Apuntes de estadistica con enfoque a la bioestadistica

130

Transcript of Apuntes de estadistica con enfoque a la bioestadistica

Page 1: Apuntes de estadistica con enfoque a la bioestadistica
Page 2: Apuntes de estadistica con enfoque a la bioestadistica

Presentación

En el año 2000, la Universidad Autónoma de Guerrero (UAGro) llevó acabo su

tercer congreso general universitario, acontecimiento que tuvo resolutivos

importantes para darle a la universidad una identidad acorde a los tiempos

actuales.

Derivado del congreso, se diseñó el nuevo Modelo Educativo y Académico que en

el año 2005 fue aprobado por el H. Consejo Universitario. Tres años mas tarde (en

el 2008), dicho modelo se inicia en el bachillerato universitario con planes de

estudio centrados en el aprendizaje y en el estudiante, tratando con esto de ser

congruente con el nuevo modelo que contempla impartir una educación integral al

educando.

Al año siguiente (2009), la Secretaría de Educación Pública (SEP), acuerda darle

al bachillerato mexicano una educación integral; pero con enfoque en

competencias. Con esto, la SEP propone la Reforma Integral para la Educación

Media Superior (RIEMS), que fue aceptada por casi la totalidad de los diferentes

subsistemas de educación media superior del país, entre ellos, el bachillerato que

se imparte en la UAGro.

Para ajustarse a la RIEMS, el bachillerato de la UAGro, cambia la estructura de los

planes y programas que estaban diseñados en el aprendizaje y en el estudiante, a

otros nuevos (los actuales) que tienen la estructura del enfoque por competencias.

Pero no únicamente se diseñaron los nuevos planes, sino que se procedió a

capacitar al personal docente (profesores) para que a través de un Diplomado

conociéramos la RIEMS y cambiar nuestro trabajo docente por otro con enfoque

por competencias. Sumado a lo anterior, se “nos invitó” a varios profesores a

capacitarnos en escribir los textos de las asignaturas del bachillerato, trabajo que

hicimos con gran entusiasmo.

Se escribieron varios textos; pero resulta que faltó el de la materia de Estadística,

asignatura que se imparte únicamente en el cuarto semestre del bachillerato con

solamente 3 horas a la semana. En el quinto semestre aparece nuevamente; pero

con la etiqueta de optativa. Por desgracia, se tienen indicadores que muestran que

casi ninguna preparatoria de la UAGro oferta esta optativa y en consecuencia

nadie la cursa.

Desde mi opinión, este es un problema que debe resolverse. Por un lado,

incrementar el número de horas del cuarto semestre y por el otro, hacerla obligada

en el quinto. Esto lo justifico en el sentido que prácticamente todas las

licenciaturas contemplan al menos uno o dos cursos de Estadística y Probabilidad.

Page 3: Apuntes de estadistica con enfoque a la bioestadistica

Consciente del problema anterior, se procedió a escribir los presentes apuntes,

que titulé “Estadística con enfoque a la Bioestadística” que tienen un doble

propósito: servir como material de apoyo tanto a profesores como a estudiantes

del bachillerato universitario y servir de igual manera a las mismas figuras; pero en

licenciaturas como enfermería o en aquellas donde se imparta la bioestadística

con enfoque a las ciencias de la salud.

Los apuntes se hicieron en base al programa de estudios por competencias que

actualmente existe en el bachillerato de la UAGro y aunque no están escritos con

la estructura de las competencias, considero que al no existir el texto

correspondiente puede ayudar en mucho tanto al alumno como al maestro.

Los apuntes se dividieron en dos partes: En la primera se trata de los Sucesos con

una variable; es decir, lo que tradicionalmente se conoce como la Estadística

Descriptiva. En la segunda, se trata el Azar y su medida; es decir, la Probabilidad.

Me sentiré satisfecho si se cumplen los propósitos mencionados.

Cd. Altamirano Gro, mes de agosto de 2013

JESÚS FERNÁNDEZ ALMAZÁN

Unidad Académica: Preparatoria No 8.

Page 4: Apuntes de estadistica con enfoque a la bioestadistica

CONTENIDO

CONCEPTOS BÁSICOS 1

La estadística y su utilidad 1

¿Qué es la estadística? 1

Definición 1

Clasificación 1

Datos 2

Población 2

Muestra 2

Variable 2

PARTE I ESTUDIOS DE SUCESOS CON UNA VARIABLE

LA ESTADÍSTICA DESCRIPTIVA

4

1 Recolección, ordenación, análisis e interpretación de datos 4

1.1 Recolección 4

1.2 Ordenación 4

1.3 Intervalos de clase 6

1.4 Distribución de frecuencias 7

1.5 Frecuencias acumuladas 7

1.6 Histograma y polígono de frecuencias 8

2 Medidas de tendencia central a partir de una colección de datos.

13

2.1 Media aritmética 14

2.2 Mediana 15

2.3 Moda 17

3 Medidas de dispersión a partir de una colección de datos 19

3.1 Rango o recorrido 19

3.2 Desviación media 20

3.3 Varianza 23

3.4 Desviación estándar 25

4 Medidas de tendencia central y de dispersión a partir de datos agrupados.

30

4.1 Media aritmética a partir de datos agrupados 31

4.2 Mediana a partir de datos agrupados 34

4.3 Moda a partir de datos agrupados 40

4.4 Varianza y desviación estándar a partir de datos agrupados

41

Page 5: Apuntes de estadistica con enfoque a la bioestadistica

PARTE II EL AZAR Y SU MEDIDA

CONCEPTOS BÁSICOS DE PROBABILIDAD INTRODUCCIÓN A LA ESTADISTICA INFERENCIAL

48

1 La probabilidad 48

2 Teoría de conjuntos 49

2.1 Definición de conjunto 49

2.2 Descripción de conjuntos 49

2.3 Tipos de conjuntos 51

2.4 Cardinalidad de un conjunto 51

2.5 Operaciones con conjuntos 52

3 Iniciación a la teoría de la probabilidad 57

3.1 Conceptos básicos 58

3.1.1 Experimento 58

3.1.2 Evento 58

3.1.3 Espacio muestral 59

3.1.4 Punto muestral 60

4 Enfoques de la probabilidad 60

4.1 Enfoque clásico o modelo de Laplace 61

4.2 Enfoque empírico 69

4.3 Enfoque subjetivo 72

5 Las técnicas de conteo 73

5.1 Listas de resultados 74

5.2 Diagramas de árbol 74

5.3 Fórmulas matemáticas 80

5.3.1 Ley fundamental de la multiplicación 80

5.3.2 Permutaciones 82

5.3.3 Combinaciones 86

6 Distribuciones de la probabilidad 89

6.1 Distribución con variable discreta 89

6.2 Distribución acumulada 92

6.3 Probabilidades como consideraciones teóricas 93

6.3.1 Distribución Binomial o de Bernoulli 94

6.3.2 Distribución de Poisson 100

6.3.3 Distribución normal 103

6.3.3.1 Ecuación matemática de la curva de distribución normal 104

6.3.3.2 Propiedades de la curva de distribución normal 108

6.3.3.3 Estandarización de datos o valores “z” 110

6.3.3.4 Significado geométrico de “z”. 114

6.3.3.5 Áreas bajo la curva de distribución normal 115

Page 6: Apuntes de estadistica con enfoque a la bioestadistica

1

CONCEPTOS BÁSICOS

La estadística y su utilidad

Desde tiempos lejanos, el hombre ha usado datos para conocer su entorno o para

describir su región. Se sabe que en la época de Cristo, cierto día “José y María

llevaron al niño Jesús a registrarse en un censo ordenado por el rey Herodes”.

En la época actual, vivimos rodeado e inundado de las nuevas tecnologías:

celulares, computadoras, calculadoras digitales, televisiones planas y muy

modernas etc. A través de estos instrumentos, se escuchan noticias como “Las

estadísticas de la Procuraduría de Justicia de Guerrero indican que en el año 2012

se registraron 1539 extorsiones en Cd. Altamirano” o noticias como “La obesidad

de los niños de tierra caliente sigue en aumento. La estadística indica que en lugar

de consumir 800 calorías, los niños consumen cantidades entre 2000 o 2500”.

Así también la palabra estadística se escucha en los censos de población, en las

encuestas cuando vienen las elecciones, en los torneos de futbol etc. En fin

estamos rodeados de números, de datos, de informes que tratan de explicar lo

que sucede en algún fenómeno social o científico. Es la Estadística la que se

encarga de ordenarlos, analizarlos e interpretarlos.

Pero ¿Qué es la Estadística?

La palabra estadística proviene del vocablo latino “Estatus” que significa estado o

condición. Este vocablo se usó desde la época de la Edad Media para describir las

características del Estado: cuántas personas había en la ciudad, a cuántas se les

cobraban impuestos, cuántas contaban con determinado número de cabezas de

ganado, etc.

Pasaron los años y la necesidad de manipular colecciones de datos, hizo que

naciera la Estadística Teórica que tiene sus orígenes en el siglo XVIII. Con dicha

Estadística se establece un orden para recolectar datos, procesarlos e

interpretarlos. Con esto, se formaliza la Estadística.

Definición de Estadística.

Es la ciencia que brinda los instrumentos (métodos y técnicas) para recopilar,

organizar, presentar, analizar e interpretar información que apoye los procesos de

toma de decisiones en cualquier ámbito.

Clasificación de la Estadística.

Son dos ramas en que se divide la estadística:

Page 7: Apuntes de estadistica con enfoque a la bioestadistica

2

Estadística Descriptiva.

Estadística Inferencial.

La Estadística descriptiva se apoya en las matemáticas para recolectar, ordenar,

analizar y presentar una colección de datos que se tomaron de alguna población o

de alguna muestra tomada de dicha población. Esto le sirve al investigador para

hacer predicciones, sacar conclusiones y tomar decisiones sobre el

comportamiento que puede tener la población o la muestra de la población donde

fue tomada.

La Estadística inferencial es la que se apoya en la teoría de las probabilidades y

las técnicas de muestreos para obtener ciertos juicios de la población en estudio.

Términos básicos usados en la Estadística.

Datos

Son los valores numéricos o tal vez características que se cuentan, observan o se

miden. Ejemplos de ellos pueden ser la colección de calificaciones de un grupo

escolar, las respuestas que se dan de alguna pregunta hecha en el Facebook, el

número de boletos vendidos para el concurso de la reina de la escuela, el número

de enfermos que ingresan a un hospital durante una semana, etc.

Población

También se le conoce como universo y es el conjunto finito o infinito de personas,

cosas u objetos que presentan características comunes.

Muestra

Es una parte representativa de una población. Su uso se debe a que existen

casos en que la población es muy grande y en consecuencia resulta difícil y a

veces imposible poderla contar; razón por la cual se recurre a una muestra

representativa. Los resultados que se obtengan, se hacen extensivos a la

población donde fue tomada.

Variable

Por variable entendemos toda característica que se estudia a cierto fenómeno,

acontecimiento o simplemente a un sujeto.

Comúnmente las variables suelen clasificarse en cualitativas y cuantitativas. Las

cualitativas se refieren a cualidades que no pueden medirse; así por ejemplo el

Page 8: Apuntes de estadistica con enfoque a la bioestadistica

3

sexo de las personas o animales, la nacionalidad de un grupo de extranjeros que

llegaron a Cd. Altamirano, la responsabilidad de los alumnos de hacer las tareas,

el color de la piel de los habitantes del Estado de Guerrero, etc. Por su parte las

variables cuantitativas si pueden medirse usando números. Estas variables se

clasifican a su vez en continuas y discontinuas. Las continuas se pueden medir

con números enteros y fracciones; así por ejemplo las estaturas de los alumnos de

una escuela (existen medidas como 1.65 m, 1.72 m, 1.76 m etc), otro ejemplo

sería el peso de los niños al nacer (3.200 kg, 3.500 kg, 3.650 kg, etc). Por su

parte, las discontinuas se miden únicamente con números enteros; así por ejemplo

el número de hijos de las familias de tierra caliente (no puede decirse que una

familia tiene 4.56 hijos), el número de alumnos de cada grupo de la escuela (no

puede decirse que un grupo tiene 50. 45 alumnos), etc.

También existen otras variables conocidas como aleatorias. Estas variables se

asocian al término "azar". Así que una variable aleatoria no representa con certeza

el valor que tomará al ser medida o determinada. Ejemplo de esto sería un caso

como el siguiente: Existe una epidemia de cólera donde se trata de conocer el

índice de propagación. Para ello, una persona cualquiera (tomada al azar) puede o

no estar enferma y en consecuencia, no se sabe con certeza que suceso va a

ocurrir, es decir, tal vez se enferme o tal vez no. Aquí entra la probabilidad de que

tal vez la persona elegida enferme. Esta persona es una variable aleatoria.

Page 9: Apuntes de estadistica con enfoque a la bioestadistica

4

PARTE I

ESTUDIO DE SUCESOS CON UNA VARIABLE.

LA ESTADÍSTICA DESCRIPTIVA.

Anteriormente dijimos que la Estadística Descriptiva se encarga de recolectar,

ordenar, analizar y presentar una colección de datos que se tomaron de alguna

población o de alguna muestra de ella. Con esto, se pretende hacer predicciones,

conjeturas y tomar decisiones en apego a los resultados encontrados.

1. RECOLECCIÓN, ORDENACIÓN, ANÁLISIS E INTERPRETACIÓN DE DATOS

1.1.-La recolección de datos

Consiste en recoger la información cualitativa o tal vez cuantitativa necesaria para

estudiar algún proceso. Los datos que se recogen son las variables.

Cuando se aplica la estadística al área de las ciencias de la salud, se le conoce

como Bioestadística. Aquí los principales métodos para la recolección de los datos

son las encuestas, los experimentos, los censos y los sistemas de registro.

No abundaremos en detalle de estos métodos, ni tampoco aplicaremos el rigor de

las matemáticas; sino mas bien, nos concretamos a resolver casos de la vida real.

1.2.- Ordenación de datos.

Cuando se recogen las variables de alguna población, comúnmente le llegan al

investigador en forma desordenada. Para poder trabajarlas, necesitamos darles un

orden y para ello, procedemos a colocarlas en forma ascendente, colocando en

primera instancia el valor mas pequeño y terminar con el mas grande.

Ejemplo 1.- La tabla siguiente muestra los pesos en gramos de tumores malignos

que le fueron extirpados a 57 personas. Se pide:

Trazar:

1. Construye una tabla donde ordenes los datos (de menor a mayor)

2. Calcula el número de intervalos de clase y su ancho correspondiente para

propósitos de tabulación.

3. Construye una tabla de distribución de frecuencias.

Page 10: Apuntes de estadistica con enfoque a la bioestadistica

5

4. Construye una tabla de frecuencias acumuladas y frecuencias relativas

acumuladas.

5. Construye un histograma y un polígono de frecuencias.

Tabla:

68 65 12 22

63 43 32 43

42 25 49 27

27 74 38 49

30 51 42 28

36 36 27 23

28 42 31 19

32 28 50 46

79 31 38 30

27 28 21 43

22 25 16 49

23 45 24 12

24 12 69

25 57 47

44 51 23

Solución:

Ordenación de los datos de menor a mayor.

12 27 42 63

12 27 42 65

12 27 42 68

16 28 43 69

19 28 43 74

21 28 43 79

22 28 44

22 30 45

23 30 46

23 31 47

23 31 49

24 32 49

24 32 49

25 36 50

25 36 51

25 38 51

27 38 57

Page 11: Apuntes de estadistica con enfoque a la bioestadistica

6

1.3.- Número de intervalos de clase y su ancho correspondiente.

Para analizar y presentar los datos los vamos a agrupar en intervalos de clase y

para ello, calculemos primero el número de intervalos en los cuales los vamos

agrupar.

El número de intervalos se deja casi siempre a juicio de un experimentado

investigador; pero muchas veces se hace uso de una fórmula propuesta por

Sturges. Esta fòrmula dice:

K = 1 + 3.322 (LOG10 N)

Donde:

K = Número de intervalos de clase.

N= Número de datos

LOG10 = Logaritmo base 10 que se puede calcular usando una calculadora.

Para el ejemplo que nos ocupa, tendremos que:

K = 1 + 3.322(LOG 57) = 1 + 3.322(1.7559) = 6.833

Aceptemos 7 como el número de intervalos.

Calculemos ahora la amplitud (A) o ancho de los intervalos propuestos. Esta

amplitud se puede calcular dividiendo el recorrido de los datos entre el número de

intervalos. El recorrido se obtiene restando el valor del dato mayor menos el valor

del dato menor.

Recorrido = 79 – 12 = 67.

Amplitud o ancho del intervalo = A = 6.97

67Re

K

corrido

Aceptemos el valor 10 como ancho del intervalo

Resumen.

Los intervalos serán:

Page 12: Apuntes de estadistica con enfoque a la bioestadistica

7

Intervalo 1 A = de 10 a 19 = 10

Intervalo 2 A = de 20 a 29 = 10

Intervalo 3 A = de 30 a 39 = 10

Intervalo 4 A = de 40 a 49 = 10

Intervalo 5 A = de 50 a 59 = 10

Intervalo 6 A = de 60 a 69 = 10

Intervalo 7 A = de 70 a 79 = 10

1.4.- Tabla de distribución de frecuencias.

Construyamos una tabla que nos indique qué intervalo de clase es el mas

frecuente y cual será el de menor frecuencia.

Intervalo de clase Tarjado Frecuencia “f”

10-19 5

20-29 19

30-39 10

40-49 13

50-59 4

60-69 4

70-79 2

TOTAL DE DATOS = 57

La tabla indica que el intervalo mas frecuente es de 20 a 29; es decir, el mayor

número de tumores malignos extirpados se tiene entre 20 y 29 gramos de peso.

Por su parte el intervalo menos frecuente se tiene en el intervalo de 70 a 79; es

decir, es el menos frecuente, o sea, son poco frecuentes los enfermos que tienen

tumores malignos con pesos entre 70 y 79 gramos.

1.5.- Tabla de frecuencia acumulada, frecuencia relativa de ocurrencia y

frecuencia relativa acumulada:

Intervalo de clase

IC

Frecuencia f

Frecuencia acumulada

fa

Frecuencia relativa de ocurrencia

fr =57

f

N

f

Frecuencia relativa

acumulada. fra

10-19 5 5 0.0877 0.0877

20-29 19 24 0.3333 0.4210

30-39 10 34 0.1754 0.5964

40-49 13 47 0.2281 0.8245

Page 13: Apuntes de estadistica con enfoque a la bioestadistica

8

50-59 4 51 0.0702 0.8947

60-69 4 55 0.0702 0.9649

70-79 2 57 0.0351 1.0000

TOTALES 57 1.0000

La columna 4 que indica la frecuencia relativa acumulada, nos señala el

porcentaje (en forma decimal) de la ocurrencia de cada intervalo de clase. Ahí

vemos que el porcentaje mayor de ocurrencia se tiene en el intervalo de 20 a 29

donde se tiene un 33.33% de ocurrencia y el menor porcentaje lo presenta el

intervalo de 70 a 79.

1.6.- El histograma y el polígono de frecuencias.

La distribución de frecuencias (f) puede representarse en forma gráfica usando un

histograma. Para esto, se hace uso de un sistema de ejes cartesianos. En el eje

horizontal (conocido como de las “x”) se dibujan los intervalos de clase (utilizando

su ancho “A”) y en el eje vertical (conocido como de las “y”) se marcan las

frecuencias (f) de cada intervalo.

Nota: en el problema que estamos resolviendo, vemos que los intervalos son de

10 a 19, de 20 a 29, de 30 a 39 etc. Así que del valor 19 (del primer intervalo) al

valor 20 (del segundo intervalo), existe UN UNO de diferencia el cual debe

tomarse en cuenta al dibujar la gráfica. Lo mismo sucede entre el valor 29 del

segundo intervalo con el valor 30 del tercero, donde también existe UN UNO de

diferencia que debe tomarse en cuenta. Algo parecido sucede con el resto de

intervalos.

Para subsanar lo anterior, lo que podemos hacer es iniciar con el primer intervalo

en el valor 9.5 y terminar su ancho en 19.5, teniendo de todas formas un ancho de

10. Para el segundo intervalo, lo iniciamos en 19.5 y terminamos su ancho en

29.5, cuyo ancho sigue siendo 10. Algo parecido hacemos con el resto de los

intervalos. De acuerdo a esto, los intervalos a dibujar serían así:

Primer intervalo de 9.5 a 19.5

Segundo intervalo de 19.5 a 29.5

Tercer intervalo de 29.5 a 39.5

Cuarto intervalo de 39.5 a 49.5

Quinto intervalo de 49.5 a 59.5

Page 14: Apuntes de estadistica con enfoque a la bioestadistica

9

Sexto intervalo de 59.5 a 69.5

Séptimo intervalo de 69.5 a 79.5

Debe observarse que los valores reales de los intervalos están dentro del

polígono. Recordemos que el dato menor era 12 y el mayor era 79 que estarían

dentro del histograma.

Dibujemos este histograma:

El área de cada barra nos indica la frecuencia de ocurrencia de los valores

comprendidos entre los límites de la escala horizontal. Así por ejemplo la segunda

barra (o celda) es la frecuencia relativa de ocurrencia de los valores comprendidos

entre 19.5 y 29.5. En forma parecida se tienen las frecuencias relativas de las

otras barras (o celdas).

2

4

6

8

10

12

14

16

18

20

F r e

c u e

n c i

a

“f”

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5

I n t e r v a l o d e c l a s e IC

Page 15: Apuntes de estadistica con enfoque a la bioestadistica

10

Otra forma de explicar esto, sería:

La barra 1 representa el 57

5 del área del histograma.

La barra 2 representa el 57

19 del área del histograma

La barra 3 representa el 57

10 del área del histograma

La barra 4 representa el 57

13 del área del histograma

La barra 5 representa el 57

4 del área del histograma

La barra 6 representa el 57

4 del área del histograma

La barra 7 representa el 57

2 del área del histograma.

Nota: la suma de todas estas fracciones es 157

57

Ahora dibujemos el polígono de frecuencias.

Este polígono representa otra forma de representar a la distribución de

frecuencias. Para trazarlo se marcan los puntos medios de la parte superior de

cada una de las barras que representan a los intervalos de clase. Se unen dichos

puntos y se tiene el polígono de frecuencias.

Veamos el trazo de este polígono:

Page 16: Apuntes de estadistica con enfoque a la bioestadistica

11

POLÍGONO DE FRECUENCIAS

Nota: El área total del polígono de frecuencias, es igual al área del histograma.

TAREA: Hagan equipos de 5 estudiantes y resuelvan los problemas siguientes.

Problema.- En el hospital regional de Coyuca de Catalán se practicaron 100

exámenes de niveles de glucosa a igual número de niños. Los resultados

encontrados se reportaron en la tabla siguiente. Se pide:

Construye una tabla donde ordenes los datos (de menor a mayor)

1. Calcula el número de intervalos de clase y su ancho correspondiente para

propósitos de tabulación.

2. Construye una tabla de distribución de frecuencias.

14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5 4.5

2

4

5

10

13

19

F r e

c u

e n

c i a

f

I n t e r v a l o d e c l a s e IC

Polígono de frecuencias

Page 17: Apuntes de estadistica con enfoque a la bioestadistica

12

3. Construye una tabla de frecuencias acumuladas y frecuencias relativas

acumuladas.

4. Construye un histograma y un polígono de frecuencias.

Tabla reportada:

56 61 57 77 62 75 63 55 64 60

60 57 61 57 67 62 69 67 68 59

65 72 65 61 68 73 65 62 75 80

66 61 69 76 72 57 75 68 81 64

69 64 66 65 65 76 65 58 65 64

68 71 72 58 73 55 73 79 81 56

65 60 65 80 66 80 68 55 66 71

72 73 73 75 75 74 66 68 73 65

73 74 68 59 69 55 67 65 67 63

67 56 67 62 65 75 62 63 63 59

Problema.- A 45 enfermos de la clínica del ISSSTE en Cd. Altamirano, se les

aplicó un anestésico para que durmieran. La tabla siguiente reportada por una

enfermera muestran los resultados en horas. Se pide calcular lo siguiente:

1. Construye una tabla donde ordenes los datos (de menor a mayor)

2. Calcula el número de intervalos de clase y su ancho correspondiente para

propósitos de tabulación.

3. Construye una tabla de distribución de frecuencias.

4. Construye una tabla de frecuencias acumuladas y frecuencias relativas

acumuladas.

5. Construye un histograma y un polígono de frecuencias.

Tabla reportada por la enfermera:

7 10 12 4 8 7 3 8 5

12 11 3 8 1 1 13 10 4

4 5 5 8 7 7 3 2 3

8 13 1 7 17 3 4 5 5

3 1 17 10 4 7 7 11 8

Problema.- Se aplicó un examen de matemáticas a 40 estudiantes del grupo 402

turno matutino de la Preparatoria No 8 de Cd. Altamirano. Las calificaciones

obtenidas se muestran en la tabla siguiente. La escala usada por el maestro es de

0 a 100.

Page 18: Apuntes de estadistica con enfoque a la bioestadistica

13

Se pide hagas lo siguiente:

1. Construye una tabla donde ordenes los datos (de menor a mayor)

2. Calcula el número de intervalos de clase y su ancho correspondiente para

propósitos de tabulación.

3. Construye una tabla de distribución de frecuencias.

4. Construye una tabla de frecuencias acumuladas y frecuencias relativas

acumuladas.

5. Construye un histograma y un polígono de frecuencias.

Tabla de calificaciones obtenidas por los alumnos:

56 78 62 37 54 39 62 60

28 82 38 72 62 44 54 42

42 55 57 65 68 47 42 56

56 56 55 66 42 52 48 48

47 41 50 52 47 48 53 68

2.- LAS MEDIDAS DE TENDENCIA CENTRAL A PARTIR DE UNA COLECCIÓN

DE DATOS.

En muchos problemas de la vida real es de interés conocer el centro del problema.

Se habla muchas veces que el centro de la república mexicana es el Distrito

Federal, que el centro de una población es el zócalo, que el centro de nuestro

cuerpo es el corazón, etc.

Si algo parecido a lo anterior lo lleváramos a una colección de datos que fueron

obtenidos de una población o de alguna muestra de ella, tendríamos una idea de

“hacia donde tienden dichos datos respecto a un centro”. Para medir estas

tendencias se usan ciertas medidas, siendo las mas conocidas las siguientes:

1. La media aritmética.

2. La mediana

3. La moda.

Si los datos que se usen son la totalidad de la población, entonces las medidas

antes mencionadas (media aritmética, mediana y moda) se les conoce como

parámetros; pero si los datos son de una muestra tomada de la población,

entonces a dichas medidas se les nombra medidas estadísticas o simplemente

estadística.

Veamos el significado de cada una de estas medidas:

Page 19: Apuntes de estadistica con enfoque a la bioestadistica

14

2.1.- La media aritmética.

Esta medida es lo que comúnmente conocemos como “el promedio” o “la media”.

Recordemos que el promedio es una división donde el numerador es la suma de

todos los valores; que para nuestro caso, sería la suma de los datos y el

denominador es el número de valores, que para nuestro caso, sería el número de

datos.

Si la media que se calcula se hace con los datos de la población (no de una

muestra), se tendrá lo siguiente:

µ = N

xN

i

i1

Donde:

µ es la media aritmética de la población.

N

i 1

es la suma o sumatoria de todos los datos de la población

N es el número de sumandos que tiene la sumatoria, es decir, el número de

datos.

Cuando la media se calcula con los datos de una muestra (no de toda la

población), se usa un cociente parecido. Esto es lo siguiente:

x = n

xn

i

i1

Donde:

x es la media aritmética de la muestra

Page 20: Apuntes de estadistica con enfoque a la bioestadistica

15

n

i 1

es la suma o sumatoria de los datos de la muestra.

n es el número de datos que contiene la muestra.

Veamos el ejemplo siguiente:

Problema.- la tabla siguiente, indica una muestra constituida por 5 datos (o

valores) que en forma aleatoria se tomaron de una población formada por cien

valores. Estos datos corresponden a las edades de enfermos de diarrea que

ingresaron al Centro de Salud de Cutzamala Gro.

Dato de la población

Dato tomado de la población para tener LA

MUESTRA.

Dato

X12 es el enfermo 12 X1 10

X20 es el enfermo 20 X2 54

X36 es el enfermo 36 X3 21

X62 es el enfermo 62 X4 33

X98 es el enfermo 98 X5 53

Se pide calcular la media aritmética:

Solución:

Empleando la fórmula para la muestra:

x = n

xn

i

i1

x = 2.345

171

5

5333215410

La media aritmética o promedio será entonces 34.2

2.2.- La mediana.

Page 21: Apuntes de estadistica con enfoque a la bioestadistica

16

La mediana es aquel valor que divide a un conjunto de valores en dos partes

iguales, tales que el número de valores iguales a la mediana o mayores que ella,

es igual al número de valores iguales a ella o menores que ella.

Se recomienda el siguiente algoritmo para calcularla:

1. Se ordenan los datos de menor a mayor.

2. Si el número de datos es impar, la mediana será el valor que está en medio.

3. Si el número de datos es par, no se tiene una sola observación en medio,

sino dos. La mediana será la media aritmética de estas dos observaciones.

Veamos el siguiente ejemplo:

Problema.- Calcular la mediana a los 5 valores o datos de la muestra que se tomó

de la población de 100 valores de los enfermos reportados con diarrea del Centro

de Salud de Cutzamala Gro.

Solución.

Aplicando el algoritmo.

1.- Ordenando los datos tendremos: 10 21 33 53 54

2.- El numero de datos es impar (son 5), entonces la mediana es el valor que está

en medio o sea 33.

10 21 33 53 54

Problema.- Calcular la mediana a una muestra constituida por 6 valores que se

tomaron de la misma población del Centro de Salud de Cutzamala Gro.

Muestra reportada: 22 15 18 23 9 31

Solución:

Aplicando el algoritmo.

1.- Ordenando los datos de menor a mayor: 9 15 18 22 23 31

2.- El número de datos es par (son 6), entonces la mediana será el promedio de

los dos valores centrales.

Mediana

Page 22: Apuntes de estadistica con enfoque a la bioestadistica

17

9 15 18 22 23 31

Valores centrales

Mediana = 202

40

2

2218

2.3.- La moda.

La moda de una colección de datos (valores), es aquel dato (valor) que se

presenta con mayor frecuencia. Si la colección tiene puros datos diferentes

entonces no hay moda.

Veamos los ejemplos siguientes:

Problema.- Una muestra de datos tomados de una población fueron: 4, 7, 11, 15,

15, 18, 21 y 27. Esta muestra se refiere a edades de enfermos que ingresaron al

Centro de Salud de Cd. Altamirano presentando síntomas de gripe.

Se pregunta ¿Cuánto vale la moda de esa muestra?.

Solución:

Analizando la muestra vemos que el dato que mas se presenta es 15, entonces el

valor de la moda es 15.

Problema.- En el conjunto de valores 20, 31, 20, 20, 34, 22, 24, 27, 27 y 27

¿Cuánto vale la moda?.

Solución:

Analizando los datos, se tienen 2 modas: 20 y 27.

Problema.- En la colección de datos: 10, 21, 33, 53, 54 y 60. ¿Cuánto vale la

moda?.

Solución. La colección NO TIENE MODA.

TAREA.

Page 23: Apuntes de estadistica con enfoque a la bioestadistica

18

Formen equipos de 5 estudiantes y resuelvan los problemas siguientes.

Problema.- Los valores de la tabla siguiente son los niveles de glucosa en sangre

extraída a 10 niños en ayunas.

Niño No. Nivel de glucosa Niño No. Nivel de glucosa

1 56 6 65

2 62 7 65

3 63 8 68

4 65 9 70

5 65 10 72

Se pide que calculen:

1. La media

2. La mediana

3. La moda.

Problema.- Los contenidos de nicotina en una muestra aleatoria de 6 cigarros de

cierta marca fueron: 2.3, 2.7, 2.5, 2.9, 3.1 y 1.9 miligramos.

Se pide que calculen:

La mediana de la muestra.

Problema.- Los donativos para construir una aula en la Preparatoria No 8 de los

habitantes de la colonia Esquipulas de Cd. Altamirano fueron: 9, 10, 5, 9, 9, 7, 8, 6,

10 y 11 dólares.

Se pide calcular la moda de dicha colección.

Problema.- Quince pacientes que vinieron de diferentes lugares, realizaron una

visita a un Departamento Sanitario que existe en Tanganhuato. Los pacientes

recorrieron las distancias indicadas en la tabla siguiente.

Paciente No

Distancia en Km

Paciente No

Distancia en Km

Paciente No

Distancia en Km

1 5 6 13 11 3

2 9 7 12 12 15

3 11 8 6 13 12

Page 24: Apuntes de estadistica con enfoque a la bioestadistica

19

4 3 9 13 14 15

5 12 10 7 15 5

Se pide calcular:

1. La media de las distancias recorridas por los pacientes.

2. La mediana de las distancias recorridas.

3.-MEDIDAS DE DISPERSIÓN A PARTIR DE UNA COLECCIÓN DE DATOS.

La dispersión de una colección de datos o valores, se refiere a la variabilidad que

presentan. Si tuviéramos por ejemplo una colección de datos como 35,35,35,35,35

y 35, su variabilidad es cero; es decir, tanto la media aritmética, la mediana y la

moda serían 35 o sea iguales. Pero esto nunca sucede y por lo tanto la

variabilidad existe.

Así que en una colección de datos, no basta con las medidas de tendencia central

(media aritmética, mediana y moda) para conocer ciertos aspectos de los datos y

se recurre a otras medidas llamadas de dispersión. Esto significa entonces que en

una colección de datos son necesarias tanto las medidas de tendencia central

como otras llamadas de dispersión.

Las medidas de dispersión mas usadas son:

1. El Recorrido o Rango.

2. La desviación media y la varianza.

3. La desviación Estándar (que no es otra cosa que una medida de

desviaciones).

3.1.-Recorrido o rango.

En una colección de datos, el Rango se calcula restando al dato mayor el dato

menor.

Ejemplo: Pensemos que de la Rectoría de Chilpancingo, le pidieron al Director de

la Preparatoria 8 enviara una relación de los sueldos quincenales de los 19

maestros que aquí trabajan.

El Director envió el cuadro siguiente:

Page 25: Apuntes de estadistica con enfoque a la bioestadistica

20

Trabajador No

Sueldo quincenal

Trabajador No

Sueldo quincenal

Trabajador No

Sueldo quincenal

1 $1400.00 8 $2000.00 15 $7000.00

2 $1500.00 9 $6000.00 16 $1500.00

3 $3000.00 10 $1400.00 17 $7500.00

4 $4000.00 11 $2000.00 18 $2000.00

5 $2000.00 12 $2500.00 19 $3000.00

6 $6500.00 13 $1500.00

7 $7000.00 14 $7500.00

El Rango de la colección de datos será: R = 7500 – 1400 = 6100

En realidad el rango no indica algo significativo. Su valor es muy escueto y poco

se usa. Esto lo podemos constatar si existiera un valor muy grande “o disparado”

respecto a los otros. Si en la tabla hubiera por ejemplo un trabajador con sueldo

de $15000.00, entonces el rango sería:

R = 15000 – 1400 = 13600 el cual no es representativo para la variabilidad de los

otros datos.

3.2.-La desviación media.

La desviación media es una media o promedio de todas las desviaciones con

respecto a la media.

Supongamos por ejemplo que tuviéramos el conjunto de datos 5, 10,15, 20, 25, 30

y 35. La media (promedio) de dicho conjunto es 20. Si quisiéramos conocer la

desviación de cada dato, tendríamos:

La desviación de 5 con respecto a la media será: 5 – 20 = - 15

La desviación de 10 con respecto a la media será: 10 – 20 = - 10

La desviación de 15 con respecto a la media será: 15 – 20 = - 5

La desviación de 20 respecto a la media será: 20 – 20 = 0

La desviación de 25 con respecto a la media será: 25 – 20 = 5

La desviación de 30 con respecto a la media será: 30 – 20 = 10

La desviación de 35 con respecto a la media será: 35 – 20 = 15

Page 26: Apuntes de estadistica con enfoque a la bioestadistica

21

Si observamos, la suma de todas las desviaciones con respecto a la media es

cero.

Si a la media o promedio lo llamamos x y al dato lo llamamos x entonces la

Desviación Media (DM) se calcula por la fórmula siguiente:

N

xxDM

El numerador es la sumatoria de las restas, pero en valor absoluto. Esto se hace

para evitar los signos negativos (recordemos que el valor absoluto de cualquier

número sea positivo o negativo, siempre es positivo).

En la fórmula anterior, DM es la desviación media y N es el número de datos que

componen a la colección (o sea el número de datos de la población).

Para la colección de datos del ejemplo anterior, tendremos que la desviación

media sería:

7

51015051015DM 57.8

7

60

Debemos observar que el valor absoluto de los números negativos son siempre

números positivos.

Calculemos ahora la Desviación Media de los sueldos de los 19 maestros de la

Preparatoria 8 que la Rectoría le solicitó al Director de la Preparatoria 8.

Primero arreglemos los datos del valor menor al valor mayor:

Trabajador No

Sueldo quincenal

Trabajador No

Sueldo quincenal

Trabajador No

Sueldo quincenal

1 1400 8 2000 15 6500

2 1400 9 2000 16 7000

3 1500 10 2500 17 7000

Page 27: Apuntes de estadistica con enfoque a la bioestadistica

22

4 1500 11 3000 18 7500

5 1500 12 3000 19 7500

6 2000 13 4000

7 2000 14 6000

Ahora calculemos la media o promedio x de la colección de datos:

19

)2(7500)2(7000650060004000)2(30002500)4(2000)3(1500)2(1400

x = 364719

69300

Ahora calculemos los valores absolutos xx

224736471400

214736471500

164736472000

114736472500

64736473000

35336474000

235336476000

285336476500

335336477000

385336477500

Calculemos la Desviación Media:

Page 28: Apuntes de estadistica con enfoque a la bioestadistica

23

19

)2(3853)2(335328532353353)2(6471147)4(1647)3(2147)2(2247 DM

84.210119

39935DM

3.3.-La varianza.

Como ya se trató, el uso de la Desviación Media (DM), exige la necesidad de usar

el valor absoluto y se hace con el propósito de evitar los signos negativos. Para

salvar este obstáculo, se opta por elevar al cuadrado a la resta ( )xx y con ello

los valores siempre serán positivos. Esto da lugar a lo que se conoce como

varianza que no es otra cosa que una media de la dispersión de los datos. A la

varianza se acostumbra escribirla como S2.

Así que la varianza será la fórmula siguiente:

S2 = N

xx 2)(

Nota. El valor “N” se refiere al número de datos que corresponden a la población.

Algunos autores proponen que si se trata de calcular la varianza de una muestra

extraída de una población, entonces la fórmula de la varianza debe ser:

S2 = 1

)( 2

n

xx n = número de datos de la muestra.

El hecho de restarle un uno a la “n”, es para considerar el grado de libertad de la

muestra extraída de la población.

Page 29: Apuntes de estadistica con enfoque a la bioestadistica

24

Ejemplo1.

Calcular la varianza de la colección de los 19 sueldos de igual número de

trabajadores que la Rectoría de la UAG solicitó al Director de la Preparatoria 8.

Solución.

Aplicando la fórmula correspondiente:

S2 = N

xx 2)(

Por facilidad, hagamos una tabla:

Recordemos que la media (promedio) es:

x = 364719

69300

Sueldo (x)

Frecuencia “f”

Totales (x)(f)

(x - )x 2)( xx 2)( xxf

1400 2 2800 -2247 5049009 10098018

1500 3 4500 -2147 4609609 13828827

2000 4 8000 -1647 2712609 10850436

2500 1 2500 -1147 1315609 1315609

3000 2 6000 -647 418609 837218

4000 1 4000 353 124609 124609

6000 1 6000 2353 5536609 5536609

6500 1 6500 2853 8139609 8139609

7000 2 14000 3353 11242609 22485218

7500 2 15000 3853 14845609 29691218

69300 102907371

La varianza será:

S2 = 541617719

102907371

Nota: Debe observarse que se usó la última columna que contiene los productos

de 2)( xxf . Esto se hizo para tomar en cuenta a las frecuencias de los valores.

Page 30: Apuntes de estadistica con enfoque a la bioestadistica

25

3.4.- La desviación estándar.

Al calcular la varianza tuvimos que elevar al cuadrado a la resta )( xx ; esto

origina que resulten unidades cuadradas, lo cual no representa a las medidas

originales que deben ser lineales. Para obtener estas medidas bastará con extraer

la raíz cuadrada a S2 y el problema estaría resuelto. La raíz aplicada a S2 se le

conoce como Desviación Estándar que contiene las medidas originales.

De acuerdo a lo anterior, la desviación estándar se calcula con cualquiera de las

dos fórmulas siguientes:

Desviación Estándar = S = N

xxS

22 )(

Esto, cuando se trata de una población completa, siendo “N” el número de datos o

elementos de la población.

Desviación Estándar = S = 1

)( 22

n

xxS

Esto, cuando se trata de una muestra tomada de una población, siendo “n” el

número de datos o elementos de la muestra.

Conocida la Desviación Estándar, se puede calcular el coeficiente de variación,

el cual se obtiene dividiendo a la Desviación Estándar entre la media aritmética (o

promedio); pero en por ciento.

Si llamamos C.V. al coeficiente de variación, éste se calculará de la forma

siguiente:

C.V = )100(x

S

Page 31: Apuntes de estadistica con enfoque a la bioestadistica

26

Ejemplo 1.

Calcular la Desviación Estándar “S” y el coeficiente de variación (CV), a la

colección de sueldos que la Rectoría de la UAG solicitó al Director de la

Preparatoria 8.

Solución:

La varianza fue: S2 = 5416177

La Desviación Estándar será: S = 26.232754161772 S

El coeficiente de variación será: C.V = 8.63)100(638.03647

26.2327)100(

x

S

Ejemplo 2.

Las edades de 6 niños que presentaron síntomas de diarrea en el municipio de

Pungarabato, fueron 2, 4, 6, 8, 10 y 12 años.

Calcular:

1. La media aritmética

2. La desviación media

3. La varianza

4. La desviación Estándar.

5. El coeficiente de variación.

Solución:

La media aritmética:

x = n

xn

i

i1

x = 76

42

6

12108642

Page 32: Apuntes de estadistica con enfoque a la bioestadistica

27

Media Aritmética = 7

La desviación media:

N

xxDM

=

6

71271078767472

36

18

6

531135

DM

Desviación Media = DM = 3

La varianza:

S2 = N

xx 2)(

S2 = 6

)712()710()78()76()74()72( 222222

S2 = 6

)5()3()1()1()3()5( 222222

S2 = 667.116

70

6

25911925

Varianza = S2 = 11.667

La Desviación Estándar:

S = 415.3667.112 S

Page 33: Apuntes de estadistica con enfoque a la bioestadistica

28

Desviación Estándar = S = 3.415

Coeficiente de Variación = C.V = )100(x

S = 7.48)100(487.0)100(

7

415.3

TAREA.

Hagan equipos de 5 alumnos y resuelvan los problemas siguientes:

Problema 1.

De una población de 100 observaciones realizadas a igual número de pacientes

que padecen una enfermedad crónica, se tomó una muestra de solamente 5

observaciones tomadas en forma aleatoria. Se construyó la siguiente tabla:

Observaciones de la población.

Observaciones de la muestra

Dato o valor de la observación

X12 X1 10

X20 X2 54

X36 X3 21

X62 X4 33

X98 X5 53

Se pide calcular:

1. La media aritmética

2. La desviación media

3. La varianza

4. La desviación estándar

5. El coeficiente de variación.

Problema 2.

En la carretera que existe de Cd. Altamirano a Cutzamala, se construyó un

terraplén de arcilla compactada. La compañía constructora hizo 28 pruebas de

control de la compactación y reportó los resultados en la tabla siguiente. La

Page 34: Apuntes de estadistica con enfoque a la bioestadistica

29

compañía reporta que dichos resultados son los grados de compactación respecto

a la prueba Proctor de laboratorio de mecánica de suelos.

Tabla:

Prueba No

Grado de compactación respecto a la prueba Proctor

X

XX

2)( XX

1 97.7

2 99.7

3 99.4

4 96.3

5 97.4

6 97.7

7 97.1

8 102.2

9 97.8

10 96.5

11 97.0

12 99.6

13 98.0

14 100.0

15 98.2

16 102.8

17 98.8

18 96.0

19 98.8

20 98.5

21 97.6

22 99.9

23 98.3

24 100.0

25 96.5

26 96.2

27 98.4

28 98.4

Se pide calcular:

1. La media aritmética (promedio)

2. La desviación media

Page 35: Apuntes de estadistica con enfoque a la bioestadistica

30

3. La varianza

4. La desviación estándar

5. El coeficiente de variación.

Respuesta:

Media aritmética = X = 98.4

Varianza = S2 = 2.36

Desviación Estándar = S = 1.54

Coeficiente de Variación = C.V = 1.56

4.- LAS MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN A PARTIR

DE DATOS AGRUPADOS.

En los problemas anteriores aprendimos a calcular tanto las medidas de tendencia

central como de dispersión partiendo de un listado de datos o sea de una

colección. Estas listas pueden venir de algún hospital, de alguna escuela, de

alguna compañía constructora, etc. Cada una de estas fuentes, tienen una misión

que cumplir. Los hospitales por ejemplo buscan conocer medidas que le son de su

incumbencia (enfermos, médicos, enfermeras, medicamentos etc). En alguna

escuela es de su interés conocer medidas de lo que ahí se hace (alumnos,

maestros, sueldos, exámenes, etc). En alguna compañía constructora tal vez

interese conocer cantidades de materiales que se consumen mensualmente,

combustibles, personal, etc.

Los datos que de esas fuentes provienen, se reportan como listas o colecciones

que aprendimos a manejar para calcular tanto las medidas de tendencia central

como de dispersión.

Ahora aprenderemos a calcular las mismas medidas; pero ya no provenientes de

un listado de datos, sino de datos agrupados en los intervalos de clase y la

frecuencia de cada uno de esos intervalos.

En otras palabras, lo que ahora conocemos como datos del problema son los

intervalos de clase y sus frecuencias y con esto, calcularemos las medidas de

tendencia central y de dispersión.

Page 36: Apuntes de estadistica con enfoque a la bioestadistica

31

4.1.- La media aritmética a partir de datos agrupados.

Para calcular la media aritmética a partir de datos agrupados, se acepta que todos

los valores que caen dentro de un intervalo de clase se localizan en el punto

medio de dicho intervalo.

El punto medio de un intervalo de clase, se obtiene calculando la media

(promedio) de los límites superior e inferior del intervalo.

Ejemplo 1.

La tabla siguiente muestra los pesos en gramos de tumores malignos que le

fueron extirpados a 57 personas.

Nota: La tabla se elaboró colocando los datos de menor a mayor valor.

12 27 42 63

12 27 42 65

12 27 42 68

16 28 43 69

19 28 43 74

21 28 43 79

22 28 44

22 30 45

23 30 46

23 31 47

23 31 49

24 32 49

24 32 49

25 36 50

25 36 51

25 38 51

27 38 57

Los intervalos de clase y sus frecuencias ya fueron calculados anteriormente.

Estos resultados fueron los siguientes:

Intervalo de clase: Ic Frecuencia: “f”

10-19 5

20-29 19

30-39 10

40-49 13

50-59 4

Page 37: Apuntes de estadistica con enfoque a la bioestadistica

32

60-69 4

70-79 2

Cálculo de los puntos medios (mi) de los intervalos de clase.

Intervalo de 10 a 19 mi = 5.142

29

2

1910

Puesto que los intervalos de clase tienen el mismo ancho (10) y además existe

continuidad de intervalos, entonces los puntos medios de cada intervalo se podrán

calcular sumando el valor 10 a cada punto medio del intervalo anterior.

En caso de no existir continuidad de intervalos no debemos sumar el ancho

referido.

Veamos la tabla siguiente:

Intervalo de clase: Ic Punto medio (mi) del intervalo de clase

10-19 14.5

20-29 14.5+10 = 24.5

30-39 24.5+10 = 34.5

40-49 34.5+10 = 44.5

50-59 44.5+10 = 54.5

60-69 54.5+10 = 64.5

70-79 64.5+10 = 74.5

La media aritmética que se busca a través de datos agrupados, se calcula

multiplicando cada punto medio (mi), por su frecuencia correspondiente (fi); se

suman estos productos y se divide entre la suma de las frecuencias (fi).

X =

i

ii

f

fm

Para el ejemplo anterior, tendremos lo siguiente:

Intervalo de clase IC

Punto medio del intervalo.

mi

Frecuencia del intervalo.

f

Producto (mi)(f)

Page 38: Apuntes de estadistica con enfoque a la bioestadistica

33

10-19 14.5 5 72.5

20-29 24.5 19 465.5

30-39 34.5 10 345.0

40-49 44.5 13 578.5

50-59 54.5 4 218.0

60-69 64.5 4 258.0

70-79 74.5 2 149.0

57 2086.5

Media aritmética = X =

i

ii

f

fm = 6.36

57

5.2086

Ejemplo 2.

La tabla siguiente muestra 7 intervalos de clase que agrupan salarios que cobran

100 enfermeras que trabajan en el ISSSTE de Cd. Altamirano. Asimismo, se indica

la frecuencia de cada intervalo (número de enfermeras que cobran el salario

comprendido dentro de ese intervalo).

Se pide calcular la media aritmética.

Intervalos de clase (salarios mensuales)

IC

Frecuencia. f

De 419 a 437 9

De 238 a 456 25

De 457 a 475 36

De 476 a 494 14

De 495 a 513 0

De 514 a 532 8

De 533 a 551 8

100

Solución:

Calculemos los puntos medios (mi) de los intervalos.

Del intervalo 419 a 437: mi = 4282

437419

Page 39: Apuntes de estadistica con enfoque a la bioestadistica

34

Del intervalo 238 a 456: mi = 4472

456438

Del intervalo 457 a 475 mi = 4662

475457

Del intervalo 476 a 494 mi = 4852

494476

Del intervalo 495 a 513 mi = 5042

513495

Del intervalo 514 a 532 mi = 5232

532514

Del intervalo 533 a 551 mi = 5422

551533

Ahora construyamos una tabla donde tengamos los productos (mi)(fi)

Intervalo de clase Ic

Frecuencia f

Puntos medios mi

Productos (mi)(fi)

419 a 437 9 428 3852

438 a 456 25 447 11175

457 a 475 36 466 16776

476 a 494 14 485 6790

495 a 513 0 504 0

514 a 532 8 523 4184

533 a 551 8 542 4336

100 47113

La media aritmética será: X =

i

ii

f

fm

X = 13.471100

47113

4.2.- La mediana a partir de datos agrupados.

Cuando los datos se tienen agrupados en intervalos de clase, la mediana se

calcula siguiendo la secuencia siguiente:

Page 40: Apuntes de estadistica con enfoque a la bioestadistica

35

a) Se calcula el intervalo de clase que contiene a la mediana. Este intervalo es

aquel que ocupa el lugar 2

N, donde N es el número total de datos u

observaciones.

b) Se calcula la frecuencia acumulada que corresponde al intervalo inmediato

inferior al intervalo que contiene a la mediana.

c) Se calcula la frecuencia del intervalo de la mediana.

d) Se calcula el ancho del intervalo de clase.

e) Se calcula el límite real inferior del intervalo que contiene a la mediana.

f) Para calcular a la mediana se aplica la fórmula siguiente:

Mediana = )(2 if

fN

La

Donde:

L = Límite real inferior del intervalo que contiene a la mediana.

N = Número de datos u observaciones.

fa = Frecuencia acumulada en el intervalo inmediato inferior al intervalo que

contiene a la mediana, la cual es la misma que la frecuencia acumulada de “L”.

f = frecuencia del intervalo que contiene a la mediana.

i = ancho o longitud del intervalo que contiene a la mediana.

Ejemplo 1.

La tabla siguiente, muestra datos agrupados de edades de 180 personas que en el

año 2102 se practicaron examen de glucosa en el IMSS de Cd. Altamirano.

Intervalo de clase Ic

Frecuencia f

Frecuencia acumulada fa

41.5 – 46.5 2 2

46.5 – 51.5 9 11

51.5 – 56.5 31 42

56.5 – 61.5 50 92

61.5 – 66.5 51 143

66.5 – 71.5 30 173

Page 41: Apuntes de estadistica con enfoque a la bioestadistica

36

71.5 – 76.5 7 180

180

Se pide calcular la mediana.

Solución.

Apliquemos la secuencia que hemos mencionado.

a) Cálculo del intervalo que contiene a la mediana.

Lugar = 902

180

2

N

Si observamos la columna de las frecuencias acumuladas, se tiene que el valor 90

está en el intervalo 56.5 – 61.5 donde se tienen 92 frecuencias acumuladas; es

decir, el intervalo 56.5 – 61.5 contiene aquellos valores que ocupan desde el lugar

43 hasta el lugar 92 y ahí está el lugar 90.

b) Cálculo de la frecuencia acumulada que corresponde al intervalo inmediato

inferior al intervalo que contiene a la mediana.

El intervalo inmediato inferior a 56.5 – 61.5 es el intervalo 51.5 – 56.5. La

frecuencia acumulada para este intervalo es 42. Así que:

fa = 42

c) Cálculo de la frecuencia del intervalo de la mediana.

El intervalo donde está la mediana es como ya dijimos el 56.5 – 61.5 y ahí la

frecuencia es 50. Así que:

f = 50

d) Cálculo del ancho del intervalo (i).

Si observamos la tabla, el ancho es el mismo para todos los intervalos y su valor

es 5.

i = 5

e) Cálculo del límite inferior del intervalo donde está la mediana.

El intervalo es como ya dijimos el 56.5 – 61.5; así que el límite inferior es 56.5

Page 42: Apuntes de estadistica con enfoque a la bioestadistica

37

L = 56.5

f) Sustituyendo valores en la fórmula, tenemos:

MEDIANA = L + )(2 if

fN

a

= 56.5 + )5(50

4290

MEDIANA = 61.3

Ejemplo 2.

La tabla siguiente muestra datos agrupados que corresponden a pesos en gramos

de tumores malignos que le fueron extirpados a 57 personas.

Intervalo de clase (pesos en gramos)

Ic

Frecuencia f

Frecuencia acumulada fa

10 -19 5 5

20 - 29 19 24

30 - 39 10 34

40 - 49 13 47

50 - 59 4 51

60 - 69 4 55

70 - 79 2 57

57

Se pide calcular la Mediana.

Solución:

Aplicando la secuencia tenemos:

a) Cálculo del intervalo que contiene a la mediana.

Lugar = 5.282

57

Page 43: Apuntes de estadistica con enfoque a la bioestadistica

38

Al observar la columna de frecuencia acumulada, se tiene que dicho lugar se

encuentra en el intervalo 30 – 39; es decir, este intervalo contiene valores

comprendidos desde el lugar 24 hasta el 34, que es el espacio donde está el lugar

28.5

b) Cálculo de la frecuencia acumulada que corresponde al intervalo inferior al

intervalo donde está la mediana.

El intervalo inferior al 30 – 39 es el 20 – 29. La frecuencia acumulada para este

intervalo es 24. Entonces se tendrá que:

fa = 24

c) Cálculo de la frecuencia del intervalo donde está la mediana. Este intervalo

es como ya se dijo el 30 – 39. La frecuencia para este intervalo es 10. Así

que:

f = 10

d) Cálculo del ancho (i) del intervalo donde está la mediana.

Según la tabla, todos los anchos de los intervalos son iguales y su valor es 10.

Así que:

i = 10

e) Cálculo del límite inferior del intervalo donde está la mediana.

El intervalo es como ya se dijo el 30 – 39; así que el límite inferior es 30. Así

que

L = 30

f) Apliquemos la fórmula:

MEDIANA = L + f

fN

a2

Page 44: Apuntes de estadistica con enfoque a la bioestadistica

39

MEDIANA = 30 + )10(10

245.28

MEDIANA = 34.5

Tarea.

Hagan equipos de 5 estudiantes y resuelvan el siguiente problema.

Problema.

La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias.

Estos intervalos representan pesos en gramos de tumores malignos que le fueron

extirpados a 57 pacientes enfermos.

Intervalo de clase (pesos en gramos)

IC

Frecuencia f

Frecuencia acumulada fa

9.5 – 19.5 5 5

19.5 – 29.5 19 24

29.5 – 39.5 10 34

39.5 – 49.5 13 47

49.5 – 59.5 4 51

59.5 – 69.5 4 55

69.5 – 79.5 2 57

57

Se pide que calculen la Mediana.

Respuesta: Mediana = 34

Page 45: Apuntes de estadistica con enfoque a la bioestadistica

40

4.3.- La moda a partir de datos agrupados.

Al estudiar las medidas de tendencia central para una colección de datos, se dijo

que la moda es el valor que ocurre con mayor frecuencia. En el mismo sentido, si

lo único que se conoce son datos agrupados (intervalos de clase), la moda es el

intervalo que tiene la más alta frecuencia.

Ejemplo 1.

La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias.

Estos intervalos representan pesos en gramos de tumores malignos que le fueron

extirpados a 57 pacientes enfermos.

Intervalo de clase (pesos en gramos) IC

Frecuencia f

10 – 19 5

20 – 29 19

30 – 39 10

40 – 49 13

50 – 59 4

60 – 69 4

70 - 79 2

57

Se pide calcular la Moda.

Solución:

Al observar la tabla se tiene que el intervalo de mayor frecuencia es el 20 – 29 (su

frecuencia es 19); entonces ese intervalo es LA CLASE MODAL.

Si se trata de dar un valor numérico para la moda, entonces recurrimos a la media

(promedio) de los límites del intervalo de la CLASE MODAL.

MODA = 5.242

2920

Page 46: Apuntes de estadistica con enfoque a la bioestadistica

41

4.4.- La varianza y la desviación estándar a partir de datos agrupados.

Cuando se estudió a la varianza a partir de una colección de datos, se dijo que su

valor se encontraba con la fórmula siguiente:

S2 = N

xx 2)(

Cuando lo único que conoce son los intervalos de clase (los datos están

agrupados), la varianza se calcula con la fórmula siguiente:

S2 =

1

)( 2

f

xmi (f)

Donde:

f = frecuencia

mi = punto medio del intervalo

Ejemplo 1.

En la escuela de enfermería se aplicó un examen de bioestadística a 51

estudiantes. Las calificaciones variaron entre 50 y 95 puntos. Se hicieron 8

intervalos de clase con una amplitud (ancho) de 6 unidades.

La tabla siguiente muestra los intervalos de clase (puntos obtenidos por los

estudiantes) y las frecuencias que se presentaron.

Intervalo de clase (puntos obtenidos por los estudiantes)

Ic

Frecuencia f

48 - 54 2

54 – 60 3

60 – 66 5

66 – 72 8

72 – 78 10

78 – 84 12

84 – 90 10

90 - 96 1

51

Page 47: Apuntes de estadistica con enfoque a la bioestadistica

42

Se pide calcular la varianza S2 y la Desviación Estándar S.

Solución:

La solución del problema requiere que se conozca primeramente la media

aritmética ( X ). Para lograrlo, necesitamos conocer los puntos medios (mi) y los

productos (mi)(fi). Construyamos una tabla como la siguiente:

Intervalo de clase

Ic

Punto medio del intervalo:

mi

Frecuencia: fi

Producto:

(mi)(fi)

48 – 54 51 2 102

54 – 60 57 3 171

60 – 66 63 5 315

66 – 72 69 8 552

72 – 78 75 10 750

78 – 84 81 12 972

84 – 90 87 10 870

90 - 96 93 1 93

51 3825

Cálculo de X : X = 7551

3825

i

ii

f

fm

Ahora conviene ampliar la tabla para poder calcular la varianza:

Productos

(mi)(fi)

La resta

xmi

Elevando al

cuadrado 2)( xmi

El

producto

ii fxm 2)(

La varianza

102 51 - 75 = -24 576 1152

)(1

)( 2

2

i

i

if

f

xmS

171 57 – 75 = -18 324 972

315 63 – 75 = - 12 144 720

552 69 – 75 = - 6 36 288

750 75 – 75 = 0 0 0

972 81 – 75 = 6 36 432

870 87 – 75 = 12 144 1440

Page 48: Apuntes de estadistica con enfoque a la bioestadistica

43

93 93 – 75 = 18 324 324

1584 5328

La varianza: 56.10650

5328

151

53282

S

La desviación estándar: S = 323.1056.1062 S

Ejemplo 2.

En la Clínica Avenida de Cd. Altamirano, los Doctores Franco Rojo y René

Fernández extirparon 57 tumores cancerosos a igual número de pacientes. Los

tumores se pesaron en gramos y de acuerdo a los pesos que se tuvieron se

agruparon en 7 intervalos de clase. La tabla siguiente muestra dichos intervalos y

la frecuencia de cada intervalo.

Intervalo de clase que agrupa pesos en gramos de tumores extirpados. IC

Frecuencia presentada o sea número de pacientes agrupados en el intervalo. f

10 – 19 5

20 – 29 19

30 – 39 10

40 – 49 13

50 – 59 4

60 – 69 4

70 – 79 2

57

Se pide calcular la varianza y la desviación estándar.

Page 49: Apuntes de estadistica con enfoque a la bioestadistica

44

Solución.

Para resolver el problema, necesitamos por principio conocer a la media aritmética

o sea x .

x =

i

ii

f

fm

Construyamos la tabla siguiente:

Intervalo de clase

Ic

Punto medio del intervalo:

mi

Frecuencia: fi

Producto:

(mi)(fi)

10 - 19 14.5 5 72.5

20 - 29 24.5 19 465.5

30 - 39 34.5 10 345.0

40 - 49 44.5 13 578.5

50 - 59 54.5 4 218.0

60 - 69 64.5 4 258.0

70 - 79 74.5 2 149.0

57 2086.5

x = 6.3657

5.2086

i

ii

f

fm

Ahora construyamos la siguiente tabla donde se tiene la varianza:

Productos

(mi)(fi)

La resta

xmi

Elevando

al

cuadrado 2)( xmi

El

producto

ii fxm 2)(

La varianza

72.5

14.5 – 36.6 = - 22.1 488.41 2442.05

)(1

)( 2

2

i

i

if

f

xmS

465.5

24.5 – 36.6 = - 12.1 146.41 2781.79

345.0

34.5 – 36.6 = - 2.1 4.41 44.10 578.5

44.5 – 36.6 = 7.9 62.41 811.33

218.0

54.5 – 36.6 = 17.9 320.41 1281.64

258.0

64.5 – 36.6 = 27.9 778.41 3113.64

Page 50: Apuntes de estadistica con enfoque a la bioestadistica

45

149.0

74.5 – 36.6 = 37.9 1436.41 2872.82

2086.5

13347.37

La varianza es:

)(1

)( 2

2

i

i

if

f

xmS

34.23856

37.13347

1.57

37.13347)(

1

)( 2

2

i

i

if

f

xmS

La desviación estándar “S” será entonces:

43.1534.2382 SS

El coeficiente de variación C.V. sería entonces:

)100(..x

SVC

42

6.36

43.15)100(..

x

SVC

Tarea:

Hagan equipos de 5 estudiantes y resuelvan el problema siguiente:

Problema.

El grupo 401 de la Preparatoria 8 hicieron un trabajo de investigación que consistió

en recabar el número de ancianos y sus respectivas edades que solicitaron

consulta en el ISSSTE de Cd. Altamirano durante el mes de julio de 2013.

La jefa de grupo (Karla) reportó que fueron 100 ancianos y sus edades las escribió

en la tabla siguiente:

Page 51: Apuntes de estadistica con enfoque a la bioestadistica

46

62 72 72 69 69 69 61 68 71 71

64 67 64 67 60 64 67 66 64 67

65 64 74 64 73 65 63 74 64 63

73 64 67 73 71 71 67 65 67 67

67 63 63 63 64 71 64 74 71 71

70 67 70 66 70 67 70 66 70 66

66 68 66 66 69 67 67 68 68 68

68 66 68 70 70 66 67 66 66 70

68 68 68 70 67 67 68 68 67 69

67 67 67 70 70 70 70 61 70 70

Calcular:

1. Construye una tabla donde ordenes los datos (de menor a mayor)

2. Calcula el número de intervalos de clase y su ancho correspondiente para

propósitos de tabulación.

3. Construye una tabla de distribución de frecuencias.

4. Construye una tabla de frecuencias acumuladas y frecuencias relativas

acumuladas.

5. Construye un histograma y un polígono de frecuencias.

Calcular también:

1. La media

2. La mediana

3. La moda.

Calcular también:

1. La desviación media

2. La varianza

3. La desviación estándar

4. El coeficiente de variación.

Hacer una tabla con los datos agrupados (los intervalos de clase) y a partir de

estos datos calcular:

Page 52: Apuntes de estadistica con enfoque a la bioestadistica

47

1. La media aritmética

2. La moda

3. La varianza

4. La desviación estándar.

Page 53: Apuntes de estadistica con enfoque a la bioestadistica

48

PARTE II

EL AZAR Y SU MEDIDA

CONCEPTOS BÁSICOS DE PROBABILIDAD COMO UNA

INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL.

En la parte I de estos apuntes, se trataron algunos puntos de vista para describir

datos que bien pueden venir de alguna colección o estar agrupados en

intervalos de clase. Estos puntos de vista constituyen la Estadística Descriptiva.

También dijimos que la Estadística propiamente dicha se acostumbra dividirla en

dos partes: La Descriptiva y la Inferencial.

La Estadística Inferencial tiene como propósito hacer inferencias; es decir se trata

de “predecir algo que puede suceder”, de “tomar decisiones”, de “hacer

estimaciones de algo”, de “sacar conclusiones”, etc.

La Estadística Inferencial requiere de LA TEORIA DE LA PROBABILIDAD y

debido a ello, trataremos en esta parte II algunos conceptos básicos de esta

teoría.

1.- LA PROBABILIDAD.

Esta palabra es un concepto un tanto vago que se usa en la vida cotidiana. Su uso

trata de indicar cuán posible es que ocurra un evento en el futuro. Un médico por

ejemplo suele decir: “ Se tiene una probabilidad de un 80% que el medicamento

tenga buenos resultados”. Un agricultor dice “ Presiento que tengo una

probabilidad de un 90% de tener buena cosecha”. Un meteorólogo dice “Se tiene

una probabilidad del 100% que hoy por la tarde lloverá”.

Así entonces conocer algo o mucho nos ayuda a tomar decisiones. Es por esto

que es importante estudiar la aplicación de la probabilidad y cómo medirla, lo

mismo que cómo emplearla para hacer inferencias.

Page 54: Apuntes de estadistica con enfoque a la bioestadistica

49

Hacer inferencias ayuda en mucho en estudios que se hacen a procesos físicos,

químicos, biológicos, económicos, sociales etc., que generan acontecimientos que

no son tan fáciles de predecir con exactitud.

También se tiene que la probabilidad aparece en rubros como los juegos de azar,

casinos, fenómenos meteorológicos, deportes organizados, demandas que tendrá

un producto nuevo, eficacia de un suero, presupuestar, estimación de la carga que

soporta un puente antes de derrumbarse y caer, etc.

Pero antes de iniciar con el estudio de esta teoría, recordemos un poco a la Teoría

de Conjuntos en la cual se apoya.

2.- LA TEORÍA DE CONJUNTOS.

2.1.-Definición de conjunto.

Un conjunto se define como una colección bien definida.

La colección puede ser números, objetos, personas, cualidades de algo, cosas,

etc. A los elementos de la colección se les llama miembros del conjunto o

simplemente elementos.

Los conjuntos se representan con letras mayúsculas y a los elementos se les

encierra en un par de llaves.

Ejemplos:

Conjunto de las vocales del abecedario: A = uoiea ,,,,

Conjunto de los hijos de Adán y Eva: A = AbelCain,

Conjunto de los números naturales del 1 al 10: A = 10,9,8,7,6,5,4,3,2,1

Conjunto de los municipios de la tierra caliente de Guerrero:

Zirandaro

oPungarabatCoyucaTlalchapaCutzamalaTlapehualaAjuchitlanMiguelTSArcelia ,,,,,,,.,

Conjunto de las Preparatorias de la UAG en tierra caliente:

A = 39,37,20,18,8

2.2.- Descripción de conjuntos.

Page 55: Apuntes de estadistica con enfoque a la bioestadistica

50

Existen tres formas para describir un conjunto:

1. Por enumeración

2. Por una regla (comprensión)

3. Por diagramas de Venn.

Los de enumeración se escriben conteniendo una lista de los elementos que

constituyen el conjunto.

Los de la regla se escriben usando símbolos matemáticos propios del lenguaje de

esta disciplina.

Los escritos usando los diagramas de Venn, consisten en dibujos geométricos que

expresan a los conjuntos.

De los tres anteriores, usaremos en estos apuntes a los de enumeración y los

diagramas de Venn. Los de la regla les daremos poca atención ya que estos

sirven principalmente a los matemáticos interesados en la estadística.

A manera de ejemplo, describamos al conjunto formado por los números naturales

comprendidos del 0 (inclusive) al 10 (inclusive). Recordemos que los números

naturales son los que se usan para contar: 1, 2, 3 , 4 etc; algunos matemáticos

dicen que el cero también es natural (aceptemos esta opinión).

1. Por enumeración será: A = 10,9,8,7,6,5,4,3,2,1,0

2. Usando la regla de los matemáticos: A = x I x es natural donde 0 ≤ x ≤10

Se lee diciendo: x es natural tal que (el matemático le llama “tal que” a la rayita

vertical) x cumple conque cero es menor o igual a x y x es menor o igual a 10.

3. Usando los diagramas de Venn.

Este diagrama consiste en hacer un dibujo donde una circunferencia encierra a los

elementos del conjunto. Esta circunferencia es encerrada en un rectángulo que

representa al conjunto universal (U) que es aquel conjunto universo donde

pertenecen los elementos del conjunto que se está estudiando.

Para nuestro ejemplo tendríamos:

1 3 5 2

4 10 6 8

7 0 9

U

A

Page 56: Apuntes de estadistica con enfoque a la bioestadistica

51

2.3.-Algunos tipos de conjuntos.

Para los propósitos de este curso y tomando en cuenta a los elementos de un

conjunto y asimismo, evadiendo lo mas posible el rigor de las matemáticas,

tenemos los tipos de conjuntos siguientes:

1. Conjunto unitario.- Es aquel que tiene un solo elemento.

2. Conjunto vacío.- Es el que carece de elementos. Se acostumbra escribirlos

con la letra griega Ф. Es importante decir que este conjunto no debe

confundirse con aquel que tiene como único elemento al cero.

3. Conjunto Universal.- Es el que contiene todos los elementos posibles del

conjunto. Se acostumbra escribirlo con la letra U.

4. Un conjunto “A” es subconjunto de otro conjunto “B”, si y solo si cada

elemento de “A” es también elemento de “B”. Para indicar que “A” es

subconjunto de “B” se escribe A С B.

5. El conjunto vacío escrito como Ф es subconjunto de cualquier otro conjunto.

6. Dos conjuntos son iguales si y solo si contienen los mismos elementos.

2.4.- Cardinalidad de un conjunto.

La cardinalidad de un conjunto “A” es el número de elementos que contiene

distintos unos de otros, y se acostumbra simbolizarlos con #(A).

Ejemplos.

Determina la cardinalidad de cada uno de los conjuntos siguientes:

A = días de la semana

#(A) = 7

B = los dedos de una mano normal

#(B) = 5

C = 0

#(C) = 1

Ф=

#(D) = 0

E = Aníbal, René, Karla

Page 57: Apuntes de estadistica con enfoque a la bioestadistica

52

#(E) = 3

2.5.- Operaciones con conjuntos.

Son cuatro las operaciones básicas que se hacen con un par de conjuntos

llamados “A” y “B”.

1. Unión

2. Intersección

3. Complemento

4. Diferencia.

UNIÓN.- La unión de dos conjuntos A y B es otro conjunto C cuyos elementos

están en A o están en B. Para indicar la operación unión se acostumbra usar el

símbolo U.

Ejemplo.

Sea el conjunto A = 1,2,3,4,5,6 y el conjunto B = 2,4,7,8,9,10,11

Calcular el conjunto unión.

Solución:

C = A U B = 1,2,3,4,5,6,7,8,9,10,11

Usando los diagramas de Venn se tendrá:

U =

INTERSECCIÓN.- La intersección de dos conjuntos A y B es otro conjunto C

cuyos elementos son comunes tanto en A como en B. En otras palabras, los

elementos de C, se tienen tanto en A como en B.

Para indicar esta operación se acostumbra usar el símbolo

1 2 3

4 5 6

A 2 4 7 8

9 10 11

B 1 2 3 4 5 6

7 8 9 10 11

C

U

Page 58: Apuntes de estadistica con enfoque a la bioestadistica

53

Ejemplo 1.

Se tiene el conjunto A = a b c d e y el conjunto B = b d f g

Calcular su intersección.

Solución:

A B = b d

Nota: Nótese que los elementos b y d son comunes en A y B.

Usando los diagramas de Venn se tiene:

También es común hacer el siguiente diagrama como intersección:

Ejemplo 2.

El conjunto de médicos que trabajan en la Preparatoria 8 de Cd Altamirano es:

A = René, Franco, Jorge, Alejandro, Alfonso

El conjunto de médicos que trabajan en el ISSSTE de Cd. Altamirano es:

B = René, Natividad, Hildebrando, Alejandro, Xetzael

Calcular el conjunto intersección:

Solución:

A B = René, Alejandro

U

a b c d e U b d f g = b d

b

d a c e

f

g

A B C

A B

U

Page 59: Apuntes de estadistica con enfoque a la bioestadistica

54

Usando el diagrama de Venn:

René, Alejandro

COMPLEMENTO.- El complemento de un conjunto “A” escrito como AC es el

conjunto de todos los elementos del universo que no están en A. En otras

palabras, son todos los elementos que le faltan a A para ser U. Entonces:

AC = U – A

Ejemplo 1.

Un conjunto A = a, b, c, d y el conjunto universal es el alfabeto completo.

Calcular el complemento de A; es decir AC.

Solución:

AC = e, f, g, h….x, y, z

Usando el diagrama de Venn:

Franco

Jorge

Alfonso

Natividad

Hildebrando

Xetzael

A

B

a b c

d

e f g h i

j k l m n

ñ o p q

r s t u v

w x y z

A

U

Page 60: Apuntes de estadistica con enfoque a la bioestadistica

55

Ejemplo 2

El conjunto de Preparatorias de la UAG en la tierra caliente es:

A = 8, 18, 20, 37, 39

El universo de las preparatorias de la UAG está formado por 40 preparatorias

distribuidas en todo el estado de Guerrero.

Calcular el complemento de A; es decir AC.

Solución:

AC = 1,2,3,4,5,6,7,9,10,11,12,13,14,15,16,17,19,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,38,40

Usando el diagrama de Venn:

DIFERENCIA.- La diferencia de dos conjuntos A y B, escrito como A – B, es el

conjunto de elementos que pertenecen a “A”; pero no pertenecen a “B”.

Ejemplo.

Sea el conjunto A = a, b, c, d, e y sea otro conjunto B = b, d, f, g

Calcular A – B.

Solución:

A – B = a, c, e

A

8, 18, 20, 37,

39

1,2,3,4,5,6,7,9,10,11,12,13,14,15

16,17,19,21,22,23,24,25,26,27,28

29,30,31,32,33,34,35,36,38,39,40

U

Page 61: Apuntes de estadistica con enfoque a la bioestadistica

56

Usando el diagrama de Venn:

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente:

1.-Se tienen los conjuntos:

A = a, b, c, d, e, f, g, h, i, j

B = a, c, e, g, i, k, n, p

Calcular numéricamente y con diagramas de Venn lo siguiente:

A U B

A B

AC

A – B

2.- Se tienen los conjuntos:

SEA EL CONJUNTO UNIVERSAL U = A,B,C,D,E,F,G,H,I,J,K,L

A

a, c e

b, d f, g

B

U

Page 62: Apuntes de estadistica con enfoque a la bioestadistica

57

A = A,B,C,D,E

B = E,F,G,H

Calcular lo siguiente:

A U B

A B

BC

B – A

(A U B)C

(A B)C

AC U BC

AC BC

3.- INICIACIÓN A LA TEORIA DE LA PROBABILIDAD.

Anteriormente explicamos la importancia de la probabilidad en diferentes

contextos sociales.

Iniciamos esta teoría diciendo que la medida de la probabilidad se hace en una

escala comprendida entre cero y uno ( o entre 0% y 100%). Esta medida indica

la factibilidad que ocurra cierto resultado al cual se le llama evento. La figura

siguiente muestra esquemáticamente la medida de la probabilidad:

U

U

U

0 1 0.5

Evento con medida

cero de probabilidad:

El rector de la UAG

estará 100 años en el

cargo.

Evento con medida 0.5

de probabilidad:

Al nacer el bebé será

HOMBRE.

Evento con medida 1

de probabilidad:

A toda persona se le

llega la hora de su

muerte

Page 63: Apuntes de estadistica con enfoque a la bioestadistica

58

3.1. Conceptos básicos de la probabilidad.

3.1.1.-Experimento.

Es la operación que consiste en observar los resultados obtenidos en ciertas

condiciones de trabajo.

Los experimentos pueden ser aleatorios (también se les llama estocásticos) o

deterministas. Los aleatorios son aquellos que pueden tener uno de varios

resultados y por lo tanto no puede predecirse cuál será el que ocurrirá. Los

deterministas en cambio, son aquellos que tienen un único resultado o sea ya se

sabe lo que ocurrirá.

Un ejemplo de experimento aleatorio sería “el lanzamiento de una moneda al aire”.

Al caer la moneda, puede caer en sol o en águila. Es decir, no podemos predecir

lo que ocurrirá.

Otro ejemplo de experimento aleatorio sería “el tirar un dado”. Puede suceder que

caiga en 1, en 2, en 3, en 4, en 5 o en 6. Es decir, no podemos predecir lo que

ocurrirá.

Un ejemplo de experimento determinista sería “el sacar una bola azul de una caja

que contiene 10 bolas todas azules”. Es decir, sabemos de antemano que saldrá

azul.

Otro ejemplo de experimento determinista sería “la elección del puerto turístico

mas importante de Guerrero: Acapulco o Zihuatanejo”. Sabemos de antemano que

es Acapulco.

3.1.2.-Evento.

Es el conjunto de uno o mas resultados de un experimento.

El evento puede ser simple o compuesto. Un evento es simple cuando es un solo

resultado del espacio muestral. Un ejemplo sería que en el experimento de “tirar

un dado” el evento fuera “que salga número par”. Así el evento puede ser un solo

elemento del conjunto 2, 4, 6. En cambio, un evento será compuesto cuando el

resultado esperado sea un solo resultado; pero con dos características. Así en el

experimento de “tirar un dado”, que el evento fuera “un número par mayor a 4”

Page 64: Apuntes de estadistica con enfoque a la bioestadistica

59

(aquí existen dos características: que sea par y mayor que 4). El evento esperado

será el conjunto unitario 6.

3.1.3.-Espacio muestral.

Es el conjunto de todos los posibles eventos o resultados que pueden ocurrir del

experimento. Se acostumbra representarlo con la letra ῼ

En el experimento “lanzar al aire una moneda”, el espacio muestral será águila (a)

y sol (s).

ῼ = a, s

En el experimento “tirar un dado”, el espacio muestral será el conjunto:

ῼ = 1, 2, 3, 4, 5, 6.

En el experimento “de una carta americana (tiene 52 cartas) sacar un rey de

diamantes”. ¿Cuál es el espacio muestral?

Será: ῼ = 52 cartas

En el experimento “se observa el funcionamiento de tres aparatos electrónicos

durante una semana. Nos interesa saber el número de aparatos diferentes que se

descompongan una o mas veces durante la semana”. Indicar el espacio muestral

a considerar.

Será:

ῼ = 0,1,2,3

No olvidemos que el espacio muestral es el conjunto de todos los resultados

posibles del experimento. Así que:

Resultado posible 1: Se descomponen 0 aparatos.

Resultado posible 2: Se descompone un aparato.

Resultado posible 3: Se descomponen 2 aparatos.

Resultado posible 4: Se descomponen 3 aparatos.

Page 65: Apuntes de estadistica con enfoque a la bioestadistica

60

3.1.4.-Punto muestral.

Es cada uno de los valores del espacio muestral. A cada punto muestral le

corresponde una probabilidad, de tal suerte que la suma de todas las

probabilidades de ese espacio muestral es igual a uno.

Algunos se preguntan ¿Porqué se le da importancia a los juegos de azar como

lanzar monedas, tirar dados, sacar alguna carta, etc en la teoría de la

probabilidad.?. La respuesta es que para estructurar esta teoría, los iniciadores

como Girolamo Cardano (1501-1576) físico, astrólogo y matemático se valió de

esas situaciones para estructurar su teoría. Apoyándose en las conclusiones así

determinadas, hoy en día, se aplica en otras áreas del saber; así por ejemplo, en

medicina se puede presentar un caso como el siguiente: “Si un médico desea

probar que cierta droga cura determinada enfermedad, procede a su aplicación en

pacientes enfermos. Supongamos que la mitad de los enfermos recobran la salud;

pero la otra mitad muere. Ahora el médico sabe que tiene “cierta idea de

probabilidad de que si es posible sanar algunos enfermos”. Ahora elige 100

enfermos y se le presenta el caso que 55 sanaron; pero 45 murieron. Estos

nuevos resultados indican que el caso que se le está presentando al médico es

parecido al problema de tirar 100 veces una moneda, donde 55 salieron soles y 45

águilas. Así tenemos que los famosos juegos de azar sirven de comparación con

otras áreas como la medicina por ejemplo.

.

4.- LOS ENFOQUES DE LA PROBABILIDAD

Para asignar una medida de probabilidad, se tienen dos enfoques: Uno llamado

objetivo y el otro conocido como subjetivo.

El enfoque objetivo se apoya en las teorías y métodos matemáticos para asignar

una medida de probabilidad a un evento determinado.

El enfoque subjetivo se apoya en la experiencia o conocimientos de quien hace la

investigación.

El enfoque objetivo se divide a su vez en probabilidad clásica y probabilidad

empírica.

Veamos el esquema siguiente:

Page 66: Apuntes de estadistica con enfoque a la bioestadistica

61

4.1.-El enfoque clásico o modelo de Laplace.

Este enfoque o modelo se le debe al ilustre matemático francés Pierre Simón

Laplace (1749-1827).

Se basa en la idea de que los resultados de un experimento son igualmente

posibles.

Su medida o cálculo es de la forma siguiente:

Probabilidad de un evento = esCasosTotal

ablesCasosFavor

Ejemplo 1.

Dentro de una caja hay 10 pelotas, de las cuales 4 son azules. ¿Cuál es la

probabilidad de que sin ver saques una pelota azul?.

Solución:

Sea “A” el evento de sacar una pelota azul. Como cada pelota tiene la misma

probabilidad de ser sacada, utilizamos el enfoque Clásico:

P(A) = 4.010

4

Enfoques de la Probabilidad

Objetivo Subjetivo

Clásico Empírico

Page 67: Apuntes de estadistica con enfoque a la bioestadistica

62

La probabilidad es 0.4 (el 40%).

Ejemplo 2.

Se tiene una baraja americana (la baraja tiene 52 cartas, donde 26 son color

negro). Calcular la probabilidad de sacar una carta negra al azar.

Solución:

Sea A el evento de sacar una carta negra. Todas las cartas sean negras o no,

tienen la misma posibilidad de ser sacadas. Llamando P(A) a la probabilidad del

evento A, se tiene:

P(A) = 5.02

1

52

26

esCasosTotal

ablesCasosFavor

La probabilidad de sacar una carta negra será 0.5 o sea un 50%.

Ejemplo 3.

El experimento consiste ahora en sacar un “as” de una carta americana. La carta

tiene 4 ases.

Solución:

Llamando “A” al evento de sacar un “as”. Todas las cartas (son 52) tienen la

misma posibilidad de ser sacadas y puesto que únicamente son 4 ases:

P(A) = 0769.0

13

1

52

4

esCasosTotal

ablesCasosFavor

La probabilidad de sacar un “as” será 0.0769 o sea el 7.69%

Ejemplo 4.

Experimento: Se tiene una caja dentro de la cual existen 15 bolas numeradas del 1

al 15.

Page 68: Apuntes de estadistica con enfoque a la bioestadistica

63

Un alumno elige al azar una de esas bolas. ¿Cuál será la probabilidad de que la

bola elegida sea un número primo mayor a 5?.

Nota: Recordemos que un número es primo cuando se puede dividir únicamente

entre uno o él mismo. Son números primos el 2, 3, 5, 7, 11, 13, 17,19 etc.

Solución:

Las bolas tienen los números 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15.

Los números primos mayores a 5 son 7, 11 y 13 (las bolas están numeradas hasta

el 15). En este sentido se tienen 3 casos favorables.

Llamando “A” al evento de sacar un primo mayor a 5 y P(A) a la probabilidad del

evento se tendrá:

P(A) = 20.05

1

15

3

esCasosTotal

ablesCasosFavor

La probabilidad es 0.20 es decir, un 20%.

Ejemplo 5.

Experimento: “La escuela preparatoria 8 de Cd. Altamirano tiene 1500 estudiantes.

Se hizo una encuesta para saber qué áreas del conocimiento les gusta más”.

325 alumnos dijeron que matemáticas y ciencias experimentales. 550 contestaron

que ciencias de la salud y 625 humanístico sociales.

Construye una tabla y determina la probabilidad de que un estudiante elegido al

azar:

Estudie ingeniería

Estudie medicina

Estudie para abogado.

Estudie para ingeniero o para odontólogo.

Page 69: Apuntes de estadistica con enfoque a la bioestadistica

64

Solución.

Tabla:

Área del conocimiento Evento Número de estudiantes

Matemáticas y ciencias

experimentales.

ME 325

Ciencias de la salud CS 550

Humanístico-Sociales HS 625

Totales 1500

Probabilidad que un estudiante estudie ingeniería:

2166.0

1500

325)( MEP

La probabilidad es 21.66%

Probabilidad que un estudiante estudie medicina:

3666.0

1500

550)( CSP

La probabilidad es 36.66%

Probabilidad que un estudiante estudie abogacía:

4166.0

1500

625)( HSP

La probabilidad es 41.66%

Probabilidad que un estudiante estudie para ingeniero u odontólogo.

P(ME U CS) = P(ME) + P(CS)

5833.0

1500

875

1500

550

1500

325)()( CSPMEP

Page 70: Apuntes de estadistica con enfoque a la bioestadistica

65

Ejemplo 6.

La tabla siguiente muestra el personal técnico y profesional de un grupo de

hospitales tabulada por edad y categoría de trabajo.

SIGNOS: ≤ Menor o igual que > Mayor que

Conjunto A1 ≤25

A2 26-30

A3

31-35 A4 >35

Totales

B1 Médicos 0 5 25 75 105

B2 Laboratoristas 20 30 35 35 120

B3 Servicios de dietas 3 6 6 10 25

B4 Servicios de registros 7 15 8 12 42

B5 Servicios de

enfermería

200 375 442 203 1220

B6 Farmacia 1 12 8 3 24

B7 Tecnología radiológica 4 10 19 12 45

B8 Servicios terapéuticos 5 25 15 10 55

B9 Otros servicios

profesionales.

20 35 50 25 130

Totales 260 513 608 385 1766

a) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho

empleado tenga menos de 25 años de edad ?.

b) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho

empleado sea médico?.

c) Si del personal que tiene mas de 35 años se elige al azar un empleado

cualquiera . ¿Cuál será la probabilidad de que sea médico?.

Edades

Categoría

Page 71: Apuntes de estadistica con enfoque a la bioestadistica

66

Solución:

a) Debemos considerar que al elegir un empleado cualquiera, entonces puede ser

electo cualquiera de los 1766 (conjunto universal). En consecuencia, el total de

casos totales es 1766. De los 1766 empleados, solamente 260 (conjunto A1)

tienen una edad menor a 25 años; así que el total de casos favorables es 260.

La cardinalidad del conjunto A1 es: #(A1) = 260

La cardinalidad del conjunto Universal U es: #(U) = 1766

La probabilidad de A1 que llamamos P(A1) es:

La probabilidad de que un empleado cualquiera de los 1766 sea menor a 25 años

es 0.1472 o sea el 14.72%.

b) Para calcular la probabilidad de que un empleado cualquiera electo al azar sea

un médico, debemos considerar que la elección se hará con cualquiera de las

1766 personas. Así que el total de casos es 1766. De estos 1766, se tiene que

105 son médicos. Así que el total de casos favorables es 105.

La cardinalidad del conjunto B1 es: #(B1) = 105

La cardinalidad del conjunto universal U es: #(U) = 1766

La probabilidad de que de los 1766 empleados sea un médico es 0.059 o sea un

5.9%.

c) Para calcular la probabilidad de que un empleado electo al azar con

característica de que sea mayor a 35 años sea un médico, debemos considerar lo

siguiente:

1472.01766

260

)(#

)(#)( 1

1 U

AAP

059.01766

105

)(#

)(#)( 1

1 U

BAP

Page 72: Apuntes de estadistica con enfoque a la bioestadistica

67

Los casos totales o sea aquellos que son mayores a 35 años están representados

por el conjunto A4. De estos 385 se tiene que únicamente 75 son médicos; así que

el conjunto de casos favorables es el conjunto formado por la intersección de B1

con A4.

Cardinalidad de la intersección B1 con A4 es: # (B1 A4) = 75

Cardinalidad del conjunto A4 : # (A4) = 385

La probabilidad pedida es:

1948.0

385

75)( MP

Donde P(M) es la probabilidad de que alguien sea médico o sea 0.1948 = 19.48%

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente.

1.- En un grupo de 502 personas se determinó que la distribución de los grupos

sanguíneos era la siguiente:

Grupo Sanguíneo Número

O 226

A 206

B 50

AB 20

TOTAL 502

1.-Si se elige al azar una persona de este grupo, ¿cuál será la probabilidad de que

tenga el grupo sanguíneo:

U

Page 73: Apuntes de estadistica con enfoque a la bioestadistica

68

a) O? b) A? c) B? d) AB?

2.- Uno de los graves problemas que enfrenta actualmente la sociedad es el

alcoholismo. En fechas recientes se ha visto una tendencia a la alza en el

consumo de bebidas alcohólicas entre los jóvenes. La embriaguez causa muchos

accidentes de tránsito, como se muestra en la tabla siguiente:

Tipo de accidente Presentó aliento alcohólico

Colisión con vehículo automotor 22733

Colisión con peatón (atropellamiento) 934

Colisión con animal 135

Colisión con objeto fijo 7533

Volcadura 1164

Caída de pasajero 239

Salida del camino 1316

Incendio 48

Colisión con ferrocarril 9

Colisión con motocicleta 1705

Colisión con ciclista 587

Otro 326

Total 36729

a) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido

una colisión con vehículo automotor?

b) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido

una volcadura?.

Page 74: Apuntes de estadistica con enfoque a la bioestadistica

69

c) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido

una colisión con un peatón?

d) Investiguen ¿Qué es la responsabilidad social?. Discutan qué se pudiera

hacer al respecto para reducir la cantidad de accidentes y cuál es la

responsabilidad de cada ciudadano.

4.2.-El enfoque empírico.

Este enfoque se basa principalmente en frecuencias relativas, esto es, en el

número de veces que ocurrió cierto evento en el pasado y se calcula de la forma

siguiente:

Probabilidad del evento =

Nota: Conforme crece el número de observaciones, el enfoque empírico se acerca

al valor del enfoque clásico.

En otras palabras, el enfoque empírico se puede explicar diciendo que si un

experimento “E”, se repite “n” veces y si en cada caso de “n” se toma el resultado

“m”, entonces la probabilidad de “E” es aproximadamente igual a la frecuencia

relativa acumulada calculada como

Ejemplo 1.

Se lanza una moneda al aire 100 veces y se registra el número de soles en cada

20 tiradas. La tabla siguiente indica las frecuencias que se presentaron:

Número de

tiradas:

“n”

Número de soles

que salieron

Frecuencia

acumulada:

“m”

Frecuencia relativa

acumulada:

n

m

Número de veces que ocurrió en el pasado

Número total de observaciones

n

m

Page 75: Apuntes de estadistica con enfoque a la bioestadistica

70

20 8 8 0.40

40 10 18 0.45

60 12 30 0.50

80 11 41 0.51

100 9 50 0.50

Un promedio de las frecuencias acumuladas es 0. 47 o sea un 47% que es muy

parecido al enfoque clásico.

Si recordamos el enfoque clásico, se tiene que el espacio muestral es s,a o sea

la totalidad de casos es 2 y si hablamos de la probabilidad que salga “sol”, el caso

favorable es 1. Entonces la probabilidad que salga sol es:

5.0

2

1)( SP

Este valor es muy parecido a los valores de la columna de frecuencias relativas

acumuladas y en consecuencia al promedio de ellas.

Por eso hemos dicho que si aumenta el número “n”, la probabilidad es casi igual a

la frecuencia relativa acumulada.

Ejemplo 2.

Una persona lanza un dado “justo” 40 veces y anota cuántas veces salió cada

número del dado. Al terminar los lanzamientos, calcula cada una de las

probabilidades como el número de veces que salió cada número dividido entre el

número de lanzamientos realizados. Los resultados los anotó en la tabla siguiente:

Número del dado que

salió en las 40 tiradas

Número de veces que

salió el número del

dado

Probabilidad

1 8 20.0

40

8

2 6

15.040

6

3 10

25.040

10

4 4

10.040

4

Page 76: Apuntes de estadistica con enfoque a la bioestadistica

71

5 6 15.0

40

6

6 6

15.040

6

Si se aumentara el número de lanzamientos, se tendrían probabilidades muy

cercanas a que es lo que se tiene en el enfoque clásico,

Ejemplo 3.

El profesor Gabriel López Sarabio de la Preparatoria No 8 de Cd. Altamirano se

puso a jugar a los dados. El profesor lanzó 150 veces el dado y anotó las veces

que el dado cayó en números mayores que 4, es decir, el evento fue 5,6. Cada

vez que caía en número mayor que cuatro, trazaba una rayita (tarjado) y por

separado trazaba otra cuando no caía en número mayor que 4.

El profesor calculó la frecuencia relativa dividiendo las veces que cayó en número

mayor que 4 entre el total de lanzamientos. El profesor elaboró la tabla siguiente:

Evento A

Veces que cayó

en número mayor

que 4 (se usó un

tarjado de 5

rayitas)

Frecuencia

Frecuencia relativa

A 45 rayitas 45 3.0

150

45)( AP

AC 105 rayitas 105

7.0150

105)( CAP

Del resultado de la tabla, se concluye que la probabilidad del evento A o sea la

probabilidad que caiga en número mayor que 4, es de 0.3 o sea un 30%.

La probabilidad que no se cumpla lo anterior, representa el complemento de A, es

decir (AC). La probabilidad de que no se cumpla el número mayor que 4 será

entonces 0.7, es decir el 70%.

1667.06

1

Page 77: Apuntes de estadistica con enfoque a la bioestadistica

72

TAREA.

Formen equipos de 5 estudiantes y resuelvan el siguiente problema:

Antes de incluir la cobertura para ciertos tipos de problemas dentales en pólizas

de seguros médicos para adultos con empleo, una compañía de seguros desea

determinar la probabilidad de ocurrencia de esa clase de problemas, para que

pueda fijarse la prima de seguros de acuerdo con esas cifras. Para ello, un

especialista en estadística recopila datos para 10, 000 adultos que se encuentran

en categorías de edad apropiadas y encuentra que 100 de ellos han

experimentado el problema dental específico durante el año anterior.

Calculen la probabilidad de ocurrencia y comenten el resultado.

RESPUESTA: 0.01 o sea el 1%.

4.3.-El enfoque subjetivo.

Este enfoque consiste en confiar en la experiencia del investigador para asignar la

probabilidad de algún evento. Debido a esto, al enfoque subjetivo también se le

llama enfoque personalista.

Debemos decir, que este enfoque está cobrando mucha fuerza en los tiempos

actuales. Para ello, se concentra toda la información disponible del evento al que

se le asignará una probabilidad en manos de un experto, quien valiéndose de su

experiencia asigna la probabilidad.

Ejemplo 1.

Para asignar la probabilidad que el América sea campeón en la clausura 2013 del

futbol mexicano, se puso en manos de José Ramón Fernández (JOSERA) toda la

información del desempeño que ha tenido el América en la presente temporada.

JOSERA tiene la palabra (recordemos que no es mas que una probabilidad).

Ejemplo 2.

Un experto en mercado de la bodega Aurrera de Cd. Altamirano asigna una

probabilidad del 90% de que las ventas mejoren este año.

Page 78: Apuntes de estadistica con enfoque a la bioestadistica

73

Ejemplo 3.

En muchas ocasiones, las empresas desean conocer la probabilidad de que un

nuevo producto tenga éxito en el mercado. Para ello, recurren a la experiencia o

conocimiento del negocio de sus directivos o de sus vendedores. Tal vez

organicen grupos foco (focus group) , en los que las personas expresan el grado

de aceptación del producto. De esta manera, se utiliza el criterio o experiencia o

punto de vista personal para asignar una probabilidad de éxito o de un fracaso.

TAREA.

Formen equipos de 5 estudiantes y escriban 3 ejemplos de enfoques subjetivos.

Pueden consultar el internet. Comenten los ejemplos.

5.- LAS TÉCNICAS DE CONTEO

Cuando iniciamos la teoría de la probabilidad, dijimos que se tienen algunos

enfoques para ser estudiada. Uno de ellos fue el enfoque clásico, en el cual la

asignación de la probabilidad se hace dividiendo el número de casos favorables

entre el número de casos totales. En los ejemplos que al respecto se dieron,

pudimos fácilmente calcular ambos casos. Estos ejemplos fueron sencillos; así por

ejemplo en el experimento de “tirar un dado”, la probabilidad de que aparezca en

la cara superior un número para (2, 4, 6) dividimos el número total de pares (en

este caso 3) entre el número total de caras que tiene el dado (es 6). y la

probabilidad es ; es decir, de un 50%.

Pero se tienen experimentos donde no es tan fácil enumerar los casos favorables

y totales. Para salvar esta dificultad, se hace uso de las llamadas técnicas de

conteo que facilitan enumerar ambos casos.

El esquema siguiente ilustra estas técnicas:

5.02

1

6

3

Page 79: Apuntes de estadistica con enfoque a la bioestadistica

74

5.1.-Listar Resultados.

Esta técnica es la que empleamos en los ejemplos antes vistos. Contábamos los

casos, los enlistábamos y formábamos el espacio muestral. Una vez hecho esto,

procedíamos a calcular probabilidades.

5.2.-Diagrama de árbol.

En algunos experimentos resulta sencillo construir una especie de árbol donde se

anotan los puntos muestrales. Se cuentan estos puntos y se tiene el espacio

muestral.

Ejemplo 1.

Experimento: Se trata de lanzar dos dados. Trazar el diagrama de árbol y anotar el

espacio muestral.

Solución.

Cada dado tiene 6 caras numeradas del 1 al 6. Si el primer dado llega a caer en 1,

en 2, en 3, en 4, en 5 o en 6; el otro puede caer en cualquiera de esos mismos

números. El árbol puede ser entonces un dibujo como el siguiente:

Técnicas de conteo

Diagrama de

árbol

Fórmulas matemáticas:

Ley fundamental de la multiplicación.

Permutaciones

Combinaciones

Listar resultado

Page 80: Apuntes de estadistica con enfoque a la bioestadistica

75

La barra de la izquierda representa las posibilidades del dado 1 y la barra de la

derecha las posibilidades del dado 2 en cada una de las posibilidades del dado 1.

El espacio muestral de este experimento es:

1

2

3

4

5

6

1 2 3 4 5 6

1 2 3 4 5 6

1 2 3 4 5 6

1 2 3 4 5 6

1 2 3 4 5 6

1 2 3 4 5 6

Page 81: Apuntes de estadistica con enfoque a la bioestadistica

76

ῼ =

Nota: Observar que la cardinalidad del espacio muestral es 36. En otras palabras,

el número de puntos muestrales es 36.

En base a lo encontrado, podemos calcular probabilidades como las siguientes:

1.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados en uno

de ellos “caiga un 3 y en el otro caiga un 6”?

P( E ) = La probabilidad es del 2.7%

2.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados salgan

números nones (en un dado un non y en el otro también non)?.

Si analizamos el espacio muestral, los casos favorables son 9 puntos muestrales;

es decir, (1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5). La probabilidad

será:

25.0

36

9)( EP

Ejemplo 2.

La preparatoria No 8 de Cd. Altamirano tiene 1500 estudiantes. De esta cantidad,

325 les gusta el campo de las matemáticas y las ciencias experimentales, 550 las

ciencias de la salud y los 625 restantes el campo de humanístico-sociales.

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Casos favorables

Casos totales

027.036

1

La probabilidad es el 25%

Page 82: Apuntes de estadistica con enfoque a la bioestadistica

77

Con esta información, trace un diagrama de árbol y calcula la probabilidad de que

un estudiante elegido al azar estudie:

Ingeniería

Optometría

Historia

Solución:

El diagrama de árbol puede ser el siguiente:

Probabilidad de que un estudiante elegido al azar estudie ingeniería:

2166.0

1500

325)( IP

Probabilidad de que un estudiante elegido al azar estudie Optometría:

Estudiantes

# ῼ = 1500

Matemáticas y ciencias

experimentales

# (M y CE) = 325

Ciencias de la salud

# (CS) =550

Humanístico-sociales

# (HS) = 625

Page 83: Apuntes de estadistica con enfoque a la bioestadistica

78

3666.0

1500

550)( OP

Probabilidad de que un estudiante elegido al azar estudie Historia:

4166.01500

625)( HP

Ejemplo 3.

Un restaurante de Cd. Altamirano presenta la posibilidad de elegir como menú de

comidas corridas: un plato de entrada que puede ser sopa o arroz; como plato

principal puede elegir o carne o pollo o pescado y de postre puede ser o pastel o

helado.

Dibujar un diagrama de árbol que represente todas las posibilidades de comidas

corridas (espacio muestral) que ofrece el restaurante.

Solución:

Arroz

Sopa

Carne Pollo Pescado

Carne Pollo Pescado

Pastel

Helado

Pastel

Helado

Pastel

Helado

Pastel

Helado

Pastel

Helado

Pastel

Helado

Page 84: Apuntes de estadistica con enfoque a la bioestadistica

79

Si escribimos el espacio muestral, tendremos 12 comidas diferentes:

Nota: Debe observarse que la cardinalidad del espacio muestral es 12 y que

equivale al número de las últimas “ramitas” (las flechas) del árbol.

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente:

Problema.

En un restaurante de Cd. Altamirano se ofrece un menú de comidas corridas que

consiste en lo siguiente:

Como platillo de entrada se puede elegir entre sopa, jugo de naranja o jugo de

verduras.

Como platillo principal se puede elegir entre birria, aporreado o pollo.

Como postre se puede elegir entre pastel o gelatina.

1) Arroz-carne pastel

2) Arroz-carne-helado

3) Arroz-pollo-pastel

4) Arroz-pollo-helado

5) Arroz-pescado-pastel

6) Arroz-pescado-helado

7) Sopa-carne-pastel

8) Sopa-carne-helado

9) Sopa-pollo-pastel

10) Sopa-pollo-helado

11) Sopa-pescado-pastel

12) Sopa-pescado-helado

Page 85: Apuntes de estadistica con enfoque a la bioestadistica

80

Dibujen un diagrama de árbol, escriban el espacio muestral e indiquen la

cardinalidad.

Problema.

Se tiene un dado y una moneda. Se lanza el dado y se anota el número que queda

hacia arriba. En seguida se lanza la moneda y se anota el resultado. Dibujar un

diagrama de árbol que represente este experimento, escriban el espacio muestral

e indiquen la cardinalidad.

5.3.-Fórmulas matemáticas.

5.3.1.-Ley fundamental de la multiplicación.

En muchos experimentos no se prefiere el dibujo del árbol ya que resulta difícil de

trazarlo y se opta por usar la ley fundamental de la multiplicación. Con esta ley se

obtiene la cardinalidad del espacio maestral o sea el número de puntos

muestrales.

La ley dice que si en un experimento, una operación se puede hacer en “m”

formas y otra segunda operación se puede hacer en “n” formas, entonces las dos

operaciones pueden hacerse juntas en “m· n” formas .

Ejemplo 1.

En un experimento se lanza un par de dados. ¿Cuál es la cardinalidad del espacio

muestral de este experimento?

Solución.

El dado 1 puede caer en 6 maneras diferentes. Entonces puede caer en “m = 6”

formas distintas. El dado 2 presenta también “n = 6” formas distintas de caer. De

acuerdo con la ley fundamental de la multiplicación, la cardinalidad del espacio

muestral será:

# ῼ = m·n = (6) (6) = 36

Page 86: Apuntes de estadistica con enfoque a la bioestadistica

81

Ejemplo 2.

Un experimento consiste en lanzar un dado y posteriormente una moneda. ¿Cuál

es la cardinalidad del espacio muestral?.

Solución.

El dado presenta m = 6 formas de caer. La moneda presenta n = 2 formas de caer.

De acuerdo con la ley de la multiplicación la cardinalidad del espacio muestral

será:

# ῼ = m·n = (6) (2) = 12

Ejemplo 3.

En la tienda COPEL de Cd. Altamirano se ofertan camisas en 3 colores. Cada

color se presenta en 4 tallas diferentes y están marcadas como S, M, L, XL. Cada

talla tiene 2 tipos de estampados. ¿Cuántas camisas diferentes (cardinalidad del

espacio muestral) oferta la tienda la tienda COPEL?.

Solución.

Aplicando la ley de la multiplicación, la cardinalidad del espacio muestral será:

# ῼ = m·n·p = (3) (4) (2) = 24

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente:

1.- Un experimento consiste en lanzar 3 dados. calculen la cardinalidad del

espacio muestral y argumenten el resultado.

2.- Entre Cd. Altamirano y Arcelia se tiene la Ciudad de Tlapehuala. Supongamos

que entre Cd. Altamirano y Tlapehuala se tienen 4 caminos que comunican a esas

ciudades (Cd. Altamirano y Tlapehual) y entre Tlapehuala y Arcelia son 6 caminos

los que comunican a esas dos ciudades (Tlapehuala y Arcelia). Hagan un dibujo

que represente esta situación y calculen de cuantas formas es posible viajar de

Cd. Altamirano a Arcelia.

Page 87: Apuntes de estadistica con enfoque a la bioestadistica

82

3.-¿De cuantas formas diferentes se pueden seleccionar parejas de diferente sexo

de un grupo de 4 hombres y 6 mujeres?.

5.3.2.- Permutaciones.

Antes de explicar esta técnica de conteo, se requiere conocer el significado del

concepto “factorial de un número entero positivo”.

Factorial de un número “n” entero positivo.

Si se tiene un número “n” que sea entero y positivo (1,2,3,4,5,6…+∞), su factorial

escrito como “nỊ” y que se lee diciendo “ene factorial” o “factorial de ene”, es el

producto de todos los números enteros positivos que existan desde 1 hasta “n”.

Si “n” es cero, su factorial es 1 (por definición).

Si “n” ni es entero positivo y ni tampoco es cero, entonces no tiene sentido su

factorial.

Ejemplos de factorial de números “n” siendo todos enteros y positivos (se incluye

el factorial de 0):

0Ị = 1 (por definición)

1Ị = 1

2Ị = 1x2 = 2

3Ị = 1x2x3 = 6

4Ị = 1x2x3x4 = 24

5Ị = 1x2x3x4x5 = 120

6Ị = 1x2x3x4x5x6 = 720

7Ị = 1x2x3x4x5x6x7= 5040

0.5Ị = Sin sentido, ya que 0.5 no es entero positivo.

- 4Ị = Sin sentido, ya que – 4 no es entero positivo.

Page 88: Apuntes de estadistica con enfoque a la bioestadistica

83

La técnica Permutaciones.

Muchas veces es importante un espacio muestral que contenga como elementos

todos los posibles arreglos u ordenes de un grupo de objetos; en otras palabras,

cuando el orden en que se disponen los términos es importante, el número

total de resultados posibles recibe el nombre de permutación.

En forma por demás simple, podemos decir que una permutación es un arreglo

ordenado de objetos.

Para entender lo anterior, pongamos el siguiente ejemplo:

Ejemplo 1.

Problema:

Entre Cd. Altamirano y Tejupilco se encuentra la ciudad de Cutzamala. Pensemos

que entre Altamirano y Cutzamala se tienen 3 carreteras que unen a esas

poblaciones (Altamirano y Cutzamala) y entre Cutzamala y Tejupilco existen 2

carreteras que las unen (a Cutzamala con Tejupilco). Una persona estando en Cd.

Altamirano, desea viajar de este lugar (Altamirano) hasta Tejupilco. ¿De cuantas

formas puede hacerlo?.

Solución:

Hagamos un dibujo representativo:

Es lógico pensar que si la persona sale de Cd. Altamirano, al partir a Cutzamala,

únicamente puede tomar una sola carretera (de las 3 existentes) y cuando parte

de Cutzamala a Tejupilco, puede también tomar una sola (de las 2 existentes). Así

que, en su partida de Cd. Altamirano, ÚNICAMENTE TIENE 3 formas distintas

para emprender su viaje.

CD. ALTAMIRANO CUTZAMALA TEJUPILCO

r1

r2

r3

r4

r5

Page 89: Apuntes de estadistica con enfoque a la bioestadistica

84

Usando factoriales tendríamos:

3Ị = 1x2x3 = 6 que serían las distintas formas que puede elegir para hacer el

viaje.

El valor 6 representa la cardinalidad del espacio muestral de ese experimento (o

problema); es decir, son 6 los puntos muestrales del espacio muestral.

Ω = (r1 r4) (r1 r5) (r2 r4) (r2 r5) (r3 r4) (r3 r5)

Del análisis del problema anterior, se puede desprender el siguiente teorema:

Teorema:

El número de permutaciones de “n” objetos distintos es “nỊ”.

El número de permutaciones de “n” objetos distintos, tomando “r” a la vez es:

nPr =

Algunos autores usan otras escrituras para escribir nPr ; nosotros consideramos

que la mas sencilla es esta.

Por otra parte, obsérvese que cuando n = r, se llegaría al valor nỊ

Ejemplo 2.

En la clínica del ISSSTE de Cd. Altamirano, se tienen 5 consultorios que serán

ocupados por 5 médicos. ¿De cuántas maneras distintas pueden asignarse a los 5

médicos los 5 consultorios?.

Solución.

Para este problema, n = 5, r = 5. Aplicando la fórmula se tendrá:

nPr = = = = 120

nỊ

(n – r)Ị

nỊ

(n – r)Ị

5Ị

(5 – 5)Ị

1·2·3·4·5

0Ị

Page 90: Apuntes de estadistica con enfoque a la bioestadistica

85

Ejemplo 3.

En la clínica del IMSS de Cd. Altamirano, se tienen 6 enfermeras, de las cuales 4

se asignarán para ocupar 4 cubículos. Se pide calcular el número de

permutaciones posibles.

Solución.

Para este caso, se tienen 6 objetos (las enfermeras), de las cuales se toman 4 a la

vez. Así que n = 6 ; r = 4

nPr = 6P4 = = = = 360

Ejemplo 4.

Calcular el número de permutaciones de las letras a, b, c. tomadas de dos en dos.

Escribir el espacio muestral de estas permutaciones.

Solución.

nPr = 3P2 = = = = 6

El espacio muestral es: ab,ac,ba,ba,ca,cb. (Son 6 los números muestrales).

Ejemplo 5.

Una combi que sale de Cd. Altamirano a Arcelia, tiene un asiento para 4 personas.

En Tanganhuato suben 8 pasajeros. ¿De cuantas maneras pueden estar sentadas

en el asiento?.

Solución:

Para este problema se tiene que n = 8, r = 4; entonces tendremos:

nPr = 8P4 = = = = = 1680

nỊ

(n – r)Ị

6Ị

(6 – 4)Ị

1·2·3·4·5·6

2Ị

nỊ

(n – r)Ị

3Ị

(3 – 2)Ị

1·2·3

1Ị

nỊ

(n – r)Ị

8Ị

(8 – 4)Ị

40320

24

1·2·3·4·5·6·7·8

1·2·3·4

Page 91: Apuntes de estadistica con enfoque a la bioestadistica

86

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente.

1.- Calculen el valor de:

a) 6P2

b) 7P3

c) 10P5

2.- ¿Cuántas palabras de 4 letras pueden formarse con las letras A,B,C,D,E,F?.

Nota: No importa lo que digan las palabras.

3.- En un hospital hay 15 enfermos y únicamente se cuenta con 6 camas.

¿Cuántos arreglos se pueden hacer con los enfermos en las 6 camas existentes?.

5.3.3.- Combinaciones.

Una combinación es un arreglo de objetos sin importar su orden.

Si el número total de objetos es “n”, y de ellos se toman “r” a la vez, entonces el

número de combinaciones se escribe como “nCr “ y su valor es:

nCr =

Ejemplo 1.

Calcular el número de combinaciones de las letras a,b,c tomadas de dos en dos.

Solución.

En el ejemplo 4 de permutaciones se resolvió este problema. El número de

permutaciones fue 6. Aquí importa el orden de las parejas de letras encontradas.

El espacio muestral fue: ab, ac, ba, bc, ca, cb.

nỊ

rỊ(n – r)Ị

Page 92: Apuntes de estadistica con enfoque a la bioestadistica

87

Para el caso de Combinaciones (donde no importa el orden), el número de

combinaciones es:

nCr = 3C2 = = = = 3

El resultado indica que el número de combinaciones es 3. Estas combinaciones

son ab,ac y bc. Este sería el espacio muestral.

Para las combinaciones es lo mismo decir “ab que ba” o decir “bc que cb”.

Ejemplo 2.

En el puesto de comida china que se vende en la Preparatoria, se ofertan 5

platillos diferentes: Espagueti, Arroz blanco, Verduras, Pollo y Rollitos. Con sus

iniciales formamos el conjunto E, A, V, P, R. ¿Cuántos platillos se pueden

combinar tomando de 3 en 3?.

Solución.

nCr = 5C3 = = = = = 10

Ejemplo 3.

De un botiquín de la farmacia del ISSSTE se escogieron 5 medicamentos para

formar ternas (de 3) con ellos. ¿Cuántas combinaciones podemos hacer con las

ternas?.

nCr = 5C3 = = = 10

TAREA.

Hagan equipos de 5 estudiantes y resuelvan lo siguiente.

nỊ

rỊ(n – r)Ị 2Ị(3– 2)Ị

3Ị 1·2·3

1·2(1)

rỊ(n – r)Ị

nỊ 5Ị

3Ị(5 – 3)Ị

1·2·3·4·5

3Ị(2)Ị

120

12

5Ị

3Ị(5 – 3)Ị

120

12

Page 93: Apuntes de estadistica con enfoque a la bioestadistica

88

1.- El equipo de básquet bol de la Preparatoria 8 jugará en el torneo de Cd.

Altamirano. El equipo tiene 12 jugadores. Para iniciar el juego, se requieren 5

jugadores. Si no importa el lugar que ocupará cada jugador, ¿Cuántos equipos de

5 jugadores se pueden formar?.

2.- El grupo 401 T.M de la Preparatoria 8 tiene 30 alumnos. El maestro de

estadística formará equipos de 4 alumnos. Sin importar el orden de los alumnos.

¿Cuantos equipos podrá formar el profesor?

3.- Una enfermera tiene 6 fichas con las que tiene que formar grupos de 4 fichas

sin importar el orden que tome. ¿Cuántas combinaciones puede hacer con esos

grupos?.

Page 94: Apuntes de estadistica con enfoque a la bioestadistica

89

6.- DISTRIBUCIONES DE PROBABILIDAD

Antes de comentar la distribución de la probabilidad, necesitamos definir los

conceptos de variable discreta y variable continua.

Al iniciar estos apuntes dijimos que existen variables conocidas como continuas y

discontinuas. Las variables continuas admiten números enteros y fraccionarios.

Dijimos que ejemplos de estas variables serían la estatura de las personas: 1.67

m, 1.72 m, 1.81 m etc. Otro ejemplo sería el peso de las personas: 74.5 kg, 82.35

kg, 85.25 kg, etc. Si graficamos estos valores, se tendría una gráfica sin cortes, sin

saltos, sin interrupciones. A estas variables se les conoce –como ya se dijo- con el

nombre de continuas.

Por su parte, las variables discontinuas admiten únicamente números enteros

positivos. Estas variables también se les llama discretas. Ejemplos de variables

discontinuas o discretas son: El número de consultas que un Optometrista

realiza diariamente (tal vez 3, 5, 9 u otro número entero). Sería ilógico decir que el

Optometrista tuvo 3.25 consultas en un día. Otro ejemplo de variable discontinua

o discreta es el número de alumnos que tiene el grupo 405 de la Preparatoria 8;

el grupo tiene 45 alumnos. Sería incorrecto que el número de alumnos es 44.8

alumnos. Si graficamos los valores de las variables discontinuas o discretas,

tendremos una gráfica con cortes, con saltos, con interrupciones. Precisamente en

esos saltos, cortes o interrupciones, existe ausencia de valores que hacen perder

la continuidad y es por ello que son discontinuas o discretas.

Ahora si, estamos en condiciones de iniciar nuestros comentarios sobre la

distribución de probabilidades.

6.1.-Definición de distribución de probabilidad de variables discretas.

La distribución de probabilidad de una variable aleatoria discreta es una tabla, una

gráfica, una fórmula o cualquier otro medio que se utilice para especificar todos los

valores posibles de una variable aleatoria discreta junto con sus probabilidades

respectivas.

Para entender esta definición, pongamos el siguiente ejemplo:

Page 95: Apuntes de estadistica con enfoque a la bioestadistica

90

Ejemplo 1.

Una enfermera del hospital regional de Coyuca tiene a su cargo 50 familias.

Construir la distribución de probabilidad X, siendo que el número de niños por

familia para esa población es la indicada en la primera columna de la tabla

siguiente:

A) Como una tabla.

x

Frecuencia de ocurrencia de

“x”

Probabilidad X cuando esta X

toma un valor particular “x”.

P(X = x)

0 1

50

1

1 4

50

4

2 6

50

6

3 4

50

4

4 9

50

9

5 10

50

10

6 7

50

7

7 4

50

4

8 2

50

2

9 2

50

2

10 1

50

1

50

50

50

Debe observarse que la suma de las probabilidades parciales es 1 (uno).

Page 96: Apuntes de estadistica con enfoque a la bioestadistica

91

Ahora dibuje una gráfica de las probabilidades de la tabla anterior.

B) Como una gráfica.

Nota: La longitud vertical de cada barra, indica la probabilidad para cada valor de

“x”.

Contestemos preguntas como las siguientes:

1.- ¿Cuál es la probabilidad de que una familia tenga 3 hijos?

De acuerdo a la gráfica (o a la tabla), la probabilidad es (4/50) es decir 0.08 o sea

un 8%.

2.- ¿Cuál es la probabilidad de que una familia elegida al azar, tenga 3 o 4 niños?.

De acuerdo a la gráfica (o a la tabla), para 3 niños es (4/50) y para 4 es (9/50).

Sumando estos valores, se tiene:

1/50

2/50

3/50

4/50

5/50

6/50

8/50

7/50

9/50

10/50

Probabilidad

1 2 3 4 6 5 7 8 9 10 0 x = Niños

Page 97: Apuntes de estadistica con enfoque a la bioestadistica

92

26.050

13

50

9

50

4

La probabilidad es 0.26 o sea un 26%.

6.2.- Distribuciones acumuladas.

Muchas veces resulta mas cómodo trabajar con la distribución de probabilidad

acumulada de una variable aleatoria.

Tomando el ejemplo 1, la distribución de probabilidad acumulada se indica en la

tabla siguiente:

x Frecuencia de ocurrencia de “x”

Probabilidad de “x” Probabilidad acumulada de “x”

0 1 1/50 1/50

1 4 4/50 5/50

2 6 6/50 11/50

3 4 4/50 15/50

4 9 9/50 24/50

5 10 10/50 34/50

6 7 7/50 41/50

7 4 4/50 45/50

8 2 2/50 47/50

9 2 2/50 49/50

10 1 1/50 50/50

50 50/50

Con esta tabla, se pueden contestar preguntas como las siguientes:

Page 98: Apuntes de estadistica con enfoque a la bioestadistica

93

1.- Cual es la probabilidad de que una familia elegida al azar, tenga menos de 5

niños?.

La respuesta la podemos ver en la tabla en los valores comprendidos entre 0 y 4.

El valor se tiene donde la distribución de probabilidades acumulada es (24/50) que

corresponde a x = 4. La probabilidad es entonces 0.48; es decir, el 48%.

2.- Cual es la probabilidad que una familia elegida al azar tenga 5 o mas niños?.

La respuesta es el complemento del conjunto donde x = 4 (pregunta anterior). Si

en ese conjunto la probabilidad era 0.48, entonces su complemento es 0.52

(recordemos que el valor máximo de probabilidad es 1). La probabilidad es 52%

También la podemos calcular haciendo la siguiente resta:

52.050

26

50

24

50

50

3.- Cual es la probabilidad que una familia elegida al azar tenga entre 3 (inclusive)

y 6 (inclusive) niños?.

En la tabla vemos que para 3 niños inclusive la probabilidad acumulada es (15/50)

y para 6 niños inclusive la probabilidad es (41/50).

Restando ambos valores se tiene:

52.050

26

50

15

50

41

La probabilidad es el 52%.

6.3.- Probabilidades como consideraciones teóricas.

También la distribución de probabilidades se pueden conocer a través de teorías

matemáticas y para ello se usan fórmulas. Dentro de estas teorías estudiaremos

en forma somera a tres de ellas:

1. La distribución binomial

2. La distribución de Poisson

Page 99: Apuntes de estadistica con enfoque a la bioestadistica

94

3. La distribución normal.

6.3.1.-Distribución Binomial o de Bernoulli.

La palabra binomial significa que los resultados de una variable aleatoria (para

este caso discreta), se pueden agrupar en dos clases o categorías las cuales

deben ser mutuamente excluyentes.

Recordemos que las variables discretas son discontinuas. Estas variables tienen

valores aislados (por eso son discretas). Estos valores casi siempre son números

enteros positivos (1,2,3,4,5 etc.) y se tienen en aquellos experimentos donde

contamos. Nunca contamos diciendo 1.4, 2.7, 3.56 etc. Por eso decimos que las

variables discretas son enteros positivos o sea los que usamos para contar.

Ejemplos de variables discretas serian los siguientes:

1. El número de varones del grupo 401 (tal vez 45; pero no 45.8)

2. El número de profesores que imparten estadística (tal vez 5; pero no 5.79)

3. El número de cachorritos que parió la perra (tal vez 5; pero no 6.34)

4. El número de computadoras que tiene la sala de cómputo (tal vez 35; pero

no 37.88)

Estas variables (las discretas o discontinuas) son la que intervienen en la

distribución binomial.

Un ejemplo del tipo binomial, es por ejemplo las respuestas de un examen del tipo

falso o verdadero. Esto significa que existen dos clases; uno llamado falso y otro

llamado verdadero. No hay otro resultado posible. Además, el falso excluye al

verdadero o viceversa.

Otro ejemplo es la clase o categoría que resulte al clasificar aparatos electrónicos

de una fábrica como defectuosos o no defectuosos. Uno excluye al otro y no

puede haber otro resultado.

Un ejemplo mas, sería el control de nacimientos de bebes en el hospital regional

de Coyuca. El ser que nace o es niño o es niña. No hay otro resultado posible.

Además el hecho que sea niño excluye al ser niña o viceversa.

Page 100: Apuntes de estadistica con enfoque a la bioestadistica

95

A la distribución binomial también se le conoce como la distribución de

Bernoulli, en honor al ilustre físico-matemático suizo James Bernoulli (1654-

1705), que la propuso en el siglo XVII.

Para emplear la distribución binomial se debe cumplir que en cada experimento:

1. Existen “n” observaciones similares.

2. Cada observación tiene dos posibles resultados (nada mas), uno de ellos

se le llama éxito (lo llamaremos “p”) y el otro se le llama fracaso (lo

llamaremos “q”)

3. Las probabilidades de éxito o de fracaso se mantienen constantes para

todas las observaciones.

4. Los resultados de las observaciones (éxito o fracaso) son independientes

entre sí.

La fórmula binomial.

Dijimos que en cada observación se tienen dos resultados mutuamente

excluyentes. Uno de ellos se llama éxito y se representa con la letra “p” el otro se

le llama fracaso y se representa con la letra “q”.

La suma “p + q” debe ser uno. Esto significa que si el éxito es “p”, entonces el

fracaso es “q = 1 – p”.

Si llamamos P(X) a la probabilidad de que se presente el éxito, “n” el número de

ensayos y “x” el número de veces que se presente el éxito, la probabilidad P(X) se

calcula como:

P(X) = nCx·px·qn-x

Pero recordemos que nCx es el valor del número de combinaciones. Si sustituimos

ese valor, tendremos que la probabilidad P(X) será:

Page 101: Apuntes de estadistica con enfoque a la bioestadistica

96

P(X) = px qn-x Fórmula de la distribución binomial.

Ejemplo 1.

Un alumno del grupo de enfermería de Coyuca de Catalán contestó un examen

sobre Bioestadística que consistió en 10 preguntas con respuestas SI o NO.

Suponiendo que el alumno no sabe nada sobre Bioestadística y utilizó el método

del “tín marín” para contestarlo.

a) Calcular la probabilidad de que haga 5 aciertos.

b) Calcular la probabilidad de obtener algún acierto.

c) Calcular la probabilidad de que obtenga al menos 5 aciertos.

Solución.

a) La probabilidad que haga 5 aciertos es:

El problema es del tipo binomial ya que existen dos categorías excluyentes; o es

SI o es NO.

El éxito “p” es (1/2), ya que el espacio muestral es SI y NO.

El fracaso “q” es también (1/2). Efectivamente: p = 1 – p = 1 - (1/2) = 1/2

El número de ensayos es n = 10

El número de éxitos que se busca es x = 5.

Aplicando la fórmula:

P(A) = px qn-x = (0.5)5 (0.5)10-5

P(A) = (0.0312) (0.0312) = 252 (0.0009734) = 0.2452

La probabilidad es del 24.52%.

nỊ

xỊ (n – x)Ị

nỊ

xỊ (n – x)Ị

10Ị

5Ị (10 – 5)Ị

3628800

(120) (120)

Page 102: Apuntes de estadistica con enfoque a la bioestadistica

97

b) La probabilidad de obtener algún acierto.

Si se trata de calcular la probabilidad de obtener algún acierto, significa que no se

obtiene ninguno. En este caso, el número de éxitos es cero (x = 0) y los datos son

entonces:

x = 0

n = 10

p = (1/2)

q = (1/2)

La probabilidad pedida es:

P(A) = px qn-x = (0.5)0 (0.5)10-0 = (1)(0.0009)

P(A) = 0.0009 = 0.09 %

Ejemplo 2.

Una familia tiene 4 hijos. Calcula la probabilidad que 3 de ellos sean hombres.

Solución.

El problema es del tipo binomial, ya que, o se es hombre o se es mujer.

La probabilidad del éxito es (1/2); entonces, p = (1/2).

El complemento de “p” o sea el fracaso es q = (1/2); ya que, q = 1 – p

El número de éxitos pedido es x = 3.

El número de ensayos es n = 4

Aplicando la fórmula se tiene:

P(A) = px qn-x = (0.5)3 (0.5)1 = (0.125)(0.5)

P(A) = 0.25 La probabilidad es el 25%

xỊ (n – x)Ị

nỊ 10Ị

3Ị (4– 3)Ị

3628800

1 (3628800)

nỊ

xỊ (n – x)Ị

xỊ (n – x)Ị

4Ị

0Ị (10 –0)Ị

24

6 ( 1 )

Page 103: Apuntes de estadistica con enfoque a la bioestadistica

98

Ejemplo 3.

Estudios realizados por el sector salud del Estado de Guerrero, indican que en Cd.

Altamirano el 30% de los ciudadanos son inmunes a la diabetes. Se tomó una

muestra aleatoria de 10 personas. ¿Cuál es la probabilidad que 4 personas de la

muestra sean inmunes a esa enfermedad?.

Solución.

E problema es del tipo binomial puesto que, o se es inmune, o no se es.

El éxito “p” es el 30% de la población; es decir, p = 0.30

El fracaso “q” son los enfermos que representan el 70%; es decir, q = 0.70

Nota: recordemos que la probabilidad tiene como valor máximo el UNO. De

acuerdo a esto, p + q = 0.30 + 0.70 = 1

El número de éxitos pedido es 4; es decir x = 4.

El número de ensayos es n = 10.

Con estos datos aplicamos la fórmula:

P(A) = px qn-x = (0.30)4 (0.70)10-4

P(A) = ( 0.0081) ( 0.1176) = 0.200

La probabilidad es el 20%.

TAREA.

Hagan equipos de 5 alumnos y resuelvan lo siguiente:

1.- Un profesor de Bioestadística aplicó un examen a 50 alumnos. La escala de

calificaciones fue de 0 a 10.

nỊ

xỊ (n – x)Ị

10 Ị

4 Ị (10 – 4) Ị

3628800

24 (720)

Page 104: Apuntes de estadistica con enfoque a la bioestadistica

99

En la tabla siguiente, aparece en la segunda columna la frecuencia de ocurrencia

de las calificaciones obtenidas en el examen. Escribe en la tercera columna, la

probabilidad de cada frecuencia de ocurrencia.

Escala de calificaciones Frecuencia de ocurrencia Probabilidad. P(X) = x

0 2

1 3

2 5

3 4

4 4

5 6

6 8

7 8

8 5

9 3

10 2

SUMA 50

Construye una tabla de probabilidad acumulada.

2.- Calcula la probabilidad de obtener exactamente 2 soles en 8 “volados” de una

moneda.

Respuesta: 10.93%

3.- Calcula la probabilidad de obtener exactamente 3 “águilas” en 5 lanzamientos

de una moneda.

Respuesta: 31.25%

4.- El 24% de personas de una población se les detectó sangre del tipo “A”. Para

una muestra de tamaño 20 extraída de esa población, calcule la probabilidad de

que 3 personas pertenezcan al grupo sanguíneo “A”.

Page 105: Apuntes de estadistica con enfoque a la bioestadistica

100

6.3.2.- Distribución de Poisson

Esta distribución también es de variable discreta o discontinua y se le atribuye al

ilustre matemático francés Simeón Denis Poisson (1781-1840) quien la publicó en

1837.

De hecho, Poisson parte de la distribución binomial para hacer su propuesta.

Poisson considera que si el experimento consiste en un elevado número de

ensayos ( o sea “n” es muy grande), entonces para evitar operaciones

matemáticas muy engorrosas, se debe aplicar la fórmula siguiente conocida como

el modelo de Poisson.

x

exP

x)(

Donde:

P(x) es la probabilidad de “x” ocurrencias, dado λ, y x = 0,1,2,3,4 …

λ es la letra griega llamada “lamda” y que para este modelo de Poisson se le

conoce como parámetro de Poisson. Su valor es λ = (n) (p); es decir, se obtiene

multiplicando el número de ensayos (n) por la probabilidad de éxito (p) de cada

ensayo. También λ se considera como el promedio o media de un número de

eventos sucedidos en un experimento determinado.

“e” es la base de los logaritmos naturales cuyo valor aproximado es: e = 2.71828.

“x” es el número de éxitos cuya probabilidad se está calculando.

El modelo de Poisson conviene aplicarlo cuando se cumpla lo siguiente:

La probabilidad de éxito “p” debe ser menor a 0.1. Esto es p < 0.1

El producto (p) (n) debe ser menor que 10. Esto es (p) (n) < 10.

Ejemplo 1.

Estudios realizados por la Dirección de tránsito de Cd. Altamirano, indican que la

probabilidad de tener un accidente en un viaje a Toluca es 0.02. Si se hacen 300

viajes a Toluca, ¿Cuál es la probabilidad de tener 3 accidentes?

Solución.

Page 106: Apuntes de estadistica con enfoque a la bioestadistica

101

La probabilidad de éxito “p” es 0.02 lo cual es menor a 0.1

El producto (p) (n) es (0.02) (300) = 6 que es menor a 10.

El valor de λ es entonces λ = 6

Aplicando la fórmula de Poisson:

x

exP

x)(

P(x) = = = 0.0892

La probabilidad es entonces de 8.92%.

Ejemplo 2.

En la empacadora de mangos de Riva Palacio Mich. se detectó que el 10% de las

cajas de mango resultaron defectuosas. Calcular la probabilidad de que de una

muestra de 10 cajas seleccionadas al azar, 2 resulten defectuosas.

Solución.

La probabilidad del éxito “p” es el 10%; entonces p = 0.1

El producto (p) (n) es (0.1) (10) = 1

Así que el valor del parámetro λ es 1. Esto es λ = 1

El valor “x” es 2

Aplicando la fórmula de Poisson:

x

exP

x)(

(2.71828-6) (63)

3Ị

(0.002478) (216)

6

Page 107: Apuntes de estadistica con enfoque a la bioestadistica

102

P(x) = = = 0.1839

Es decir, la probabilidad es 18.39%

Ejemplo 3.

En la clínica del ISSSTE de Cd. Altamirano, se le aplicó una inyección a un

maestro de la Preparatoria 8 y según el médico, la probabilidad de que tenga

alguna reacción es del 0.1%. Calcule la probabilidad de que de los 2000 maestros

de la tierra caliente, 3 de ellos tengan alguna reacción.

Solución.

La probabilidad del éxito “p” es 0.1%; es decir 0.001 que es menor que 0.1.

El producto (p) (n) es (0.001) (2000) = 2

Así que el parámetro λ es 2; esto es λ = 2.

El valor de “x” es 3. Esto es x = 3.

Aplicando la fórmula de Poisson:

P(x) = = = 0.1804

Así que la probabilidad es del 18.04%

TAREA.

Hagan equipos de 5 alumnos y resuelvan lo siguiente:

1.- En la Dirección de la Preparatoria 8, se reciben en promedio 5 llamadas

telefónicas por hora. Cuál es la probabilidad de que en una hora seleccionada al

azar, se reciban 3 llamadas telefónicas.

Nota: Considerar que λ vale 5. Esto es λ = 5.

(2.71828-1) (12)

2Ị

(0.3678) ( 1 )

2

(2.71828-2) (23) (0.1353) (8)

3Ị 6

Page 108: Apuntes de estadistica con enfoque a la bioestadistica

103

2.- En el hospital regional de Coyuca, se tiene por estudios, que la probabilidad de

que un niño nazca con problemas de salud es del 1.2%. ¿Cuál será la probabilidad

de que entre 800 niños recién nacidos, 5 tengan problemas de salud?.

3.- En el torneo de fut bol clausura 2013, las Águilas del América anotaron en

promedio, 1.69 goles por cada 90 minutos de juego. Calcular la probabilidad de

que el América anote 2 goles en los próximos 90 minutos de juego?.

Nota: El valor de λ se considera en muchas veces como el valor promedio (o

media). Así que en este problema λ vale 1.69. Es decir, λ = 1.69

6.3.3.-Distribución Normal.

La distribución Normal es la más importante de todas las distribuciones. Su

aportación se le debe al ilustre matemático francés Abraham De Moivre (1667-

1754) quien la publicó en 1733. Otros matemáticos figuran también en la historia

de la distribución normal, donde se incluye al “príncipe de los matemáticos”, el

Alemán Carl Friedrich Gauss (1777-1855) quien hizo aportaciones importantes.

Las variables de la distribución normal son continuas (no son discretas) y se tienen

en aquellos experimentos donde se mide algo (no se cuenta). En este sentido, las

variables continuas pueden tener cualquier valor. Ejemplos de variables continuas

son los siguientes:

1. El peso de las personas. Podemos decir 56.5 kg, 78.85 kg, 80.53 kg etc.

2. La estatura de las personas. Podemos decir 1.72m, 1.79m, 1.85 m etc.,

3. Distancia que un carro recorre con 1 litro de gasolina: 5.5km, 7.2 km etc.

4. El volumen de las pipas de una central. Podemos decir 2500.45 litros,

3500.45 litros, 3455.98 litros etc.

Para entender esta distribución, vamos a recordar el problema de los tumores

malignos que tratamos en estos apuntes y que aparece en la página 4. Ahí

Page 109: Apuntes de estadistica con enfoque a la bioestadistica

104

resolvimos el problema dibujando un histograma en la página 9. Dicho histograma

consistió en 7 intervalos de clase. Con este histograma dibujamos un polígono de

frecuencias, uniendo los puntos medios de dichos intervalos (página 11).

De acuerdo a lo anterior, podemos pensar que si tuviéramos “muchísimos”

intervalos de clase (cuyo número tendiera al infinito), sería tanto como pensar que

los anchos de esos intervalos tienden a un valor cero y el polígono de frecuencias

se parecería a una curva como la siguiente:

Esta curva se le conoce como la curva de distribución normal y resulta en muchos

experimentos que se hacen en diferentes campos de la ciencia.

Puede observarse que la curva tiene forma “acampanada” y de ahí que muchos le

dicen la campana de Gauss.

6.3.3.1.- Ecuación matemática de la curva de distribución normal.

La curva de distribución normal contiene en su eje vertical a las frecuencias de

variación y en el eje horizontal a los anchos de intervalos de clase. Así que las

frecuencias son función de los intervalos de clase. Matemáticamente la función

está dada por la siguiente expresión:

Page 110: Apuntes de estadistica con enfoque a la bioestadistica

105

2

2

2

)(

2

1)(

S

x

eS

xf

Donde:

x = Variable aleatoria

μ = Media de la población

S = Desviación estándar de la población

S2 = La varianza

π = 3.1416 (es una constante)

e = 2.71828 (es una constante y es la base de los logaritmos naturales).

Algunos matemáticos llaman a la función f(x), como la función de densidad

probabilística. Puesto que el valor máximo de la probabilidad es 1 (uno),

entonces el área por debajo de la curva acampanada es UNO.

Para hacer mas simple la función mencionada, podemos valernos de una

expresión que llamaremos “Z”:

S

xZ

por lo que:

2

22 )(

S

xZ

Sustituyendo este valor en la función de densidad tendremos:

Page 111: Apuntes de estadistica con enfoque a la bioestadistica

106

2

2

1

2

1)(

Z

eS

xf

Aun más simple:

2

2

2

1)(

z

eS

xf

Ejemplo 1.

Calcular la altura de la curva acampanada o valor de f(x) si se tienen los valores

siguientes: x = 2, μ = 3 y S = 1.6

Solución:

Apliquemos la expresión 2

2

2

1)(

z

eS

xf

donde al sustituir valores tenemos:

625.06.1

32

Z y por lo tanto 39.02 Z . Con este valor, sustituimos en f(x)

205.0)822.0)(249.0()71828.2(01.4

1)71828.2(

1416.3)(2(6.1

1)2( 195.02

39.0

f

La altura de la curva donde x = 2 es 0.205

Ejemplo 2.

Calcular la altura de la curva acampanada o valor de f(x), si se tienen los valores

siguientes: x = 0, μ = 0 y S = 1.

Nota: Donde x = 0 y μ = 0 se tiene la altura máxima de la curva.

Page 112: Apuntes de estadistica con enfoque a la bioestadistica

107

Solución:

Apliquemos la expresión: 2

2

2

1)(

z

eS

xf

Calculemos el valor de Z2:

01

00

Z Por lo que Z2 = 0

Sustituyendo valores:

399.0)1)(399.0()71828.2(506.2

1)71828.2(

)1416.3)(2(1

1)0( 02

0

f

La altura de la curva donde x = 0 es 0.399

Ejemplo 3.

Represente en un dibujo geométrico la solución de los dos ejemplos anteriores.

Solución:

a) Para el primer problema tenemos:

0.205

μ = 3

S = 1.6 S = - 1.6

Page 113: Apuntes de estadistica con enfoque a la bioestadistica

108

b) Para el segundo problema tenemos.

6.3.3.2.-Algunas propiedades de la curva de distribución normal.

1. Es simétrica con respecto a su media “μ”. Esto significa que lo existente a la

derecha de la vertical levantada desde “μ”, es exactamente lo mismo que lo

existente al lado izquierdo.

2. La media, la mediana y la moda son iguales. El valor de la media es cero,

μ =0

3. El área por debajo de la curva y por encima del eje “x” es igual a UNO. Esto

se debe a que la probabilidad máxima es 100% (uno). En estas

condiciones, el área a la izquierda del eje simétrico es 0.5 y la del lado

derecho también es 0.5

μ = 0

0.399

μ

Lado izquierdo Lado derecho

Page 114: Apuntes de estadistica con enfoque a la bioestadistica

109

4. Si se trazan perpendiculares a una distancia igual al valor que tenga una

desviación estándar (1S) y medidas a ambos lados del eje simétrico que

se levanta desde μ, el área encerrada por estas perpendiculares, el eje de

las “x” y la curva, será aproximadamente el 68% del área total; es decir,

esta área es 0.68

5. Si se levantan perpendiculares a una distancia igual al valor de dos

desviaciones estándar (2S) y medidas a ambos lados del eje simétrico

que se levanta desde μ, el área encerrada por dichas perpendiculares, el

eje “x” y la curva, es aproximadamente igual al 95% del área total, es decir,

0.95

A = 0.5 A = 0.5

μ = 0

A = 0.68

1S 1S

μ = 0

A = 0.95

2S 2S

μ = 0

A1 = 0.475

A2 = 0.475

A2 = 0.34

A1 = 0.34

Page 115: Apuntes de estadistica con enfoque a la bioestadistica

110

6. Si se levantan perpendiculares a una distancia igual al valor de tres

desviaciones estándar (3S) y medidas a ambos lados del eje simétrico

que se levanta desde μ, el área encerrada por dichas perpendiculares, el

eje “x” y la curva, es aproximadamente igual al 99.7% del área total, es

decir el 0.997

La división de la curva de los tres puntos anteriores se ilustra en la siguiente

figura:

Se debe observar que a la media μ se le asignó el valor cero y está en el eje “x”

donde se levanta el eje simétrico. A la derecha de μ se tienen las distancias de las

desviaciones estándar con signo positivo, mientras que a la izquierda de μ son las

mismas distancias pero con valores negativos.

6.3.3.3.-Estandarización de datos.

Al resolver problemas de distribución normal, se presenta el caso que un dato

nominal se debe transformar a otro que sea su equivalente en la escala

3S 3S

A = 0.997

μ = 0

μ = 0 +1 +2 +3 -1 -2 -3

A1 = 0.498 A2 = 0.498

Page 116: Apuntes de estadistica con enfoque a la bioestadistica

111

comprendida desde -3 a +3. Esta transformación se le llama estandarización de

datos.

La estandarización de un dato nominal “x” tomado de alguna colección de datos,

se le llama “z” (visto en la fórmula de la densidad probabilística). Como ya se dijo,

este valor “z” se calcula por la fórmula:

z = S

x

Donde:

z = dato estandarizado

x = dato nominal tomado de alguna lista de datos

S = desviación estándar

μ = media de la población. Algunas veces en lugar de μ, se usa la media de la

muestra (no de la población) y se le llama x (equis testada).

Ejemplo 1.

La tabla siguiente indica las edades de niños y jóvenes que durante el año de

2013 presentaron síntomas de Dengue en el Estado de Guerrero:

Edad (x) 6 7 8 9 10 11 12 13 14 15 16 17 18

Frecuencia (f)

1 2 3 5 9 15 18 15 9 5 3 2 1

Total (x) (f) 6 14 24 45 90 165 216 195 126 75 48 34 18

Calcular:

a) La media μ (también puede llamarse x )

b) La varianza S2

c) La desviación estándar “S”

d) Con los datos de “μ” y “S” estandarizar cada valor de “x” o sea cada edad

de la tabla.

Solución:

Page 117: Apuntes de estadistica con enfoque a la bioestadistica

112

a) La media μ:

)(

))((

f

fx =

1235915181595321

18344875126195216165904524146

μ = = 12 μ = 12

b) La varianza S2:

N

xfS

2

2))((

Construyamos una tabla:

Edad = x Frecuencia (f)

Producto (x) (f)

(x – μ) (x – μ)2 (f) (x – μ)2

6 1 6 -6 36 36

7 2 14 -5 25 50

8 3 24 -4 16 48

9 5 45 -3 9 45

10 9 90 -2 4 36

11 15 165 -1 1 15

12 18 216 0 0 0

13 15 195 1 1 15

14 9 126 2 4 36

15 5 75 3 9 45

16 3 48 4 16 48

17 2 34 5 25 50

18 1 18 6 36 36

N = 88 1056 460

Varianza = 2272.588

4602 S S2 = 5.2272

c) La desviación estándar “S”: 29.22272.5 S S = 2.29

1056

88

Page 118: Apuntes de estadistica con enfoque a la bioestadistica

113

S = 2.29

d) Estandarización de cada valor de “x” o sea cada edad. Este valor es “z”.

S

xz

Construyamos una tabla:

Edad o sea el valor “x” Sustituyendo Dato estandarizado “z”

6

29.2

126 z

Z = -2.62

7

29.2

127 z

Z =-2.18

8

29.2

128 z

Z =-1.75

9

29.2

129 z

Z = -1.31

10

29.2

1210 z

Z = -0.87

11

29.2

1211z

Z = -0.43

12

29.2

1212 z

Z = 0

13

29.2

1213z

Z = 0.43

14

29.2

1214 z

Z = 0.87

15

29.2

1215z

Z = 1.31

16

29.2

1216 z

Z = 1.75

17

29.2

1217 z

Z = 2.18

18

29.2

1218z

Z = 2.62

Page 119: Apuntes de estadistica con enfoque a la bioestadistica

114

6.3.3.4.-Significado geométrico del dato “z”.

Hemos dicho que conocido un dato “x” que proviene de una lista o colección de

datos de un problema determinado, podemos transformar esa “x” a un dato

estandarizado que hemos llamado “z”. Pero ¿qué interpretación geométrica le

damos a esa “z”?.

El dato “z” es la distancia que separa al dato “x” de la media μ. Esta distancia

se mide en desviaciones estándar y pude ser positiva (cuando “x” está por

arriba de la media) o negativa (si está por debajo de la media).

En el ejemplo 1 resuelto anteriormente, tendríamos:

TAREA.

Hagan equipos de 5 estudiantes y resuelvan el siguiente problema:

La tabla siguiente representa la frecuencia (f) de médicos que durante los últimos

20 años estudiaron 7 especialidades en el IMSS de Cd. Altamirano Gro.

v a l o r e s d e “x” ( l a s e d a d e s )

6 7 8 9 10 11 12 13 14 15 16 18 17

2 1 0 1 2 3

V A L O R E S D E Z

1 desviación estándar

2.29

14.29 16.58 18.87 12 9.71 7.42

Page 120: Apuntes de estadistica con enfoque a la bioestadistica

115

x = Número de médicos por especialidad Frecuencia (f) de médicos en los 20 años

Especialidad 1: x = 4 20

Especialidad 2: x = 5 21

Especialidad 3: x = 6 27

Especialidad 4: x = 7 35

Especialidad 5: x = 8 27

Especialidad 6: x = 9 21

Especialidad 7: x = 10 20

Calcular:

a) La media μ

b) La varianza S2

c) La desviación estándar “S”.

d) Con los datos μ y S, estandarizar cada valor de “x”

e) Dibujen la geometría de los resultados encontrados.

6.3.3.5.-Áreas bajo la curva de distribución normal.

Porcentaje de área desde la media μ hasta un valor “z”.

Anteriormente se dijo que la curva de desviación estándar es simétrica respecto a

una vertical que se levanta desde μ y que pasa por el punto más alto de la curva.

Por lo tanto, el área que existe por cada lado de la vertical (derecho e izquierdo)

vale 0.5 (recordemos que el área total bajo la curva vale UNO).

También se dijo que si a partir de μ se mide una distancia (llamada “z”)

equivalente a una desviación estándar (1S), entonces el porcentaje del área total

encerrada es el 34%. Si la distancia equivale a dos desviaciones estándar (2S), el

porcentaje del área encerrada es el 47.5% y si la distancia equivale a tres

unidades estándar (3S), el porcentaje de área es 49.8%.

a) Para z = 1S

Z = 1S

A = 0.34

Page 121: Apuntes de estadistica con enfoque a la bioestadistica

116

b) Para z = 2S

c) Para z = 3S

De acuerdo a lo anterior, se concluye que para un determinado valor de “z”,

existirá un porcentaje de área. Además, la gráfica de la curva viene de una

colección de datos y por lo tanto, cada área calculada, representará un porcentaje

determinado de datos.

No olvidemos además que los valores de “z” los estamos midiendo a partir de la

vertical donde está μ, es decir, a partir del eje simétrico de la curva.

Para facilitar el cálculo de los porcentajes de área, se dispone de una tabla donde

la “z” varía desde z = 0 hasta z = 3.99. El uso de esta tabla resuelve muchos

problemas. Se maneja usando simultáneamente la primer columna y la primer fila.

El valor que exista en la intersección de ambos, es el porcentaje de área buscado.

La tabla se ilustra en la página siguiente.

A = 0.475

Z = 2S

A = 0.498

Z = 3S

Page 122: Apuntes de estadistica con enfoque a la bioestadistica

117

Ejemplo 1.

Cuánto vale el porcentaje de área si en un problema dado z = 0.4

Solución:

Usando la tabla, se tiene en que en la columna vertical está 0.4 que al

encabezarla con la horizontal donde está “0”, el valor es 15.54% = 0.1554

Ejemplo 2.

Cuánto vale el porcentaje de área si en un problema dado z = 0.96.

Solución.

Usando la tabla se tiene que en la columna vertical está 0.9 que al encabezarla

con la horizontal donde está 6, se tiene el valor 33.15% = 0.3315

Ejemplo 3

Cuánto vale el porcentaje de área si en un problema dado z = 1.32

Usando la tabla se tiene que en la columna vertical está el valor 1.3 que al

encabezarla con la horizontal donde está 2, se tiene el valor 40.66% = 0.4066

NOTA IMPORTANTE: No debe olvidarse que los porcentajes de la tabla, se refiere

a la medida desde la media μ hasta el valor estandarizado “z”.

Ejemplo 4.

Un químico que trabaja en el laboratorio de la Preparatoria 8, recolectó 250 datos

de muestras de sangre practicado al mismo número de estudiantes. Al calcular la

media obtuvo el valor μ = 7.65 y desviación estándar S = 2.24

Calcular el número de datos aproximados que hay desde la media μ hasta el dato

con valor 8.

Solución.

Puesto que ya se conocen “μ” y “S”, procedamos a calcular el valor “z”.

Page 123: Apuntes de estadistica con enfoque a la bioestadistica

118

PORCENTAJES DE ÁREAS BAJO LA CURVA NORMAL DESDE Z = 0 A Z = 3.99

Z 0 1 2 3 4 5 6 7 8 9

0.0 0 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59

0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.54

0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41

0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17

0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79

0.5 19.15 19.50 19.85 20.19 20.54 20.88 21.23 21.57 21.90 22.24

0.6 22.58 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.18 25.49

0.7 25.80 26.12 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52

0.8 28.81 29.10 29.39 29.67 29.96 30.23 30.51 30.78 31.06 31.33

0.9 31.59 31.86 32.12 32.38 32.64 32.89 33.15 33.40 33.65 33.89

1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21

1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30

1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15

1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.77

1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19

1.5 43.32 43.45 43.57 43.70 43.82 43.94 44.06 44.18 44.29 44.41

1.6 44.52 44.63 44.74 44.84 44.95 45.05 45.15 45.25 54.35 45.45

1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33

1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06

1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67

2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17

2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57

2.2 48.61 48.64 48.68 48.71 48.75 48.78 48.81 48.84 48.87 48.90

2.3 48.93 48.96 48.98 49.01 49.04 49.06 49.09 49.11 49.13 49.16

2.4 49.18 49.20 49.22 49.25 49.27 49.29 49.31 49.32 49.34 49.36

2.5 49.38 49.40 49.41 49.43 49.45 49.46 49.48 49.49 49.51 49.52

2.6 49.53 49.55 49.56 49.57 49.59 49.60 49.61 49.62 49.63 49.64

2.7 49.65 49.66 49.67 49.68 49.69 49.70 49.71 49.72 49.73 49.74

2.8 49.74 49.75 49.76 49.77 49.77 49.78 49.79 49.79 49.89 49.81

2.9 49.81 49.82 49.82 49.83 49.84 49.84 49.85 49.85 49.86 49.86

3.0 49.87 49.87 49.87 49.88 49.88 49.89 49.89 49.89 49.90 49.90

3.1 49.90 49.91 49.91 49.91 49.92 49.92 49.92 49.92 49.93 49.93

3.2 49.93 49.93 49.94 49.94 49.94 49.94 49.94 49.95 49.95 49.95

3.3 49.95 49.95 49.95 49.96 49.96 49.96 49.96 49.96 49.96 49.97

3.4 49.97 49.97 49.97 49.97 49.97 49.97 49.97 49.97 49.97 49.98

3.5 49.98 49.98 49.98 49.98 49.98 49.98 49.98 49.98 49.98 49.98

3.6 49.98 49.98 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99

3.7 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99

3.8 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99 49.99

3.9 50.00 50.00 50.00 50.00 50.00 50.00 50.00 50.00 50.00 50.00

Page 124: Apuntes de estadistica con enfoque a la bioestadistica

119

156.024.2

65.78

S

xz

Buscamos en la tabla el valor z = 0.156. En la primer columna ubicamos el 0.1 y

lo encabezamos con 6 (es el aproximado) de la primer fila. Así encontramos que el

porcentaje del área total es 6.36%. Este valor es el porcentaje de área bajo la

curva comprendida desde la media μ = 7.65 hasta el valor estandarizado z = 0.156

Este porcentaje de 6.36% hace equivalencia con el porcentaje de datos

recolectados desde la media μ hasta el dato “z”. Mediante una regla de tres,

podemos calcular el número de esos datos.

36.6%100

250 nd 90.15

100

36.6)(250(nd nd = número de datos = 16

Ejemplo 5.

En cierto estudio realizado por el IFE, se recolectaron 850 datos con distribución

normal. Los estudios contienen una media μ = 27 y una desviación estándar con

valor S = 5.34. Se pide calcular el número de datos aproximados que hay desde

la media μ hasta el dato nominal 20.

Solución:

Estandarizamos el dato 20; es decir, calculamos “z”.

31.134.5

7

34.5

2720

S

xz

El signo negativo indica simplemente que el dato x = 20 se encuentra a la

izquierda de la media μ, o sea está por debajo de la media. En la tabla se busca

simplemente como 1.31. Al usar la tabla se encuentra el valor 40.49%.

Aplicando una regla de tres tendremos el número de datos comprendidos a la

izquierda de μ; es decir datos por debajo de la media:

49.40%100

850 nd 16.344

100

)49.40)(850(nd

Aplicando el criterio del redondeo, existirán 344 datos.

Número de datos son 344 y están por debajo de la media μ = 27

Page 125: Apuntes de estadistica con enfoque a la bioestadistica

120

Porcentaje de área bajo la curva normal comprendida entre dos datos

nominales.

En el punto anterior se calcularon áreas que existían desde la media μ hasta un

valor de dato determinado y que al estandarizarlo, se obtenía un valor “z”.

Ahora calcularemos áreas por debajo de la curva; pero aquella comprendida entre

dos datos determinados (no a partir de la media).

Si el problema a resolver es como el dibujo anterior; es decir, z1 y z2 están en un

mismo lado de la media (en ese caso a la derecha), el área “A” se obtiene

siguiendo el mismo método ya explicado; pero ahora restando al área determinada

por z2 el valor del área determinado por z1.

Si el problema a resolver consiste en que el valor z1 está por un lado de la media

(el izquierdo por ejemplo) y el z2 está en el otro lado (el derecho), entonces el área

“A” se obtiene sumando las dos áreas (la de z1 con la de z2).

Ejemplo 6.

En la clínica del IMSS de Cd. Altamirano se hizo un estudio con 350 datos y al

hacer los cálculos, se obtuvo una media μ = 33.2 y una desviación estándar con

S = 9.4. Se pide calcular el porcentaje de área que existe entre el dato nominal

con valor x1 = 14 y el dato nominal x2 = 45

Solución:

Necesitamos primeramente estandarizar los datos de 14 y 45. Así obtendríamos

dos valores de z.

z1

Z2

A

Page 126: Apuntes de estadistica con enfoque a la bioestadistica

121

Estandarizando a 14:

04.24.9

2.33141

S

xz

El signo negativo indica que z1 se encuentra a la

izquierda de la media μ; es decir, el dato 14 está por debajo de la media.

Estandarizando a 45:

25.14.9

2.33452

S

xz

El signo es positivo y entonces z2 está a la

derecha de la media μ; es decir 45 está por arriba de la media.

La figura siguiente ilustra este problema:

El porcentaje de área pedido será la suma de las dos áreas. Usando la tabla se

tiene:

Para z1 = - 2.04 El porcentaje de área es 47.93% = 0.4793

Para z2 = 1.25 El porcentaje de área es 39.44 % = 0.3944

El porcentaje total es la suma de las dos : A = 0.8737

El porcentaje total de datos comprendidos desde el dato 14 hasta el 45 es del

87.37%

Con una regla de tres podemos conocer el número de datos:

%37.87%100

350 nd nd = 306 datos

z1 z2

Page 127: Apuntes de estadistica con enfoque a la bioestadistica

122

Ejemplo 7.

En el hospital de Coyuca de Catalán se pesaron a 155 personas. Al hacer cálculos

se tuvo que dichos datos presentan una distribución normal. La media que se

calculó es μ = 70 kg y una desviación estándar de S = 12.5 kg. ¿Cuál es la

probabilidad de que una persona elegida al azar de ese grupo pese entre 50 y 85

kg?.

Solución:

Estandarizando el dato 50, tenemos: 6.15.12

70501

S

xz

Se encuentra a la

izquierda de μ.

Estandarizando el dato 85, tenemos: 2.15.12

70852

S

xz

Se encuentra a la

derecha de μ.

Porcentaje de área para z1 = - 1.6 es de acuerdo a la tabla 44.52% = 0.4452

Porcentaje de área para z2 = 1.2 es de acuerdo a la tabla 38.49% = 0.3849

El porcentaje de área pedido es la suma de las dos. El valor es 0.8301= 83.01%

La probabilidad de que una persona elegida al azar pese entre 50 y 85 kg es

83.01%

TAREA.

Hagan equipos de 5 alumnos y resuelvan los problemas siguientes:

1.- Un estudio realizado sobre las cooperaciones que pagó la cooperativa de la

escuela durante el año 2012 se indican en la tabla siguiente. Su distribución es

normal. Ahí mismo se indican las frecuencias (f) de cada pago (x).

Calcular:

a) La media μ

b) La desviación estándar “S”.

Page 128: Apuntes de estadistica con enfoque a la bioestadistica

123

c) Estandarizar cada dato “x” a su equivalente “z”.

Tabla:

Pago “x” Frecuencia presentada (f)

2 100

4 300

6 800

8 900

10 800

12 300

14 100

2.- Al recolectar 450 datos con una distribución normal, se obtuvo una media con

valor μ = 50 y una desviación estándar con valor S = 17.4. Calcular el número de

datos aproximados que hay entre el dato nominal 34 y el dato nominal 62.

3.- En el año escolar 2013 ingresaron a la Preparatoria 8 de Cd. Altamirano, la

cantidad de 450 estudiantes de nuevo ingreso. Se procedió a pesar cada

estudiante. La media calculada de esos pesos fue μ = 54 kg con una desviación

estándar de S = 4 kg

Si la distribución es normal. Calcule:

a) El número de alumnos que pesan mas de 50 kg

b) El número de alumnos que pesan entre 45 y 55 kg.

4.- Una persona procede a calificar la destreza manual a un grupo de alumnos. Si

la distribución es normal con una media μ = 10 y desviación estándar S = 2.5. Si

se selecciona al azar a uno de esos alumnos. ¿Cuál es la probabilidad que

obtenga una calificación de 15 o más?

5.- Un conjunto de datos con distribución normal, tiene una media μ = 65 y una

desviación estándar S = 10. Si entre la media “μ” y un valor “x” se tiene el 27% del

total de datos. Calcular el valor “x”.

Page 129: Apuntes de estadistica con enfoque a la bioestadistica

124

BIBLIOGRAFIA CONSULTADA

Cartas, J. Estadística Médica, Limusa, México, 1996.

Downie, N. Métodos Estadísticos Aplicados, Editorial Harla, México, 1986.

Fuenlabrada, S. Probabilidad y Estadística, Mc Graw Hill, México, 2004.

Franco, G.M. Introducción a la probabilidad, IPN, México, 2010.

Gutiérrez, A.L. Probabilidad y Estadística. Enfoque por competencias, Mc Graw

Hill, México, 2012.

Hayslett, H.T. Estadística simplificada, Editorial Minerva, México, 1979.

L´Gamiz, A. Bioestadística. La estadística aplicada al área de la salud. Editor

UNAM, México, 1982.

Milton, J. Susan. Estadística para Biología y Ciencias de la Salud, McGraw Hill,

México, 2001

Montes de Oca, F. Resolución total de probabilidad y estadística. Vol. 1, Skorpio,

México, 1988.

Portilla, E. Estadística, Mc Graw Hill, México, 1988.

Page 130: Apuntes de estadistica con enfoque a la bioestadistica

125

Sandoval, S. Estadística y econometría para economistas y administradores,

Editorial D.P. Débora, México 2001.

Spiegel, M. Estadística, Mc Graw Hill, México, 2009.

Stephen, W. Probabilidad y Estadística, Publicaciones cultural, México, 1980.

Wayne W, D. Bioestadística, Limusa, México 1990.