Estadística 2 Psic (Rev 25.03.07) v.07

101
ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág. i UNIVERSIDAD DE VALPARAÍSO FACULTAD DE CIENCIAS –DEPARTAMENTO DE ESTADÍSTICA ESTADÍSTICA II CARRERA DE PSICOLOGÍA PROF. ALBERTO CARO MARTÍN VALPARAÍSO, AGOSTO DE 2007

description

k,m

Transcript of Estadística 2 Psic (Rev 25.03.07) v.07

Page 1: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág. i

UNIVERSIDAD DE VALPARAÍSO FACULTAD DE CIENCIAS –DEPARTAMENTO DE ESTADÍSTICA

ESTADÍSTICA II CARRERA DE PSICOLOGÍA

PROF. ALBERTO CARO MARTÍN

VALPARAÍSO, AGOSTO DE 2007

Page 2: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

ii

INDICE

PROBABILIDADES 1. ESPACIO MUESTRAL Y SUCESOS 1.1. Fenómeno aleatorio 1 1.2. Experimento y espacio muestral 1 1.3. Sucesos 2 1.4- Ejercicios 2 2. PROBABILIDAD

2.1. Probabilidad y suceso 3 2.2. Modelo de probabilidad uniforme 3 2.3. Ejercicios 6

3. CONCEPTUALIZACIÓN DE LA PROBABILIDAD

3.1. Definición axiomática 7 3.2. Teoremas de probabilidades 7 3.3. Ejercicios 9

4. PROBABILIDAD CONDICIONAL

4.1. Probabilidad condicional 9 4.2 Ejercicios 10 4.3. Sucesos independientes 10 4.4. Probabilidad Total 11 4.5. Teorema de Bayes 11 4.6. Ejercicios 13

5. VARIABLES ALEATORIAS UNIDIMENSIONALES DISCRETAS

5.1. Definiciones 14 5.2 Variable aleatoria discreta 16 5.3. Parámetros de una variable aleatoria discreta 18 5.4. Ejercicios 21 5.5. Distribuciones de probabilidad discreta 22 5.6. Distribución Binomial 22 5.7. Distribución Hipergeométrica 23 5.8. Ejercicios 24

6. VARIABLES ALEATORIAS UNIDIMENSIONALES CONTINUAS

6.1. Definiciones 25 6.2. Distribución Normal 26 6.3. Ejercicios 31 6.4. Otras distribuciones continuas 32

7. DISTRIBUCIONES MUESTRALES

7.1. Muestra aleatoria 34 7.2. Parámetros y estadísticas 34 7.3. Distribuciones en el muestreo 34 7.4. Distribución en el muestreo de la media aritmética 36 7.5. Otras distribuciones en el muestreo 37 7.6. Ejercicios 40

Page 3: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

iii

INFERENCIA 8. ESTIMACIÓN DE PARÁMETROS

8.1. Estimación de parámetros poblacionales 41 8.2. Estimación puntual de parámetros 44 8.3. Estimación por intervalos de parámetros 44 8.4. Est. por int. de la media pobl. con varianza pobl. conocida 44 8.5. Est. por int. de la media pobl. con varianza pobl. desconocida 49 8.6. Estimación por intervalo de la proporción poblacional 50

8.7. Estimación por intervalo de la varianza poblacional 51 8.8. Estimación por intervalo del Coef. Confiabilidad Alfa 53 8.9. Tamaño de la muestra para estimar la Media Poblacional 54 9. DÓCIMAS SOBRE UN PARAMETRO POBLACIONAL

9.1. Tipos de hipótesis 57 9.2. Procedimiento de la prueba de hipótesis 58 9.3. Elementos de la prueba de hipótesis 59 10. DÓCIMAS SOBRE PARÁMETROS DE UNA POBLACIÓN 10.1. Media poblacional con varianza poblacional conocida 63 10.2. Media poblacional con varianza poblacional desconocida 65

10.3. Proporción poblacional 67 10.4. Varianza poblacional 69 10.5. Coeficiente de Confiabilidad Alfa de Cronbach 70

10.6. Tamaño de muestra para dócima de hipótesis 71 11. DÓCIMAS SOBRE PARAMETROS DE DOS POBLACIONES 11.1. Diferencia de medias pobl. con varianzas poblac. conocidas 74 11.2. Diferencia de medias pobl. con varianza pobl. desconocidas 76

11.3. Diferencia de medias pobl. para datos pareados 78 11.4. Diferencia de proporciones poblacionales 80 11.5. Comparación de varianzas poblacionales 82 11.6. Ejercicios 84

BIBLIOGRAFÍA COMPLEMENTARIA 86 ANEXOS 1. Funciones de Distribución 88

- Normal Estándar, - t de Student - Ji Cuadrado - F

2. Formularios de Probabilidades e Inferencia 99

Page 4: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág. 1

PROBABILIDADES 1. ESPACIO MUESTRAL Y SUCESOS 1.1. FENÓMENO ALEATORIO Muchos problemas científicos requieren la realización de experimentos u observaciones, los que pueden repetirse (al menos en teoría) muchas veces. Si para cada uno de ellos no es posible o no es conveniente intentar su descripción causal (predecir el estado final a partir del estado inicial), pero si se considerara su descripción estadística, esto es, las características o propiedades del conjunto de resultados, entonces se trata de fenómenos aleatorios. Los fenómenos aleatorios están presentes en todas las situaciones en que hay variabilidad o incertidumbre en los resultados del experimento. Ejemplos de éstos son: respuesta a un ítem de una prueba (resultado puede ser correcto o incorrecto); puntaje obtenido en una prueba de 20 ítems aplicada a un escolar (resultado puede ser 0; 1;...;20 puntos); estatura de niños (valores entre 140 y 160 cm). Según Cansado "el Cálculo de Probabilidades es la teoría matemática que sirve de modelo para la descripción y análisis de los fenómenos estadísticos o aleatorios" (Cansado, 1958: 397). La Teoría de las Probabilidades es importante en Estadística pues suministra las bases de la Inferencia, la cual consiste en obtener información sobre una población a partir del análisis de una muestra de datos de la misma. Este proceso es muy útil en la investigación científica. 1.2. EXPERIMENTO Y ESPACIO MUESTRAL Un "experimento aleatorio" es el proceso controlado (puede repetirse en las mismas condiciones) que se realiza con el propósito de recolectar información acerca de la ocurrencia de un fenómeno aleatorio. Ejemplos son los siguientes: a) Experimento 1: Aplicar un ítem a una persona y registrar su respuesta; b) Experimento 2: Aplicar 3 ítems a una persona y registrar las respuestas a cada uno de ellos. c) Experimento 3: Aplicar prueba de 20 ítems a un persona y registrar el resultado obtenido. d) Experimento 4: Solicitar a un sujeto que ejecute una acción y registrar el número del intento en que la realiza bien. e) Experimento 5: Medir la estatura de un niño. Se denomina "espacio muestral" al conjunto de resultados asociados con el experimento aleatorio. Para los experimentos anteriores, los espacios muestrales son: S1= {Bueno, Malo} = {B , M } S2= {BBB, BBM, BMB, BMM, MBB, MBM, MMB, MMM} S3= {0, 1, 2, 3, 4,..., 20} = {x |x∈Z; 0 x 20 }

S4= {1, 2, 3, 4, 5, 6, .... } S5= { x|x∈R; 100 < x < 180 ; x en cm}

Se denomina "espacio muestral discreto" al que está compuesto por un número de elementos finito o infinito numerable. Ejemplos son todos los anteriores, exceptuando S5. Se denomina "espacio muestral continuo" al que está compuesto por un número infinito no numerable de elementos (como ocurre con un intervalo de números reales). Ejemplo es S5.

Page 5: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

2

1.3. SUCESOS Se denomina "suceso" a cualquier subconjunto del espacio muestral. Se llama "suceso elemental" a aquellos que componen el espacio muestral. Mediante la aplicación de las operaciones de conjuntos (unión, intersección, complemento) se pueden definir nuevos sucesos a partir de otros dados. Se dice que "ocurre un suceso" si al realizar un experimento el resultado pertenece al suceso respectivo. Se denominan "sucesos mutuamente excluyentes" aquellos que no ocurren simultáneamente. Su intersección es vacía. Por ejemplo, para el Experimento 3 (aplicar prueba de 20 ítems a una persona) y su Espacio Muestral S3= {0, 1, 2, 3, 4,..., 20} se pueden definir los sucesos siguientes, entre otros: a) Sucesos elementales son: {1}, {8} etc. b) Considerando los siguientes sucesos: A = {0, 1, 2, 3, 4 } B= { 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 } C= {10, 15, 18 } A ∪ C = { 0, 1, 2, 3, 4, 10, 15, 18 }; A∩C=Ø

A y C son mutuamente excluyentes pues A∩C=Ø

c) Si se realiza el experimento, esto es, se aplica el test a la persona y ésta logra 10 puntos, se dirá que han ocurrido los sucesos B y C y no ha ocurrido A. 1.4. EJERCICIOS 1. Explicar el significado de los términos: a) Fenómeno aleatorio b) Suceso aleatorio c) Experimento d) Espacio muestral 2. Dar un ejemplo de un fenómeno aleatorio 3. Supóngase que un investigador de mercados entrevista a una ama de casa y a su marido para determinar la "aceptación" o "no aceptación" de un cierto producto. ¿Cuántas posibles respuestas podrá dar esta pareja?. Indicar el experimento y el Espacio Muestral. 4. Juan tiene cinco cartas marcadas 1, 2, 3, 4 y 5 y María tiene cinco cartas marcadas también 1, 2, 3, 4 y 5. Si se aparean las cartas de Juan con las de María ¿Cuántos posibles pares hay? Indicar el experimento y el Espacio Muestral. Representar el espacio muestral del experimento. 5. Indicar cuales de los siguientes grupos de sucesos son mutuamente excluyentes, suponiendo la existencia de un espacio muestral apropiado: a) La elección de un hombre y una mujer de entre los alumnos del curso.

b) La elección de un estudiante con nota 4 o superior y de otro con nota 4 o inferior en la prueba de Estadística.

c) Comprar un auto marca Suzuki o marca Hyundai en un negocio de venta de autos usados.

Page 6: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

3

2. PROBABILIDAD 2.1. PROBABILIDAD Y SUCESO Intuitivamente se percibe la probabilidad asociada a un suceso como la medida (expresión numérica) de cuán posible es la ocurrencia del suceso cuando se realiza un experimento aleatorio. Siendo A un suceso, la probabilidad asociada se denota como P(A). Esta asociación entre sucesos y números (que es una función) se considera que puede realizarse de tres maneras: a) empleando las frecuencias relativas de ocurrencia del suceso, b) en forma subjetiva y, c) suponiendo un espacio muestral cuyos sucesos elementales son igualmente probables. A continuación se reseñan las dos primeras formas. La tercera manera se detallará por ser una forma que permite un mayor desarrollo. Sin embargo es conveniente puntualizar que, independientemente del método empleado para realizar la asignación de probabilidades a los sucesos, éstas se rigen por los mismos principios, los que serán explicitados más adelante en los teoremas sobre probabilidades. 2.1.1. Modelo Frecuentista. En situaciones en que es posible es realizar un experimento muchas veces y en las mismas condiciones, puede apreciarse la existencia de una regularidad estadística, esto es, cuando aumenta el número de realizaciones del experimento, la frecuencia de un suceso tiende a estabilizarse. Por ello, se ha considerado como definición de probabilidad de un suceso el valor límite de la frecuencia relativa del suceso cuando el número de realizaciones del experimento tiende a infinito. Este modelo es útil en el campo de los seguros. 2.1.2. Modelo de Asignación Subjetiva También puede considerarse la asignación subjetiva de una probabilidad a un suceso, empleando la experiencia de quien la realiza la asignación. Por ejemplo, cada uno puede asignar una probabilidad al suceso “lloverá mañana” o al suceso “obtener un resultado aprobatorio en la próxima prueba”. Por supuesto, las asignaciones realizadas por diversas personas no tienen por que coincidir. Este procedimiento es empleado en el campo de los negocios. 2.2. MODELO DE PROBABILIDAD UNIFORME (suc. elem. igualmente probables) 2.2.1. Características Cuando un experimento se realiza y la ocurrencia de un suceso elemental es tan probable como la de otro, se dice que el espacio muestral contiene sucesos elementales igualmente probables. Este modelo es adecuado en experimentos como los juegos de azar. Si un espacio muestral consiste en k sucesos elementales {e1, e2, ...,ek} igualmente probables, la probabilidad de cada suceso elemental es P(ei)=1/k . Si un suceso A consiste en m sucesos elementales, esto es:

Si el suceso { }1 2 ... kA e e e= + + + entonces ( ) mP Ak

= .

La probabilidad de un suceso A puede obtenerse mediante la expresión siguiente:

( ) Numero de casos favorables a la ocurrencia de AP ANumero de casos totales

=

Un espacio muestral que tiene sucesos elementales igualmente probables se dice que tiene un "modelo de probabilidad uniforme".

Page 7: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

4

n−

Ejemplo: Si el experimento consiste en lanzar un dado, el espacio muestral es: S= {1,2,3,4,5,6}. Como no hay evidencia que un resultado elemental pueda ocurrir más que otro, el modelo de probabilidad uniforme es apropiado. Por esto:

P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6 Siendo el suceso A = { Resultado es un número par } = { 2,4,6 } Entonces P(A)= 3/6 = 1/2 . 2.2.2. Principios de enumeración El modelo de espacio muestral equiprobable y la “fórmula” señalada posibilita el empleo de los métodos de enumeración para calcular las probabilidades de un suceso. En particular, son útiles el empleo de las permutaciones y las combinaciones, las que se basan en dos principios: de multiplicación y de adición. a) Principio de Multiplicación Este principìo se puede esquematizar de la siguiente forma: Si un procedimiento 1 puede realizarse de n1 formas y otro procedimiento 2 puede realizarse de n2 formas y si se supone que cada forma de realizar el procedimiento 1 puede ser seguida por cualquiera de las formas de realizar el procedimiento 2, entonces el número de maneras en que se puede realizar el procedimiento 1 y luego el procedimiento 2 es igual a 1 2.n ni Ejemplo: Si una prueba se puede realizar en 3 tamaños de papel (oficio, carta o A4) y para escribir las preguntas se pueden emplear 4 tipos de letra (courier, arial, tahoma o verdana), entonces el número de maneras en que se puede realizar la prueba es igual a 12 (esto es 3*4) b) Principo de Adición Si un procedimiento 1 puede realizarse de n1 formas y otro procedimiento 2 puede realizarse de n2 formas. Si se supone que ambos procedimientos no pueden realizarse juntos, entonces el número de maneras en que se puede realizar el procedimiento 1 o el procedimiento 2 es igual a 1 2.n n+ Ejemplo: Una persona desea viajar a Santiago. Dispone de 4 líneas de buses o 3 líneas de taxis. Por lo tanto, el número de formas en que dicha persona puede realizar el viaje es 7 (esto es 4+3), dado que no puede viajar en bus y taxi simultáneamente. 2.2.3. Números factoriales Los números factoriales son expresiones útiles que se emplean para expresar recuentos u ordenaciones de objetos. Se define como ( n! se lee “n factorial”). ! 1 2 3 4 .... ( 1)n n= i i i i i i Además se considera que: 1! 1 ; 0! 1= = 2.2.4. Permutaciones i) Se define como el "numero de permutaciones de n en n" al número de arreglos u

ordenaciones posibles de "n" objetos considerándolos todos a la vez es y es igual a:

! 1 2 3 4 .... ( 1)n nP n n n= = −i i i i i i

Page 8: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

5

Ejemplo: Si se dispone de 5 sillas el número de formas en que se pueden sentar 5 personas en ellas es igual a: formas 5 5 5! 5 4 3 2 1 120P = = =i i i i ii) Se define como el "número de permutaciones de r en n” al número de formas diferentes en que pueden arreglarse u ordenarse "r" objetos de un grupo de "n" objetos distintos, lo que se denota como

!P ( 1) ( 2) .... ( 1)( )n r

nn n n n rn r

== − − − + =−

i i i i!

Ejemplo: Si se dispone de 5 sillas en las cuales se deben sentar 3 personas, entonces el número de formas en que esto se puede realizar es:

5 3

5 3

P 5 4 3 605 4 3 2 1 5! 5! 120P 6

2 1 (5 3)! 2! 2

formas

0 formas

= =

= = = = =−

i ii i i ii

ii) Si se tienen "n" objetos entre los que existen repeticiones, tales que n1 son de un tipo,

n2 de un segundo tipo, n3 de un tercer tipo, ... , nk de un k-ésimo tipo (siendo n1+n2+n3+…+nk=n), entonces el número de permutaciones de los "n" objetos será igual a

1 2 3; ; ; ...;1 2 3

!( )! ! !... !k

n con repeticiones n n n nknP

n n n n=

Ejemplo: El número de permutaciones (palabras) que pueden realizarse con las letras de la palabra CARRETERA es igual a:

9 . 3; 2; 2;1;19! 362.880 362.880( ) 15.120

3!2!2!1!1! 6 2 2 1 1 24con repetP palabras= = = =

i i i i

Pues hay 3 letras R; 2 letras A; 2 letras E; 1 letra C y 1 letra T. 2.2.5. Combinaciones Las “combinaciones” son otra expresión que se emplea para contar selecciones o arreglos de objetos. La diferencia con las permutaciones es que en las combinaciones no interesa en orden en que se ubican los objetos. Por lo tanto, se define a las "combinaciones de r objetos tomados de entre n de los mismos" al número de formas posibles en que pueden seleccionarse "r" objetos de un grupo de "n" objetos distintos, sin que interese el orden, denotándose como :

( ; )!

! ( 1) ( 2) ... ( 1)( )! ! 1 2 3 ... ( 1)

n rn r

n r

n PC C n rr r

n n n n n rCn r r r r

⎛ ⎞= = =⎜ ⎟

⎝ ⎠− − −

= =− −

i i i ii i i i i

+

Ejemplo: El número de muestras diferentes de 4 alumnos que pueden seleccionarse de un grupo de 10 alumnos (considerando que una muestra es un grupo de 4 alumnos distintos en que no interesa el orden de selección, y que una muestra es diferente a otra si al menos tienen un integrante distinto), entonces el número de muestras distintas que pueden seleccionarse es igual a:

10 410! 10! 3.628.800 3.628.800 210

(10 4)!4! 6!4! 720 24 17.280C muestras= = = = =

− i

Page 9: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

6

2.3. EJERCICIOS a) Permutaciones y Combinaciones 1. Explicar la diferencia entre permutación y combinación. 2. Si se lanzan cinco dados distinguibles ¿De cuántas maneras pueden caer? 3. Se juega cuatro veces una moneda ¿De cuántas maneras posibles puede caer en las cuatro jugadas? Utilice un diagrama de árbol para presentarlos. 4. Las patentes de automóvil tienen dos letras y tres números. ¿Cuántas patentes diferentes se pueden formar? 5. Los pacientes de un psicólogo se clasifican por edad en menos de 30, de 30 a 45 y de más de 45. Según estado civil en solteros, casados y viudos; y según sexo en hombres y mujeres. Un experimento consiste en seleccionar un paciente. Indique el espacio muestral. Use diagrama de árbol. 6. En un concurso de belleza quedan 15 semifinalistas. ¿De cuántas maneras pueden ocuparse los cinco primeros lugares del concurso? 7. En un curso de Estadística hay 24 hombres y 6 mujeres. ¿De cuántas maneras distintas se puede constituir una directiva de cuatro estudiantes? ¿De cuántas maneras se puede constituir si debe haber dos hombres y dos mujeres?. ¿De cuántas formas si debe haber una mujer? b) Asignación de Probabilidades 8. Un psicólogo piensa que las opciones que un tratamiento sea efectivo para curar a un paciente son de 3 a 1. ¿Cuál es la probabilidad respectiva?. ¿Qué esquema de asignación de probabilidad se emplea? 9. El gerente de una gran tienda ha observado que de 3.000 personas que entraron al establecimiento durante la semana anterior, 450 hicieron alguna compra. ¿Cuál es la probabilidad que el próximo cliente que entre compre algo. ¿Qué esquema de asignación de probabilidad se emplea? 10. Se lanzan tres monedas. Escribir el espacio muestral. Calcular las probabilidades siguientes: a) Salgan más de dos caras b) Salgan dos caras o dos sellos c) ¿Qué esquema de asignación de probabilidad se emplea? 11. Un vendedor de automóviles tiene 10 autos nuevos. Tres son color blanco, tres son grises y 4 son azules. Determine la probabilidad que venda: a) Dos autos b) Dos autos blancos c) Dos autos del mismo color 12. De un naipe inglés (de 52 cartas con 13 de cada pinta) se seleccionan 5 cartas. Estime la probabilidad que éstas sean de la misma pinta. (Resp: 4)

Page 10: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

7

3. CONCEPTUALIZACIÓN DE LA PROBABILIDAD 3.1. DEFINICIÓN AXIOMÁTICA A continuación se presenta una definición formal del concepto de probabilidad, mediante axiomas, teoremas, definiciones etc. Los axiomas son la base para el desarrollo de la Teoría de las Probabilidades y es fácil advertir su paralelo con el comportamiento observado para las frecuencias relativas. Sea E un experimento aleatorio y S un espacio muestral de E. Con cada suceso A se asocia un número real P(A), llamado "probabilidad de A", que cumple con las siguientes condiciones: a) Para todo suceso A, 0 P(A) 1

b) P(S ) = 1 c) P( A ∪ B ) = P( A ) + P( B ) ; siendo A y B sucesos mutuamente excluyentes.

d) Si el espacio muestral es infinito, el axioma anterior se reemplaza por: Si A1, A2, A3,... son sucesos mutuamente excluyentes, entonces

P( A1 ∪ A2 ∪ A3 ∪... ) = P( A1 ) + P( A2 ) + P( A3 ) + ...

3.2. TEOREMAS DE PROBABILIDADES Los axiomas se complementan con teoremas. Estos permiten incrementar las propiedades que tienen las probabilidades. Los axiomas así como los teoremas modelan el comportamiento de las probabilidades y por ello se aplican bajo cualquier forma que se emplee para asignar las probabilidades a los sucesos. Los teoremas fundamentales son los siguientes Teo. 1) P (Ø) = 0 (probabilidad del suceso imposible)

Teo. 2) P ( A’ ) = 1- P(A ) (probabilidad del suceso complementario de A) Teo. 3) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) Siendo A y B sucesos cualesquiera

Teo. 4) P(A ∪ B ∪ C) = P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)+P(A∩B∩C)

Teo. 5) Si A B, entonces P(A) P(B) ⊂ Ejemplo 1: Sea el experimento E: Lanzar un dado y registrar resultado obtenido. Sea su espacio muestral S= {1, 2, 3, 4, 5, 6 }. Considerando el espacio muestral equiprobable para la asignación de probabilidades, entonces se tiene que: P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=1/6 a) Se definen los sucesos: A={1, 2, 3 } B= {2, 3, 4, 5, 6} C={4, 5} A ∪ B = {1, 2, 3, 4, 5, 6} A ∩ B = {2, 3} C'= {1, 2, 3, 6}

A ∪ C = {1, 2, 3, 4, 5} ; A ∩ C = Ø (A y C suc. mutuamente. excluyentes)

b) Las probabilidades de los sucesos son: P(A)=3/6 ; P(B)= 5/6 ; P(C)= 2/6 ; P(C') = 4/6 P(A ∪ B) = P(S)= 6/6 ; P(A ∪ C) = 5/6 ;

P(A ∩ B) = 2/6; ; P(A ∩ C) = 0

Page 11: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

8

c) Aplicando los teoremas se puede verificar que: P(C')= 1- P(C) = 1 - 2/6 = 4/6 P(A ∪ C) = P(A) + P(C) = 3/6 + 2/6 = 5/6 (pues A y C son sucesos

mutuamente excluyentes) P(A ∪ B) = P(A) + P(B) - P(A∩B) = 3/6 + 5/6 - 2/6= 6/6 (pues A y B no son

sucesos mutuamente excluyentes) Ejemplo 2: Se tiene una bolsa con 10 fichas de las cuales 6 son Azules y 4 son Blancas. Un experimento consiste en seleccionar una muestra de 3 fichas (sin reposición).

a) Nº de muestras distintas que pueden seleccionarse: 10 10! 3.628.800 1203 7!3! (5.040)(6)⎛ ⎞

= = =⎜ ⎟⎝ ⎠

b) Probabilidad de seleccionar una muestra cualesquiera: 1 1 0,0083 (8,3%)

10 1203

= ==⎛ ⎞⎜ ⎟⎝ ⎠

c) Grupos de 2 fichas azules que pueden formarse con 6 azules: 6 6! 720 152 4!2! (24)(2)⎛ ⎞

= = =⎜ ⎟⎝ ⎠

d) Grupos de 1 fichas blancas que pueden formarse con4 blancas: 4 4! 24 41 3!1! (6)(1)⎛ ⎞

= = =⎜ ⎟⎝ ⎠

e) Muestras de 3 fichas formadas por dos Azules y una Blanca: 6 4

(15)(4) 602 1⎛ ⎞⎛ ⎞

= =⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠

f) Probabilidad de seleccionar una muestra de 3 fichas compuesta por dos fichas Azules y una Blanca:

P(2 Azules, 1 Blancas) =

6 42 1 (15)(4) 60 0,50 (50,0%)10 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

g) Probabilidad de seleccionar una muestra de 3 fichas compuesta por una ficha Azul y dos Blancas:

P(1 Azules, 2 Blanca) =

6 41 2 (6)(6) 36 0,30 (30,0%)

10 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

h) Probabilidad de seleccionar una muestra de 3 fichas compuesta por 2 Azules y 1 Blancas o por 1 Azules y 2 Blanca: P(2 Azules,1 Blanca) ∪ (1 Azul, 2 Blancas))=

=P(2 Azules,1 Blanca) + P(1 Azules, 2 Blancas)=

= 60 36 96 0,80 (80,0%)

120 120 120+ = =

Page 12: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

9

3.3. EJERCICIOS 1. Analizar la información siguiente y explicar la razón en caso de ser errónea. a) Las probabilidades que un chofer de bus no tenga accidentes durante el año es de 0,90; que tenga un accidente es de 0,02 y tenga dos o más es 0,90. b) Un inversionista afirma que la probabilidad que el precio de una acción suba es de 0,38; que no cambie de valor es de 0,52 y de que baje es de 0,12. 2. Las probabilidades que un vendedor de automóviles venda 0, 1, 2, 3, 4 ó más autos son de 0,14, 0,21, 0,48; 0,12 y 0,05 respectivamente. Sea X el número de autos que va a vender la semana próxima. Calcular la probabilidad de: a) P(X = 0, 1 ó 3) c) P(X<4) e) P(X>2) b) P(2 X 3) d) P(X<3) f) P(X 3)

3. Suponiendo que cada una de las 52 cartas de un naipe inglés tiene la misma probabilidad de salir. Si se selecciona al azar una carta determine la probabilidad de extraer: a) Un rey negro (Resp: 2/52) b) Un 10 o una figura (Resp: 16/52) c) Un trébol o el rey de diamantes (Resp: 14/52) d) Una reina roja o un rey negro (Resp: 4/52) e) Una reina, un rey o un as (Resp: 12/52) f) Un trébol o un as (Resp: 16/52) 4. Entre los 200 empleados de una empresa hay 60 que dedican su tiempo a asesoría. De los empleados, 150 son graduados de los cuales 40 dedican parte de su tiempo a trabajos de asesoría. Si se toma al azar uno de los empleados, estime la probabilidad que no sea graduado y no dedique su tiempo a asesoría (Dibuje un diagrama de Venn). (Resp: 0,15) 4. PROBABILIDAD CONDICIONAL La probabilidad de un suceso A puede ser modificada de acuerdo a la información que se tenga sobre la acurrencia de otro suceso B, el que puede estar o no relacionado con A. La probabilidad revisada de A cuando se sabe que ha ocurrido B se denomina la probabilidad condicional de A dado B y se denota como P(A/B). Se define como:

(( / )

( )P A BP A B

P B∩

=)

)

;siendo P(B) > 0. En forma equivalente,

(Ley de multiplicación de probabilidades) ( ) ( ) ( / ) ( ) ( / )P A B P B P A B P A P B A∩ = = Para el caso de tres sucesos, la ley de multiplicación de probabilidad se expresa como: ( ) ( ) ( / ) ( /P A B C P A P B A P C A B∩ ∩ = ∩ Ejemplo: Se clasifica a los 120 alumnos de una carrera por sexo: Hombre (H), Mujer (M) y según nivel: Primer año (R), Segundo año (S), Otros Cursos (O) de la forma siguiente:

ALUMNOS POR NIVEL SEXO

R:PRIMERO S:SEGUNDO O:OTROS TOTAL H: HOMBRE 20 10 15 45 M: MUJER 30 20 25 75 TOTAL 50 30 40 120

Se pueden definir las probabilidades para los sucesos siguientes:

Page 13: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

10

P(Ser de Segundo) = P(S) = 30/120 (Prob. marginal) P(Ser Mujer) = P(M) = 75/120 (Prob. Marginal) P(Ser de Segundo y Ser Mujer) = P(S ∩ M)= 20/120 (Prob. Conjunta)

P(Ser Mujer dado que es de Segundo)= P(M/S)= 20/30 (Prob. Condicional) P(Ser de Segundo dado que es Mujer)= P(S/M)= 20/75 (Prob. Condicional) (Observar que la probabilidad condicional no es conmutativa: P(M/S) ≠ P(S/M) ) Aplicando la definición de probabilidad condicional:

P(Ser Mujer dado que es de Segundo)= ( ) 120 /120 20( / ) 0,667 (66,7%)

( ) 30 /120 30P S MP M S

P S∩

= = = =

P(Ser de Segundo dado que es Mujer)= ( ) 20 /120 20( / ) 0, 267 (26,7%)

( ) 75 /120 75P S MP S M

P M∩

= = = =

4.1. EJERCICIOS 1. Señale diferencia entre las probabilidades conjuntas, marginales y condicionales. 2. Una caja contiene 5 fichas rojas y tres verdes. Se selecciona una ficha (X), se anota su color y se vuelve a la caja. Se selecciona otra ficha (Y). Calcular. a) P( X es roja y Y es verde) b) P(X es roja o verde) c) P(x y Y son rojas) d) P(X es roja o Y es verde) 3. Una empresa contrata personal con o sin formación académica para realizar una tarea. Los registros de la empresa indican que 40% de los empleados tiene formación académica (C) o sea P(C)=0,40. Análogamente, 60% no tiene formación académica (o sea P(C')=0,60). Luego de seis meses a prueba se clasifica a los candidatos como Excelentes (E), Medianos (M) o Insuficientes (I). Las proporciones de los clasificados en categorías anteriores son 0,30; 0,50 y 0,20 respectivamente. a) Indique probabilidades conjuntas b) Calcule la probabilidad que un empleado sea clasificado como Excelente con la condición que tenga formación académica. 4.2. SUCESOS INDEPENDIENTES Cuando la probabilidad condicional del suceso A dado B, esto es P(A/B), es igual a la probabilidad no condicional de A, esto es P(A), significa que la información sobre B no afecta al suceso A, lo que se interpreta en el sentido que A es independiente de B. Esto permite formular la definición siguiente: Dos eventos A y B son independientes si P( A/B ) = P( A ) o si P( B/A ) = P( B ) Por lo tanto: P( A ∩ B )=P( A ) P( B ) , si A y B son independientes.

Ejemplo: En el ejemplo anterior, estudiantes clasificados por nivel y sexo, los sucesos S={Ser de Segundo} y M={Ser mujer} no son independientes ya que:

P(S ∩ M) ≠ P(S)P(M) pues 20 30 75

120 120 120≠

Page 14: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

11

4.3. PROBABILIDAD TOTAL Empleando los datos del ejemplo anterior, sobre sexo y nivel de los alumnos, se aprecia en la tabla que la probabilidad de ser hombre es P(H)=45/120 Esta probabilidad se puede expresar de diversas formas. Si se considera a los niveles como una partición, entonces: P(H) = P( Hombre de Primero) + P(Hombre de Segundo) + P(Hombre y Otro Nivel)

P(H) = P(H ∩ R) + P(H ∩ S) + P(H ∩ O) = 20 10 15 45

120 120 120 120+ + =

Otra forma: P(H) = P( H/R )P( R ) + P( H/S )P( S ) + P( H/O )P( O ) =

= 20 50 10 30 15 40 4550 120 30 120 40 120 120

⎛ ⎞⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞⎛ ⎞+ +⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎝ ⎠

=

El desarrollo anterior ilustra la idea de la denominada Probabilidad Total mediante la cual la probabilidad de un suceso dividido en partes excluyentes, mediante una partición del espacio muestral, se calcula por la adición de las probabilidades de esas partes. Formalizando la idea anterior, se tiene el siguiente enunciado: “Si en un espacio muestral se define una partición del mismo, esto es un conjunto de sucesos B1, B2,,..,Bk que son mutuamente excluyentes y cuya unión corresponden al espacio muestral (en el ejemplo anterior, la partición corresponde a la división en niveles de los alumnos) Si además se define un otro suceso cualquiera A (en el ejemplo anterior corresponde a “ser hombre”) siendo B el conjunto de sucesos que representa la partición del espacio muestral S, entonces se puede demostrar que: P(A) = P( A ∩ B1) + P( A ∩ B2)+…+ P(A ∩ Bk)

P(A) = P(A/B1)P(B1)+ P(A/B2)P(B2) + … + P(A/Bk)P(Bk) 4.4. TEOREMA DE BAYES Empleando, nuevamente, los datos del ejemplo sobre estudiantes clasificados por sexo y nivel que cursan, se puede considerar el problema siguiente: Si se selecciona un estudiante del grupo completo y resulta ser Hombre ¿Cuál es la probabilidad que sea de Segundo año?. Este problema se puede plantear como un probabilidad condicional. Observando la tabla se tiene que la respuesta es: P(S/H) =10/45. Empleando los conceptos antes definidos de Probabilidad Condicional y Probabilidad Total, la probabilidad P(S/H) se puede expresar como:

( ) ( ) 10 /120 10( / )

( ) ( ) ( ) ( ) 45 /120 45P H S P H SP S H

P S P H R P H S P H O∩ ∩

= = =∩ + ∩ + ∩

=

o, en forma alternativa:

( ) ( / ) ( ) 10 /120 10( / )

( ) ( / ) ( ) ( / ) ( ) ( / ) ( ) 45 /120 45P H S P H S P SP S H

P S P H R P R P H S P S P H O P O∩

= = =+ +

=

Page 15: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

12

Estas expresiones corresponden a un importante teorema conocido como Teorema de Bayes o probabilidad a posteriori, Este resultado permite calcular la probabilidad de un suceso que ha ocurrido empleando información parcial sobre el mismo. Si bien en el ejemplo anterior se partió conociendo la probabilidad P(S/H)=10/45 por simple inspección de la tabla, y los desarrollos siguientes permitieron explicar dicho resultados usando otras probabilidades asociadas (condicionales y totales) en las aplicaciones sólo se contara con estas últimas y de ahí se origina la importancia de este resultado. Generalizando la expresión anterior, siendo B1, B2,...,Bk una partición del espacio muestral S y siendo A un suceso asociado con S, entonces, para cualquier Bi :

1 1 2 2

( / ) ( )( / )( / ) ( ) ( / ) ( ) ... ( / ) ( )

i ii

k k

P A B P BP B AP A B P B P A B P B P A B P B

=+ + +

(Teorema de Bayes)

Ejemplo: Un colegio tres curso de 4º Medios identificados como X, Y, Z. Todos los alumnos de tres cursos rinden un mismo examen de Matemáticas. El curso X representa el 50% del total de los alumnos, el curso Y representa el 30% del total de alumnos y el curso Z el 20% restante de los alumnos. La proporción de los que aprobaron el examen del curso X es 30%, los que aprobaron del curso Y son el 70% y del curso Z son el 40%. Considerando estos valores como estimaciones de probabilidades, calcular: a) La probabilidad que tiene un alumno de aprobar el examen. b) Si se selecciona un alumno al azar que ha aprobado el examen, estime la probabilidad que sea del curso X. Este problema es típico de la aplicación de los teoremas de la Probabilidad Total y el Teorema de Bayes. a) Se aplica el resultado para Probabilidad Total. Definiendo los sucesos: A = {aprobar examen} X ={ser de curso X}; Y ={ser de curso Y} ; Z ={ser de curso Z} La división en cursos representan la partición del conjunto de alumnos, siendo el suceso de interés el aprobar el examen. La información permite estimar las siguientes probabilidades: P(X)=0,5 P(Y)=0,3 P(Z)=0,2 P(A/X) = 0,3 , P(A/Y) = 0,7 ; P(Z/A) = 0,4 P(A)= P(A/X)P(X) + P(A/Y)P(Y) + P(A/Z)P(Z)= (0,3)(0,5)+(0,7)(0,3)+(0,4)(0,2) = 0,15 + 0,21 + 0,08 = 0,44 b) Se aplica el teorema de Bayes.

( ) ( / ) ( ) (0,3)(0,5) 0,15( / ) 0,341 (34,1%)

( ) ( ) 0,44 0,44P A X P A X P XP X A

P A P A∩

= = = = =

En resumen: a) La probabilidad de aprobar el examen es 0,44 (o del 44%). b) La probabilidad que si selecciona un alumno, que ha aprobado el examen, provenga del curso X es de 0,341 (o sea 34,1%).

Page 16: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

13

4.5. EJERCICIOS 1. Explicar diferencias entre probabilidades a priori y a posteriori 2. Una vendedora de cosméticos hace ventas a domicilio. Según su experiencia, de todas las visitas, el 20% le producen ventas grandes, el 30% de las visitas le produce ventas pequeñas y el 50% de las visitas no produce ventas. Por otra parte, ha observado que el 60% de quienes hicieron compras grandes viven en casas de dos pisos; entre quienes hicieron compras pequeñas el 50% vive en casas de dos pisos y entre quines no hicieron compras, el 20% vive en casas de dos pisos. Si la próxima visita de la vendedora es a una casa de dos pisos, estime la probabilidad que esta visita produzca a) Una venta grande (Resp: 0,12/0,37) b) Una venta pequeña (Resp: 0,15/0,37) c) Ninguna venta (Resp: 0,10/0,37) 3. Para detectar la hepatitis suele hacerse un examen de sangre de cierto tipo. La confiabilidad de este examen se basa en lo siguiente: entre las personas con hepatitis, el 80% de los exámenes de sangre descubren la enfermedad, pero el 20% fallan en hacerlo. Por otra parte, se sabe que entre las personas sin hepatitis el 5% se diagnostican erradamente como casos con hepatitis y el 95% de los exámenes dan el diagnóstico correcto. Si se aplica el examen a una persona (Pedro) escogido al azar de una población de la cual el 1% tiene hepatitis ¿Cuál es la probabilidad que Pedro realmente tenga la enfermedad? (Resp: 0,008/0,0575 ó 16/115) 4. En un estudio realizado en una universidad sobre estudiantes ingresados a primer año,

se determinó que el 55% de ellos no tienen problemas; el 25% estima que su principal problema consiste en la elección inadecuada de su carrera y el 20% estima que sus problemas principales son económicos. Del mismo estudio se estima que aquellos que no tienen problemas solamente el 1% no regresa en el Segundo Semestre; de los que tienen problemas con la elección de la carrera no regresa el Segundo Semestre el 70% y de aquellos con problemas económico no regresa el 5%. Si se selecciona al azar un alumno que regresó el Segundo Semestre, ¿Cuál es la probabilidad que sea de aquellos que tienen problemas de elección con su carrera? (Resp: 0,1191)

5. En tres cajas (1, 2 y 3) se colocan fichas de colores Rojas, Blancas y Azules según se

presenta en la tabla siguiente. Si se selecciona una caja al azar y se selecciona una ficha al azar, ¿Cuál es la probabilidad que la caja selecciona haya sido la Caja Nº3 si la ficha elegida es de color Rojo? (Resp: 1/3)

COLOR DE FICHAS CAJA

ROJAS BLANCAS AZULES CAJA 1 5 3 2 CAJA 2 1 8 1 CAJA 3 3 1 6

Page 17: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

14

5. VARIABLES ALEATORIAS UNIDIMENSIONALES DISCRETAS 5.1. DEFINICIONES 5.1.1. Variable Aleatoria Los espacios muestrales pueden ser expresados en forma cualitativa o cuantitativa. Con el objeto de tener una expresión numérica para todos los casos, se define el concepto de "variable aleatoria" del modo siguiente: Sea E un experimento y S el espacio muestral asociado con el mismo. Una función X que asocia a cada elemento "s" del espacio muestral un número real X(s) se denomina "variable aleatoria". 5.1.2. Espacio recorrido El conjunto de todos los posibles valores de la variable aleatoria X se denomina "Espacio del recorrido" (Rx). En cierto sentido puede considerarse como una especie de espacio muestral. 5.1.3. Sucesos equivalentes Sea E un experimeto aleatorio y S su espacio muestral asociado. Sea X una variable aleatoria definida sobre S y sea Rx se "espacio de recorrido". Sea B un suceso con respecto a Rx (esto es, B⊂Rx ). Si se define el suceso A tal que: A = { s ∈ S / X(s) ∈ B } entonces se

dice que "A es equivalente con B". Lo anterior significa que, para establecer la equivalencia, todos elementos de A deben tener imágenes que pertenecen a B. 5.1.4. Probabilidad de sucesos equivalentes Sea A un suceso de S y sea B un "suceso" de Rx (esto es A⊂S y B⊂Rx). Si se tiene que

A = { s ∈ S / X(s) ∈ B }, entonces se define la "probabilidad de B" como P( B ) = P( A ).

La definición anterior permite transferir probabilidades de sucesos reales (del espacio muestral) a otros sucesos ficticios (del recorrido de la variable aleatoria) con los cuales los primeros están relacionados. 5.1.5. Ejemplo Sea el experimento E: "Lanzar tres monedas y registrar resultados". El espacio muestral es: S = {CCC. CCS, CSC, SCC, CSS, SCS, SSC, SSS}. Algunos sucesos son: A = {SSS} ; B = {CSS, SCS, SSC} ; C = {CCS, CSC, SCC} ; D = {CCC} a) Las probabilidades de los sucesos elementales y de los otros sucesos son: P(CCC) = P(CCS) = P(CSC) = P(SCC) =P(CSS) = P(SCS) = P(SSC) = P(SSS) = 1/8 P(A) = 1/8; P(B) = 3/8; P(C) = 3/8; P(D) = 1/8 b) Se define la variable aleatoria X: "número de caras obtenidos" El "Espacio Recorrido de X es Rx= {0, 1, 2, 3 } Son "sucesos elementales" en Rx los siguientes {0}; {1}; {2}; {3} Otros sucesos en Rx pueden ser:

Page 18: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

15

{obtener a lo más 1 cara} = { 0, 1 } {obtener a lo menos 1 cara} = { 1, 2, 3 } {obtener entre 2 y 3 caras} = {2, 3} c) Se establece la siguiente equivalencia entre los sucesos elementales del "espacio muestral S" y del "espacio recorrido Rx " { SSS } es equivalente con { 0 } { CSS, SCS, SSC } es equivalente con { 1 } { CCS, CSC, SCC } es equivalente con { 2 } { CCC } es equivalente con { 3 } d) Para la asignación de probabilidades a los "sucesos elementales" de Rx se emplea la "equivalencia de sucesos" realizada antes, con los resultados siguientes: P ( 0 ) = 1/8 pues P( SSS ) = 1/8 y los sucesos son equivalentes P ( 1 ) = 3/8 pues P( CSS, SCS, SSC ) = 3/8 y los sucesos son equivalentes P ( 2 ) = 3/8 pues P( CCS, CSC, SCC ) = 3/8 y los sucesos son equivalentes P ( 3 ) = 1/8 pues P( CCC ) = 1/8 y los sucesos son equivalentes e) Para la asignación de probabilidades a otros sucesos, se emplea la equivalencia de sucesos con los resultados siguientes: P(obtener a lo más 1 cara) = P( 0, 1 ) = 4/8 P(obtener a lo menos 1 cara) = P( 1, 2, 3 ) = 7/8 P(obtener entre 2 y 3 cara) = P( 2, 3 ) = 6/8 d) El resumen de todo lo anterior se presenta en la tabla siguiente:

ESPACIO MUESTRAL Y SUCESOS V. ALEA. X:”Nº de caras” Sucesos Prob. Suceso Valor de xi Probab. xi

SSS 1/8 0 P(0)= 1/8 CSS 1/8 SCS 1/8 SSC 1/8

1

P(1) = 3/8

CCS 1/8 CSC 1/8 SCC 1/8

2

P(2) = 3/8

CCC 1/8 3 P(3) = 1/8 TOTAL 8/8 = 1 8/8 = 1

5.1.6. Ejercicios 1. a) Indicar la diferencia entre variable aleatoria discreta y continua. b) Indicar diferencia entre función de cuantía y función de densidad. 2. Una bolsa contiene 25 fichas, de las cuales 5 son rojas y 20 son verdes. Se eligen 4 fichas al azar. Se define la v.a. X:"Número de fichas rojas seleccionadas". Determine distribución de probabilidad de X, la función de Distribución de la misma y los gráficos respectivos si: a) La muestra se selecciona sin reposición b) La muestra se selecciona con reposición 3. Se sabe que una moneda, no equilibrada, tiene la particularidad que la cara aparece tres veces más que el sello (o sea P(Cara)=0,75). Si la moneda se lanza tres veces y se define la v.a. X: "Número de caras obtenidas", obtenga la distribución de probabilidad y la función de Distribución de X.

Page 19: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

16

5.2. VARIABLE ALEATORIA DISCRETA 5.2.1. Definición Sea X una variable aleatoria. Si el número de posibles valores de X (esto es Rx) es finito o infinito numerable se dice que X es una variable aleatoria discreta. 5.2.2. Función de cuantía (f. de c.) Sea X una variable aleatoria discreta y Rx= {x, x,...} su recorrido. Con cada posible resultado "xi" se asocia un número p(xi) = P(X=xi) llamado "probabilidad de xi" que debe satisfacer las siguientes condiciones: a) p( xi ) 0 para todo i

b) Σp(xi) = 1. La función "p" se denomina "función de cuantía" 5.2.3. Distribución de probabilidad Se denomina "distribución de probabilidad" al conjunto de pares ( xi; p(xi) ). La distribución de probabilidad puede expresarse mediante una tabla de valores de los pares ( xi; p(xi) ), o mediante una fórmula que exprese la relación de los pares, o mediante un gráfico de dichos pares. 5.2.4. Función de distribución (f. de D.) Sea X una variable aleatoria discreta y sea su Recorrido Rx= {x1, x2,...}. Con cada valor "xo" del recorrido se puede asociar la probabilidad acumulada hasta dicho valor, que se denota como F(xo), y que se define como: F(xo) = P(X xo )

El conjunto de pares ordenados (x, F(x) ) se llama "Función de Distribución" o "Función de distribución acumulada". Estos pares también se pueden graficar. 5.2.5. Ejemplo 1: Sea el experimento E: "lanzar tres monedas y registrar los resultados. Se define la variable aleatoria X: "números de caras obtenidas en el lanzamiento de tres monedas" En la tabla siguiente se presentan sus distribuciones asociadas, de probabilidad o cuantía p(x) y de probabilidades acumuladas o "función de distribución" F(x).

Xi:”Nº Caras” P(xi) F(xi) 0 1/8 1/8 1 3/8 4/8 2 3/8 7/8 3 1/8 8/8

TOTAL 8/8=1

A continuación se presentan los gráficos respectivos:

Page 20: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

17

Gráfico Distribución de Probabilidad

Prob

3/8

2/8

1/8

0 1 2 3X: Nº Caras

Gráfico Función de DistribuciónProb8/8

7/8

6/8

5/84/8

3/8

2/81/8

0 1 2 3X: Nº Caras

Ejemplo 2: Se tiene una bolsa con 10 fichas de las cuales 6 son Azules y 4 son Blancas. Un experimento consiste en seleccionar una muestra de 3 fichas (sin reposición). Se define la variable aleatoria X: "Número de fichas azules seleccionadas en la muestra de 3 fichas" En la tabla siguiente se presentan las funciones de probabilidad y de distribución.

Xi:”Nº Azules” P(xi) F(xi)

0

6 40 3 (1)(4) 4 0,033

10 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

4 0,033

120=

1

6 41 2 (6)(6) 36 0,300

10 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

40 0,333

120=

2

6 42 1 (15)(4) 60 0,50010 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

100 0,833120

=

3

6 43 0 (20)(1) 20 0,167

10 120 1203

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

120 1,000120

=

TOTAL 120 1,000120

=

Page 21: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

18

Ejemplo 3: Se tiene una bolsa con 10 fichas de las cuales 6 son Azules y 4 son Blancas. Un experimento consiste en seleccionar una muestra de 3 fichas con reposición. Se define la variable aleatoria X: "Número de fichas azules seleccionadas en la muestra de 3 fichas"

Este ejemplo es distinto al anterior, por cuanto al ser la selección con reposición, significa que se mantiene constante la cantidad de fichas en cada selección. Por ello también son constantes las probabilidades de seleccionar una ficha Azul o una Blanca. Otra consecuencia de lo anterior, es que cada selección no afecta a las otras, por ello son independientes los resultados obtenidos en la primera extracción de la segunda y de la tercera. Por lo tanto, se puede resumir lo antes indicado en los siguientes resultados: P (Seleccionar ficha Azul) = P(A) = 0,6 P (Seleccionar ficha Blanca) = P(B) = 0,4 El Espacio Muestral es: S = { AAA, AAB, ABA, BAA, ABB, BAB, BBA, BBB } Las probabilidades de cada suceso elemental son: P(AAA) =(0,6)(0,6)(0,6) = (0,6)3 = 0,216 P(AAB) = P(ABA) = P(BAA) = (0,6)(0,6)(0,4) = (0,6)2(0,4) = 0,144 P(ABB) = P(BAB) = P(BBA) = (0,6)(0,4)(0,4) = (0,6)(0,4)2 = 0,096 P(BBB) = (0,4)(0,4)(0,4) = (0,4)3 = 0,064 En la tabla siguiente se presentan las funciones de probabilidad y de distribución de la Variable Aleatoria X: "Nº de fichas Azules seleccionadas"

Xi:”Nº Azules” Sucesos P(xi) F(xi) 0 BBB (0,4)3 = 0,064 0,064 1 ABB, BAB, BBA 3(0,6)(0,4)2 = 3(0,096) = 0,288 0,352 2 AAB, ABA, BAA 3(0,6)2(0,4) = 3(0,144) = 0,432 0,784 3 AAA (0,6)3 = 0,216 1,000

TOTAL 1,000 5.3. PARÁMETROS DE UNA VARIABLE ALEATORIA DISCRETA Se puede caracterizar una variable aleatoria mediante algunas medidas descriptivas, que se denominan PARÁMETROS y que corresponden a medidas POBLACIONALES. Algunos parámetros son: la Esperanza, que caracteriza la posición; la Varianza, que corresponde al parámetro de dispersión. También se considera la Desviación Típica, que es otro parámetro de dispersión, definido como la raíz cuadrada de la Varianza. Finalmente, el Coeficiente de Variación, que es un parámetro de variabilidad relativo. Estos parámetros se pueden obtener a partir de la función de cuantía o probabilidad de la variable aleatoria. ESPERANZA (media o valor esperado) de la v.a. X se define como: µ =E(X)= ∑xip(xi)

VARIANZA de la v.a. x se define como: s2=V(X)= ∑(xi-µ)2p(xi) =∑xi2p(xi) –µ2

DESVIACIÓN ESTÁNDAR de la v.a. X Se define como: s= 2σ

COEFICIENTE DE VARIACIÓN de la v.a. X se define como: CV = σµ

Page 22: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

19

A continuación se presenta el cálculo de la Esperanza y la Varianza de las variables aleatorias de los ejemplos anteriores Ejemplo 1. Sea el experimento E: "lanzar tres monedas y registrar los resultados”. Se define la variable aleatoria X: "números de caras obtenidas en el lanzamiento de tres monedas" En la tabla siguiente se presentan su distribución de probabilidad o cuantía p(x). Se indican los resultados parciales para calcular los parámetros definidos.

Xi:”Nº Caras” p(xi) xip(xi) xi2p(xi)

0 1/8 0 0 1 3/8 3/8 3/8 2 3/8 6/8 12/8 3 1/8 3/8 9/8

TOTAL 1,000 µ= 12/8 24/8 a) Esperanza: µ =E(X)= ∑xip(xi) = 12/8 = 1,5 (caras)

Interpretación: En un lanzamiento de tres monedas se puede obtener 0, 1, 2 ó 3 caras. Si se registra el número de caras que se obtienen en infinitos lanzamientos, el promedio de caras es de 1,5 caras por lanzamiento. b) Varianza: s2 = V(X) = ∑(xi-µ)2p(xi) = ∑xi

2p(xi) –µ2

= 24/8 – (1,5)2 = 3 – 2,25 = 0,75 (caras2) Interpretación: En un lanzamiento de tres monedas se tiene en promedio 1,5 caras. La variabilidad de los resultados obtenidos en infinitos lanzamientos, en torno a 1,5 caras, como promedio de desvíos al cuadrado es de 0,75 caras. c) Desviación Estándar:

s= 2σ = 0,75 = 0,866 (caras) Interpretación: En un lanzamiento de tres monedas se tiene en promedio 1,5 caras. La

variabilidad de los resultados obtenidos en infinitos lanzamientos, en torno a 1,5 caras, como raíz cuadrada del promedio de desvíos al cuadrado es de 0,87 caras.También puede decirse que la raíz cuadrada de la varianza es 0,87 caras.

d) Coeficiente de variación:

CV = σµ

=0,866 0,5771,5

= (57,7%)

Interpretación: En un lanzamiento de tres monedas se tiene una variabilidad, medida por la desviación estándar, de 0,87 caras respecto al promedio 1,5 caras (medido con la esperanza). El valor de la desviación estándar respecto al de la esperanza es de 0,58 veces (o sea, la desviación estándar corresponde al 58% del valor de la esperanza). El Coeficiente de variación no tiene unidad.

Page 23: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

20

Ejemplo 2: Se tiene una bolsa con 10 fichas de las cuales 6 son Azules y 4 son Blancas. Un experimento consiste en seleccionar una muestra de 3 fichas (sin reposición). Se define la variable aleatoria X: "Número de fichas azules seleccionadas en la muestra de 3 fichas". La distribución de probabilidad y otros cálculos se presentan a continuación:

Xi:”Nº Azules”

p(xi) xip(xi) xi2p(xi)

0 4 0,033

120=

(0)(4) 0 0,000120 120

= = (0)(4) 0 0,000120 120

= =

1 36 0,300

120=

(1)(36) 36 0,300120 120

= = (1)(36) 36 0,300

120 120= =

2 60 0,500

120=

(2)(60) 120 1,000120 120

= = (4)(60) 240 2,000

120 120= =

3 20 0,167

120=

(3)(20) 60 0,500120 120

= = (9)(20) 180 1,500

120 120= =

TOTAL 120 1,000120

= µ = ∑xip(xi) = 216 1,800120

= ∑xi2p(xi)=

456 3,800120

=

a) Esperanza: µ = E(X) = ∑xip(xi) = 216/120 = 1,8 (azules)

b) Varianza: s2 = V(X) = ∑(xi-µ)2p(xi) = ∑xi

2p(xi) –µ2

= 456/120 - (1,8)2= 3,80 - 3,24 = 0,56 (azules)2

c) Desviación Estándar:

s= 2σ = 0,56 = 0,748 (azules) d) Coeficiente de Variación

CV = σµ

=0,748

1,8= 0,416 (41,6%)

Ejemplo 3: Se tiene una bolsa con 10 fichas de las cuales 6 son Azules y 4 son Blancas. Un experimento consiste en seleccionar una muestra de 3 fichas (con reposición). Se define la variable aleatoria X: "Número de fichas azules seleccionadas en la muestra de 3 fichas". La distribución de probabilidad y otros cálculos se presentan a continuación:

Xi:”Nº Azules” p(xi) xip(xi) xi2p(xi)

0 0,064 (0)(0,064) = 0 (0)(0,064) = 0 1 0,288 (1)(0,288) = 0,288 (1)(0,288) = 0,288 2 0,432 (2)(0,432) = 0,864 (4)(0,432) = 1,728 3 0,216 (3)(0,216) = 0,648 (9)(0,216) = 1,944

TOTAL 1,000 µ = ∑xip(xi) = 1,800 ∑xi2p(xi) =3,960

Page 24: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

21

a) Esperanza: µ = E(X) = ∑xip(xi) = 1,8 (azules)

b) Varianza: s2 = V(X) = ∑(xi-µ)2p(xi) = ∑xi

2p(xi) –µ2

= 3,96 - (1,8)2= 3,96 - 3,24 = 0,72 (azules)2

c) Desviación Estándar:

s= 2σ = 0,72 = 0,848 (azules) d) Coeficiente de Variación

CV = σµ

=0,8481,8

= 0,471 (47,1%)

5.4. EJERCICIOS 1. a) Indicar la diferencia entre variable aleatoria discreta y continua. b) Indicar diferencia entre función de cuantía y función de densidad. 2. Una bolsa contiene 25 fichas, de las cuales 5 son rojas y 20 son verdes. Se eligen 4 fichas al azar. Se define la v.a. X:"Número de fichas rojas seleccionadas". Determine distribución de probabilidad de X, la función de Distribución de la misma y los gráficos respectivos si: a) La muestra se selecciona sin reposición b) La muestra se selecciona con reposición 3. Se sabe que una moneda, no equilibrada, tiene la particularidad que la cara aparece tres veces más que el sello (o sea P(Cara)=0,75). Si la moneda se lanza tres veces y se define la v.a. X: "Número de caras obtenidas", obtenga la distribución de probabilidad y la función de Distribución de X. 4. a) ¿Qué se entiende por Esperanza o valor esperado? b) ¿Qué se entiende por varianza de una variable aleatoria? d) ¿Cuál es la diferencia entre media aritmética y valor esperado? 5. Se lanza un dado correcto. Se define la v.a. X:"Número de puntos obtenidos". Obtener la distribución de probabilidad. Calcular el valor esperado de X. Interpretar resultado.

6. Se lanzan tres monedas. Se define la v.a. X:"Número de caras obtenidas". Obtener la distribución

de probabilidad. Calcular el valor esperado de X. Calcular varianza. Interpretar resultado. (Resp: =1,5 caras; ,75 caras) 7. Un juego consiste en lanzar tres monedas. Se define la v.a. X:"Número de caras obtenidas". Si

salen 2 o más caras se reciben $2.- Si sale 0 o 1 cara hay que pagar $1.- ¿Cuál es la pérdida o ganancia esperada por juego? (Resp: $ 0,5.-)

Page 25: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

22

k

5.5. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS En algunas situaciones es posible modelar el comportamiento de una variable aleatoria. Los modelos permiten obtener las probabilidades asociadas a un suceso en forma más directa, sin realizar el análisis detallados y complejos que se podría requerir para obtener el espacio muestral y las probabilidades de los sucesos elementales. Para la aplicación de los modelos se requiere verificar el cumplimiento de un conjunto de condiciones, que son los supuestos del mismo. 5.6. DISTRIBUCIÓN BINOMIAL Si se considera un experimento E y un suceso A asociado con el experimento. Suponiendo que la probabilidad de A es P(A)=p y por lo tanto P(Á)=1-p=q. Considerando "n" repeticiones del experimento, el espacio muestral consiste en todas las secuencias {aa, ..., a} en que cada a puede ser A o Á según si ocurre A o no en la i-ésima repetición del experimento. Suponiendo que P(A)p es constante en todas las repeticiones del experimento. Sea la variable aleatoria X definida como "Número de veces que el suceso A ocurre". Se dice que X es una variable aleatoria con distribución BINOMIAL con parámetros "n" y "p". Lo anterior se expresa como: X∼Bin (n; p). Los valores posibles de la v.a. X son 1, 2, 3, ..., n.

La función de cuantía o de probabilidad de la variable aleatoria X está dada por:

P(X=k)= (1 )k nnp p

k−⎛ ⎞

−⎜ ⎟⎝ ⎠

, k=0, 1, 2, …, n

Se puede demostrar que los parámetros de la variable aleatoria XBin (n; p) son: Esperanza: E(X)= µ = np Varianza: V(X)=s2= np(1-p) Ejemplo: Una prueba consiste en 10 ítemes de cinco alternativas cada uno, siendo una sola la correcta. Se define la v.a. X: "Número de respuestas correctas en la prueba" Si la prueba se contesta sin saber, determine la probabilidad de obtener 0 correctas, 1 correcta , a lo menos 1 correcta, o todas correctas. Calcular Esperanza y Varianza. Desarrollo: En este ejemplo se verifican las condiciones de la distribución binomial, pues el número de repeticiones es finito (n=10); la probabilidad de éxito (responder bien) es constante (p=0,2). Luego se cumplen las condiciones para aplicar la fórmula para obtener las probabilidades de la Distribución Binomial. Por lo anterior, X∼Bin (10; 0,2). Las probabilidades

son:

P(Obtener 0 resp correctas)= P(X=0)= (0,2)100

⎛ ⎞⎜ ⎟⎝ ⎠

0(0,8)10=0,1074

P(Obtener 1 resp correctas)= P(X=1)= (0,2)101

⎛ ⎞⎜ ⎟⎝ ⎠

1(0,8)9=0,2684

P(A lo más 1 resp. correcta)= P(X=0)+(X=1) = 0,1074 + 0,2684 = 0,3758

P(Obtener 10 resp correctas)= P(X=10) = (0,2)1010⎛ ⎞⎜ ⎟⎝ ⎠

10(0,8)0 = 0,00004

Page 26: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

23

Parámetros de la distribución: Esperanza: E(X)= µ = np =10(0,2) = 2 correctas Varianza: V(X)=s2= np(1-p) =10(0,2)(0,8) = 1,6 correctas2

Desviación Estándar: s= 2σ = 1,6 = 1,26 (correctas) Interpretación: Los resultados anteriores señalan que al aplicar la prueba de 10 ítems muchas veces (a

un individuo o a muchos simultáneamente) y si responden sin saber, el número de aciertos que pude tener un individuo podría variar entre o y 10, pero el promedio de tales aciertos es de 2 respuestas correctas por persona. La variabilidad de tales respuestas es de 1,26 respuestas correctas por individuo (empleando la Desv. Estándar).

Los resultados anteriores modelan el comportamiento de los resultados de la situación para muchas (en verdad, infinitas) realizaciones del experimento de aplicar la prueba en las mismas condiciones. Si sólo se realiza el experimento una cantidad determinada de veces (por ejemplo 100 o 1000) se obtiene una “distribución de frecuencias” del número de correctas observados y cuyos valores de frecuencias relativas, media aritmética y desviación estándar puede ser parecidos a los de probabilidades, esperanza y desv. Estándar antes calculados.

5.7. DISTRIBUCIÓN HIPERGEÓMÉTRICA Se tiene un lote de N fichas, r de las cuales son azules y (N-r) son blancas. Suponiendo que se seleccionan al azar n fichas (n N) SIN REPOSICIÓN. Se define la variable

aleatoria X: "Número de fichas azules seleccionadas". Siendo que X=k coresponderá a seleccionar k fichas azules de entre las r azules disponibles y (n-r) blanca de entre las (N-r) blancas existentes, se tiene:

P(X=k)=

r N rk n k

Nn

−⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟−⎝ ⎠⎝ ⎠

⎛ ⎞⎜ ⎟⎝ ⎠

para k=0,1,2,3,…,r

Se puede demostrar que los parámetros de la variable aleatoria X distribuída como Hipergeométrica son: Esperanza: E(X)= µ = np siendo p=r/N; q=1-p

Varianza: V(X) 2 (1 )( )1

np p N nN

σ − −= =

− i

Ejemplo: Un grupo de 15 alumnos se compone de 8 mujeres y 7 hombres. Si se desea formar un grupo de trabajo de 5 alumnos. Se define la variable aleatoria X: "Número de mujeres seleccionadas". Calcular: a) La probabilidad que el grupo se componga por 3 mujeres b) La probabilidad que el grupo a lo menos se componga de 3 mujeres c) La cantidad esperada de mujeres así como la varianza del número de mujeres, la desviación estándar y el coeficiente de variación. Desarrollo: Según las condiciones, se hace la selección sin reposición. La variable aleatoria tiene distribución Hipergeométrica siendo N=15; n=5; r=8

Page 27: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

24

a)

P(X=3) =

8 73 2 (56)(21) 1.176 0,3916

15 3.003 3.0035

⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ = = =⎛ ⎞⎜ ⎟⎝ ⎠

(39,16%)

b) P(X 3) = P(X=3)+P(X=4)+P(x=5)=

8 7 8 7 8 73 2 4 1 5 0

15 15 155 5 5

⎛ ⎞⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎝ ⎠+ + =⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠

(56)(21) (70)(7) (56)(1)3.003 3.003 3.003

+ + =

1.176 490 56 0,3916 0,1632 0,0186 0,57343.003 3.003 3.003

= + + = + + = (57,3%)

C) ESPERANZA:

Siendo p=8/15 = 0,533; q= 1-p = 7/15 = 0,467

E(X) = µ=(5)(8) (5)(0,533)

15= = 2,67 mujeres

VARIANZA:

V(X) = 2σ =8 7 15 55 (5)(0,533)(0,467)(0,714)

15 15 15 1−⎛ ⎞⎛ ⎞⎛ ⎞ = =⎜ ⎟⎜ ⎟⎜ ⎟−⎝ ⎠⎝ ⎠⎝ ⎠

0,889 (mujeres)2

DESVIACIÓN ESTÁNDAR: 0,889σ = = 0,943 mujeres COEFICIENTE DE VARIACIÓN

CV= 0,9432,67

= 0,353 (35,3%)

5.8. EJERCICIOS 1. Suponga que el 10% de los pacientes que reciben un tratamiento tienen un efecto secundario. De un grupo de 10 pacientes, determine la probabilidad que: a) A lo más 2 tengan efectos secundarios (Resp: 0,9298) b) Exactamente 3 tengan efectos secundarios (Resp: 0,0574) c) Entre 3 y 4 tengan efectos secundarios (Resp: 0,0686) d) La esperanza de pacientes con efectos secundarios (Resp: 1 paciente) 2. Una escala tiene cinco respuestas (Muy en desacuerdo, en desacuerdo, indiferente, de acuerdo, muy de acuerdo). Si cada respuesta tiene la misma posibilidad, determine la probabilidad que en una escala con 10 aseveraciones se obtengan: a) Exactamente 5 respuestas "De acuerdo" (Resp: 0,0264) b) A lo menos 8 respuestas "De acuerdo" (Resp: 0,0001) c) Entre 6 y 8 respuestas "De acuerdo" (Resp: 0,0064) d) la esperanza de respuestas "De acuerdo" (Resp: 2 respuestas) 3. Explicar en que circunstancia se aplica la distribución hipergeométrica en vez de la binomial. 4. Se sospecha que de 15 declaraciones de salud hay 10 que contienen omisiones. Se decide revisar 5 de éstas. Calcular la probabilidad que: a) Las 5 tengan omisiones b) Entre 3 y 4 tengan omisiones c) por lo menos 3 tengan omisiones (Resp: 2502/3003 ) c) El valor esperado de declaraciones con omisiones (Resp: 3,3 declarac.)

Page 28: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

25

6. VARIABLE ALEATORIA UNIDIMENSIONALCONTINUA (v.a.c.) 6.1. DEFINICIONES

Función de Densidad

Se define a X como "variable aleatoria continua" (v.a.c.) si existe una función "f", denominada "función de densidad" que satisface las condiciones siguientes: a) f(x)≥ 0 para todo x (La función es no negativa para los valores de )

b) 1xdx+∞

−∞=∫ (El área total encerrada por la función y el eje X es igual a 1)

c) P(a≤X≤b) = b

axdx∫ (La probabilidad, en un intervalo, se define como el área

encerrada por la función y el eje X entre los puntos definidos por X=a y X=b) Observaciones: - La función de densidad permite describir la "forma" de la variable aleatoria, pero por si

sola no permite obtener probabilidades. - La probabilidad corresponde al área encerrada entre dos puntos. Por ello, la

probabilidad en un punto es igual a 0, esto es P(a≤X≤a) = 0. - Por lo anterior, son equivalentes expresiones como las siguientes: P(a≤X≤b) = P(a≤X<b) = P(a<X≤b) = P(a<X<b) 6.1.2. Función de Distribución (F. de D.)

Sea una variable aleatoria continua. Con cada valor " x0" del recorrido se puede asociar la probabilidad acumulada hasta dicho valor, que se denota como F(x0), y que se define como

F(xo) = P(X≤xo) = 0xxdx

−∞∫ (Área encerrada por la función desde hasta X=x0)

El conjunto de pares ordenados (x, F(x) ) se llama "Función de Distribución" o "Función de Probabilidad acumulada". 6.1.3. Parámetros de una Variable Aleatoria Continua Se definen los mismos parámetros y con el mismo significado que para una variable aleatoria discreta, esto es, Esperanza, Varianza, Desviación Estándar. Como sus fórmulas escapan al alcance del curso no se indican. Ejemplo

Una variable aleatoria X tiene función de densidad definida por 2( )25xf x = para 0≤X≤5

a) Comprobar que es una función de densidad. b) Calcular P(2≤X≤4) Desarrollo: El gráfico de esta función es un recta definida entre X=0 y X=5. a) Para comprobar que esta función cumple las condiciones indicadas, considerar lo

siguiente: el área total definida por la función f(x) y el eje X entre X=0 y entre X=5 es el área de un triángulo rectángulo, cuyos catetos son 5 y 10/25. (Este último valor se obtiene al reemplazar X por 5 en ecuación f(x)=(2x)/25 ).

Page 29: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

26

El área del triángulo rectángulo corresponde a la mitad del producto de los catetos,

esto es: 1 (5)(10) 50 12 25 50

AREA = = =

b) Para obtener la probabilidad entre 2 y 4, se puede calcular como la diferencia de las áreas de dos triángulos rectángulos. El triángulo mayor tiene catetos 4 y 8/25 y su área es 16/25. El triángulo menor tiene catetos 2 y 4/25 y su área es 4/25. Por lo tanto, el área comprendida entre X=2 y X=4 es la diferencia entre las áreas 16/25 y 4/25 esto es 12/25.

f(x) Gráfico Función de Densidad

10/25

9/25

8/25

7/25

6/25

5/25

4/25

3/25

2/25

1/25

0 1 2 3 4 5Variable X

Esta área es la probabilidad P(2<X<4)

6.2. DISTRIBUCIÓN NORMAL Existen muchas distribuciones de probabilidad continuas que sirven para modelar el comportamiento de diversas variables que se emplean en la práctica. Una de las más importante es la denominada Distribución Normal. 6.2.1. Función de densidad de la Distribución NormaL Una variable aleatoria X asumiendo todos los valores reales entre tiene Distribución Normal si su función de densidad f(x) está dada por :

2121( )

2

X

f x eµ

σ

σ π

−⎛ ⎞− ⎜ ⎟⎝ ⎠= siendo -∞ < µ < +∞ ; σ > 0

6.2.2. Características de la Distribución Normal a) El parámetro µ corresponde a la Esperanza (o Media Poblacional) de la distribución. b) El parámetro σ corresponde a la Desviación Estándar de la distribución

c) Se puede considerar al parámetro σ2 que es la Varianza de la distribución.

d) Si la v.a.c. X tiene Distribución Normal se emplea la notación X∼N(µ; σ2)

e) En la Distribución Normal la Esperanza, la Mediana y la Moda tienen el mismo valor f) El sesgo de esta distribución y la curtosis valen cero.

Page 30: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

27

g) La distribución normal tiene forma de campana y es simétrica respecto a su Esperanza h) Las colas de la distribución se aproximan al eje X a medida que se aleja de la

esperanza, pero sin llegar a tocar dicho eje. Se dice que la curva tiende "asintóticamente" al eje X.

6.2.3. Importancia de la Distribución Normal a) Muchas pruebas (test o dócimas) estadísticas que se estudiarán suponen que los datos

que se emplean provienen de variables que tienen una Distribución Normal. Estas son las llanmadas "Pruebas Parámetricas". Hay muchas otras pruebas que no suponen que los datos provienen de variables con distribución Normal, son las denominadas "Pruebas No Paramétricas".

b) Cuando los datos siguen una distribución Normal, la media y la varianza son

independientes (una no depende de la otra) lo que no es cierto en otros casos. c) Los resultados provenientes de variables asociadas con muchos fenómenos naturales

(peso, estatura, presión sanguínea, etc.) siguen aproximadamente la Distribución Normal.

d) Para cualquier distribución de datos, si se seleccionan muchísimas muestras de un

tamaño fijo y "razonable" y se calcula la media aritmética de cada una de las muestras, el conjunto de tales medias aritméticas tiene siempre una Distribución Normal (Distribución de la media aritmética en el muestreo). Lo importante del resultado anterior, conocido como Teorema Central del Límite, es que no importando cual es la distribución de los datos, la distribución de las medias aritméticas siempre será Normal.

6.2.4. Distribución Normal Estandarizada ( Z∼N(0;1) )

Existen infinitas distribuciones normales, las que se obtienen asignando valores a los parámetros µ y σ. Un caso especial es la denominada "Distribución Normal Estandarizada"

que es aquella de parámetros µ=0 y σ=1. Se emplea la variable Z para distinguirla y su

función de densidad esta dada por.

( )21

21( )2

Zf x e

π−

=

La Función de Distribución (probabilidades acumuladas) de la distribución Normal Estandarizada, que se designa como φ(Z), se ha tabulado, lo que permite calcular

probabilidades de intervalos de valores de la variable Z en forma simple, por diferencia de valores de φ(Z). Por lo tanto:

P(a≤X≤b)= φ(b) - φ(a)

6.2.5. Tabla de la Función de Distribución Normal Estandarizada La Tabla de la Función de Distribución de la Normal Estandarizada (Ver Apéndice de Tablas) presenta los valores de las probabilidades acumuladas desde Z=3,90 hasta Z= 3,90, en dos páginas, una para los valores negativos de Z (desde z=3,90 hasta Z=0) y otra para los valores positivos de Z (desde Z=0 hasta Z= 3,90). En la primera columna (señalada con Z) se presentan los valores de Z con un decimal. En las columnas siguientes se presenta el segundo decimal (0 a 9). En el cuerpo de la tabla se presentan los valores de las probabilidades acumuladas.

Page 31: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

28

Así, para determinar la probabilidad acumulada hasta 1,96 (esto es φ(1,96)) se ubica la

fila del valor 1,9 en columna Z en la página de valores positivos. En esa fila, se sigue la lectura hasta la columna 6. En la intersección de fila 1,9 y columna 6 se encuentra el valor 0,9750, que es la probabilidad acumulada buscada. Por lo tanto, φ(1,96) = 0,9750

6.2.6. Ejemplos de Uso de Tabla de la Función de Distribución Normal Estandarizada a) Uso directo de la tabla φ(Z)

P(Z<1,68) = P(Z≤1,68)= φ(1,68) = 0,9535

P(Z<-0,50) = P(Z≤-0,50) = φ(0,50) = 0,3085

b) Uso para calcular probabilidades complementarias P(Z>1,68) = P(Z≥1,68)=1- φ(1,68) =1 - 0,9535 = 0,0465

P(Z>-0,50) = P(Z≥-0,50) =1 - φ(-0,50) =1 - 0,3085 = 0,6915

c) Uso para calcular probabilidades en un intervalo P(-0,50 ≤ X ≤ 1,68) = P(-0,50<X<1,68) = = φ(1,68) – φ(0,50) = 0,9535 - 0,3085 = 0,6450

P(-1,96 ≤ X ≤ 1,96) = P(-1,96 < X < 1,96) = = φ(1,96) - φ(1,96)= 0,9750 - 0,0250 = 0,9500

6.2.7. Estandarización De Una Distribución Normal Cualquiera La distribución Normal Estandarizada es importante pues cualquier Distribución Normal se puede llevar a ella mediante una transformación de la respectiva variable. Esta propiedad permite emplear la Tabla de la Función de Distribución de la Normal Estandarizada para obtener probabilidades de cualquier distribución normal. El enunciado siguiente expresa la estandarización:

Si una variable aleatoria X tiene distribución Normal de parámetros µ y σ2 (esto es

X∼N(µ, σ2) ) si se transforma la variable X definiéndose XZ µσ−

= entonces Z∼N(0,1)

Ejemplo 1:

Se aplicó una prueba de psicomotricidad a 300 estudiantes de Primer Año Básico. Los rendimientos (R) se supone que tienen distribución Normal con Esperanza µ=100 puntos y Varianza σ2= 225 puntos2 (luego σ=15 ptos) esto es R∼N(100; 225).

a) Si se selecciona un alumno, determine la probabilidad que su rendimiento sea inferior a 110 puntos.

b) Si se selecciona un alumno, determine la probabilidad que su rendimiento sea superior a 95 puntos.

c) Si se selecciona un alumno, determine la probabilidad que su rendimiento se encuentre entre 95 y 110 puntos.

d) Determine la cantidad estimada de alumnos con rendimientos inferiores a 110 puntos; con rendimientos superiores a 95 puntos y con rendimientos entre 95 y 110 puntos.

Page 32: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

29

Desarrollo: Para calcular las probabilidades se estandariza la variable aleatoria “Rendimiento” (R) mediante la transformación: Z=(R-100)/15 . El cálculo de las probabilidades se realiza de la siguiente forma:

a) ( 100) (110 100) 10( 110) ( )

15 15 15RP R P P Z− −⎛ ⎞< = < = <⎜ ⎟

⎝ ⎠=

= P(Z<0,67)= φ(0,67)=0,7486 (74,86%)

b) ( 100) (95 100) 5( 95) ( )

15 15 15RP R P P Z− −⎛ ⎞> = > = > −⎜ ⎟

⎝ ⎠=

= P(Z>0,33)=1 - φ(-0,33)= 1 - 0,3707 = 0,6293 (62,93%)

c) (95 100) ( 100) (110 100) 5 10(95 110) ( )

15 15 15 15 15RP R P P Z− − −⎛ ⎞< < = < < = − < < =⎜ ⎟

⎝ ⎠

=P(-0,33 < Z <0,67)= φ(0,67) - φ(-0,33)=0,7486 - 0,3707=0,3779 (37,8%)

d) - La cantidad estimada de alumnos con rendimientos inferiores a 110 puntos

se obtiene multiplicando el número de alumnos que rindió la prueba (300) por la probabilidad de obtener menos de 110 puntos en la prueba, luego, la cantidad estimada es:

n= (300)P(R<110) = (300)(0,7486) = 224,58 = 225 alumnos - La cantidad estimada de alumnos con rendimientos mayores a 95 puntos es: n=(300)P(R>95) = (300)(0,6293) = 188,79 = 189 alumnos. - La cantidad estimada de alumnos con rendimientos entre 95 y 110 puntos es: n=(300)P(95<R<110) = (300)(0,3779) = 113.37 = 114 alumnos. Ejemplo 2: (Datos de Apuntes Est. Descriptiva)

Las estaturas (A) de un grupo de 40 estudiantes se supone que tienen distribución Normal con Esperanza 146,8 cm y Desv. Estándar 13,33 cm (o sea Varianza 177,7 cm). Lo anterior se sintetiza en la expresión A∼N(146,8; 177,7).

a) Si se selecciona un alumno, determine la probabilidad que su estatura sea inferior a 155 cm.

b) Si se selecciona un alumno, determine la probabilidad que su estatura se encuentre entre 143 y 152 cm.

c) Determine la cantidad estimada de alumnos con estaturas inferiores a 155 cm y con estaturas entre 143 y 152 cm.

d) Compare sus estimaciones sobre el número de alumnos con los valores exactos empleando los datos de estaturas usados en ejemplo de Estadística Descriptiva.

Desarrollo: Para calcular las probabilidades se estandariza la variable estatura (A) mediante la transformación: Z=(A - 146,8)/13,33 . El cálculo de las probabilidades es el siguiente.

a) ( 146,8) (155 146,8) 8, 2( 155) ( )

13,33 13,33 13,33AP A P P Z− −⎛ ⎞

< = < = <⎜ ⎟⎝ ⎠

=

P(Z<0,62)= φ(0,62)=0,7324 (73,24%)

b) (143 146,8) ( 146,8) (152 146,8) 3,8 5,2(143 152) ( )

13,33 13,33 13,33 13,33 13,33AP A P P Z− − −⎛ ⎞< < = < < = − < =⎜ ⎟

⎝ ⎠

=P(-0,29 < Z <0,39)=φ(0,39) - φ(-0,29)= 0,6517 - 0,3859 = 0,2658 (26,6%)

Page 33: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

30

c) - La cantidad estimada de alumnos con estaturas inferiores a 155 cm se

obtiene multiplicando el número de alumnos del grupo (40) por la probabilidad de tener menos de 155 cm de estatura, luego, la cantidad estimada es:

n= (40)P(A<155) = (40)(0,7324) = 29,3 = 30 alumnos - La cantidad estimada de alumnos con estaturas entre 143 y 152 cm es: n=(40)P(143 <A <52)= (40)(0,2658) = 10,6 = 11 alumnos.

d) Los datos reales del ejemplo de Estadística Descriptiva, ordenados, son: 116 125 126 128 132 135 135 135 136 138 138 140 140 142 142

144 144 145 145 146 146 147 147 148 149 150 150 152 153 154 156 157 158 161 163 164 165 168 173 178

- La cantidad efectiva de alumnos con estaturas inferiores a 155 cm es de 30 alumnos. - La cantidad efectiva de alumnos con estaturas entre 143 y 152 cm de estatura es de 13 alumnos. - En resumen, las estimaciones son bastante buenas. por lo tanto, la Distribución Normal ( o el supuesto de normalidad) parece adecuado para estos datos.

6.2.8. Uso de Puntajes Estandarizados Para Comparar Distribuciones Los puntajes estandarizados o "Puntajes Típificados" permiten comparar resultados obtenidos en distribuciones que pueden diferir en sus valores medios o en sus desviaciones estándar. Si además se puede suponer que los resultados se distribuyen normalmente, entonces se pueden estimar los percentiles asociados con un resultado particular. a) Comparación de Resultados Se tiene información de dos escalas para evaluar la depresión: a) El inventario de Beck de la depresión (IBD), que tiene un recorrido de 0 a 63 puntos con una media de 11,3 puntos y una desviación estándar de 7,7 puntos; b) La escala de autoevaluación de la depresión (EAD), de Zung, con un recorrido entre 25 y 100 puntos con una media de 52,1 puntos y una desviación estándar de 10,5.

Si Pedro fue evaluado con la escala IBD y obtuvo un resultado 23 y Angela fue evaluada con la escala EAD obteniendo un resultado de 58 puntos, ¿Cuál de las dos tiene un mayor nivel de depresión?

Desarrollo: Estandarizando los resultados anteriores se tiene: Para Pedro (escala IBD): Z= (23,0 - 11,3)/7,71 =1,7/7,7= 1,52 Para Angela (escala EAD): Z=(58,0 - 52,1)/10,5 = 5,9/10,5 = 0,56

Según los resultados anteriores, Pedro tendría un mayor nivel de depresión pues el valor Z respectivo es mayor.

b) Estimación de Percentiles Si se supone que los resultados de las escalas de depresión se distribuyen normalmente, entonces se puede emplear la Tabla de la Función de Distribución de la Normal Estandarizada para estimar los percentiles asociados.

Page 34: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

31

Desarrollo: Para Pedro (escala IBD): P(Z<1,52)= φ(1,52) = 0,9357 esto es , percentil 93,6

Para Angela (escala EAD): P(Z<0,56)= φ(0,56) = 0,7123 esto es , percentil 71,2

Según los resultados, Pedro supera al 93,6% del grupo de referencia en la escala Beck, mientras Angela supera al 71,2% de su grupo en la escala EAD. Por lo tanto, Pedro tiene un nivel mayor de depresión que Angela.

6.2.9. Puntajes Estandarizados y Escalas Derivadas Como se ha podido apreciar, los puntajes estandarizados se expresan como decimales positivos o negativos. Con el objeto de lograr escalas de referencia expresadas en valores enteros positivos, se realizan transformaciones de los puntajes Z con este objetivo. La expresión general para expresar los puntaje originales de una escala X, que tiene una Esperanza µ y una Desviación estándar σ, en otra escala P con una media M y una

desviación típica D es la siguiente:

P = D(X µσ−

) + M o más abreviado

P = D(Z) + M Una escala importante es la escala T con media M=50 y desviación estándar D=10. En este caso la transfiormación es: T = 10(Z) + 50 Ejemplo: Los puntajes T para Pedro y Angela, del ejemplo anterior, serían: Pedro: Z=1,52 T=10(1,52)+50 = 65,2 Angela: Z= 0,56 T=10(0,56)+50 = 55,6 Nuevamente, el mayor puntaje T de Pedro indica un mayor nivel de depresión. 6.3. EJERCICIOS 1. En una prueba, los resultados se supone que tienen distribución normal con Esperanza

(o media) de 26,1 puntos y desviación típica de 10,7 puntos. a) Determine los puntajes Z que corresponden a los puntajes brutos 5, 18; 30; 39;

46 y 51 puntos. b) Estime los percentiles correspondientes a los puntajes brutos anteriores. c) Indique los puntajes T correspondientes a los puntajes brutos indicados.

2. Los siguientes son los resultados obtenidos por 130 estudiantes en el Minnesota Paper-

Form Board Test (M):

PUNTAJES ALUMNOS 27 - 32 16 33 - 38 28 39 - 44 28 45 - 50 34 51 - 56 18 57 - 62 6

Page 35: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

32

a) Suponiendo que los puntajes tienen distribución normal, obtenga los puntajes Z correspondientes a los puntajes brutos 28, 40 y 60.

b) Determine los puntajes T correspondientes a los puntajes brutos anteriores. c) Usando el supuesto de normalidad de los puntajes, estime el número de casos

con puntajes M<28; M<40 y M<60 3. Los resultados del curso en tres asignaturas se indican a continuación así como los

obtenidos por la alumna Maria en dichas asignaturas:

EXAMEN MEDIA DESV. EST. Nº ALUMNOS CALIF. MARIA ALGEBRA 48 12,1 65 44 FISICA 40 8,3 48 30 INGLÉS 80 15,2 39 108

a) Suponiendo que los resultados siguen una distribución normal, indique en que

asignatura tiene María un mejor rendimiento relativo: b) Indique el percentil que ocupa María en cada asignatura

c) Indique cuantos alumnos superan a María en puntaje, en cada asignatura. 6.4. OTRAS DISTRIBUCIONES CONTINUAS Existen muchas variables aleatorias continuas que son empleadas en Estadística, para modelar diversas situaciones o fenómenos. De las más importantes se han tabulado sus funciones de distribución para facilitar el empleo de probabilidades asociadas a ella. A continuación se presentan algunas de éstas. No se indican las funciones de densidad por no ser de interés si no sus características generales y como se emplean las tablas de las funciones de distribución respectivas. 6.4.1. Distribución "T" (de Student) Una variable aleatoria continua "t" que tiene una función de densidad correspondiente a la "Distibución t", graficamente también tiene forma de campana y se parece a la Normal pues también es simétrica y está centrada en 0. Sin embargo, esta distribución depende de un parámetro denomina do "grados de libertad" (gl) el cual está asociado generalmente con el número de datos de la muestra. Por lo tanto, existen muchas distribuciones "t", pero no existe una que puede representar a las otras (como ocurre con la Normal Estándarizada que puede representar a las infintas normales). Por lo antes indicado, se debería representar cada distribución "t" por separado. Por ello, si se repitiera el trabajo de calcular las probabilidades para cada valor de la variable (como se hizo para la Normal estandarizada) se generaría una tabla para cada valor del parámetro "gl". Así, habría una tabla para gl=1; otra para gl=2; otra par gl=3 etc. El resultado sería un libro de tablas. Para simplificar la presentación de estas múltiple tablas, se han tomado algunos valores de probabilidades que se emplean regularmente en Estadística (0,05; 0,01; etc) y se ha confeccionado una tabla de resumen con ellos empleando los valores de la variable que se asocian con esas probabilidades en cada distribución "t". Esa tabla de resumen es la "Tabla de la Función de Distribución de la Distribución "t" la cual tiene en su encabezado los valores de probabilidades destacados (0,60; 0,70;...; 0,90; 0,95; 0,975; 0,99; 0,995 etc). En la columna matriz, se presentan los diversos valores de los grados de libertad: 1;2;3;.....; 140, 180; 200; infinito. En el cuerpo de la tabla, se entregan los valores de la variable "t" (que tiene la distribución "t") correspondiente a los grados de libertad "gl" y para un área o probabilidad indicados.

Page 36: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

33

Así por ejemplo, si se desea determinar el valor una v.a. "t" con 20 g.l. y que acumula una probabilidad (o área ) del 95%, habrá que ubicar el valor en la intersección de la fila para gl=20 y la columna para probabilidad igual a 0,95. Allí se encuentra el valor t=1,7247. Lo anterior se expresa en forma más abreviada como:

t(0,95;20)=1,7247 (o también t(20; 0,95)=1,7247 ) 6.4.2 Distribución Ji-Cuadrado (χ2)

Una v.a. continua "χ2" que tiene una función de densidad correspondiente a la

"Distibución χ2", gráficamente no es simétrica y está definida sólo para valores positivos de la

variable. Sin embargo, esta distribución depende de un parámetro denominado "grados de libertad" (gl). En forma análoga a lo señalado para la distribución "t", la tabla "Tabla de la Función de Distribución de la Distribución "presenta la misma estructura de la anterior. En el encabezado se presentan los valores de probabilidades destacados (0,005; 0,01; 0,025; 0,05;...; 0,90; 0,95; 0,975; 0,99; 0,995). En la columna matriz, se presentan los diversos valores de los grados de libertad: 1;2;3;... 44; 45. En el cuerpo de la tabla, se entregan los valores de la variable "χ2" (que tiene la distribución "χ2") correspondiente a los grados de libertad "gl" y

para un área o probabilidad indicados. Así por ejemplo, si se desea determinar el valor una v.a. "χ2" con 20 g.l. y que

acumula una probabilidad (o área ) del 97,5%, habrá que ubicar el valor en la intersección de la fila para gl=20 y la columna para probabilidad igual a 0,975. Allí se encuentra el valor =34,17. Lo anterior se expresa en forma más abreviada como:

χ2 (0,975;20)=34,17 (o también χ2 (20; 0,975)=34,17 )

6.4.3. Distribución F (de Fisher) Una v.a. continua "F" que tiene una función de densidad correspondiente a la "Distibución F", graficamente no es simétrica y está definida sólo para valores positivos de la variable. Sin embargo, esta distribución depende de dos parámetros "grados de libertad (g.l.)" que suelen denominarse "g.l. del denominador" y "g.l. del denominador" pues esta distribución está generalmente asociada con cuocientes de varianzas. Por lo anterior, la tabla de resumen de las múltiples distribuciones "F" permite presentar sólo algunos valores de probabilidad (0,95; 0,99), los que se indican en el título de la tabla (como niveles de significación del 5% o del 1% respectivamente). En el encabezado y columna matriz se ubican los grados de libertad. Así por ejemplo, si se desea determinar el valor una v.a. "F" con 20 "g.l. en el numerador" y 10 "g.l. del denominador" que acumula una probabilidad (o área) del 95% (o nivel de significación del 5%), habrá que ubicar la página para el nivel del significación del 5% y en ella, el valor de F en la intersección de la columna para gl=20 y la fila para gl=10 probabilidad. El valor es F=2,77. Lo anterior se expresa en forma más abreviada como:

F(0,95; 10; 20) = 2,77 (o también F(10; 20; 0,95)=2,77)

Page 37: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

34

7. DISTRIBUCIONES MUESTRALES En el área de la Estadística que corresponde a Inferencia interesa conocer el comportamiento de las estadísticas (como media aritmética, varianza, proporción etc.) calculadas de cada una de las muestras seleccionadas de una población, pues a partir de una de ellas se pretende estimar las características desconocidas de dicha población. 7.1. MUESTRA ALEATORIA Dada una población de N elementos, una muestra es un subconjunto de n elementos seleccionados desde una población. La selección puede ser con reemplazo o sin reemplazo. En el primer caso, una unidad seleccionada puede serlo nuevamente. En el segundo caso, ello no es posible. Por ejemplo, la población podría estar constituida por todos los alumnos de una carrera y una muestra podría ser un grupo de 10 alumnos de dicha carrera. Una característica importante de la selección de las muestras es que sea aleatoria, esto es, no intencional. Para lograr esto se podría identificar (p.ej. numerar) cada elemento de la población y luego poner esa identificación (p.ej. papelitos con los números) en una tómbola y seleccionar la muestra desde ahí. En general, para la selección de muestras se reemplaza el procedimiento anterior mediante el empleo de "números aleatorios" que ser pueden encontrar en tablas o se pueden obtener desde una calculadora (rutina RAN) o en un software estadístico. 7.2. PARÁMETROS Y ESTADÍSTICAS En la población asociada con un estudio usualmente interesan variables susceptibles de ser medidas en los elementos que la componen. Por ejemplo, en la población de estudiantes de una carrera de la universidad una variable de interés podría ser la edad. Otras podrían ser el resultado de una prueba en una asignatura o las opiniones sobre la carrera. Las variables en la población se supone que tiene características fijas, que no cambian, denominadas PARÁMETROS, como ser: Media Poblacional (o Esperanza), Varianza, Desviación estándar etc. Los "parámetros" se designarán habitualmente con letras griegas o mayúsculas. Así, la edad media de los alumnos de la carrera, o la varianza de las edades permiten caracterizar la población. Dichos valores no cambian. De las diferentes muestras que se pueden seleccionar de la población, también se pueden medir las variables de interés. Las medidas de resumen se denominan ESTADÍSTICAS, como ser, media aritmética, varianza, desviación estándar etc. Estas medidas son variables, pues en las distintas muestras seleccionadas de la población se pueden obtener diversos valores para las estadísticas. Por ejemplo, la media aritmética de las edades será distinta en las diferentes muestras. Lo mismo ocurrirá con la varianza o la desviación estándar. 7.3. DISTRIBUCIONES EN EL MUESTREO La "Distribución en el Muestreo" es el estudio del comportamiento que tiene una Estadística de una variable, p. ej. la media aritmética, cuando se calcula para todas las muestras posibles seleccionadas de una población determinada. Así existe la "Distribución en el Muestreo de la Media Aritmética". También se puede considerar la "Distribución en el Muestreo de la Varianza" o la "Distribución en el Muestreo de la Mediana" etc. Ejemplo (Edades de 4 niños) En la página siguiente se presentan las distribuciones en el muestreo de la Media Aritmética, la Mediana y la varianza muestral de muestras de tamaño 3, con reemplazo, seleccionadas de una “población” de edades de 4 niños con valores 5, 7, 8 y 10 años. Los valores poblacionales son µ= 7,5 años; σ2 = 3,25 años2 y Mediana es 7,5 años.

Page 38: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

35

Distribuciones en el muestreo de Media Aritmética, Mediana y Varianza Muestral

MUESTRA MEDIA MEDIANA VAR. MUEST.5 5 5 5,00 5,00 0,005 5 7 5,67 5,00 1,335 5 8 6,00 5,00 3,005 5 10 6,67 5,00 8,335 7 5 5,67 5,00 1,335 7 7 6,33 7,00 1,335 7 8 6,67 7,00 2,335 7 10 7,33 7,00 6,335 8 5 6,00 5,00 3,005 8 7 6,67 7,00 2,335 8 8 7,00 8,00 3,005 8 10 7,67 8,00 6,335 10 5 6,67 5,00 8,335 10 7 7,33 7,00 6,335 10 8 7,67 8,00 6,335 10 10 8,33 10,00 8,337 5 5 5,67 5,00 1,337 5 7 6,33 7,00 1,337 5 8 6,67 7,00 2,337 5 10 7,33 7,00 6,337 7 5 6,33 7,00 1,337 7 7 7,00 7,00 0,007 7 8 7,33 7,00 0,337 7 10 8,00 7,00 3,007 8 5 6,67 7,00 2,337 8 7 7,33 7,00 0,337 8 8 7,67 8,00 0,337 8 10 8,33 8,00 2,337 10 5 7,33 7,00 6,337 10 7 8,00 7,00 3,007 10 8 8,33 8,00 2,337 10 10 9,00 10,00 3,008 5 5 6,00 5,00 3,008 5 7 6,67 7,00 2,338 5 8 7,00 8,00 3,008 5 10 7,67 8,00 6,338 7 5 6,67 7,00 2,338 7 7 7,33 7,00 0,338 7 8 7,67 8,00 0,338 7 10 8,33 8,00 2,338 8 5 7,00 8,00 3,008 8 7 7,67 8,00 0,338 8 8 8,00 8,00 0,008 8 10 8,67 8,00 1,338 10 5 7,67 8,00 6,338 10 7 8,33 8,00 2,338 10 8 8,67 8,00 1,338 10 10 9,33 10,00 1,33

10 5 5 6,67 5,00 8,3310 5 7 7,33 7,00 6,3310 5 8 7,67 8,00 6,3310 5 10 8,33 10,00 8,3310 7 5 7,33 7,00 6,3310 7 7 8,00 7,00 3,0010 7 8 8,33 8,00 2,3310 7 10 9,00 10,00 3,0010 8 5 7,67 8,00 6,3310 8 7 8,33 8,00 2,3310 8 8 8,67 8,00 1,3310 8 10 9,33 10,00 1,3310 10 5 8,33 10,00 8,3310 10 7 9,00 10,00 3,0010 10 8 9,33 10,00 1,3310 10 10 10,00 10,00 0,00

ESPERANZA 7,500 7,500 3,250VARIANZA 1,083 2,125 6,521

Page 39: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

36

7.4. DISTRIBUCIÓN EN EL MUESTREO DE LA MEDIA ARITMÉTICA El estudio de la "Distribución en el Muestreo de la Media Aritmética" es particularmente interesante. Los resultados de dicho estudio se sintetizan en el importante "Teorema del Límite Central", que establece (simplificadamente) lo siguiente:

"Dada una población cualquiera con Esperanza µ (Media Poblacional) y Varianza σ2 , la

distribución muestral de las Medias Aritméticas X , calculadas a partir de todas las muestras aleatorias con reemplazo de tamaño "n" seleccionadas de esta población, estará distribuida en forma aproximadamente Normal con Esperanza µ y Varianza σ2/n.

La aproximación a la Normal será mejor cuanto mayor se "n". La importancia de este teorema reside en el hecho que no existiendo supuestos sobre la distribución que tiene la variable en estudio (esto es, podría ser cualquiera) el conjunto de medias aritméticas obtenidas de las muestras aleatorias seleccionadas de dicha población si tiene un comportamiento regulado por la distribución Normal, cuyos parámetros están asociados con los de la variable en estudio.

Lo esencial del teorema se expresa sintéticamente como: X ∼ N(µ;σ2/n).

La expresión anterior también puede estandarizarse como cualquier variable que tiene una Distribución Normal. El resultado se expresa como:

( ) , (0X X nSiendo Z entonces Z N

n

µ µσ σ− −

= = ∼ ;1)

La estandarización de X permite calcular probabilidades asociadas con valores de la Media Aritmética empleando la Tabla para la Función de Distribución de la Normal Estandarizada, igual como se hizo antes para el caso de una variable. Ejemplo 1 (Distribución en el muestreo) En el ejemplo de la distribución en el muestreo de muestras de tamaño 3 de la población de 4 edades, se aprecia que siendo µ= 7,5 años y σ2 = 3,25 años2, la Esperanza de

las Medias Aritméticas ( Xµ ) es también 7,5 y la varianza de las Medias Aritméticas ( 2Xσ ) es

1,083. Estos resultados verifican lo establecido en el Teorema del Límite Central por cuanto:

7,5Xµ µ= = años y 2

2 3, 25 1,0833X n

σσ = = = años2

Ejemplo 2 (Cálculo de probabilidades)

Los puntajes de un test se conoce que tienen una Media Poblacional de 120 puntos y una Varianza de 225 puntos2 (Desviación Estándar 15 puntos). Si se selecciona una muestra de 16 alumnos,

a) Calcular la probabilidad que el puntaje medio de la muestra fluctúe entre 115 y 128

puntos.

b) Determinar los valores de las Medias Aritméticas que se asocian con el 95% central de estos resultados.

Page 40: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

37

Desarrollo: a) Según la información entregada, µ=120 puntos ; σ2=225; σ=15 puntos; n=16 alumnos

El planteamiento del problema y la estandarización del mismo para obtener las probabilidades se expresa como:

(115 120)(4) (128 120)(4) ( 5)(4) (8)(4)(115 128)15 15 15 15

P X P Z P Z− − −⎛ ⎞ ⎛< < = < < = < < =⎜ ⎟ ⎜⎝ ⎠ ⎝

⎞⎟⎠

=P(-1,33<Z<2,13)=φ(2,13)- φ(-1,33)= 0,9834 - 0,0918= 0,8916

Por lo tanto, la probabilidad que el puntaje medio de una muestra de 16 alumnos fluctúe entre 115 y 128 pubtos es del 0,8916 , esto es del 89,2% aproximadamente.

b) Se conoce la probabilidad y se debe determinar los extremos de los intervalos de

valores de Medias Aritméticas inferior ( iX ) y superior ( sX ) que se asocian con dicha probabilidad. Por lo tanto:

( 120)(4) ( 120)(4)

( )15 15

i Si S

X XP X X X P Z

⎛ ⎞− −< < = < < =⎜ ⎟

⎝ ⎠0,95

Por otra parte, la lectura de la Tabla de la D. Normal indica que: P(-1,96<Z<1,96)=0,95

Igualando las expresiones para Z se obtiene que: ( 120)(4)

1,9615

iX −= − Despejando

(1,96)(15)120 120 7,35 112,654iX = − = − = =112,7 ptos.

( 120)(4)1,96

15SX −

= Despejando (1,96)(15)120 120 7,35 127,35

4SX = + = + = =127,4 ptos.

Por lo tanto, entre 112,7 puntos y 127,4 puntos se encontraría el 95% de los puntajes

de las medias aritméticas de muestras de 16 alumnos. 7.5. OTRAS DISTRIBUCIONES EN EL MUESTREO A continuación se presentan algunos resultados sobre distribuciones en el muestreo de ciertas estadísticas, que serán útiles para los temas de Inferencia. Estos resultados se pueden demostrar, pero ello escapa al objetivo de este curso. 7.5.1. Media Aritmética con Varianza Poblacional Desconocida El teorema del Límite Central es importante pues permite modelar el comportamiento de la Media Aritmética. Sin embargo requiere conocer la Varianza de la Población de la cual provienen las muestras. Como esta situación no es corriente, en la práctica, el resultado siguiente permite modelar el comportamiento de la Media Aritmética cuando no se conoce la Varianza Poblacional y se estima con la Varianza Muestral:

Si se consideran muestras aleatorias de tamaño "n" de una población que tiene distribución Normal con Esperanza (Media Poblacional) µ y Varianza σ2, siendo X la

media muestral y S2 la varianza muestral, si se define la variable aleatoria “t” siguiente, entonces:

( ) ( 1X nt tSµ− )n= −∼

Lo anterior significa que la variable aleatoria tiene una distribución "t" con (n-1) grados de libertad.

Page 41: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

38

7.5.2. Distribución de la Varianza Muestral El siguiente resultado modela el comportamiento de la Varianza Muestral, con los mismos supuestos anteriores:

Si se consideran muestras aleatorias de tamaño "n" de una población que tiene distribución Normal con Varianza σ2, siendo S2 la varianza muestral, si se define la

variable aleatoria siguiente, que se denomina χ2, entonces: 2

2 22

( 1) ( 1n S nχ χσ− )= −∼

Lo anterior significa que esta variable aleatoria tiene una distribución "χ2 " con (n-1)

grados de libertad. 7.5.3. Distribución de la Proporción Muestral Si se considera una población dividida en dos categorías (dicotomizada) como hombres y mujeres; capacitados y no capacitados; viven en la zona o fuera de ella, ganan más de $200.000.- o no, etc. Si una de estas categorías es de interés para la investigación y se denomina C. La proporción poblacional de unidades pertenecientes a C se denomina “π ” (Por ejemplo, la proporción de mujeres que estudian en la universidad). El estimador muestral se denomina “p” y corresponde a la proporción de unidades de la muestra que pertenecen a la categoría C (Por ejemplo, la proporción de mujeres en una muestra de 30 alumnos de la universidad). Se puede demostrar (mediante el Teorema central del Límite) que la distribución de p, cuando el tamaño de la muestra es grande, es aproximadamente Normal con Esperanza µ=nπ y Varianza σ2=π (1-π )/n

Por lo tanto, la estandarización de la proporción “p” se expresa como:

( ) (0;1)(1 ) (1 )

p p nZ N

n

π ππ π π π− −

= =− −

7.5.4. Distribución de la Diferencia de Dos Medias Poblacionales ( 1X - 2X ) (con Varianzas Conocidas σ2

1 y σ22)

Dadas dos poblaciones con distribuciones normales y con Esperanza µ1 y µ2

respectivamente y Varianzas σ21 y σ22 respectivamente, si se seleccionan muestras aleatorias

de tamaños "n1” y "n2” respectivamente en dichas poblaciones y de las cuales se obtienen sus Medias Aritméticas 1X y 2X , si se considera la variable aleatoria definida por las diferencias

de las medias aritméticas ( 1X - 2X ), calculadas a partir de todas las muestras aleatorias independientes seleccionadas de dichas poblaciones, se puede demostrar que esa variable aleatoria estará distribuida en forma aproximadamente Normal con Esperanza (µ1- µ2 ) y Varianza (σ2

1/n1 +σ22/n2) .

En resumen: ( 1X - 2X )∼ N(µ1- µ2; σ2

1/n1 +σ22/n2).

La expresión anterior también puede estandarizarse como cualquier variable que tiene una Distribución Normal. El resultado de la estandarización se expresa como:

Page 42: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

39

1 2 1 2

2 21 2

1 2

( ) ( )(0;1)

X XZ N

n n

µ µ

σ σ

− − −=

+

7.5.5. Distribución de la Diferencia de Dos Medias Poblacionales ( 1X - 2X ) (con Varianzas Desconocidas pero que se suponen son iguales σ2

1=σ22= σ2)

Dadas dos poblaciones con distribuciones normales y con Esperanza µ1 y µ2 respectivamente y Varianzas σ2

1 y σ22 ,respectivamente, que son desconocidas pero que se

supone son iguales (o sea σ21=σ2

2= σ2); si se seleccionan muestras aleatorias de tamaños "n1” y "n2” respectivamente en dichas poblaciones y de las cuales se obtienen sus Medias Aritméticas 1X y 2X , si se considera la variable aleatoria definida por las diferencias de las

medias aritméticas ( 1X - 2X ), calculadas a partir de todas las muestras aleatorias independientes seleccionadas de dichas poblaciones, se puede demostrar que la variable aleatoria siguiente se distribuye como “t”. Esto es:

2 21 2 1 2 1 1 2 2

1 21 2

1 2

( ) ( ) ( 1) ( 1)( 2)

21 1 p

p

X X n S n St t n n siendo S

n nS

n n

µ µ− − − − + −= + − =

+ −+

En la expresión anterior S2p es la estimación de σ2, la varianza común pero

desconocida, que se obtiene combinando la información de las dos muestras. 7.5.6. Distribución de la Diferencia de Dos Proporciones Muestrales (p1-p2)

Dadas dos poblaciones dicotomizadas (hombres y mujeres; capacitados y no capacitados etc.) de las cuales se considera las proporciones 1π y 2π en que se presenta una cierta característica (por ejemplo, la proporción de mujeres), si se seleccionan muestras aleatorias de tamaños "n1” y "n2” respectivamente en dichas poblaciones y de las cuales se obtienen sus proporciones muestrales p1 y p2, si se considera la variable aleatoria definida por las diferencias de dichas proporciones (p1-p2) calculadas a partir de todas las muestras aleatorias independientes seleccionadas de dichas poblaciones, se puede demostrar que esa variable aleatoria estará distribuida como Normal con Esperanza( 1π - 2π ) y Varianza ( 1 1(1 ) / n1π π− )+( 2 2(1 ) / n2π π− ) La expresión anterior también puede estandarizarse como cualquier variable que tiene una Distribución Normal. El resultado de la estandarización se expresa como:

1 2 1 2

1 1 2 2

1 2

( ) ( )(0;1)

(1 ) (1 )p p

Z N

n n

π ππ π π π

− − −=

− −+

7.5.7. Distribución del Cuociente de Varianzas Maestrales ( y ) 2

1S 22S

El siguiente resultado modela el comportamiento del cuociente de dos Varianzas Muestrales con los mismos supuestos anteriores:

Si se consideran muestras aleatorias de tamaño "n1" de una población que tiene distribución Normal con Varianza 2

1σ , y de tamaño "n2" de otra población que tiene

distribución Normal con Varianza 22σ ; siendo y las respectivas varianzas maestrales. 2

1S 22S

Page 43: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

40

Si se define la variable aleatoria siguiente, denominada “F”, entonces: 2 2

1 11 22 2

2 2

/( 1; 1

/S

F F nS

σσ

)n= − −∼

Lo anterior significa que la variable aleatoria tiene una distribución " F" con (n1-1) y (n2-1) grados de libertad. 7.6. EJERCICIOS 1. Indique por qué es importante el Teorema del Limite Central. 2. Observando las distribuciones en el muestreo de la Mediana y la Varianza, para el

ejemplo de las edades de 4 niños ¿Qué le sugieren los resultados respecto a la distribución en el muestreo de la Mediana y la Varianza Muestral?

3. Los puntajes de un índice de ansiedad para adultos en una ciudad se distribuyen

normalmente con Esperanza 100 puntos y Desviación Estándar 15 puntos. a) Encuentre la distribución de la ansiedad media para una muestra de n=225 personas. b) Encuentre la probabilidad que la ansiedad media de la muestra anterior exceda los 103 puntos. c) Encuentre la probabilidad que la ansiedad media muestral esté entre 97 y 103 puntos. d) Encuentre el puntaje Z correspondiente a la ansiedad media de 90 puntos.

4. Siendo la v.a. X “velocidad de escritura” de digitadores de cierto tipo de texto tiene un

distribución normal con Esperanza de 58 palabras por minuto y Desviación Típica de 16 palabras por minuto. Si se toma una muestra aleatoria de 16 digitadores y se les somete a una prueba de velocidad, ¿cuál es la probabilidad que la media muestral esté entre 50 y 70 palabras por minuto. (Resp.: 0,9759).

5. Suponiendo que el contenido de nicotina de cierta marca de cigarrillo tiene distribución

normal con Esperanza de 25 miligramos y Desviación Típica de 4 miligramos. Si se toma una muestra aleatoria de 25 cigarrillos.¿Cuál es la probabilidad que con una muestra de ese tamaño se obtenga una media aritmética de 26 miligramos o mayor?

6. La proporción de personal de una empresa con algún tipo de problemas de adaptación,

en una empresa, se estima en 15% (esto es π=0,15). Si se selecciona una muestra de 40 personas, calcule la probabilidad que la proporción de personas con problemas de adaptación fluctúe entre 12% y 18%.

7. Considerando una muestra aleatoria de “n” observaciones de una variable X con µ=5 y

que tiene una distribución “t” con “n-1” grados de libertad, responder lo siguiente: a) Si n = 25; X = 3; S = 2 ¿Cuál es el valor de t? b) Si n = 9; X = 2; t = -2 ¿Cuál es el valor de S? c) Si n = 25; S = 10; t = 2 ¿Cuál es el valor de X ? d) Si S = 15; X = 14; t = 3 ¿Cuál es el valor de t?

8. Considerando una muestra aleatoria de “n” observaciones de una variable X que tiene

una distribución “χ2” con “n-1” grados de libertad, responder lo siguiente:

e) Si n = 25; S = 2 ¿Cuál es el valor de σ2?

f) Si n = 9; σ2 = 10; ¿Cuál es el valor de S2?

Page 44: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

41

8. INFERENCIA: Estimación de Parámetros La Estadística Inferencial es el área de la Estadística que se preocupa de la relación entre muestras y la población de la cual se han seleccionado, para emplear los resultados obtenidos en una muestra con el objeto de "inferir" o "tener una idea" acerca de los valores de las características de la población. La Estadística Inferencial pretende resolver dos problemas fundamentales: la estimación de parámetros poblacionales a partir de estadísticas muestrales conocidas (Estimación Puntual y Estimación por Intervalos), y la toma de decisiones estadísticas acerca de hipótesis establecidas sobre la población, también con base en el conocimiento y los resultados obtenidos de una muestra de dicha población (Docimasia o Prueba de Hipótesis). 8.1. ESTIMACIÓN DE PARÁMETROS POBLACIONALES La Estimación de Parámetros consiste en estimar el valor de un parámetro poblacional (Esperanza, Varianza, Proporción etc.) a partir de los resultados observados en una muestra aleatoria de dicha población. La estadística muestral utilizada (Media Aritmética, Varianza muestral, Proporción muestral, Mediana, etc.) se denomina genéricamente ESTIMADOR y los resultados obtenido empleando dicho estimador con un conjunto de valores maestrales se denominan ESTIMACIÓN. Se espera que la selección de los estimadores (estadísticas muestrales) se realice atendiendo al cumplimiento de algunos criterios o características que garanticen que sean lo mejor posible. La Estadística también ofrece métodos para obtener estimadores, los que cumplen con algunas propiedades. Una presentación intuitiva del significado de los criterios más usados para caracterizar a los estimadores, así como los métodos para obtenerlos se ofrece a continuación. Los resultados que se muestran pueden demostrarse, lo que no se hace por no ser de interés para el curso. 8.1.1. Métodos para Obtener Estimadores Hay diversos métodos para generar estimadores. Los más conocidos son los de Mínimos Cuadrados, que se presentaron en el tema de Regresión, y de Máxima Verosimilitud. Este último permite obtener estimadores de los parámetros de distribuciones de probabilidad (como la Normal o la Binomial, por ejemplo) que tienen importantes propiedades.

Page 45: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

42

8.1.2. Parámetros y Estimadores Usuales A continuación se presenta, sin demostración, la relación entre algunos Parámetros Poblacionales y los mejores Estimadores muestrales, pues tienen la mayor cantidad de propiedades y que se emplerán en lo que sigue. Para distinguir los parámetros de los estimadores, se emplean letras griegas para los primeros y latinas para los segundos.

PARAMETROS POBLACIONALES ESTIMADOR MUESTRAL

1

Nii

XN

µ == ∑

Esperanza o Media Poblacional

1

nii

XX

n== ∑

Media Aritmética

22 1

( )1

nii

XN

µσ =

−=

−∑

Varianza Poblacional

22 1

( )1

nii

X XS

n=

−=

−∑

Varianza Muestral

2 :σ σ=

Desviación Estándar poblacional

2S S= Desviación Estándar muestral

:AN

π =

Proporción Poblacional

apn

=

Proporción muestral

8.1.3. Propiedades de los estimadores A continuación se presentan las principales propiedades de los estimadores. a) Insesgamiento Un estimador es insesgado si la distribución muestral del mismo tiene una Esperanza (Media Poblacional) que es igual al valor del parámetro que se desea estimar. Si se considere el ejemplo de las edades de 4 niños con valores 5, 7, 8 y 10 años, cuyos valores poblacionales son µ= 7,5 años; σ2 = 3,25 años2 y Mediana es 7,5 años.

Observando los resultados obtenidos con todas las muestras posibles de tamaño n=3 (con reemplazo) se puede apreciar lo siguiente: a) El promedio de todas las medias aritméticas (esperanza de la Media Aritmética) de

todas las muestras seleccionadas de tamaño n=3 es igual a 7,5 años lo que coincide con el valor de la Media Poblacional (En símbolos: 7,5Xµ µ= = años. Como esta

propiedad se puede demostrar que ocurre siempre, y no sólo en este caso, se puede afirmar que la Media Aritmética es un estimador insesgado de la Media Poblacional.

b) Para las Medianas muestrales se observa lo mismo antes indicado, por lo tanto se

puede afirmar que la Mediana muestral es un estimador insesgado de la Mediana Poblacional.

c) Para las Varianzas muestrales (S2) se observa que el promedio de todas ellas

(esperanza de la varianza muestral) de todas las muestras seleccionadas de tamaño n=3 es igual a 3,25 lo que coincide con el valor de Varianza Poblacional (En símbolos:

Page 46: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

43

22 3,25

Sµ σ= = años2. Como esta propiedad se puede demostrar que ocurre siempre, y

no sólo en este caso, se puede afirmar que la Varianza muestral es un estimador insesgado de la Varianza Poblacional.

Si bien la propiedad de insesgamiento se aplica a la población de resultados de las

estimaciones que se pueden realizar con el estimador, la importancia que tiene el emplear estimadores insesgados consiste en que al seleccionar una sola muestra, como es lo habitual en las aplicaciones prácticas, y tener una sola estimación se espera que entregue resultados cercanos al valor verdadero del parámetro que se estima. b) Consistencia Generalmente un estimador no entrega valores idénticos al valor del parámetro que pretende estimar. La variabilidad de todas las diferencia entre la estimación y el valor verdadero del parámetro estimado permite definir la "Varianza de Muestreo" y la raíz cuadrada de la misma que se denomina el "Error de Muestreo". La propiedad de Consistencia se verifica si al aumentar el tamaño de la muestra el Error de Muestreo tiende a disminuir, hasta hacerse cero si el tamaño de la muestra es igual al de la población. Como ejemplos se puede comprobar que los estimadores Media Aritmética, Varianza muestral y Mediana (entre otras) tienen esta propiedad. c) Insesgado de Varianza Mínima (Eficiencia) Como se aprecia por los ejemplos, puede haber varios estimadores de un parámetro que satisfacen algunas propiedades. Para distinguir entre ellos, se define la propiedad de "Insesgado de Varianza Mínima" la que establece que si hay dos o más que son estimadores insesgados, es preferible aquel cuya Varianza de Muestreo (o Error de Muestreo) es menor. Se puede decir que este último es más eficiente.

Usando el ejemplo de las edades de 4 niños, para la Media Poblacional, se puede emplear como estimadores tanto la Media Aritmética como la Mediana, los cuales son insesgados y consistentes. Sin embargo, la distribución muestral de la Media Aritmética tiene una varianza menor (1,083 años2) que la distribución muestral de la Mediana (2,125 años2). Por lo tanto, se puede afirmar que la Media Aritmética es un estimador Insesgado de Varianza Mínima o es más eficiente que la Mediana. Lo anterior permite justificar por que es importante la media aritmética como estimador preferido de la media poblacional, así como su empleo en los procedimientos que más adelante se estudiarán. d) Suficiencia Intuitivamente, se dice que un estimador es Suficiente si transmite la mayor cantidad posible de información de la muestra acerca del parámetro que se pretende estimar, con respecto a la información que podrían transmitir otros estimadores definidos en la misma muestra. Como ejemplo, para el parámetro Media Poblacional, se puede comprobar que los estimadores que pueden emplearse, entre otros, son la Media Aritmética, la Mediana y el Centro del Recorrido. Sin embargo, el Centro del Recorrido sólo emplea los valores muestrales mínimo y máximo, la Mediana sólo la posición relativa para determinar aquel que tiene la ubicación central. Sólo la Media Aritmética toma en cuenta el valor de cada observación y por ello toda la información de la muestra. Por lo tanto, la Media Aritmética sería un estimador suficiente de la Media Poblacional.

Page 47: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

44

8.2. ESTIMACIÓN PUNTUAL DE PARÁMETROS POBLACIONALES La Estimación Puntual de un Parámetro, asociado con la distribución de una variable aleatoria de interés, consiste en emplear el valor obtenido en el estimador para inferir sobre el valor del respectivo parámetro poblacional de la variable. Por ejemplo, si interesa inferir sobre la edad media de los alumnos de una carrera, y en una muestra aleatoria de 20 estudiantes universitarios de dicha carrera se observa que la Media Aritmética de las edades es X =20,7 años puede inferirse que la Edad media poblacional (µ) de todos los estudiantes de la carrera es también 20,7 años. Si la varianza muestral (S2) de las mismas edades es de 5,3 años2 puede inferirse que la Varianza Poblacional ( 2σ ) también corresponde a 5,3 años2. Por último, si la proporción (p) de hombres obtenida en la muestra de alumnos de la carrera es de 0,55 puede inferirse que la Proporción Poblacional de hombres (P) también es de 0,55 (o 55%). 8.3. ESTIMACIÓN POR INTERVALOS DE PARÁMETROS POBLACIONALES La estimación puntual de un parámetro poblacional desconocido no ofrece seguridad que ese sea efectivamente el valor del parámetro poblacional. Esta situación puede mejorarse ofreciendo un conjunto (o intervalo) de valores posibles para el parámetro poblacional. Así para el ejemplo del punto anterior, podría indicarse que la edad media de los alumnos de la carrera fluctúa entre 19,2 y 22,2 años (esto es 20,7±1,5 años). A la media aritmética (20,7 años) de la muestra se le ha agregado y restado la cantidad de 1,5 años, denominado ERROR DE ESTIMACIÖN, para determinar el intervalo de posibles valores de la edad media de todos los alumnos de la carrera. A continuación se presentará un procedimiento para calcular el ERROR de ESTIMACIÓN y así determinar los extremos del intervalo para estimar un parámetro, que emplea el conocimiento existente sobre la distribución muestral de la estadística (que desempeñara el rol de estimador) que se presentaron en el tema de "Distribuciones en el Muestreo". 8.4. ESTIMACIÓN POR INTERVALOS DE LA MEDIA POBLACIONAL µ (CON VARIANZA POBLACIONAL σ2 CONOCIDA) Suponiendo que una variable X (por ejemplo la edad de los estudiantes) tiene distribución Normal, esto es, X∼N(µ;σ2) (esto es Normal con Esperanza µ y Varianza σ2). Se

supone que µ es desconocido y σ2 es conocida. Por el Teorema del Límite Central se sabe que para muestras de tamaño "n" la Media Aritmética se distribuye como X ∼N(µ;σ2/n). Por lo

tanto:

( ) , (0X X nSiendo Z entonces Z N

n

µ µσ σ− −

= = ∼ ;1)

Aunque Z depende de µ la distribución de probabilidad de Z no depende de µ. Por lo indicado, puede plantearse la siguiente relación ya usada antes: P(-1,96 < Z < 1,96) = 0,95. Reemplazando Z por su equivalente antes definido:

P(-1,96 < ( )X nµ

σ−

< 1,96)=0,95

Despejando µ que es la incógnita se llega a:

Page 48: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

45

(1,96) (1,96) 0,95P X Xn nσ σµ⎛ ⎞

− < < + =⎜ ⎟⎝ ⎠

Este resultado es un "intervalo probabilístico" y debe interpretarse del modo siguiente: si se seleccionan todas las muestras de tamaño "n" de la población en estudio y se calcula cada Media Aritmética, siendo conocidos “σ” para cada una de las medias aritméticas se puede

calcular un intervalo con extremos: (1,96)X

nσ⎛ ⎞

−⎜ ⎟⎝ ⎠

y (1,96)X

nσ⎛ ⎞

+⎜ ⎟⎝ ⎠

.

Por lo tanto habrá un conjunto de intervalos. Si el valor de la Media Poblacional (µ)

fuera conocido, se podría verificar que el 95% de tales intervalos la contienen, esto es, el valor de µ estará comprendido entre el valor mínimo y el máximo del intervalo. Por lo mismo, habrá un 5% de los intervalos que no contiene el valor de la Media Poblacional µ. Pero como en la práctica sólo se trabajará sólo con una muestra, siendo el valor de µ desconocido y se desea estimarlo, no se sabe si el intervalo asociado con esa única muestra pertenece al grupo mayoritario (del 95%) de intervalos que contienen a µ o al grupo minoritario (del 5%) que no contiene a µ. Apelando al criterio, suponemos que hay mayores posibilidades para que el intervalo calculado pertenezca al grupo mayoritario, pero como no podemos asignar una probabilidad a nuestra presunción, la expresamos como una CONFIANZA DEL 95%. Finalmente, el INTERVALO DE CONFIANZA DEL 95% PARA ESTIMAR µ CONOCIENDO LA VARIANZA POBLACIONAL σ2 tiene como límites los valores siguientes:

(1,96)Xnσ⎛ ⎞

−⎜ ⎟⎝ ⎠

y (1,96)X

nσ⎛ ⎞

+⎜ ⎟⎝ ⎠

.

Pero también pueden obtenerse Intervalos de Confianza asociados con otros porcentajes de confianza. Esto depende del planteamiento inicial.

Por ejemplo, para obtener intervalos del 99% de confianza el planteamiento inicial es: P(-2,575 < Z < 2,575) = 0,99. Por lo tanto, el INTERVALO DE CONFIANZA DEL 99% PARA ESTIMAR µ CONOCIENDO LA VARIANZA POBLACIONAL σ2 tiene como límites los valores siguientes:

(2,575)Xnσ⎛ ⎞

−⎜ ⎟⎝ ⎠

y (2,575)X

nσ⎛ ⎞

+⎜ ⎟⎝ ⎠

La generalización del resultado anterior, para cualquier "coeficiente o nivel de confianza "1 α− ” en que "α " es el "nivel de significación", esto es la probabilidad que el intervalo probabilístico no contenga al parámetro que se estima (que es µ en este caso), parte del enunciado siguiente:

( / 2) (1 / 2) (1 / 2) (1 / 2)( ) (P Z Z Z P Z Z Zα α α α ) 1 α− − −< < = − < < = −

Por lo tanto, el INTERVALO DE CONFIANZA DEL (1 α− )100% PARA ESTIMAR µ CONOCIENDO σ2 LA VARIANZA POBLACIONAL tiene como límite inferior y límite superior los valores siguientes:

Límite inferior = (1 / 2)( )ZX

nα σ−⎛ ⎞

−⎜ ⎟⎝ ⎠

Límite superior = (1 / 2)( )ZX

nα σ−⎛ ⎞

+⎜ ⎟⎝ ⎠

Page 49: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

46

8.4.1. Ejemplo aclaratorio sobre Int. Conf. En la página siguiente se presenta una situación hipotética para ayudar a comprender el significado de los intervalos de confianza. A partir de la población de 4 edades (6,7, 9 y 10 años) se generan las 64 muestras posibles, con reposición, y se obtuvieron los 6ª intervalos de confianza para estimar la media poblacional (µ), suponiendo la varianza poblacional conocida (σ2=3,25 años2) con una confianza del 95% (o sea, se empleó Z=1,96). Dado que este es una situación muy especial (es hipotética pues se conoce la población y sus parámetros, lo que no corresponde a lo que ocurre en las situaciones reales que se ejemplifican más adelante), se conoce el valor de la media poblacional (µ=7,5 años). Por ello, se puede comprobar si cada uno de los intervalos generados contiene ese valor o no. La forma de construir los intervalos garantizaría que el 95% de los mismos debería contener el valor de la media poblacional. La primera tabla de los intervalos de confianza (páginas siguientes), señala en la última columna que en 2 de los 64 intervalos no ocurre lo señalado, por lo tanto, el 3,1% de los mismos no contiene a la media poblacional, porcentaje próximo al 5% en que se esperaría que ocurriera lo indicado. En la segunda tabla se presentan los Intervalos de confianza del 90%. Se aprecia que en la tabla hay 8 intervalos (12,5%) que no contiene a la media poblacional, lo que es cercano al 10% esperado en que eso ocurriera. El gráfico siguiente presenta los 64 intervalos del 95% de confianza, apreciándose los dos que no contienen al valor 7,5 que es la media poblacional.

INTERVALOS DE 95% DE CONFIANZA PARA ESTIMAR LA EDAD MEDIA POBLACIONAL (VAR. POB. =3,25 n=3)

2,5

3,5

4,5

5,5

6,5

7,5

8,5

9,5

10,5

11,5

12,5

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65

MUESTRAS

OS

Med.Pobl.µ

Page 50: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

47

INTERVALOS DE CONFIANZA DEL 95% PARA ESTIMAR MEDIA POB. CON VAR. CONOCIDA

MUESTRA MEDIA ARIT. LIMITE INFERIOR LIMITE SUPERIOR CONTIENE µ5 5 5 5,00 2,96 7,04 No5 5 7 5,67 3,63 7,715 5 8 6,00 3,96 8,045 5 10 6,67 4,63 8,715 7 5 5,67 3,63 7,715 7 7 6,33 4,29 8,375 7 8 6,67 4,63 8,715 7 10 7,33 5,29 9,375 8 5 6,00 3,96 8,045 8 7 6,67 4,63 8,715 8 8 7,00 4,96 9,045 8 10 7,67 5,63 9,715 10 5 6,67 4,63 8,715 10 7 7,33 5,29 9,375 10 8 7,67 5,63 9,715 10 10 8,33 6,29 10,377 5 5 5,67 3,63 7,717 5 7 6,33 4,29 8,377 5 8 6,67 4,63 8,717 5 10 7,33 5,29 9,377 7 5 6,33 4,29 8,377 7 7 7,00 4,96 9,047 7 8 7,33 5,29 9,377 7 10 8,00 5,96 10,047 8 5 6,67 4,63 8,717 8 7 7,33 5,29 9,377 8 8 7,67 5,63 9,717 8 10 8,33 6,29 10,377 10 5 7,33 5,29 9,377 10 7 8,00 5,96 10,047 10 8 8,33 6,29 10,377 10 10 9,00 6,96 11,048 5 5 6,00 3,96 8,048 5 7 6,67 4,63 8,718 5 8 7,00 4,96 9,048 5 10 7,67 5,63 9,718 7 5 6,67 4,63 8,718 7 7 7,33 5,29 9,378 7 8 7,67 5,63 9,718 7 10 8,33 6,29 10,378 8 5 7,00 4,96 9,048 8 7 7,67 5,63 9,718 8 8 8,00 5,96 10,048 8 10 8,67 6,63 10,718 10 5 7,67 5,63 9,718 10 7 8,33 6,29 10,378 10 8 8,67 6,63 10,718 10 10 9,33 7,29 11,37

10 5 5 6,67 4,63 8,7110 5 7 7,33 5,29 9,3710 5 8 7,67 5,63 9,7110 5 10 8,33 6,29 10,3710 7 5 7,33 5,29 9,3710 7 7 8,00 5,96 10,0410 7 8 8,33 6,29 10,3710 7 10 9,00 6,96 11,0410 8 5 7,67 5,63 9,7110 8 7 8,33 6,29 10,3710 8 8 8,67 6,63 10,7110 8 10 9,33 7,29 11,3710 10 5 8,33 6,29 10,3710 10 7 9,00 6,96 11,0410 10 8 9,33 7,29 11,3710 10 10 10,00 7,96 12,04 No

nº total muestras= 64,000MEDIA = 7,500 nº muestras no contienen Med. Poblac. 2VARIANZA = 1,083 % muestras no contienen Med. Poblac. 3,1

Sea la población de edades en años de 4 niños: 5, 7, 8, 10. La edad Media Poblacional es µ=7,5 años y la Varianza Poblacional es σ2 = 3,25 años2. Se toman muestras de tamaño n=3

con reemplazo. Los siguientes son la totalidad de Intervalos de Confianza del 95% que pueden generarse para estimar la Media poblacional µ (Se supone varianza conocida y se usó z=1,96).

Page 51: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

48

INTERVALOS DE CONFIANZA DEL 90% PARA ESTIMAR MEDIA POB. CON VAR. CONOCIDA

MUESTRA MEDIA ARIT. LIMITE INFERIOR LIMITE SUPERIOR CONTIENE µ5 5 5 5,00 3,29 6,71 No5 5 7 5,67 3,95 7,38 No5 5 8 6,00 4,29 7,715 5 10 6,67 4,95 8,385 7 5 5,67 3,95 7,38 No5 7 7 6,33 4,62 8,055 7 8 6,67 4,95 8,385 7 10 7,33 5,62 9,055 8 5 6,00 4,29 7,715 8 7 6,67 4,95 8,385 8 8 7,00 5,29 8,715 8 10 7,67 5,95 9,385 10 5 6,67 4,95 8,385 10 7 7,33 5,62 9,055 10 8 7,67 5,95 9,385 10 10 8,33 6,62 10,057 5 5 5,67 3,95 7,38 No7 5 7 6,33 4,62 8,057 5 8 6,67 4,95 8,387 5 10 7,33 5,62 9,057 7 5 6,33 4,62 8,057 7 7 7,00 5,29 8,717 7 8 7,33 5,62 9,057 7 10 8,00 6,29 9,717 8 5 6,67 4,95 8,387 8 7 7,33 5,62 9,057 8 8 7,67 5,95 9,387 8 10 8,33 6,62 10,057 10 5 7,33 5,62 9,057 10 7 8,00 6,29 9,717 10 8 8,33 6,62 10,057 10 10 9,00 7,29 10,718 5 5 6,00 4,29 7,718 5 7 6,67 4,95 8,388 5 8 7,00 5,29 8,718 5 10 7,67 5,95 9,388 7 5 6,67 4,95 8,388 7 7 7,33 5,62 9,058 7 8 7,67 5,95 9,388 7 10 8,33 6,62 10,058 8 5 7,00 5,29 8,718 8 7 7,67 5,95 9,388 8 8 8,00 6,29 9,718 8 10 8,67 6,95 10,388 10 5 7,67 5,95 9,388 10 7 8,33 6,62 10,058 10 8 8,67 6,95 10,388 10 10 9,33 7,62 11,05 No

10 5 5 6,67 4,95 8,3810 5 7 7,33 5,62 9,0510 5 8 7,67 5,95 9,3810 5 10 8,33 6,62 10,0510 7 5 7,33 5,62 9,0510 7 7 8,00 6,29 9,7110 7 8 8,33 6,62 10,0510 7 10 9,00 7,29 10,7110 8 5 7,67 5,95 9,3810 8 7 8,33 6,62 10,0510 8 8 8,67 6,95 10,3810 8 10 9,33 7,62 11,05 No10 10 5 8,33 6,62 10,0510 10 7 9,00 7,29 10,7110 10 8 9,33 7,62 11,05 No10 10 10 10,00 8,29 11,71 No

nº total muestras= 64,000MEDIA = 7,500 nº muestras no contienen Med. Poblac. 8VARIANZA = 1,083 % muestras no contienen Med. Poblac. 12,5

Sea la población de edades en años de 4 niños: 5, 7, 8, 10. La edad Media Poblacional es µ=7,5 años y la Varianza Poblacional es σ2 = 3,25 años2. Se toman muestras de tamaño n=3

con reemplazo. Los siguientes son la totalidad de Intervalos de Confianza del 90% que pueden generarse para estimar la Media poblacional µ (Se supone varianza conocida y se usó

z=1,645).

Page 52: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

49

8.4.2. Ejemplo (Test conocimientos Computación) Se aplicó un test para medir el nivel de conocimientos sobre Computación de las secretarias de una empresa. El test aplicado se había estandarizado y tiene un puntaje medio de 100 puntos y una desviación estándar de 15 puntos (σ2=225 pts2). Los puntajes obtenidos por una muestra de 16 secretarias son los siguientes:

110 98 95 103 106 89 125 102 106 111 115 93 116 121 96 101 a) Estimar el Intervalo del 95% de confianza para el puntaje medio poblacional de

conocimientos. b) ¿Puede aceptarse HIPÓTESIS que el puntaje medio poblacional es 100 puntos? c) ¿Cómo se interpreta el intervalo obtenido? Desarrollo: a) Usando los datos de la muestra se obtiene X =105,4 pt., n=16. Considerando los

datos del test se emplea σ2=225 pts2 (luego σ=15 puntos). Luego, los extremos del intervalo de confianza del 95% para el puntaje medio poblacional son:

Límite inferior = (1,96)X

nσ⎛ ⎞

−⎜ ⎟⎝ ⎠

= (1,96)(15) 29,4105,44 105, 44 105,44 7,35 98,08

4 4− = − = − = =98,1 pts

Límite superior = (1,96)X

nσ⎛ ⎞

+⎜ ⎟⎝ ⎠

=(1,96)(15) 29,4105, 44 105,44 105, 44 7,35 112,79

4 4+ = + = + == = 112,8 pts

b) El intervalo calculado antes (98,1 a 112,8) comprende los puntajes entre los cuales

se estima se debe encontrar el verdadero valor del puntaje medio poblacional de conocimientos, con 95% de confianza (o sea, con una posibilidad de equivocarse del 5%). Por lo tanto, el puntaje medio poblacional puede ser µ=100 pts pues este valor está comprendido en el intervalo anterior.

c) Los resultados anteriores señalan que el nivel de conocimientos de las secretarias

corresponde a lo normal, pues el puntaje medio poblacional puede ser µ=100 pts. 8.5. ESTIMACIÓN POR INTERVALOS DE LA MEDIA POBLACIONAL µ (CON VARIANZA POBLACIONAL σ2 DESCONOCIDA) Suponiendo que una variable X (por ejemplo la edad, ingresos, puntajes en test etc.) tiene distribución Normal con esperanza µ y varianza σ2, esto es, X∼N(µ;σ2). Se supone,

además, que µ y σ2 no son conocidas, pero sólo µ es el parámetro que se desea estimar por intervalo empleando una muestra aleatoria de tamaño "n", a partir de la cual σ2 será estimado con S2 (7varianza muestral). La estrategia para realizar la estimación, igual que en el caso anterior, es emplear una estadística que relacione los elementos del problema, conocidos y desconocidos, y tenga una distribución muestral conocida. En este caso se emplea la estadística "t" siguiente:

( ) ( 1X nt tSµ− )n= −∼

A partir del enunciado siguiente: ( )(1 / 2; 1) (1 / 2; 1) 1n nP t t tα α α− − − −− < < = −

En forma análoga al caso antes visto, reemplazando "t" en la expresión anterior y despejando µ se obtiene el INTERVALO DE CONFIANZA DEL (1-α)100% PARA ESTIMAR µ CUANDO LA VARIANZA POBLACIONAL σ2 ES DESCONOCIDA. Los extremos del intervalo de Confianza están dados por:

Límite inferior: (1 / 2; 1)nt SX

nα− −⎛ ⎞

−⎜⎝ ⎠

⎟ y Límite superior: (1 / 2; 1)nt SX

nα− −⎛ ⎞

+⎜ ⎟⎝ ⎠

Page 53: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

50

8.5.1. Ejemplo (El anterior sobre Test conocimientos Computación) Se aplicó un test para medir el nivel de conocimientos sobre Computación de las secretarias de una empresa. El test aplicado se había estandarizado y tiene un puntaje medio de 100 puntos. Los puntajes obtenidos por una muestra de 16 secretarias son los siguientes:

110 98 95 103 106 89 125 102 106 111 115 93 116 121 96 101 a) Estimar el Intervalo del 95% de confianza para el puntaje medio poblacional de

conocimientos. d) ¿Puede aceptarse la hipótesis que el puntaje medio poblacional es 100 puntos? e) ¿Cómo se interpreta el intervalo obtenido? Desarrollo:

a) Usando los datos de la muestra se obtiene X =105,4 pt., S=10,3 pt.;n=16; 0,05α = Luego, los valores de t obtenidos de la tabla son: (1 / 2; 1) (0,975; 15) 2,1315nt tα− − = = .

Los extremos del intervalo de confianza del 95% para el puntaje medio poblacional son:

Límite inferior = (1 / 2; 1)nt SX

nα− −⎛ ⎞

−⎜ ⎟⎝ ⎠

= (2,1315)(15) 31,97105, 44 105,44 105,44 7,99

4 4− = − = − = 97,5 pts

Límite superior = (1 / 2; 1)nt SX

nα− −⎛ ⎞

+⎜ ⎟⎝ ⎠

= (2,1315)(15) 31,97105, 44 105, 44 105,44 7,99

4 4+ = + = + =113,4 pts

b) El intervalo calculado antes (97,5 a 113,4) comprende los puntajes entre los cuales

se estima se debe encontrar el verdadero valor del puntaje medio poblacional de conocimientos, con 95% de confianza (o sea, con una posibilidad de equivocarse del 5%). Por lo tanto, el puntaje medio poblacional puede ser µ=100 pts pues este valor está comprendido en el intervalo anterior.

c) Los resultados anteriores señalan que el nivel de conocimientos de las secretarias

corresponde a lo normal, pues el puntaje medio poblacional puede ser µ=100 pts. 8.6. ESTIMACIÓN POR INTERVALO DE LA PROPORCIÓN POBLACIONAL

En forma análoga a lo realizado en los casos anteriores, a partir de la distribución en el muestreo de p:

( ) (0;1)(1 ) (1 )

p p nZ N

n

π ππ π π π− −

= =− −

Se obtienen los siguientes límites (inferior y superior) para el INTERVALO DE CONFIANZA DEL (1 α− )100% PARA ESTIMAR π LA PROPORCIÓN, se estima π con la proporción muestral p, entonces:

Límite inferior = (1 / 2)(1 )p pp Z

nα−

⎛ ⎞−−⎜ ⎟⎜ ⎟

⎝ ⎠

Límite superior = (1 / 2)(1 )p pp Z

nα−

⎛ ⎞−+⎜ ⎟⎜ ⎟

⎝ ⎠

8.7.1. Ejemplo (El anterior sobre Test conocimientos Computación) Se aplicó un test para medir el nivel de conocimientos sobre Computación de las secretarias de una empresa. El test aplicado se había estandarizado y tiene un puntaje medio de 100 puntos. Los puntajes obtenidos por una muestra de 16 secretarias son los siguientes:

110 98 95 103 106 89 125 102 106 111 115 93 116 121 96 101

Page 54: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

51

a) Estimar el Intervalo del 95% de confianza para la proporción poblacional π de puntajes mayores de 100 puntos.

b) ¿Puede ser la proporción poblacional de puntajes mayores de 100 puntos igual a 0,45 (o 45% en porcentajes)?

Desarrollo: Los puntajes forman dos grupos: aquellos mayores de 100 puntos (clase de interés C) y los puntajes 100 o menores. A partir de los resultados de la muestra, la proporción de puntajes mayores de 100 puntos corresponde a p=11/16=0,6875. Por lo tanto (1-p)=0,3125.

Para 0,05α = , el valor de (1 / 2) (0,975) 1,96Z Zα− = = .

a) El intervalo de confianza del 95% para π será: Límite Inferior

(1 / 2)(1 ) 0,6875(1 0,6875)0,6875 1,96 0,6875 (1,96)(0,1159) 0,6875 0, 2271

16p pp Z

nα−

⎛ ⎞ ⎛ ⎞− −− = − = − = −⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠= 0,460

Límite Superior

(1 / 2)(1 ) 0,6875(1 0,6875)0,6875 1,96 0,6875 (1,96)(0,1159) 0,6875 0,2271

16p pp Z

nα−

⎛ ⎞ ⎛ ⎞− −+ = + = + = +⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠= 0,915

b) El intervalo del 95% para la proporción poblacional de puntajes mayores de 100 puntos

corresponde a (0,460 a 0,915) o en porcentajes corresponde a (46,0% a 91,5%). Dado que el valor 0,45 no está comprendido entre los valores del intervalo, para la propor-ción poblacional, se concluye que dicha proporción no corresponde a la población de la

cual proviene la muestra analizada. 8.7. ESTIMACIÓN POR INTERVALO DE LA VARIANZA POBLACIONAL Suponiendo que una variable X tiene distribución Normal con esperanza µ y varianza σ2, esto es, X∼N(µ;σ2). Se supone, además, que µ y σ2 no son conocidas, pero sólo σ2 es el

parámetro que se desea estimar por intervalo empleando una muestra aleatoria de tamaño "n", a partir de la cual σ2 será estimado con S2 (7varianza muestral). La estrategia para realizar la estimación, igual que en el caso anterior, es emplear una estadística que relacione los elementos del problema, conocidos y desconocidos, y tenga una distribución muestral conocida. En este caso se emplea la estadística "χ2" siguiente:

22 2

2

( 1) ( 1n S nχ χσ− )= −∼

A partir del enunciado siguiente: ( )2 2 2( / 2; 1) (1 / 2; 1) 1n nP α αχ χ χ α− − −< < = −

En forma análoga a los casos anteriores, reemplazando "χ2" en la expresión anterior y

despejando se obtiene el INTERVALO DE CONFIANZA DEL (1-α)100% PARA ESTIMAR σ2 . Los extremos del intervalo de Confianza están dados por:

Límite inferior:

2

2(1 / 2; 1)

( 1)

n

n S

αχ − −

⎛ ⎞−⎜⎜⎝ ⎠

⎟⎟ y Límite superior:

2

2( / 2; 1)

( 1)

n

n S

αχ −

⎛ ⎞−⎜ ⎟⎜ ⎟⎝ ⎠

Page 55: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

52

8.7.1. Ejemplo (El anterior sobre Test conocimientos Computación) Se aplicó un test para medir el nivel de conocimientos sobre Computación de las secretarias de una empresa. El test aplicado se había estandarizado y tiene un puntaje medio de 100 puntos. Los puntajes obtenidos por una muestra de 16 secretarias son los siguientes:

110 98 95 103 106 89 125 102 106 111 115 93 116 121 96 101 a) Estimar el Intervalo del 95% de confianza para la varianza poblacional de puntajes de

conocimientos. d) ¿Puede aceptarse la hipótesis que la varianza poblacional de los puntajes de

conocimientos es σ2=225 pts2? c) ¿Cómo se interpreta el intervalo obtenido? Desarrollo: a) Usando los datos de la muestra se obtiene que S=10,3 puntos; S2=106,4 puntos2;

n=16; 0,05α = Luego, los valores de χ2 obtenidos de la tabla son: 2 2( / 2; 1) (0,025;15) 6,262nαχ χ− = =

2 2 2(1 /2; 1) (1 0,025;15) (0,975;15) 27,488nαχ χ χ− − −= = =

Los extremos del intervalo de confianza del 95% para la varianza poblacional de los puntajes son:

Límite inferior = 2

2 2(1 / 2; 1) (0,975; 15)

( 1) (15)(106,4) 1.59627, 488n

n S

αχ χ− −

⎛ ⎞ ⎛ ⎞− ⎛ ⎞= =⎜ ⎟ ⎜ ⎟ ⎜⎜ ⎟ ⎜ ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠

=⎟ 58,06 puntos2

Límite superior = 2

2 2( / 2; 1) (0,025; 15)

( 1) (15)(106, 4) 1.5966, 262n

n S

αχ χ−

⎛ ⎞ ⎛ ⎞− ⎛ ⎞= =⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠

= 254,87 puntos2

b) El intervalo para la varianza poblacional (58,06 a 254,87) comprende los puntajes

entre los cuales se estima se debe encontrar el verdadero valor de la varianza de los puntajes de conocimientos, con 95% de confianza (o sea, con una posibilidad de equivocarse del 5%). Por lo tanto, la varianza poblacional de los puntajes puede ser σ2=225 pts2 pues este valor está comprendido en el intervalo anterior.

Observaciones. a) Los resultados anteriores (estimación de media y varianza poblacional) señalan que el

nivel de conocimientos sobre Computación de las secretarias corresponde a los observados para la población en que se validó el test, pues el puntaje medio poblacional puede ser µ=100 pts y la varianza de los mismos puede ser σ2=225 pts2. Por lo tanto, estos rendimientos de conocimientos se ajustan al comportamiento corriente para la población de puntajes del test.

b) Si las secretarias habían tenido un curso de capacitación y se planteara la hipótesis que

los rendimientos medios de este grupo de secretarias es mayor que el promedio, por ejemplo µ=120 puntos, los resultados observados y el intervalo de confianza calculado antes (97,5 pts a 113,4 pts) no avalan dicha hipótesis por cuanto el valor 120 no pertenece al intervalo. Por lo tanto, la hipótesis se rechazaría, concluyéndose que el grupo no tiene un rendimiento medio superior al de la población en que se validó el test.

Page 56: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

53

8.8. ESTIMACIÓN POR INTERVALO DEL COEF. DE CONFIABILIDAD ALFA DE CRONBACH A partir de la distribución en el muestreo del Coeficiente de Confiabilidad Alfa de Cronbach, dada por la expresión siguiente, siendo α = Coef. poblacional Alfa de Cronbach; α0 = Coef. muestral Alfa de Cronbach; K=número de ítems; n= tamaño de la muestra a la cual se aplica el test,

0

1 (( 1); ( 1)( 1))1

F F n K nαα−

= − − −−

Considerando enunciado probabilístico:

P(F(α/2 ; (n-1);(K-1)(n-1))< F <F(1- α/2 ; (n-1);(K-1)(n-1))) = 1 - α Reemplazando F por expresión para Coef. de Confiabilidad anterior, con los grados de libertad indicados para F, se tiene:

(( / 2); ( 1); ( 1)( 1)) ((1 / 2); ( 1); ( 1)( 1))0

1 P( ) 11n K n n K nF Fα α

α αα− − − − − − −

−< < =

−−

(Atención: el símbolo “α” se emplea con dos significados diferentes, no confundir) A partir de expresión anterior se obtienen límites inferior y superior para el Intervalo de Confianza del Coef de Confiabilidad Alfa de Cronbach “α”, que son los siguientes:

0 ((1 / 2); ( 1); ( 1)( 1))Lim. Inferior: 1 (1 ) n K nF αα − − − −− −

0 (( / 2); ( 1); ( 1)( 1))Lim. Superior: 1 (1 ) n K nF αα − − −− −

8.8.1. Ejemplo Se aplicó una escala tipo Likert, con 7 aseveraciones a una muestra de 13 estudiantes, para conocer las opiniones de los estudiantes acerca de una asignatura. Se obtuvo un coeficiente de confiabilidad Alfa de Cronbach de 0,75. Estimar el Intervalo de Confianza del 90% para dicho coeficiente. Los datos básicos son n= 13; K= 7; α0 = 0,75; (n-1) = 12; (n-1)(K-1)= (12)(6)=72

Los valores de F obtenidos de la tabla, aproximando los grados de libertad a 10 y 80 son:

( / 2);( 1);( 1)( 1) (0,05);(13 1);(7 1)(13 1) (0,05);(12);(72) (0,05);(10);(80) 0,385n K nF F F Fα − − − − − −= = ≈ =

=

(1 / 2); ( 1); ( 1)( 1) (0,95); (13 1); (7 1)(13 1) (0,95); (12); (72) (0,95); (10); (80) 1,95n K nF F F Fα− − − − − − −= = ≈

Los límites del Intervalo de Confianza del 90% para Alfa de Cronbach poblacional son:

0 (1 / 2);( 1);( 1)( 1)Lim. Inferior: 1 (1 ) 1 (1 0,75)(1,95) 1 0,4875 0,5125n K nF αα − − − −− − = − − = − =

0 ( / 2); ( 1); ( 1)( 1)Lim. Superior: 1 (1 ) 1 (1 0,75)(0,385) 1 0,09625 0,90375n K nF αα − − −− − = − − = − =

Por lo tanto, los límites de confianza del 90% para el Coeficiente Alfa de Cronbach están entre 0,513 a 0,904

Page 57: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

54

8.9. TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA POBLACIONAL La estimación del tamaño de la muestra "n" es un tema importante en Inferencia, tanto para estimar un determinado parámetro poblacional o para una dócima de hipótesis. Cada problema tiene una solución diferente. En el caso de estimación de parámetros, se puede relacionar de manera directa, con el costo de una investigación o con la precisión requerida para la estimación del parámetro (medida por el error de estimación. En el caso de dócimas de hipótesis, se relaciona con los tipos de errores asociados.

Los pasos para la determinación del tamaño de muestra para la estimación de parámetros son los siguientes: a. Debe haber algún enunciado acerca de lo que se espera de la muestra. Dicho enunciado puede establecerse respecto a la precisión (error de estimación “d” deseado) o con el costo disponible para el muestreo. b. Debe encontrarse alguna ecuación que conecte n con la precisión deseada (error de estimación ”d”) Esta ecuación contendrá, como parámetros, ciertas propiedades desconocidas de la población, las cuales deberán ser estimadas para lograr resultados específicos. c. En una investigación generalmente se mide más de una variable (estimándose diferentes parámetros). Si para cada una se especifica la precisión deseada, podrían ser necesarios tamaños de muestra diferentes para cada variable. Se deberá encontrar algún método para conciliar esos requerimientos de diferentes tamaños de muestra d. Finalmente, debe examinarse el valor de n determinado respecto a su consistencia con los recursos de que se dispone para realizar el muestreo. Esto significa estimaciones del costo, trabajo, tiempo y materiales necesarios para obtener el tamaño propuesto. A veces se hace necesario considerar una reducción drástica del tamaño de muestra determinado. Esto hace que se deba decidir si se continua con la investigación, empleando un tamaño de muestra menor y esperando obtener una precisión también menor a la deseada, o se suspende la investigación hasta conseguir más recursos.

El tamaño de muestra n mínimo para estimar la media poblacional de una variable dada cuya varianza poblacional es σ2; con un error de estimación d; un nivel de confianza t de (1-α)100% dado por el cuantil de la distribución t o de la normal y representado por t, siendo N el número de unidades de la población, se obtiene a partir de la definición del error de estimación:

t Sdn

=

2 22 t Sd

n=

Despejando para n se tiene la relación siguiente, denominado “tamaño de muestra

preliminar” n0: 22 2

0 2

t S t Sndd

⎛ ⎞= = ⎜ ⎟⎝ ⎠

Si se conoce el tamaño de la población N, el tamaño de muestra definitivo es:

0

01

nn

nN

=+

Page 58: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

55

Observaciones: 1. Si no se conoce S se puede estimar mediante una muestra piloto, de tamaño arbitrario, seleccionada de la población en estudio. También para una confianza del 95%, se puede usar t=2 como valor preliminar. Una vez determinado un tamaño de muestra, se puede corregir el valor de t usando la tabla “t” de Student. Este proceso se puede repetir hasta estabilizar el tamaño de la muestra.

2. En la expresión para “n”, la influencia de N se manifiesta como un factor de corrección del valor de no para disminuir este valor, lo que ocurrirá si n es grande respecto a N. 3. Si N no se conoce se puede emplear el valor n0. El efecto de usar un tamaño de muestra mayor al necesario es mejorar la precisión esperada de la estimación, lo que es bueno si no hay problemas de costo asociados a la selección de la muestra. Ejemplo 1: Con el objeto de determinar el tamaño de muestra que se requiere para estimar el puntaje medio en un test de Computación a las secretarias de una empresa, con un error de 3 puntos y una confianza del 95%, como no se conocía la varianza de los puntajes, se seleccionó una muestra piloto de 6 puntajes con los resultados siguientes: 110 98 95 103 106 89. Por lo tanto, los datos básicos son: t=2; d=3 pt ; S= 7,68 pt.(de muestra piloto). El tamaño de la muestra preliminar es:

2 2 22

02 7,68 15,35 5,11 26, 2 27 secret.

3 3t Snd

⋅⎛ ⎞ ⎛ ⎞ ⎛ ⎞= = = = = ≈⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠

Ejemplo 2: En ejemplo anterior, si se sabe que el número de secretarias de la empresa son N=64, entonces el tamaño de la muestra necesario será:

0

0

2 6 , 2 2 6 , 2 2 6 , 2 1 8 , 6 1 9 s e c2 6 , 2 1 0 , 4 0 9 1, 4 0 911

6 4

nn r

ne t

N

= = = = = ≈+++

Ejemplo 3: Si en el ejemplo anterior, se desea obtener un error de estimación para estimar el puntaje medio en el test, correspondiente al 5% de la media.

De la muestra piloto se obtiene 1 0 0 , 2=X pt y S= 7,68 pt. Por lo tanto, el error de

estimación es el 5% de la media estimada de la muestra, esto es (0,05)(100,3)=5,015. Luego, con los datos básicos son: t=2; d=5,015 pt ; S= 7,68 pt. El tamaño de la

muestra preliminar es:

2 222

02 7 , 6 8 1 5 , 3 5 3, 0 6 9 , 4 1 0 s e c re t .5 , 0 1 5 5 , 0 1 5

t Snd

⋅⎛ ⎞ ⎛ ⎞⎛ ⎞= = = = = ≈⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠

Page 59: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

56

Considerando que N=64 secret., el tamaño de muestra definitivo es:

0

0

9 , 4 9 , 4 9 , 4 8 , 2 9 s e c9 , 4 1 0 ,1 4 7 1,1 4 7116 4

nn r

ne t

N

= = = = = ≈+++

Ejemplo 4: Si en el ejemplo anterior, se desea estimar el puntaje medio en el test y se dispone de $·32.000.- para realizar el muestreo y seleccionar una unidad de muestreo vale $3.000.

En este caso, el tamaño de la muestra es 10 secretarias pues no alcanza el presupuesto para seleccionar 11 secretarias, pues:

32000 10,7 10 secret3000

n = = ≈

Page 60: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

57

9. PRUEBA DE HIPÓTESIS (DOCIMASIA)

Se mencionó que las dos grandes áreas de la Inferencia son la estimación de parámetros poblacionales y el someter a prueba (docimar, contrastar) hipótesis estadísticas sobre parámetros poblacionales. El empleo de estos procedimientos puede depender del conocimiento existente sobre una población. Si no hay información, posiblemente el interés se centre en estimar alguna característica de la misma. Si existe alguna información referente a la población de interés, el objetivo puede ser el aprovecharla para formular hipótesis. 9.1. TIPOS DE HIPÓTESIS 9.1.1. Hipótesis de Investigación

Las hipótesis de investigación son las hipótesis sustantivas que guían la investigación, por estar fundamentadas teóricamente. Se expresan como posibles contestaciones a una pregunta de investigación. Además, se formulan en términos de las relaciones que existen entre las variables del estudio.

Por ejemplo, en un estudio sobre los niveles de stress de las secretarias de una

empresa, podría preguntarse (esta sería la pregunta de investigación): ¿Cuál es el nivel de stress de las secretarias de la empresa en comparación al nivel de stress que se podría considerar habitual para este tipo de trabajo?

Una posible respuesta a esta pregunta de investigación (la hipótesis) sería postular, luego de analizar los antecedentes (que según el tipo de estudio puede consistir en los fundamentos teóricos así como la información de otros estudios o de organismos relacionados con el tema), que el nivel de stress (la variable de interés) de las secretarias de la empresa analizada es inferior al nivel habitual de las mismas pues las secretarias de al empresa habían recibido una capacitación en esa área. Esta declaración no es otra cosa que nuestra hipótesis de investigación y constituye, en principio, nuestra respuesta tentativa a la pregunta de investigación. Pero también, los estudios relacionados o la información disponible, nos podrían llevar a postular que el nivel de stress es mayor que el de otras secretarias, o, si no hay seguridad en cuanto al sentido de la comparación, que sólo es diferente al de otras secretarias.

9.1.2. Hipótesis Estadísticas Las Hipótesis Estadísticas corresponden a la traducción de la Hipótesis de Investigación en términos de aseveraciones o conjeturas acerca de la distribución de una o más variables. Específicamente, las hipótesis estadísticas pueden referirse a parámetros poblacionales (Medias, Proporciones, Varianzas etc.) o a la forma de la distribución (Normal, Uniforme etc.).

Operativamente, las hipótesis estadísticas se expresan como la Hipótesis Nula (H0) y la Hipótesis Alternativa (H1). La primera, generalmente, establece lo conocido o lo conservador, mientras que la segunda, que es complementaria a la anterior, refleja lo novedoso o lo que usualmente interesa al investigador. Ambas hipótesis agotan las posibles alternativas, en cuanto a valores de parámetros o formas de distribución. Siguiendo con el ejemplo, se puede considerar que el “nivel medio de stress” corresponde al parámetro de interés. Si además suponemos que se empleará un test estandarizado con una Media de 500 puntos y una desviación estándar de 100 puntos. Estos valores se pueden considerar como características de la población y se usarán como valor de referencia para plantear las diversas hipótesis.

Page 61: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

58

Las distintas situaciones señaladas permiten traducir la Hipótesis de Investigación en las siguientes Hipótesis Estadísticas, considerando que lo conocido debe formar parte de la Hipótesis Nula.

Definiendo a “µ : Nivel medio de stress de las secretarias, en puntos” las posibles hipótesis que se pueden plantear son las siguientes: a) H0: µ = 500 puntos H1: µ ≠ 500 puntos

b) H0 : µ ≤ 500 puntos H1 : µ > 500 puntos

c) H0 : µ ≥ 500 puntos H1 : µ < 500 puntos

Las hipótesis anteriores se denominan (a) bilateral, bidireccional o de dos colas, (b) y (c) se denominan unilaterales, unidireccionales o de una cola. Conviene tener presente que en un problema particular, ante una Hipótesis de Investigación sólo una de las alternativas anteriores (a, b ó c) se deberá considerar. 9.2. PROCEDIMIENTO DE LA PRUEBA DE HIPÓTESIS La Prueba de Hipótesis (o dócima de hipótesis) es el procedimiento o la regla de decisión que se emplea para decidir sobre la aceptación o no de la Hipótesis Nula.

La Prueba de Hipótesis consiste en suponer verdadera la Hipótesis Nula y derivar las consecuencias que ello implica. Finalmente, se contrastan las consecuencias mencionadas con la información que aporta la muestra de la población, resumida en los estimadores respectivos que se denominan estadísticos de prueba. Si los resultados muestrales son coherentes con las consecuencias, ello se interpreta como que la Hipótesis Nula no es contradictoria y se decidirá aceptarla. Por el contrario, si los resultados muestrales no son coherentes con las consecuencias, ello se interpreta en el sentido que la Hipótesis Nula es contradictoria y se decidirá no aceptarla (y se aceptará su complemento, la Hipótesis Alternativa). La decisión, en cualquier caso, involucra riesgos de equivocarse. Continuando con el ejemplo, supongamos que las secretarias de la empresa asistieron a un taller de capacitación para controlar el stress, por lo tanto se espera que el nivel de stress de las mismas sea inferior al del común de las secretarias. Por ello, las hipótesis de interés correspondientes se plantean como:

H0: µ ≥ 500 puntos H1: µ < 500 puntos

La Hipótesis Nula refleja la condición normal de stress, que son un nivel medio de 500 puntos o superior, mientras la hipótesis alternativa refleja lo que se espera se ha logrado con el taller de capacitación, esto es, que el promedio de stress sea inferior a 500 puntos.

Como se emplea una muestra para decidir, y si se supone que en verdad el puntaje medio de las secretarias es 500 puntos, las muestras de secretarias seleccionadas pueden diferir de ese valor. El problema es determinar hasta que punto se pueden considerar diferencias, dado que el puntaje medio realmente es 500. El monto del error admisible es denominado nivel de significación y simbolizado por α. En todo caso, si en las muestras se obtuvieran valores bajos respecto a 500 puntos, ello sería indicio que el puntaje medio de los secretarias de la empresa es inferior a 500 puntos. Por ello se denomina unilateral a la prueba respectiva. Si se supone que la Hipótesis Nula es verdadera (se puede sólo suponer pues es imposible saberlo con certeza) y es rechazada por la prueba, se cometería el error tipo I cuya magnitud es α y es el nivel de significación. Si se supone que la Hipótesis Nula no es verdadera y no es rechazada por la prueba, se cometería el error tipo II cuya magnitud es β (el valor 1-β se denomina potencia de la dócima).

Page 62: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

59

En las aplicaciones, generalmente se emplean niveles de significación del 5% o del 1% para tomar decisiones (o riesgos de equivocarse si la hipótesis nula es verdadera). Sin embargo, los software estadístico (como SPSS u otros) o Excel entregan los denominados valores-p (p-value) usualmente como valores de significación los que facilitan mucho la decisión de aceptar o no la Hipótesis Nula, lo que en definitiva se realiza, comparando dicho valor con el nivel de significación decidido por el investigador ( por ejemplo 5% o 1%). 9.3. ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS A continuación, se detallan los principales elementos involucrados en una Prueba de Hipótesis: a) Prueba: Es el procedimiento o la regla de decisión que se emplea para decidir sobre la aceptación o no de la Hipótesis Nula. La selección de la prueba se realiza, considerando la Hipótesis de la Investigación y la respectivas Hipótesis Estadísticas, considerando las características de la muestra y los supuestos necesarios para desarrollar la prueba (p.ej. normalidad, aleatoriedad de la muestra, independencia etc.) b) Hipótesis Nula (H0): Es la hipótesis que señala lo tradicional y se supone que es verdadera para desarrollar el procedimiento de la prueba. c) Hipótesis Alternativa (H1): Es complementaria a H0, refleja lo novedoso o lo que usualmente interesa al investigador. Ambas hipótesis agotan las posibles alternativas, en cuanto a valores de parámetros o formas de distribución. d) Nivel de significación (α): Corresponde a la probabilidad de rechazar una hipótesis que puede ser verdadera (se denomina también error tipo I). Valores usuales son 5% y 1% (α=0,05 o α=0,01). Es fijado por el investigador. e) Estadística de Prueba: Es la estadística muestral empleada en la prueba. Tiene una distribución en el muestreo con características que se asocian con el parámetro que se estima. f) Región Crítica (RC): Corresponde al conjunto de valores de la estadística de prueba que llevan al rechazo de H0. Dependen del nivel de significación fijado y de la Hipótesis alternativa. Puede corresponder a un área en una cola de la distribución de la estadística de prueba (en dócimas unilaterales) o a dos áreas en las colas de esa distribución (en dócimas bilaterales). Cuando se conoce el valor-p (valor de significación), no es necesario indicar la región crítica como ocurre al usar un software estadístico. g) Región de Aceptación (RA): Es el complemento de la región crítica. No es necesario indicarla pues toda la prueba se realiza en función de la Hipótesis Nula y su región crítica.

Page 63: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

60

9.3.1. Ejemplo (Secretarias y stress) En el ejemplo siguiente se presentan los elementos antes mencionados con algún detalle. Más adelante, se presentará un esquema de trabajo más sintético para el desarrollo de las pruebas de hipótesis así como el Supongamos que se realizó un taller de capacitación a las secretarias de una empresa con el objeto de reducir su nivel de stress. Para comprobar los efectos se piensa emplear un test desarrollado para medir stress en una población de trabajadores, de condiciones de salud normal, el que se ha estandarizado asignándole un Puntaje Medio µ=500 ptos con una desviación estándar σ=100 ptos. (o sea la varianza es σ2=10.000 ptos2). Al cabo de seis meses de asistencia al taller de capacitación se aplicó el test de stress a una muestra de 16 secretarias con los resultados siguientes (en puntos):

542 479 520 560 508 563 496 507363 340 365 365 354 368 387 421

¿Los resultados obtenidos permiten avalar la hipótesis que el nivel medio de stress en

las secretarias de la empresa ha disminuido? o sea ¿Ha sido exitoso el taller de capacitación para disminuir el nivel de stress? El razonamiento para decidir sobre la hipótesis planteada es el siguiente: a) Planteamiento de las Hipótesis y Supuestos:

Hipótesis Nula (Ho): El taller de capacitación no ha sido exitoso, por ello los

resultados de la aplicación del test de stress de las secretarias de la empresa son los mismos que la población corriente (con una Media Poblacional µ=500 ptos.)

Hipótesis Alternativa (H1): El taller ha sido exitoso, por lo que los rendimientos en el test constituyen una población con una Media Poblacional µ<500 ptos

Supuestos: La varianza de los puntajes es conocida y es σ2=10.000 ptos2

(La desviación estándar es σ=100 ptos.) La muestra de 16 secretarias es una muestra aleatoria de la población. b) Nivel de significación (α)

Suponiendo que los resultados en el test de las secretarias de la empresa son los habituales, esto es la Media Poblacional son 500 puntos (µ=500 ptos.), la conocida variabilidad de los valores de las Medias Aritméticas de muestras (de n=16) tomadas de esa población, posibilita el hecho que las muestras puedan presentar Medias Aritméticas muy bajas o altas respecto a 500 puntos. Sin embargo, puede esperarse que eso no ocurra con mucha frecuencia y lo habitual será obtener valores cercanos a 500. Pero ¿qué puede entenderse como valores habituales? Para resolver este punto se acostumbra a considerar un porcentaje del total de resultados de las Medias Aritméticas, como ser 95% (o 99%), como los “valores habituales”. Lo anterior implica fijar en 5% el riesgo de equivocarse (Nivel de significación α=0,05), pues se considera no habitual a los valores extremos que son el 5% del total

c) Estadística de Prueba

En consideración a que H0 es una hipótesis sobre la Media Poblacional, la Media Aritmética X es el mejor estimador de la misma. En este ejemplo, las Medias Aritméticas de muestras de tamaño n=16 tienen una distribución Normal con Media (µ=500 ptos) y Varianza = 10.000/16 = 625. En resumen, X ∼N(500; 625).

Page 64: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

61

d) Regiones Crítica y de Aceptación de H0.

Considerando el 95% como porcentaje de valores habituales de la Media Aritmética, entonces pueden determinarse los extremos del intervalo del 95% de los valores habituales para la Media Aritmética. Ellos definirán la Región de Aceptación de la dócima. Para ello, se considera lo siguiente:

P( X > iX )=0,95 , Por otra parte, la Tabla de la D. Normal indica que: P(Z>-1,645)=0,95. Igualando las expresiones se tiene:

( 500) 16 (1,645)(100)1,645 ; 500 500 (1,645)(25) 500 41,13 458,87100 16

ii

Xluego X

−= − = − = − = − =

Por lo tanto, si una muestra tiene X ≥458,9 se considera es el 95% de valores habituales para una población con media poblacional de 500 puntos. Este intervalo es la REGIÖN DE ACEPTACIÖN de H0. Por el contrario, si una muestra tiene X <458,9 se considera que no es lo habitual para una población con media poblacional de 500 puntos. Este intervalo es la REGIÖN CRÍTICA O DE RECHAZO de H0.

En las aplicaciones, las Regiones Críticas o de Aceptación se definirán en función de la distribución del estadístico de prueba, lo que facilita su determinación. En este ejemplo, la Región Crítica se define como en conjunto de valores de Z tal que (Z<-1,645) y la Región de Aceptación corresponde al intervalo de valores de Z tal que (Z≥-1,645). En general, sólo se necesita establecer una de estas regiones y ella será la Región Crítica o de Rechazo de H

e) Evaluación de la Estadística de Prueba y Decisión sobre H0.

Volviendo a los datos de los resultados de la muestra de las secretarias, se puede apreciar que la Media Aritmética de los puntajes de la muestra es X =446,1 ptos, valor que es menor a 458,9 y pertenece a la Región Crítica o de rechazo de H0. Por lo tanto, con un riesgo de error del 5% (nivel de significación) se decide que el resultado medio de la muestra de secretarias de la empresa no corresponde a aquellos que se estimarían habituales, rechazándose la Hipótesis Nula. Lo anterior implica que aceptar que el nivel medio de las secretarias en la prueba de stress es menor a 500 puntos, por lo tanto, se considera que el taller de capacitación fue exitoso para disminuir el nivel de stress.

9.3.2. Desarrollo del Ejemplo en forma alternativa Como se menciono, puede resultar más cómodo definir el conjunto de valores de la Región Crítica (de rechazo de H0) en función de la variable aleatoria según se distribuye la estadística de prueba. En el ejemplo, es Z. Para tomar una decisión, se basa en el valor de la estadística para los valores observados de la muestra, según si pertenece o no a la Región Crítica. En el ejemplo, la Región Crítica se define como: RC={Z/ Z<-1,645} El valor de la estadística para la muestra es: Z=(446,1-500)/25 =-53,9/25= -2,16 Como Z=-2,16 < -1,645 entonces dentro del intervalo correspondiente a la Región Crítica. Esto significa que el resultado observado para el puntaje medio de las secretarias (446,1) ptos no es un resultado habitual, lo que implica no aceptar la Hipótesis Nula, con un riesgo de error (nivel de significación) del 5%.

Page 65: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

62

9.3.3. Esquema Para Realizar una Dócima o Prueba de Hipótesis Los pasos para realizar una dócima, en síntesis, son los siguientes: a) Formular las Hipótesis Nula (H0) y Alternativa (H1) b) Establecer el nivel de significación (α) c) Indicar los supuestos del problema (distribuciones, parámetros conocidos, etc.) d) Seleccionar la Estadística de Prueba apropiada según los supuestos del problema e) Determinar la Región Crítica (rechazo de H0) según nivel de significación. f) Empleando la información muestral, evaluar la Estadística de Prueba

g) Comparar el valor anterior con los que definen la Región Crítica. Si el valor observado pertenece a la Región Crítica se decide rechazar H0 (y aceptar H1). Si el valor observado no pertenece a la Región Crítica se decide no rechazar H0.

Page 66: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

63

10. DÓCIMAS SOBRE PARÁMETROS DE UNA POBLACION

10.1. DÓCIMA SOBRE LA MEDIA POBLACIONAL (µ) CON VARIANZA CONOCIDA (Σ2) 1. Hipótesis: (Siendo µ0 es un valor que se conoce)

a) Bilateral H0: µ = µ0

H1: µ ≠ µ0

b) unilateral izquierda H0 : µ ≥ µ0

H1 : µ < µ0

c) Unilateral derecha H0 : µ ≤ µ0

H1 : µ > µ0

2. Supuestos: 1. La muestra se selecciona aleatoriamente 2. La varianza poblacional (σ2) es conocida 3. Las muestras provienen de una población con distribución normal o no 3. Nivel de significación: α 4. Estadística de Prueba:

( ) (0; 1)X nZ Nµσ−

= ∼

5. Región Crítica:

a) Bilateral RCb={Z<-Z(1- α/2) ó Z>Z(1- α/2)}

b) unilateral izquierda RCi={Z<-Z(1- α)}

c) Unilateral derecha RCd={Z>Z(1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar X obtenido de la muestra en Estadística de Prueba para obtener Zobs. 2. Si Zobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Zobs no pertenece a la Región Crítica, no se rechaza H0

Page 67: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

64

10.1.1. Ejemplo (Secretarias y stress)

Se realizó un taller de capacitación a las secretarias de una empresa con el objeto de reducir su nivel de stress. Para comprobar los efectos se piensa emplear un test desarrollado para medir stress en una población de trabajadores, de condiciones de salud normal, el que se ha estandarizado asignándole un Puntaje Medio µ=500 ptos con una desviación estándar σ=100 ptos. (o sea la varianza es σ2=10.000 ptos2). Al cabo de seis meses de asistencia al taller de capacitación se aplicó el test de stress a una muestra de 16 secretarias con los resultados siguientes (en puntos):

542 479 520 560 508 563 496 507363 340 365 365 354 368 387 421

¿Los resultados obtenidos permiten avalar la hipótesis que el nivel medio de stress en

las secretarias de la empresa ha disminuido? o sea ¿Ha sido exitoso el taller de capacitación para disminuir el nivel de stress? 1. Hipótesis: (Siendo µ = nivel medio de stress en la población de secretarias)

H0 : µ ≥ 500 puntos H1 : µ < 500 puntos

2. Supuestos:

1. Las muestras se seleccionan aleatoriamente 2. La varianza poblacional es conocida σ2= 10.000 pts2 (σ=100 ptos) 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

( ) ( 500) 16 (0; 1)100

X n XZ Nµσ− −

= = ∼

5. Región Crítica: RCi={Z<-Z(1- α)=-1,645}

6. Evaluación y Decisión sobre H0

Reemplazar X = 446,1 pts obtenido de la muestra en Estadística de Prueba

(446,1 500) 16 ( 53,9)(4) 215,6 2,16100 100 100obsZ − − −

= = = = −

Como Zobs= -2,16 es menor que -1,645 entonces pertenece a la Región Crítica, por lo que se rechaza la Hipótesis Nula, por lo tanto se acepta que el puntaje medio de stress es menor que 500 puntos con un riesgo de error (nivel de significación) del 5%. Como conclusión, se puede afirmar que el taller de capacitación fue efectivo.

Page 68: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

65

10.2. DÓCIMA SOBRE LA MEDIA POBLACIONAL (µ) CON VARIANZA DESCONOCIDA 1. Hipótesis: (Siendo µ0 es un valor que se conoce)

a) Bilateral H0: µ = µ0

H1: µ ≠ µ0

b) Unilateral izquierda H0 : µ ≥ µ0

H1 : µ < µ0

c) Unilateral derecha H0 : µ ≤ µ0

H1 : µ > µ0

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 2. La varianza poblacional (σ2) es desconocida y se estima con S2

3. La muestra provienen de una población con distribución normal 3. Nivel de significación: α 4. Estadística de Prueba:

( ) ( 1X nt tSµ− )n= −∼

5. Región Crítica:

a) Bilateral RCb={t<-t(n-1;1- α/2) ó t>t(n-1;1- α/2)}

c) unilateral izquierda RCi={t<-t(n-1; 1- α)}

c) Unilateral derecha RCd={t>t(n-1; 1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar X obtenido de la muestra en Estadística de Prueba para obtener tobs. 2. Si tobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si tobs no pertenece a la Región Crítica, no se rechaza H0

Page 69: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

66

10.2.1. Ejemplo (Secretarias y stress con menos información poblacional)

Se realizó un taller de capacitación a las secretarias de una empresa con el objeto de reducir su nivel de stress. Para comprobar los efectos se piensa emplear un test desarrollado para medir stress en una población de trabajadores, de condiciones de salud normal, el que se ha estandarizado asignándole un Puntaje Medio µ=500 ptos. Al cabo de seis meses de asistencia al taller de capacitación se aplicó el test de stress a una muestra de 16 secretarias con los resultados siguientes (en puntos):

542 479 520 560 508 563 496 507363 340 365 365 354 368 387 421

¿Los resultados obtenidos permiten avalar la hipótesis que el nivel medio de stress en

las secretarias de la empresa ha disminuido? o sea ¿Ha sido exitoso el taller de capacitación para disminuir el nivel de stress? 1. Hipótesis: (Siendo µ = nivel medio de stress en la población de secretarias)

H0 : µ ≥ 500 puntos H1 : µ < 500 puntos

2. Supuestos:

1. La muestra se selecciona aleatoriamente 2. La varianza poblacional (σ2) es desconocida y se estima con S2

3. La muestra provienen de una población con distribución normal

3. Nivel de significación: α= 0,05 4. Estadística de Prueba:

( ) ( 500) 16 (15)X n Xt tS Sµ− −

= = ∼

5. Región Crítica:

RCi={t<-t(n-1; 1- α)=-t(15; 0,95)=-1,7531}

6. Evaluación y Decisión sobre H0

Reemplazar X = 446,1 y S= 82,64 pts obtenidos de la muestra en Estadística de Prueba para obtener tobs.

(446,1 500) 16 ( 53,9) 16 ( 53,9)(4) 215,6 2,61

82,64 82,64 82,64 82,64obst − − − −= = = = = −

Como tobs= -2,61 es menor que -1,7531 entonces pertenece a la Región Crítica, por lo que se rechaza la Hipótesis Nula, por lo tanto se acepta que el puntaje medio de stress es menor que 500 puntos con un riesgo de error (nivel de significación) del 5%. Como conclusión, se puede afirmar que el taller de capacitación fue efectivo.

Page 70: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

67

10.3. DÓCIMA SOBRE LA PROPORCIÓN POBLACIONAL (π) 1. Hipótesis: (Siendo π0 es un valor que se conoce)

a) Bilateral H0: π = π0

H1: π ≠ π0

b) Unilateral izquierda H0 : π ≥ π0

H1 : π < π0

c) Unilateral derecha H0 : π ≤ π0

H1 : π > π0

2. Supuestos: 1. La muestra se seleccionan aleatoriamente 3. La muestras proviene de una población con distribución binomial 3. Nivel de significación: α 4. Estadística de Prueba:

( ) (0; 1)(1 )

pZ N

n

ππ π−

=−

5. Región Crítica:

a) Bilateral RCb={Z<-Z(1- α/2) ó Z>Z(1- α/2)}

c) Unilateral izquierda RCi={Z<-Z(1- α)}

c) Unilateral derecha RCd={Z>Z(1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar X obtenido de la muestra en Estadística de Prueba para obtener Zobs. 2. Si Zobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Zobs no pertenece a la Región Crítica, no se rechaza H0

Page 71: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

68

10.3.1. Ejemplo (Agencia de publicidad) Una Agencia de Publicidad ha desarrollado un tema para un comercial de un programa de televisión, sobre la base que el 50% de los telespectadores son de 30 o más años de edad. Para determinar si este supuesto es adecuado, hace una investigación seleccionando una muestra aleatoria de 400 telespectadores del programa de TV, observándose que 210 de ello tenían 30 años o más. ¿Sobre la base de los resultados anteriores puede aceptarse el supuesto de la Agencia de Publicidad para su tema del comercial?

1. Hipótesis: (Sea π : Proporción poblacional de telespectadores de 30 años o más)

H0: π = 0,5 H1: π ≠ 0,5

2. Supuestos: 1. La muestras se selecciona aleatoriamente 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

( ) ( 0,5) (0; 1)(1 ) 0,5(1 0,5)

400

p pZ N

n

ππ π− −

= =− −

5. Región Crítica: RCb={Z<-Z(0,975) =-1,96 ó Z>Z(0,975)=1,96 }

6. Evaluación y Decisión sobre H0

De la muestra se obtiene que p= 210/400 = 0,525. Luego,

(0,525 0,5) 0,025 0,025 1,000,0250,5(1 0,5) 0,5(1 0,5)

400 400

obsZ −= = =

− −=

Como Zobs=1,00 no pertenece a la Región Crítica, por lo tanto no hay evidencia

para rechazar la Hipótesis Nula que proporción de telespectadores de 30 o mas años de edad es 50% (con un nivel de significación o riesgo del 5%). Por lo tanto, el supuesto de la Agencia para su tema del comercial es aceptable.

Page 72: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

69

10.4. DÓCIMA SOBRE LA VARIANZA POBLACIONAL (σ2) 1. Hipótesis: (Siendo σ2

0 es un valor que se conoce) a) Bilateral

H0: σ2= σ20

H1: σ2 ≠ σ20

d) Unilateral izquierda H0 : σ2

≥ σ20

H1 : σ2< σ20

c) Unilateral Derecha H0 : σ2

≤ σ20

H1 : σ2 > σ20

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 2. La muestra proviene de una población con distribución normal 3. Nivel de significación: α 4. Estadística de Prueba:

22 2

20

( 1) ( 1)n S nχ χσ−

= −∼

5. Región Crítica: a) Bilateral

RCb={χ2<χ2 (n-1; α/2) ó χ2>χ2

(n-1;1- α/2)} e) unilateral izquierda

RCi={χ2<χ2 (n-1; α)}

c) Unilateral derecha RCd={χ2>χ2

(n-1; 1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar S2 de la muestra en Estadística de Prueba para obtener χ2obs.

2. Si χ2obs pertenece a la Región Crítica se rechaza H0 (y se acepta H1)

3. Si χ2obs no pertenece a la Región Crítica, no se rechaza H0

10.4.1. Ejemplo (Otra mirada al ejemplo de Secretarias y stress) En el ejemplo 2 sobre secretarias y stress no se conocía la varianza poblacional de los resultados del test para medir stress y se estimó con la varianza muestral. ¿Sobre la base de la muestra de los resultados de las 16 secretarias puede aceptarse la hipótesis que la varianza de los puntajes de la población de secretarias es la misma del test, esto es, 10.000 pts2?

1. Hipótesis: Sea σ2: Varianza poblacional de puntajes de las secretarias en test.

H0: σ2= 10.000 pts2

H1: σ2 ≠ 10.000 pts2

2. Supuestos: 1. La muestra se selecciona aleatoriamente 2. La muestra proviene de una población con distribución normal 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

2 22 2

20

( 1) (15) (15)10.000

n S Sχ χσ−

= = ∼

5. Región Crítica: RCb={χ2<χ2

(15; 0,025) =6,262 ó χ2>χ2 (15; 0,975)= 27,488}

6. Evaluación y Decisión sobre H0

De la muestra se obtiene S2=6.829,37 pts2. 2

220

( 1) (15)(6829,37) 102.440,54 10,2410.000 10.000obs

n Sχσ−

= = = =

Como χ2obs =10,24 no pertenece a la Región Crítica, no se rechaza Ho, por lo

tanto se acepta que Varianza de puntajes del test de stress puede ser 10.000 pts2.

Page 73: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

70

10.5. DÓCIMA SOBRE EL COEFICIENTE DE CONFIABILIDAD ALFA DE CRONBACH 1. Hipótesis: (Siendo α0 es un valor que se conoce)

a) Bilateral H0: α = α0H1: α ≠ α0

f) Unilateral izquierda H0 : α ≥ α0

H1 : α < α0

c) Unilateral derecha H0 : α ≤ α0

H1 : α > α0

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 3. Nivel de significación: α (No confundir con Coef de Confiabilidad α )

4. Estadística de Prueba:

0

1 (( 1); ( 1)( 1))1

F F n K nαα−

= − − −−

K=número de ítems; n= tamaño de la muestra a la cual se aplica el test. 5. Región Crítica Siendo los grados libertad: GL= (n-1; (K-1)(n-1))

a) Bilateral RCb={F<F(GL; α/2) ó F>F (GL ; 1- α/2)}

c) Unilateral izquierda RCi={F<F (GL; α)}

c) Unilateral derecha RCd={F>F (GL; 1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar α0 obtenida de la muestra, en Estadística de Prueba para obtener Fobs.

2. Si Fobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Fobs no pertenece a la Región Crítica, no se rechaza H0 10.5.1. Ejemplo Se aplicó un test de inteligencia espacial que consta de 20 ítems a una muestra de 30 sujetos, obteniéndose una confiabilidad, calculada con el coeficiente Alfa de Cronbach de 0,65. ¿Puede aceptarse la hipótesis que el test tiene una confiabilidad poblacional superior a 0,60? 1. Hipótesis: H0 : α ≤ 0,60 H1 : α > 0,60 2. Supuestos: La muestra se selecciona aleatoriamente 3. Nivel de significación: α=0,05

4. Estadística de Prueba: (29;551)0

1 0,61

F Fα

−=

−∼

K=20; n= 30; K-1=29; (k-1)(n-1)=(19)(29)=551 GL=(29;551) 5. Región Crítica: RCd={F>F (29:551; 0,95)}≈ {F>F (30:∞; 0,95)=1,459}

6. Evaluación y Decisión sobre H0

1 0,6 0,40 1,1431 0,65 0,35obsF −

= = =−

Como Fobs=1,143 no pertenece a la Región Crítica, no se rechaza H0, esto implica decidir que el test no tiene confiabilidad poblacional mayor de 0,6.

Page 74: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

71

10.6. ESTIMACIÓN DE TAMAÑOS DE MUESTRA PARA DÓCIMA DE HIPÓTESIS

La estimación del tamaño de la muestra asociado a los problemas de docimasia de hipótesis es diferente al enfoque empleado para la estimación de parámetros.

En dócimas de hipótesis los elementos son las hipótesis planteadas (nula y alternativa),

el nivel de significación (Error tipo I con valor α) utilizado, la estadística de prueba, la distribución de la estadística de prueba, la región crítica.

Los conceptos importantes son: Error tipo I (α): Es la probabilidad de llegar a la conclusión de que la muestra está tomada en una población diferente (es decir existe una diferencia significativa) cuando en realidad no es así (cometiendo un error tipo I). Error tipo II (β): Es la probabilidad de llegar a la conclusión de que no existe ninguna diferencia cuando en realidad si la hay (cometiendo un error tipo II). Potencia (1-β): Es la probabilidad de llegar a la conclusión de que había una diferencia cuando efectivamente así era.

10.6.1. Dócima bilateral Sobre Media Poblacional Con Varianza Conocida

Supongamos que se plantea la hipótesis que el uso de un material escrito en el estudio de Estadística incrementa el nivel de rendimiento de los estudiantes en esa asignatura. Se emplea una prueba estandarizada para medir los rendimientos de los alumnos, que en situación normal tiene una media µ=100 puntos y una desviación estándar σ=15 puntos. Si se decide que una diferencia ∆=5 puntos de aumento en los rendimientos medios es adecuada para aceptar que el método es efectivo ¿Cuál es el tamaño de muestra (número de pruebas) que debe usarse para detectar dicha diferencia? La hipótesis nula es H0: µ =100 puntos y la alternativa es H1: µ ≠ 100.

H0 VC H1

Como se presenta en la figura anterior, si se emplea un nivel de significación α=0,05 y

se desea que el error tipo II no excede de β=0,10 entonces, el valor de la media de puntajes (denominado “valor crítico” VC) para rechazar la Hipótesis nula corresponde, en el ejemplo, al valor del puntaje medio VC asociado con Z(1-α/2)= Z(0,975)=1,96. Pero si el error tipo II es β=0,10 significa que en otra distribución normal, con µ =105 el valor crítico (VC) corresponde a la cola a la izquierda de Z(β)= Z(0,10)= -1,28

Page 75: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

72

Por lo tanto, se pueden plantear las relaciones siguientes, en las dos distribuciones de los puntajes medios muestrales, cuyas medias poblacionales (µ) son 100 y 105 y desviación estándar poblacional (σ) igual a 15 en ambas:

0,95P X VC< =⎡ ⎤⎣ ⎦ y en la otra distribución: 0,10P X VC⎡ ⎤< =⎣ ⎦

(1 / 2)( 100) 0,95VC nP Z α−

⎡ ⎤−≤⎢ 15

=⎥⎣ ⎦

y en la otra distribución:

( 105) 0,1015

VC nP Zβ

⎡ ⎤−≤ =⎢ ⎥

⎣ ⎦

(1 / 2)( 100) 1,96

15VC nZ α−

−= = y en la otra distribución:

( 105) 1,2815

VC nZβ−

= = −

Igualando para VC en las ecuaciones, se llega a:

(1,96)(15) (1,28)(15)100 105n n

+ = −

Despejando para n: (1,96 1, 28)(15)

(105 100)n +=

2 2 22(1,96 1, 28)(15) (3,24)(15) 48,6 9,72 94,5 95

(105 100) 5 5n pruebas

⎡ ⎤+ ⎡ ⎤ ⎡ ⎤= = = = = =⎢ ⎥ ⎢ ⎥ ⎢ ⎥− ⎣ ⎦ ⎣ ⎦⎣ ⎦

Si en vez de estar interesados en detectar una diferencia de ∆=5 puntos en rendimientos medios o si se cambian los valores α ó β (errores tipo I o II), la expresión general para estimar el tamaño de la muestra “n” es:

2

(1 / 2)( )Z Zn α β σ− −⎡ ⎤= ⎢ ⎥∆⎣ ⎦

10.6.2. Dócima Unilateral sobre Media Poblacional con Varianza Conocida

Para el caso unilateral las hipótesis generales son: H0: µ ≤ µ0 y H1: µ > µ0. El desarrollo de la fórmula para el tamaño de la muestra lleva a la expresión siguiente:

2(1 )( )Z Z

n α β σ− −⎡ ⎤= ⎢ ⎥∆⎣ ⎦

10.6.3. Dócima sobre Media Poblacional con Varianza Desconocida Si no se conoce la varianza poblacional σ2 se estima con la varianza muestral S2 (o usando otra información) Sin embargo, la distribución de la media muestral es una distribución “t” con (n-1) grados de libertad, lo que no podría obtenerse si se desconoce “n”. Un procedimiento sugerido por Mace (1964) es el siguiente:

Page 76: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

73

a) Obtener una primera aproximación al tamaño de la muestra (n’) usando los valores asociados con los niveles de errores α ó β (errores tipo I o II) dados por la distribución normal, empleando expresión:

2(1 )( )

'Z Z S

n α β− −⎡ ⎤= ⎢ ⎥∆⎣ ⎦

b) Corregir las estimaciones usando la tabla t respectiva para los niveles de errores y los grados de libertad asociados con n’.

c) Repetir el proceso hasta que se estabilicen los valores de n.

10.6.4. Ejemplo: Un ingeniero desea docimar la hipótesis que la resistencia media de un cierto tipo de resistor es al menos de 3.000 ohms. El fabricante asegura que el rango de tolerancia de la resistencia es aproximadamente ±150 ohms. El ingeniero supone que la resistencia está distribuida normalmente y estima la desviación estándar empleando el recorrido dado por los niveles de tolerencia dividida por 6, esto es 50= (150-(-150) / 6 = 300 / 6 . El ingeniero planea construir una dócima tal que la probabilidad de rechazar la hipótesis nula que la resistencia media es al menos 3.000 ohms es 5% y la probabilidad de fallar en rechazar esa hipótesis cuan la resistencia media es efectivamente 2.980 ohms es 10%. Por lo tanto:

La hipótesis nula es H0: µ ≥ 3.000 puntos y la alternativa es H1: µ < 3.000. Para α = 0,05 el valor de Z(1-α) = Z(0,95) = 1,645 Para β = 0,10 el valor de Zβ = Z(0,10) = -1,282 Se tiene que: S=50 ohms, µ0 = 3.000; µ1 = 2.980 ; ∆ = 20. Reemplazando, como primera aproximación, el valor de n´ es:

[ ]2 2

2(1 )( ) (1,645 1,282)50' 7,3175 52,820

Z Z Sn resistoresα β− −⎡ ⎤ +⎡ ⎤= = = =⎢ ⎥ ⎢ ⎥∆ ⎣ ⎦⎣ ⎦

Corrigiendo los valores de Z por los de “t” se aprecia que: t(53;0,95) =1,6741 y t(53;0,10) =1,2977 Luego reemplazando en expresión anterior:

[ ]2 2

2(52;0,95) (52;0,10)( ) (1,6747 1,2980)50' 720

t t Sn r

−⎡ ⎤ +⎡ ⎤= = = =⎢ ⎥ ⎢ ⎥∆ ⎣ ⎦⎣ ⎦,4318 55,2 esistores

Si se vuelve a corregir la estimación, empleando los valores de “t” con 55 grados de libertad se obtiene que n=55,1=56 resistores. Por lo tanto, el ingeniero concluye que una muestra de 56 transistores se necesita para docimar la hipótesis que la resistencia es de 3.000 ohms al menos, con un nivel de significación del 5% y con un riesgo del 10% de rechazar esa hipótesis cuando el verdadero valor de la resistencia media es 2.980 ohms.

10.6.4. Referencias sobre el tema Se pueden consultar textos de Mace (1964), Montgomery y Runger (1996), Norman y Streiner (1996), Meter y Wasserman (1974). Estor textos traen tablas con los tamaños de muestras para ciertas dócimas. para facilitar la solución del problema.

En Internet se encuentra una gran cantidad de referencias sobre el tema. Además, se encuentra software para la determinación de los tamaños de muestra. Finalmente, en la carrera de Ingeniería en Estadística de la Universidad de Valparaíso se desarrolló una tesis, y un software, para determinar tamaños de muestras para ciertos diseños.

Page 77: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

74

11. DÓCIMAS SOBRE PARÁMETROS DE DOS POBLACIONES

11.1. DÓCIMAS SOBRE LA DIFERENCIA DE MEDIAS POBLACIONALES (µ1-µ2 ) CON VARIANZAS CONOCIDAS (σ2

1 y σ22)

1. Hipótesis:

a) Bilateral H0: µ1 - µ2 = ∆0

H1: µ1 - µ2 ≠ ∆0

b) Unilateral izquierda H0: µ1 - µ2 ≥ ∆0

H1: µ1 - µ2 < ∆0

c) Unilateral derecha H0: µ1 - µ2 ≤ ∆0

H1: µ1 - µ2 > ∆0

Las hipótesis planteadas para una diferencia ∆0=0

a) Bilateral

H0: µ1 = µ2 H1: µ1 ≠ µ2

c) Unilateral izquierda H0 : µ1 ≥ µ2

H1 : µ1 < µ2

c) Unilateral derecha H0 : µ1 ≤ µ2

H1 : µ1 > µ2

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones. 2. Las varianzas poblacionales (σ2

1 y σ22) son conocidas.

3. Las muestras provienen poblaciones con distribución normal. 3. Nivel de significación: α 4. Estadística de Prueba:

1 2 01 2 1 2

2 2 2 21 2 1 2

1 2 1 2

( )( ) ( )(0; 1)

X XX XZ N

n n n n

µ µ

σ σ σ σ

− − ∆− − −= =

+ +

5. Región Crítica:

a) Bilateral RCb={Z<-Z(1- α/2) ó Z>Z(1- α/2)}

b) Unilateral izquierda RCi={Z<-Z(1- α)}

c) Unilateral derecha RCd={Z>Z(1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar 1X y X2 obtenidos de las muestras en Estadística de Prueba para

obtener Zobs. 2. Si Zobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Zobs no pertenece a la Región Crítica, no se rechaza H0

Page 78: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

75

11.1.1. Ejemplo (Comparación de incentivos)

Con el objeto de estudiar el efecto de un incentivo (consistente en dar un día libre) sobre el rendimiento de los trabajadores de una empresa, se anuncio el incentivo a los trabajadores de una planta (A) y se comparó con los rendimientos de otra planta (B) que desempeñaban labores semejantes y tenía un desempeño parecido a la primera. Al cabo de 15 días se comparó los rendimientos, mediante una escala de puntajes estandarizada, con media de 100 puntos y varianza de 500 pts2. La escala se compone de diversos ítems de modo que un puntaje mayor corresponde a un mejor rendimiento. Al aplicarla en muestras de trabajadores de ambas plantas se obtuvieron los resultados siguientes: PLANTA A: 134 146 104 119 124 161 107 83 113 129 97 123 PLANTA B: 70 118 101 85 107 132 94

¿Puede afirmarse que el incentivo permitió incrementar el rendimiento de la Planta A

respecto a la Planta B?

1. Hipótesis: Siendo : µ1 rendimiento medio Planta A µ2 rendimiento medio Planta B

H0 : µ1 ≤ µ2 ó H0: µ1 - µ2 ≤ 0 (∆0 = 0) H1 : µ1 > µ2 ó H1: µ1 - µ2 > 0 (∆0 = 0)

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones.

2. Las varianzas poblacionales se supone que corresponden a la varianza del test y por lo tanto son conocidas (σ2

1 = σ22= 500)

3. Las muestras provienen poblaciones con distribución normal. 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

1 2 1 2 1 2 1 2

2 21 2

1 2

( ) ( ) ( ) 0 ( )(0; 1)

500 500 500 50012 7 12 7

X X X X X XZ N

n n

µ µ

σ σ

− − − − − −= = =

+ ++

5. Región Crítica: RCd={Z>Z(1- α)=Z(0,95)= 1,645}

6. Evaluación y Decisión sobre H0

De las muestras se obtiene:

PLANTA A: n1=12 ; 1 120X = pts

PLANTA B: n2= 7 ; 1 101X = pts

(120 101) 19 19 19 1,7910,63500 500 41,67 71,43 113,1

12 7

obsZ −= = = =

++

=

Como Zobs=1,79 pertenece a la Región Crítica, se rechaza H0. Por lo tanto se acepta que la media poblacional de los rendimientos de la Planta A es superior a la Media poblacional de la Planta B. En conclusión, el incentivo habría sido efectivo para aumentar el rendimiento.

Page 79: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

76

11.2. DÓCIMAS SOBRE LA DIFERENCIA DE MEDIAS POBLACIONALES (µ1-µ2 ) CON VARIANZAS DESCONOCIDAS E IGUALES (σ2

1= σ22= σ2 )

1. Hipótesis:

a) Bilateral H0: µ1 - µ2 = ∆0

H1: µ1 - µ2 ≠ ∆0

d) Unilateral izquierda H0: µ1 - µ2 ≥ ∆0

H1: µ1 - µ2 < ∆0

c) Unilateral derecha H0: µ1 - µ2 ≤ ∆0

H1: µ1 - µ2 > ∆0

Las hipótesis planteadas para una diferencia ∆0=0

a) Bilateral

H0: µ1 = µ2 H1: µ1 ≠ µ2

e) Unilateral izquierda H0 : µ1 ≥ µ2

H1 : µ1 < µ2

c) Unilateral derecha H0 : µ1 ≤ µ2

H1 : µ1 > µ2

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones. 2. Las varianzas poblacionales son desconocidas pero se suponen iguales a σ2 3. Las muestras provienen poblaciones con distribución normal. 3. Nivel de significación: α 4. Estadística de Prueba:

1 2 01 2 1 21 2

1 2 1 2

( )( ) ( )( 2

1 1 1 1P P

X XX Xt t

S Sn n n n

µ µ − −∆− − −= =

+ +∼ )n n+ −

Siendo 2 2

1 1 2

1 2

( 1) ( 1)2P

n S n SS

n n− + −

=+ −

2

5. Región Crítica:

a) Bilateral RCb={t<-t(n1+n2-2; 1- α/2) ó t> t(n1+n2-2; 1- α/2)}

g) unilateral izquierda RCi={t<-t(n1+n2-2; 1- α)}

c) Unilateral derecha RCd={t>t(n1+n2-2; 1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar 1X y X2 y S1

2 y S22 obtenidos de la muestra en Estadística de Prueba

para obtener tobs. 2. Si tobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si tobs no pertenece a la Región Crítica, no se rechaza H0

Page 80: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

77

11.2.1. Ejemplo (Comparación de incentivos sin información de varianzas poblac.)

Con el objeto de estudiar el efecto de un incentivo (consistente en dar un día libre) sobre el rendimiento de los trabajadores de una empresa, se anuncio el incentivo a los trabajadores de una planta (A) y se comparó con los rendimientos de otra planta (B) que desempeñaban labores semejantes y tenía un desempeño parecido a la primera. Al cabo de 15 días se comparó los rendimientos, mediante una escala de puntajes. La escala se compone de diversos ítems de modo que un puntaje mayor corresponde a un mejor rendimiento. Al aplicarla en muestras de trabajadores de ambas plantas se obtuvieron los resultados siguientes: PLANTA A: 134 146 104 119 124 161 107 83 113 129 97 123 PLANTA B: 70 118 101 85 107 132 94

¿Puede afirmarse que el incentivo permitió incrementar el rendimiento de la Planta A respecto a la Planta B?

1. Hipótesis: Siendo : µ1 rendimiento medio Planta A µ2 rendimiento medio Planta B

H0 : µ1 ≤ µ2 ó H0: µ1 - µ2 ≤ 0 (∆0 = 0) H1 : µ1 > µ2 ó H1: µ1 - µ2 > 0 (∆0 = 0)

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones.

2. Las varianzas poblacionales son desconocidas pero como se mide con la misma escala se supone que puede tener el mismo valor (σ2

1 = σ22= σ2)

3. Las muestras provienen poblaciones con distribución normal. 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

1 2 1 2 1 2

1 2

( ) ( ) ( )(17)

1 1 1 112 7P P

X X X Xt t

S Sn n

µ µ− − − −= =

+ +∼

Siendo 2 2

1 1 2

1 2

( 1) ( 1)2P

n S n SS

n n− + −

=+ −

2

5. Región Crítica: RCd={t>t(n1+n2-2; 1- α)}={t>t(17; 0,95)= 1,7396}

6. Evaluación y Decisión sobre H0

De las muestras se obtiene: PLANTA A: n1=12 ; 1 120X = pts ; S1

2 =457,45 pts2.

PLANTA B: n2= 7 ; 1 101X = pts ; S12 =425,33 pts2.

2 2

1 1 2 2

1 2

( 1) ( 1) (11)(457, 45) (6)(425,33) 5.031,95 2.551,98 7.583,93 446,11 21,122 17 17 17P

n S n SS

n n− + − + +

= = = = =+ −

=

1 2( ) (120 101) 19 19 19 1,89(21,12)(0, 476) 10,041 1 1 1 21,12 0, 226221,12

12 7 12 7

obs

P

X Xt

S

− −= = = = = =

+ +

Como tobs=1,89 pertenece a la Región Crítica, se rechaza H0. Por lo tanto se

acepta que la media poblacional de los rendimientos de la Planta A es superior a la Media poblacional de rendimientos de la Planta B. En conclusión, el incentivo habría sido efectivo para aumentar el rendimiento.

Page 81: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

78

11.3. DOCIMAS SOBRE LA DIFERENCIA DE MEDIAS POBLACIONALES (µ1-µ2 ) PARA DATOS PAREADOS 1. Hipótesis:

a) Bilateral H0: µ1 - µ2 = ∆0

H1: µ1 - µ2 ≠ ∆0

f) Unilateral izquierda H0: µ1 - µ2 ≥ ∆0

H1: µ1 - µ2 < ∆0

c) Unilateral derecha H0: µ1 - µ2 ≤ ∆0

H1: µ1 - µ2 > ∆0

Las hipótesis planteadas para una diferencia ∆0=0

a) Bilateral

H0: µ1 = µ2 (D = 0) H1: µ1 ≠ µ2 (D ≠ 0)

g) Unilateral izquierda H0 : µ1 ≥ µ2 (D ≥ 0) H1 : µ1 < µ2 (D< 0)

c) Unilateral derecha H0 : µ1 ≤ µ2 (D ≤ 0) H1 : µ1 > µ2 (D >0)

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones.

2. Los datos son bivariantes o pueden parerase 3. Nivel de significación: α 4. Estadística de Prueba:

´0( ) ( ) ( 1D D

D n D nt tS S

−∆)n= = −∼

1 2siendo D X X= − SD : Desviación Estándar de diferencias datos X1-X2

5. Región Crítica:

a) Bilateral

RCb={t<-t(n-1;1- α/2) o t>t(n-1;1- α/2)} c) Unilateral izquierda

RCi={t<-t(n-1; 1- α)} c) Unilateral derecha

RCd={t>t(n-1; 1- α)}

6. Evaluación y Decisión sobre H0:

1. Calcular 1 2D X X= − así como SD obtenidos de las diferencias en la muestra,

reemplazar en Estadística de Prueba para obtener tobs. 2. Si tobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si tobs no pertenece a la Región Crítica, no se rechaza H0

Page 82: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

79

11.3.1. Ejemplo (Ruido y coordinación) Un investigador está interesado en estudiar el efecto producido por el ruido en la coordinación entre el pulso y la vista de los cirujanos. El investigador tomó una prueba estandarizad de coordinación entre el pulso y la vista a nueve cirujanos en ambas condiciones, silenciosa y ruidosa (Un puntaje mayor indica mayor coordinación). La hipótesis del investigador es que la coordinación es mayor en silencio que con ruido. Dócima la hipótesis. Usar α=0,05.

CIRUJANO 1 2 3 4 5 6 7 8 9

SILECIO 18 21 19 21 17 20 18 16 20RUIDO 12 21 16 16 19 19 16 17 16

1. Hipótesis: Siendo D= µ1 - µ2= Coordinación Media en silencio – Coord. Media con ruido

H0 : µ1 ≤ µ2 (D ≤ 0) H1 : µ1 > µ2 (D >0)

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente de las poblaciones.

2. Los datos son bivariantes o pueden parerase 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

( ) 9 (8)

D

Dt tS

= ∼

5. Región Crítica: RCd={t>t(n-1; 1- α)= t(8; 0,95)= 1,8595}}

6. Evaluación y Decisión sobre H0:

CIRUJANO 1 2 3 4 5 6 7 8 9X1=SILECIO 18 21 19 21 17 20 18 16 20X2=RUIDO 12 21 16 16 19 19 16 17 16

Di= X1 - X2 6 0 3 5 -2 1 2 -1 4

D = 2,0 pts.; SD= 2,74 pts. ; ( ) 9 (2)(3) 6

2,74 2,74obsD

DtS

= = = = 2,19

Como tobs=2,19 pertenece a la Región Crítica, entonces se rechaza la Hipótesis

Nula, esto es, se acepta que la coordinación media en silencio es mayor que la coordinación media con ruido, al nivel de significación del 5%.

OBSERVACIÓN:

Estudie si se llega a la misma conclusión empleando el nivel de significación α=0,01

Page 83: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

80

11.4. DOCIMAS SOBRE DIFERENCIA DE PROPORCIONES POBLACIONALES (π1 – π2) 1. Hipótesis:

a) Bilateral H0: π1 – π2 = ∆0

H1: π1 – π2 ≠ ∆0

h) Unilateral izquierda H0: π1 – π2 ≥ ∆0

H1: π1 – π2 < ∆0

c) Unilateral derecha H0: π1 – π2 ≤ ∆0

H1: π1 – π2 > ∆0

Las hipótesis planteadas para una diferencia ∆0=0

a) Bilateral

H0: π1 = π2

H1: π1 ≠ π2

i) Unilateral izquierda H0 : µ 1 ≥ µ2

H1 : µ1 < µ2

c) Unilateral derecha H0 : µ1 ≤ µ2

H1 : µ1 > µ2

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 2. Las muestras provienen de una población con distribución binomial

3. La muestra es suficientemente grande para justificar la aproximación a la Normal de la distribución de la proporción muestral "p".

3. Nivel de significación: α 4. Estadística de Prueba:

1 2 01 2 1 2

1 2 1 2

( )( ) ( )(0; 1)

1 1 1 1

p pp pZ N

pq pqn n n n

π π − − ∆− − −= =

⎛ ⎞ ⎛ ⎞+ +⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

Siendo 1 1 2 2

1 2

; 1n p n p

p qn n+

p= = −+

5. Región Crítica: a) Bilateral

RCb={Z<-Z(1- α/2) ó Z>Z(1- α/2)} d) Unilateral izquierda RCi={Z<-Z(1- α)}

c) Unilateral derecha RCd={Z>Z(1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar p1 y p2 obtenidos de la muestra en Estadística de Prueba para obtener “p” y el valor de Zobs.

2. Si Zobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Zobs no pertenece a la Región Crítica, no se rechaza H0

Page 84: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

81

11.4.1. Ejemplo (Opiniones de Psicólogos y Psiquiatras) Un investigador está interesado en comparar las opiniones de psicólogos y psiquiatras sobre las causas de la esquizofrenia (anormalidad bioquímica o inadaptación de la niñez). Para ello, tomó muestras aleatorias de 120 psicólogos y 80 psiquiatras y les consultó su opinión, con los resultados siguientes:

CAUSA DE ESQUIZOFRENIA PSICÓLOGOS PSIQUIATRAS Anormalidad Bioquímica 60 50 Inadaptación de la niñez 60 30

TOTAL 120 80 Dócime la hipótesis sobre si la proporción de psicólogos y psiquiatras que tiene la misma opinión es la misma. Use α = 0,05. 1. Hipótesis: Siendo π1: Proporción de psicólogos que opina que es anormalidad bioquímica

π2: Proporción de psiquiatras que opina que es anormalidad bioquímica H0: π1 = π2H1: π1 ≠ π2

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente y son grandes 2. Las muestras provienen de una población con distribución binomial 3. Nivel de significación: α=0,05 4. Estadística de Prueba:

1 2( )(0; 1)

1 1120 80

p pZ N

pq

−==

⎛ ⎞+⎜ ⎟⎝ ⎠

Siendo 1 1 2 2

1 2

; 1n p n p

p qn n+

p= = −+

5. Región Crítica:

RCb={Z<-Z(0,975) =-1,96 ó Z>Z(0,975) =1,96} 6. Evaluación y Decisión sobre H0

p1=60/120 = 0,5 ; p2= 50/80 = 0,625

1 1 2 2

1 2

(120)(0,5) (80)(0,625) 60 50 110120 80 200 200

n p n pp

n n+ + +

= = = =+ +

=0,55 ; q = 0,45

( )1 2( ) 0,500 0,625 0,125 0,125

0,0718(0,55)(0, 45) 0,020831 1 1 1(0,55)(0, 45)120 80 120 80

p pZ

pq

− − −== = = = =

⎛ ⎞ ⎛ ⎞+ +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

−-1,74

Como Zobs=-1,74 no pertenece a la Región Crítica, no se rechaza la Hipótesis

nula. Por lo tanto, las opiniones sobre la causa de la esquizofrenia son las mismas entre las poblaciones de los psicólogos y los psiquiatras estudiados.

Page 85: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

82

11.5. DOCIMAS SOBRE COMPARACIÓN DE VARIANZAS POBLACIONALES (σ1

2 Y σ22)

1. Hipótesis:

a) Bilateral H0: σ2

1= σ22

H1: σ21 ≠ σ2

2

b) Unilateral izquierda H0 : σ2

1≥ σ22

H1 : σ21< σ2

2

c) Unilateral Derecha H0 : σ2

1 ≤ σ22

H1 : σ21> σ2

2

Expresando la hipótesis respecto al cuociente de varianzas con valor R0:

a) Bilateral

21

0 022

:H Rσσ

=

21

0 022

:H Rσσ

b) Unilateral izquierda 21

0 022

:H Rσσ

21

0 022

:H Rσσ

<

c) Unilateral Derecha 21

0 022

:H Rσσ

21

0 022

:H Rσσ

>

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 2. La muestra proviene de una población con distribución normal 3. Nivel de significación: α 4. Estadística de Prueba:

2 2 21 1 1

1 22 2 22 2 2 0

/( 1; 1

/S S

F F nS S R

σσ

)n= = −∼ −

5. Región Crítica Siendo los grados libertad: GL= (n1-1; n2-1)

a) Bilateral RCb={F<F(GL; α/2) ó F>F (GL ; 1- α/2)}

d) Unilateral izquierda RCi={F<F (GL; α)}

c) Unilateral derecha RCd={F>F (GL; 1- α)}

6. Evaluación y Decisión sobre H0

1. Reemplazar S12 y S2

2 obtenidas de las muestras en Estadística de Prueba para obtener Fobs.

2. Si Fobs pertenece a la Región Crítica se rechaza H0 (y se acepta H1) 3. Si Fobs no pertenece a la Región Crítica, no se rechaza H0

Page 86: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

83

11.5.1. Ejemplo (Comparación de incentivos supuesto de varianzas poblacionales iguales)

Con el objeto de estudiar el efecto de un incentivo (consistente en dar un día libre) sobre el rendimiento de los trabajadores de una empresa, se anuncio el incentivo a los trabajadores de una planta (A) y se comparó con los rendimientos de otra planta (B) que desempeñaban labores semejantes y tenía un desempeño parecido a la primera. Al cabo de 15 días se comparó los rendimientos, mediante una escala de puntajes. La escala se compone de diversos ítems de modo que un puntaje mayor corresponde a un mejor rendimiento. Al aplicarla en muestras de trabajadores de ambas plantas se obtuvieron los resultados siguientes:

PLANTA A: 134 146 104 119 124 161 107 83 113 129 97 123 PLANTA B: 70 118 101 85 107 132 94

¿Puede afirmarse que las varianzas poblacionales de los rendimientos de la Planta A y la Planta B son iguales? 1. Hipótesis: Siendo σ2

1: Varianza rendimientos trabajadores planta A σ2

2: Varianza rendimientos trabajadores planta B

H0: σ21 = σ2

2 ó 2

10 2

2

: 1Hσσ

=

H1: σ21 ≠ σ2

2

21

0 22

: 1Hσσ

2. Supuestos: 1. Las muestras se seleccionan aleatoriamente 2. Las muestras proviene de poblaciones con distribución normal 3. Nivel de significación: α=0,10 4. Estadística de Prueba:

2 2 2 21 1 1 1

02 2 2 22 2 2 0 2

/ 1 (/ obs

S S SF siendo R entonces F FS S R S

σσ

= = = = ∼ 11; 6)

5. Región Crítica: g: grados libertad g=(n1-1; n2-1)

RCb={F<F(11; 6; 0,05) =0,311 ó F>F (11; 6; 0,95) =4,06} (Se emplearon los valores aproximados F(10;6;0,05) y F(10;6;0,95))

6. Evaluación y Decisión sobre H0

De las muestras se obtiene: PLANTA A: n1=12 ; S1

2 = 457,45 pts2. PLANTA B: n2= 7 ; S2

2 = 425,33 pts2. 2

122

457, 45425,33obs

SF

S= = = 1,08

Como Fobs= 1,08 no pertenece a la Región crítica, no se rechaza la Hipótesis nula. Por lo tanto, el supuesto de igualdad de varianzas que se empleó en el ejercicio 6 fue correcto.

Page 87: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

84

11.6. EJERCICIOS 1. El investigador Olthoff(1989) analizó la calidad de la comunicación entre parejas comprometidas tres meses antes y tres meses después del matrimonio. Uno de los grupos estudiados estaba formado por 19 parejas que habían recibido el acostumbrado curso prematrimonial por ministros que iban celebrar su matrimonio. Se midió la calidad de la comunicación mediante una escala apropiada en que un puntaje mayor indica mejor calidad de la comunicación. ¿Puede afirmarse que hay algún cambio en la calidad de la comunicación Antes y Después del matrimonio? (Usar α=0,05) (Resp: D=después-Antes D = -12,5 ; SD= 2,85 ; t= -4,23 )

ESPOSO ANTES DESPUES ESPOSO ANTES DESPUES ESPOSO ANTES DESPUES ESPOSO ANTES DESPUES

A 126 115 F 109 82 K 118 107 P 105 87B 133 125 G 124 93 L 126 118 Q 123 121C 126 96 H 98 109 M 121 102 R 125 100D 115 115 I 95 72 N 116 115 S 128 118E 108 119 J 120 104 O 94 83

a. Un psicólogo especializado en desarrollo está estudiando la sensibilidad de los niños frente a extraños, utilizando un nuevo tipo de medida (mayor valor indica mayor sensibilidad). Tiene la posibilidad de medir a 10 niños a los tres meses y a los cuatro meses. El psicólogo estima que la sensibilidad aumenta con la edad. Dócime la hipótesis anterior. Usar α=0,05. (Resp. D=4 meses-3 meses ; D =0,14 ; SD= 0,2; t=0,7 )

NIÑO 1 2 3 4 5 6 7 8 9 10

3 MESES 10,4 12,6 11,2 10,9 14,3 13,2 9,7 11,5 10,8 13,14 MESES 10,8 12,1 12,1 11,4 13,9 13,5 10,9 11,5 10,4 12,5

DÓCIMAS ASOCIADAS CON UN EXPERIMENTO 3. Con el propósito de estudiar la efectividad de un método para aumentar el rendimiento en Matemáticas en 4º Medio, mediante el empleo del computador, se realizó un experimento con escolares de establecimientos municipalizados. Se tomaron dos grupos de estudiantes de similares características de edad y sexo. Al primer grupo (Grupo Experimental) se les aplicó el método nuevo. Al segundo grupo de escolares no se les aplicó el método nuevo (Grupo Control). En ambos grupos se vieron los mismos contenidos y se les aplicó una misma prueba, en que un puntaje mayor indica mayor nivel de rendimiento. Se realizaron mediciones, a ambos grupos, antes de la capacitación (Preexp y Precont) y luego de realizada esta (Postexp y Postcont). A continuación se presentan los datos, valores de medias, varianzas, proporciones de cada grupo. Los investigadores se plantean las siguientes hipótesis: a) El rendimiento medio del grupo experimental después del experimento es superior a

140 puntos. (Resp: tobs=2,08 ; No rechazar H0 ) b) La proporción de alumnos que obtuvieron puntajes superiores a 140 puntos es mayor

al 50% (Resp: Zobs=0,902 ; No rechazar H0 ) c) Las varianza del grupo del grupo experimental después del experimento es igual a la

varianza del grupo control después del experimento. (Resp: Fobs=1,81; No rechazar H0)

Page 88: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

85

d) El puntaje medio del grupo experimental después del experimento es superior al puntaje medio del grupo control después del experimento. (Resp: tobs = 2,46 ; Rechazar H0 )

e) El puntaje medio del grupo experimental después del experimento es superior al

puntaje medio del grupo experimental antes del experimento. (Resp: tobs= 5,16 ; Rechazar H0 ) f) Las proporciones de alumnos con puntajes superiores a 140 puntos antes del

experimento del grupo experimental no es diferente a la misma proporción antes del experimento del grupo control (Resp: Zobs= 1,23 ; No rechazar H0 )

h) Calcule las diferencias para cada alumno del grupo experimental entre resultado del

Post y el Pre, esto es, se define la diferencia D(exp)=Postexp – Prexp. Lo mismo se hace para cada alumno del grupo control entre el Post y el Pre. Esto es, se define la diferencia D(cont)= Postcont-Precont. Desarrolle una dócima de diferencia de medias para las diferencias del grupo experimental y el grupo control (Resp: tobs= 3,98 ; Rechazar H0 )

Desarrolle las dócimas respectivas. Utilice un nivel de significación del 5%. Plantee otras dócimas que parezcan interesantes, y desarróllelas. Exprese conclusiones referentes al problema estudiado.

GRUPO EXPERIMENTAL GRUPO CONTROL

NOMBRE POSTEXP PREXP NOMBRE POSTCONT PRECONT1. Alvarez 140 125 1. Baeza 128 1252. Benítez 151 148 2. Cerda 138 1403. Bravo 152 148 3. Duarte 136 1334. Cárdenas 151 147 4. Escalante 134 1325. Díaz 163 146 5. Figueroa 141 1406. Espinoza 148 145 6. Leiva 129 1307. Fuentes 133 123 7. Martín 145 1468. Hurtado 135 130 8. Palma 149 1499. Trujillo 139 132 9. Pérez 137 13210. Veas 141 133 10. Zamora 134 13311. Zapata 148 132

Casos 11 11 Casos 10 10Media Aritmética 145,55 137,18 Media Aritmética 137,10 136,00Desv. Estándar 8,84 9,70 Desv. Estándar 6,57 7,51Varianza 82,99 86,49 Varianza 43,21 56,44Prop. > 140 pts. 7/11 7/12 Prop. > 140 pts. 3/10 2/10

Page 89: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

86

BIBLIOGRAFÍA (complementaria) AGRESTI Alan & AGRESTI, Barbara F. (1979) Statistical Methods for the Social Sciences. San Francisco: Dellen Pub. Co. ARON, Arthur y ARON, Elaine N. (2001) Estadística para Psicología. Buenos Aires: Pearson Education. DOANE, David (1985) Exploring Statistics with the IBM PC. Reading, Mass.: Addison-

Wesley Pub. Co. DOWNIE, N. M., HEATH, R. W (1973) Métodos estadisticos aplicados. México: Harla ELORZA, Haroldo (1987) Estadística para ciencias del comportamiento. México:Harla ESCALANTE, Eduardo y CARO, Alberto (2002) Análisis y Tratamiento de Datos en SPSS. Valparaíso: Ediciones Univ. de Playa Ancha de Cs. de la Ed. GARNER, Robert C. (2003) Estadística para Psicología usando SPSS para Windows.

México: Pearson Educación. GUILFORD, J. P. y FRUCHTER, B. (1984) Estadística aplicada a la Psicologia y la

Educación. México: Mc Graw-Hill. HOPKINS, Kenneth D., HOPKINS, B. R. y GLASS, Gene V. (1997) Estadística Básica para

las Ciencias Sociales y del Comportamiento (3ª Ed.). México: Prentice-Hall Hispanoamericana S. A.

LOPES, Paulo Alfonso (2000) Probabilidad & Estadística. Conceptos, modelos,

aplicaciones en Excel. Santa Fé de Bogotá: Pearson Educación de Colombia Ltda. MACE, Arthur E. (1964) Simple-Size determination. New York: Reinhold Publishing Co. MARQUES DE CANTÚ, María José (1990) Probabilidad y Estadística para ciencias Químico- Biológicas. México: McGraw-Hill. MONTGOMERY, Douglas C. y RUNGEr, George C. (1996) Probabilidad y Estadística aplicadas a la Ingeniería. México: McGraw-Hill. NETER, John & WASSERMAN, William (1974) Applied Linear Statistical Models.

Regression, Analysis of Variance, and Experimental Designs. Homewood, Ill.: Richard D. Irwin, Inc.

NORMAN, G. R. y STREINER, D. L. (1996) Bioestadística. Madrid: Mosby/Doyma Libros S.A. PÉREZ, César (2001) Técnicas Estadísticas con SPSS. Madrid: Pearson Educación. PÉREZ, César (2002) Estadística Aplicada a través de Excel. Madrid: Pearson Educación. SPIEGEL, Murray R. (1987) Estadística. Serie Schaum (2ª Ed.) Panamá: McGraw-Hill.

Page 90: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

87

ANEXOS

ANEXO 1: Funciones de Distribución

- Normal Estándar - “t” de Student - Ji Cuadrado - F

ANEXO 2: Formularios Probabilidades e Inferencia

Page 91: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

88

VALORES DE LA FUNCIÓN DE DISTRIBUCIÓN NORMAL ESTÁNDARΦ(Z) = P(Z<z)

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09-3,0 0,0013 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,42470,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,46410,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000

Page 92: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

89

g.l. 0,750 0,900 0,950 0,975 0,990 0,995 g.l. 0,750 0,900 0,950 0,975 0,990 0,9951 1,000 3,078 6,314 12,706 31,821 63,656 46 0,680 1,300 1,679 2,013 2,410 2,6872 0,816 1,886 2,920 4,303 6,965 9,925 47 0,680 1,300 1,678 2,012 2,408 2,6853 0,765 1,638 2,353 3,182 4,541 5,841 48 0,680 1,299 1,677 2,011 2,407 2,6824 0,741 1,533 2,132 2,776 3,747 4,604 49 0,680 1,299 1,677 2,010 2,405 2,6805 0,727 1,476 2,015 2,571 3,365 4,032 50 0,679 1,299 1,676 2,009 2,403 2,6786 0,718 1,440 1,943 2,447 3,143 3,707 51 0,679 1,298 1,675 2,008 2,402 2,6767 0,711 1,415 1,895 2,365 2,998 3,499 52 0,679 1,298 1,675 2,007 2,400 2,6748 0,706 1,397 1,860 2,306 2,896 3,355 53 0,679 1,298 1,674 2,006 2,399 2,6729 0,703 1,383 1,833 2,262 2,821 3,250 54 0,679 1,297 1,674 2,005 2,397 2,67010 0,700 1,372 1,812 2,228 2,764 3,169 55 0,679 1,297 1,673 2,004 2,396 2,66811 0,697 1,363 1,796 2,201 2,718 3,106 56 0,679 1,297 1,673 2,003 2,395 2,66712 0,695 1,356 1,782 2,179 2,681 3,055 57 0,679 1,297 1,672 2,002 2,394 2,66513 0,694 1,350 1,771 2,160 2,650 3,012 58 0,679 1,296 1,672 2,002 2,392 2,66314 0,692 1,345 1,761 2,145 2,624 2,977 59 0,679 1,296 1,671 2,001 2,391 2,66215 0,691 1,341 1,753 2,131 2,602 2,947 60 0,679 1,296 1,671 2,000 2,390 2,66016 0,690 1,337 1,746 2,120 2,583 2,921 61 0,679 1,296 1,670 2,000 2,389 2,65917 0,689 1,333 1,740 2,110 2,567 2,898 62 0,678 1,295 1,670 1,999 2,388 2,65718 0,688 1,330 1,734 2,101 2,552 2,878 63 0,678 1,295 1,669 1,998 2,387 2,65619 0,688 1,328 1,729 2,093 2,539 2,861 64 0,678 1,295 1,669 1,998 2,386 2,65520 0,687 1,325 1,725 2,086 2,528 2,845 65 0,678 1,295 1,669 1,997 2,385 2,65421 0,686 1,323 1,721 2,080 2,518 2,831 66 0,678 1,295 1,668 1,997 2,384 2,65222 0,686 1,321 1,717 2,074 2,508 2,819 67 0,678 1,294 1,668 1,996 2,383 2,65123 0,685 1,319 1,714 2,069 2,500 2,807 68 0,678 1,294 1,668 1,995 2,382 2,65024 0,685 1,318 1,711 2,064 2,492 2,797 69 0,678 1,294 1,667 1,995 2,382 2,64925 0,684 1,316 1,708 2,060 2,485 2,787 70 0,678 1,294 1,667 1,994 2,381 2,64826 0,684 1,315 1,706 2,056 2,479 2,779 71 0,678 1,294 1,667 1,994 2,380 2,64727 0,684 1,314 1,703 2,052 2,473 2,771 72 0,678 1,293 1,666 1,993 2,379 2,64628 0,683 1,313 1,701 2,048 2,467 2,763 73 0,678 1,293 1,666 1,993 2,379 2,64529 0,683 1,311 1,699 2,045 2,462 2,756 74 0,678 1,293 1,666 1,993 2,378 2,64430 0,683 1,310 1,697 2,042 2,457 2,750 75 0,678 1,293 1,665 1,992 2,377 2,64331 0,682 1,309 1,696 2,040 2,453 2,744 76 0,678 1,293 1,665 1,992 2,376 2,64232 0,682 1,309 1,694 2,037 2,449 2,738 77 0,678 1,293 1,665 1,991 2,376 2,64133 0,682 1,308 1,692 2,035 2,445 2,733 78 0,678 1,292 1,665 1,991 2,375 2,64034 0,682 1,307 1,691 2,032 2,441 2,728 79 0,678 1,292 1,664 1,990 2,374 2,63935 0,682 1,306 1,690 2,030 2,438 2,724 80 0,678 1,292 1,664 1,990 2,374 2,63936 0,681 1,306 1,688 2,028 2,434 2,719 81 0,678 1,292 1,664 1,990 2,373 2,63837 0,681 1,305 1,687 2,026 2,431 2,715 82 0,677 1,292 1,664 1,989 2,373 2,63738 0,681 1,304 1,686 2,024 2,429 2,712 83 0,677 1,292 1,663 1,989 2,372 2,63639 0,681 1,304 1,685 2,023 2,426 2,708 84 0,677 1,292 1,663 1,989 2,372 2,63640 0,681 1,303 1,684 2,021 2,423 2,704 85 0,677 1,292 1,663 1,988 2,371 2,63541 0,681 1,303 1,683 2,020 2,421 2,701 86 0,677 1,291 1,663 1,988 2,370 2,63442 0,680 1,302 1,682 2,018 2,418 2,698 87 0,677 1,291 1,663 1,988 2,370 2,63443 0,680 1,302 1,681 2,017 2,416 2,695 88 0,677 1,291 1,662 1,987 2,369 2,63344 0,680 1,301 1,680 2,015 2,414 2,692 89 0,677 1,291 1,662 1,987 2,369 2,63245 0,680 1,301 1,679 2,014 2,412 2,690 90 0,677 1,291 1,662 1,987 2,368 2,632

Interpretación: Para g.l.= 40 P(t < 2,0211) = 0,975A. Caro v.05

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN "t" DE STUDENT

Page 93: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

90

gr.lib 0,005 0,010 0,025 0,050 0,100 0,250 gr.lib 0,750 0,900 0,950 0,975 0,990 0,9951 0,000 0,000 0,001 0,004 0,016 0,102 1 1,323 2,706 3,841 5,024 6,635 7,8792 0,010 0,020 0,051 0,103 0,211 0,575 2 2,773 4,605 5,991 7,378 9,210 10,5973 0,072 0,115 0,216 0,352 0,584 1,213 3 4,108 6,251 7,815 9,348 11,345 12,8384 0,207 0,297 0,484 0,711 1,064 1,923 4 5,385 7,779 9,488 11,143 13,277 14,8605 0,412 0,554 0,831 1,145 1,610 2,675 5 6,626 9,236 11,070 12,832 15,086 16,7506 0,676 0,872 1,237 1,635 2,204 3,455 6 7,841 10,645 12,592 14,449 16,812 18,5487 0,989 1,239 1,690 2,167 2,833 4,255 7 9,037 12,017 14,067 16,013 18,475 20,2788 1,344 1,647 2,180 2,733 3,490 5,071 8 10,219 13,362 15,507 17,535 20,090 21,9559 1,735 2,088 2,700 3,325 4,168 5,899 9 11,389 14,684 16,919 19,023 21,666 23,58910 2,156 2,558 3,247 3,940 4,865 6,737 10 12,549 15,987 18,307 20,483 23,209 25,18811 2,603 3,053 3,816 4,575 5,578 7,584 11 13,701 17,275 19,675 21,920 24,725 26,75712 3,074 3,571 4,404 5,226 6,304 8,438 12 14,845 18,549 21,026 23,337 26,217 28,30013 3,565 4,107 5,009 5,892 7,041 9,299 13 15,984 19,812 22,362 24,736 27,688 29,81914 4,075 4,660 5,629 6,571 7,790 10,165 14 17,117 21,064 23,685 26,119 29,141 31,31915 4,601 5,229 6,262 7,261 8,547 11,037 15 18,245 22,307 24,996 27,488 30,578 32,80116 5,142 5,812 6,908 7,962 9,312 11,912 16 19,369 23,542 26,296 28,845 32,000 34,26717 5,697 6,408 7,564 8,672 10,085 12,792 17 20,489 24,769 27,587 30,191 33,409 35,71818 6,265 7,015 8,231 9,390 10,865 13,675 18 21,605 25,989 28,869 31,526 34,805 37,15619 6,844 7,633 8,907 10,117 11,651 14,562 19 22,718 27,204 30,144 32,852 36,191 38,58220 7,434 8,260 9,591 10,851 12,443 15,452 20 23,828 28,412 31,410 34,170 37,566 39,99721 8,034 8,897 10,283 11,591 13,240 16,344 21 24,935 29,615 32,671 35,479 38,932 41,40122 8,643 9,542 10,982 12,338 14,041 17,240 22 26,039 30,813 33,924 36,781 40,289 42,79623 9,260 10,196 11,689 13,091 14,848 18,137 23 27,141 32,007 35,172 38,076 41,638 44,18124 9,886 10,856 12,401 13,848 15,659 19,037 24 28,241 33,196 36,415 39,364 42,980 45,55825 10,520 11,524 13,120 14,611 16,473 19,939 25 29,339 34,382 37,652 40,646 44,314 46,92826 11,160 12,198 13,844 15,379 17,292 20,843 26 30,435 35,563 38,885 41,923 45,642 48,29027 11,808 12,878 14,573 16,151 18,114 21,749 27 31,528 36,741 40,113 43,195 46,963 49,64528 12,461 13,565 15,308 16,928 18,939 22,657 28 32,620 37,916 41,337 44,461 48,278 50,99429 13,121 14,256 16,047 17,708 19,768 23,567 29 33,711 39,087 42,557 45,722 49,588 52,33530 13,787 14,953 16,791 18,493 20,599 24,478 30 34,800 40,256 43,773 46,979 50,892 53,67231 14,458 15,655 17,539 19,281 21,434 25,390 31 35,887 41,422 44,985 48,232 52,191 55,00232 15,134 16,362 18,291 20,072 22,271 26,304 32 36,973 42,585 46,194 49,480 53,486 56,32833 15,815 17,073 19,047 20,867 23,110 27,219 33 38,058 43,745 47,400 50,725 54,775 57,64834 16,501 17,789 19,806 21,664 23,952 28,136 34 39,141 44,903 48,602 51,966 56,061 58,96435 17,192 18,509 20,569 22,465 24,797 29,054 35 40,223 46,059 49,802 53,203 57,342 60,27536 17,887 19,233 21,336 23,269 25,643 29,973 36 41,304 47,212 50,998 54,437 58,619 61,58137 18,586 19,960 22,106 24,075 26,492 30,893 37 42,383 48,363 52,192 55,668 59,893 62,88338 19,289 20,691 22,878 24,884 27,343 31,815 38 43,462 49,513 53,384 56,895 61,162 64,18139 19,996 21,426 23,654 25,695 28,196 32,737 39 44,539 50,660 54,572 58,120 62,428 65,47540 20,707 22,164 24,433 26,509 29,051 33,660 40 45,616 51,805 55,758 59,342 63,691 66,76641 21,421 22,906 25,215 27,326 29,907 34,585 41 46,692 52,949 56,942 60,561 64,950 68,05342 22,138 23,650 25,999 28,144 30,765 35,510 42 47,766 54,090 58,124 61,777 66,206 69,33643 22,860 24,398 26,785 28,965 31,625 36,436 43 48,840 55,230 59,304 62,990 67,459 70,61644 23,584 25,148 27,575 29,787 32,487 37,363 44 49,913 56,369 60,481 64,201 68,710 71,89245 24,311 25,901 28,366 30,612 33,350 38,291 45 50,985 57,505 61,656 65,410 69,957 73,166

Interpretación: Para g.l. = 40 se tiene que P(χ2 < 59,342) = 0,975A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN χ2 (JI CUADRADO)

Page 94: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

91

α = 0,01

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 0,000 0,010 0,029 0,047 0,062 0,073 0,082 0,089 0,095 0,100 0,115 0,124 0,132 0,1512 0,000 0,010 0,032 0,056 0,075 0,092 0,105 0,116 0,125 0,132 0,157 0,171 0,186 0,2173 0,000 0,010 0,034 0,060 0,083 0,102 0,118 0,132 0,143 0,153 0,185 0,203 0,222 0,2644 0,000 0,010 0,035 0,063 0,088 0,109 0,127 0,143 0,156 0,167 0,204 0,226 0,249 0,3015 0,000 0,010 0,035 0,064 0,091 0,114 0,134 0,151 0,165 0,177 0,220 0,244 0,270 0,3316 0,000 0,010 0,036 0,066 0,094 0,118 0,139 0,157 0,172 0,186 0,232 0,258 0,288 0,3577 0,000 0,010 0,036 0,067 0,096 0,121 0,143 0,162 0,178 0,192 0,241 0,270 0,303 0,3798 0,000 0,010 0,036 0,068 0,097 0,123 0,146 0,166 0,183 0,198 0,250 0,281 0,315 0,3989 0,000 0,010 0,037 0,068 0,098 0,125 0,149 0,169 0,187 0,202 0,257 0,289 0,326 0,41510 0,000 0,010 0,037 0,069 0,099 0,127 0,151 0,172 0,190 0,206 0,263 0,297 0,336 0,43111 0,000 0,010 0,037 0,069 0,100 0,128 0,153 0,174 0,193 0,210 0,268 0,304 0,344 0,44512 0,000 0,010 0,037 0,070 0,101 0,130 0,155 0,176 0,196 0,213 0,273 0,309 0,352 0,45813 0,000 0,010 0,037 0,070 0,102 0,131 0,156 0,178 0,198 0,215 0,277 0,315 0,359 0,46914 0,000 0,010 0,037 0,070 0,102 0,131 0,157 0,180 0,200 0,217 0,281 0,320 0,365 0,48015 0,000 0,010 0,037 0,070 0,103 0,132 0,158 0,181 0,202 0,219 0,284 0,324 0,370 0,49116 0,000 0,010 0,037 0,071 0,103 0,133 0,159 0,183 0,203 0,221 0,287 0,328 0,375 0,50017 0,000 0,010 0,037 0,071 0,104 0,134 0,160 0,184 0,204 0,223 0,290 0,331 0,380 0,50918 0,000 0,010 0,037 0,071 0,104 0,134 0,161 0,185 0,206 0,224 0,292 0,335 0,385 0,51719 0,000 0,010 0,037 0,071 0,104 0,135 0,162 0,186 0,207 0,226 0,294 0,338 0,389 0,52520 0,000 0,010 0,037 0,071 0,105 0,135 0,162 0,187 0,208 0,227 0,297 0,340 0,392 0,53221 0,000 0,010 0,038 0,071 0,105 0,136 0,163 0,187 0,209 0,228 0,299 0,343 0,396 0,53922 0,000 0,010 0,038 0,072 0,105 0,136 0,164 0,188 0,210 0,229 0,300 0,345 0,399 0,54623 0,000 0,010 0,038 0,072 0,105 0,136 0,164 0,189 0,211 0,230 0,302 0,348 0,402 0,55224 0,000 0,010 0,038 0,072 0,106 0,137 0,165 0,189 0,211 0,231 0,304 0,350 0,405 0,55825 0,000 0,010 0,038 0,072 0,106 0,137 0,165 0,190 0,212 0,232 0,305 0,352 0,408 0,56426 0,000 0,010 0,038 0,072 0,106 0,137 0,165 0,191 0,213 0,233 0,306 0,354 0,410 0,57027 0,000 0,010 0,038 0,072 0,106 0,138 0,166 0,191 0,213 0,233 0,308 0,355 0,413 0,57528 0,000 0,010 0,038 0,072 0,106 0,138 0,166 0,192 0,214 0,234 0,309 0,357 0,415 0,58029 0,000 0,010 0,038 0,072 0,106 0,138 0,167 0,192 0,215 0,235 0,310 0,358 0,417 0,58530 0,000 0,010 0,038 0,072 0,107 0,138 0,167 0,192 0,215 0,235 0,311 0,360 0,419 0,58931 0,000 0,010 0,038 0,072 0,107 0,139 0,167 0,193 0,216 0,236 0,312 0,361 0,421 0,59432 0,000 0,010 0,038 0,072 0,107 0,139 0,167 0,193 0,216 0,237 0,313 0,363 0,423 0,59833 0,000 0,010 0,038 0,072 0,107 0,139 0,168 0,193 0,216 0,237 0,314 0,364 0,425 0,60234 0,000 0,010 0,038 0,072 0,107 0,139 0,168 0,194 0,217 0,238 0,315 0,365 0,426 0,60635 0,000 0,010 0,038 0,073 0,107 0,139 0,168 0,194 0,217 0,238 0,316 0,366 0,428 0,61036 0,000 0,010 0,038 0,073 0,107 0,139 0,168 0,194 0,218 0,239 0,316 0,367 0,429 0,61437 0,000 0,010 0,038 0,073 0,107 0,140 0,169 0,195 0,218 0,239 0,317 0,368 0,431 0,61838 0,000 0,010 0,038 0,073 0,107 0,140 0,169 0,195 0,218 0,239 0,318 0,369 0,432 0,62139 0,000 0,010 0,038 0,073 0,108 0,140 0,169 0,195 0,219 0,240 0,319 0,370 0,434 0,62540 0,000 0,010 0,038 0,073 0,108 0,140 0,169 0,195 0,219 0,240 0,319 0,371 0,435 0,62860 0,000 0,010 0,038 0,073 0,109 0,142 0,172 0,199 0,223 0,245 0,328 0,383 0,453 0,67980 0,000 0,010 0,038 0,074 0,109 0,143 0,173 0,200 0,225 0,248 0,333 0,390 0,463 0,712

100 0,000 0,010 0,038 0,074 0,110 0,143 0,174 0,201 0,227 0,249 0,336 0,394 0,469 0,736120 0,000 0,010 0,038 0,074 0,110 0,143 0,174 0,202 0,227 0,250 0,338 0,397 0,474 0,755

8 0,000 0,010 0,038 0,074 0,111 0,145 0,177 0,206 0,232 0,256 0,349 0,413 0,498 0,985

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 0,23) = 0,01

A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 95: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

92

α = 0,025

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 0,002 0,026 0,057 0,082 0,100 0,113 0,124 0,132 0,139 0,144 0,161 0,170 0,180 0,199

2 0,001 0,026 0,062 0,094 0,119 0,138 0,153 0,165 0,175 0,183 0,210 0,224 0,239 0,271

3 0,001 0,026 0,065 0,100 0,129 0,152 0,170 0,185 0,197 0,207 0,241 0,259 0,279 0,321

4 0,001 0,025 0,066 0,104 0,135 0,161 0,181 0,198 0,212 0,224 0,263 0,285 0,308 0,359

5 0,001 0,025 0,067 0,107 0,140 0,167 0,189 0,208 0,223 0,236 0,280 0,304 0,330 0,390

6 0,001 0,025 0,068 0,109 0,143 0,172 0,195 0,215 0,231 0,246 0,293 0,320 0,349 0,415

7 0,001 0,025 0,068 0,110 0,146 0,176 0,200 0,221 0,238 0,253 0,304 0,333 0,364 0,437

8 0,001 0,025 0,069 0,111 0,148 0,179 0,204 0,226 0,244 0,259 0,313 0,343 0,377 0,456

9 0,001 0,025 0,069 0,112 0,150 0,181 0,207 0,230 0,248 0,265 0,320 0,353 0,388 0,473

10 0,001 0,025 0,069 0,113 0,151 0,183 0,210 0,233 0,252 0,269 0,327 0,361 0,398 0,488

11 0,001 0,025 0,070 0,114 0,152 0,185 0,212 0,236 0,256 0,273 0,332 0,368 0,407 0,502

12 0,001 0,025 0,070 0,114 0,153 0,186 0,214 0,238 0,259 0,276 0,337 0,374 0,415 0,514

13 0,001 0,025 0,070 0,115 0,154 0,188 0,216 0,240 0,261 0,279 0,342 0,379 0,422 0,526

14 0,001 0,025 0,070 0,115 0,155 0,189 0,218 0,242 0,263 0,282 0,346 0,384 0,428 0,536

15 0,001 0,025 0,070 0,116 0,156 0,190 0,219 0,244 0,265 0,284 0,349 0,389 0,433 0,546

16 0,001 0,025 0,070 0,116 0,156 0,191 0,220 0,245 0,267 0,286 0,353 0,393 0,439 0,555

17 0,001 0,025 0,070 0,116 0,157 0,192 0,221 0,247 0,269 0,288 0,356 0,396 0,443 0,563

18 0,001 0,025 0,070 0,116 0,157 0,192 0,222 0,248 0,270 0,290 0,358 0,400 0,448 0,571

19 0,001 0,025 0,071 0,117 0,158 0,193 0,223 0,249 0,271 0,291 0,361 0,403 0,452 0,578

20 0,001 0,025 0,071 0,117 0,158 0,193 0,224 0,250 0,273 0,293 0,363 0,406 0,456 0,585

21 0,001 0,025 0,071 0,117 0,158 0,194 0,225 0,251 0,274 0,294 0,365 0,408 0,459 0,592

22 0,001 0,025 0,071 0,117 0,159 0,195 0,225 0,252 0,275 0,295 0,367 0,411 0,462 0,598

23 0,001 0,025 0,071 0,117 0,159 0,195 0,226 0,253 0,276 0,296 0,369 0,413 0,465 0,604

24 0,001 0,025 0,071 0,117 0,159 0,195 0,226 0,253 0,277 0,297 0,370 0,415 0,468 0,610

25 0,001 0,025 0,071 0,118 0,160 0,196 0,227 0,254 0,278 0,298 0,372 0,417 0,471 0,615

26 0,001 0,025 0,071 0,118 0,160 0,196 0,228 0,255 0,278 0,299 0,373 0,419 0,473 0,620

27 0,001 0,025 0,071 0,118 0,160 0,197 0,228 0,255 0,279 0,300 0,375 0,421 0,476 0,625

28 0,001 0,025 0,071 0,118 0,160 0,197 0,228 0,256 0,280 0,301 0,376 0,423 0,478 0,630

29 0,001 0,025 0,071 0,118 0,160 0,197 0,229 0,256 0,280 0,301 0,377 0,424 0,480 0,634

30 0,001 0,025 0,071 0,118 0,161 0,197 0,229 0,257 0,281 0,302 0,378 0,426 0,482 0,639

31 0,001 0,025 0,071 0,118 0,161 0,198 0,230 0,257 0,281 0,303 0,379 0,427 0,484 0,643

32 0,001 0,025 0,071 0,118 0,161 0,198 0,230 0,258 0,282 0,303 0,380 0,429 0,486 0,647

33 0,001 0,025 0,071 0,118 0,161 0,198 0,230 0,258 0,282 0,304 0,381 0,430 0,488 0,651

34 0,001 0,025 0,071 0,119 0,161 0,198 0,231 0,258 0,283 0,304 0,382 0,431 0,489 0,654

35 0,001 0,025 0,071 0,119 0,161 0,199 0,231 0,259 0,283 0,305 0,383 0,432 0,491 0,658

36 0,001 0,025 0,071 0,119 0,161 0,199 0,231 0,259 0,284 0,305 0,384 0,433 0,492 0,661

37 0,001 0,025 0,071 0,119 0,162 0,199 0,231 0,260 0,284 0,306 0,385 0,434 0,494 0,665

38 0,001 0,025 0,071 0,119 0,162 0,199 0,232 0,260 0,285 0,306 0,385 0,435 0,495 0,668

39 0,001 0,025 0,071 0,119 0,162 0,199 0,232 0,260 0,285 0,307 0,386 0,436 0,497 0,671

40 0,001 0,025 0,071 0,119 0,162 0,200 0,232 0,260 0,285 0,307 0,387 0,437 0,498 0,674

60 0,001 0,025 0,071 0,120 0,163 0,202 0,235 0,264 0,290 0,313 0,396 0,450 0,515 0,720

80 0,001 0,025 0,072 0,120 0,164 0,203 0,237 0,266 0,292 0,316 0,401 0,457 0,525 0,750

100 0,001 0,025 0,072 0,120 0,164 0,203 0,238 0,267 0,294 0,317 0,404 0,461 0,531 0,772

120 0,001 0,025 0,072 0,120 0,165 0,204 0,238 0,268 0,295 0,318 0,406 0,464 0,536 0,788

8 0,001 0,025 0,072 0,121 0,166 0,206 0,241 0,272 0,300 0,325 0,417 0,480 0,560 0,988

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 0,293) = 0,025A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 96: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

93

α = 0,05

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 0,006 0,054 0,099 0,130 0,151 0,167 0,179 0,188 0,195 0,201 0,220 0,230 0,240 0,260

2 0,005 0,053 0,105 0,144 0,173 0,194 0,211 0,224 0,235 0,244 0,272 0,286 0,302 0,334

3 0,005 0,052 0,108 0,152 0,185 0,210 0,230 0,246 0,259 0,270 0,304 0,323 0,342 0,384

4 0,004 0,052 0,110 0,157 0,193 0,221 0,243 0,261 0,275 0,288 0,327 0,349 0,372 0,422

5 0,004 0,052 0,111 0,160 0,198 0,228 0,252 0,271 0,287 0,301 0,345 0,369 0,395 0,452

6 0,004 0,052 0,112 0,162 0,202 0,233 0,259 0,279 0,296 0,311 0,358 0,385 0,413 0,476

7 0,004 0,052 0,113 0,164 0,205 0,238 0,264 0,286 0,304 0,319 0,369 0,398 0,428 0,498

8 0,004 0,052 0,113 0,166 0,208 0,241 0,268 0,291 0,310 0,326 0,379 0,409 0,441 0,516

9 0,004 0,052 0,113 0,167 0,210 0,244 0,272 0,295 0,315 0,331 0,386 0,418 0,452 0,532

10 0,004 0,052 0,114 0,168 0,211 0,246 0,275 0,299 0,319 0,336 0,393 0,426 0,462 0,546

11 0,004 0,052 0,114 0,168 0,213 0,248 0,278 0,302 0,322 0,340 0,399 0,433 0,470 0,559

12 0,004 0,052 0,114 0,169 0,214 0,250 0,280 0,305 0,325 0,343 0,404 0,439 0,478 0,571

13 0,004 0,051 0,115 0,170 0,215 0,251 0,282 0,307 0,328 0,346 0,408 0,445 0,485 0,581

14 0,004 0,051 0,115 0,170 0,216 0,253 0,283 0,309 0,331 0,349 0,412 0,449 0,491 0,591

15 0,004 0,051 0,115 0,171 0,217 0,254 0,285 0,311 0,333 0,351 0,416 0,454 0,496 0,600

16 0,004 0,051 0,115 0,171 0,217 0,255 0,286 0,312 0,335 0,354 0,419 0,458 0,501 0,608

17 0,004 0,051 0,115 0,171 0,218 0,256 0,287 0,314 0,336 0,356 0,422 0,462 0,506 0,616

18 0,004 0,051 0,115 0,172 0,218 0,257 0,288 0,315 0,338 0,357 0,425 0,465 0,510 0,623

19 0,004 0,051 0,115 0,172 0,219 0,257 0,289 0,316 0,339 0,359 0,427 0,468 0,514 0,630

20 0,004 0,051 0,115 0,172 0,219 0,258 0,290 0,317 0,341 0,360 0,430 0,471 0,518 0,637

21 0,004 0,051 0,116 0,173 0,220 0,259 0,291 0,318 0,342 0,362 0,432 0,473 0,521 0,643

22 0,004 0,051 0,116 0,173 0,220 0,259 0,292 0,319 0,343 0,363 0,434 0,476 0,524 0,648

23 0,004 0,051 0,116 0,173 0,221 0,260 0,293 0,320 0,344 0,364 0,435 0,478 0,527 0,654

24 0,004 0,051 0,116 0,173 0,221 0,260 0,293 0,321 0,345 0,365 0,437 0,480 0,530 0,659

25 0,004 0,051 0,116 0,173 0,221 0,261 0,294 0,322 0,346 0,366 0,439 0,482 0,532 0,664

26 0,004 0,051 0,116 0,174 0,221 0,261 0,294 0,322 0,346 0,367 0,440 0,484 0,535 0,669

27 0,004 0,051 0,116 0,174 0,222 0,262 0,295 0,323 0,347 0,368 0,441 0,486 0,537 0,673

28 0,004 0,051 0,116 0,174 0,222 0,262 0,295 0,324 0,348 0,369 0,443 0,487 0,539 0,677

29 0,004 0,051 0,116 0,174 0,222 0,262 0,296 0,324 0,349 0,370 0,444 0,489 0,541 0,681

30 0,004 0,051 0,116 0,174 0,222 0,263 0,296 0,325 0,349 0,370 0,445 0,490 0,543 0,685

31 0,004 0,051 0,116 0,174 0,223 0,263 0,297 0,325 0,350 0,371 0,446 0,492 0,545 0,689

32 0,004 0,051 0,116 0,174 0,223 0,263 0,297 0,326 0,350 0,372 0,447 0,493 0,547 0,693

33 0,004 0,051 0,116 0,174 0,223 0,263 0,297 0,326 0,351 0,372 0,448 0,494 0,548 0,696

34 0,004 0,051 0,116 0,174 0,223 0,264 0,298 0,327 0,351 0,373 0,449 0,496 0,550 0,699

35 0,004 0,051 0,116 0,175 0,223 0,264 0,298 0,327 0,352 0,373 0,450 0,497 0,552 0,703

36 0,004 0,051 0,116 0,175 0,223 0,264 0,298 0,327 0,352 0,374 0,451 0,498 0,553 0,706

37 0,004 0,051 0,116 0,175 0,224 0,264 0,299 0,328 0,353 0,374 0,452 0,499 0,554 0,709

38 0,004 0,051 0,116 0,175 0,224 0,265 0,299 0,328 0,353 0,375 0,452 0,500 0,556 0,712

39 0,004 0,051 0,116 0,175 0,224 0,265 0,299 0,328 0,353 0,375 0,453 0,501 0,557 0,715

40 0,004 0,051 0,116 0,175 0,224 0,265 0,299 0,329 0,354 0,376 0,454 0,502 0,558 0,717

60 0,004 0,051 0,117 0,176 0,226 0,267 0,303 0,333 0,359 0,382 0,463 0,514 0,575 0,759

80 0,004 0,051 0,117 0,176 0,227 0,269 0,304 0,335 0,361 0,385 0,468 0,520 0,584 0,785

100 0,004 0,051 0,117 0,177 0,227 0,269 0,305 0,336 0,363 0,386 0,471 0,525 0,590 0,804

120 0,004 0,051 0,117 0,177 0,227 0,270 0,306 0,337 0,364 0,388 0,473 0,527 0,594 0,819

8 0,004 0,051 0,117 0,178 0,229 0,273 0,310 0,342 0,369 0,394 0,484 0,543 0,616 0,990

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 0,360) = 0,05A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 97: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

94

α = 0,95

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 245,95 248,02 250,10 254,31

2 18,513 19,000 19,164 19,247 19,296 19,329 19,353 19,371 19,385 19,396 19,429 19,446 19,463 19,496

3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,785 8,703 8,660 8,617 8,527

4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,858 5,803 5,746 5,628

5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,619 4,558 4,496 4,365

6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 3,938 3,874 3,808 3,669

7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,511 3,445 3,376 3,230

8 5,318 4,459 4,066 3,838 3,688 3,581 3,500 3,438 3,388 3,347 3,218 3,150 3,079 2,928

9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,006 2,936 2,864 2,707

10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,845 2,774 2,700 2,538

11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,719 2,646 2,570 2,405

12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,617 2,544 2,466 2,296

13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,533 2,459 2,380 2,206

14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,463 2,388 2,308 2,131

15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,403 2,328 2,247 2,066

16 4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,352 2,276 2,194 2,010

17 4,451 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494 2,450 2,308 2,230 2,148 1,960

18 4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,269 2,191 2,107 1,917

19 4,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,234 2,155 2,071 1,878

20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,203 2,124 2,039 1,843

21 4,325 3,467 3,072 2,840 2,685 2,573 2,488 2,420 2,366 2,321 2,176 2,096 2,010 1,812

22 4,301 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342 2,297 2,151 2,071 1,984 1,783

23 4,279 3,422 3,028 2,796 2,640 2,528 2,442 2,375 2,320 2,275 2,128 2,048 1,961 1,757

24 4,260 3,403 3,009 2,776 2,621 2,508 2,423 2,355 2,300 2,255 2,108 2,027 1,939 1,733

25 4,242 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,089 2,007 1,919 1,711

26 4,225 3,369 2,975 2,743 2,587 2,474 2,388 2,321 2,265 2,220 2,072 1,990 1,901 1,691

27 4,210 3,354 2,960 2,728 2,572 2,459 2,373 2,305 2,250 2,204 2,056 1,974 1,884 1,672

28 4,196 3,340 2,947 2,714 2,558 2,445 2,359 2,291 2,236 2,190 2,041 1,959 1,869 1,654

29 4,183 3,328 2,934 2,701 2,545 2,432 2,346 2,278 2,223 2,177 2,027 1,945 1,854 1,638

30 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,015 1,932 1,841 1,622

31 4,160 3,305 2,911 2,679 2,523 2,409 2,323 2,255 2,199 2,153 2,003 1,920 1,828 1,608

32 4,149 3,295 2,901 2,668 2,512 2,399 2,313 2,244 2,189 2,142 1,992 1,908 1,817 1,594

33 4,139 3,285 2,892 2,659 2,503 2,389 2,303 2,235 2,179 2,133 1,982 1,898 1,806 1,582

34 4,130 3,276 2,883 2,650 2,494 2,380 2,294 2,225 2,170 2,123 1,972 1,888 1,795 1,569

35 4,121 3,267 2,874 2,641 2,485 2,372 2,285 2,217 2,161 2,114 1,963 1,878 1,786 1,558

36 4,113 3,259 2,866 2,634 2,477 2,364 2,277 2,209 2,153 2,106 1,954 1,870 1,776 1,547

37 4,105 3,252 2,859 2,626 2,470 2,356 2,270 2,201 2,145 2,098 1,946 1,861 1,768 1,537

38 4,098 3,245 2,852 2,619 2,463 2,349 2,262 2,194 2,138 2,091 1,939 1,853 1,760 1,527

39 4,091 3,238 2,845 2,612 2,456 2,342 2,255 2,187 2,131 2,084 1,931 1,846 1,752 1,518

40 4,085 3,232 2,839 2,606 2,449 2,336 2,249 2,180 2,124 2,077 1,924 1,839 1,744 1,509

60 4,001 3,150 2,758 2,525 2,368 2,254 2,167 2,097 2,040 1,993 1,836 1,748 1,649 1,389

80 3,960 3,111 2,719 2,486 2,329 2,214 2,126 2,056 1,999 1,951 1,793 1,703 1,602 1,325

100 3,936 3,087 2,696 2,463 2,305 2,191 2,103 2,032 1,975 1,927 1,768 1,676 1,573 1,283

120 3,920 3,072 2,680 2,447 2,290 2,175 2,087 2,016 1,959 1,910 1,750 1,659 1,554 1,254

8 3,842 2,996 2,605 2,372 2,214 2,099 2,010 1,939 1,880 1,831 1,666 1,571 1,459 1,001

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 2,348) = 0,95A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 98: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

95

α = 0,975

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 647,79 799,48 864,15 899,60 921,83 937,11 948,20 956,64 963,28 968,63 984,87 993,08 1001,40 1018,26

2 38,506 39,000 39,166 39,248 39,298 39,331 39,356 39,373 39,387 39,398 39,431 39,448 39,465 39,498

3 17,443 16,044 15,439 15,101 14,885 14,735 14,624 14,540 14,473 14,419 14,253 14,167 14,081 13,902

4 12,218 10,649 9,979 9,604 9,364 9,197 9,074 8,980 8,905 8,844 8,657 8,560 8,461 8,257

5 10,007 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,428 6,329 6,227 6,015

6 8,813 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,269 5,168 5,065 4,849

7 8,073 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,568 4,467 4,362 4,142

8 7,571 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,101 3,999 3,894 3,670

9 7,209 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,769 3,667 3,560 3,333

10 6,937 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,522 3,419 3,311 3,080

11 6,724 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,330 3,226 3,118 2,883

12 6,554 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,177 3,073 2,963 2,725

13 6,414 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,053 2,948 2,837 2,596

14 6,298 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 2,949 2,844 2,732 2,487

15 6,200 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,862 2,756 2,644 2,395

16 6,115 4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,788 2,681 2,568 2,316

17 6,042 4,619 4,011 3,665 3,438 3,277 3,156 3,061 2,985 2,922 2,723 2,616 2,502 2,248

18 5,978 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,667 2,559 2,445 2,187

19 5,922 4,508 3,903 3,559 3,333 3,172 3,051 2,956 2,880 2,817 2,617 2,509 2,394 2,133

20 5,871 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,573 2,464 2,349 2,085

21 5,827 4,420 3,819 3,475 3,250 3,090 2,969 2,874 2,798 2,735 2,534 2,425 2,308 2,042

22 5,786 4,383 3,783 3,440 3,215 3,055 2,934 2,839 2,763 2,700 2,498 2,389 2,272 2,003

23 5,750 4,349 3,750 3,408 3,183 3,023 2,902 2,808 2,731 2,668 2,466 2,357 2,239 1,968

24 5,717 4,319 3,721 3,379 3,155 2,995 2,874 2,779 2,703 2,640 2,437 2,327 2,209 1,935

25 5,686 4,291 3,694 3,353 3,129 2,969 2,848 2,753 2,677 2,613 2,411 2,300 2,182 1,906

26 5,659 4,265 3,670 3,329 3,105 2,945 2,824 2,729 2,653 2,590 2,387 2,276 2,157 1,878

27 5,633 4,242 3,647 3,307 3,083 2,923 2,802 2,707 2,631 2,568 2,364 2,253 2,133 1,853

28 5,610 4,221 3,626 3,286 3,063 2,903 2,782 2,687 2,611 2,547 2,344 2,232 2,112 1,829

29 5,588 4,201 3,607 3,267 3,044 2,884 2,763 2,669 2,592 2,529 2,325 2,213 2,092 1,807

30 5,568 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,307 2,195 2,074 1,787

31 5,549 4,165 3,573 3,234 3,010 2,851 2,730 2,635 2,558 2,495 2,291 2,178 2,057 1,768

32 5,531 4,149 3,557 3,218 2,995 2,836 2,715 2,620 2,543 2,480 2,275 2,163 2,041 1,750

33 5,515 4,134 3,543 3,204 2,981 2,822 2,701 2,606 2,529 2,466 2,261 2,148 2,026 1,733

34 5,499 4,120 3,529 3,191 2,968 2,808 2,688 2,593 2,516 2,453 2,248 2,135 2,012 1,717

35 5,485 4,106 3,517 3,179 2,956 2,796 2,676 2,581 2,504 2,440 2,235 2,122 1,999 1,702

36 5,471 4,094 3,505 3,167 2,944 2,785 2,664 2,569 2,492 2,429 2,223 2,110 1,986 1,687

37 5,458 4,082 3,493 3,156 2,933 2,774 2,653 2,558 2,481 2,418 2,212 2,098 1,974 1,674

38 5,446 4,071 3,483 3,145 2,923 2,763 2,643 2,548 2,471 2,407 2,201 2,088 1,963 1,661

39 5,435 4,061 3,473 3,135 2,913 2,754 2,633 2,538 2,461 2,397 2,191 2,077 1,953 1,649

40 5,424 4,051 3,463 3,126 2,904 2,744 2,624 2,529 2,452 2,388 2,182 2,068 1,943 1,637

60 5,286 3,925 3,343 3,008 2,786 2,627 2,507 2,412 2,334 2,270 2,061 1,944 1,815 1,482

80 5,218 3,864 3,284 2,950 2,730 2,571 2,450 2,355 2,277 2,213 2,003 1,884 1,752 1,400

100 5,179 3,828 3,250 2,917 2,696 2,537 2,417 2,321 2,244 2,179 1,968 1,849 1,715 1,347

120 5,152 3,805 3,227 2,894 2,674 2,515 2,395 2,299 2,222 2,157 1,945 1,825 1,690 1,311

8 5,024 3,689 3,116 2,786 2,567 2,408 2,288 2,192 2,114 2,048 1,833 1,709 1,566 1,012

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 2,774) = 0,975A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 99: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

96

α = 0,99

ν 2 1 2 3 4 5 6 7 8 9 10 15 20 30 81 4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 6157,0 6208,7 6260,4 6365,6

2 98,502 99,000 99,164 99,251 99,302 99,331 99,357 99,375 99,390 99,397 99,433 99,448 99,466 99,499

3 34,116 30,816 29,457 28,710 28,237 27,911 27,671 27,489 27,345 27,228 26,872 26,690 26,504 26,125

4 21,198 18,000 16,694 15,977 15,522 15,207 14,976 14,799 14,659 14,546 14,198 14,019 13,838 13,463

5 16,258 13,274 12,060 11,392 10,967 10,672 10,456 10,289 10,158 10,051 9,722 9,553 9,379 9,021

6 13,745 10,925 9,780 9,148 8,746 8,466 8,260 8,102 7,976 7,874 7,559 7,396 7,229 6,880

7 12,246 9,547 8,451 7,847 7,460 7,191 6,993 6,840 6,719 6,620 6,314 6,155 5,992 5,650

8 11,259 8,649 7,591 7,006 6,632 6,371 6,178 6,029 5,911 5,814 5,515 5,359 5,198 4,859

9 10,562 8,022 6,992 6,422 6,057 5,802 5,613 5,467 5,351 5,257 4,962 4,808 4,649 4,311

10 10,044 7,559 6,552 5,994 5,636 5,386 5,200 5,057 4,942 4,849 4,558 4,405 4,247 3,909

11 9,646 7,206 6,217 5,668 5,316 5,069 4,886 4,744 4,632 4,539 4,251 4,099 3,941 3,603

12 9,330 6,927 5,953 5,412 5,064 4,821 4,640 4,499 4,388 4,296 4,010 3,858 3,701 3,361

13 9,074 6,701 5,739 5,205 4,862 4,620 4,441 4,302 4,191 4,100 3,815 3,665 3,507 3,165

14 8,862 6,515 5,564 5,035 4,695 4,456 4,278 4,140 4,030 3,939 3,656 3,505 3,348 3,004

15 8,683 6,359 5,417 4,893 4,556 4,318 4,142 4,004 3,895 3,805 3,522 3,372 3,214 2,869

16 8,531 6,226 5,292 4,773 4,437 4,202 4,026 3,890 3,780 3,691 3,409 3,259 3,101 2,753

17 8,400 6,112 5,185 4,669 4,336 4,101 3,927 3,791 3,682 3,593 3,312 3,162 3,003 2,653

18 8,285 6,013 5,092 4,579 4,248 4,015 3,841 3,705 3,597 3,508 3,227 3,077 2,919 2,566

19 8,185 5,926 5,010 4,500 4,171 3,939 3,765 3,631 3,523 3,434 3,153 3,003 2,844 2,489

20 8,096 5,849 4,938 4,431 4,103 3,871 3,699 3,564 3,457 3,368 3,088 2,938 2,778 2,421

21 8,017 5,780 4,874 4,369 4,042 3,812 3,640 3,506 3,398 3,310 3,030 2,880 2,720 2,360

22 7,945 5,719 4,817 4,313 3,988 3,758 3,587 3,453 3,346 3,258 2,978 2,827 2,667 2,306

23 7,881 5,664 4,765 4,264 3,939 3,710 3,539 3,406 3,299 3,211 2,931 2,780 2,620 2,256

24 7,823 5,614 4,718 4,218 3,895 3,667 3,496 3,363 3,256 3,168 2,889 2,738 2,577 2,211

25 7,770 5,568 4,675 4,177 3,855 3,627 3,457 3,324 3,217 3,129 2,850 2,699 2,538 2,170

26 7,721 5,526 4,637 4,140 3,818 3,591 3,421 3,288 3,182 3,094 2,815 2,664 2,503 2,132

27 7,677 5,488 4,601 4,106 3,785 3,558 3,388 3,256 3,149 3,062 2,783 2,632 2,470 2,097

28 7,636 5,453 4,568 4,074 3,754 3,528 3,358 3,226 3,120 3,032 2,753 2,602 2,440 2,064

29 7,598 5,420 4,538 4,045 3,725 3,499 3,330 3,198 3,092 3,005 2,726 2,574 2,412 2,034

30 7,562 5,390 4,510 4,018 3,699 3,473 3,305 3,173 3,067 2,979 2,700 2,549 2,386 2,006

31 7,530 5,362 4,484 3,993 3,675 3,449 3,281 3,149 3,043 2,955 2,677 2,525 2,362 1,980

32 7,499 5,336 4,459 3,969 3,652 3,427 3,258 3,127 3,021 2,934 2,655 2,503 2,340 1,956

33 7,471 5,312 4,437 3,948 3,630 3,406 3,238 3,106 3,000 2,913 2,634 2,482 2,319 1,933

34 7,444 5,289 4,416 3,927 3,611 3,386 3,218 3,087 2,981 2,894 2,615 2,463 2,299 1,911

35 7,419 5,268 4,396 3,908 3,592 3,368 3,200 3,069 2,963 2,876 2,597 2,445 2,281 1,891

36 7,396 5,248 4,377 3,890 3,574 3,351 3,183 3,052 2,946 2,859 2,580 2,428 2,263 1,872

37 7,374 5,229 4,360 3,873 3,558 3,334 3,167 3,036 2,930 2,843 2,564 2,412 2,247 1,854

38 7,353 5,211 4,343 3,858 3,542 3,319 3,152 3,021 2,915 2,828 2,549 2,397 2,232 1,837

39 7,333 5,194 4,327 3,843 3,528 3,305 3,137 3,006 2,901 2,814 2,535 2,382 2,217 1,820

40 7,314 5,178 4,313 3,828 3,514 3,291 3,124 2,993 2,888 2,801 2,522 2,369 2,203 1,805

60 7,077 4,977 4,126 3,649 3,339 3,119 2,953 2,823 2,718 2,632 2,352 2,198 2,028 1,601

80 6,963 4,881 4,036 3,563 3,255 3,036 2,871 2,742 2,637 2,551 2,271 2,115 1,944 1,494

100 6,895 4,824 3,984 3,513 3,206 2,988 2,823 2,694 2,590 2,503 2,223 2,067 1,893 1,427

120 6,851 4,787 3,949 3,480 3,174 2,956 2,792 2,663 2,559 2,472 2,191 2,035 1,860 1,381

8 6,635 4,605 3,782 3,319 3,017 2,802 2,640 2,511 2,408 2,321 2,039 1,878 1,697 1,001

Interpretación: Para ν 1 = 10 y ν 2 = 20 se tiene que P(F < 3,37) = 0,99A. Caro v.06

VALORES CRITICOS PARA LA FUNCIÓN DE DISTRIBUCIÓN F

ν 1 (grados libertad numerador)

Page 100: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

97

FORMULARIO DE PROBABILIDADES

! 1 2 3 4 .... ( 1)n nP n n= = −i i i i i in ! ( 1) ( 2) ... ( 1)

( )! ! 1 2 3 ... ( 1)n rn n n n n n rCr n r r r r⎛ ⎞ − − −

= = =⎜ ⎟ − −⎝ ⎠

i i i ii i i i i

+

( )( / )( )

P A BP A BP B∩

=

P(A) = P(A/B1)P(B1)+ P(A/B2)P(B2) + … + P(A/Bk)P(Bk)

1 1 2 2

( / ) ( )( / )( / ) ( ) ( / ) ( ) ... ( / ) ( )

i ii

k k

P A B P BP B AP A B P B P A B P B P A B P B

=+ + +

F(xo) = P(X xo )

µ =E(X)= ∑xip(xi) σ2=V(X)= ∑(xi-µ)2p(xi) =∑xi2p(xi) –µ2 σ=

CV = σµ

P(X=k)= , k=0, 1, 2,…, n E(X)= µ = np V(X)=σ(1 )k nnp p

k−⎛ ⎞

−⎜ ⎟⎝ ⎠

k 2= np(1-p)

P(X=k)=

r N rk n k

Nn

−⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟−⎝ ⎠⎝ ⎠

⎛ ⎞⎜ ⎟⎝ ⎠

, k=0,1,2,3,…,r E(X)= µ = np siendo p=r/N; q=1-p

V(X) 2 (1 )( )

1np p N n

Nσ − −

= =−

21

21( )2

X

f x eµ

σ

σ π

−⎛ ⎞− ⎜ ⎟⎝ ⎠= E(X) =µ; V(X)=σ2 P(a≤X≤b)= φ(b) - φ(a)

2( ; )X N µ σ∼ XZ µσ−

= Z∼N(0,1)

2

( ; )X Nnσµ∼

( )X nZ µσ−

=

.

Page 101: Estadística 2 Psic (Rev 25.03.07) v.07

ESTADÍSTICA 2 – Esc. Psicología - U. Valparaíso - PROF. ALBERTO CARO – V.07 - Pág.

98

FORMULARIO DE INFERENCIA

(1 / 2)( )ZX

nα σ−±

(1 / 2; 1)nt SX

nα− −± (1 / 2)

(1 )p pp Znα−−

±

2

2(1 / 2; 1)

( 1)

n

n S

αχ − −

⎛ ⎞−⎜ ⎟⎜ ⎟⎝ ⎠

a

2

2( / 2; 1)

( 1)

n

n S

αχ −

⎛ ⎞−⎜ ⎟⎜ ⎟⎝ ⎠

0 ((1 / 2); ( 1); ( 1)( 1))Lim. Inferior: 1 (1 ) n K nF αα − − − −− − 0 (( / 2); ( 1); ( 1)( 1))Lim. Superior: 1 (1 ) n K nF αα − − −− −

( ) (0; 1)X nZ Nµσ−

= ∼ ( ) ( 1)X nt t

Sµ−

= −∼ n

( ) (0; 1)(1 )

pZ N

n

ππ π−

=−

22 2

20

( 1) ( 1n S nχ χσ−

= −∼ )

1 2 1 2 1 2

2 2 2 21 2 1 2

1 2 1 2

( ) ( ) ( )(0; 1)

X X X XZ N

n n n n

µ µ

σ σ σ σ

− − − −= =

+ +

1 2 1 2 1 21 2

1 2 1 2

( ) ( ) ( )(

1 1 1 1P P

X X X Xt t

S Sn n n n

µ µ− − − −= =

+ +∼ 2)n n+ − Siendo

2 21 1 2

1 2

( 1) ( 1)2P

n S n SS

n n− + −

=+ −

2

´0( ) ( ) ( 1D D

D n D nt tS S

−∆= = ∼ )n −

1 2 1 2 1 2

1 2 1 2

( ) ( ) ( )(0; 1)

1 1 1 1

p p p pZ N

pq pqn n n n

π π− − − −= =

⎛ ⎞ ⎛ ⎞+ +⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

∼ Siendo 1 1 2 2

1 2

; 1n p n p

p qn n+

p= = −+

2 2 21 1 1

1 22 2 22 2 2

/( 1; 1

/S S

F F nS S

σσ

= = − −∼ )n

0

1 (( 1); ( 1)( 1))1

F F n K nαα−

= − −−

∼ −

Pasos en la dócima de hipótesis: 1. Hipótesis (Definir términos empleados) 2. Supuestos 3. Nivel de significación 4. Estadística de Prueba 5. Región crítica 6. Evaluación y Decisión