Guia Estadistica Inferencial 2

29
ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS HUMANAS Y SOCIALES CARRERA DE EDUCACIÓN INFANTIL MATERIA ESTADÍSTICA INFERENCIAL

Transcript of Guia Estadistica Inferencial 2

Page 1: Guia Estadistica Inferencial 2

ESCUELA POLITÉCNICA DEL EJÉRCITO

DEPARTAMENTO DE

CIENCIAS HUMANAS Y SOCIALES

CARRERA DE

EDUCACIÓN INFANTIL

MATERIA

ESTADÍSTICA INFERENCIAL

Page 2: Guia Estadistica Inferencial 2

ESTADÍSTICA INFERENCIAL

SEGUNDA GUIA Actividad de aprendizaje 2.1.

EJERCICIO 1

En una muestra de 15 hombres adultos se encontró una estatura media de 165

cm con una desviación estándar de 6.3 cm. En una muestra de 17 mujeres

adultas se halló una estatura media de 158 cm con una desviación estándar de

6.1 cm. ¿Es diferente la estatura media de los hombres que la de las mujeres?

α = 0.01.

DATOS

= 15

= 165 = 6,3

= 17

= 158 = 6,1

1. HIPÓTESIS =

=

(

)

=

(

)

2. DISTRIBUCIÓN MUESTRAL

Page 3: Guia Estadistica Inferencial 2

√( )

( )

√( ) ( )

( )( )

√( )( ) ( )( )

√ √

( )( )

3. NIVEL DE SIGNIFICANCIA 2 colas

Situación crítica de la prueba = 4. OBSERVACIÓN

Page 4: Guia Estadistica Inferencial 2

5. DECISIÓN DE RECHAZO

|

3,190 2,750

Se rechaza

6. INTERPRETACIÓN Con el 99% de certeza se dice que es diferente la estatura media entre hombres y mujeres.

EJERCICIO 2

En una investigación sobre la efectividad de un jabón antibacterial que

se utiliza para reducir la contaminación en las salas de operaciones, se

obtuvieron los datos siguientes obtenidos al probar el jabón en una

muestra de ocho salas de operaciones de los hospitales de una ciudad. A

mayor puntaje, mayor grado de contaminación.

Sala de operaciones___________________

A B C D E F G H

----------------------------------------------------------------

Antes 6.6 6.5 9.0 10.3 11.2 8.1 6.3 11.6

Después 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Al nivel de significancia 0.05. ¿Se puede concluir que la contaminación

disminuyó después de usar el nuevo jabón?

Page 5: Guia Estadistica Inferencial 2

Especificaciones Cálculos

número del

individuo

(A) Antes

(B) Después

D Diferencia = B - A

( )

( )

A 6,6 6,8 0,2 -2,9125 8,482656

B 6,5 2,4 -4,1 -7,2125 52,02016

C 9 7,4 -1,6 -4,7125 22,20766

D 10,3 8,5 -1,8 -4,9125 24,13266

E 11,2 8,1 -3,1 -6,2125 38,59516

F 8,1 6,1 -2 -5,1125 26,13766

G 6,3 3,4 -2,9 -6,0125 36,15016

H 11,6 2 -9,6 -12,7125 161,6077

total -24,9 -49,8 369,3338

-3,1125

1. HIPÓTESIS

=

=

2. DISTRIBUCIÓN MUESTRAL

= √ ( )

= √

= √

=7,26

Page 6: Guia Estadistica Inferencial 2

3. NIVEL DE SIGNIFICANCIA

1 cola

Situación crítica de la prueba =

4. OBSERVACIÓN Efecto de la prueba: = -3,1125 de la escala de sensibilidad Estadístico de prueba

Page 7: Guia Estadistica Inferencial 2

5. DECISIÓN DE RECHAZO

Se acepta

6. INTERPRETACIÓN

Con el 95% de certeza se puede concluir que la contaminación no disminuyó después de usar el nuevo jabón

Actividad de aprendizaje 2.2. EJERCICIO 1

Un médico especialista en el control de peso recomienda 3 dietas. Como

experimento, seleccionó aleatoriamente a 15 pacientes y asignó 5 pacientes a

cada dieta. Después de tres semanas se registraron las siguientes pérdidas de

peso (en lbs.). Con un nivel de significancia de 0.05 ¿puede concluirse que hay

alguna diferencia, entre las 3 dietas, en la pérdida media de peso perdido?

Dieta A B C 5 6 7 7 7 8 4 7 9 5 5 8 4 6 9

Page 8: Guia Estadistica Inferencial 2

A B C

( )

( )

(

)

5 6 7 2,151111 0,2177778 0,2844444 0 -0,2 -1,2 0 0,04 1,44 10,7555556

7 7 8 0,284444 0,2844444 2,3511111 2 0,8 -0,2 4 0,64 0,04 0,35555556

4 7 9 6,084444 0,2844444 6,4177778 -1 0,8 0,8 1 0,64 0,64 15,0222222

5 5 8 2,151111 2,1511111 2,3511111 0 -1,2 -0,2 0 1,44 0,04

4 6 9 6,084444 0,2177778 6,4177778 -1 -0,2 0,8 1 0,04 0,64

5 6,2 8,2 16,75556 3,1555556 17,822222 0 0 0 6 2,8 2,8 26,1333333

Page 9: Guia Estadistica Inferencial 2

1. HIPÓTESIS

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

2. DISTRIBUCIÓN MUESTRAL

3. NIVEL DE SIGNIFICANCIA

4. OBSERVACIÓN

Efectos de Prueba:

Primero se calcula las medias y la variación total. Media Total

Page 10: Guia Estadistica Inferencial 2

Medias Grupales

Variación total:

( )

Segundo, calcula los efectos principales

Efecto principal para Dieta A

( )

=−1,466

Efecto principal para Dieta B

( )

Efecto principal para Dieta C

( )

Page 11: Guia Estadistica Inferencial 2

Tercero calcula la suma de cuadrados entre los grupos y

dentro de los grupos

Suma de cuadrados entre grupos

( )

[( )( )]

Suma de cuadrados dentro de los grupos

Cuarto, calcula las varianzas de los cuadrados medios

(utilizando los grados de libertad)

Varianza del cuadrado medio entre grupos

Varianza del cuadrado medio dentro de los grupos

Page 12: Guia Estadistica Inferencial 2

Quinto, calcula el estadístico de prueba

Se realiza un resumen en una tabla de fuentes de variación

Fuente de variacion

SC

gl

Varianza de los

cuadrados medios: CM=

SC/gl

Entre grupos

Dentro de grupos

Total

2,695

5. DECISIÓN DE RECHAZO

Se rechaza 6. INTERPRETACIÓN

Puede concluirse con el 95% de confianza que hay diferencia, entre las 3 dietas para la pérdida de peso.

EJERCICIO 2

Al investigar sobre los peligros de la cafeína, un investigador agrega dos tipos de

cafeína (la que se encuentra en el café y la que se encuentra en el chocolate) al

suministro de agua de grupos de ratas criadas en laboratorio. Por lo general esta

especie sobrevive cerca de 13 meses. El suministro de agua del grupo de control de

ratas no fue alterado con cafeína. ¿Afecta la cafeína el tiempo de vida de las ratas?

Probar la hipótesis con los siguientes datos. Asumir la igualdad de varianzas

poblacionales. = 0.01.

Grupo de tratamiento Días que vivió la rata

Cafeína de café: 398, 372, 413, 419, 408, 393

Cafeína de chocolate: 401, 389, 413, 396, 406, 378

Page 13: Guia Estadistica Inferencial 2

Control (sin cafeína): 412, 386, 394, 409, 415, 384

Page 14: Guia Estadistica Inferencial 2

A B C

398 401 412 1,4938 3,1605 163,271605 -2,5 3,8333 12 6,25 14,6944 144 9,7963

372 389 386 741,049 104,4938 174,82716 -28,5 -8,1667 -14 812,25 66,6944 196 25,3519

413 413 394 189,8272 189,8272 27,2716049 12,5 15,8333 -6 156,25 250,6944 36 3,6296

419 396 409 391,1605 10,3827 95,6049383 18,5 -1,1667 9 342,25 1,3611 81

408 406 415 77,0494 45,9383 248,938272 7,5 8,8333 15 56,25 78,0278 225

393 378 384 38,7160 450,3827 231,716049 -7,5 -19,1667 -16 56,25 367,3611 256

2403 2383 2400 1439,2963 804,1852 941,6296 0 0 0 1429,5 778,8333 938 38,7778

Page 15: Guia Estadistica Inferencial 2

1) HIPÓTESIS a. ( ) ( ) ( ) ( )

b. ( ) ( ) ( ) ( )

2) DISTRIBUCIÓN MUESTRAL

3) NIVEL DE SIGNIFICANCIA

4) OBSERVACIÓN

Efectos de Prueba:

Primero se calcula las medias y la variación total. Media Total

Page 16: Guia Estadistica Inferencial 2

Medias Grupales

Variación total:

( )

Segundo, calcula los efectos principales

Efecto principal para Café

( )

=1,278

Efecto principal para Chocolate

( )

Efecto principal para Sin cafeína

( )

Page 17: Guia Estadistica Inferencial 2

Tercero calcula la suma de cuadrados entre los grupos y

dentro de los grupos

Suma de cuadrados entre grupos

( )

[( )( )]

Suma de cuadrados dentro de los grupos

Cuarto, calcula las varianzas de los cuadrados medios

(utilizando los grados de libertad)

Varianza del cuadrado medio entre grupos

Varianza del cuadrado medio dentro de los grupos

Page 18: Guia Estadistica Inferencial 2

Quinto, calcula el estadístico de prueba

Se realiza un resumen en una tabla de fuentes de variación

Fuente de variacion

SC

gl

Varianza de los cuadrados

medios: CM=

SC/gl

Entre grupos

Dentro de grupos

Total

187,3594

5) DECISIÓN DE RECHAZO

Se acepta

6) INTERPRETACIÓN

Puede concluirse con el 99% de confianza que no afecta la cafeína en la vida

de las ratas.

Page 19: Guia Estadistica Inferencial 2

Actividad de aprendizaje 2.3.

EJERCICIO 1

De 64 médicos y 89 pacientes encuestados, 36 médicos y 52 pacientes se

pronunciaron a favor de un seguro médico de cobertura universal en lugar del

actual sistema médico diversificado. Construir una tabla cruzada. Probar la

hipótesis de que existe una relación entre el estatus médico-paciente y el tipo

de sistema de seguro médico preferido. α= 0.05.

A favor En contra total

Médicos 36 28 64

pacientes 52 37 89

total 88 65 153

1. HIPÓTESIS

2. DISTRIBUCIÓN MUESTRAL

( )

( )( )

( )( )

3. NIVEL DE SIGNIFICANCIA

Page 20: Guia Estadistica Inferencial 2

4. OBSERVACIÓN

especificaciones cálculos

Casilla (x,y) O E (O-E) (O-E)^2 ((O-E)^2)/E

Medico a favor 36 36,8105 -0,8105 0,6568 0,01784

Paciente a favor 52 51,1895 0,8105 0,6568 0,01283

Medico en contra 28 27,1895 0,8105 0,6568 0,02416

Paciente en contra 37 37,8105 -0,8105 0,6568 0,01737

total 153 153 0 0,07221

5. DECISIÓN DE RECHAZO

Acepto

6. INTERPRETACIÓN

Con el 95% de confianza podemos decir que existe una relación entre el

estatus médico-paciente y el tipo de sistema de seguro médico preferido

EJERCICIO 2.

En las 3 regiones A, B y C de un país, de 100 personas encuestadas en cada

una de ellas, 52, 68 y 39 respectivamente apoyan al candidato A y el resto al

candidato B. ¿Existe una relación entre el candidato preferido y las distintas

regiones? α= 0.01

.

Candidato

a Candidato

b total

Región A 52 48 100

Región B 68 32 100

Región C 39 61 100

TOTAL 159 141 300

Page 21: Guia Estadistica Inferencial 2

1. HIPÓTESIS

2. DISTRIBUCIÓN MUESTRAL

( )

( )( )

( )( )

3. NIVEL DE SIGNIFICANCIA

4. OBSERVACIÓN

Especificaciones cálculos

Casilla x,y O E (O-E) (O-E)^2 ((O-E)^2)/E Región A candidato a 52 53 -1 1 0,0189 Región B candidato a 68 53 15 225 4,2453 Región C candidato a 39 53 -14 196 3,6981 Región A candidato b 48 47 1 1 0,0213 Región B candidato b 32 47 -15 225 4,7872 Región C candidato b 61 47 14 196 4,1702

total 300 300 0 16,9410

5. DECISIÓN DE RECHAZO

Acepto

6. INTERPRETACIÓN

Page 22: Guia Estadistica Inferencial 2

Con el 99% de certeza podemos decir que no Existe una relación entre el

candidato preferido y las distintas regiones

EJERCICIO 3

Una empresa farmacéutica se encuentra probando un nuevo fármaco contra el

cáncer en ratones genéticamente infectados. Investigaciones anteriores en sus

laboratorios demuestran que 50% de estos animales sobrevive seis meses sin

ningún tratamiento. Se administra la droga a ocho ratones. Seis de ellos

sobreviven seis meses. Probar la hipótesis de que el tratamiento administrado

ofrece una tasa superior de supervivencia que la que se observa con la

ausencia del mismo fármaco. Utilizar α= 0.01.

viven mueren total

fármaco 6 2 8

sin fármaco 4 4 8

TOTAL 10 6 16

1. HIPÓTESIS

2. DISTRIBUCIÓN MUESTRAL

( )

( )( )

( )( )

3. NIVEL DE SIGNIFICANCIA

Page 23: Guia Estadistica Inferencial 2

4. OBSERVACIÓN

Especificaciones cálculos

casilla x,y O E (O-E) (O-E)^2 ((O-E)^2)/E

vive con fármaco 6 5 1 1 0,2000

vive sin fármaco 4 5 -1 1 0,2000

muere con fármaco 2 3 -1 1 0,3333

muere sin fármaco 4 3 1 1 0,3333

total 16 16 0 1,0667

5. DECISIÓN DE RECHAZO

Acepto

6. INTERPRETACIÓN

Con el 99% de certeza se asegura que el tratamiento administrado ofrece una

tasa superior de supervivencia que con la ausencia del mismo fármaco

Actividad de aprendizaje 2.4.

EJERCICIO 1

En una empresa se considera que el nivel salarial debería ser aproximadamente

paralelo a los años de estudio. En una muestra de 7 empleados se encontraron

los siguientes valores de años de educación y salario (en miles de $).

Empleado Años de educación Salario (en miles de $)

1 12 22.5

2 11 16.5

3 16 29.6

4 18 42.6

5 17 45.8

Page 24: Guia Estadistica Inferencial 2

6 10 14

7 19 54

a) ¿Cuál es la variable independiente y cual al variable dependiente? Trazar

el diagrama de dispersión.

b) Calcular los estadísticos de la recta de regresión y trazar dicha recta.

c) Calcular la r de Pearson. Interpretar el resultado.

d) ¿Parece que existe una relación lineal en el patrón de coordenadas?

y x

empleado salario año estudio y^2 X^2 XY

1 22,5 12 506,25 144 270

2 16,5 11 272,25 121 181,5

3 29,6 16 876,16 256 473,6

4 42,6 18 1814,76 324 766,8

5 45,8 17 2097,64 289 778,6

6 14 10 196 100 140

7 54 19 1156 361 646

28 225 103 6919,06 1595 3256,5

0

5

10

15

20

25

0 20 40 60

año estudio

año estudio

Lineal (año estudio)

Lineal (año estudio)

Page 25: Guia Estadistica Inferencial 2

( ) ( )( )

( )

( ) ( )( )

( ) ( )

( )

( ) ( )( )

√[ ( ) ] [ ( )

]

Page 26: Guia Estadistica Inferencial 2

( ) ( )( )

√[ ( ) ( ) ][ ( ) ( ) ]

√[ ][ ]

EJERCICIO 2

Los días de incapacidad se definen como el número de días que los individuos no pueden llevar a cabo sus actividades normales como consecuencia de una enfermedad o una lesión. Los días de incapacidad se relacionan con los riesgos en el trabajo y ambientes domésticos, los cuales, a su vez, se relacionan estrechamente con los niveles de ingreso. Los siguientes datos indican el patrón de la relación entre los días de incapacidad al año y el ingreso familiar (en miles de $).

a) Trazar el diagrama de dispersión del ingreso familiar total (Y) regresionado a partir de los días de incapacidad (X).

b) Calcular los estadísticos de regresión y trazarla recta de regresión. c) Calcular el coeficiente de correlación bivariada r de Pearson. d) ¿Parece que existe alguna relación lineal en el patrón de las

coordenadas?

Ingreso familiar Días de incapacidad

____________________________________________________________

5 27

15 19

28 14

40 10

6 29

14 21

26 13

37 6

Page 27: Guia Estadistica Inferencial 2

x y

empleado dias incapacidad

ingreso familiar X^2 Y^2 XY

1 27 5 729 25 135

2 19 15 361 225 285

3 14 28 196 784 392

4 10 40 100 1600 400

5 29 6 841 36 174

6 21 14 441 196 294

7 13 26 169 676 338

8 6 37 36 1369 222

139 171 2873 4911 2240

y = -1.5968x + 49.119

0

5

10

15

20

25

30

35

40

45

0 10 20 30 40

ingreso familiar

ingreso familiar

Lineal (ingresofamiliar)

Page 28: Guia Estadistica Inferencial 2

( )

( ) ( )( )

( )

( ) ( )( )

( ) ( )

( )

Page 29: Guia Estadistica Inferencial 2

( ) ( )( )

√[ ( ) ] [ ( ) ]

( ) ( )( )

√[ ( ) ( ) ][ ( ) ( ) ]

√[ ][ ]