Trabajo Estadistica Industrial
-
Upload
jason-bautista -
Category
Documents
-
view
342 -
download
23
description
Transcript of Trabajo Estadistica Industrial
2016
Universidad Nacional Mayor de San Marcos
Curso: Estadística Industrial
Profesor: Víctor Pérez Quispe
Alumnos:
Bautista Salazar Julio Jason 10170040
Ganoza Morales Guillermo 10170116
Laboratorio de Estadística Industrial
Laboratorio de Estadística Industrial 2016
García Alarcón Carlos Alexander 11170020
1
Laboratorio de Estadística Industrial 2016
INDICE
Problemas aplicativos de Distribución Normal......................................................................................2
Problemas aplicativos de Distribución de Muestras Pequeñas.....................................................11
Problemas Aplicativos de Regresión Simple.........................................................................................20
Problemas Aplicativos de Regresión Múltiple......................................................................................30
Problemas Aplicativos de Chi Cuadrada................................................................................................42
Problemas Aplicativos de Prueba de Independencia.........................................................................48
Problemas Aplicativos de la Distribución de Poisson........................................................................52
Problemas Aplicativos de Métodos no Paramétricos.........................................................................60
Prueba de Signos........................................................................................................................................60
Problemas Aplicativos de la Prueba de Wilcoxon...........................................................................69
Problemas Aplicativos de la Prueba de Mann-Whitney-Wilcoxon.............................................77
Prueba de Kruskal-Wallis.........................................................................................................................85
2
Laboratorio de Estadística Industrial 2016
Problemas aplicativos de Distribución Normal
Problema n°1:
Le han pedido que evalúe la respuesta de las empresas a una nueva obligación legal de incrementar las prestaciones sanitarias que ofrecen a sus empleados. Tiene una muestra aleatoria de 76 cambios porcentuales de las prestaciones sanitarias prometidas. La media muestral de los cambios porcentuales es 0.078 y la desviación típica muestral es 0.201. Halle e interprete el valor p de un contraste de la hipótesis nula de que la media poblacional de los cambios porcentuales es 0 frente a la hipótesis alternativa bilateral.
Solución:
3
Laboratorio de Estadística Industrial 2016
p=0.1% <1% entonces se rechaza la hipótesis nula H0, es decir si se tiene que incrementar las prestaciones sanitarias que ofrecen a sus empleados.
4
Laboratorio de Estadística Industrial 2016
Problema n°2:
El director de producción de Rodamientos Niquelados, S.A., le ha pedido ayuda para evaluar el proceso modificado de producción de rodamientos. Cuando el proceso funciona correctamente, produce rodamientos cuyo peso sigue una distribución normal de media poblacional 5 onzas y desviación típica poblacional 0.1 onzas. Se ha recurrido a un nuevo proveedor de materia prima para un lote reciente de producción y el director quiere saber si, como consecuencia del cambio, el peso medio de los rodamientos es menor. No hay razón alguna para sospechar que el nuevo proveedor plantea problemas y el director continuará recurriendo a él a menos que existan pruebas contundentes de que están produciéndose rodamientos de menor peso que antes. En este problema obtenemos una muestra aleatoria de n = 16 observaciones y la media muestral es 4.962. Tome la decisión realizando una prueba de hipótesis por el método clásico y utilizando el valor p.
Haga la prueba con un nivel de significancia = 0.05.
Solución:
En este caso nos interesa saber si existen pruebas contundentes para concluir que están produciéndose rodamientos de menor peso. Por lo tanto, contrastamos la hipótesis.
5
Laboratorio de Estadística Industrial 2016
6
Laboratorio de Estadística Industrial 2016
Al encontrar p=0.064>0.05 no se rechaza la hipótesis nula Ho, por lo tanto no se están produciéndose rodamientos de menor peso.Problema n°3:En un estudio se extrajeron muestras aleatorias de empleados de restaurantes de comida rápida en los que el empresario da formación. En una muestra de 67 empleados que no habían terminado los estudios secundarios, 11 habían participado en un programa de formación de la empresa. En una muestra aleatoria independiente de 113 empleados que habían terminado los estudios secundarios, pero no habían ido a la universidad, habían participado 27. Contraste al nivel del 1 por ciento la hipótesis nula de que las tasas de participación de los dos grupos son iguales frente a la hipótesis alternativa de que la tasa es mucho más baja en el caso de los que no habían terminado los estudios secundarios.
Solución
7
Laboratorio de Estadística Industrial 2016
p=15.9. % >1% entonces se acepta hipótesis nula H0.
8
Laboratorio de Estadística Industrial 2016
Problema n° 4:
El precio de venta promedio nacional para casas unifamiliares es de 181900 dólares. Para una muestra de ventas de 40 casa unifamiliares nuevas en el sur se observó una media muestral de 166400 dólares y una desviación estándar de 33500 dólares.
a) Formule las hipótesis nula y alternativa que servirán para determinar si los datos de la muestra sustentan la conclusión de que el precio de ventas promedio poblacional para las casas unifamiliares nuevas en el sur es menor que la media nacional de 181900 dólares.
b) ¿Cuál es el valor del estadístico de prueba?c) ¿Cuál es el valor de p?d) Con α = 0.01, ¿Cuál es su conclusión?
Solución:
a)
b)
9
Laboratorio de Estadística Industrial 2016
p=0.2% <1% entonces se rechaza hipótesis nula H0.
Problema n°5:El expendio de pollos a la brasa de RikoPollo S.A asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. ¿Puede concluirse, en el nivel de significancia 0.1, que menos de 90% de las órdenes se entregan en menos de 10 minutos?
Solución:
H0:
H1:
10
Laboratorio de Estadística Industrial 2016
11
Laboratorio de Estadística Industrial 2016
p=0.4% <1% entonces se rechaza hipótesis nula H0, se acepta que menos de 90% de las órdenes se entregan en menos de 10 minutos
Problema n° 6:El consejo de seguridad nacional de un país encuentra que 52% de los conductores en las autopistas son hombres. Ayer se encontró en una muestra de 300 autos que viajaban por una determinada autopista, que 170 de los conductores eran hombres. ¿Puede concluirse, en el nivel de significancia 0.01, que en esta autopista conducían más hombres que los que indican las estadísticas nacionales?
Solución:
H0:
H1:
12
Laboratorio de Estadística Industrial 2016
p=5.3% >1% entonces NO se rechaza hipótesis nula H0, en esta autopista no conducían más hombres
13
Laboratorio de Estadística Industrial 2016
Problemas aplicativos de Distribución de Muestras PequeñasProbleman°1:
Los registros de la empresa Yellows indican que la duración media de un juego de bujías es 22 100 millas. La distribución de los tiempos de vida útil de las bujías es aproximadamente normal.
Un fabricante de bujías afirma que sus bujías tienen una duración media superior a 22 100 millas. El dueño de los camiones compra muchos de estos juegos. En una muestra de 18 juegos el tiempo medio de vida útil fue 23400 millas y la desviación estándar 1 500 millas ¿hay suficientes evidencias, con el nivel de significancia 0.05, que apoyen la afirmación?
Solución:
Ho: µ ≤ 22100
H1: µ > 22100
14
Laboratorio de Estadística Industrial 2016
15
Laboratorio de Estadística Industrial 2016
Al encontrar un p de 0.1% <5% se rechaza Ho Con lo que la vida media de las bujías es mayor a 22 100 millas.
Problema n°2:
Un criador de pollos sabe por experiencia que el peso de los pollos de cinco meses es 4.35 libras. Los pesos siguen una distribución normal .para tratar de aumentar el peso de dichas aves se le agrega un aditivo al alimento .en una muestra de pollos de cinco meses se obtuvieron los siguientes pesos (en libras).
Pesos 4.41 4.37 4.33 4.35 4.30 4.39 4.36 4.38 4.40 4.39
En el nivel 0.01 ¿el aditivo ha aumentado el peso de los pollos?
Ho: µ ≤ 4.35
H1: µ > 4.35
16
Laboratorio de Estadística Industrial 2016
17
Laboratorio de Estadística Industrial 2016
Como p=6.4%>1% se acepta la hipótesis nula Ho. El aditivo no ha aumentado el peso de los pollos.
Problema n°3:
Una muestra de las calificaciones en un examen presentado en un curso de estadística es:
Hombres
72 69 98 66 85 76 79 80 77
Mujeres
81 67 90 78 81 80 76
A nivel de significancia de 0.01. ¿La calificación media de las mujeres es más alta que la calificación media de los hombres?
Solución:
Ho: µ2 ≤µ1
H1: µ2 > µ1
18
Laboratorio de Estadística Industrial 2016
Como p=40.9%>1% se acepta Ho. La calificación media de las mujeres no es más alta que la de los varones.
19
Laboratorio de Estadística Industrial 2016
Problema n°4:
Recuerde que la empresa Nikel Saving desea comprara las dos agencias que utiliza para realizar avalúos de casas. Para esto selecciono una muestra de 10 propiedades residenciales y programó un avaluó por cada agencia .los resultados, reportados en miles de dólares, son:
Casa Schadek Bowyer
1 135 128
2 110 105
3 131 119
4 142 140
5 105 98
6 130 123
7 131 127
8 110 115
9 125 122
10 149 145
Al nivel de significancia de 0.05. ¿Puede concluirse que hay una diferencia en los avalúos medios de las casas?
Ho: µ =0
H1: µ ≠0
20
Laboratorio de Estadística Industrial 2016
21
Laboratorio de Estadística Industrial 2016
Problema n°5:
Lammers Limo ofrece servicio de limusinas desde el edificio del ayuntamiento de la ciudad de Toledo, Ohio, hasta el aeropuerto Metro, en Detroit. El presidente de la compañía, San Lammers, está considerando dos rutas, una vía es la ruta US25 y la otra es vía la autopista I75 .Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos caminos y después comparar (en minutos). Utilizando el nivel de significancia de 0.10. ¿Existe alguna diferencia en la variación de los tiempos de recorrido por ambas rutas?
Ho: σ1 = σ 2
H1: σ1 ≠ σ2
22
RUTA US25 INTERESTATAL 75
52
67
56
45
70
54
64
59
60
61
51
56
63
57
65
Laboratorio de Estadística Industrial 2016
23
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de Regresión SimpleProblema n°1:
Se llevó a cabo un estudio en el Instituto Politécnico y Universidad Estatal de Virginia para determinar si ciertas medidas de resistencia estática del brazo (Kg.) tienen alguna influencia en las características de "elevación dinámica (milímetros)" de un individuo. Se sometieron a pruebas de resistencia a 10 individuos y después se les pidió realizar una prueba de levantamiento de pesas en la que el peso se debía levantar en forma dinámica por arriba de la cabeza.
Los datos son los siguientes:
INDIVIDUO RESISTENCIA DEL BRAZO
LEVANTAMIENTO DINÁMICO
1
2
3
4
5
6
7
8
9
10
17.3
19.3
29.6
29.6
19.5
29.9
19.7
30.3
22.9
31.3
71.7
48.3
78.3
60.0
88.3
71.7
75.0
85.0
91.7
85.0
24
Laboratorio de Estadística Industrial 2016
Gráficas de puntos:
25
Laboratorio de Estadística Industrial 2016
26
Laboratorio de Estadística Industrial 2016
Al encontrar un r2 de 2.9% no se ajusta a una regresión lineal
27
Laboratorio de Estadística Industrial 2016
28
Laboratorio de Estadística Industrial 2016
Problema n°2:
El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y Gales en el período de 1970-72. Cada grupo está formado por trabajadores de la misma profesión (médicos, trabajadores textiles, decoradores,...etc.,) y en cada uno de los veinticinco grupos muestreados se han observado dos variables: el índice estandarizado de consumo de cigarrillos y el índice de muertes por cáncer de pulmón.
29
Laboratorio de Estadística Industrial 2016
Estudiar la regresión lineal del índice de mortalidad frente al índice de fumadores.
30
Laboratorio de Estadística Industrial 2016
31
Laboratorio de Estadística Industrial 2016
No es conveniente un ajuste lineal al encontrar un R2 de 51.3%
32
Laboratorio de Estadística Industrial 2016
33
Laboratorio de Estadística Industrial 2016
Problema n°3:
En 34 lotes de 120 libras de cacahuetes se observó el nivel medio de anatoxina (partes por billón) (X) y el porcentaje de cacahuetes no contaminados (Y):
Analizar estos datos e investigar la relación entre estas dos variables para predecir
Y en función de X. ¿Es adecuado el ajuste lineal?
34
Laboratorio de Estadística Industrial 2016
35
Laboratorio de Estadística Industrial 2016
Al encontrar un R-cuad=82.9% resulta conveniente trazar un ajuste lineal
36
Análisis de regresión: Y vs. X
La ecuación de regresión es
Y = 100 - 0,00290 X
Predictor Coef SE Coef T P
Constante 100,002 0,011 9184,91 0,000
X -0,0029035 0,0002335 -12,43 0,000
S = 0,0393282 R-cuad. = 82,9% R-cuad.(ajustado) = 82,3%
Análisis de varianza
Fuente GL SC CM F P
Regresión 1 0,23915 0,23915 154,62 0,000
Error residual 32 0,04949 0,00155
Total 33 0,28864
Ajuste a un x=100
Observaciones poco comunes
EE de Residuo
Obs X Y Ajuste ajuste Residuo estándar
28 111 99,6580 99,6792 0,0187 -0,0212 -0,61 X
X denota una observación cuyo valor X le concede gran apalancamiento.
Valores pronosticados para nuevas observaciones
EE de
Nueva obs Ajuste ajuste IC de 95% IP de 95%
1 99,7117 0,0163 (99,6786. 99,7449) (99,6251. 99,7984)
Valores de predictores para nuevas observaciones
Nueva obs X
1 100
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de Regresión MúltipleProblema n°1:
En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.
ALUMNO
PHP ALGORITMOS BASE DE DATOS
PROGRAMACIÓN
1 13 15 15 132 13 14 13 123 13 16 13 144 15 20 14 165 16 18 18 176 15 16 17 157 12 13 15 118 13 16 14 159 13 15 14 1310 13 14 13 1011 11 12 12 1012 14 16 11 1413 15 17 16 1514 15 19 14 1615 15 13 15 10
Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Programación.
Determine la ecuación de regresión.37
Laboratorio de Estadística Industrial 2016
Calcule e interprete.
Estimar la nota del curso de PHP si se sabe que en Algoritmos tiene 15, Base de Datos 16 y Programación 17.
38
Laboratorio de Estadística Industrial 2016
Solución:
39
Laboratorio de Estadística Industrial 2016
Coeficiente de determinación: es 0.697, entonces el 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.
Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.003 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.
Podemos observar que hay una buena relación de linealidad entre las variables dependientes con la dependiente.
40
Laboratorio de Estadística Industrial 2016
41
Laboratorio de Estadística Industrial 2016
42
Laboratorio de Estadística Industrial 2016
43
Laboratorio de Estadística Industrial 2016
Problema n°2:
Montgomery y Peck (1982) describen el empleo de un modelo de regresión para relacionar la cantidad de tiempo requerido por un vendedor de ruta (chofer) para abastecer una maquina vendedora de refrescos con el número de latas que incluye la misma, y la distancia del vehículo de servicio a la ubicación de la máquina. Este modelo se empleó para el diseño de la ruta, el programa y el despacho de vehículos. La tabla presenta 25 observaciones respecto al tiempo de entrega tomadas del mismo estudio descrito por Montgomery y Peck.
44
Laboratorio de Estadística Industrial 2016
NUMERO DE OBSERVACIONES
TIEMPO DE ENTREGA (MIN.)
NUMERO DE LATAS
DISTANCIAS(PIES)
1 9.95 2 502 24.45 8 110
3 31.75 11 120
4 35.00 10 550
5 25.02 8 295
6 16.8 4 200
7 14.38 2 375
8 9.60 2 52
9 24.35 9 100
10 27.50 8 300
11 17.08 4 412
12 37.00 11 400
13 41.95 12 500
14 11.66 2 360
15 21.65 4 205
16 17.89 4 400
17 69.00 20 600
18 10.30 1 585
19 34.93 10 540
20 46.59 15 250
21 44.88 15 290
22 54.12 16 510
23 56.63 17 590
24 22.13 6 100
45
Laboratorio de Estadística Industrial 2016
25 21.15 5 400
Determine la ecuación de regresión. Calcule e interprete.
Estimar el tiempo de entrega si se sabe que el número de latas es 20 y la distancia del vehículo es 110.
Solución:
46
Laboratorio de Estadística Industrial 2016
47
Laboratorio de Estadística Industrial 2016
Coeficiente de determinación: es 0.981, entonces el 98.1% del tiempo de un vendedor para abastecer una maquina vendedora puede ser explicado mediante el número de latas y la distancia del camión.
Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.000 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.
Observamos un relación lineal entre la variable dependiente Nro. De latas con respecto al T.de entrega (Variable independiente), y en menor grado de linealidad Distancia Vs Tiempo de entrega.
48
Laboratorio de Estadística Industrial 2016
49
Laboratorio de Estadística Industrial 2016
Contribución de la variable X1 sabiendo que X2 está incluida
SSR(X1 / X2) = SSR(X1 y X2) – SSR(X2)
=5992.4-5887.3=105.1
Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,20.23>4.3
Entonces la variable X1(nro. de latas), si contribuye significativamente a la ecuación de regresión
Contribución de la variable X2 sabiendo que X1 está incluida
SSR(X2 / X1) =SSR(X1 y X2) – SSR(X1)
=5992.4-1483.9=4508.5
50
Laboratorio de Estadística Industrial 2016
Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,867.019>4.3
Entonces la variable X2(distancia), si contribuye significativamente a la ecuación de regresión, y podríamos concluir que es más importante que la varia X1.
51
Laboratorio de Estadística Industrial 2016
52
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de Chi Cuadrada
Distribución de Bondad de Ajuste: Chi CuadradaProblema n°1:
Probar la hipótesis siguiente usando la prueba de bondad de ajuste X2.
H0: pA=0.40, pB=0.40 y pc=0.20
H1: pA≠0.40, pB≠0.40 y pc≠0.20
En una muestra de 200 elementos se tiene que 60 pertenecen a la categoría A, 120 a la categoría B y 20 a la categoría C.
Use α=0.01 y pruebe si las proporciones son las afirmadas en H0.
Solución:
Calculamos las frecuencias esperadas con n=200:
Categoría A = 0.40 (200) = 80
Categoría B = 0.40 (200) = 80
Categoría C = 0.20 (200) = 40
Calculamos el estadístico de prueba chi-cuadrada (X2):
CATEGORÍAS
NÚMERO OBSERVADOS(FI)
NÚMERO ESPERADOS(EI)
FI - EI (FI - EI)2
(FI - EI)2/ EI
A 60 80 -20 400 5
B 120 80 40 1600 20
C 20 40 -20 400 10
53
Laboratorio de Estadística Industrial 2016
TOTAL X2=35
Para k-1=3-1=2 grados de libertad, con X2=35. Mediante tabla el valor-p es menor a 0.005. Entonces el valor-p≤ α=0.01, por tanto, se rechaza H0.
54
Laboratorio de Estadística Industrial 2016
Mediante el Minitab con X2 =35, se calcula el valor-p que se aproxima a 0. Por tanto el valor-p≤0.01. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no tienen la misma proporción en las poblaciones.
Problema n°2:
Durante las primeras 13 semanas, se registraron las proporciones siguientes de televidentes los sábados de 8 a 9 de la noche: ABC 29%, CBS 28%, NBC 25% e independientes 18%. Dos semanas después en una muestra de 300 hogares se obtuvieron las audiencias siguientes en sábados por la noche: ABC 95 hogares, CBS 70 hogares, NBC 89 hogares e independientes 46 hogares. Use α=0.05 para determinar si han variado las proporciones en la audiencia de televidentes.
Solución:
H0: pA=0.29, pB=0.28, pc=0.25 y pD=0.18
H1: pA≠0.29, pB≠0.28 y pc≠0.25 y pD≠0.18
Nivel de significancia α=0.05.
Calculamos las frecuencias esperadas con n=300:
ABC = 0.29 (300) = 87
CBS = 0.28 (300) = 84
NBC = 0.25 (300) = 75
55
Laboratorio de Estadística Industrial 2016
Independiente = 0.18 (300) = 54
Calculamos el estadístico de prueba chi-cuadrada (X2):
TELEVISORASNÚMERO
OBSERVADOS(FI)
NÚMERO ESPERADOS(E
I)FI - EI (FI -
EI)2(FI -
EI)2/ EI
ABC 95 87 8 64 0.7356
CBC 70 84 14 16 2.3333
NBC 89 75 14 196 2.6133
INDEPENDIENTE 46 54 -8 64 1.1852
TOTAL X2=6.8674
Para k-1=4-1=3 grados de libertad, con X2=6.8674. Mediante tabla el valor-p esta entre 0.10 y 0.05. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.
56
Laboratorio de Estadística Industrial 2016
Mediante el Minitab con X2 =6.86748, se calcula el valor-p =0.0762436. Por tanto el valor-p≥ α=0.05. Entonces se comprueba el no rechazo de la hipótesis nula, concluyendo que tienen la misma proporción en las poblaciones.
M&M/Mars, fabricantes de los chocolates M&M, realizaron un sondeo nacional en el que más de 10 millones de personas dieron su preferencia para un nuevo color. El resultado de este sondeo fue el reemplazo de un color café claro por uno azul. En el prospecto “Colors” de M&M/Mars, la distribución de los colores de estos chocolates es el siguiente:
CAFÉ AMARILLO
ROJO ANARANJADO
VERDE AZUL
30% 20% 20% 10% 10% 10%
En un estudio anterior se emplearon como muestra bolsas de 1 libra para determinar si los porcentajes dados eran reales. En la muestra de 506 dulces los resultados encontrados fueron los siguientes:
CAFÉ AMARILLO
ROJO ANARANJADO
VERDE AZUL
177
135 79 41 36 38
Use α=0.05 para determinar si estos datos coinciden con los datos por la empresa.
Solución:
H0: pA=0.30, pB=0.20, pc=0.20, pD=0.10, pE=0.10 y pf=0.10
H1: pA≠0.30, pB≠0.20, pc≠0.20, pD≠0.10, pE≠0.10 y pf≠0.10
Nivel de significancia α=0.05.
57
Laboratorio de Estadística Industrial 2016
Calculamos las frecuencias esperadas con n=506:
Café = 0.30 (506) = 151.8
Amarillo = 0.20 (506) = 101.2
Rojo = 0.20 (506) = 101.2
Anaranjado = 0.10 (506) = 50.6
Verde = 0.10 (506) = 50.6
Azul = 0.10 (506) = 50.6
Calculamos el estadístico de prueba chi-cuadrada (X2):
COLORES DE CHOCOLATES
NÚMERO OBSERVADOS(FI)
NÚMERO ESPERADOS(EI)
FI - EI (FI - EI)2
(FI - EI)2/ EI
CAFÉ 177 151.8 25.20 635.04 4.1834
AMARILLO 135 101.2 33.80 1142.44 11.2889
ROJO 79 101.2 -22.20 492.84 4.8700
ANARANJADO
41 50.6 -9.6 92.16 1.8213
VERDE 36 50.6 -14.6 213.16 4.2126
AZUL 38 50.6 -12.6 158.76 3.1375
TOTAL X2=29.51
Para k-1=5-1=4 grados de libertad, con X2=29.51. Mediante tabla el valor-p es menor que 0.005. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.
58
Laboratorio de Estadística Industrial 2016
Mediante el Minitab con X2 =29.5138, se calcula el valor-p =0.0000061. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no tienen la misma proporción en las poblaciones.
59
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de Prueba de IndependenciaLa siguiente tabla de contingencia 2x3 contiene las frecuencias observadas de una muestra de tamaño de 200. Pruebe la independencia de las variables de renglón y de la columna usando la prueba X2 con α=0.05.
VARIABLE DE RENGLONES
VARIABLE DE COLUMNA
A B C
P 20 44 50
Q 30 26 30
Solución:
H0: Las variables de renglón son independientes a las variables columna.
H1: Las variables de renglón no son independientes a las variables columna.
Tabla de contingencia:
VARIABLE DE RENGLONES
VARIABLE DE COLUMNA
A B C TOTAL
P 20 44 50 114
Q 30 26 30 86
TOTAL 50 70 80 200
Hallando las frecuencias esperadas de cada celda:
eij=
60
Laboratorio de Estadística Industrial 2016
e11= =28.5 e12= =39.9 e13= =45.6
e21= =21.5 e22= =30.1 e23= =34.4
Tabla de números observados y esperados:
RENGLÓN
COLUMNA
NÚMERO OBSERVADOS(FI)
NÚMERO ESPERADOS(EI)
FI - EI
(FI -EI)2
(FI - EI)2/EI
P A 20 28.5 -8.5 72.25 2.5351
P B 44 39.9 4.1 16.81 0.4213
P C 50 45.6 4.4 19.36 0.4246
Q A 30 21.5 8.5 72.25 3.3605
Q B 26 30.1 -4.1 16.81 0.5585
Q A 30 34.4 -4.4 19.36 0.5628
TOTAL X2=7.8628
Para (2-1) x (3-1) = 2 grados de libertad y mediante tabla para X2=7.8628, se calcula el valor-p que esta entre 0.025 y 0.01. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la hipótesis nula.
61
Laboratorio de Estadística Industrial 2016
Mediante el Minitab con X2 =7.863, se calcula el valor-p = 0.020. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay independencia entre variable renglón y variable columna.
Una de las preguntas a los suscriptores de Bussiness Week fue, “En sus viajes de negocios de los último 12 meses, ¿Qué tipo de boleto ha comprado?” Los datos obtenidos se presentan en la tabla de contingencia siguiente.
TIPO DE BOLETO
TIPO DE VUELO
Vuelo Nacional
Vuelo Internacional
PRIMERA CLASE
29 22
CLASE NEGOCIO/EJECUTIVA
95 121
VUELO TRADICIONAL/ CLASE ECONÓMICA
518 135
Solución:
H0: Los tipo de boleto son independientes con los tipos de vuelo.
62
Laboratorio de Estadística Industrial 2016
H1: Los tipo de boleto son no independientes con los tipos de vuelo.
Tabla de contingencia:
TIPO DE BOLETO
TIPO DE VUELO
V. Nacional V. Internacional
TOTAL
PRIMERA CLASE
20 44 64
CLASE NEGOCIO
30 26 56
VUELO TRADICIONAL
518 135 653
TOTAL 568 205 773
Hallando las frecuencias esperadas de cada celda:
eij=
e11= =28.5 e12= =39.9 e21= =45.6
e22= =21.5 e31= =30.1 e32= =34.4
Tabla de números observados y esperados:
TIPO DE BOLETO
TIPO DE VUELO
NÚMERO OBSERVADOS(
FI)
NÚMERO ESPERADOS(
EI)
FI - EI
(FI EI)2
(FI - EI)2/EI
PRIMERA Nacional 20 47.03 27.0 730.6 15.535
63
Laboratorio de Estadística Industrial 2016
3 2
PRIMERA Internacional 44 16.97 27.0
3730.6
2 43.054
NEGOCIO Nacional 30 41.15-
11.15
124.32 3.0212
NEGOCIO Internacional 26 14.85 11.1
5124.3
2 8.3719
TRADICIONAL Nacional 518 479.82 38.1
81457.
7 3.0380
TRADICIONAL
Internacional 135 173.18 38.1
81457.
7 8.4173
TOTAL X2=81.437
Para (3-1) x (2-1) = 2 grados de libertad y mediante tabla para X2=81.437, se calcula el valor-p que es menor a 0.005. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la hipótesis nula.
64
Laboratorio de Estadística Industrial 2016
Mediante el Minitab con X2 =81.413, se calcula el valor-p = 0.000. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay independencia entre los tipos de boleto y los tipos de vuelo.
Problemas Aplicativos de la Distribución de PoissonA continuación se presenta el número de ocurrencia por lapso de tiempo y su frecuencia observada. Use α=0.05 y la prueba de bondad de ajuste para verificar su estos datos se ajustan a un distribución de Poisson.
NÚMERO DE OCURRENCIA
F. OBSERVADA
0 39
1 30
2 30
3 18
4 3
Solución:
H0: La población tiene una distribución Poisson.
H1: La población no tiene una distribución Poisson.
Total de frecuencias observadas: 120.
Media de ocurrencias: μ = = 1.31
Entonces la probabilidad de Poisson es: f(x)= =
Frecuencia esperada que siga un distribución de Poisson con μ=1.31
NÚMERO DE PROBABILIDA NÚMERO
65
Laboratorio de Estadística Industrial 2016
OCURRENCIAS
D DE POISSON F(X)
ESPERADO 120.F(X)
0 0.2698 32.376
1 0.3535 42.420
2 0.2315 27.780
3 0.1011 12.132
4 0.0331 3.972
5 O MÁS 0.0110 1.320
Cálculo del estadístico de prueba Chi-Cuadrado X2:
NÚMERO DE OCURRENCIA
S
NÚMERO OBSERVADOS(F
I)
NÚMERO ESPERADOS(E
I)FI - EI (FI
EI)2(FI -
EI)2/EI
0 39 32.376 6.624 43.877 1.355
1 30 42.420 -12.42 154.256 3.636
2 30 27.780 2.22 4.928 0.177
3 18 12.132 5.868 34.433 2.838
4 O MÁS 3 5.292 -2.292 5.253 0.993
TOTAL X2=8.999
66
Laboratorio de Estadística Industrial 2016
Para k-p-1=5-2=3 grados de libertad, con X2=8.999 mediante tabla el valor-p esta entre 0.05 y 0.025. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.
67
Laboratorio de Estadística Industrial 2016
Mediante Minitab con X2=8.99683, se calcula el valor-p=0.0293330. Por tanto el valor-p ≤ α=0.05. Entonces se rechaza la hipótesis nula y se concluye que la población no tiene una distribución Poisson.
68
Laboratorio de Estadística Industrial 2016
Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene una distribución de Poisson. A continuación se presentan los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la creencia de que el número de accidentes por día tiene una distribución de Poisson? Use α=0.05.
Número de Accidentes
F. Observada(días)
0 34
1 25
2 11
3 7
4 3
Solución:
H0: La población tiene una distribución Poisson.
H1: La población no tiene una distribución Poisson.
Total de frecuencias observadas: 80.
Media de ocurrencias: μ = = 1
Entonces la probabilidad de Poisson es: f(x)= =
Frecuencia esperada que siga un distribución de Poisson con μ=1
NÚMERO DE OCURRENCIAS
PROBABILIDAD DE POISSON F(X)
NÚMERO ESPERADO 80.F(X)
0 0.3679 29.432
69
Laboratorio de Estadística Industrial 2016
1 0.3679 29.432
2 0.1839 14.712
3 0.0613 4.904
4 0.0153 1.224
5 O MÁS 0.0037 0.296
Cálculo del estadístico de prueba Chi-Cuadrado X2:
NÚMERO DE OCURRENCIAS
NÚMERO OBSERVADOS(FI)
NÚMERO ESPERADOS(EI)
FI - EI (FI - EI)2
(FI - EI)2/ EI
0 34 29.432 4.568 20.867 0.7095
1 25 29.432 -4.568 19.643 0.6669
2 11 14.712 -3.712 13.779 0.9381
3 O MÁS 10 6.424 3.712 12.788 1.9905
TOTAL X2=4.30
Para k-p-1=4-2=2 grados de libertad, con X2=4.3 mediante tabla el valor-p esta entre 0.90 y 0.10. Entonces el valor-p> α=0.05, por tanto, no se rechaza H0.
70
Laboratorio de Estadística Industrial 2016
Mediante Minitab con X2=4.30491, se calcula el valor-p=0.116199. Por tanto el valor-p >α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene una distribución Poisson.
El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use α=0.05 y los datos siguientes para probar esta suposición.
NÚMERO DE LLAMADAS TELEFÓNICAS QUE LLEGAN POR MINUTO
FRECUENCIA OBSERVADA
0 15
1 31
2 20
3 15
4 13
5 4
6 2
Solución:
71
Laboratorio de Estadística Industrial 2016
H0: La población tiene una distribución Poisson.
H1: La población no tiene una distribución Poisson.
Total de frecuencias observadas: 100.
Media de ocurrencias: μ = = 2
Entonces la probabilidad de Poisson es: f(x)= =
Frecuencia esperada que siga un distribución de Poisson con μ=2
NÚMERO DE OCURRENCIAS
PROBABILIDAD DE POISSON F(X)
NÚMERO ESPERADO 100.F(X)
0 0.1353 13.53
1 0.2707 27.07
2 0.2707 27.07
3 0.1804 18.04
4 0.0902 9.02
5 0.0361 3.61
6 0.0120 1.20
7 O MÁS 0.0047 0.47
Cálculo del estadístico de prueba Chi-Cuadrado X2:
72
Laboratorio de Estadística Industrial 2016
NÚMERO DE OCURRENCIA
S
NÚMERO OBSERVADOS(F
I)
NÚMERO ESPERADOS(E
I)FI - EI (FI -
EI)2(FI -
EI)2/ EI
0 15 13.53 1.47 2.1609
0.1597
1 31 27.07 3.93 15.4449 0.5706
2 20 27.07 -7.07 49.9849 1.8465
3 15 18.04 -3.04 9.2416 0.5123
4 13 9.02 3.98 15.8404 1.7561
5 O MÁS 6 5.28 0.72 0.5184 0.0982
TOTAL 100 X2=4.9434
Para k-p-1=6-2=4 grados de libertad, con X2=4.9434 mediante tabla el valor-p esta entre 0.90 y 0.10. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.
Mediante Minitab con X2=4.945411, se calcula el valor-p=0.292945. Por tanto el valor-p >α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene una distribución Poisson.
73
Laboratorio de Estadística Industrial 2016
74
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de Métodos no Paramétricos
Prueba de Signos¿Las divisiones de acciones son benéficas para los accionistas? La empresa SNL Securities estudió, a lo largo de 18 meses, las divisiones de las acciones de la industria de la banca y encontró que las divisiones de las acciones de un individuo. Admita que en una muestra de 20 recientes divisiones de acciones, 14 hayan llevado a un aumento de su valor, cuatro hayan llevado a una disminución de su valor y dos no hayan ocasionado ningún cambio. Suponga que realiza un estudio para determinar si las divisiones de acciones aún benefician a los poseedores de acciones bancarias.
¿Cuáles son las hipótesis nula y alternativa?
¿A qué conclusión se llega con α=0.05?
Solución:
p = es la proporción de poseedores bancarios beneficiarios (aumente su valor).
H0: p≤0.5
H1: p>0.5
Nivel de significancia α=0.05.
Tabla de probabilidades binomiales para n=18 y p=0.5.
NÚMERO DE SIGNOS MÁS
PROBABILIDADES
0 0.0000
1 0.0001
2 0.0006
3 0.0031
4 0.0117
75
Laboratorio de Estadística Industrial 2016
5 0.0327
6 0.0708
7 0.1214
8 0.1669
9 0.1855
10 0.1669
11 0.1214
12 0.0708
13 0.0327
14 0.0117
15 0.0031
16 0.0006
17 0.0001
18 0.0000
El número de signos más para el valor de poseedores bancarios beneficiarios es x=14, entonces su probabilidad está en la cola superior:
P(x≥ 14) = P(14)+P(15)+P(16)+P(17)+P(18)=0.0117+0.0031+0.0006+0.0001+0.0000=0.0154
Como es para una cola el valor-p = 0.0154. Además el valor-p≤ α=0.05, entonces se rechaza H0.
76
Laboratorio de Estadística Industrial 2016
La empresa Nielson Media Research identificó que American Idol y a Dancing whit the Stars como los 2 programas de televisión de mayor rating en febrero de 2006. En un estudio local acerca del programa de televisión preferido, de 750 encuestados 330 votaron por American Idol, 270 por Dancing whit the Stars, y 150 por otros programas de televisión. Con 0.05 como nivel de significancia prueba la hipótesis de que American Idol y Dancing whit the Stars tiene el mismo nivel de preferencia. ¿A qué conclusión llega?
Solución:
p = es la proporción que ven American Idol.
H0: p=0.5
H1: p≠0.5
Nivel de significancia α=0.05.
La muestra es n=600, entonces es una distribución normal donde:
μ = 0.50 (600) = 300
= =12.25
El número de signo más es x=330, se halla el estadístico de prueba Z:
Z = = 2.45
Mediante tabla para Z=2.45, se calcula para 2 colas el valor-p= 2(1-0.9929)= 0.0142. Como el valor-p≤ α=0.05, entonces se rechaza H0.
77
Laboratorio de Estadística Industrial 2016
En el mercado de computadoras personales la competencia es intensa. En una muestra de 500 compras, se encontró que 202 eran compras de la marca A, 158 de la marca B y 140 de otras marcas. Con un nivel de significancia de 0.05 pruebe la hipótesis de que las marcas A y B tienen la misma participación en el mercado de las computadoras personales ¿Cuál es su conclusión?
Solución:
p = es la proporción de los que compran computadoras de la marca A.
H0: p=0.5
H1: p≠0.5
Nivel de significancia α=0.05.
La muestra es n=360, entonces es una distribución normal donde:
μ = 0.50 (360) = 180
= =9.49
El número de signo más es x=202, se halla el estadístico de prueba Z:
Z = = 2.32
Mediante tabla para Z=2.32, se calcula para 2 colas el valor-p= 2(1-0.9898)= 0.0204. Como el valor-p≤ α=0.05, entonces se rechaza H0.
78
Laboratorio de Estadística Industrial 2016
En una muestra de 150 partidos de basquetbol universitario, el equipo de casa ganó 98 partidos. Realice una prueba para determinar su los datos sustentan la hipótesis de que en el basquetbol universitario el equipo de casa tiene ventaja. ¿A qué conclusión llega con α=0.05?
Solución:
p = es la proporción de partidos que gana un equipo en casa.
H0: p≤0.5
H1: p>0.5
Nivel de significancia α=0.05.
La muestra es n=150, entonces es una distribución normal donde:
μ = 0.50 (150) = 75
= =6.12
El número de signo más es x=98, se halla el estadístico de prueba Z:
Z = = 3.76
Mediante tabla para Z=3.76, se calcula para una cola el valor-p= 1- 0.9999 ≈ 0.00. Como el valor-p≤ α=0.05, entonces se rechaza H0.
PROBLEMA
En la tabla se presentan las preferencias de 10 personas respecto a dos marcas de un producto.
PERSONA MARCA A FRENTEA MARCA B
1 +
2 +
3 +79
Laboratorio de Estadística Industrial 2016
4 -
5 +
6 +
7 -
8 +
9 -
10 +
Emplee α=0.05 y pruebe si existe alguna diferencia significativa de preferencia por estas dos marcas. Un signo más indica preferencia por la marca A sobre la marca B.
Solución:
p = es la proporción de preferencia por la marca A.
H0: p=0.5
H1: p≠0.5
Nivel de significancia α=0.05.
Tabla de probabilidades binomiales para n=10 y p=0.5.
NÚMERO DE SIGNOS MÁS
PROBABILIDADES
0 0.0010
1 0.0098
2 0.0439
3 0.1172
4 0.205180
Laboratorio de Estadística Industrial 2016
5 0.2461
6 0.2051
7 0.1172
8 0.0439
9 0.0098
10 0.0010
El número de signos más para la marca A es x=7, entonces su probabilidad está en la cola superior:
P(x≥ 7) = P(7)+P(8)+P(9)+P(10)=0.1172+0.0439+0.0098+0.0010=0.1719.
Como es para dos cola el valor-p = 2(0.0154)=0.8438. Además el valor-p≥ α=0.05
Entonces no se rechaza H0.
PROBLEMA
Realice la prueba de hipótesis siguiente:
H0: Mediana ≤150
H1: Mediana >150
En una muestra de tamaño 30 se obtuvieron 22 casos cuyo valor fue mayor que 150, tres cuyo valor fue exactamente 150 y cinco cuyo valor fue menor que 150. Con α=0.01 realice una prueba de hipótesis.
Solución:
Con nivel de significancia α=0.01.
El número de la muestra es n = 27, asume una distribución normal.
μ = 0.50 (27) = 13.5
= =2.60
81
Laboratorio de Estadística Industrial 2016
El número de signo más es x=22, se halla el estadístico de prueba Z:
Z = = 3.27
Mediante tabla para Z=3.27, se calcula para una cola el valor-p= 1- 0.990 = 0.001.
Como el valor-p≤ α=0.01.
Entonces se rechaza H0.
82
Laboratorio de Estadística Industrial 2016
PROBLEMA
El ingreso mediano anual de los suscriptores de la Barron es $131 000. Suponga que en una muestra de 300 suscriptores a The Wall Street Journal, 165 suscriptores posean un ingreso mayor que $131 000 y 135 poseen un ingreso menor que $131 000. ¿Puede concluir que hay diferencia entre los ingresos medianos de los dos grupos de suscriptores? Emplee como nivel de significancia α=0.05, ¿a qué conclusión llega?
Solución:
H0: Mediana = $131 000
H1: Mediana ≠ $131 000
Con nivel de significancia α=0.01.
El número de la muestra es n = 300, asume una distribución normal.
μ = 0.50 (300) = 150
= = 8.66
El número de signo más es x=165, se halla el estadístico de prueba Z:
Z = = 1.73
Mediante tabla para Z=1.73, se calcula para dos colas el valor-p=2(1- 0.9582) = 0.0836. Como el valor-p≥ α=0.01, entonces no se rechaza H0.
83
Laboratorio de Estadística Industrial 2016
PROBLEMA
De acuerdo con un estudio nacional, el ingreso anual mediano que los adultos dicen harían realidad sus sueños es $152 000. Suponga que en Ohio, de 225 personas tomadas en una muestra, 122 indican que el ingreso necesario para hacer realidad sus sueños sea menor que $152 000, y 103 informan que esta cantidad sea mayor que $152 000. Pruebe la hipótesis nula de que en Ohio, el ingreso medio anual para que una persona haga realidad sus sueños es $152 000. Use α=0.05, ¿a qué conclusión llega?
Solución:
H0: Mediana = $152 000
H1: Mediana ≠ $152 000
Con nivel de significancia α=0.01.
El número de la muestra es n = 225, asume una distribución normal.
μ = 0.50 (225) = 112.5
= = 7.5
El número de signo más es x=122, se halla el estadístico de prueba Z:
Z = = 1.27
Mediante tabla para Z=1.27, se calcula para dos colas el valor-p=2(1- 0.8980) = 0.204. Como el valor-p≥ α=0.01, entonces no se rechaza H0.
84
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de la Prueba de WilcoxonPROBLEMA
Con efecto de determinar el rendimiento de la gasolina en millas por galón en los automóviles de pasajeros, se prueban dos aditivos para gasolina. A continuación aparecen los resultados de esta prueba en 12 automóviles; en cada automóvil se probaron los dos aditivos. Use nivel de significancia α=0.05 y la prueba de los rangos con signo de Wilcoxon para determinar su existe una diferencia significativa.
AUTÓMOVIL
ADITIVOS
1(millas/galón)
2(millas/galón)
1 20.12 18.05
2 23.56 21.77
3 22.03 22.57
4 19.15 17.06
5 21.23 21.22
6 24.77 23.80
7 16.16 17.20
8 18.55 14.98
9 21.87 20.03
10 24.23 21.15
11 23.21 22.78
12 25.02 23.70
Solución:
H0: Las poblaciones son idénticas en relación a los aditivos.
85
Laboratorio de Estadística Industrial 2016
H1: Las poblaciones no son idénticas en relación a los aditivos.
AUTÓMOVIL
ADITIVOS DIFERENCIA
VALORABS.DE DIFERENCIA
RANGO
RANGO CON SIGNO
1(millas/galón)
2(millas/galón)
1 20.12 18.05 2.07 2.07 9 9
2 23.56 21.77 1.79 1.79 7 7
3 22.03 22.57 -0.54 0.54 3 -3
4 19.15 17.06 2.09 2.09 10 10
5 21.23 21.22 0.01 0.01 1 1
6 24.77 23.80 0.97 0.97 4 4
7 16.16 17.20 -1.04 1.04 5 -5
8 18.55 14.98 3.57 3.57 12 12
9 21.87 20.03 1.84 1.84 8 8
10 24.23 21.15 3.08 3.08 11 11
11 23.21 22.78 0.43 0.43 2 2
12 25.02 23.70 1.32 1.32 6 6
Suma de signos: 62
Media: µt=0
Desviación: t= = = 25.50
86
Laboratorio de Estadística Industrial 2016
Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=62. Se obtiene el valor para el estadístico de prueba:
Z= = = 2
De la tabla para Z=2.43 se halla para dos colas el valor-p=2(1-0.9925)=0.015. Como el valor-p ≤ α=0.05, se rechaza H0.
Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.017, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de H0. Entonces las dos poblaciones son distintas.
PROBLEMA
En 10 de los principales aeropuertos se muestran los precios de la gasolina para automóviles rentados. A continuación se presentan los datos correspondientes a las empresas Avis y Budget. Use α = 0.05 para probar la hipótesis de que hay diferencia entre las 2 poblaciones. ¿Cuál es su conclusión?
AEROPUERTOS
EMPRESAS
Avis Budget
87
Laboratorio de Estadística Industrial 2016
BOSTON LOGAN
1.58 1.39
CHICAGO OHARE
1.60 1.55
CHICAGO MIDWAY
1.53 1.55
DENVER 1.55 1.51
FORT LAUDERDALE
1.57 1.58
LOS ÁNGELES 1.80 1.74
MIAMI 1.62 1.60
NUEVO YORK 1.69 1.60
ORANGE COUNTRY
1.75 1.59
WASHINGTON W.
1.55 1.54
Solución:
H0: Las poblaciones son idénticas en relación a los aditivos.
H1: Las poblaciones no son idénticas en relación a los aditivos.
AEROPUERTOS
EMPRESAS
DIFERENCIA
VALOR ABS. DE DIFERENCIA
RANGO
RANGO CON SIGNO
Avis
Budget
BOSTON LOGAN
1.58
1.39 0.19 0.19 10 10
88
Laboratorio de Estadística Industrial 2016
CHICAGO OHARE
1.60
1.55 0.05 0.05 6 6
CHICAGO MIDWAY
1.53
1.55 -0.02 0.02 3.5 -3.5
DENVER 1.55
1.51 0.04 0.04 5 5
FORT LAUDERDALE
1.57
1.58 -0.01 0.01 1.5 -1.5
LOS ÁNGELES 1.80
1.74 0.06 0.06 7 7
MIAMI 1.62
1.60 0.02 0.02 3.5 3.5
NUEVO YORK 1.69
1.60 0.09 0.09 8 8
ORANGE COUNTRY
1.75
1.59 0.16 0.16 9 9
WASHINGTON W.
1.55
1.54 0.01 0.01 1.5 1.5
Suma de signos=45
Media: µt=0
Desviación: t= = = 19.62
Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=45. Se obtiene el valor para el estadístico de prueba:
Z= = = 2.29
89
Laboratorio de Estadística Industrial 2016
De la tabla para Z= 2.29, se halla para dos colas el valor-p=2(1-0.9890)=0.0220 como el valor-p ≤ 0.05, Se rechaza H0.
Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.025, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de H0. Entonces las dos poblaciones son distintas.
90
Laboratorio de Estadística Industrial 2016
PROBLEMA
El campeonato de los jugadores de la PGA tuvo lugar, del 23 al 26 de marzo del 2006, en el campeonato de golf TPC Sangras en Ponte Vendra Beach, Florida. A continuación se presentan puntuaciones obtenidas, en la primera y segunda ronda, por 11 golfistas de la muestra. Use α = 0.05 y determinar si existe una diferencia significativa entre las puntuaciones obtenidas por los golfistas en la primera y segunda ronda. ¿Cuál es su conclusión?
ENTREGAS RONDAS
1
2
FRED COUPLES
69 73
JOHN DAB 70 73
ERNIE ELS 72 70
JIM FURYK 65 71
PHIL MICKELSON
70 73
ROCCO MEDIATE
69 74
NICK PRICE
72 71
VIJAY SINGH
68 70
SERGIO GARCÍA
70 68
MIKE WEIR
71 71
91
Laboratorio de Estadística Industrial 2016
TIGER WOODS
72 69
Solución:
H0: Las poblaciones son idénticas en relación a los aditivos.
H1: Las poblaciones no son idénticas en relación a los aditivos.
ENTREGAS
SERVICIOS DIFERENCI
A
VALOR ABS.DE
DIFERENCIA
RANGO
RANGO CON SIGNO1 2
FRED COUPLES 69 73 -4 4 8 -8
JOHN DAB 70 73 -3 3 6 -6
ERNIE ELS 72 70 2 2 3 3
JIM FURYK 65 71 -6 6 10 -10
PHIL MICKELSO
N70 73 -3 3 6 -6
ROCCO MEDIATE 69 74 -5 5 9 -9
NICK PRICE 72 71 1 1 1 1
VIJAY SINGH 68 70 -2 2 3 -3
SERGIO GARCÍA 70 68 2 2 3 3
92
Laboratorio de Estadística Industrial 2016
MIKE WEIR 71 71 0 0 -- --
TIGER WOODS 72 69 3 3 6 6
Suma de signos = -29
Media: µt=0
Desviación: t= = = 19.62
Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=-29. Se obtiene el valor para el estadístico de prueba:
Z= = = -1.48
De la tabla para Z= 1.48, se halla para dos colas el valor-p = 2(1-0.99306)=0.1388, como el valor-p ≥ 0.05, No se rechaza H0.
Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.154, el cual es mayor a α = 0.05, por lo tanto se comprueba el no rechazo de H0. Entonces las dos poblaciones son idénticas.
93
Laboratorio de Estadística Industrial 2016
Problemas Aplicativos de la Prueba de Mann-Whitney-WilcoxonPROBLEMA
Para poder comprobar el efecto de dos aditivos sobre el rendimiento de gasolina, siete automóviles usan aditivo 1 y nueve automóviles el aditivo 2. En los datos siguientes se presenta el rendimiento en millas por galón obtenido con cada uno de los dos aditivos. Use α = 0.05 y la prueba de MWW para determinar si existe una diferencia significativa en el efecto que tiene los dos aditivos sobre el rendimiento.
ADITIVO 1 ADITIVO 2
17.3 18.7
18.4 17.8
19.1 21.3
16.7 21.0
18.2 22.1
18.6 18.7
17.5 19.8
20.7
20.2
Solución:
H0: las dos poblaciones son idénticas en término de rendimiento.
H1: las dos poblaciones no son idénticas en términos de rendimiento.
Nivel de significancia que se toma α=0.05.
ADITIVO 1 RANGO ADITIVO 2 RANGO
16.7 1 17.8 4
17.3 2 18.7 8.594
Laboratorio de Estadística Industrial 2016
17.5 3 18.7 8.5
18.2 5 19.8 11
18.4 6 20.2 12
18.6 7 20.7 13
19.1 10 21.0 14
21.3 15
22.1 16
Suma de rangos: 34 102
Se toma la suma de rangos de la primera muestra para el valor de T=34.
95
Laboratorio de Estadística Industrial 2016
PROBLEMA
Para un nivel de significancia α=0.05, de la tabla se encuentra el valor crítico Tl en la cola inferior para el estadístico de prueba MWW con n1=7 y n2=9 es Tl=41. El valor crítico en la cola superior para el estadístico de prueba MWW es:
Tu=n1 (n1 +n2 +1)- Tl=7(7+9+1) – 41=78
La decisión que se tomara es:
Rechazar H0 si T<41 v T> 78.
Se concluye, como: T=34, además 34 < 41, entonces se rechaza H0.
Minitab:
Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de rendimiento según el aditivo usado.
96
Laboratorio de Estadística Industrial 2016
PROBLEMA
A continuación se muestra los datos muestrales de los salarios iniciales de contadores públicos y planificadores financieros. Los salarios anuales están dados en millones de dólares.
Use 0.05 como nivel de significancia y prueba la hipótesis de que no hay diferencia entre los salarios anuales iniciales de los contadores públicos y los planificadores financieros.
CONTADOR PÚBLICO
PLANIFICADOR FINANCIERO
45.2 44.0
45.9 44.2
46.9 48.1
49.2 50.9
50.0 46.9
51.3 48.6
52.0 44.7
53.2 48.9
53.8 46.8
54.5 43.9
Solución:
H0: las dos poblaciones son idénticas en término de salarios iniciales.
H1: las dos poblaciones no son idénticas en términos de salarios iniciales.
Nivel de significancia que se toma α=0.05.
CONTADOR PÚBLICO
PLANIFICADOR FINANCIERO
SALARIO Rango Salari Rang
97
Laboratorio de Estadística Industrial 2016
o o
45.2 5 43.9 1
45.9 6 44.0 2
46.9 8.5 44.2 3
49.2 13 44.7 4
50.0 14 46.8 7
51.3 16 46.9 8.5
52.0 17 48.1 10
53.2 18 48.6 11
53.8 19 48.9 12
54.5 20 50.9 15
Suma de Rangos 136.573.5
98
Laboratorio de Estadística Industrial 2016
La suma de los rangos que se toma es de la primera muestra: T=136.5.
Como n1=10 y n2=10 se usa la aproximación normal de la distribución muestral de la suma de rangos T:
µt= n1 (n1+n2+1) = 10(10+10+1) =105
t= = = 13.23
Para T= 136.5 y nivel de significancia 0.05 se halla el estadístico de prueba:
Z= = = 2.38
Mediante tabla para Z=2.38, se halla para 2 colas el valor-p=2(1-0.9913)=0.0174. Como valor-p≤α=0.05, entonces se rechaza H0.
Minitab:
Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de salarios entre la población de contadores públicos y de planificadores financieros.
99
Laboratorio de Estadística Industrial 2016
La brecha entre los salarios de hombres y mujeres con la misma preparación disminuye cada vez más, pero aún no se ha cerrado totalmente. A continuación se presenta datos de muestras de 7 hombres y 7 mujeres con licenciatura. Los datos se dan en miles dólares.
Hombre 30.6
75.5
45.2
62.2
38.2
49.9
55.3
Mujeres 44.5
35.4
27.9
40.5
25.8
47.5
24.8
Solución:
H0: las dos poblaciones son idénticas en término de salarios iniciales.
H1: las dos poblaciones no son idénticas en términos de salarios iniciales.
Nivel de significancia que se toma α=0.05.
Hombres Mujeres
Salario Rango
Salario Rango
30.6 4 24.8 1
38.2 6 25.8 2
45.2 9 27.9 3
49.9 11 35.4 5
55.3 12 40.5 7
62.2 13 44.5 8
75.5 14 47.5 10
Suma de Rangos 69 36
La suma de rangos que se toma es de la primera muestra: T=69.
Para un nivel de significancia de 0.05. La cota inferior para un estadístico de prueba MWW mediante tabla es Tl= 37. La cota superior para un estadístico de prueba MWW se calcula:
100
Laboratorio de Estadística Industrial 2016
Tu=n1 (n1 +n2 +1)- Tl=7(7+7+1) – 37 = 68
La decisión que se tomara es:
Rechazar H0 si T<37 v T> 68.
Se concluye, como: T=69, además 69 > 68, entonces se rechaza H0.
Minitab:
Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de salarios entre mujeres y hombres.
101
Laboratorio de Estadística Industrial 2016
Prueba de Kruskal-WallisPROBLEMA
Las calificaciones dadas a productos por un panel de 15 consumidores son las siguientes:
PRODUCTO
A B C
50 80 60
62 95 45
75 98 30
48 87 58
65 90 57
Use la prueba de Kruskal-Wallis y α=0.05 para determinar si existe una diferencia significativa entre las clasificaciones dadas de los tres productos.
Solución:
PRODUCTO
A RANGO B RANGO C RANG
O
48 3 80 11 30 1
50 4 87 12 45 2
62 8 90 13 57 5
65 9 95 14 58 6
75 10 98 15 60 7
TOTAL 34 65 21
H0: Todas poblaciones son idénticas.102
Laboratorio de Estadística Industrial 2016
H1: No todas las poblaciones son idénticas.
Nivel de significancia y α=0.05.
Los tamaños de las muestras son:
n1=5, n2=5, n3=5 y nT=15
Calculamos el estadístico de prueba W:
W =
W = 10.22
Para k-1=3-1=2 grados de libertad.
X2= 9.210 su área de cola superior = 0.01
X2= 10.597 su área de cola superior = 0.005
Entonces el valor-p esta entre 0.01 y 0.005, por tanto valor-p ≤ α=0.05, se rechaza H0.
Minitab:
El valor-p que se calcula es 0.006, por tanto, valor-p=0.006 ≤ α=0.05, se rechaza H0.
103
Laboratorio de Estadística Industrial 2016
Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre la clasificación entre los 3 productos.
104
Laboratorio de Estadística Industrial 2016
PROBLEMA
Para un examen de admisión se evalúan tres programas de preparación. Las calificaciones obtenidas por las 20 personas de una muestra empleada para probar los programas de preparación son las siguientes. Use la prueba de Kruskal-Wallis para determinar su hay diferencia significativa entre los tres programas de preparación. Use α=0.01.
PROGRAMAS
A B C
540 450 600
400 540 630
490 400 580
530 410 490
490 480 590
610 370 620
550 570
Solución:
PROGRAMAS
A RANGO
B RANGO C RANGO
400 2.5 370 1 490 8
490 8 400 2.5 570 14
490 8 410 4 580 15
530 10 450 5 590 16
540 11.5 480 6 600 17
105
Laboratorio de Estadística Industrial 2016
610 18 540 11.5 620 19
550 13 630 20
TOTAL
58 43 109
H0: Todas poblaciones son idénticas.
H1: No todas las poblaciones son idénticas.
Nivel de significancia y α=0.01.
Los tamaños de las muestras son:
n1=6, n2=7, n3=7 y nT=20
Calculamos el estadístico de prueba W:
W =
W = 9.06
Para k-1=3-1=2 grados de libertad.
X2= 7.378 su área de cola superior = 0.025
X2= 9.210 su área de cola superior = 0.01
Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza H0.
Minitab:
106
Laboratorio de Estadística Industrial 2016
El valor-p que se calcula es 0.011, por tanto, valor-p=0.011 ≤ α=0.05, se rechaza H0.
Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre los tres programas de calificación.
PROBLEMA
Para bajar de peso basta con practicar una de las siguientes disciplinas tres veces por semana durante 40 minutos. En la tabla siguiente se muestra la cantidad de calorías que se quema en 40 minutos de cada una de estas disciplinas. ¿Estos datos indican que exista diferencia en la cantidad de calorías quemadas con cada una de estas disciplinas? De su conclusión.
DISCIPLINAS
NATACIÓN TENIS ANDAR EN BICICLETA
408 415 385
380 485 250
425 450 295
400 420 402
427 530 268
Solución:
DISCIPLINAS
NATACIÓN
RANGO
TENIS
RANGO
ANDAR EN
RANGO
107
Laboratorio de Estadística Industrial 2016
BICICLETA
380 4 415 9 250 1
400 6 420 10 268 2
408 8 450 13 295 3
425 11 485 14 385 4
427 12 530 15 402 7
TOTAL 41 61 17
H0: Todas poblaciones son idénticas.
H1: No todas las poblaciones son idénticas.
Nivel de significancia y α=0.05.
Los tamaños de las muestras son:
n1=5, n2=5, n3=5 y nT=15
Calculamos el estadístico de prueba W:
W =
W = 9.26
Para k-1=3-1=2 grados de libertad.
X2= 7.378 su área de cola superior = 0.025
X2= 9.210 su área de cola superior = 0.01
Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza H0.
108
Laboratorio de Estadística Industrial 2016
El valor-p que se calcula es 0.010, por tanto, valor-p=0.010 ≤ α=0.05, se rechaza H0.
Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre los la cantidad de calorías quemadas con cada una de las disciplinas.
109