Distribucion de Chi Cuadrado

31
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA NACIONAL CENTRO DE INVESTIGACIÓN Y POSTGRADO TÉCNICAS CUANTITATIVAS DE GESTIÓN (Distribución de Chi Cuadrado) Calatrava Yanoski Maldonado Hugo Rincón Julio Sevilla Carlos

Transcript of Distribucion de Chi Cuadrado

Page 1: Distribucion de Chi Cuadrado

REPÚBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DE LA DEFENSA

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICADE LA FUERZA ARMADA NACIONAL

CENTRO DE INVESTIGACIÓN Y POSTGRADO

TÉCNICAS CUANTITATIVAS DE GESTIÓN

(Distribución de Chi Cuadrado)Calatrava YanoskiMaldonado Hugo

Rincón JulioSevilla Carlos

Page 2: Distribucion de Chi Cuadrado

ESTADÍSTICA INFERENCIAL“Distribución de Chi Cuadrado ”

2

Las distribución Chi cuadrado, se derivan de la distribución Normal y están relacionadas con la teoría del muestreo pequeño n< 30.

Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos de Confianza y Pruebas de Hipótesis.

En otros estudios se les define como la suma de diferencias cuadráticas relativas entre valores experimentales (observados) y valores teóricos (esperados).

Page 3: Distribucion de Chi Cuadrado

Definición: Sea Sea k variables aleatorias normales e independientes, cada una con media 0 y desviación típica 1. entonces, la variable aleatoria

Se llama la variable aleatoria chi cuadrado con k grados de libertad.

Distribución Chi-cuadrado2

Page 4: Distribucion de Chi Cuadrado

Fórmula de Chi Cuadrado

α = Nivel de Significancia: En estadística, un resultado se denomina

estadísticamente significativo cuando no es probable que haya sido debido al azar.

Son comunes los niveles de significancia del 0,05, 0,01 y 0,1. En algunas situaciones es conveniente expresar la significancia estadística como percentil 1 − α.

Este valor hace referencia al nivel de confianza que deseamos que tengan los cálculos de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza.

Definición de los Términos

e

eo

f

ff

22 )(

Page 5: Distribucion de Chi Cuadrado

Hipótesis: Si un contraste de hipótesis proporciona un valor P inferior a α, la hipótesis nula es rechazada, siendo tal resultado denominado “estadísticamente significativo”. Cuanto menor sea el nivel de significancia, más fuerte será la evidencia de que un hecho no se debe a una mera coincidencia (al azar).

Grados de Libertad: GL=k-1 En estadística, grados de libertad es un estimador del número de categorías independientes en una prueba particular o experimento estadístico. Se encuentran mediante la fórmula n − r, donde n=número de sujetos en la muestra, también pueden ser representados por k − r,

k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales

r=número de sujetos o grupos estadísticamente dependientes

Page 6: Distribucion de Chi Cuadrado

Distribución Chi-cuadrado2

Page 7: Distribucion de Chi Cuadrado

Distribución Chi-cuadrado2

Page 8: Distribucion de Chi Cuadrado

Chi Cuadrado Crítico2

Page 9: Distribucion de Chi Cuadrado

La Regla de Decisión

Ch² observado < Ch² critico

Rechazar Ho

Aceptar Ho

Si

No

Page 10: Distribucion de Chi Cuadrado

Para determinar si la muestra se ajusta o no se ajusta a una distribución teórica.

Para saber si la(s) poblacione(s) son homogénea(s) o no.

Para determinar la dependencia e independencia la(s) variable(s) a analizar.

¿Para que utilizamos una Prueba de Chi Cuadrado?

2

Page 11: Distribucion de Chi Cuadrado

Aplicaciones de Chi Cuadrado

Prueba de Chi Cuadrado

Dos Variables

Prueba de Homogenei

dad

Prueba de Independen

cia

Una Variable

Prueba de Bondad de Ajuste

2

Page 12: Distribucion de Chi Cuadrado

Se utiliza para la comparación de la distribución de una muestra con alguna distribución teórica que se supone describe a la población de la cual se extrajo.

Ho : La variable tiene comportamiento normal se distribuye de manera uniforme

H1 : La variable no tiene comportamiento normal, no se distribuye de manera uniforme.

Prueba de Bondad de Ajuste

e

eo

f

ff

)(2

Page 13: Distribucion de Chi Cuadrado

Un gerente de ventas que tiene su mercado dividido en cuatro zonas le indica a sus vendedores que las zonas tienen el mismo potencial de ventas.

Ante la duda de los vendedores sobre el potencial de sus zonas el gerente hace el siguiente procedimiento :Se extrae una muestra de los archivos de la empresa de 40 ventas realizadas el año pasado y encuentra que el numero de ventas por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 = 14 y zona 4 = 8 . En vista de esos resultados se realiza una prueba de bondad de ajuste.

Ejemplo 1:

Page 14: Distribucion de Chi Cuadrado

Planteamiento de Hipótesis H0 : las ventas están igualmente distribuidas. H1: las ventas no están igualmente distribuidas

Nivel de Significancia α = 5% = 0.05

Cálculos GL= k-1 = 4-1 = 3 El critico = 7.81 (Según Tabla)

Solución:

2

Page 15: Distribucion de Chi Cuadrado

Chi Cuadrado Crítico2

Page 16: Distribucion de Chi Cuadrado

Elaborar la tabla de y y calcular el .

ZONAS

A B C DFrecuencia

observada (fo) 6 12 14 8 40Frecuencia

esperada (fe) 10 10 10 10 40

Ch² 1.6 0.4 1.6 0.4 4

Los individuales se calculan con la formula; y luego se suman:

Este valor es el observado = 4

Solución:

e

eo

f

ff2

2 )(

of ef

2

2

2

Page 17: Distribucion de Chi Cuadrado

Como: observado < Critico observado (4) < critico (7.81) Si se Cumple

entonces, no rechazamos Ho.

Es decir que la Ho de que las ventas se encuentran igualmente distribuidas en las cuatro zonas no se puede rechazar para un nivel de significancia de 5%.

La decisión:2 22 2

Page 18: Distribucion de Chi Cuadrado

Se usa para analizar la frecuencia de dos variables con categorías múltiples para determinar si las dos variables son independientes o no.

Hipótesis nula (H0) : Las variables X e Y son independientes, ( X e Y no están relacionadas)

Hipótesis alternativa (H1): Las variables X e Y no son independientes, (X e Y están relacionadas)

Prueba de Independencia

F

i

C

j ij

ijijCF

E

EO

1 1

2

)1)(1(2 )(

Page 19: Distribucion de Chi Cuadrado

Tablas de contingencias Grados de libertad GL= (m-1)(n-1) Calculo de frecuencia esperado.

Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma:

)(

)()(

total

columnasumafilasumafe

Los datos de variables cualitativa o categóricas representan atributos o categorías y se organizan en tablas llamadas tablas de contingencia o tablas de clasificación cruzada.

Page 20: Distribucion de Chi Cuadrado

Donde:

Oi j : es el número de sujetos que tienen las características Ai y Bj a la vez.

Ri : (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos que poseen la característica Ai.

Cj :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos que poseen la característica Bj.

n : representa el total de observaciones tomadas.

F

i

C

j ij

ijijCF

E

EO

1 1

2

)1)(1(2 )(

Page 21: Distribucion de Chi Cuadrado

El uso de bebida ordenado con alimentos en un restaurante ¿es independiente de la edad del consumidor? Se toma una muestra aleatoria de 309 clientes del restaurante de donde resulta el siguiente cuadro de valores observados. Utilice α = 1% para determinar si las dos variedades son independientes.

EDAD CAFÉ (TÉ) REFRESCO LECHE

21 – 34 26 95 18

35 – 55 41 40 20

>55 24 13 32

Ejemplo 2:

Page 22: Distribucion de Chi Cuadrado

Solución:

Planteamiento de Hipótesis H0 : El tipo de bebida preferida es independiente de la edad H1 : El tipo de bebida preferida no es independiente ,esta

relacionada con la edad

Nivel de significancia α = 0.01

Cálculos Grados de Libertad GL = (m-1)(n-1)

Tenemos 3 filas y tres columnas, es decirGL = (3-1)(3-1) = 4

El critico = 13.27 (Según Tabla)

2

Page 23: Distribucion de Chi Cuadrado

Chi Cuadrado Crítico2

Page 24: Distribucion de Chi Cuadrado

Solución:Calculo de frecuencia esperado. )(

)()(

total

columnasumafilasumafe

EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL

21 – 34 26 95 18 139

Frecuencia Esperada

35 – 55 41 40 20 101

Frecuencia Esperada

≥55 24 13 32 49

Frecuencia Esperada

Total fo 91 148 50 289

Total fe

43,8 71,2

EDAD CAFÉ (TÉ) REFRESCO LECHE TOTAL

21 – 34 26 95 18 139

Frecuencia Esperada 43.8 71.2 24.0 139,0

35 – 55 41 40 20 101

Frecuencia Esperada 31.8 51.7 17.5 101,1

≥55 24 13 32 49

Frecuencia Esperada 15.4 25.1 8.5 49,0

Total fo 91 148 50 289

Total fe 91.0 148.0 50,0 289,0

Page 25: Distribucion de Chi Cuadrado

Como: observado < Critico observado (97,93) < critico (13,27)

No se Cumpleentonces, rechazamos H0, es decir se acepta la hipótesis alternativa H1

Las dos variables, bebida preferida y edad, no son independientes. El tipo de bebida que un cliente ordena con alimentos está relacionada con la edad y depende de está.

La Decisión2 22 2

Page 26: Distribucion de Chi Cuadrado

Se extraen Muestras Independientes de varias poblaciones y se prueban para ver si son homogéneas con respecto a algún criterio de clasificación.

H0 = Las Poblaciones son Homogéneas H1 = Las Poblaciones no son Homogéneas

Prueba de Homogeneidad

F

i

C

j ij

ijijCF

E

EO

1 1

2

)1)(1(2 )(

Page 27: Distribucion de Chi Cuadrado

La siguiente tabla indica las familias de cuatro distritos y el número de personas que vieron un programa especial de política económica nacional. Use α=1%

Ejemplo 3:

A B C D TOTAL

Número de personas que si vio 10 15 5 18 48

Número de personas que no vio 40 35 45 32 152

50 50 50 50 200

Page 28: Distribucion de Chi Cuadrado

Planteamiento de Hipótesis H0: todos vieron el programa H1: No todos vieron el programa

Nivel de Significancia α = 0.011

Cálculos GL = (m-1)(n-1) = (2-1)(4-1) = 3 = 11.35 Calcular las frecuencias esperadas y el Ch2 observado.

Solución:

2

Page 29: Distribucion de Chi Cuadrado

A B C D TOTAL

VEN EL PROGRAMA 0.33 0.75 4.08 3.00NO VEN EL PROGRAMA 0.11 0.24 1.29 0.95TOTAL 10.75

Como el valor observado (10.75) es menor que el valor critico (11.35). No podemos rechazar H0 para un nivel del 1%. La diferencia de las proporciones no es suficientemente grande para rechazar H0.

Solución:

Page 30: Distribucion de Chi Cuadrado

Lipschutz. S., Schiller. J., Introducción a la Probabilidad y Estadística. 2001 Editorial Mc Graw Hill.

Evans. M., Rosenthal. J. Probabilidad y Estadística. 2005 Editorial Reverte

Bibliografía

Page 31: Distribucion de Chi Cuadrado

MUCHAS GRACIAS…