2 prueba z,prueba t student y prueba chi-cuadrado
-
Upload
rominagallegosormeo -
Category
Data & Analytics
-
view
1.486 -
download
9
Transcript of 2 prueba z,prueba t student y prueba chi-cuadrado
“Año de la consolidación del mar de Grau”
GRUPO: N° 2
DISTRIBUCIÓN
Z
ESTIMACIÓN• La inferencia estadística, es el
proceso que consiste en utilizar losresultados de una muestra parallegar a conclusiones acerca de lascaracterísticas de una población.
• Existen dos tipos principales deestimación:
• Estimación puntual:
• Estimación de intervalo:
Estimación Puntual:• Consiste en una sola estadística de
muestra que se utiliza para estimar el valorverdadero de un parámetro de población.
por ejemplo:
La media de muestra X, es una estimaciónpuntual de la media poblacional µx.
La varianza de muestra S2, es unaestimación puntual de la varianza depoblación ơ2x.
Estimación de Intervalo:
El objetivo de la estimación es utilizarla distribución de muestreo paradesarrollar una estimación de intervalode confianza para una media o parauna proporción, y determinar el tamañode muestra necesario para obtener unintervalo de confianza deseado.
ESTIMACIÓN DE INTERVALO DE CONFIANZA DE LA MEDIA (ơx CONOCIDA).
Cuando una distribución en elmuestreo de la media o de laproporción es normal, la probabilidadde que las medias muestrales oproporciones estén dentro de lamáxima ordenada (y) y la ordenada enZ puede ser obtenida de la tabla dedistribución normal.
NIVEL DE CONFIANZA.
En términos generales el nivel de confianza sesimboliza como (1 - α) 100, en donde α, es laporción que se encuentra en los extremos dela distribución y que está fuera del intervalo deconfianza.
por consiguiente, para obtener la estimaciónde intervalo de confianza de (1 - α) 100 de lamedia, con desviación estándar conocida ơx,tenemos:
NIVEL DE CONFIANZA.
X±Z ơ𝒙
√𝒏
ó
X–Z ơ𝒙
√𝒏≤ µx ≤ X+Z
ơ𝒙
√𝒏
En la que Z, es el valor correspondiente a unárea (1-α)/2, desde el centro de una distribuciónnormal estandarizada.
Así; para construir una estimación de intervalo deconfianza de 95 %, el valor Z correspondiente aun área de 0.95/2 = 0.4750 desde el centro de ladistribución normal, entonces Z = 1.96.
El valor Z elegido para el intervalo de confianzase conoce como el valor crítico de ladistribución.
Curva normal para determinar el valor de Z necesario para un nivel de confianza del 95%.
Entonces podemos afirmar quetenemos 95% de confianza deque hemos seleccionado unamuestra cuyo intervalo incluye ala media de población.
y solamente 5% de ellas no estarían incluidas.
Curva normal para determinar el valor de Z necesario para un nivel de confianza del 99%.
Si se deseara un nivel de confianza de 99% entonces:
0.99
2= 0.495, el valor
Z = 2.58
Curva normal para determinar el valor de Z necesario para un nivel de confianza del 90%.
En otros casos podríamos estar dispuestos aaceptar una certeza menor, como 90% dehaber estimado correctamente la media depoblación. Entonces 0.90/2 = 0.4500, el valor Z= 1.645
ESTIMACIÓN DE INTERVALO DE CONFIANZA DE LA MEDIA (ơx
DESCONOCIDA)
Puede parecer un tanto más extraño que se tengala varianza de la población y no se conozca el valorde la media de la población. De hecho, es común,que se desconozca tanto la varianza como la mediade la población.
𝑍 =𝑋− µ
ơ/√𝑛
Cuando el tamaño de muestra es mayorque 30, la confianza en la S comoaproximación de la ơ por lo general essustancial, por lo que se justifica lautilización de la teoría de la distribuciónnormal para construir un intervalo deconfianza.
PRUEBA
T
STUDENT
Se aplica cuando la población estudiadasigue una distribución normal pero eltamaño muestral es demasiado pequeñocomo para que el estadístico en el queestá basada la inferencia esténormalmente distribuido, utilizándoseuna estimación de la desviación típica enlugar del valor real.
PRUEBAS T PARA DOS MUESTRAS APAREADAS Y DESAPAREADAS:
DESAPAREADAS O DE MUESTRAS
INDEPENDIENTES
SE UTILIZAN CUANDO SE OBTIENEN DOS GRUPOS DE MUESTRAS ALEATORIAS, INDEPENDIENTES E IDÉNTICAMENTE DISTRIBUIDAS A PARTIR DE LAS DOS POBLACIONES A SER COMPARADAS.
supóngase que estamos evaluando el efecto deun tratamiento médico, y reclutamos a 100sujetos para el estudio. Luego elegimosaleatoriamente 50 sujetos para el grupo entratamiento y 50 sujetos para el grupo decontrol. En este caso, obtenemos dos muestrasindependientes y podríamos utilizar la formadesapareada de la prueba t. La elecciónaleatoria no es esencial en este caso
un grupo de unidades que hansido evaluadas en dos ocasionesdiferentes (UNA PRUEBA T DEMEDICIONES REPETITIVAS).
LAS PRUEBAS T DE MUESTRAS DEPENDIENTES O APAREADAS
en esta prueba estadística se exigedependencia entre ambas, en las quehay dos momentos uno antes y otrodespués. Con ello se da a entender queen el primer período, las observacionesservirán de control o testigo, paraconocer los cambios que se suscitendespués de aplicar una variableexperimental.
t = valor estadístico del procedimiento.Valor promedio o media aritmética de las diferencias entre los momentos antes y después.desviación estándar de las diferencias entre los momentos antes y después.N = tamaño de la muestra.
EN CUANTO A LA HOMOGENEIDAD DE VARIANZAS, ES UN REQUISITO QUE TAMBIÉN DEBE SATISFACERSE Y UNA MANERA PRÁCTICA ES DEMOSTRARLO
MEDIANTE LA APLICACIÓN DE LA PRUEBA JI CUADRADA DE BARTLETT:
Ordenar los datos en función de los momentos antes y después, y obtener las diferencias entre ambos.
Calcular la media aritmética de las diferencias ( ).
Calcular la desviación estándar de las diferencias (sd).
Decidir si se acepta o rechaza la hipótesis.
PASOS:
Calcular el valor de t por medio de la ecuación.Calcular los grados de libertad (gl) gl = N - 1.Comparar el valor de t calculado con respecto a grados de libertad en la tabla respectiva, a fin de obtener la probabilidad.Decidir si se acepta o rechaza la hipótesis.
PRUEBA CHI
CUADRADO
Una prueba de chi-cuadrado es
una prueba de hipótesis que
determina si 2 variables están
relacionadas o no.
Compara la distribución
observada de los datos
con una distribución
esperada de los datos.
Dónde:
X2 = valor estadístico de ji
cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Los datos estén recopilados
en una tabla.
Los datos estén expresados en
frecuencias absolutas.
Cada celda de la tabla
contenga un valor mayor o igual
a 5.
PARA SU APLICACIÓN SE REQUIERE:
Prueba chi-
cuadrado
Una variable
Prueba de Bondad de
ajuste
Dos variables
Prueba de Homogenei
dad
Prueba de Independe
ncia
Prueba de chi-
cuadrado de bondad
de ajuste
Utilice este análisis para
probar qué tan bien una
muestra de datos categóricos
se ajusta a una distribución
teórica.
Por ejemplo, se puede
comprobar si un dado es
justo, lanzando el dado
muchas veces, para
determinar si los
resultados siguen una
distribución uniforme.
Prueba de Homogeneidad:Consiste en comprobar si varias
muestras de una carácter
cualitativo proceden de la misma
población.
Por ejemplo: Se obtiene tres
muestras de alumnos provienen de
poblaciones con igual distribución
de aprobados.
Prueba de
independencia:
Utilice una prueba de
independencia para
determinar si el valor
observado de una variable
depende del valor observado
de otra variable.
Por ejemplo, el hecho de
que una persona vote por
un candidato depende
del género del elector?,
o si el color de ojos está
relacionado con el color
de los cabellos?