Tarea tres de estadistica

23
UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA ORIENTAL DEPARTAMENTO DE CIENCIAS NATURALES Y MATEMATICA SECCION DE MATEMATICA “Prueba de hipótesis” Asignatura: Probabilidad e inferencia estadística Docente: Mst. Es. María del Tránsito Gutiérrez Reyes Estudiantes: Mauricio Ernesto Flores Hernández José Gerardo Menjivar Especialidad: Profesorado en Matemática

Transcript of Tarea tres de estadistica

Page 1: Tarea tres de estadistica

UNIVERSIDAD DE EL SALVADOR

FACULTAD MULTIDISCIPLINARIA ORIENTAL

DEPARTAMENTO DE CIENCIAS NATURALES Y MATEMATICA

SECCION DE MATEMATICA

“Prueba de hipótesis”

Asignatura: Probabilidad e inferencia estadística

Docente: Mst. Es. María del Tránsito Gutiérrez Reyes

Estudiantes: Mauricio Ernesto Flores Hernández

José Gerardo Menjivar

Especialidad: Profesorado en Matemática

Ciudad Universitaria Oriental, 26 de octubre de 2011

Page 2: Tarea tres de estadistica

Pruebas de hipótesis para muestras grandes

Partes de una prueba estadística

Hipótesis nula: una contradicion de la hipótesis alternativa.

Hipótesis alternativa : la hipótesis que el investigador quiere apoyar

Estadístico de prueba y su valor p: la evidencia muestral calculada de los datos

de la muestra

Región de rechazo- valores críticos y nivel de significación: valores que

separan el rechazo y el no rechazo de la hipótesis nula, estableciendo la

significación practica de su conclusión

Errores y significación estadística

El nivel de significación: es la probabilidad de rechazar H0 cuando de hecho es

cirta.

El valor p: es la probabilidad de observar un estadístico de prueba tan extremo

como o mas extremo que el observado; también, el valor mas pequeño de con el

cual se puede recharzar H0

Cuando el valor p es menor que el valor de significación : se rechaza la

hipotesis nula. Esto pasa cuando el estadístico de prueba excede el valor critico.

En un error tipo II, : es la probabilidad de aceptar H0 cuando de hecho es falsa. La

potencia de la prueba es (1-) la probabilidad de rechazo es H0 cuando es falsa.

9.1 prueba de hipótesis respecto a los parámetros.

La inferencia estadística se podría requiere a estimar un parámetro de la población o

tomar decisiones respecto al valor del parámetro. El razonamiento usado en una prueva

de hipótesis estadística es similar al proceso en un juicio, cuando los tamaños de la

muestra son grandes los estimadores puntuales para cada uno de estos cuatro

parámetros tiene distribuciones muéstrales normales, de tal manera que las cuatro

pruebas estadísticas con una muestra grande sigue el mismo modelo general.

9.2 prueba de hipótesis estadística

Page 3: Tarea tres de estadistica

Una prueba de hipótesis estadística consta de cinco partes:

a) La hipótesis nula denotada por H0

b) la hipótesis alternativa , denotada por Ha

c) el estadístico de prueba y su valor p

d) la región de rechazo

e) la conclusión

cuando se especifican estos cinco elemento se están refiriendo a una prueba particular

si modifica una o mas de las partes se crea una nueva prueba.

Definición: las dos hipótesis en competencia son la hipótesis alternativa Ha por lo

general es la hipótesis que el investigador desea apoyar y la hipótesis

Como pronto se verá, es más fácil mostrar el soporte de la hipótesis alternativa

demostrando que la hipótesis nula es falsa un. Por tanto, el investigador estadístico

siempre empieza suponiendo que la hipótesis nula Ho es cierta qué. Así, a partir de los

datos de la muestra el investigador decide si la evidencia favorece a Ha y no a H0 y

llega una de estas dos conclusiones:

Rechazar Ho y concluir que Ha es verdadera.

Aceptar (no rechazar) a H0 como verdadera.

La decisión de rechazar aceptar la hipótesis nula se basa en la información que

contiene una muestra extraída de la población de interés. Esta información toma estas

formas:

Estadístico de prueba: un solo número calculado a partir de la información

muestral.

Valor P: una probabilidad calculada mediante el estadístico de prueba

Cualquiera de las dos medidas o ambas actúan como marca de decisión para el

investigador rechazar aceptar H0.

Estadístico de prueba x = 15 encuentros encuentra

Z= x - µ = 15 - 14 = 5 σ/ √n 0.2 σ/ √ Z= x - n 0.2

Page 4: Tarea tres de estadistica

Desviación estándar de la media poblacional µ.

El Valor p es la probabilidad de observar un estadístico de prueba que este a

cinco o más desviaciones estándar de la media. Puesto que z mide el número de

desviaciones estándar a que una variable aleatoria normal esta de su media, se

tiene

Valor p = P (z > 5)+P (z˂ - 5) ≈ 0

El Valor grande del estadístico de prueba y el Valor pequeño de P significan que se

ha observado un evento muy improbable, si en realidad H0 es verdadera y µ = 14

Page 5: Tarea tres de estadistica

Región de región de Región de Región de

Rechazo Aceptación rechazo x

$ 14

Valor crítico Valor crítico

Región de

Rechazo

P

Valor crítico 0.03

Si el estadístico de prueba cae en la región de rechazo, entonces se rechaza la

hipótesis nula. Si el estadístico de prueba se encuentra la región de aceptación,

entonces se acepta la hipótesis nula o se considera que la prueba no será concluyente.

Se aclararán los distintos tipos de conclusiones apropiadas cuando se estudien los

ejemplos prácticos de pruebas de hipótesis.

Por último, ¿cómo elegir sobre los valores críticos que separa las regiones de

aceptación y rechazó? Es decir, ¿de qué manera se decide cuanta evidencia

estadística se necesita antes de rechazar H0 ? Esto depende de la confianza que el

investigador quiera dar a las conclusiones de la prueba y el nivel significación α, el

riesgo que está dispuesto a correr al tomar una decisión incorrecta.

Definición: un error tipo I para una prueba estadística es el que se comete al rechazar

la hipótesis nula cuando es verdadera. El nivel significación α para una prueba de

hipótesis que es

α= P (error tipo I) = P (rechazar falsamente a H0) = P (rechazar H0 cuando es

verdadera)

Page 6: Tarea tres de estadistica

Este Valor α representa el riesgo tolerable máximo o rechazar de manera incorrecta a

Ho. Una vez que este nivel de significación se determina, la región del rechazo se puede

establecer para permitir al investigador rechazar Ho con un grado fijo de confianza en la

decisión.

En la siguiente sección se muestra cómo usar una prueba de hipótesis para probar el

valor de una media poblacional µ. Como continuamos se aclararan algunos de los

detalles de cálculo y se agregarán algunos otros conceptos para ayudar a la

comprensión completa de las pruebas de hipótesis.

9.3 prueba de la media poblacional para muestra

Considere una muestra aleatoria de n mediciones tomado de una población con una

media µ y desviación estándar σ. Se requiere probar una hipótesis de la forma

H0 : µ = µ0

Contra una hipótesis alternativa de una cola donde µo es algún valor hipotético para

Ha : µ > µ0

El subíndice cero indica el valor del parámetro especificado por H0. Observe que H0

proporciona un valor exacto para el parámetro que ese probará, en tanto que le H a da

un intervalo de valores posibles para µ.

Elementos esenciales de la prueba

La media muestral x es la mejor estimación del valor real de µ, la cual está

actualmente en cuestión. ¿Qué valores de x lo llevarían a creer que H0 es falsa y que µ

es, de hecho, mayor que el Valor hipotético? Esos valores de x que son

Page 7: Tarea tres de estadistica

extremadamente grandes querrían decir que µ es más grande que el valor hipotético.

Por tanto, usted puede rechazar H0 si x es demasiado grande.

El siguiente problema es definir el significado de (demasiado grande). No es muy

probable que ocurran los valores de x que quieren a demasiadas desviaciones estándar

a la derecha de la media. Esos valores tienen un área muy pequeña a su derecha.

Entonces, se puede definir (demasiado grande) cuando está a demasiadas

desviaciones estándar de µ0. ¿Pero qué es demasiadas? Esta pregunta se contesta

cuando el nivel de significación α, la probabilidad de rechazar H0 cuando es verdadera

recuerde que el error estándar de x se calcula mediante

σ x¯= _ σ __

√n

Puesto que la distribución muestral de la media x es aproximadamente normal cuando n

es grande, el número de de desviaciones estándar que están entre x y µ0 se determina

mediante el estadístico de prueba estandarizado:

Z= x - µ0

σ/ √n

La cual tiene una distribución normal estándar cuando H0 es verdadera y µ = µ0. El

nivel de significación α es igual al área bajo la curva normal que está más allá de la

región de rechazo. Entonces, si se quiere que α =0.01, rechazara H0 cuando x esta a

más de 2.33 desviaciones estándar a la derecha de µ0. En forma equivalente, usted

rechazará H0 si el estadístico de prueba estandarizado Z es mayor que 2.33

Prueba estadística como estas grandes para µ

1. Hipótesis nula: H0 : µ=µ0

2. Hipótesis alternativa:

Page 8: Tarea tres de estadistica

Prueba de cola prueba de dos colas

H a: µ>µ0 Ha : µ ≠ µ0

(o bien H a: µ˂µ0)

Calculo del valor P

Definición: el valor p 0 nivel de significación observado de una prueba estadística es el

valor mas pequeño de α con la cual puede rechazarse H0. Es el riesgo real de cometer

un error tipo I, si se rechaza la orden de con base en el Valor observado del estadístico

de prueba. El Valor de mi de la fuerza de la evidencia contra.

Definición: en un Si el Valor P menor que un nivel de significación pre asignado,

entonces puede rechazar se la hipótesis nula, e informar que los resultados son

estadísticamente significativos en el nivel α.

Si usted está leyendo el informe de una investigación, y ¿que tan pequeña debe ser el

Valor p un para que decida rechazar H0? muchos investigadores usan una escala móvil

para clasificar su resultados.

si el Valor p de es menor que 0.01, es de rechazar H0 los resultados son muy

significativos

Si el Valor p está entre 0.01 y 0.05, se rechaza H0. Los resultados son

estadísticamente significativos.

Si el Valor está entre 0.05 y 0.10, generalmente no se rechaza H0. Los resultados

son estadísticamente significativos.

Si el Valor p es mayor que 0.10, no se rechaza H0. Los resultados no son

estadísticamente significativos.

Ejemplo: las normas establecidas por las intenciones gubernamentales seña{lan que

los estados unidos no deben exceder una ingestión promedio diaria de sodio de 3300

mg. Para averiguar si están excediendo este limite se selecciona una muestra de 100

Page 9: Tarea tres de estadistica

estado unidenses, y se encuentra que la media y la desviación estándar de la ingestión

diaria de sodio son 3400 mg, respectivamente. Use = 0.05 para efectuar una prueba

de hipótesis.

Sol: H0: = 3300ncontra Ha: 3300

El estadístico de prueba es

Z=×−μ

θ/√n≈ 3400−33001100 /√100

=0.91

Los dos métodos desarrollados en esta sección llegan a las mismas conclusiones en.

El método del Valor crítico: como el nivel de significación es 0.05 y la prueba

es una cola, la región de rechazo se determina por medio de un Valor crítico con

un área de cola igual 0.05; es decir, H0 se puede rechazar z 1.645. Como

Z = 0.91 y no es mayor que el Valor crítico, H0 no se rechaza.

El método del Valor p: calcule el Valor p, la probabilidad que el Z sea mayor o

igual que z =0.91:

Valor p = P(z0.91)= 0.5- 0.3186 = 0.1814

Solo se puede rechazar la hipótesis nula si el Valor p es menor que el nivel de

significación especificado 5%. Por consiguiente. H0 no se rechaza y los resultados

no son estadísticamente significativos. No hay suficiente evidencia para señalar que

la ingestión promedio diaria de sodio excede en 3300 mg.

Page 10: Tarea tres de estadistica

Valor p= 0.1814

= 0.05

Rechazar H0(z1.645)

Observe que estos dos métodos son, de hecho, el mismo, como se ilustra en la

figura 9.6. Tan pronto el Valor calculado del estadístico de prueba de z se vuelve

más grande que el Valor crítico, z, el valor p se vuelve menor que el valor

significativo de . Puede usar el método que mas le convenga; ¡las conclusiones a

las que llegue siempre serán las mismas! Sin embargo, el método del valor p tiene

dos ventajas:

Los resultados estadísticos que se obtienen por medio de paquetes como

minitab generalmente dan el valor p de la prueba.

Con base en el valor p es posible evaluar los resultados de su prueba usando

cualquier nivel de significación que desee. Muchos investigadores indican el

nivel de significación mas pequeño posible para el cual resultados son

estadísticamente significativos.

Dos tipos de errores

Usted podría preguntarse por que, cuando no se rechaza la H0 en el ejemplo

anterior, no se dijo definitivamente que H0 era verdadera y que = 3300. La razón

es que si se escoge aceptar H0 debe haber una medida de la probabilidad de

error asociada con esta decisión.

Page 11: Tarea tres de estadistica

Puesto que hay dos opciones en una prueba estadística , también hay dos tipos

de errores que se pueden cometer. De hecho, la hipótesis nula puede ser

verdadera o falsa, independiente de la decisión que tome el investigador.

Hipótesis nula

Además del error tipo I con probabilidad definido al principio en sección, es posible

cometer un segundo error, llamado error tipo II, el cual tiene probabilidad .

Error tipo I: para una prueba estadística es el que se cometer al rechazar la hipótesis

nula cuando es verdadera.la probabilidad de cometer un error tipo I se denota con el

símbolo .

Error tipo II: para una prueba estadística es el que se comete al aceptar la hipótesis

nula cuando es falsa y alguna hipótesis alternativa es verdadera. La probabilidad de

cometer un error tipo II se denota mediante el símbolo

Potencia de una prueba estadística

La bondad de una prueba estadística se mide por el tamaño de los dos índices de

error:, la probabilidad de rechazar H0 cuando e verdadera y , la probabilidad de

aceptar H0 cuando Ha es verdadera. “Una buena prueba“es aquella en la cual ambos

índices de error son pequeños. El investigador empieza por seleccionar, la

probabilidad de cometer un error tipo I.si también decide controlar el valor , la

probabilidad de aceptar H0 cuando Ha es verdadera, entonces escoge un tamaño

apropiado para la muestra. Otra manera de evaluar la prueba es considerar el

complemento de un error tipo II, es decir, rechazar H0 cuando Ha es verdadera, el

cual tiene la probabilidad

Decisión verdadera Falsa

Rechazar

H0

Aceptar H0

Error tipo I

Decisión

correcta

decisión

correcta

error tipo II

Page 12: Tarea tres de estadistica

1 - P (rechazar H0 cuando Ha es verdadera)

La cantidad (1 - ) se llama potencia de la prueba por que mide la probabilidad de

tomar la acción que deseamos que ocurra, es decir, rechazar la hipótesis nula

cuando es falsa.

Definición: la potencia de la prueba estadística, dada como

1 - = p (rechazar H0 cuando Ha es verdadera)

mide la actitu de la prueba para comportarse como se requiere

una grafica (1 - ), la probabilidad de rechazar H0 cuando en efecto es falsa, como

funcion del valor verdadero del parámetro de interés se llama curva de potencia para

la prueba estadística. En condiciones perfectas querria que fuera pequeña y que

la potencia (1 - ) fuera grande.

Pruebas de hipótesis con muestras grnades para la diferencia entre dos medias

poblacionales

En muchas situaciones, la pregunta estadística que se tiene que contestsar requiere

la comparación de dos medios poblacionales. El estadístico que resume la

información de la muestra con respecto a la difencia en las medias poblacionales (1

- 2) es la diferencia en las medias muestrales (1-2).. Por consiguiente, al probar si

la diferencia en las medias muestrales que la verdadera diferencia de las medias

poblacionales difiere de un valor especificado (1 - 2) = D0, se puede usar el error

estándar de (1-2).

SE = √❑12

n1

❑22

n2

En la forma de un estadístico z para medir a cuantas desviaciones estándar esta la

diferncias (1-2). De la diferencia hipotética de D0. El procedimiento de la prueba

formal se describe a continuación.

Page 13: Tarea tres de estadistica

Prueba estadística con muestras grandes para (1 - 2)

1. hipótesis nula : H0 : (1 - 2) = D0, donde D0 es alguna diferencia especificada que

desea probar. En muchas pruebas se supondrá que no hay diferencia entre 1 y 2;

es decir, D0 = 0

2. hipótesis alternativa:

prueba de una cola prueba de dos colas

Ha : (1 - 2) D0 Ha : (1 - 2) D0

o Ha : (1 - 2) D0

3.estadístico de prueba: z = (1−2 )−D

SE=¿

(1−2 )−D

√❑12

n1

❑22

n2

si 21 y 2

2, don dos desconocidos(lo cual casi siempre es el caso ), sustituya las

varianzas muestrales S21 y S

22

21 y

22, respectivamente.

4. región de rechazo: rechase H0 cuando

Prueba de una cola prueba de dos colas

Z z Z z/2 o bien z - z/2

[o bien, z - z cuando la hipótesis alternativa es Ha : (1 - 2) D0 ]o bien cuando el

valor p

Page 14: Tarea tres de estadistica

Prueba de hipótesis de intervalo de confianza

Si usa el método del valor critico o el valor p para probar la hipótesis de (1 - 2),

siempre llegara a la misma conclusión porque el valor calculado del estadístico de

prueba y el valor critico están relacionados exactamente del mismo modo que el

valor p y el nivel de significación . Recordara que los intervalos de confianza

presentados en el capitulo ocho también se podrían usar para constestar la pregunta

sobre la diferencia entre dos medias poblacionales.De hecho, para una

si el intervalo de confianza que se construya contiene el valor del parámetro

espesificado por H0, entonces ese valor es uno de los valores probables o posibles

del parámetro, y no debe rechazar H0

si el valor hipotético queda fuera de los limites de confianza, la hipótesis nula se

trechaza en el nivel de significación .

Prueba de hipótesis para una proporción binomial en una muestra grande.

Cuando se extrae una muestra aleatoria de n ensayos idénticos de una población

binomial, la proporción muestral ~p tiene una distribución aproximadamente normal

cuando n es grande, con media p y error estándar.

SE=√ pqn

Cuando se prueba una hipótesis respecto a p, la proporción en la población que

posee un cierto atributo , la prueba sigue la misma forma general que las pruebas de

muestras grandes de las asociaciones para probar una hipótesis de la forma.

H 0 : p=p0

contra unaalternativade unaodoscolas

H a : p p0 obienH a : p p0 obienH a : p p0

El estadístico estdistico de prueba se construye ~p el mejor estimador de la población

verdadera p. la proporción muestral ~p se estandariza por medio de la medio de la

Page 15: Tarea tres de estadistica

media y el error estándar hipotético, para formar un estadístico de prueba z que

tiene una distribcion normal estándar sin H0 es sierta se resume esta prueba para

muestras grandes.

Pruebaestad í stica para penunamuestra grande

1Hipotesisnula :H 0 : p=p 0

2hipotesis alternativa :

Pruebadeunacola prueba dedos colas

H a : p p0H a : p p0

3estadistico de prueba : z=~p−p0SE ❑

=~p−p0

√ p0−q0n

con~p= xn

Donde xes el numerode é xitosennensayos binomiales .

4 regionderec hazo :rechace H 0cuando

Pruebadeunacola prueba dedos colas

Z z z obie n z−z

(o bien z−za cuando lahip ó tesis alternativaes H a: p p0)

Ocuandoel valor p α

prueba de hipotesis de la diferencia entre dos proporciones binomiales para

muestras grnades

cuando se elige una muestra aleatoria e independientes de dos poblaciones

binomiales el objetivo del experimento ppuede ser la diferncia (p1-p2) en las

proporciones de individuos o articulos que poseen una caracteristica especifica en

las poblaciones. En esta situacion, se puede usar la diferencia de las proporciones

muestrales (~p1−~p2) junto con su error estandar,

√ p1q1+¿n1

p2q2n2

¿

Page 16: Tarea tres de estadistica

En la forma de un estadístico z para probar para una diferencia significativa en las

dos proporciones poblacionales. La hipótesis nula por probar normalmente es de la

forma.

H 0 : p1=p2o bienH 0 :( p1=p2)=0

Contra una hipótesis alternativa de una o dos colas. La prueba formal de hipótesis .

para estimar el error estándar del estadístico z, se puede usar el hecho de que H0 es

cierta, las dos proporciones poblacionales son iguales a un valor común

~p= numero totalde exitosnumerototal deensayos

=x1+x2n1+n2

Recuerde que para la diferencia de las proporciones muestrales tengan una distribución

aproximadamente normal, los tamaños de la muestra deben ser grandes y las

proporciones no deben de estar cerca de ceo o uno

Pruebade estad í stica de( p1 – p2)=0oquivalente a H 0 : p1=p2

Hipó tesis alternativa :

Pruebadeunacola prueba dedos colas

H a :( p1=p2)0H a :( p1=p2)0

[H a:( p1=p2)0]

Estad í sticode prueba :

Z= ~¿¿¿ =

~p1−~p2

√ p1q1+ p2q2n1n2

= ~p1−~p2

√ pqn1

+ pqn2

Page 17: Tarea tres de estadistica

Donde ~p1= x1/n1y ~p2 = ~x2/n2. Puesto que no se conoce el valor común de p1 =p2 = p

(utilizando el error estándar ), se estima por

~p =x1+x2n1+n2

Y el estadístico de prueba es

Z=~¿¿¿¿ o bien z= ~¿¿¿¿

Región de rechazo: rechaze H0 cuando

Prueba de una cola prueba de dos colas

Z z Z z/2 o bien z - z/2

[ o bien z - zcuando la hipótesis alternativa es Ha (p1- p2) D0]

O cuando el valor de p