Estad y Prob_5a_10

download Estad y Prob_5a_10

of 65

Transcript of Estad y Prob_5a_10

  • Objetivos

    Al finalizar la unidad, el alumno:

    determinar si un estimador es sesgado o insesgado resolver problemas de intervalos de confianza para la media, diferencia de medias, varianza y proporciones llevar a cabo pruebas de hiptesis para la media, diferencia de medias, varianza y proporciones en problemas de aplicacin

    Inferencia estadstica

    UNIDAD

    10

  • Introduccin

    En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan estimaciones de parmetros en estudio; las multivariables aleatorias; se defini formalmente el muestreo aleatorio, y se estudiaron algunas distribuciones muestrales empleando el teorema central del lmite. El objetivo general de dichos temas es la construccin de las bases tericas para la inferencia estadstica.

    En esta unidad se analizar el proceso de inferencia estadstica, el cual se puede hacer de tres maneras: por estimacin puntual, intervalo de confianza o por prueba de hiptesis.

    Los estimadores puntuales, como se ver, tienen gran importancia terica en la infe-rencia estadstica, pero en la cuestin prctica no es apropiado llevarlos a cabo con base en un solo punto; por consiguiente se harn estimaciones basadas en intervalos.

    La otra rea de inferencia estadstica que se analizar es la prueba de hiptesis. Es decir, se formula una suposicin del parmetro y bajo condiciones determinadas se comprobar si es vlida o no.

    En la unidad 1 se determin que la estadstica descriptiva trabaja con todos los individuos de la poblacin o la muestra. En esta unidad se ver que la estadstica inferencialse basa en el estudio de muestras, a partir de las cuales se pretende inferir aspectos relevantes de toda la poblacin. En la unidad 9 se determin que el mtodo de seleccionar muestras tiene gran importancia en el desarrollo de la estadstica. Cmo se realiza la inferencia yqu grado de confianza se puede tener en la muestra son aspectos fundamentales que se analizarn en esta unidad.

    10.1 Inferencia estadsticaLa inferencia estadstica consiste en crear mtodos con los cuales se puedan realizar conclusiones o inferencias acerca de la poblacin, con base en informacin muestral o apriori. Tales mtodos se dividen en dos grupos:

    1. Clsico.2. Bayesiano.

    En el mtodo clsico la inferencia se realiza mediante los resultados de un muestreo aleatorio. Mientras que en el mtodo bayesiano las inferencias se realizan (deforma anloga a la asignacin de probabilidades en la corriente bayesiana) con base en el conocimiento previo sobre la distribucin de los parmetros desconocidos.

    El desarrollo de la inferencia estadstica en la presente unidad se har slo con el mtodo clsico. El anlisis comienza con la estimacin de parmetros.

  • 286

    10.1.1 Estimacin puntual

    Un estimador es un elemento descriptivo basado en las mediciones contenidas en una muestra. Por ejemplo, la media de la muestra

    xn

    xii

    n1

    1

    es un estimador puntual para la media de la poblacin 0.Supngase que se quiere obtener una inferencia respecto de la calificacin media

    de todos los alumnosque cursan la materia de clculo, para esto se analiza una muestra aleatoria de diez de ellos, cuyas calificaciones son

    8, 4, 9, 9, 6, 8, 2, 7, 3 y 6

    Mediante el promedio de los datos de una muestra se calcula un valor para el estadstico X

    x110

    8 4 9 9 6 8 2 7 3 6 6 2( ) .

    Con base en el valor calculado del estadstico X se puede llevar a cabo una inferencia respecto del parmetro , es decir, una estimacin puntual del parmetro media respecto de las calificaciones de la materia de clculo. En este caso la calificacin promedio es 6.2. En general

    Dada una poblacin en donde es un parmetro, y su estadstica correspondiente, se le llama estimador puntual de a cualquier valor de .

    De la definicin de estimador puntual no se puede esperar que dicho valor realice una estimacin certera del parmetro, de hecho, sta tambin depende del estadstico utilizado. Por ejemplo, si la poblacin estudiantil de la materia de clculo tiene calificacin promedio = 6.5, y se considera una muestra al azar de tres estudiantes con calificaciones 3, 6 y 6, para realizar una estimacin del parmetro, se tiene

    x13

    3 6 6 5( )

    Es decir, el estadstico media difiere del parmetro en 1.5 unidades, mientras que el estadstico mediana x 6, difiere del parmetro en slo 0.5.

    Por tanto, con la muestra anterior, el estadstico mediana estima mejor el parmetro. Pero, qu pasar si en una segunda muestra aleatoria de tamao tres, las calificaciones para la estimacin del parmetro resultan 4, 4, y 10, se tiene

    x13

    4 4 10 6( )

    Por tanto, para esta muestra el estadstico media difiere del parmetro en 0.5 unidades, mientras que el estadstico x 4, difiere del parmetro en 2.5.

    Es decir, con la muestra anterior el estadstico media estima mejor el parmetro. Por tanto, puede ser de interes qu estimador puntual para un mismo parmetro es mejor elegir. La respuesta se encuentra en las siguientes definiciones.

    Definicin 10.1

  • 287

    El estadstico se llama estimador insesgado del parmetro si E( ) = .

    Dadas X1, X2, . . ., X5 una muestra aleatoria de una poblacin cuya distribucin es normal, con media y varianza 2, considerando los estadsticos

    T X T X X X T X X X X X1 2 1 2 5 3 1 2 3 4 510 3, y

    se comprueba cules son estimadores insesgados de .Para verificar qu estimadores son insesgados, se emplea la definicin y la propiedad

    del valor esperado en variables independientes

    E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2Para el estadstico T1

    E T E X E X X X X X E X X X X X( ) ( )1 1 2 3 4 5 1 2 3 4 5515

    15

    EE X E X E X E X E X( ) ( ) ( ) ( ) ( )

    ( ) ( )

    1 2 3 4 5

    15

    15

    5

    Se muestra que T1 es un estimador insesgado.Para el estadstico T2

    E T E X X X X X E X X X X X

    E

    ( )

    (

    21 2 3 4 5

    1 2 3 4 5101

    10

    110

    XX E X E X E X E X1 2 3 4 51

    105 1

    2) ( ) ( ) ( ) ( ) ( )

    Se muestra que T2 es un estimador sesgado.Para el estadstico T3

    E T E X X X X X E X X X X X

    E X

    ( )

    ( )

    31 2 3 4 5

    1 2 3 4 5

    1

    313

    13

    E X E X E X E X( ) ( ) ( ) ( ) ( ) ( )2 3 4 5 1313

    3

    Por tanto, T3 tambin es un estimador insesgado de la media.

    En el ejemplo anterior se aprecia que a un mismo parmetro le pueden corresponder varios estimadores insesgados. Por consiguiente, en el estudio de la estadstica resulta deinters conocer el estimador insesgado que tenga la menor varianza, ya que en tal caso sudistribucin est ms cercana al parmetro.

    Dado un parmetro y un conjunto de estimadores insesgados de l, , , , 1 2 m , se llama de al de menor varianza.

    Definicin 10.2

    Definicin 10.3

    Ejemplo 1

  • 288

    Dada la muestra aleatoria del ejemplo anterior X1, X2, . . ., X5 y considerando los estadsticos que resultaron insesgados de

    T X T X X X X X1 3 1 2 3 4 53y

    se comprueba cul es ms eficiente. Para esto se usa la definicin y la propiedad de la varianza en variables independientes

    V a X a X a X a V X a V X a V Xn n n n( ) ( ) ( ) ( )1 1 2 2 12 1 22 2 2

    Para el estadstico T1

    V T V X X X X X V X X X X X

    V X

    ( )

    (

    11 2 3 4 5

    2 1 2 3 4 5515

    125 11 2 3 4 5

    2 2 2 2 2125

    125

    5

    ) ( ) ( ) ( ) ( ) ( )

    (

    V X V X V X V X

    22 215

    )

    Para el estadstico T3

    V T V X X X X X V X X X X X

    V X

    ( )

    (

    31 2 3 4 5

    2 1 2 3 4 5

    1

    313

    19

    )) ( ) ( ) ( ) ( ) ( ) ( )

    (

    V X V X V X V X2 3 2 4 5 2 2 2 2 2119

    19

    55 59

    2 2)

    De los clculos anteriores, resulta que el estadstico T1 es ms eficiente que T3, puesto que 1/ 5 5/ 9.

    Entre los parmetros ms comunes y sus estadsticos, existen los insesgados que se emplean con mayor regularidad:

    Ejercicio 1 1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una poblacin

    distribuida en forma normal con media y desviacin estndar , considera los siguientes estimadores de

    T X X X X1 1 2 3 46

    T X X X X2 1 2 3 44

    T X X X X3 1 2 3 42 3 4

    10

    y determina cules son insesgados y entre stos cul es ms eficiente.

    Ejemplo 2

  • 289

    2. La lectura en un voltmetro conectado a un circuito deprueba tiene una distribucin uniforme en el intervalo de ( , + 1), donde es el parmetro para el voltaje del circuito. Supn que X1, X2, X3 y X4 es una muestra aleatoria de tales lecturas y verifica que .X 0 5 es un estimador insesgado.

    3. Dadas X1, X2 y X3 y Y1, Y2 y Y3 como muestras aleatorias independientes de dos poblaciones con medias 1 y 2 y varianza 1

    2 y 22, respectivamente

    a) comprueba que X Y es un estimador insesgado de 1 y 2 b) calcula la varianza del estimador X Y

    10.1.2 Estimacin por intervalo

    Despus de iniciado el estudio de los estimadores puntuales es lgico suponer que la inferencia realizada mediante un valor puntual no es la ms adecuada, ya que puede variar considerablemente de muestra en muestra, por tanto, es preferible indicar un intervalo en el que se pueda estimar, con cierto grado de confianza, la localizacin del parmetro en estudio.

    Dada como parmetro, supngase que, bajo ciertas condiciones (como se ver en las siguientes subsecciones), se encuentra que ( , )i s , donde los puntos extremos

    i sy llamados extremo inferior y extremo superior, respectivamente, dependen del valor de la estadstica para una muestra particular. Como los extremos i sy del intervalo dependen de la muestra, resulta que slo son valores de las variables aleatorias correspondientes i sy . Con base en las variables aleatorias anteriores y sus valores correspondientes, se calcula la probabilidad de que el parmetro se encuentre en el intervalo establecido. Se simboliza por 1 con (0, 1) a la probabilidad mencionada

    P i s( ) 1

    Es decir, se tiene una probabilidad de 1 de seleccionar una variable aleatoria que con base en una muestra produzca un intervalo que contenga a .

    El intervalo anterior en el que se localiza el parmetro , i s, se llama intervalo de de (1 )100%; mientras que la fraccin 1 se le llama o grado

    y los extremos i sy , son los inferior y superior, respectivamente.

    Por ejemplo, se tiene una muestra de 20 focos cuya duracin promedio en horas es x 750 y con base en este valor se estima que el parmetro puede encontrarse con una probabilidad 1 , establecida de antemano en el intervalo de confianza (740, 760), es decir

    P( )740 760 1

    En las siguientes subsecciones se analizarn los intervalos de confianza ms comunes para los parmetros, medias, diferencia de medias, varianzas y proporciones.

    Definicin 10.4

  • 290

    Intervalos de confianza para medias de poblaciones aproximadamente normales

    Establecidas las bases generales de los intervalos de confianza y utilizando el teorema del lmite central, los conceptos sobre estimadores puntuales ylas distribuciones determinadas en la unidad 9, se presentan mtodos para el clculo de intervalos de confianza. Uno de estos mtodos se refiere a la media, y se divide en tres casos:

    1. Intervalo de confianza para la media poblacional con distribucin normal, cuando se conoce

    Dada x la media de una muestra aleatoria de tamao n de una poblacin con distribucin aproximadamente normal, de la cual se conoce 2, el intervalo de confianza (1 ) de 100% para est dado por

    x zn

    x zn2 2

    donde z / 2 es el valor de la distribucin normal estndar, a la derecha del cual tiene un rea de / 2. Se denota en este caso que para poder aplicar la frmula, la distribucin tiene que ser normal o aproximadamente normal y se debe conocer el parmetro .

    Una mquina de refrescos est ajustada de tal manera que la cantidad de lquido suministrado se distribuye en forma normal con desviacin estndar de 0.15 dl. Se calcula 95% de intervalo de confianza para la media de refrescos servidos de una muestra de 36 vasos tomada al azar con un contenido promedio de 2.25 dl.

    Se toman los datos: = 0.15 dl, el tamao de la muestra es 36 con media muestral de x 2 25. dl. Para calcular el intervalo de confianza del parmetro media se emplea la frmula anterior.

    Primero se calcula el valor de z / 2, con 1 = 0.95. De las tablas porcentuales para la distribucin normal estndar se tiene z / 2 = 1.96. Por tanto,

    2 25 1 96 0 1536

    2 25 1 96 0 1536

    2 201 2 299

    . .

    .

    . .

    .

    . .

    Es decir, con 95% de probabilidad se afirma que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 2.201 y 2.299 dl.

    2. Intervalo de confianza para la media poblacional cuando se desconoce en muestras grandes.

    Dada x la media de una muestra aleatoria de tamao n (n 30) tomada al azar de una poblacin de la cual se conoce su desviacin estandar s y se desconoce , el intervalo de confianza (1 ) de 100% para est dado por

    x zs

    nx z

    s

    n2 2

    Ejemplo 3

  • 291

    donde z / 2 es el valor de la distribucin normal estndar, la cual tiene un rea de / 2 y s es la desviacin estndar obtenida del estadstico varianza insesgada. En este caso es posible notar que para poder aplicar la frmula, a diferencia del anterior, se desconoce la distribucin.

    Se tiene una mquina de refrescos como en el ejemplo anterior, pero de la cual se desconoce su desviacin estndar. Para estimar la cantidad promedio de lquido suministrado por la mquina se toma una muestra al azar de 50 vasos, con media de 240 ml y desviacin estndar de 20. Se calcula 99% de intervalo de confianza para la media de refrescos servidos.

    Se toman los datos: el tamao de la muestra es 50, x 240 y s = 20 ml. El intervalo de confianza del parmetro media se obtiene sustituyendo estos valores en la frmula anterior.

    Se calcula primero el valor de z / 2, con 1 = 0.99. De las tablas porcentuales para la distribucin normal estndar se tiene z / 2 = 2.575. Por tanto,

    240 2 575 2050

    240 2 575 2050

    232 72 247 28

    . .

    . .

    Es decir, con 99% de probabilidad se afirma que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 232.72 y 247.28 ml.

    3. Intervalo de confianza para la media poblacional cuando se desconoce en muestras pequeas.

    Dada x la media de una muestra de tamao n (n 30) tomada al azar de una poblacin con distribucin normal de la cual se conoce s2, y se desconoce 2, el intervalo de con-fianza (1 ) de 100% para est dado por

    x t sn

    x t sn2 2

    donde t / 2 es el valor de la distribucin t-Student con v = n 1 grados de libertad, la cual tiene un rea de / 2, y s es la desviacin estndar obtenida del estadstico varianza insesgada. Se denota en este caso que la aplicacin de la frmula se puede realizar si la distri-bucin de la poblacin es normal o aproximadamente normal, pero a diferencia del caso 1, no se conoce el parmetro , y del caso 2, el tamao de la muestra debe ser pequeo.

    Un fabricante de mquinas de refrescos asegura que sus mquinas suministran en promedio 240 ml de refresco 99.9% de los casos. Un comprador decide verificar estos datos, por lo que toma una muestra al azar de 15 vasos, obteniendo los siguientes resultados

    243 250 240 248 245 250 238 246 252 247 246 240 250 249 248 240 245 247 238 248 250 252 247 239 245 249 250 248 247 251

    Se calcula con 99.9% de confianza si es vlida la afirmacin del fabricante.Para encontrar el intervalo de confianza se necesita calcular la media y la varianza

    insesgada de la muestra obtenida: x 246 27. y sn 12 17 58. , es decir, s = 4.19.

    Ejemplo 4

    Ejemplo 5

  • 292

    Siendo la muestra de 15 vasos, se aplica el caso 3, para lo cual se calcula el valor de t / 2, con v = 15 1 = 14 grados de libertad y 1 = 0.999, donde = 0.001, es decir

    / 2 = 0.0005. Por tanto, aplicando las tablas porcentuales para la distribucin t-Studentse tiene t0.0005 = 4.14. En conclusin

    246 27 4 14 4 1915

    246 27 4 14 4 1915

    241 79

    . .

    .

    . .

    .

    . 2250 75.

    Es decir, con 99.9% de probabilidad se determina que el parmetro media del lquido suministrado por la mquina de refrescos se encuentra entre 241.79 y 250.75 ml. Por tanto, la afirmacin del fabricante no ser vlida con 99% de confianza, puesto que el valor 240 ml est fuera del intervalo.

    Ejercicio 2 1. De la siguiente muestra aleatoria, tomada de un poblacin normal

    13 19 14 12 21 14 17 20 17

    calcula 95% de intervalo de confianza para la media de la poblacin

    a) si se sabe que la varianza poblacional es 4 b) si no se conoce el valor de la varianza poblacional

    2. Un ingeniero de control de calidad midi las paredes de 25 botellas de vidrio de dos litros. La media muestral fue 4.02 mm y la desviacin estndar muestral 0.09, calcula 95% de intervalo de confianza respecto de la media del espesor de las paredes de lasbotellas.

    3. Mientras se efecta una tarea determinada en condiciones simuladas de ausencia de gravedad el ritmo cardiaco de 40 astronautas en adiestramiento se incrementa, 26.4 pulsaciones por minuto en promedio con desviacin estndar de 4.28, calcula la verdadera media en el incremento del ritmo cardiaco si x 26 4. se utiliza como una estimacin puntual del incremento medio en el ritmo cardiaco y se utiliza 95% de confianza.

    4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estacin de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supn normalidad y calcula un intervalo de confianza para la media con = 0.05

    5. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra al azar de piezas cuyos dimetros son 10, 12, 11, 11.5, 9, 9.8, 10.4, 9.8, 10 y 9.8 mm. Supn que los dimetros tienen una distribucin aproximadamente normal y

    a) calcula 99% de intervalo de confianza para el dimetro promedio de todas laspiezas

    b) calcula 99% de intervalo de confianza para el dimetro promedio de piezas si = 1.

  • 293

    Intervalos de confianza para la diferencia de medias en poblaciones aproximadamente normales

    Despus de analizar los intervalos de confianza para la media poblacional, se contina con el clculo de intervalos de confianza para la diferencia de medias, el cual se divide en cinco casos.

    1. Intervalo de confianza para 1 2 de poblaciones con distribuciones normales, cuando se conocen 12 22y .

    Dadas x x1 2y las medias de muestras aleatorias independientes de tamaos n1y n2, respectivamente, de poblaciones con distribuciones aproximadamente normales, de las cuales se conoce 12 22y , el intervalo de confianza de (1 ) de 100% para

    1 y 2 est dado por

    ( ) ( )x x zn n

    x x zn n

    1 22

    12

    1

    22

    21 2 1 2

    2

    12

    1

    22

    2

    donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.

    Se comparan dos tipos de rosca de tornillos para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)

    Si 1 y 2 son resistencias promedio a la tensin de los tornillos tipo I y tipo II, respectivamente, con las variaciones a la tensin de los tornillos tipo I y tipo II 12 5 y

    22 10, respectivamente, se calcula 90% de intervalo de confianza para 1 2.

    Primero se calculan las medias muestrales: x x1 270 5 71 4. .y .Las muestras son de tamao n1 = n2 = 12. Se calcula el valor para z / 2 con 90% de

    intervalo de confianza usando las tablas porcentuales, z / 2 = 1.645.

    ( . . ) . ( . . ) .70 5 71 4 1 645 512

    1012

    70 5 71 4 1 645 512

    10121 2

    22 74 0 941 2. .

    Es decir, la diferencia de la resistencia promedio a la tensin al fabricar los tornillos tipos I y II se encuentra entre el intervalo (2.74, 0.94), con 90% de confianza. Dado que en el intervalo se encuentra el 0, no hay diferencia significativa entre los dos tipos de rosca.

    Ejemplo 6

    1 2 3 4 5 6 7 8 9 10 11 12

    68 70 72 69 71 72 70 69 75 69 70 71

    75 73 73 68 68 67 69 75 74 68 73 74

    Tipode rosca

    1

    2

  • 294

    2. Intervalo de confianza para 1 2 de poblaciones cuando se desconocen 12

    22y

    en muestras grandes.

    Dadas x x1 2y las medias de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones de las cuales se desconocen

    12

    22y , el intervalo de confianza (1 ) de 100% para 1 2 est dado por

    ( ) ( )x x z sn

    s

    nx x z

    s

    n

    s

    n1 2

    2

    12

    1

    22

    21 2 1 2

    2

    12

    1

    22

    2

    donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2 y s s12 22, son las varianzas insesgadas respectivas de las muestras 1 y 2.

    Retomando el ejemplo 6, se prueban 40 tornillos de cada tipo de cuerda bajo condiciones similares y se obtienen los siguientes resultados (en kg).

    del tipo I x s n1 1 172 5 2 45 40. . ,y del tipo II x s n2 2 269 8 1 75 40. . ,y

    Si 1 y 2 son resistencias promedio a la tensin, de los tornillos tipo I y tipo II, respectivamente, se calcula 95% de intervalo de confianza para 1 2 con el fin de determinar con cul tipo de tornillos es ms resistente.

    Como ya se conocen los valores muestrales para la media y la desviacin estndar, y siendo las muestras grandes (n1 = n2 = 40 30), falta nicamente encontrar el valor para z / 2 con 95% de intervalo de confianza. Usando las tablas porcentuales, z / 2 = 1.96

    ( . . ) . . . ( . . ) . .72 5 69 8 1 96 2 4540

    1 7540

    72 5 69 8 1 96 2 452 2

    1 2

    22 2

    1 2

    401 75

    40

    1 78 3 62

    .

    . .

    Puesto que el intervalo para la diferencia de las medias poblacionales siempre ser positivo, se tiene 95% de confianza de que la resistencia a la tensin de los tornillos tipo I es mayor a la de los del tipo II

    1 2 (1.78, 3.62) indica que 1 2 0, es decir 1 2

    3. Intervalo de confianza para 1 2 de poblaciones normales cuando se desconocen

    12

    22y , pero se sabe que 12 22 en muestras pequeas.

    Dadas x x1 2y las medias de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales de las que se desconocen 12 22y pero se conoce que 12 22, el intervalo de confianza (1 ) de 100% para 1 2 est dado por

    ( ) ( ) ( ) ( )x x t sn n

    x x t sn n

    p p1 22 1 2

    1 2 1 22 1 2

    1 1 1 1

    Ejemplo 7

  • 295

    donde t / 2 es el valor de la distribucin t-Student con v = n1 + n2 2 grados de libertad, el cual tiene un rea de / 2

    sn s n s

    n np

    ( ) ( )1 12 2 221 2

    1 12

    es la estimacin comn de la desviacin estndar poblacional y s s12 22y son las varianzas insesgadas respectivas de las muestras 1 y 2.

    Las pruebas de traccin en diez puntos de soldadura para un dispositivo semiconductor produjeron los siguientes resultados en libras requeridas para romper la soldadura

    15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

    Un segundo conjunto de ocho puntos fue probado para determinar si la resistencia a la traccin se incrementa con un recubrimiento, produciendo los siguientes resultados

    24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

    Se supone distribucin normal, se calcula 90% de intervalo de confianza para 1 2, considerando 12 22, ambas desconocidas.

    Primero se calculan las medias y varianzas muestrales

    del conjunto 1 x s n1 12 114 29 7 50 10. . ,ydel conjunto 2 x s n2 22 222 09 2 68 8. . ,y

    Con estos valores se calcula

    sn s n s

    n np

    ( ) ( ) ( ) . ( ) .1 12 2 221 2

    1 12

    10 1 7 50 8 1 2 6810 8 2

    2..32

    Falta determinar en las tablas porcentuales de la distribucin t-Student el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = n1 + n2 2 = 16 grados de libertad. Se determina en las tablas correspondientes que t0.05 = 1.746.

    ( . . ) . . ( . . ) .14 29 22 09 1 746 2 32 110

    18

    14 29 22 09 1 746 21 2 ..

    . .

    32 110

    18

    9 72 5 881 2

    4. Intervalo de confianza para 1 2 de poblaciones normales cuando se desconocen

    12

    22y , pero se sabe que 12 22 en muestras pequeas.

    Dadas x x1 2y las medias de muestras aleatorias independientes de tamaos n1y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales donde se desconocen 12 22y pero se sabe que 12 22 , el intervalo de confianza (1 ) de 100% para 1 2 est dado por

    ( ) ( )x x t sn

    s

    nx x t s

    n

    s

    n1 2

    2

    12

    1

    22

    21 2 1 2

    2

    12

    1

    22

    2

    Ejemplo 8

  • 296

    donde t / 2 es el valor de la distribucin t-Student cons

    n

    s

    n

    s

    n n

    s

    n

    12

    1

    22

    2

    2

    12

    1

    2

    1

    22

    2

    11

    2

    2

    11n

    grados de libertad, el cual tiene un rea de / 2, y s s12 22y son las varianzas insesgadas respectivas de las muestras. De la frmula anterior se puede estimar que el resultado del clculo de losgrados de libertad generalmente ser una cantidad no entera, por lo que siempre se debe redondear al entero ms prximo (no al siguiente), por ejemplo, si v = 14.3 14; v = 14.7 15; v = 14.5 15.

    Se retoman los datos del ejemplo 8, considerando que 12 22 y son ambas desco-nocidas. Se supone normalidad; se calcula 90% de intervalo de confianza para 1 2; se determina qu tipo de semiconductor sin recubrimiento (1) o con recubrimiento (2) tiene ms resistencia a la traccin.

    Las medias y varianzas muestrales se calcularon anteriormente

    del conjunto 1 x s n1 12 114 29 7 50 10. . ,ydel conjunto 2 x s n2 22 222 09 2 68 8. . ,y

    Con estos valores se calculan los grados de libertads

    n

    s

    n

    s

    n n

    s

    n

    12

    1

    22

    2

    2

    12

    1

    2

    1

    22

    2

    11

    2

    2

    2

    21

    1

    7 5010

    2 688

    7 5010

    110 1n

    . .

    . 2 688

    18 1

    14 99 152.

    .

    Falta determinar, usando las tablas porcentuales de la distribucin t-Student, el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = 15 grados de libertad. Se determina en las tablas correspondientes que t0.05 = 1.753.

    ( . . ) . . . ( . . ) .14 29 22 09 1 753 7 5010

    2 688

    14 29 22 09 1 753 71 2.. .

    . .

    5010

    2 688

    9 63 5 971 2Como el intervalo de confianza siempre resulta negativo (de 9.63 a 5.97), se tiene

    90% de confianza de que la resistencia a la traccin con recubrimiento es mayor que sin recubrimiento.

    5. Intervalo de confianza para = 1 2 de poblaciones normales, cuando se desconocen 12

    22y , pero se sabe que son observaciones por pares en muestras pequeas.

    Dadas x sd dy la media y la desviacin estndar de las diferencias normalmente distribuidas de n pares aleatorios y dependientes de mediciones de muestras de tamao n(n 30), respectivamente, de poblaciones aproximadamente normales

    Ejemplo 9

  • 297

    donde se desconoce 12 22y , el intervalo de confianza (1 ) de 100% para d = 1 2 est dado por

    x t sn

    x t sn

    dd

    d dd

    2 2

    donde t / 2 es el valor de la distribucin t-Student con v = n 1 grados de libertad, el cual tiene un rea de / 2.

    En un proceso qumico se comparan dos catalizadores para comprobar su efecto en el resultado de la reaccin. Se prepar una muestra de doce procesos utilizando el catalizador marca L y tambin doce de la marca M; a continuacin se muestran los datos con los rendimientos.

    Se calcula 99% de intervalo de confianza para la diferencia de observaciones igua-ladas y se supone que los datos estn distribuidos normalmente.

    Primero se determinan las diferencias de los datos de la muestra

    Con estas diferencias se calcula su valor medio y la desviacin estndar

    x sd d0 074 0 207. .y

    El tamao de la muestra es diez, por consiguiente los grados de libertad v = 10 1 = 9. De las tablas porcentuales correspondientes a la distribucin t-Student con 99% de con-fianza ( = 0.01 y / 2 = 0.005), se tiene que t0.005 = 3.25. Por ltimo el intervalo de confianza resulta

    0 074 3 25 0 20710

    0 074 3 25 0 20710

    0 139

    . .

    .

    . .

    .

    .

    d

    dd 0 287.

    Ejercicio 3 1. Calcula si en una clase de diez estudiantes se tiene el mismo rendimiento en dos

    pruebas diferentes. Sus puntuaciones son

    Considera 95% de intervalo de confianza para la diferencia de las puntuaciones igualadas y supn normalidad en las poblaciones.

    Ejemplo 10

    0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

    0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

    LM

    0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

    0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

    0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06

    LM

    L M

    1 2 3 4 5 6 7 8 9 10

    90 90 90 80 90 92 88 90 63 70

    84 84 82 94 90 85 89 62 65 52

    Estudiante:

    Prueba 1:

    Prueba 2:

  • 298

    2. Se aplic un examen de matemticas financieras a un grupo de alumnos (grupo A), el cual obtuvo las siguientes calificaciones

    3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0

    A otro grupo se le aplic un examen de lgebra lineal con las siguientes calificaciones

    2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0

    Calcula un intervalo de confianza para la diferencia de medias con 90% de nivel deconfianza.

    3. Un centro de investigacin en medicina del deporte dio a conocer las diferencias en las tasas de consumo de oxgeno para varones universitarios entrenados con dos mtodos diferentes. Uno de ellos recibe entrenamiento continuo y el otro intermitente, los dos con igual duracin. En la siguiente tabla se registran los tamaos de muestra, medias y desviaciones estndar respectivas, expresados en ml por kg/min

    Calcula las medias de estas poblaciones con 99% de intervalo de confianza; supn que las varianzas poblacionales son diferentes y que su distribucin es aproxima-damente normal.

    4. Los datos que se muestran a continuacin son los grados de dureza Brinell obtenidos para muestras de dos aleaciones de magnesio

    Supn que provienen de poblaciones aproximadamente normales con varianzas que son distintas y considera 98% de intervalo de confianza para 1 2.

    5. Se dice que una nueva dieta reduce el peso de una persona, 4.5 kg en promedio, en un periodo de dos semanas. Los pesos de siete mujeres que siguieron esta dieta fueron anotados antes y despus de dicho periodo.

    Determina la eficacia de la dieta considerando 95% de intervalo de confianza para la diferencia de media de los pesos; supn que su distribucin aproximadamente normal.

    a) si 12 22 b) si 12 22

    Entrenamiento intermitenteEntrenamiento continuo

    xc= 43.71

    nc= 9

    = 4.87sc

    xi = 39.63

    ni = 7

    = 9.68si

    1 2 3 4 5 6 7

    58.5 60.3 61.7 69.0 64.0 62.6 56.7

    60.0 54.9 58.1 62.1 58.5 59.9 54.4

    MujerPeso anterior

    Peso posterior

  • 299

    Intervalos de confianza para la varianza de poblaciones aproximadamente normales

    Cuando se trata de intervalos de confianza para la varianza, se consideran dos casos, unopara las varianzas poblacionales y el otro para una razn entre varianzas.

    1. Intervalo de confianza para 2 de poblaciones normales en muestras pequeas.

    Dada s2 la varianza de una muestra aleatoria de tamao n (n 30) de una pobla-cin aproximadamente normal, el intervalo de confianza (1 ) de 100% para el parmetro 2 est dado por

    ( ) ( )n s n s1 122

    22

    2

    1 22

    donde 22 1 22y son valores de la distribucin ji cuadrada 2 (ver tablas estads-ticas correspondientes) con v = n 1 grados de libertad, los cuales tienen reas de / 2 y 1 / 2, respectivamente.

    Un antroplogo midi el ancho (en centmetros) de una muestra tomada al azar de nueve crneos de miembros de cierta tribu, y obtuvo los siguientes resultados

    13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0

    Se calcula 95% de intervalo de confianza para la varianza de dicha tribu.Primero se calcula la varianza insesgada de la muestra s2 = 2.33.El grado de confianza est dado por 1 = 0.95, donde = 0.05, es deci r

    / 2 = 0.025 y 1 / 2 = 0.975. Buscando en las tablas de la distribucin ji cuadrada con v = 9 1 = 8 grados de libertad, se tiene

    22

    0 0252

    1 22

    0 975217 5345 2 1797

    . .

    . .y

    Por ltimo, resulta( ) .

    .

    ( ) ..

    . .

    9 1 2 3317 5345

    9 1 2 332 1797

    1 06 8 55

    2

    2

    2. Intervalo de confianza para 12 22 de poblaciones normales en muestras pequeas.

    Dadas s s12 22y las varianzas de muestras aleatorias independientes de tamaos n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones normales, el intervalo de confianza (1 ) de 100% para la razn de las varianzas 12 22 est dado por

    s

    s

    s

    s12

    22

    2 1 2

    12

    22

    12

    22 2 2 1

    1f

    f( , ) ( , )

    donde f 2 1 2( , ) es el valor de la distribucin F (ver tablas correspondientes), con v1 = n1 1 grados de libertad del numerador y v2 = n2 1 grados de libertad del denominador el cual tiene un rea de / 2, similarmente f 2 2 1( , ).

    Ejemplo 11

  • 300

    Retomando los datos del ejemplo 8 se hizo la suposicin de que 12 22 y se calcul un intervalo de confianza para la razn de varianzas y se determin si fue vlida lasuposicin, con 90% de confianza.

    Los resultados del conjunto 1 fueron15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

    Los resultados del conjunto 2 fueron 24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

    Al calcular las varianzas muestrales, del conjunto 1 se obtuvo s12 7 50. , n1 = 10, y del conjunto dos s22 2 68. , n2 = 8.

    Falta determinar usando las tablas porcentuales de la distribucin F los valores de f f2 1 2 2 2 1( , ) ( , )y con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v1= n1 1 = 10 1 = 9 y v2 = n2 1 = 8 1 = 7 grados de libertad. Se busca en las tablas de la distribucin F y se obtiene

    f f f f2 1 2 0 05 2 2 1 0 059 7 3 677 7 9 3 29( , ) ( , ) . ( , ) ( , ) .. . y 33

    El intervalo de confianza resulta

    7 502 68

    13 677

    7 502 68

    3 293

    0 76

    12

    22

    12

    22

    .

    . .

    .

    .

    .

    . 9 22.

    Del intervalo de confianza para la razn entre varianzas se determina que el valor 1 est contenido en el intervalo. Por tanto, con 90% de confianza se justifica la suposicin de que 12 22, ya que 12 22 1 0 76 9 22( . , . ) y si se multiplican por 22 ambos miembros de la igualdad se obtiene 12 22.

    Ejercicio 4 1. Un gelogo estudia el movimiento de los cambios relativos en la corteza terrestre en

    un sitio particular, en un intento por determinar el ngulo medio de las fracturas eligi n = 50 fracturas y determina que la media es de 39.8 y la desviacin estndar muestral es de 17.20. Considera 99% de intervalo d e confianza para estimar la varianza de la poblacin (supn que la poblacin est normalmente distribuida).

    2. En un proceso qumico se comparan dos catalizadores para verificar su efecto en el resultado de la reaccin. Se prepar una muestra de diez procesos utilizando el catalizador marca L y diez con el de la marca M, a continuacin se muestran los datos con los rendimientos

    Ejemplo 12

    0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

    0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

    LM

  • 301

    Considera 99% de intervalo de confianza para razn entre varianzas de los rendi-mientos de los catalizadores; supn que los datos estn distribuidos normalmente.

    3. El espesor de las paredes de 25 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue de 4.02 mm y la desviacin estndar muestral de 0.09. Considera 95% de intervalo de confianza con respecto de la varianza del espesor de las paredes de las botellas.

    4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estacin de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supn normalidad y calcula un intervalo de confianza para la varianza con = 0.05.

    Intervalos de confianza para las proporciones en muestras grandes

    1. Intervalo de confianza para el parmetro p en muestras grandes.

    Si p q py 1 son las proporciones respectivas de xitos y fracasos en una muestra aleatoria de tamao n (n 30), el intervalo de confianza (1 ) de 100% para el parmetro binomial p est dado por

    p z pqn

    p p z pqn2 2

    donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.

    En una muestra aleatoria de cien posibles clientes, 70 prefieren determinado producto. Se considera 95% de intervalo de confianza para la proporcin de todos los posibles clientes que prefieren tal producto.

    Para el intervalo de confianza de la proporcin primero se determina el valor de sta de personas que prefieren el producto

    .

    .p q70

    1000 70 30

    1000 30y

    En este caso se tiene 95% de confianza, por tanto, 1 = 0.95, y usando las tablas porcentuales de la distribucin normal se tiene z / 2 = 1.96. Por ltimo

    0 70 1 96 0 70 0 30100

    0 70 1 96 0 70 0 30100

    0 6102 0 78

    . .

    . .

    . .

    . .

    . .

    p

    p 998

    2. Intervalo de confianza para p1 p2 de poblaciones en muestras grandes.

    Dadas p p1 2y las proporciones de xitos de las muestras aleatorias de tamaos n1 y n2(n1 30y n2 30), respectivamente y q p q p1 1 2 21 1y , el intervalo de confianza (1 ) de 100% para la diferencia entre los dos parmetros binomiales p1 p2 est dado por

    ( ) ( ) p p z p qn

    p qn

    p p p p z p qn

    1 22

    1 1

    1

    2 2

    21 2 1 2

    2

    1 1

    1

    p qn2 2

    2

    donde z / 2 es el valor de la distribucin normal estndar, el cual tiene un rea de / 2.

    Ejemplo 13

  • 302

    Una firma manufacturera de cigarros distribuye dos marcas. Si se encuentra que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se considera 95% de intervalo de confianza para pA pB; se determina si es vlido suponer que la poblacin de fumadores prefiere la marca B, sobre la marca A.

    Dada pA la probabilidad de que 56 de 200 fumadores prefieran la marca A, su estadstico resulta

    .pA

    56200

    0 28

    de tal forma que .qA 0 72 con n1 = 200. Asimismo la probabilidad de que 29 de 150 prefieran la marca B resulta

    .pB

    29150

    0 19

    de tal forma que .qB 0 81 con n2 = 150. Por ltimo para el intervalo de 95% de confianza, de las tablas porcentuales para la distribucin normal resultaque z / 2 = 1.96, empleando la frmula correspondiente para pA pB

    ( . . ) . . . . . ( . .0 28 0 19 1 96 0 28 0 72200

    0 19 0 81150

    0 28 0 19p pA B )) . . . . .

    . .

    1 96 0 28 0 72200

    0 19 0 81150

    0 0018 0 1782p pA BComo pA pB 0 entonces pA pB.Por tanto, no es vlida la suposicin de que la poblacin de fumadores prefiere la

    marca B sobre la A con 95% de confianza.

    Ejercicio 5 1. Para estimar la propuesta de los trabajadores desempleados en Panam, un

    economista toma una muestra al azar de 400 personas de clase obrera, donde 25 resultaron sin empleo. Calcula la proporcin real de trabajadores desempleados en Panam considerando 97% de un intervalo de confianza.

    2. Un rector registr debidamente el porcentaje de calificaciones D y F otorgadas a los estudiantes por dos profesores universitarios de historia. El profesor I alcanz 32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente. Considera90% de intervalo de confianza para la diferencia de proporciones.

    3. Un antroplogo est interesado en la proporcin de individuos que presentan braquicefalia en dos tribus indgenas. Supn que se toman muestras independientes de cada una de las tribus y se descubre que 24 de cada 100 nativos de la tribu A y 36 de cada 120 de la tribu B poseen dicha caracterstica. Considera 95% de intervalo de confianza para la diferencia p1 p2 entre las proporciones de estas dos tribus.

    10.2 Pruebas de hiptesisEn la seccin anterior se analizaron los intervalos de confianza para el clculo de estimaciones sobre los parmetros y para tomar decisiones al trabajar con la poblacin de inters. En esta seccin se estudiar otro mtodo estadstico que permita tomar deci-siones en problemas relacionados con poblaciones que resultan muy difciles o imposibles de analizar en su totalidad. Por ejemplo, para poder concluir con cierta veracidad sobre la

    Ejemplo 14

  • 303

    vida promedio de focos de cierta marca, se puede formular una hiptesis, la cual se debe comprobar, es decir, buscar evidencias que ayuden a decidir si la hiptesis se acepta o se rechaza.

    Se llama hiptesis estadstica

    La comprobacin de una hiptesis estadstica consiste en buscar evidencias para decidir sobre la aceptacin o rechazo de la afirmacin realizada. En el ejemplo de los focos se puede suponer que su vida promedio est por arriba de las 750 h de duracin; despus de elegir una muestra de tales focos, resulta que su vida promedio fue 730 h, con este anlisis surge un cuestionamiento.

    En la comprobacin de hiptesis, la manera ptima de tomar la decisin de aceptar o rechazar la afirmacin realizada slo se puede conocer cuando se analiza toda la poblacin; sin embargo, en la prctica, una afirmacin se acepta con base en una muestra aleatoria de la poblacin que slo indica que con los resultados obtenidos no existe evidencia para rechazarla. Asimismo, cuando se rechaza una afirmacin formulada slo significa que no existen evidencias suficientes de la muestra para aceptarla.

    Para formular unaafirmacin sobre un suceso y realizar una prueba de aceptacin o rechazo, surge la siguiente terminologa: se llama hiptesis nula a la afirmacin que se quiera probar y se simboliza por H0. A la afirmacin que es opuesta a la hiptesis nula se le llama hiptesis alterna, y se simboliza por H1. Cabe aclarar que la hiptesis nula siem-pre deber ser establecida de tal forma que especifique un valor exacto del parmetro en estudio, mientras que la hiptesis alterna debe representar un valor diferente al de la hiptesis nula. Por ejemplo en el caso de la duracin promedio de los focos la muestra tuvo una vida promedio de 730 h, 20 menos que la conjetura del fabricante, por tanto, se formula la hiptesis nula como H0: 750, es decir, la vida promedio de los focos es menor o igual que 750.

    La hiptesis alterna correspondiente se basa en la afirmacin del fabricante, el cual asegura que la vida promedio de los focos est por arriba de las 750 h de duracin, con lo que se establece la hiptesis alterna como H1: 750, es decir, la vida promedio de los focos es mayor a 750.

    Como se aprecia, el valor del parmetro en la hiptesis alterna puede elegirse dentro de una infinidad de posibilidades ya que no se establece un valor concreto, en este caso slo debe cumplir con ser mayor a 750.

    10.2.1 Tipos de errores en una prueba de hiptesis

    Al aceptar o rechazar una hiptesis nula se pueden cometer ciertos errores, los cuales deben ser mnimos.

    Se llama error tipo I cuando se rechaza la hiptesis nula, dado que sta es cierta. Asimismo, se llama error tipo II cuando no se rechaza la hiptesis nula, dado que es falsa.

    Dadas las definiciones de los dos errores que van implcitos al aceptar o rechazar una hiptesis nula, surge de nuevo un cuestionamiento.

    Definicin 10.5

    Definicin 10.6

  • 304

    La respuesta referente a la probabilidad de cometer un error tipo I o tipo II es fundamental en el desarrollo de la prueba de hiptesis.

    Se llama a la probabilidad de cometer un error tipo I y se simboliza por ; si se comete un error tipo II, la probabilidad se simboliza por .

    Se retoma el caso de la vida promedio de los focos y se consideran 49 focos de muestra y las hiptesis H0: 750, H1: 750, la evidencia de la muestra establece 760 h de vida promedio, se calcula el nivel de significancia.

    = probabilidad de cometer un error tipo I = probabilidad de rechazar H0 siendo verdadera

    Es decir

    P X( ),760 750 cuando

    Para calcular la probabilidad anterior se usa el teorema central del lmite

    P X P X

    n

    P Z( ) ( . ) .760 760 7502549

    2 8 0 0026

    En tales condiciones, la probabilidad de cometer un error tipo I es pequea; es decir, el nivel de significancia es 0.26%.

    Se retoma el caso de la vida promedio de los focos y se calcula para = 765.

    = probabilidad de cometer un error tipo II = probabilidad de aceptar H0, siendo falsa

    Es decir,P X( )760 765 cuando

    se calcula la probabilidad anterior usando el teorema del lmite central

    P X P X

    n

    P Z( ) ( . ) .760 760 7652549

    1 4 0 0808

    La probabilidad de cometer un error tipo II es pequea, es decir, 8.08% para el caso en que la verdadera vida promedio de los focos sea igual a 765 horas.

    Definicin 10.7

    Ejemplo 16

    Ejemplo 15

  • 305

    Ejercicio 6 1. Se ha desarrollado una nueva preparacin para cierto tipo de cemento con un

    coeficiente de compresin de 5 mil kg por cm2 y una desviacin estndar de 120. Para comprobar la hiptesis de que = 5 000, en contraposicin con la alternativa de 5 000 se verifica una muestra al azar de 50 piezas de cemento. Se determina que la regin crtica es X 4 970 .

    a) calcula la probabilidad de cometer el error tipo I cuando H0 es verdadera b) evala para la alternativa = 4 960

    2. Supn que X es una variable aleatoria normal con varianza 100. Si se toma una muestra al azar de tamao 16 de X, comprueba la hiptesis H0: = 10 contra H1: 10. Si se determin una media muestral de 12.5, calcula la probabilidad de error

    de tipo II. 3. Una lavandera afirma que un nuevo quitamanchas es efectivo en no ms de 70%

    de los casos en que se utiliza. Para comprobar esta afirmacin se aplica el producto en doce manchas tomadas al azar. Si menos de once son eliminadas se acepta la hiptesis nula de que p = 0.7; de otra forma se concluye p 0.7.

    a) evala , suponiendo p = 0.7 b) evala para la alternativa p = 0.9

    Para la comprobacin de hiptesis se tienen los mismos casos que en los intervalos de confianza. La formulacin de las hiptesis nula y alterna comnmente causa cierto desconcierto. Para diferenciar a la hiptesis nula de la alterna y simplificar los ejemplos y ejercicios, el anlisis delimita que las hiptesis a verificar siempre estn formuladas con , o =. De tal forma que en los dos primeros casos stas sern las hiptesis alternas

    correspondientes, mientras que en el tercero se refiere a la hiptesis nula. Puesto que en la prueba de hiptesis y los intervalos de confianza se tienen los

    mismos casos y sus condiciones para la aplicacin son las mismas, se simplifica el trabajo, resumiendo nicamente las frmulas para las hiptesis nulas y sus hiptesis alternas respectivas con sus estadsticos y regiones de rechazo correspondientes, para cada uno de los diferentes temas: medias (tres casos), diferencia de medias (cinco), varianzas (dos)y proporciones (dos).

    Para la prueba de hiptesis se recomienda seguir los siguientes pasos:

    establecer la hiptesis nula establecer la hiptesis alterna fijar el nivel de significancia elegir el estadstico para la prueba de hiptesis con base en lo anterior encontrar la regin de aceptacin y rechazo calcular el valor del estadstico correspondiente y, con base en ste, aceptar o

    rechazar la hiptesis nula

  • 306

    10.2.2 Pruebas de hiptesis para medias de poblaciones aproximadamente normales con valor crtico

    1. Una mquina produce piezas metlicas de forma cilndrica, se toma una muestra alazar de piezas cuyos dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 mm. Se supone que los dimetros tienen una distribucin aproximadamente normal. Si el fabricante afirma que el dimetro promedio es 10 mm, se determina respecto de esta afirmacin con 0.01 de nivel de significancia.

    Se pide una prueba de hiptesis para la media, comprobando que sta es igual a 10 mm, en tal caso, de acuerdo con datos muestrales, la hiptesis alterna ser el opuesto, es decir, diferente de diez. Se siguen los pasos para una prueba de hiptesis.

    a) H0: = 10 b) H1: 10 c) nivel de significancia = 0.01

    d) estadstico de prueba, primero se identifica a cul de los tres casos anteriores corres-ponde, se indica que no se conoce s y que la muestra es pequea; por tanto,

    t xs n

    0

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin t-Student, por lo que la regin de rechazo est dada por

    t t / 2 y t t / 2

    Con base en el inciso c), se tiene = 0.01, donde / 2 = 0.005. Por otro lado, el tamao de la muestra es n = 9, donde v = 9 1 = 8 grados de libertad. Por tanto, de las tablas porcentuales de la distribucin t-Studentresulta la regin de rechazo

    t t0.005 = 3.355 y t t0.005 = 3.355

    Ejemplo 17

    Regin de rechazo,cola derecha

    Regin de rechazo,cola izquierda

  • 307

    f) para calcular el estadstico t, primero se determinan los datos de la media y la desviacin estndar muestral calculando los nueve datos, se tiene x 10 1222. y s = 0.7981, donde

    t 10 1222 100 7981 9

    0 4593..

    .

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta y, por tanto, se determina que con nivel de significancia de = 0.01 es vlida la afirmacin del fabricante.

    2. Se toma una muestra al azar de 36 vasos suministrados por una mquina de refrescos que sirve por vaso un contenido promedio de 21.9 dl, con desviacin estndar de 1.42 dl. Se comprueba la hiptesis = 22.2 dl contra la hiptesis alterna 22.2 con nivel de significancia 0.05.

    a) H0: = 22.2b) H1: 22.2c) nivel de significancia = 0.05d) estadstico de prueba; primero se identifica a cul de los tres casos anteriores

    corresponde, dado que no se conoce y la muestra es grande; por tanto

    zx

    s n0

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por

    z z

    Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcen-tuales de la distribucin normal la regin de rechazo resulta

    z z = 1.6449

    f) de la muestra aleatoria de 36 servicios de la mquina de bebidas se obtuvo un contenido promedio de 21.9 dl, con desviacin estndar de 1.42 dl, donde

    z = 21 9 22 21 42 36

    . .

    .

    = 1.2676

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con un nivel de significancia de = 0.05.

    3. De acuerdo con las normas establecidas para un examen de aptitud mecnica, las personas de 18 aos deberan promediar 73.2 con desviacin estndar de 8.6. Si de una toma al azar 45 personas promedian 76.7, se comprueba la hiptesis de que la media poblacional es mayor que 73.2. Se determina nivel de significancia de 2.5% y desviacin estndar poblacional de 8.6.

  • 308

    Se pide una prueba de hiptesis para la media, donde se comprueba que la media poblacional es mayor que 73.2, segn los datos anteriores; en tal caso, lahiptesis alterna ser la afirmacin que se quiere probar: la media poblacional es mayor que 73.2.

    a) H0: = 73.2b) H1: 73.2c) nivel de significancia = 0.025d) estadstico de prueba; primero se identifica a cul de los tres casos corresponde,

    siendo que se conoce ; por tanto,

    zx

    n0

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por z z .

    Con base en el inciso c), se tiene que = 0.025. Por tanto, de las tablas porcentuales de la distribucin normal la regin de rechazo resulta

    z z0.025 = 1.96

    f) se calcula el estadstico z, x 76 7. y = 8.6, dondez

    76 7 73 28 6 45

    2 73. ..

    .

    Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con nivel de significancia de 2.5%.

    Ejercicio 7 1. Un fabricante de mquinas de refrescos asegura que sus mquinas suministran un

    promedio de 250 mm por vaso, pero debido a algunas quejas de los consumidoressobre una mquina en particular decide verificarla, para lo cual toma una muestra de 20 vasos, obteniendo 245 mm de media con desviacin estndar de 11. Calcula con 0.10 de nivel de significacin, si es cierta la afirmacin del fabricante.

    2. Comprueba la hiptesis de que el contenido promedio de los envases de un lubricante es de diez litros si los contenidos de una muestra aleatoria de diez envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 l. Utiliza 0.01 de nivel de significancia y supn que la distribucin de los contenidos es normal.

    3. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a once. Al tomar una muestra al azar de tamao 36, se obtiene que X 10 y S2 = 9. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

  • 309

    4. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a trece. Al tomar una muestra al azar de tamao 36, se obtiene una media y una varianza de 10 y 9, respectivamente. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

    10.2.3 Pruebas para la diferencia de medias de poblaciones aproximadamente normales con valor crtico

    sn s n s

    n np

    ( ) ( )1 12 2 221 2

    1 12

    t x x ds n np

    ( )( ) ( )1 2 0

    1 21 1

    t x x ds n s n

    ( )( ) ( )

    1 2 0

    12

    1 22

    2

    s

    n

    s

    n

    s

    n n

    s

    n

    12

    1

    22

    2

    2

    12

    1

    2

    1

    22

    2

    11

    2

    2

    11n

    t d ds nd

    0

  • 310

    1. Para determinar el rendimiento de combustible en dos marcas de automviles con caractersticas similares se experiment con doce automviles marca V y diez marca I en pruebas de velocidad fija de 90 kmph. Para los de la marca V se obtuvieron 16 kmpl con desviacin estndar de 1.0 kmpl y para los de la marca I el promedio fue 11 kmpl, con desviacin estndar de 1.8 kmpl. Se supone que la distancia por litro para cada modelo del automvil se distribuye aproximadamente en forma normal con varianzas iguales. Se comprueba la hiptesis referente a que los automviles marca V en promedio exceden a los de la marca I por 4 kmpl utilizando = 0.10 Las varianzas poblacionales son diferentes.

    Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar que el rendimiento promedio por litro de los automviles marca V excede el rendimiento de los de la marca I en 4 kmpl. De tal forma que la hiptesis alterna queda de dos colas. Se representa por 1 el promedio del rendimiento por litro de los automviles marca V y por 2 a los de la marca I.

    a) H0: 1 2 = 4b) H1: 1 2 4c) nivel de significancia = 0.10d) estadstico de prueba; primero se identifica a cul de los cinco casos anteriores

    corresponde, dado que no se conoce la varianza poblacional y las muestras son pequeas, con varianzas poblacionales diferentes, se tiene

    t x x ds n s n

    ( )( ) ( )

    1 2 0

    12

    1 22

    2

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin t-Student, por lo que la regin de rechazo est dada por

    t t / 2 y t t / 2

    Con base en el inciso c), se tiene que = 0.10, donde / 2 = 0.05. Los grados de libertad se calculan mediante

    s

    n

    s

    n

    s

    n n

    s

    n

    12

    1

    22

    2

    2

    12

    1

    2

    1

    22

    2

    11

    2

    2

    2

    21

    1

    112

    3 2410

    112

    112 1

    3n

    .

    .22410

    110 1

    13 4946 132 .

    Por tanto, usando las tablas porcentuales de la distribucin t-Student con 13 grados de libertad resulta la regin de rechazo

    t t0.05 = 1.796 y t t0.05 = 1.796

    f) se calcula el estadstico t con los datos que se tienen

    x s n x s n1 12

    1 2 22 2

    216 1 12 11 1 8 3 24 10, ; , ( . ) .y y

  • 311

    t x x ds n s n

    ( )( ) ( )

    ( )( ) ( . ) .

    1 2 0

    12

    1 22

    2

    16 11 41 12 3 24 10

    1 5668

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 10%. Por tanto, el rendimiento por litro de los automviles marca V sobrepasa en 4 kmpl a los de la marca I.

    2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)

    Con 0.025 de nivel de significancia, se calcula que la resistencia promedio a la tensin de los tornillos tipo I es menor a la de los tipo II, Se supone que las varianzas poblacionales son iguales.

    Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar que la resistencia promedio a la tensin de los tornillos tipo I es menor que la de los tipo II. De tal forma que la hiptesis alterna es de una cola. Se representa por 1 la resistencia promedio a la tensin de los tornillos tipo I y por 2 la resistencia promedio a la tensin de los tipo II.

    a) H0: 1 2 = 0b) H1: 1 2 0c) nivel de significancia = 0.025d) estadstico de prueba; primero se identifica a cul de los cinco casos anteriores

    corresponde, dado que no conoce las varianza poblacional pero se sabe que son iguales y las muestras pequeas; por tanto

    t x x ds n np

    ( )( ) ( )1 2 0

    1 21 1

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin t-Student, por lo que la regin de rechazo est dada por

    t t

    Con base en el inciso c), se tiene que = 0.025. Los grados de libertad se calculan mediante v = n1 + n2 2 = 12 + 12 2 = 22. Por tanto, de las tablas porcentuales de la distribucin t-Student con 22 grados de libertad, resulta la regin de rechazo

    t t0.025 = 2.074

    Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12

    1

    2

    78 76 80

    80

    80

    80

    80

    80

    82

    82 8383 82

    8281

    81 81

    79

    79 78 79

    8379 78

  • 312

    f) se calcula el estadstico t con los datos de sus medias y varianzas

    x s n x s n1 12

    1 2 22

    279 8333 3 9697 12 80 6667 2 6061 12. , . ; . , .y y

    sn s n s

    n np

    ( ) ( ) ( ) . ( ) .1 12 2 221 2

    1 12

    12 1 3 9697 12 1 2 606112 112 2

    1 8133.

    Se sustituye en la frmula del estadstico

    t x x ds n np

    ( )( ) ( )

    ( . . ). ( ) (

    1 2 0

    1 21 179 8333 80 6667 01 8133 1 12 11 12

    1 1257) .

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta, con 2.5% de nivel de significancia, por tanto, la resistencia promedio a la tensin de los tornillos tipo I no es menor a la de los tipo II.

    3. Se comparan dos tipos de rosca de anillo para determinar su resistencia a la tensin. Se prueban cien piezas de cadatipo de cuerdabajo condiciones similares, obtenindose los siguientes resultados, la tipo I, present resistencia promedio de 88 kg, con desviacin estndar de 5; la tipo II present resistencia promedio de 83 kg, con desviacin estndar de 9. Se calcula con nivel de significancia de 0.05 si la rosca tipo I tiene mayor resistencia promedio a la tipo II en ms de 3 kg.

    Se pide una prueba de hiptesis para la diferencia de medias, donde se tiene que comprobar la resistencia a la tensin de la rosca de dos tipos de tornillos. De tal forma que la hiptesis alterna es de una cola. Se representa por 1 a la resistencia a la tensin de las cuerdas de los tornillos tipo I y por 2 a la de los tornillos tipo II;

    a) H0: 1 2 = 3b) H1: 1 2 3c) nivel de significancia = 0.05.d) estadstico de prueba: primero se identifica a cul de los cinco casos anteriores

    corresponde, dado que no se conoce la varianza poblacional y las muestras son grandes, se tiene

    zx x d

    s

    n

    s

    n

    ( )1 2 012

    1

    22

    2

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin normal, por lo que la regin de rechazo est dada por

    z z

    Con base en el inciso c), se tiene que = 0.05. Por tanto, de las tablas porcentuales de la distribucin normal resulta la regin de rechazo

    z z = z0.05 = 1.6449

  • 313

    f) se calcula el estadstico z con los datosx s n x s n1 1

    2 21 2 2

    2 2288 5 25 100 83 9 81 100, ; ,y y

    zx x d

    s

    n

    s

    n

    ( ) ( ).

    1 2 0

    12

    1

    22

    2

    88 83 325

    10081

    100

    1 9426

    Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con nivel de significancia de 5%, por tanto, la rosca de los tornillos tipo I tiene mayor resistencia promedio a la tipo II en ms de 3 kg.

    Ejercicio 8 1. Un grupo de personas requiere procesar trabajos de clculo en un centro de cmputo

    para estimar la cantidad de tiempo requerida por la computadora para analizar el trabajo. Este tiempo se mide en una unidad central de procesamiento (UCP ). Se decide comparar el tiempo estimado contra el tiempo real en la UCP para un cliente y se obtienen los siguientes datos

    Calcula si esta evidencia es suficiente para sealar que, en promedio, el cliente tiende a subestimar el tiempo en la UCP necesario para los trabajos; realiza la prueba con = 0.10 y varianzas poblacionales diferentes.

    2. Cierto metal se obtiene mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos, el estndar y la aleacin. Para cada metal se toman al azar ocho especificaciones, donde cada una se somete a tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los metales en kg/cm2.

    Supn que el muestreo se lleva a cabo sobre dos distribuciones normales e independientes con varianzas iguales. Con base en los resultados, calcula si existe una diferencia real entre e y n, con nivel de significancia de 5% y varianzas poblacionales iguales.

    3. Se realiz un experimento para comparar los tiempos medios necesarios para que dos empleados (A y B), completen el trmite de las cuentas corrientes personales para nuevos clientes. Se toman al azar diez clientes para cada empleado y se registran los tiempos de servicio obtenindose los siguientes resultados

    428 419

    462

    441

    429 453

    456

    448 435 459

    463

    465

    429

    472

    458 439

  • 314

    Determina si existe evidencia suficiente para indicar una diferencia signifi-cativa en los tiempos medios requeridos para completar los trmites necesarios mencionados. Los parmetros de las varianzas son diferentes; usa = 0.10.

    4. Los siguientes datos fueron recabados en un experimento que se dise para verificar si existe una diferencia sistemtica en los pesos obtenidos con dos escalas diferentes

    Suponiendo normalidad, se puede concluir que la escala 1 da menor peso promedio que la 2? Considrese = 5% y que las varianzas son diferentes.

    10.2.4 Pruebas para las varianzas poblaciones normales de muestras pequeas con valor crtico

    1. Se determina que una mquina de refrescos est fuera de control si la varianza de los contenidos excede 1.15 dl. Se toma una muestra aleatoria de 25 refrescos con varianza de 2.03 dl. Se calcula con 0.05 de nivel de significancia si la mquina est fuera de control y se supone que los contenidos tienen una distribucin normal.

    En este ejercicio la prueba de hiptesis se refiere a una varianza, se comprueba si sta es mayor que 1.15 dl.

    a) H0: 2 = 1.15 b) H1: 2 1.15 c) nivel de significancia = 0.05

    Xi = 222 Yi = 285

    A B

    Xi = 5075.642 2Yi = 8292.78

    Ejemplo 19

  • 315

    d) estadstico de prueba; aqu slo se tiene un caso para la varianza; por tanto2

    2

    021( )n s

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin ji por lo que la regin de rechazo est dada por

    2 2

    rea derecha. Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcentuales de la distribucin ji2 con v = n 1 = 25 1 = 24 grados de libertad, resulta la regin de rechazo

    2 20 052 36 415.

    .

    Para calcular el estadstico 2 , se tiene, de los datos del enunciado, s2 = 2.03 y n = 25.

    22

    021 25 1 2 03

    1 1542 365( ) ( ) .

    .

    .

    n s

    Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con un nivel de significancia de 0.05, por tanto, la mquina est fuera decontrol.

    2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensin. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados (en kg)

    Con 0.10 de nivel de significancia, se comprueba si es justificable la suposicin de que 12 22.

    Como no se tiene ningn caso para diferencia de varianzas se puede dividir entre la varianza 2 y obtener una razn entre varianzas, de tal forma que

    a) H0 12

    22 1:

    b) H1 12

    22 1:

    c) nivel de significancia = 0.10

    Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12

    1

    2

    78 76 80

    80

    80

    80

    80

    80

    82

    82 8383 82

    8281

    81 81

    79

    79 78 79

    8379 78

  • 316

    d) estadstico de prueba; aqu slo se tiene un caso para la razn entre varianzas; por tanto

    fs

    s

    12

    22

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadstico de prueba est basado en la distribucin F por lo que la regin de rechazo est dada por

    ff

    f f12 2 1

    2 1 2( , ) ( , ) y

    Con base en el inciso c), se tiene = 0.10, donde / 2 = 0.05. Por tanto, de las tablas porcentuales de la distribucin F con v1 = v2 = 11 grados de libertad, resulta la regin de rechazo

    ff

    f f111 11

    12 818

    0 355 11 11 2 8180 05

    0 05.

    .( , ) . . ( , ) . y

    Para calcular el estadstico f se determinan las varianzas insesgadas de los datos muestrales

    f ss12

    22

    3 972 61

    1 52..

    .

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 0.10 y se justifica la suposicin de que

    12

    22.

    Ejercicio 9 1. Se conoce que la varianza de los puntajes de lectura para los estudiantes de sexto

    ao de primaria es 1.44. Se toman al azar 21 estudiantes de sexto ao a los que se les proporciona un curso especial de lectura, despus del cual la varianza de los puntajes de lectura es 1.05. Calcula si sta es suficiente con nivel de significacin de 0.05 para determinar si el curso especial la reduce.

    2. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de piezas al azar cuyos dimetros son 9.8, 9.8, 9.8, 11.5, 9.0, 10.4, 10.0, 10.0, 11.0 y 12.0 mm. Supn que los dimetros tienen una distribucin aproximadamente normal. Si el fabricante de las mquinas indica que su mquina est desajustada cuando la varianza de los dimetros de las piezas metlicas producidas excede 0.5 mm, calcula con nivel de significancia de 0.01 si la mquina est desajustada.

    3. Se sabe que el contenido de nicotina de una cierta marca de cigarrillos est normalmente distribuida con una varianza de 1.3 mg. Comprueba la hiptesis

    2 = 1.3 en contra de la alternativa 2 1.3 , si una muestra aleatoria de ocho

    cigarrillos tiene desviacin estndar de 1.8. Utiliza 0.05 de nivel de significancia.

  • 317

    10.2.5 Pruebas para muestras grandes

    1. Una firma manufacturera de cigarros distribuye dos marcas. Si se determina que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se calcula con nivel de significancia de 0.06 si la marca A aventaja en ventas a la B.

    Esto se puede comprobar mediante una diferencia de proporciones.

    a) H p pA B0 0:b) H p pA B1 0:c) nivel de significancia = 0.06d) estadstico de prueba; aqu slo se tiene un caso para la diferencia de proporciones;

    por tanto

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin Z, por lo que la regin de rechazo est dada por

    z z

    Con base en el inciso c), se tiene = 0.06. Por tanto, de las tablas porcentuales de la distribucin Z, resulta la regin de rechazo

    z z0.06 = 1.5548

    Ejemplo 20

  • 318

    Para calcular el estadstico z las variables son XA y XB, que representan a los fumadores en favor de las marcas A y B, respectivamente, de tal manera que las proporciones correspondientes estn dadas por

    .

    .p x

    np x

    nA

    A

    AB

    B

    B

    56200

    0 28 29150

    0 193y

    mientras que

    .

    . .p x x

    n nq pA B

    A B

    56 29200 150

    0 243 1 1 0 243 0 757y

    Por tanto,

    Como dicho valor se encuentra en la regin de rechazo, la hiptesis nula se rechaza con un nivel de significancia de 0.06; por tanto, la suposicin de que la marca A aventaja en ventas a la marca B se justifica.

    2. Un canal televisivo asegura que la audiencia que mira cierto programa el sbado por la noche es 40%. Se tomo al azar una muestra de cien televidentes, a quienes se entrevist, dando como resultado que 45 de ellos vean el programa. Con 2.5% de nivel de significancia se comprueba si la afirmacin es vlida.

    La prueba se trata de proporciones, donde se define una variable

    X = cantidad de personas que miran dicho programa los sbados por la noche.

    a) H0: p = 0.40 b) H1: p 0.40 c) nivel de significancia = 0.025 d) estadstico de prueba; aqu slo se tiene un caso para las proporciones; por tanto,

    zx npnp q

    0

    0 0

    e) para localizar la regin de aceptacin y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadstico de prueba est basado en la distribucin Z, por lo que la regin de rechazo est dada por

    z z

    Con base en el inciso c), se tiene = 0.025. Por tanto, de las tablas porcentuales de la distribucin z, resulta la regin de rechazo

    z z0.025 = 1.96

    f) se calcula el estadstico z con los datos que se tienen, la variable X representa a los televidentes que ven dicho programa los sbados por la noche: se entrevista a n = 100 televidentes de los cuales x = 45 ven el programa; por tanto

  • 319

    zx npnp q

    0

    0 0

    45 100 0 40100 0 40 0 60

    1 02.. .

    .

    Como dicho valor se encuentra en la regin de aceptacin, la hiptesis nula se acepta con nivel de significancia de 0.025, por tanto, se puede asegurar que la proporcin de televidentes que ven el programa del sbado por la noche es menor que 40%.

    Ejercicio 10 1. En un estudio para estimar la proporcin de amas de casa que tienen una secadora

    automtica, se determina que 63 de cada 100 residentes urbanos y 59 de cada 125 residentes suburbanos la tienen. Calcula si la proporcin de amas de casa urbanas que tienen secadora exceden en ms de 7% a la proporcin de amas de casa suburbanas que tambin tienen. Considera = 4%.

    2. La industria cervecera est interesada en comparar dos marcas de cerveza (A y B), puesto que se presume que la marca B es preferida sobre la marca A. De 200 personas entrevistadas, 116 prefieren la marca B; y de 150 personas, 78 prefieren la marca A. Determina la veracidad de la hiptesis de la industria. Considera = 10%.

    3. Se realiz un estudio para determinar si ms italianos que estadounidenses prefieren el vino espumoso blanco que el vino espumoso rosado en las bodas. De una muestra aleatoria de 300 italianos, 72 prefirieron el blanco; y de 400 estadounidenses, 70tambin prefirieron el blanco. Calcula si ms italianos que estadounidenses prefieren el vino espumoso blanco en las bodas. Utiliza 5% de nivel de significancia.

    4. Un fabricante de cierto producto afirma que ms de 40% de los consumidores prefiere su producto. Se entrevista a 60 personas al azar para verificar su afirmacin. Si 28 personas de las entrevistadas prefiere dicho producto, entonces se considera vlida la afirmacin del fabricante, en caso contrario, se rechaza. Con un nivel designificancia de 5% prueba la afirmacin del fabricante.

    Autoevaluacin 1. Dadas X1, X2, X3, y X4 variables de una muestra aleatoria tomada de una poblacin

    distribuida en forma normal, de los siguientes estimadores indica cul es un estimador insesgado de la media .

    a) 1 1 2 3 42 3 44X X X X

    b) 2 1 2 3 42 4X X X X

    c) 3 1 2 3 4X X X X

    d) 4 1 2 3 42 3 410X X X X

    2. De una mquina que produce piezas metlicas de forma cilndrica, se toma una muestra al azar cuyos dimetros son 9.8, 10.5, 10.1, 9.9, 10.4, 10.6, 10.2, 10.8, 10.0,

  • 320

    10.7 y 9.8 mm. Supn que los dimetros tienen una distribucin aproximadamente normal, considera 95% de intervalo de confianza para el dimetro promedio de todas las piezas de esta mquina.

    a) (9.29, 11.29) b) (8.46, 10.36) c) (8.95, 11.06) d) (10.05, 10.55)

    3. Supn que la vidapromedio de los focos tiene 30 h de desviacin estndar de vida, considerando una muestra de 50 focos y las hiptesis H0: = 750, H1: 750, con la regin de rechazo establecida para medias mayores a 760, calcula el nivel designificancia.

    a) 0.0091 b) 0.9919 c) 0.0182 d) 0.9818

    4. El espesor de las paredes de 20 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue 3.98 mm y la desviacin estndar muestral 0.09 mm. Considera 90% de intervalo de confianza respecto de la varianza del espesor de las paredes de las botellas.

    a) (0.08, 0.010) b) (0.0051, 0.0152) c) (0.008, 0.010) d) (0.0152, 0.1520)

    5. Se aplic un examen de ecuaciones diferenciales a un grupo de alumnos (grupo A), obtenindose las calificaciones 4.5, 3.5, 8.5, 9.5, 9.0, 6.0, 5.5, 7.5, 10, 4.0 y 8.0. A otro grupo de lgebra lineal se le aplic otro examen obtenindose las calificaciones 5.0, 6.0, 3.5, 8.0, 5.0, 7.0, 9.5, 8.0, 9.0, 10, 7.0, 4.5 y 6.5. Considera 95% de intervalo de confianza para la diferencia de medias, existir diferencia entre las medias de las calificaciones de los grupos?

    a) (0.245, 3.562) b) (2.476, 3.638) c) (1.7673, 1.89325) d) (1.477, 4.604)

    6. Un economista tom al azar una muestra de 400 personas de clase obrera, de la cual 25 resultaron desempleadas. Calcula la proporcin real de trabajadores desem-pleados considerando 97% de intervalo de confianza.

    a) (0.018, 0.045) b) (0.360, 0.890) c) (0.036, 0.089) d) (0.046, 0.094)

  • 321

    7. Un investigador afirma que el promedio de accidentes en una fbrica es inferior a trece. Al tomar una muestra al azar de 36, se obtuvo media y varianza de 10 y 9, respectivamente. Comprueba la hiptesis del investigador con 1% de nivel de significancia.

    a) se acepta la afirmacin con z = 2.3263 b) se rechaza la afirmacin con z = 6 c) se rechaza la afirmacin con z = 2.3263 d) se acepta la afirmacin con z = 4.569

    8. Considera un medidor de volumen en la bomba de una estacin de gasolina en la cual se realizan cinco mediciones, 10.5, 10.0, 9.90, 9.95 y 10.15. Supn normalidad,calcula un intervalo de confianza para la varianza con = 0.05.

    a) (6.799, 13.401) b) (9.799, 10.401) c) (8.799,12.401) d) (8.946, 10.984)

    Respuestas de los ejerciciosEjercicio 1 1. insesgados T2, T3, ms eficiente T2

    2. se comprueba que E( ) 3. a) se comprueba que E X Y( ) 1 2 b) V X Y

    n n( ) 1

    2

    1

    22

    2

    Ejercicio 2 1. a) (15.03, 17.64) b) (13.84, 18.82) 2. (3.98, 4.06) 3. (25.07, 27.73) 4. (9.80, 10.40) 5. a) (9.40, 11.26) b) (9.52, 11.14)

  • 322

    Ejercicio 3 1. (1.50, 12.70) 2. (0.55, 3.28) 3. (9.35, 17.51) 4. (4.96, 1.60) 5. a) (0.96, 8.08) b) (0.51, 7.62)

    Ejercicio 4 1. (132.24, 1016.46) 2. (0.17, 7.16) 3. (0.0049, 0.0157) 4. (0.021, 0.485)

    Ejercicio 5 1. (0.036, 0.089) 2. (0.036, 0.184) 3. (0.177, 0.057)

    Ejercicio 6 1. a) 0.0384 b) 0.2776 2. 0.1587

    3. a) 0.085 b) 0.341

    Ejercicio 7 1. t = 2.033; no es cierta la afirmacin del fabricante

    2. t = 2.44; se acepta que el contenido promedio es 10.l

  • 323

    3. z = 4; el promedio de accidentes es menor que doce

    4. z = 2, el promedio de accidentes es mayor o igual que once

    Ejercicio 8 1. t = 0.408; el promedio real es mayor o igual al estimado

    2. t = 1.456; los dos procesos son iguales

    3. t = 0.18; los tiempos medios son iguales

    4. t = 1.039; la escala 1 da un peso promedio mayor o igual que la 2

    Ejercicio 9 1. 2 10 1273. ; los cursos disminuyen la varianza de los puntajes en la lectura 2. 2 29 76. ; s, la mquina est desajustada 3. 2 7 45. ; la varianza es igual a 1.3

    Ejercicio 10 1. z = 1.316; la proporcin de amas de casa urbanas que poseen secadora no es mayor

    que la de las residentes suburbanas

    2. z = 1.1176; la marca B no es preferida sobre la marca A

    3. z = 5.2927; los italianos prefieren el vino espumoso blanco

    4. z = 1.05; la afirmacin no es vlida

    Respuestas de la autoevaluacin 1. d) 2. d) 3. a) 4. b) 5. c); dado que el 0 est en el intervalo, no hay diferencia entre los grupos 6. c) 7. b) 8. b)

  • Apndice A

    Uso de tablas alternativas para la distribucin normalLa unidad 8 abord la distribucin normal y en la seccin 8.3.3 se estudi el uso de las tablas normales que se encuentran en el apndice B. En su momento, se mencion que la distribucin normal juega un papel muy importante en el estudio de la probabilidad y la inferencia estadstica; por consiguiente, en diferentes textos, la presentacin delas tablas normales es variable, obviamente el valor de la probabilidad que se calcula no cambiar. A causa de dichas variantes en su presentacin se decidi dar al alumno una explicacin sobre el uso de otros dos tipos de tablas, las cuales estn al final de la presente explicacin.

    A.1 Uso de tablas de la distribucin normal estndar, cola derecha

    Las tablas de cola derecha tienen el siguiente aspecto:

    En las tablas, los valores de Z varan de centsima en centsima desde 0 hasta 3.99. En la fila se ponen las dcimas y en las columnas las centsimas.

    Por tanto, el clculo de probabilidades con base en esta funcin y las propiedades de simetra y el complemento estudiadas en la subseccin 8.3.2, se podr efectuar de la siguiente forma, para los diferentes casos que puedan ocurrir, y que ya se vieron en la seccin 8.3.3:

  • 326

    1. P Z ZF Z Z

    F Z Zd

    d( )

    ( )( ),00 0

    0 0

    0

    1 0

    , en caso de que

    en caso de que

    2. P Z ZF Z Z

    F Z Zd

    d( )

    ( ),( ),0

    0 0

    0 0

    1 0

    0

    en caso de que

    en caso de que

    3. P Z Z Z F Zd( ) ( )0 0 01 2

    4. P a Z b

    F a F b a b

    F b F ad d

    d d( )( ) ( ), , ,( ) ( ),

    en caso de que

    en caso

    0

    dde que

    en caso de que y

    a b

    F b F a a bd d

    , ,

    ( ) ( ),0

    1 0 0

    En los siguientes ejemplos se emplear la funcin Fd(z).

    Dada Z una variable aleatoria continua con distribucin normal estndar, se calculan las probabilidades indicadas en el ejemplo 4 de la seccin 8.3.3:

    1. P Z Fd( . ) ( . ) . .1 25 1 1 25 1 0 1056 0 89442. P Z F Fd d( . ) ( ( . )) ( . ) .0 86 0 86 0 86 0 19493. P Z Fd( . . ) ( . ) . . .2 97 2 97 1 2 2 97 1 2 0 0015 1 0 0030 0 99704. P Z F Fd d( . . ) ( . ) ( ( . )) . . .0 67 1 24 1 1 24 0 67 1 0 1075 0 2514 0 664115. P Z F Fd d( . . ) ( . ) ( . ) . . .0 06 3 04 0 06 3 04 0 4761 0 0012 0 47496. P Z F Fd d( . . ) ( ( . )) ( ( . )) . .1 34 0 56 0 56 1 34 0 2877 0 0901 0..1976

    Ejemplo

  • 327

  • 328

    A.2 Uso de tablas de la distribucin normal estndar, parte central

    Las tablas de la parte central tienen el siguiente aspecto:

    En las tablas, los valores de Z varan de centsima en centsima desde 0 hasta 3.99. En la fila se ponen las dcimas y en las columnas las centsimas.

    Por tanto, el clculo de probabilidades con base en esta funcin y las propiedades de simetra y el complemento estudiadas en la subseccin 8.3.2, se podr efectuar de la siguiente forma, para los diferentes casos que puedan ocurrir, y que ya se vieron en la seccin 8.3.3:

    1. P Z ZF Z Z

    F Z Zc

    c

    ( ). ( ). ( ),0

    0 0

    0

    0 5 0

    0 5

    , en caso de que

    en caso de que 00 0

    2. P Z ZF Z Z

    F Z Zc

    c

    ( ). ( ),

    ( ),00 0

    0 0

    0 5 0

    05

    en caso de que

    en caso de que 0

    3. P Z Z Z F Zc( ) ( )0 0 02

    4. P a Z b

    F b F a a b

    F a F bc c

    c c( )( ) ( ), , ,( ) ( ),

    en caso de que

    en caso

    0

    dde que

    en caso de que y

    a b

    F b F a a bc c

    , ,

    ( ) ( ),0

    0 0

    En los siguientes ejemplos se emplear la funcin Fc(z).

  • 329

    Dada Z una variable aleatoria continua con distribucin normal estndar, se calculan las probabilidades indicadas en el ejemplo 4 de la seccin 8.3.3:

    1. P Z Fc( . ) ( . ) . . .1 25 05 1 25 0 5 0 3944 0 89442. P Z F Fc c( . ) . ( ( . )) . ( . ) . . .0 86 0 5 0 86 0 5 0 86 0 5 0 3051 0 19493. P Z Fc( . . ) ( . ) . .2 97 2 97 2 2 97 2 0 4985 0 99704. P Z F Fc c( . . ) ( . ) ( ( . )) . . .0 67 1 24 1 24 0 67 0 3925 0 2486 0 64115. P Z F Fc c( . . ) ( . ) ( . ) . . .0 06 3 04 3 04 0 06 0 4988 0 0239 0 47496. P Z F Fd d( . . ) ( ( . )) ( ( . )) . .1 34 0 56 1 34 0 56 0 4099 0 2123 0..1976

    Ejemplo

  • Apndice B

  • 332

    Funcin acumulada de la distribucin normal estndar

  • 333

  • 334

    Tabla porcentual de la distribucin normal estndar

  • 335

    Tabla t-Student

  • 336

    Tabla de porcentajes de la funcin inversa acumulada, distribucin -cuadrada, rea de cola derecha

  • 337

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 338

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 339

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 340

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 341

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 342

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 343

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 344

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 345

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • 346

    Tabla de porcentajes de la funcin inversa acumulada, distribucin F, rea de cola derecha

  • Bibliografa

    Bibliografa bsica

    Mendenhall, William, Richard L. Scheaffer y Dennis D. Wackerly, Estadstica matemtica con aplicaciones, Grupo Editorial Iberoamrica, 1994.

    Por medio de esta obra se pueden ampliar los conocimientos sobre las multivariables y distribuciones muestrales (unidad 9), as como los modelos continuos y discretos (unidades 5 a 8).

    Meyer, Paul L., Probabilidad y aplicaciones estadsticas, Addison-Wesley Iberoamericana (edicin revisada), 1992. Este texto es propicio para los estudiantes que quieran resolver problemas referentes a los temas de las unidades 2-10 con mayor grado de dificultad.

    Montgomery, Douglas C. y George C. Runger, Probabilidad y estadstica aplicadas a la ingeniera, McGraw-Hill, Mxico, 1996.

    Este texto es propicio para ampliar los conocimientos sobre estadstica descriptiva e inferencial (unidades 1 y 10 del presente libro, respectivamente) y los modelos continuos y discretos (unidades 5 a 8).

    Walpole, Ronald E., y Raymond H. Myers, Probabilidad y estadstica, Pearson Educacin, 1998.

    Este texto es propicio para ampliar los conocimientos sobre estadstica inferencial (unidad 10) y modelos continuos y discretos (unidades 5 a 8).

    Bibliografa complementaria

    Devore, Jay L., Estadstica matemtica con aplicaciones, Thomson Editores, 1998.

    Gutirrez Gonzlez, Eduardo y Olga Vladimirovna Panteleeva, Fundamentos de la teora de las probabilidades para ingeniera y ciencias, Libudi, Mxico, 2000.

    ________________ , Tablas y formulas estadsticas, Libudi, Mxico, 2000.

    Mendenhall, William, y Terry Sincich, Probabilidad y estadstica para ingeniera y ciencias, Prentice-Hall, 1997.