Estadistica Para Ingenieros y Cientificos - William Navidi CAPITULO 5 Intervalos de Confianza

68
Capítulo 5 Intervalos de confianza Introducción En el capítulo 4 se analizaron estimaciones de diferentes parámetros; por ejemplo, ˆ p repre- senta la estimación de una probabilidad de éxito p,y X lo es de una media poblacional m. Ambas son llamadas estimaciones puntuales, porque son sólo números, o puntos. Un hecho importante de las estimaciones puntuales es que casi nunca son exactamente iguales a los va- lores reales que están estimando. Difieren casi siempre, a veces por poco y otras por mucho. Con la finalidad de que una estimación sea útil, se necesita describir qué tan alejada está del valor verdadero. Una mane- ra de lograr esto último es reportar una estimación de la desviación estándar, o de la incerti- dumbre. En este capítulo se mostrará que cuando la estimación tiene una distribución normal, se puede obtener más información acerca de su precisión cuando se calcula un intervalo de confianza. El siguiente ejemplo presenta la idea básica. Suponga que se hace gran número de mediciones independientes, todas mediante el mis- mo procedimiento, del diámetro de un pistón. La media muestral de las mediciones es 14.0 cm, y la incertidumbre en esta cantidad, que representa la desviación estándar de la media mues- tral, es 0.1 cm. Suponga que las mediciones no están sesgadas. El valor 14.0 proviene de una distribución normal, ya que es el promedio de un importante número de mediciones. Ahora el diámetro verdadero del pistón no será exactamente igual a la media muestral de 14.0 cm. Sin embargo, dado que ésta proviene de una distribución normal, se puede utilizar dicha desvia- ción estándar para determinar qué tan cerca está probablemente del diámetro verdadero. Por ejemplo, es muy improbable que la media muestral sea diferente del diámetro verdadero en más de tres desviaciones estándares. Por tanto, se tiene una enorme confianza de que el diáme- tro verdadero esté en el intervalo (13.7, 14.3). Por otro lado, es muy probable que la media muestral difiera del valor verdadero en más de una desviación estándar. Por tanto, se tiene que existe poca certeza de que el diámetro verdadero se encuentre en dicha cercanía (13.9, 14.1). Los intervalos (13.7, 14.3) y (13.9, 14.1) son intervalos de confianza para el diámetro verdadero del pistón. En este capítulo se verá cómo calcular una medida cuantitativa del ni- 300

Transcript of Estadistica Para Ingenieros y Cientificos - William Navidi CAPITULO 5 Intervalos de Confianza

  • Captulo 5Intervalos de confianza

    Introduccin

    En el captulo 4 se analizaron estimaciones de diferentes parmetros; por ejemplo, p repre-senta la estimacin de una probabilidad de xito p, y X lo es de una media poblacional m.Ambas son llamadas estimaciones puntuales, porque son slo nmeros, o puntos. Un hechoimportante de las estimaciones puntuales es que casi nunca son exactamente iguales a los va-lores reales que estn estimando.

    Difieren casi siempre, a veces por poco y otras por mucho. Con la finalidad de que unaestimacin sea til, se necesita describir qu tan alejada est del valor verdadero. Una mane-ra de lograr esto ltimo es reportar una estimacin de la desviacin estndar, o de la incerti-dumbre. En este captulo se mostrar que cuando la estimacin tiene una distribucin normal,se puede obtener ms informacin acerca de su precisin cuando se calcula un intervalo deconfianza. El siguiente ejemplo presenta la idea bsica.

    Suponga que se hace gran nmero de mediciones independientes, todas mediante el mis-mo procedimiento, del dimetro de un pistn. La media muestral de las mediciones es 14.0 cm,y la incertidumbre en esta cantidad, que representa la desviacin estndar de la media mues-tral, es 0.1 cm. Suponga que las mediciones no estn sesgadas. El valor 14.0 proviene de unadistribucin normal, ya que es el promedio de un importante nmero de mediciones. Ahora eldimetro verdadero del pistn no ser exactamente igual a la media muestral de 14.0 cm. Sinembargo, dado que sta proviene de una distribucin normal, se puede utilizar dicha desvia-cin estndar para determinar qu tan cerca est probablemente del dimetro verdadero. Porejemplo, es muy improbable que la media muestral sea diferente del dimetro verdadero enms de tres desviaciones estndares. Por tanto, se tiene una enorme confianza de que el dime-tro verdadero est en el intervalo (13.7, 14.3). Por otro lado, es muy probable que la mediamuestral difiera del valor verdadero en ms de una desviacin estndar. Por tanto, se tiene queexiste poca certeza de que el dimetro verdadero se encuentre en dicha cercana (13.9, 14.1).

    Los intervalos (13.7, 14.3) y (13.9, 14.1) son intervalos de confianza para el dimetroverdadero del pistn. En este captulo se ver cmo calcular una medida cuantitativa del ni-

    300

    NAVIDI Cap 05 2/10/06 10:34 PM Page 300

  • vel de la confianza que se puede tener en estos intervalos, as como en otros que se puedaconstruir. Especficamente, los resultados de la seccin 5.1 mostrarn que se puede tener unaconfianza de 99.7% de que el dimetro verdadero del pistn se encuentre en el intervalo(13.7, 14.3), pero slo certeza de 68% de que ese valor verdadero lo est en (13.9, 14.1).

    5.1 Intervalos de confianza para la media poblacional con muestras grandes

    Se comienza con un ejemplo. Un ingeniero que supervisa el control de calidad quiere calcu-lar la media del peso de cajas que se han llenado con cereal por una mquina especfica du-rante cierto da. Toma una muestra aleatoria de 100 cajas que se han llenado con esa mquinaen ese da. Calcula que la media muestral del peso de llenado es de X 12.05 oz y la desvia-cin estndar s 0.1 oz.

    Debido a que la media poblacional no ser exactamente igual a la media muestral de12.05, es mejor construir un intervalo de confianza alrededor de 12.05 que quiz contenga aaqulla. Despus se puede cuantificar el nivel de confianza de que la media poblacional estrealmente contenida por el intervalo. Con el propsito de ver cmo construir un intervalo deconfianza en este ejemplo, sea m la media poblacional desconocida y s2 la varianza respecti-va. Sean X1, . . . , X100 los 100 pesos del llenado de las cajas muestreadas. El valor observadode la media muestral es X 12.05. Ya que X es la media de una muestra grande, el teoremadel lmite central especifica que proviene de una distribucin normal cuya media es m y cuyadesviacin estndar es

    La figura 5.1 presenta una curva normal, que representa la distribucin de X. Aqu seindica que 95% intermedio de la curva se extiende una distancia 1.96 sX a cada lado de lamedia poblacional. El valor observado X 12.05 constituye una sola muestra de esta distri-bucin. No se tiene manera alguna de saber de qu parte de la curva fue extrado este valorespecial de X. La figura 5.1 presenta una posibi1idad: que la media muestral est dentro del

    X = /

    100.

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 301

    m Xm 1.96sX

    X 1.96sX

    m 1.96sX

    95%

    X 1.96sX

    FIGURA 5.1 La media muestral X se extrae de una distribucin normal con media m ydesviacin estndar Para esta muestra en particular, X proviene de 95% in-termedio de la distribucin, por lo que el intervalo de confianza 95% contie-ne con seguridad la media poblacional m.

    X1.96XX = /

    n.

    NAVIDI Cap 05 2/10/06 10:34 PM Page 301

  • 95% intermedio de la distribucin. Noventa y cinco por ciento de todas las muestras que sepoda haber tomado estn dentro de esta categora. La recta horizontal debajo de la curva enla figura 5.1 significa un intervalo alrededor de X que tiene exactamente la misma longitud de laparte central de 95% de la distribucin; es decir, el intervalo X 1.96 sX. Este intervalo deconfianza es de 95% para la media poblacional m. Es obvio que aqul contiene la media po-blacional m.

    Por otra parte, la figura 5.2 representa una muestra cuya media X est fuera de 95% in-termedio de la curva. Slo 5% de todas las muestras se encuentra en dicha categora. Para es-tas muestras ms inusuales el intervalo de confianza de 95% X 1.96 sX no contiene lamedia poblacional m.

    FIGURA 5.2 La media muestral X viene de una distribucin normal con media m y des-viacin estndar Para esta muestra en particular, X proviene de 5% exteriorde la distribucin, por lo que el intervalo de confianza de 95% X 1.96 sX no contiene lamedia poblacional m.

    Ahora se calcular un intervalo de confianza de 95% X 1.96 sX para la media del pe-so de llenado. El valor de X es 12.05. La desviacin estndar poblacional s y, por tanto, sX son desconocidos. Sin embargo, en este ejemplo, debido a que el tamao muestrales grande, se podra aproximar s con la desviacin estndar muestral s 0.1. Por tanto, secalcula al intervalo de confianza de 95% para la media del peso de llenado m como 12.05 (1.96)(0.01), o (12.0304, 12.0696). Se puede decir que hay 95% de confianza, o un nivel deconfianza de 95%; que la media del peso de llenado est entre 12.0304 y 12.0696.

    Este intervalo de confianza de 95% realmente contiene la media poblacional m? Estoltimo depende de si esta muestra en particular ocurri en otra cuya media proviene de 95%intermedio de la distribucin, o si era una muestra cuya media era inusualmente grande o pe-quea, en el 5% exterior de la distribucin. No hay ninguna manera de saber con seguridaden qu categora est contenida esa muestra particular. Pero imagine que el ingeniero repitieste procedimiento todos los das, extrayendo una muestra grande y calculando el intervalode confianza de 95% X 1.96 sX. A la larga, 95% de las muestras que extrae tendrn mediasen el 95% intermedio de la distribucin, por lo que en tal porcentaje de los intervalos de con-fianza que el ingeniero calcula estar contenida la media poblacional. En otras palabras, unintervalo de confianza de 95% se calcula mediante un procedimiento que con seguridad con-tiene a la media poblacional 95% de las veces.

    g/

    100

    n X = /

    n.

    302 CAPTULO 5 Intervalos de confianza

    mX m 1.96sX

    X 1.96sX

    m 1.96sX

    95%

    X 1.96sX

    NAVIDI Cap 05 2/10/06 10:34 PM Page 302

  • Es posible utilizar este mismo razonamiento para calcular intervalos de confianza condiferentes niveles. Por ejemplo, se puede construir un intervalo de confianza de 68%, comose muestra a continuacin. Se sabe que 68% intermedio de la curva normal corresponde al in-tervalo que se extiende una distancia 1.0 sX a cualquier lado de la media poblacional m. Porconsecuencia, un intervalo del mismo largo alrededor de X, especficamente X sX, conten-dr la media poblacional en 68% de las muestras que se pudiera extraer. Por tanto, un inter-valo de confianza de 68% para la media del peso de llenado de las cajas es 12.05 (1.0)(0.01), o (12.04, 12.06).

    Observe que el intervalo de confianza de 95% es ms ancho que el de 68%. Esto es in-tuitivamente creble. Con el fin de aumentar la confianza que se tiene de contener a la verda-dera media poblacional, se debe hacer ms ancho al intervalo, que proporcionar un margenms ancho de error. Tomando dos casos extremos, se tiene una confianza de 100% de que laverdadera media poblacional est en un intervalo infinitamente ancho (-, ), y una confian-za de 0% de que la verdadera media poblacional est en el intervalo de ancho cero [12.05,12.05] que contenga a la media muestral y no a otro punto.

    A continuacin se mostrar cmo encontrar un intervalo de confianza con cualquier ni-vel de confianza deseado. Sea un nmero entre 0 y 1, y 100(1 )% el nivel de confian-za requerido. La figura 5.3 muestra la curva normal que representa la distribucin de X. Sedefine a z/2 como el puntaje z que corta un rea de /2 en la cola del lado derecho. Por ejem-plo, la tabla z (tabla A.2) indica que z

    .025 1.96, ya que 2.5% del rea bajo la curva normalestandarizada est a la derecha de 1.96. De manera similar, la cantidad z/2 corta un rea de/2 en la cola del lado izquierdo. El rea 1 intermedia bajo la curva corresponde al in-tervalo m z/2sX. Como consecuencia del razonamiento que se muestra en las figuras 5.1 y5.2, el intervalo X z/2sX contendr a la media poblacional m para una proporcin 1 de todas las muestras que se pudieran extraer. Por tanto, un intervalo de confianza de nivel100(1 )% para m es X z/2sX, o X z/2s/n.

    FIGURA 5.3 La media muestral X se extrae de una distribucin normal con media m ydesviacin estndar La cantidad z/2 constituye el puntaje z que corta un reade /2 en la cola del lado derecho. Asimismo, z/2 representa el que corta un rea de /2la cola del lado izquierdo. El intervalo X z/2sX contendr la media poblacional m parauna proporcin 1 de todas las muestras que se pudiera extraer. Por tanto, X z/2sXsignifica un intervalo de confianza de nivel 100(1 )% para m.

    Ntese que aun para muestras grandes, la distribucin de X es slo aproximadamentenormal, y no exactamente normal. Por tanto, los niveles establecidos para los intervalos deconfianza son aproximados. Cuando el tamao muestral es lo suficientemente grande paraque se utilice el teorema del lmite central, la distincin entre los niveles aproximados y exac-tos se ignora en la prctica.

    X = /

    n.

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 303

    m za/2sX m za/2sXm

    1 aa/2 a/2

    NAVIDI Cap 05 2/10/06 10:34 PM Page 303

  • En particular,

    es intervalo de confianza de 68% para m.

    es intervalo de confianza de 90% para m.

    es intervalo de confianza de 95% para m.

    es intervalo de confianza de 99% para m.

    es intervalo de confianza de 99.7% para m.

    La media y desviacin estndar muestrales para todos los pesos de llenado de las 100 cajasson X 12.05 y s 0.1. Encuentre un intervalo de confianza de 85% para la media de lospesos de llenado de las cajas.SolucinCon el propsito de determinar un intervalo de confianza de 85%, haga 1 0.85 paraobtener 0.15 y /2 0.075. Cuando se busca en la tabla a z

    .075, el puntaje z que corta7.5% del rea en la cola del lado derecho. Se encuentra z

    .075 1.44. Se aproxima sX s/n

    0.01. Por lo que el intervalo de confianza de 85% es 12.05 (1.44)(0.01). Esto ltimo sepuede escribir como 12.05 0.0144, o como (12.0356, 12.0644).

    El artculo Study on the Life Distribution of Microdrills (Z. Yang, Y. Chen y Y. Yang, enJournal of Engineering Manufacture, 2002:301-305) notifica que en una muestra de 50 mi-croperforadoras, stas perforan una aleacin de acero con bajo contenido de carbono, el tiem-po de vida promedio (expresado como el nmero de huecos perforados antes de que falle) erade 12.68 con desviacin estndar de 6.83. Determine un intervalo de confianza de 95% parala media del tiempo de vida de las microperforadoras bajo estas condiciones.

    X 3 sn

    X 2.58 sn

    X 1.96 sn

    X 1.645 sn

    X sn

    304 CAPTULO 5 Intervalos de confianza

    Resumen

    Sea Xl, . . . , Xn una muestra aleatoria grande (n > 30) de una poblacin con media m ydesviacin estndar s, por lo que X es aproximadamente normal. Entonces un interva-lo de confianza 100(1 )% para m es

    X z/2sX (5.1) donde sX s/n

    . Cuando el valor de s es desconocido, se puede sustituir por la des-viacin estndar muestral s.

    5.1Ejemplo

    5.2Ejemplo

    NAVIDI Cap 05 2/10/06 10:34 PM Page 304

  • SolucinPrimero se traslada el problema al lenguaje estadstico. Se tiene una muestra aleatoria simpleXl, . . . , X50 de los tiempos de vida. La media y desviacin estndar muestrales son X

    12.68y s 6.83. La media poblacional es desconocida y se denota por m.

    El intervalo de confianza tiene la forma X z/2sX, como se especifica en la expresin(5.1). Dado que se quiere un intervalo de confianza de 95%, el nivel respectivo 1 es iguala 0.95. Por lo que 0.05 y z/2 z.025 1.96. Se aproxima s con s 6.83 y se obtienesX 6.83/50

    0.9659. Por lo que el intervalo de confianza de 95% es 12.68 (1.96)(0.9659). Lo anterior se puede escribir como 12.68 1.89, o como (10.79, 14.57).

    El siguiente resultado de computadora (de MINITAB) presenta el intervalo de confian-za de 95% calculado en el ejemplo 5.2.

    La mayor parte del resultado se explica solo. La cantidad etiquetada con SE Mean repre-senta la desviacin estndar de la media muestral sX, aproximada por s/n

    . (SE Mean es-tablece el error estndar de la media, que es otro trmino para la desviacin estndar de lamedia muestral.)

    En el ejemplo 5.2 determine un intervalo de confianza de 80 por ciento.SolucinPara determinar un intervalo de confianza de 80%, haga 1 0.80 para obtener 0.20.Despus busque en la tabla para z

    .10, el puntaje z que corta 10% del rea en la cola del ladoderecho. El valor es z

    .10 1.28. Por lo que el intervalo de confianza de 80% es 12.68 (1.28)(0.9659). ste se puede escribir como 12.68 1.24, o bien (11.44, 13.92).

    Se ha visto cmo calcular un intervalo de confianza con un nivel de confianza especfi-co. Es posible calcular el nivel de un intervalo de confianza dado. El ejemplo 5.4 ilustra elmtodo apropiado.

    Con base en los datos del tiempo de vida de las microperforadoras que se present en el ejem-plo 5.2, un ingeniero notifica un intervalo de confianza de (11.09, 14.27), pero olvid especi-ficar el nivel. Cul es el nivel de confianza de este intervalo de confianza?

    SolucinEl intervalo de confianza tiene la forma X z/2s/n

    . Se despeja a z/2 y despus se consultala tabla z para determinar el valor de . Ahora X 12.68, s 6.83 y n 50. El lmite supe-

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 305

    5.3Ejemplo

    5.4Ejemplo

    One-Sample Z

    The assumed standard deviation = 6.830000

    N Mean SE Mean 95% CI50 12.680000 0.965908 (10.786821, 14.573179)

    NAVIDI Cap 05 2/10/06 10:34 PM Page 305

  • rior de confianza de 14.27 satisface la ecuacin 14.27 12.68 z/2(6.83/50). Por tanto,z/2 1.646. De la tabla z se determina que /2, el rea a la derecha de 1.646, es aproxima-damente 0.05. El nivel es 100(1 )%, o 90 por ciento.

    Ms acerca de niveles de confianzaEl nivel de confianza de un intervalo mide la confiabilidad del mtodo utilizado para calcularel intervalo. Un intervalo de confianza de un nivel 100(1 )% se calcula mediante un m-todo que a la larga dar como resultado que la media poblacional se site en una proporcin1 todas las veces que se utilice. En la prctica, cuando se calcula un intervalo de confian-za, se debe decidir qu nivel de confianza se utilizar. Esta decisin implica un intercambio,porque los intervalos con niveles de confianza ms grandes son menos precisos. Por ejemplo,un intervalo de confianza de 68% especifica la media poblacional dentro de 1.0sX, mien-tras que un intervalo de confianza de 95% especifica a ste solamente dentro de 1.96sX;por tanto, tiene slo casi la mitad de la precisin del intervalo de confianza de 68%. La figu-ra 5.4 ilustra el intercambio entre confianza y precisin. Se extrajeron cien muestras de unapoblacin con media m. La figura 5.4b presenta cien intervalos de confianza de 95%, cada unobasado en una de estas muestras. Los intervalos de confianza son todos diferentes, porque ca-da muestra tiene una media X diferente. (Tambin tienen valores diferentes de s con los quese aproxima a s, pero esto ltimo tiene un efecto mucho muy pequeo.) Cerca de 95% de es-tos intervalos contiene la media poblacional m. La figura 5.4a presenta intervalos de confian-za de 68% basados en las mismas muestras. Estos intervalos son ms precisos (ms angostos),pero muchos de ellos no contienen la media poblacional. La figura 5.4c presenta intervalos deconfianza de 99.7%. Estos intervalos son muy confiables. A la larga, solamente tres de los 1 000intervalos no contendrn la media poblacional. Sin embargo, son menos precisos (ms an-chos); por tanto, no transmiten mucha informacin.

    El nivel de confianza ms utilizado en la prctica es de 95%. Para muchas aplicaciones,este nivel proporciona un buen compromiso entre precisin y confiabilidad. Los niveles deconfianza inferiores a 90% rara vez se utilizan. Para algunas aplicaciones de aseguramientode calidad, donde la confiabilidad de producto es importante, se utilizan intervalos con nive-les de confianza muy altos, de 99.7 por ciento.

    Probabilidad contra confianzaEn el ejemplo del peso de llenado analizado al inicio de esta seccin, se calcul un intervalode confianza de 95% para la media poblacional m de (12.304, 12.696). Es arriesgado decirque la probabilidad es de 95% y que m est entre 12.304 y 12.696. Sin embargo, esto ltimono es correcto. El trmino probabilidad se refiere a los eventos aleatorios que pueden resul-tar diferentes cuando se repiten los experimentos. Los nmeros 12.304 y 12.696 son fijos, noaleatorios. La media poblacional es tambin fija. La media del peso de llenado est ya sea enel intervalo de 12.304 a 12.696, o no lo est. No hay aleatoriedad implicada. Por tanto, se di-ce que se tiene confianza de 95% (no una probabilidad) que la media poblacional est en talintervalo.

    Por otra parte, se dice que se est analizando un mtodo utilizado para calcular un in-tervalo de confianza de 95%. El mtodo dar como resultado que la media poblacional est95% de las veces, y no el otro 5%. En este caso, si la media poblacional est contenida o noes un evento aleatorio, porque puede variar entre experimentos. Por tanto, es correcto decir

    306 CAPTULO 5 Intervalos de confianza

    NAVIDI Cap 05 2/10/06 10:34 PM Page 306

  • que un mtodo para calcular un intervalo de confianza de 95% tiene esa probabilidad de con-tener a la media poblacional.

    Un intervalo de confianza de 90% para la media del dimetro (en cm) de varillas de acero fa-bricadas en cierta mquina de extrusin se calcula de (14.73, 14.91). Verdadero o falso: Laprobabilidad de que la media del dimetro de las varillas fabricadas por este proceso est en-tre 14.73 y 14.91 es de 90 por ciento.

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 307

    a) b) c)m m m

    5.5Ejemplo

    FIGURA 5.4 a) Cien intervalos de confianza de 68% para una media poblacional, cada uno calculado con una muestra di-ferente. Aunque precisos, no contienen a la media poblacional 32% de las veces. Esta alta tasa de fallas hace que el inter-valo de confianza de 68% sea inaceptable para propsitos prcticos. b) Cien intervalos de confianza de 95% calculado deestas muestras. ste presenta un buen compromiso entre precisin y confiabilidad para muchos propsitos. c) Cien interva-los de confianza de 99.7% calculado de estas muestras. Estos intervalos no contienen a la media poblacional solamente tresveces en 1 000. Son sumamente confiables, pero poco precisos.

    NAVIDI Cap 05 2/10/06 10:34 PM Page 307

  • SolucinFalso. Un intervalo especfico de confianza est dado. La media est o no en el intervalo. Hayconfianza de 90% de que la media poblacional est entre 14.73 y 14.91. El trmino probabi-lidad no es adecuado.

    Una ingeniera planea calcular un intervalo de confianza de 90% para la media del dimetrode varillas de acero. Medir los dimetros de una muestra grande de varillas, calcular X y s,y despus el intervalo X 1.645s/n. Verdadero o falso: La probabilidad de que la media deldimetro estar en este intervalo es de 90 por ciento.

    SolucinVerdadero. Lo que se describe aqu es un mtodo para calcular un intervalo de confianza, msque un valor numrico especfico. Es correcto decir que un mtodo para calcular un interva-lo de confianza de 90% tiene probabilidad de 90% de contener la media poblacional.

    Un equipo de gelogos planea medir los pesos de 250 rocas. Despus de pesar cada roca mu-chas veces, calcular un intervalo de confianza de 95% para su peso. Suponga que no hay ses-go en el procedimiento de pesado. Cul es la probabilidad de que ms de 240 de losintervalos de confianza contengan los pesos verdaderos de las rocas?

    SolucinAqu se han analizado 250 implementaciones planeadas de un mtodo de clculo de interva-los de confianza, no 250 intervalos especficos que ya han sido calculados. Por tanto, es ade-cuado calcular la probabilidad de que un nmero especfico de estos intervalos contendr lospesos verdaderos de sus rocas respectivas. Debido a que el procedimiento de pesado no tienesesgos, el peso verdadero de una roca es igual a la media poblacional de sus mediciones. Sepuede pensar en cada uno de los 250 intervalos de confianza como un ensayo de Bernoulli,con el xito ocurriendo si el intervalo de confianza contiene la media poblacional. Como con-secuencia de que un intervalo de confianza de 95% se calcula con un proceso que contiene lamedia poblacional 95% de las veces, la probabilidad de xito para cada ensayo es de 0.95. SeaY el nmero de intervalos de confianza que contiene al peso verdadero. Entonces Y Bin(250, 0.95) N(237.5, 11.875). La desviacin estndar de Y es Con el uso de la curva normal, la probabilidad de que Y > 240 es 0.1922. Vase la figura 5.5.Observe que se ha utilizado la correccin de continuidad (vase la seccin 4.10).

    Determinacin del tamao muestral necesario para un intervalo de confianza de ancho especficoEn el ejemplo 5.2, un intervalo de confianza de 95% fue dado por 12.68 1.89, o (10.79,14.57). ste especifica que la media est dentro de 1.89. Ahora suponga que es demasiadoancho para ser til. Suponga que es deseable obtener un intervalo de confianza de 95% queespecifique que la media est dentro de 0.50. Con este propsito se debe aumentar el tama-

    g = 11.875 = 3.45.

    308 CAPTULO 5 Intervalos de confianza

    5.6Ejemplo

    5.7Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 308

  • o muestral. Se ilustra cmo calcular el tamao necesario para obtener un intervalo de con-fianza de cualquier ancho especfico.

    FIGURA 5.5 Solucin al ejemplo 5.7.

    Se sigue de la expresin (5.1) que el ancho de un intervalo de confianza para una me-dia poblacional basado en una muestra de tamao n extrada de una poblacin con desviacinestndar s es z/2s/n

    . Si se especifica el nivel de confianza 100(1 )% se puede bus-car el valor z/2. Si la desviacin estndar s poblacional tambin se especifica, se calcular elvalor de n necesario para producir un ancho especfico. En el ejemplo 5.2, el nivel de confianzaes de 95% y la desviacin estndar se calcula de 6.83. Se busca z/2 z.025 1.96. El tama-o muestral necesario para obtener un intervalo de confianza de 95% con ancho 0.50 se en-cuentra al despejar n de la ecuacin (1.96)(6.83)/n 0.50. Se obtiene n 716.83, que seredondea hacia arriba a n 717.

    En el ejemplo del peso de llenado que se analiz en esta seccin, la desviacin estndar mues-tral de pesos de las 100 cajas era de s 0.1 oz. Cuntas cajas se probarn para obtener unintervalo de confianza de 99% de ancho 0.012 oz?

    SolucinEl nivel es 99%, por lo que 1 0.99. Por tanto, 0.01 y z/2 2.58. Se calcula elvalor de s con s 0.1. El tamao muestral necesario se encuentra con (2.58)(0.1)/n 0.012. Se obtiene n 463.

    Intervalos de confianza de un ladoLos intervalos de confianza que se han analizado son de dos lados, ya que especifican tantoun lmite inferior como otro superior. Ocasionalmente se tiene inters slo en uno de estos l-mites. En estos casos son adecuados los intervalos de confianza de un lado. Por ejemplo, su-ponga que un ingeniero que supervisa la confiabilidad quiere calcular la media de la fuerzade compresin de cierto tipo de bloque de concreto, con el propsito de determinar los tipos deaplicaciones para los que ser adecuado. El ingeniero estar interesado solamente en un lmi-te inferior para la fuerza, ya que las especificaciones para diferentes aplicaciones en generalespecificarn slo una fuerza mnima.

    Suponga que una muestra grande tiene una media muestral X y desviacin estndar sX.La figura 5.6 muestra cmo se puede adaptar la idea detrs del intervalo de confianza de doslados para obtener un intervalo de confianza de un lado para la media poblacional m. La cur-

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 309

    237.5 240.5z = 0.87

    0.1922

    5.8Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 309

  • va normal representa la distribucin de X. Para 95% de todas las muestras que se pueden ex-traer, X m 1.645sX y, por tanto, el intervalo (X 1.645sX, ) contiene a m. Este lti-mo no contendr a m slo si la media muestral est en el 5% superior de su distribucin. Elintervalo (X 1.645sX, ) es un intervalo de confianza de un lado de 95% desigual para m,y la cantidad X 1.645sX es un lmite inferior de confianza del 95% para m.

    FIGURA 5.6 La media muestral X es extrada de una distribucin normal con media m ydesviacin estndar sX s/n. Para esta muestra en particular, X

    proviene de 95% msbajo de la distribucin, por lo que el intervalo de confianza de un lado de 95% (X 1.645sX, ) seguramente contiene a la media poblacional m.

    Al construir una figura, como la 5.6, con 5% de la cola inferior sombreada, se puedever que la cantidad X 1.645sX es el lmite superior de confianza de 95% superior para m.Ahora se generalizar el mtodo para obtener intervalos de confianza de un lado a cualquiernivel deseado. Se define z como el puntaje z que corta un rea en la cola de la derecha dela curva normal. Por ejemplo, z

    .05 1.645. Mediante el razonamiento que se utiliz para ob-tener un intervalo de confianza de 95%, se pueden apreciar un nivel 100(1 )% con lmiteinferior de confianza para m dado por X zsX y un nivel 1 con lmite superior de con-fianza para m dado por X zsX.

    310 CAPTULO 5 Intervalos de confianza

    X 1.645sX

    1.645sX

    95%

    Xm m

    Resumen

    Sea Xl, . . . , Xn una muestra aleatoria grande (n > 30) de una poblacin con media m ydesviacin estndar s, se tiene que X es aproximadamente normal. Entonces el nivelde confianza 100(1 )% con lmite inferior de confianza para m es

    X zsX (5.2)y un nivel 100(1 )% con lmite de confianza superior para m es

    X zsX (5.3)donde sX s/n

    . Cuando el valor de s es desconocido, se puede sustituir por la des-viacin estndar muestral s.

    NAVIDI Cap 05 2/10/06 10:35 PM Page 310

  • En particular,

    representa un lmite superior de confianza de 90% para m.

    constituye un lmite superior de confianza de 95% para m.

    significa un lmite superior de confianza de 99% para m.

    Los correspondientes lmites inferiores se encuentran al reemplazar el con el .

    Con referencia al ejemplo 5.2, encuentre tanto un lmite inferior de confianza de 95% comouno superior de 99% para la media del tiempo de vida de las microperforadoras.

    SolucinLa media muestral y la desviacin estndar son X 12.68 y s 6.83, respectivamente. Eltamao muestral es n 50. Se calcula sX s/n

    0.9659. El lmite inferior de confianzade 95% es X 1.645sX 11.09 y el de 99% es X

    2.33sX 14.93.

    En el ejemplo 5.2, el intervalo de confianza de 95% de dos lados se calcul de (10.79,14.57). El lmite inferior de confianza de 95% de 11.09, calculado en el ejemplo 5.9, es msgrande que el lmite inferior del intervalo de confianza de dos lados. La razn de esto ltimoconsiste en que el intervalo de dos lados puede fallar en dos maneras: el valor de m podra serdemasiado alto o demasiado bajo. El intervalo de confianza de 95% de dos lados est disea-do para fallar 2.5% de las veces en el lado superior y 2.5% en el inferior. En contraparte, ellmite inferior de confianza de 95% nunca falla sobre el lado superior. ste est, por tanto, di-seado para fallar 5% de las veces en el lado inferior, por lo que su lmite inferior es mayorque para el intervalo de dos lados.

    Intervalos de confianza que deben estar basados en muestras aleatoriasLos mtodos descritos en esta seccin requieren que los datos sean una muestra aleatoria deuna poblacin. Cuando se utiliza para otras muestras, los resultados podran ser no significa-tivos. Los siguientes son dos ejemplos en los que se incumple la suposicin de muestreo alea-torio.

    Un ingeniero qumico desea calcular la media de la produccin de un nuevo proceso. El pro-ceso est operando 100 veces durante un periodo de varios das. La figura 5.7 presenta las 100producciones graficadas en funcin del tiempo. Sera adecuado calcular un intervalo de con-fianza para la media de la produccin mediante el clculo de X y s para las producciones ydespus utilizar la expresin (5.l)?

    X + 2.33 sn

    X + 1.645 sn

    X + 1.28 sn

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 311

    5.9Ejemplo

    5.10Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 311

  • FIGURA 5.7 Produccin de 100 operaciones de un proceso qumico, graficadas en fun-cin del tiempo. Hay un patrn claro que indica que los datos no forman una muestra alea-toria.

    SolucinNo. La expresin (5.1) es vlida slo cuando los datos son una muestra aleatoria de una po-blacin. La figura 5.7 muestra un patrn cclico. ste podra indicar que la produccin de cadaoperacin est influida por la produccin de la operacin previa, lo que violara la suposicinde independencia. Otra posibilidad es que la produccin est influida por condiciones am-bientales que fluctan en forma regular. En cualesquiera de los dos casos, los datos no satis-facen las condiciones de una muestra aleatoria y no se debe utilizar la expresin (5.1).

    El ingeniero de quien se habl en el ejemplo 5.10 est investigando la produccin de otro pro-ceso. La figura 5.8 presenta las producciones de 100 operaciones de ste, graficadas en fun-cin del tiempo. Se debe utilizar la expresin (5.1) para calcular un intervalo de confianzapara la media de la produccin de este proceso?

    FIGURA 5.8 Produccin de 100 operaciones de un proceso qumico, graficadas en fun-cin del tiempo. Hay tendencia creciente con el tiempo, al menos en la parte inicial de lagrfica, lo que indica que los datos no forman una muestra aleatoria.

    312 CAPTULO 5 Intervalos de confianza

    Prod

    ucci

    nTiempo

    Prod

    ucci

    n

    Tiempo

    5.11Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 312

  • SolucinNo. Como en el ejemplo 5.10, hay un patrn en el tiempo. En este caso, las producciones tien-den a aumentar con el tiempo, al menos en la parte inicial de la grfica. Esto ltimo podraindicar un efecto de aprendizaje; conforme un operador se hace ms experimentado respec-to de un proceso, los resultados mejoran. Un anlisis ms minucioso de los datos podra indi-car un momento donde el aumento parece parar y, en tal caso, la parte que tiene xito se utilizapara formar un intervalo de confianza.

    5.1 Intervalos de confianza para la media poblacional con muestras grandes 313

    Ejercicios para la seccin 5.11. Determine el valor de z/2 para utilizar la expresin (5.1)

    con el fin de construir un intervalo de confianza con nivel

    a) 90%b) 83%c) 99.5%d ) 75%

    2. Determine los niveles de los intervalos de confianza que tie-nen los siguientes valores de z/2:

    a) z/2 1.96b) z/2 2.17c) z/2 1.28d ) z/2 3.28

    3. Conforme se eleva el nivel de confianza, la confiabilidad_____________ y la precisin _________. Opciones: aumenta,disminuye.

    4. Los mtodos de interpolacin se utilizan para calcular altu-ras superiores al nivel del mar para ubicaciones donde lasmediciones directas no estn disponibles. En el artculoTransformation of Ellipsoid Heights to Local LevelingHeights (M. Yanalak y O. Baykal, en Journal of SurveyingEngineering, 2001:90-103), se evala un mtodo de interpo-lacin para un polinomio de segundo orden que tiene comoobjetivo calcular las alturas de mediciones GPS (sistema deposicionamiento global). En una muestra de 74 ubicacio-nes, los errores del mtodo tienen promedio de 3.8 cm, condesviacin estndar de 4.8 cm.

    a) Determine un intervalo de confianza de 95% para la me-dia del error de este mtodo.

    b) Determine un intervalo de confianza de 98% para la me-dia del error de dicho mtodo.

    c) Un topgrafo afirma que el error de media est entre 3.2y 4.4 cm. Con qu nivel de confianza se puede haceresta afirmacin?

    d ) Aproximadamente cuntas ubicaciones se deben mues-trear con el propsito de que un intervalo de confianzade 95% especificar la media dentro de 0.7 cm?

    e) Aproximadamente cuntas ubicaciones se debe mues-trear con el propsito de que un intervalo de confianzade 98% especificar la media dentro de 0.7 cm?

    5. En una muestra aleatoria de 100 bateras producidas porcierto mtodo, el promedio del tiempo de vida fue de 150horas y la desviacin estndar de 25 horas.

    a) Determine un intervalo de confianza de 95% para la me-dia del tiempo de vida de las bateras producidas por es-te mtodo.

    b) Determine un intervalo de confianza de 99% para la me-dia del tiempo de vida de bateras producidas por dichomtodo.

    c) Un ingeniero afirma que la media del tiempo de vida es-t entre 147 y 153 horas. Con qu nivel de confianza sepuede hacer esta afirmacin?

    d ) Aproximadamente cuntas bateras se deben muestrearcon el propsito de que un intervalo de confianza de95% especificar la media dentro de 2 horas?

    e) Aproximadamente cuntas bateras se deben muestrearcon el fin de que un intervalo de confianza de 99% es-pecificar la media dentro de 2 horas?

    6. En una muestra aleatoria de 53 especmenes de concreto, lamedia de la porosidad (en %) fue de 21.6 y la desviacin es-tndar de 3.2.

    a) Determine un intervalo de confianza de 90% para la me-dia de la porosidad de los especmenes de este tipo deconcreto.

    b) Determine un intervalo de confianza de 95% para la me-dia de la porosidad de los especmenes de este tipo deconcreto.

    c) Cul es el nivel de confianza del intervalo (21.0, 22.2)?

    NAVIDI Cap 05 2/10/06 10:35 PM Page 313

  • d ) Cuntos especmenes se deben muestrear con el prop-sito de que un intervalo de confianza de 90% especifi-que la media dentro 0.3?

    e) Cuntos especmenes se deben muestrear con el prop-sito de que un intervalo de confianza de 95% especifi-que la media dentro 0.3?

    7. En una muestra de 80 clavos con costo de diez centavos, elpeso promedio era 1.56 g y la desviacin estndar era de 0.1gramos.

    a) Determine un intervalo de confianza de 95% para la me-dia del peso de este tipo de clavo.

    b) Determine un intervalo de confianza de 98% para la me-dia del peso de este tipo de clavo.

    c) Cul es el nivel de confianza del intervalo (1.54, 1.58)?d ) Cuntos clavos se deben muestrear con el propsito de

    que un intervalo de confianza de 95% especifique la me-dia dentro de 0.01 g?

    e) Aproximadamente cuntos clavos se deben muestrearcon el fin de que un intervalo de confianza de 98% es-pecifique la media dentro de 0.01 g?

    8. Una etapa en la fabricacin de cierta abrazadera de metalimplica perforar cuatro huecos. En una muestra de 150abrazaderas, el promedio del tiempo necesario para comple-tar dicha etapa era de 72 segundos y la desviacin estndarde 10 segundos.

    a) Determine un intervalo de confianza de 95% para la me-dia del tiempo necesario para completar tal etapa.

    b) Determine un intervalo de confianza de 99.5% para lamedia del tiempo necesario para completar esta etapa.

    c) Cul es el nivel de confianza del intervalo (71, 73)?d ) Cuntas abrazaderas se deben muestrear con el prop-

    sito de que un intervalo de confianza de 95% especifi-que la media dentro de 1.5 segundos?

    e) Cuntas abrazaderas se deben muestrear con el objeti-vo de que un intervalo de confianza 99.5% especifiquela media dentro de 1.5 segundos?

    9. Un proveedor vende fibras sintticas a una compaa de ma-nufactura. Se selecciona una muestra aleatoria simple de 81fibras de un envo. El promedio de la fuerza de ruptura destas es de 29 lb y la desviacin estndar de 9 lb.

    a) Determine un intervalo de confianza de 95% para la me-dia de la fuerza de ruptura de todas las fibras del envo.

    b) Determine un intervalo de confianza de 99% para la me-dia de la fuerza de ruptura de todas las fibras del envo.

    c) Cul es el nivel de confianza del intervalo (27.5, 30.5)?d ) Cuntas fibras se deben muestrear con el propsito de

    que un intervalo de confianza de 95% especifique la me-dia dentro de 1 lb?

    e) Cuntas fibras se deben muestrear con el propsito deque un intervalo de confianza de 99% especifique la me-dia dentro de 1 lb?

    10. Con referencia al ejercicio 5.a) Determine un lmite inferior de confianza de 95% para

    la media del tiempo de vida de tal tipo de batera.b) Un ingeniero afirma que la media del tiempo de vida es

    mayor de 148 horas. Con qu nivel de confianza sepuede hacer esta afirmacin?

    11. Con referencia al ejercicio 6.a) Determine un lmite superior de confianza de 99% para

    la media de la porosidad.b) Se hizo una afirmacin de que la media de la porosidad

    es menor que 22.7%. Con qu nivel de confianza se pu-do haber hecho tal afirmacin?

    12. Con referencia al ejercicio 7.a) Encuentre un lmite superior de confianza de 90% para

    la media del peso.b) Alguien dice que la media del peso es menor que 1.585

    g. Con qu nivel de confianza se pudo haber hecho di-cha afirmacin?

    13. Con referencia al ejercicio 8.a) Determine un lmite inferior de confianza de 98% para

    completar la etapa.b) Un especialista en eficiencia dice que la media del tiem-

    po es mayor de 70 segundos. Con qu nivel de confian-za se pudo haber hecho esta afirmacin?

    14. Con referencia al ejercicio 9.a) Determine un lmite superior de confianza de 95% para

    la media de la fuerza de ruptura.b) El proveedor afirma que la media de la fuerza de ruptu-

    ra es mayor que 28 lb. Con qu nivel de confianza sepudo haber hecho tal afirmacin?

    15. Una investigadora calcula un intervalo de confianza de 95%para una media poblacional con base en una muestra de ta-mao 70. Si desea calcular un intervalo de confianza de95% que sea la mitad de ancho, qu tamao muestral ne-cesita?

    314 CAPTULO 5 Intervalos de confianza

    NAVIDI Cap 05 2/10/06 10:35 PM Page 314

  • 5.2 Intervalos de confianza para proporciones

    Los mtodos de la seccin 5.1, en particular la expresin (5.1), se pueden utilizar con el finde determinar los intervalos de confianza para la media de cualquier poblacin de la cual seha extrado una muestra grande. Cuando la poblacin tiene una distribucin de Bernoulli, es-ta expresin toma una forma especial. Se muestra esto ltimo con un ejemplo.

    En el ejemplo 5.2 (de la seccin 5.1), se construy un intervalo de confianza para la me-dia del tiempo de vida de una microperforadora cuando perforaba una aleacin de acero conbajo contenido de carbono. Ahora suponga que se ha establecido una especificacin de queuna perforadora debe tener un tiempo de vida mnimo de diez huecos perforados antes de fa-

    5.2 Intervalos de confianza para proporciones 315

    16. Un intervalo de confianza de 95% para una media poblacio-nal se calcula de una muestra de tamao 50. Se calcularotro intervalo de confianza de 95% para una muestra de ta-mao 200, extrada de la misma poblacin. Elija la mejorrespuesta que complete el espacio en blanco: El intervalo deuna muestra de tamao 50 ser aproximadamente ________del intervalo de la muestra de tamao 200.

    i) Un octavo de ancho.ii) Un cuarto de ancho. iii) La mitad de ancho. iv) El mismo ancho. v) Dos veces de ancho. vi) Cuatro veces de ancho. vii)Ocho veces de ancho.

    17. Con base en pruebas de comportamiento de una gran mues-tra de uniones soldadas, se calcul un intervalo de confian-za de 90% para la media de la dureza Rockwell B de ciertotipo de soldadura de (83.2, 84.1). Determine un intervalo deconfianza de 95% para la media de la dureza Rockwell B deeste tipo de soldadura.

    18. Se hicieron 64 mediciones independientes de la velocidadde la luz. Con un promedio de 299 795 km/s y tenan unadesviacin estndar de 8 km/s. Verdadero o falso:

    a) Un intervalo de confianza de 95% para la velocidad dela luz es 299 795 1.96 km/s.

    b) La probabilidad es de 95% de que la velocidad de la luzest en el intervalo 299 795 1.96.

    c) Si se hace la medicin 65, la probabilidad es de 95% deque estuviera en el intervalo 299 795 1.96.

    19. Una caja grande contiene 10 000 cojinetes de bola. Se eligeuna muestra aleatoria de 120. La media muestral del dime-

    tro es 10 mm y la desviacin estndar es 0.24 mm. Verda-dero o falso:

    a) Un intervalo de confianza de 95% para la media del di-metro de los 120 cojinetes en la muestra es 0 (1.96)(0.24)/120.

    b) Un intervalo de confianza de 95% para la media del di-metro de los 10 000 cojinetes en la caja es 10 (1.96)(0.24)/120.

    c) Un intervalo de confianza de 95% para la media del di-metro de los 10 000 cojinetes en la caja diez es 10 (1.96)(0.24)/10000.

    20. Todos los das un ingeniero de control de calidad seleccio-na una muestra aleatoria de 100 pernos de la produccin delda, mide sus longitudes y calcula un intervalo de confianzade 95% para la media de la longitud de todos los pernos fa-bricados ese da. Cul es la probabilidad de que ms de 15de los intervalos de confianza construidos en los siguientes250 das no contendrn la media verdadera?

    21. Con base en una muestra de registros de reparacin, un in-geniero calcula el intervalo de confianza de 95% para lamedia del costo de reparar un componente de fibra ptica de($140, $160). Un supervisor resume este resultado en un in-forme, diciendo: Se tiene una confianza de 95% de que lamedia del costo de las reparaciones es menor que $160.El supervisor est subestimando la confianza, sobreesti-mndola u obtenindola de manera correcta? Explique.

    22. Un meteorlogo mide la temperatura en el centro de la ciu-dad de Denver a medioda todos los das durante un ao.Las 365 lecturas tienen un promedio de 57F y una desvia-cin estndar de 20F . El meteorlogo calcula un intervalode confianza de 95% para la media de la temperatura a me-dioda de 57 (1.96)(20)/365. Es esto correcto? Porqu si o por qu no?

    NAVIDI Cap 05 2/10/06 10:35 PM Page 315

  • llar. Se prueba una muestra de 144 microperforadoras, y 120, 83.3%, satisfacen la especifica-cin. Sea p la proporcin de microperforadoras en la poblacin que satisface la especificacin.Se desea encontrar un intervalo de confianza de 95% para p.

    Se empieza construyendo un estimador de p. Sea X el nmero de perforadoras en lamuestra que satisface la especificacin. Entonces X Bin(n, p), donde n 144 es el tama-o muestral. El estimador de p es p X/n. En este ejemplo, X 120, por lo que p 120/144 0.833. La incertidumbre, o desviacin estndar de p, es Puesto que eltamao muestral es grande, se tiene por el teorema del lmite central (ecuacin 4.52 de la sec-cin 4.10) que

    El razonamiento que se ilustra en las figuras 5.1 y 5.2 (de la seccin 5.1) muestra que en 95%de todas las muestras posibles, la proporcin poblacional p satisface la siguiente desigualdad:

    (5.4)

    A primera vista, la expresin (5.4) parece un intervalo de confianza de 95% para p. Sinembargo, los lmites contienen una p desconocida, y por eso no sepuede calcular. El punto de vista tradicional es sustituir p con p, obtener el intervalo de con-fianza Investigaciones recientes muestran que ese intervalo se pue-de mejorar modificando ligeramente tanto a n como a p. En especfico, se debe sumar 4 alnmero de los ensayos y 2 al de los xitos. As que en lugar de n se utiliza n n 4, y enlugar de p se usa p (X 2)/ n. Un intervalo de confianza de 95% para p es as dado por

    En este ejemplo, n 148 y p 122/148 0.8243, por eso el in-tervalo de confianza de 95% es 0.8243 0.0613, o (0.763, 0.886).

    Se justifica lo anterior con base en el teorema del lmite central, que requiere que n seagrande. Sin embargo, este mtodo de clculo de intervalos de confianza es adecuado paracualquier tamao n de muestra. Cuando se utiliza con muestras pequeas, podra ocurrir queel lmite inferior sea menor a 0 o que el superior a 1. Dado que 0 < p < 1, un lmite inferiormenor que 0 se debe sustituir con 0, y un lmite superior mayor que 1 se debe sustituir con 1.

    p p p (p 1.96

    p(1 p)/n.

    p pp 1.96

    p(1 p)/n.

    p 1.96p(1 p)/n

    p 1.96

    p(1 p)n

    < p < p + 1.96

    p(1 p)n

    p N(p,

    p(1 p)n

    )p =

    p(1 p)/n.

    316 CAPTULO 5 Intervalos de confianza

    Resumen

    Sea X el nmero de xitos en n ensayos de Bernoulli independientes con probabilidadde xito p, por lo que X Bin(n, p).

    Se define n n 4 y Entonces un nivel 100(1 )% de un interva-lo de confianza para p es

    (5.5)

    Si el lmite inferior es menor que 0, se reemplaza ste con 0. Si el superior es mayorque 1, se remplaza ste con 1.

    p z/2

    p(1 p)n

    p = X + 2n

    .

    NAVIDI Cap 05 2/10/06 10:35 PM Page 316

  • El intervalo de confianza dado por la expresin (5.5) algunas veces es llamado interva-lo de Agresti-Coull, en honor a Alan Agresti y Brent Coull, quienes lo desarrollaron. Para ma-yor informacin consulte Approximate Is Better Than Exact for Interval Estimation ofBinomial Proportions (A. Agresti y B. Coull, en The American Statistician, 1998:119-126).

    Los mtodos de interpolacin se usan para calcular las alturas sobre el nivel del mar para ubi-caciones donde las mediciones directas no estn disponibles. En el artculo Transformationof Ellipsoid Heights to Local Leveling Heights (M. Yanalak y O. Baykal, en Journal of Sur-veying Engineering, 2001:90-103), se evala un mtodo de promedio ponderado de interpo-lacin para calcular las alturas de mediciones GPS. El mtodo se estableci para interpretarerrores grandes (errores cuya magnitud estn por encima de umbral comnmente aceptado)en 26 de 74 ubicaciones de prueba. Determine un intervalo de confianza de 90% para la pro-porcin de ubicaciones en las que este mtodo tendr errores grandes.

    SolucinEl nmero de xitos es X 26 y el de ensayos n 74. Por tanto, se calcula n 74 4 78, p (26 2)/78 0.3590, y Paraun intervalo de confianza de 90%, el valor de /2 es 0.05, por lo que z/2 1.645. El inter-valo de confianza de 90% es, por tanto, 0.3590 (1.645)(0.0543), o (0.270, 0.448).

    Los intervalos de confianza de un lado se pueden calcular tambin para proporciones.Son anlogos a los intervalos de un lado para una media poblacional (ecuaciones 5.2 y 5.3 dela seccin 5.1). Los niveles para los intervalos de confianza de un lado son slo aproximacio-nes burdas para muestras pequeas.

    p p(0.3590)(0.6410)/78 = 0.0543.

    p(1 p)/n =

    5.2 Intervalos de confianza para proporciones 317

    5.12Ejemplo

    Resumen

    Sea X el nmero de xitos en n ensayos de Bernoulli independientes con probabilidadp de xito, por lo que X Bin(n, p).

    Se define n n 4 y Entonces un nivel 100(1 )% de un lmiteinferior de confianza para p es

    (5.6)

    y nivel 100(1 )% de un lmite superior de confianza para p es

    (5.7)

    Si el lmite inferior es menor que 0, se reemplaza con 0. Si el superior es mayor que 1,se reemplaza con 1.

    p + z

    p(1 p)n

    p z

    p(1 p)n

    p = X + 2n

    .

    NAVIDI Cap 05 2/10/06 10:35 PM Page 317

  • El ejemplo 5.13 muestra cmo calcular el tamao muestral necesario para un intervalode confianza que tenga un ancho especfico cuando se conoce un valor preliminar de p.

    En el ejemplo 5.12, qu tamao muestral se necesita para obtener un intervalo de confianzade 95% con ancho 0.08?

    SolucinUn intervalo de confianza de 95% tiene un ancho donde n n 4. Portanto, se determina el tamao muestral n con la ecuacin 0.08. Delos datos del ejemplo 5.12, p 0.3590. Al sustituir este valor para p y despejando a n, se ob-tiene n 135.

    A veces se puede desear calcular un tamao muestral sin tener disponible un estimadorp confiable. La cantidad p (1 p), que determina el ancho del intervalo de confianza, se ma-ximiza por p 0.5. Debido a que el ancho es el ms grande cuando p (1 p) es mayor, sepuede calcular un estimador de tamao muestral conservador con p 0.5 y prosiguiendo co-mo en el ejemplo 5.13.

    En el ejemplo 5.12, qu tamao muestral es necesario para garantizar que el ancho del inter-valo de confianza de 95% no ser mayor que 0.08, si no se ha tomado alguna muestra pre-liminar?

    SolucinUn intervalo de confianza de 95% tiene un ancho El intervalo deconfianza ms ancho posible, para una muestra de tamao n, es o Al despejar a n de la ecuacin , se obtiene n 147.Observe que este clculo es un poco ms grande que el que se obtuvo en el ejemplo 5.13.

    El mtodo tradicionalEl mtodo que se ha descrito se ha desarrollado recientemente (aunque se cre para simplifi-car un mtodo mucho ms antiguo). Muchas personas todava usan un mtodo ms tradicio-nal. ste utiliza el tamao muestral n real en lugar de n y la proporcin real p en lugar de p.Aunque este mtodo todava es usado, falla para lograr la probabilidad de cobertura estable-cida, incluso para algunos valores bastante grandes de n. Esto significa que intervalos de con-fianza 100(1 )% que se calculan con los mtodos tradicionales contendrn la proporcinverdadera menos del 100(1 )% de las veces. El mtodo tradicional no puede ser usado pa-ra todas las muestras pequeas; una regla prctica respecto del tamao muestral es que tantonp (el nmero de xitos) como n(1 p) (el nmero de fracasos) deben ser mayores que 10.

    Debido a que el mtodo tradicional todava es muy usado, lo resumimos en el siguien-te cuadro. Para tamaos muestrales muy grandes, los resultados del mtodo tradicional soncasi idnticos a los obtenidos con el mtodo moderno. Para tamaos muestrales pequeos omedianamente grandes, el punto de vista moderno es mejor.

    0.98/

    n + 4 = 0.080.98/

    n + 4.1.96(0.5)(1 0.5)/(n + 4),

    1.96

    p(1 p)/(n + 4).

    1.96

    p(1 p)/(n + 4) =1.96

    p(1 p)/n,

    318 CAPTULO 5 Intervalos de confianza

    5.13Ejemplo

    5.14Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 318

  • 1. Las concentraciones de contaminantes atmosfricos, comomonxido de carbono (CO), se pueden medir con un espec-trmetro. En una prueba de calibracin, se hicieron 50 me-diciones de una muestra de gas del laboratorio que se sabatena una concentracin de CO de 70 partes por milln(ppm). Se considera que una medicin es satisfactoria si es-t dentro de 5 ppm de la concentracin verdadera. De las 50mediciones, 37 fueron satisfactorias.

    a) Qu proporcin de mediciones de la muestra fue satis-factoria?

    b) Determine un intervalo de confianza de 95% para la pro-porcin de mediciones hechas por este instrumento quesern satisfactorias.

    c) Cuntas mediciones se debe tomar para especificar laproporcin de mediciones satisfactorias dentro de0.10 con una confianza de 95%?

    d ) Determine un intervalo de confianza de 99% para la pro-porcin de mediciones hechas por este instrumento queser satisfactorio.

    e) Cuntas mediciones se debe tomar para especificar laproporcin de mediciones satisfactorias dentro de0.10 con una confianza de 99%?

    2. En cierto da, se fabric gran nmero de fusibles, cada unotasado a 15 A. Al extraer una muestra de 75 de la produc-cin del da, se encontr que 17 de ellos tenan amperajesde quemado mayores de 15 A.

    a) Determine un intervalo de confianza de 95% para la pro-porcin de fusibles fabricada ese da, cuyo amperaje dequemado es mayor que 15 A.

    b) Determine un intervalo de confianza de 98% para la pro-porcin de fusibles fabricados ese da, cuyo amperaje dequemado es mayor que 15 A.

    c) Determine el tamao muestral necesario para que un in-tervalo de confianza de 95% especifique la proporcindentro de 0.05.

    d ) Determine el tamao muestral necesario para que un in-tervalo de confianza de 98% especifique la proporcindentro de 0.05.

    e) Si se calcula un intervalo de confianza de 95% a diariodurante 200 das, cul es la probabilidad de que ms de192 intervalos de confianza contengan las proporcionesverdaderas?

    3. Un fabricante de refresco compra latas de aluminio de undistribuidor externo. Se selecciona una muestra aleatoria de70 latas de un envo grande, se prueba la resistencia de ca-da una aplicando una carga creciente en los lados de la latahasta que se perfora. De las 70 latas, 52 satisfacen la espe-cificacin para la resistencia de perforacin.

    a) Determine un intervalo de confianza de 95% para la pro-porcin de latas que satisface la especificacin en el envo.

    b) Determine un intervalo de confianza de 90% para la pro-porcin de latas que satisface la especificacin en el envo.

    c) Determine el tamao muestral necesario para que un in-tervalo de confianza de 95% especifique la proporcindentro de 0.05.

    d ) Determine el tamao de la muestra necesario para queun intervalo de confianza de 90% especifique la propor-cin dentro de 0.05.

    5.2 Intervalos de confianza para proporciones 319

    Resumen

    El mtodo tradicional para calcular intervalos de confianza para una pro-porcin (ampliamente usado pero no recomendado)

    Sea p la proporcin de xitos en un gran nmero n de ensayos de Bernoulli indepen-dientes con probabilidad de xito p. Entonces el intervalo de confianza tradicional denivel 100(1 )% para p es

    (5.8)

    El mtodo no se puede utilizar a menos que la muestra contenga un mnimo de diezxitos y diez fracasos.

    p z/2

    p(1 p)n

    Ejercicios para la seccin 5.2

    NAVIDI Cap 05 2/10/06 10:35 PM Page 319

  • e) Si un intervalo de confianza de 90% se calcula a diariodurante 300 das, cul es la probabilidad de que ms de280 intervalos de confianza contengan las proporcionesverdaderas?

    4. Con referencia al ejercicio 1, encuentre un lmite inferior deconfianza de 95% para la proporcin de medidas satisfacto-rias.

    5. Con referencia al ejercicio 2, encuentre un lmite superiorde confianza de 98% para la proporcin de fusibles con am-perajes de quemado mayores de 15 A.

    6. Con referencia al ejercicio 3, encuentre un lmite inferior deconfianza de 99% para la proporcin de latas que satisfacela especificacin.

    7. Se prueba una muestra aleatoria de 400 componentes elec-trnicos fabricados por cierto proceso y se encuentra que 30estn defectuosos.

    a) Sea p la proporcin de componentes fabricados con es-te proceso que estn defectuosos. Determine un interva-lo de confianza de 95% para p.

    b) Cuntos componentes se deben muestrear con el pro-psito de que el intervalo de confianza de 95% especifi-que la proporcin defectuosa dentro de 0.02?

    c) (Difcil) La compaa enva los componentes en lotes de200. Los lotes que contienen ms de 20 componentesdefectuosos pueden ser regresados. Determine un inter-valo de confianza de 95% para la proporcin de lotesque sern regresados.

    8. Con referencia al ejercicio 7, se fabricar un dispositivo enel cual se conectarn en serie dos de los componentes delejercicio 7. Los componentes funcionan de manera inde-pendiente, el dispositivo funcionar slo si ambos compo-nentes funcionan. Sea q la probabilidad de que undispositivo funcione. Determine un intervalo de confianzade 95% para q. (Sugerencia: exprese q en funcin de p, ydespus utilice el resultado del ejercicio 7a.)

    9. El artculo Leachate from Land Disposed ResidentialConstruction Waste (W. Weber, Y. Jang y cols., en Journalof Environmental Engineering, 2002:237-245) presenta unestudio de la contaminacin en basureros que contienen de-sechos de construccin y desperdicio de demolicin. De unsitio de prueba se tomaron muestras de lixiviado. De cada42 muestras, 26 contienen niveles detectables de plomo, 41de arsnico y 32 de cromo.

    a) Encuentre un intervalo de confianza de 90% para la pro-babilidad de que una muestra contendr un nivel detec-table de plomo.

    b) Determine un intervalo de confianza de 95% para la pro-babilidad de que una muestra contenga un nivel detecta-ble de arsnico.

    c) Determine un intervalo de confianza de 99% para la pro-babilidad de que una muestra contenga un nivel detecta-ble de cromo.

    10. Los aceros inoxidables pueden ser susceptibles al agrieta-miento de corrosin por tensin bajo ciertas condiciones.Un ingeniero especializado en materiales est interesado endeterminar la proporcin de fallas de aleaciones de aceroque son atribuibles al agrietamiento de corrosin por ten-sin.

    a) En ausencia de datos preliminares, de qu tamao de-be ser una muestra para asegurar que el intervalo de con-fianza de 95% especificar la proporcin dentro de0.05?

    b) En una muestra de 100 fallas, 20 eran ocasionadas porel agrietamiento de corrosin por tensin. Encuentre unintervalo de confianza de 95% para la proporcin de fa-llas ocasionadas por el agrietamiento de corrosin portensin.

    c) Con base en los datos del inciso (b), calcule el tamaomuestral necesario con el propsito de que el intervalode confianza de 95% especificar la proporcin dentro de0.05.

    11. Para que los proyectos de remediacin ecolgica muy impor-tantes sean exitosos, deben tener apoyo pblico. El artculoModelling the Non-Market Environmental Costs and Be-nefits of Biodiversity Using Contingent Value Data (D.Macmillan, E. Duff y D. Elston, en Environmental and Re-source Economics, 2001:391-410) notifica los resultados deuna encuesta en que a votantes escoceses se les pregunt siestaran dispuestos a pagar impuestos adicionales con la fi-nalidad de restaurar el bosque Affric. De los 189 que respon-dieron, 61 decan que s apoyaran esa medida.

    a) Suponiendo que los 189 votantes que respondieron,constituyen una muestra aleatoria, determine un interva-lo de confianza de 90% para la proporcin de votantesque estaran dispuestos a pagar para restaurar el bosqueAffric.

    b) Cuntos votantes se deben muestrear para especificar laproporcin dentro de 0.03 con una confianza de 90%?

    c) Se planea realizar otra encuesta en la cual se les pregun-tar a los votantes si estaran dispuestos a pagar con la

    320 CAPTULO 5 Intervalos de confianza

    NAVIDI Cap 05 2/10/06 10:35 PM Page 320

  • finalidad de restaurar el bosque Strathspey. En este mo-mento, no hay alguna estimacin disponible. Determineun clculo conservador del tamao muestral necesariocon el propsito de que la proporcin estar especifica-da dentro de 0.03 con una confianza de 90 por ciento.

    12. Un analista del mercado de valores observa que, en ciertoao, el precio de cada accin de la IBM aument en 131 delos 252 das burstiles. Con estos datos se puede encontrarun intervalo de confianza de 95% para la proporcin de dasen que la accin de IBM se incrementa? Explique.

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas 321

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas

    Los mtodos descritos en la seccin 5.1 con el fin de calcular intervalos de confianza para lamedia de una poblacin requieren que el tamao muestral sea grande. Cuando ste es peque-o, no hay ningn buen mtodo general para encontrar intervalos de confianza. Sin embargo,cuando la poblacin es aproximadamente normal, se puede utilizar una distribucin de pro-babilidad denominada t de Student para calcular los intervalos de confianza para una mediapoblacional. En esta seccin se describe dicha distribucin y se muestra cmo utilizarla.

    Distribucin t de StudentSi X es la media de una muestra grande de tamao n de una poblacin con media m y varian-za s2, entonces el teorema del lmite central especifica que X N(m, s2/n). La cantidad(X m)/(s/n) tiene una distribucin normal con media 0 y varianza 1. Adems, la desvia-cin estndar muestral s estar cerca de la desviacin estndar s poblacional. Por esta raznla cantidad (X m)/(s/n) es aproximadamente normal con media 0 y varianza 1, por lo quese pueden buscar las probabilidades relacionadas con esta cantidad en la tabla normal estn-dar (tabla z). Esto ltimo permite que se calcule intervalos de confianza para diferentes nive-les para la media poblacional m.

    Qu se puede hacer si X es la media de una muestra pequea? Si ste es pequeo, spodra no estar cercano a s, y X puede no ser aproximadamente normal. Si no se sabe nadaacerca de la poblacin de la que la muestra pequea fue extrada, entonces no hay ningn m-todo fcil para calcular intervalos de confianza. Sin embargo, si la poblacin es aproximada-mente normal, X lo ser incluso cuando el tamao muestral sea pequeo. Lo anterior propiciaque an se puede utilizar la cantidad (X m)/(s/n), pero debido a que s no est necesaria-mente cercana a s, esta cantidad no tendr una distribucin normal. En su lugar, tiene la dis-tribucin t de Student con n 1 grados de libertad, que se denota por tn 1. El nmero degrados de libertad para la distribucin t es uno menos que el tamao muestral.

    La distribucin t de Student fue descubierta en 1908 por William Sealy Gossett, un es-tadstico que trabaj en la cervecera Guinness, en Dubln, Irlanda. La direccin de Guinnessconsider que el descubrimiento era informacin privada y prohibi a Gossett que lo publi-cara. Aun as, l lo public, usando el seudnimo Estudiante. Gossett haba hecho ya estoantes; vase la seccin 4.3.

    NAVIDI Cap 05 2/10/06 10:35 PM Page 321

  • La funcin de densidad de probabilidad de la distribucin t de Student es diferente pa-ra distintos grados de libertad. La figura 5.9 presenta grficas de la funcin de densidad deprobabilidad para diferentes elecciones de grados de libertad. Las curvas tienen una forma si-milar a la curva normal, o z, es una curva con media 0 y desviacin estndar 1. Sin embargo,las curvas t son ms extendidas. Por ejemplo, la curva t con un grado de libertad correspon-de a un tamao muestral de 2. Cuando se extraen muestras de tamao 2, ocurrir con frecuen-cia que la desviacin estndar muestral s sea mucho ms pequea que s, lo que llevar a queel valor de (X m)/(s/n) sea muy grande (ya sea positivo o negativo). Por esta razn, la curvat con un grado de libertad tiene mucho ms rea en las colas. Para tamaos muestrales msgrandes, el valor de s es menos probable que est lejos de s y la curva t es ms cercana a lacurva normal. Con diez grados de libertad (correspondiendo a un tamao muestral de 11), la di-ferencia entre la curva t y la curva normal no es grande. Si una curva t con 30 grados de la li-bertad estuviera dibujada en la figura 5.9, sera indistinguible de la curva normal.

    FIGURA 5.9 Grficas de la funcin de densidad de probabilidad de la curva t de Studentpara diferentes grados de libertad. La curva normal con media 0 y varianza 1 (curva z) esgraficada para comparar. Las curvas t estn ms extendidas que la normal, pero la cantidadde extensin adicional disminuye conforme se aumenta el nmero de grados de libertad.

    322 CAPTULO 5 Intervalos de confianza

    Resumen

    Sea Xl, . . . , Xn una muestra pequea (por ejemplo n 30) de una poblacin normalcon media m. Entonces la cantidad

    tiene una distribucin t de Student con n 1 grados de libertad, denotada por tn 1.Cuando n es grande, la distribucin de la cantidad (X m)/(s/n) es muy cercana

    a la curva normal, de esta forma la curva normal puede usarse en lugar de la t de Stu-dent.

    X s/

    n

    t4 t1

    t10 z

    0

    NAVIDI Cap 05 2/10/06 10:35 PM Page 322

  • La tabla A.3 (en el Apndice A), denominada tabla t, proporciona probabilidades rela-cionadas con la distribucin t de Student. Se presentan algunos ejemplos para mostrar el usode la tabla.

    Se extrae una muestra aleatoria de tamao 10 de una distribucin normal con media 4. Laestadstica t de Student t (X 4)/(s/10) es calculada. Cul es la probabilidad de quet 1.833?

    SolucinEsta estadstica t tiene 10 1 9 grados de libertad. De la tabla t, P(t 1.833) 0.05. Va-se la figura 5.10.

    FIGURA 5.10 Solucin al ejemplo 5.15.

    Con referencia al ejemplo 5.15, determine P(t 1.5).SolucinBuscando a travs del rengln correspondiente a 9 grados de libertad, se ve que la tabla t nolista el valor 1.5. Se encuentra que P(t 1.383) 0.10 y que P(t 1.833) 0.05. Se con-cluye entonces que 0.05 P(t 1.5) 0.10. Vase la figura 5.11. Un resultado ms preci-so que esta desigualdad se puede obtener mediante interpolacin lineal

    Un software proporciona la respuesta correcta con tres dgitos significativos como 0.0839.

    FIGURA 5.11 Solucin al ejemplo 5.16.

    Determine el valor para la distribucin t12 cuya cola superior de probabilidad es 0.025.

    P(t > 1.5) 0.10 1.5 1.3831.833 1.383 (0.10 0.05) = 0.0870

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas 323

    5.15Ejemplo

    5.16Ejemplo

    5.17Ejemplo

    0 1.833

    0.05

    0 1.38

    1.51.83

    0.10

    0.05

    NAVIDI Cap 05 2/10/06 10:35 PM Page 323

  • SolucinAl buscar hacia abajo la columna encabezada con 0.025 en el rengln correspondiente a 12grados de libertad. El valor para t12 es 2.179.

    Determine el valor para la distribucin de tl4 cuya cola de la probabilidad inferior es 0.01.

    SolucinBusque hacia abajo de la columna encabezada con 0.01 en el rengln que corresponde a 14grados de libertad. El valor para tl4 es 2.624. Este valor corta un rea, o probabilidad, de 1%en la cola superior. El valor cuya cola inferior de probabilidad es 1% es 2.624.

    No use la estadstica t de Student si la muestra contiene datos atpicos Para que la estadstica t de Student sea vlida, la muestra debe provenir de una poblacin quees aproximadamente normal. Tales muestras rara vez contienen datos atpicos. Por tanto, losmtodos que implican la estadstica t de Student no se deben utilizar en muestras que contie-nen datos atpicos.

    Intervalos de confianza al usar la distribucin t de StudentCuando el tamao muestral es pequeo y la poblacin es aproximadamente normal, se puedeutilizar la distribucin t de Student para calcular intervalos de confianza. Se muestra esto l-timo con un ejemplo.

    Un metalrgico estudia un nuevo proceso de soldadura. Fabrica cinco uniones soldadasy mide la resistencia producida por cada uno. Los cinco valores (en ksi) son 56.3, 65.4, 58.7,70.1 y 63.9. Suponga que estos valores son una muestra aleatoria de una poblacin aproxima-damente normal. La tarea es determinar un intervalo de confianza para la media de la resis-tencia de las soldaduras hechas por este proceso.

    Cuando el tamao muestral es grande, no necesita preocuparse mucho acerca de la na-turaleza de la poblacin, porque el teorema del lmite central garantiza que la cantidad X ten-dr una distribucin aproximadamente normal. Sin embargo, cuando la muestra es pequea,la distribucin de la poblacin debe ser aproximadamente normal.

    En este caso el intervalo de confianza se construye de la misma manera que en la sec-cin 5.1, exceptuando que el puntaje z se reemplaza con un valor de la distribucin t de Stu-dent. La cantidad

    tiene una distribucin t de Student con n 1 grados de libertad. La figura 5.12 muestra la dis-tribucin t4. De la tabla t de Student se encuentra que 95% del rea bajo la curva est conte-nida entre los valores t 2.776 y t 2.776. Por consecuencia, para 95% de todas lasmuestras que se pudo haber elegido,

    2.776 < X s/

    n

    < 2.776

    X s/

    n

    324 CAPTULO 5 Intervalos de confianza

    5.18Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 324

  • FIGURA 5.12 La distribucin t de Student con cuatro grados de libertad. Un 95% del reacae entre t 2.776 y t 2.776.

    Expresado de otra manera, para 95% de todas las muestras que se pudo haber elegido, se tie-ne que

    Multiplicando por 1 y al sumar X en todos los lados de la desigualdad, se obtiene un inter-valo de confianza 95% para m:

    En este ejemplo, la media muestral es X 62.88 y la desviacin estndar muestral ess 5.4838. El tamao muestral es n 5. Al sustituir valores para X, s y n, se encuentra queun intervalo de confianza de 95% para m es 62.88 6.81 m 62.88 6.81, o (56.07,69.69).

    En general, para producir un intervalo de confianza de nivel 100(1 )%, sea tn l, /2el 1 /2 cuantil de la distribucin t de Student con n 1 grados de libertad, es el valor quecorta un rea de /2 en la cola de la derecha. Por ejemplo, antes se encontr que t4, 0.025 2.776. Entonces un intervalo de confianza de nivel 100(1 )% para la media m poblacio-nal es X tn l, /2(s/n) m X tn l, /2(s/n), o X tn l, /2(s/n).

    Cmo se determina si la distribucin t de Student es adecuada?La distribucin t de Student es adecuada siempre que la muestra provenga de una poblacinque es ms o menos normal. A veces se sabe por experiencia si un proceso genera datos conuna distribucin aproximada. Sin embargo, en muchos casos, se debe decidir si una poblacines aproximadamente normal examinando la muestra. Por desgracia, cuando el tamao mues-tral es pequeo, desviaciones a la normalidad pueden ser difciles de detectar. Una manera ra-

    X 2.776 sn

    < < X + 2.776 sn

    2.776 sn

    < X < 2.776 sn

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas 325

    02.776 2.776

    2.5% 2.5%95%

    Resumen

    Sea Xl, . . . , Xn una muestra aleatoria pequea de una poblacin normal con media m.Entonces un intervalo de confianza de nivel 100(1 )% para m es

    (5.9)X tn1,/2 sn

    NAVIDI Cap 05 2/10/06 10:35 PM Page 325

  • zonable de proceder es construir un diagrama de caja o de puntos de la muestra. Si estos dia-gramas no revelan una asimetra fuerte o algn dato atpico, entonces en la mayor parte de loscasos la distribucin t de Student ser confiable. En principio, tambin se puede determinarsi una poblacin es aproximadamente normal al construir una grfica de probabilidad. Sinembargo, con muestras pequeas, los diagramas de caja y de puntos son ms fciles de dibu-jar, especialmente a mano.

    El artculo Direct Strut-and-Tie Model for Prestressed Deep Beams (K. Tan, K. Tong y C.Tang, en Journal of Structural Engineering, 2001:1076-1084) presenta mediciones de la fuer-za nominal de corte (en kN) para una muestra de 15 vigas de concreto. Los resultados son

    580 400 428 825 850 875 920 550575 750 636 360 590 735 950

    Es adecuado utilizar la estadstica t de Student para construir un intervalo de confianza de99% para la media de la fuerza de corte? Si es as, construya el intervalo de confianza. Si no,explique por qu.

    SolucinPara determinar si la estadstica t de Student es adecuada, se hace un diagrama de caja y depuntos de la muestra. stos se muestran en la figura siguiente.

    No hay evidencia de una desviacin muy importante a la normalidad; en particular lasgrficas no son fuertemente asimtricas, y no hay algn dato atpico. El mtodo t de Studentes adecuado. Por tanto, se calcula X 668.27 y s 192.089. Se utiliza la expresin (5.9) conn 15 y /2 0.005. De la tabla t con 14 grados de libertad, se encuentra t14, 0.005 2.977.El intervalo de confianza de 99% es 668.27 (2.977)(192.089)/15, o (520.62, 815.92).

    326 CAPTULO 5 Intervalos de confianza

    5.19Ejemplo

    1 000

    900

    800

    700

    600

    500

    400

    300

    Fuer

    za d

    e co

    rte (k

    N)

    300 400 500 600 700 800 900 1 000Fuerza de corte (kN)

    NAVIDI Cap 05 2/10/06 10:35 PM Page 326

  • El siguiente resultado de computadora (de MINITAB) presenta el intervalo de confian-za calculado en el ejemplo 5.19.

    El resultado es muy claro. La cantidad etiquetada SE Mean representa la desviacin estn-dar de la media muestral, s/n.

    En el artculo referido en el ejemplo 5.19, la fuerza compresiva cilndrica (en MPa) fue me-dida para 11 vigas. Los resultados fueron

    38.43 38.43 38.39 38.83 38.45 38.35 38.43 38.31 38.32 38.48 38.50

    Es adecuado utilizar la estadstica t de Student para construir un intervalo de confianza de95% para la media de la fuerza compresiva cilndrica? Si es as, construya el intervalo de con-fianza. Si no, explique por qu.

    SolucinComo en el ejemplo 5.19, se realizar un diagrama de caja y un diagrama de puntos de lamuestra. stos se muestran en la figura siguiente.

    Hay un dato atpico en esta muestra. La estadstica t de Student no se debe utilizar.

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas 327

    One-Sample T: Strength

    Test of mu = 0 vs not = 0

    Variable N Mean StDev SE Mean 99% CIStrength 15 668.2667 192.0891 49.59718 (520.6159, 815.9175)

    39

    38.9

    38.8

    38.7

    38.6

    38.5

    38.4

    38.3

    38.2

    Fuer

    za c

    ompr

    esiv

    a (M

    Pa)

    38.2 38.4 38.6 38.8 39Fuerza compresiva (MPa)

    5.20Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 327

  • Un ingeniero lee un informe que dice que una muestra de 11 vigas de concreto tena una fuer-za compresiva promedio de 38.45 MPa con desviacin estndar de 0.14 MPa. Se debe utili-zar la curva t para encontrar un intervalo de confianza para la media de la fuerza compresiva?

    SolucinNo. El problema es que no hay ninguna manera de saber si las mediciones provienen de unapoblacin normal. Por ejemplo, si las mediciones contienen un dato atpico (como en el ejem-plo 5.20), el intervalo de confianza sera invlido.

    La distribucin t de Student se puede utilizar para calcular intervalos de confianza deun lado. Las frmulas son anlogas a las que se utilizan con muestras grandes.

    Utilice z, no t, si se conoce a ssEn ocasiones se puede tomar una pequea muestra de una poblacin normal cuya desviacinestndar s se conoce. En estos casos, no se utiliza la curva t de Student, porque no se estaproximando a s con s. En su lugar, se utiliza la tabla z. El ejemplo 5.22 ilustra el mtodo.

    Con referencia al ejemplo 5.19. Suponga, con base en un nmero muy grande de medicionesprevias de otras vigas, que la poblacin de las fuerzas de corte es aproximadamente normal,con desviacin estndar s 180.0 kN. Encuentre un intervalo de confianza de 99% para lamedia de la fuerza de corte.

    SolucinSe calcula X 668.27. No se necesita calcular s, porque se conoce la desviacin estndar po-blacional s. Dado que se quiere un intervalo de confianza de 99%, /2 0.005. Ya que seconoce s, se utiliza z/2 z0.005, en lugar de un valor de t de Student, para calcular el inter-valo de confianza. De la tabla z se obtiene z0.005 2.58. El intervalo de confianza es 668.27 (2.58)(180.0)/15, o (548.36, 788.18).

    Es importante recordar que cuando el tamao muestral es pequeo, la poblacin debeser aproximadamente normal, se conozca o no la desviacin estndar.

    328 CAPTULO 5 Intervalos de confianza

    5.21Ejemplo

    Sea Xl, . . . , Xn una muestra aleatoria pequea de una poblacin normal con mediam. Entonces un lmite superior de confianza de nivel 100(1 )% para m es

    (5.10)

    y un lmite inferior de confianza de nivel 100(1 )% para m es

    (5.11)X tn1, sn

    X + tn1, sn

    5.22Ejemplo

    NAVIDI Cap 05 2/10/06 10:35 PM Page 328

  • En ocasiones se tiene un solo valor que se muestrea de una poblacin normal con des-viacin estndar conocida. En estos casos se puede obtener un intervalo de confianza para my deducir como un caso especial de la expresin (5.12) al hacer n 1.

    5.3 Intervalos de confianza para la media poblacional con muestras pequeas 329

    Resumen

    Sea Xl, . . . , Xn una muestra aleatoria (de cualquier tamao) de una poblacin normalcon media m. Si se conoce la desviacin estndar s, entonces un intervalo de confian-za de nivel 100(1 )% es

    (5.12)X z/2 n

    Resumen

    Sea X un solo valor que se muestrea de una poblacin normal con media m. Si se conoce la desviacin estndar s, entonces un intervalo de confianza de nivel 100(1 )% para m es

    (5.13)X z/2

    1. Determine el valor de tn l, /2 necesario para construir unintervalo de confianza de dos lados de un nivel especficocon los siguientes tamaos muestrales:

    a) Nivel 90%, tamao muestral 9. b) Nivel 95%, tamao muestral 5.c) Nivel 99%, tamao muestral 29.d ) Nivel 95%, tamao muestral 2.

    2. Determine el valor de tn l, necesario para construir un l-mite superior o inferior de confianza en cada uno de los ca-sos del ejercicio 1.

    3. Determine el nivel de confianza para un intervalo de dos la-dos que est basado en el valor dado de tn l, /2 y el tama-o muestral especfico.

    a) t 2.179, tamao muestral 13. b) t 3.365, tamao muestral 6.

    c) t 1.729, tamao muestral 20. d ) t 3.707, tamao muestral 7. e) t 3.707, tamao muestral 27.

    4. Verdadero o falso: La distribucin t de Student se puede uti-lizar para construir un intervalo de confianza para la mediade cualquier poblacin, en tanto que el tamao muestral seapequeo.

    5. El artculo Ozone for Removal of Acute Toxicity fromLogyard Run-off (M. Zenaitis y S. Duff, en Ozone Scien-ce and Engineering, 2002:83-90) presenta anlisis qumi-cos del agua que escurre de aserraderos en la ColumbiaBritnica. Incluye seis mediciones de pH para seis muestrasde agua: 5.9, 5.0, 6.5, 5.6, 5.9, 6.5. Suponiendo que stassean una muestra aleatoria de las muestras de agua de unapoblacin aproximadamente normal, encuentre un intervalode confianza de 95% para la media del pH.

    Ejercicios para la seccin 5.3

    NAVIDI Cap 05 2/10/06 10:35 PM Page 329

  • 7. El artculo An Automatic Visual System for Marble TileClassification (L. Carrino, W. Polini, y S. Turchetta, enJournal of Engineering Manufacture, 2002:1095-1108)describe una medida para la sombra del azulejo de mrmolen el cual la cantidad de luz reflejada por ste se mide enuna escala de 0-255. Un azulejo perfectamente negro no re-fleja luz alguna y mide 0, y un azulejo perfectamente blan-co medira 255. Se midi una muestra de nueve azulejosMezza Perla, con los siguientes resultados:

    204.999 206.149 202.102 207.048 203.496206.343 203.496 206.676 205.831

    Es adecuado utilizar la estadstica t de Student para cons-truir un intervalo de confianza de 95% para la media de lasombra del azulejo Mezza Perla? Si es as, hgalo. Si no,explique por qu.

    8. Una qumica hizo ocho mediciones independientes del pun-to de fusin del tungsteno. Obtuvo una media muestral de3 410.14C y una desviacin estndar muestral de 1.018C.

    a) Determine un intervalo de confianza de 95% para elpunto de fusin del tungsteno.

    b) Determine un intervalo de confianza de 98% para elpunto de fusin del tungsteno.

    c) Si las ocho mediciones hubieran sido 3 409.76, 3 409.80,3 412.66, 3 409.79, 3 409.76, 3 409.77, 3 409.80 y3 409.78 seran vlidos los intervalos de confianza quese encuentran en los incisos a) y b)? Explique.

    9. Se hacen ocho mediciones independientes del dimetro deun pistn. Las mediciones (en pulgadas) son 3.236, 3.223,3.242, 3.244, 3.228, 3.253, 3.253 y 3.230.

    a) Realice un diagrama de puntos de los ocho valores.b) Se debe utilizar la curva t para encontrar un intervalo

    de confianza de 99% para el dimetro de este pistn? Sies as, encuentre el intervalo de confianza. Si no, expli-que por qu.

    c) Se toman ocho mediciones independientes del dimetrode otro pistn. Las mediciones en este momento son

    3.295, 3.232, 3.261, 3.248, 3.289, 3.245, 3.576 y 3.201.Realice un diagrama de puntos de estos valores.

    d ) Se debe utilizar la curva t para encontrar un intervalode confianza de 95% para el dimetro de este pistn? Sies as, encuentre el intervalo de confianza. Si no, expli-que por qu.

    10. Se toman cinco mediciones de la clasificacin de octano pa-ra un tipo especial de gasolina. Los resultados (en %) son87.0, 86.0, 86.5, 88.0, 85.3. Encuentre un intervalo de con-fianza de 99% para la media de la clasificacin de octano demedia para este tipo de gasolina.

    11. Un modelo de transferencia de calor de un cilindro sumer-gido en un lquido predice que el coeficiente de transferen-cia de calor para el cilindro es constante en razones muybajas de circulacin del fluido. Se toma una muestra de diezmediciones. Los resultados, en W/m2K, son

    13.7 12.0 13.1 14.1 13.114.1 14.4 12.2 11.9 11.8

    Determine un intervalo de confianza de 95% para el coefi-ciente de transferencia de calor.

    12. Los tensioactivos son agentes qumicos, como detergentes,que bajan la tensin superficial de un lquido. Son impor-tantes en la limpieza de suelos contaminados. En un expe-rimento para determinar la eficacia de cierto mtodo pararetirar tolueno de arena, esta ltima fue lavada con un agen-te tensioactivo, y luego enjuagada con agua desionizada. Esimportante la cantidad de tolueno que sale en el enjuague.En cinco de estos experimentos, las cantidades de toluenoeliminado en el ciclo de enjuague, expresado como porcen-taje de la cantidad total originalmente presente, fueron de5.0, 4.8, 9.0, 10.0 y 7.3. Determine el intervalo de confianzade 95% para el porcentaje de tolueno eliminado en el enjua-gue. (Este ejercicio est basado en el artculo LaboratoryEvaluation of the Use of Surfactants for Ground Water Re-mediation and the Potential for Recycling Them D. Lee, R.Cody, y B. Hoyle, en Ground Water Monitoring and Reme-diation, 2001:49-57.)

    330 CAPTULO 5 Intervalos de confianza

    N Mean Median TrMean StDev SE Mean10 8.905 6.105 6.077 9.690 3.064

    Minimum Maximum Q1 Q30.512 39.920 1.967 8.103

    6. Los siguientes son resmenes estadsticos para un conjunto de datos. Sera adecuado utilizar la distribucin t de Student paraconstruir un intervalo de confianza de estos datos? Explique.

    NAVIDI Cap 05 2/10/06 10:35 PM Page 330

  • 13. En un experimento para medir la razn de absorcin de pesticidas a travs de la piel, 500 mg de uniconazol se aplic a la pielde cuatro ratas. Despus de diez horas, las cantidades absorbidas (en mg) fueron 0.5, 2.0, 1.4 y 1.1. Encuentre un intervalo deconfianza de 90% para la media de la cantidad absorbida.

    14. El siguiente resultado de MINITAB presenta un intervalo de confianza para una media poblacional.

    a) Cuntos grados de libertad tiene la distribucin t de Student?b) Utilice la informacin en el resultado, junto con la tabla t, para calcular un intervalo de confianza de 99 por ciento.

    15. El siguiente resultado de MINITAB presenta un intervalo de confianza para una media poblacional, pero algunos de los nme-ros estn borrosos y son ahora ilegibles. Complete los nmeros faltantes para (a), (b) y (c).

    16. La concentracin de monxido de carbono (CO) en una muestra de gas se mide con un espectrmetro y se encuentra que es de85 ppm. A partir de la gran experiencia con este instrumento, se cree que sus mediciones no tienen sesgos y se distribuyen nor-malmente, con incertidumbre (desviacin estndar) de 8 ppm. Determine un intervalo de confianza de 95% para la concentra-cin de CO en esta muestra.

    5.4 Intervalos de confianza para la diferencia entre dos medias

    Ahora se tratan ejemplos en los que se desea calcular la diferencia entre las medias de dos po-blaciones. Los datos constarn de dos muestras, una para cada poblacin. La idea bsica essimple. Se calcular la diferencia de las medias muestrales y la desviacin estndar de esa di-ferencia. Entonces una modificacin simple de la expresin (5.1) (de la seccin 5.1) propor-cionar el intervalo de confianza. El mtodo que se describe est basado en los resultados quese relacionan con la suma y la diferencia de dos variables aleatorias normales independientesque se presentaron en la seccin 4.5. Aqu se repasan estos resultados:

    5.4 Intervalos de confianza para la diferencia entre dos medias 331

    One-Sample T: X

    Variable N Mean StDev SE Mean 95% CIX 10 6.59635 0.11213 0.03546 (6.51613, 6.67656)

    One-Sample T: X

    Variable N Mean StDev SE Mean 99% CIX 20 2.39374 (a) 0.52640 ( (b), (c) )

    Sean X y Y independientes, con X N(mX, s2X ) y Y N(mY, s2Y). Entonces

    X Y N(mX mY, s2X s2Y) (5.14)

    X Y N(mX mY, s2X s2Y) (5.15)

    NAVIDI Cap 05 2/10/06 10:36 PM Page 331

  • Ahora se ver cmo construir un intervalo de confianza para la diferencia entre dos me-dias poblacionales. Como ejemplo, suponga que se ha estado desarrollando un diseo nuevode foco que se piensa durar ms que el diseo viejo. Una muestra aleatoria simple de 144 fo-cos nuevos tiene un tiempo de vida promedio de 578 horas y una desviacin estndar de 22horas. Una muestra aleatoria simple de 64 focos viejos tiene tiempo de vida promedio de 551 ho-ras y desviacin estndar de 33 horas. Las muestras son independientes, de tal manera que lostiempos de vida para una muestra no influyen sobre los tiempos de vida de la otra. Se quiereencontrar un intervalo de confianza de 95% para la diferencia entre la media de los tiemposde vida de los focos de los dos diseos.

    Se inicia por traducir el problema en el lenguaje estadstico. Se tiene una muestra alea-toria simple X1, . . . , X144 de los tiempos de vida de los focos nuevos. La media muestral esX 578 y la desviacin estndar muestral es sX 22. Se tiene otra muestra aleatoria simpleY1, . . . , Y64 de los tiempos de vida de los focos viejos. Esta muestra tiene una media Y 551y desviacin estndar sY 33. Las medias poblacionales y las desviaciones estndares no seconocen. Se denota a la media poblacional de los tiempos de vida de los nuevos focos por mXy la media poblacional de los focos viejos por mY. Se denota las correspondientes desviacio-nes estndares por sX y sY. Se tiene inters en la diferencia mX mY.

    Se puede construir el intervalo de confianza para mX mY determinando la distribucinX Y. Mediante el teorema del lmite central, X proviene de una distribucin normal con me-dia mX y desviacin estndar sX/144

    , y Y proviene de una distribucin normal con media mYy desviacin estndar sY/64

    . Dado que las muestras son independientes, se tiene por mediode la expresin (5.15) que la diferencia X Y proviene de una distribucin normal con me-dia mX mY y varianza s2X Y s2X /144 s2Y /64. La figura 5.13 muestra la distribucin deX Y e indica que 95% intermedio de la curva tiene un ancho 1.96sX Y.

    FIGURA 5.13 La diferencia observada X Y 27 se extrae de una distribucin normalcon media mX mY y desviacin estndar

    Al estimar las desviaciones estndares poblacionales sX y sY con las desviaciones estn-dares muestrales sX 22 y sY 33, respectivamente, se estima 4.514. Por tanto, el intervalo de confianza de 95% para mX mY es 578 551 1.96(4.514),o 27 8.85.

    pXY

    222/144+332/64

    XY =

    2X/144 + 2Y /64.

    332 CAPTULO 5 Intervalos de confianza

    95%

    mX mY 1.96sX Y mX mY 1.96sX YmX mY

    NAVIDI Cap 05 2/10/06 10:36 PM Page 332

  • La composicin qumica del suelo vara con la profundidad. El artculo Sampling Soil Waterin Sandy Soils: Comparative Analysis of Some Common Methods (M. Ahmed, M. Sharmay colaboradores, en Communications in Soil Science and Plant Analysis, 2001:1677-1686)describe anlisis qumicos del suelo tomado de una granja en Australia occidental. Se toman50 muestras a profundidades de 50 y 250 cm. A una profundidad de 50 cm, la concentracinpromedio de NO3 (en mg/l) era de 88.5 con una desviacin estndar de 49.4. A una profun-didad de 250 cm, la concentracin promedio era de 110.6 con una desviacin estndar de51.5. Determine un intervalo de confianza de 95% para la diferencia entre las concentracio-nes de NO3 a las dos profundidades.

    SolucinSean X1, . . . , X50 las concentraciones de 50 muestras tomadas a 50 cm y sean Y1, . . . , Y50 lasconcentraciones de 50 muestras tomadas a 250 cm. Entonces X 88.5, Y 110.6, sX 49.4y sY 51.5. Los tamaos muestrales son nX nY 50. Ambas muestras son grandes, por loque se puede utilizar la expresin (5.16). Como consecuencia de que se quiere un intervalo deconfianza de 95%, z/2 1.96. El intervalo de confianza de 95% para la diferencia mY mXe