Tema 4 Intervalos de confianza -...

37
ESTAD ´ ISTICA Grado en Biolog´ ıa Tema 4 Intervalos de confianza Javier C´ arcamo Departamento de Matem´ aticas Universidad Aut´ onoma de Madrid [email protected] Javier C´ arcamo Estad´ ıstica. Tema 4: Intervalos de confianza 1

Transcript of Tema 4 Intervalos de confianza -...

Page 1: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

ESTADISTICA

Grado en Biologıa

Tema 4Intervalos de confianza

Javier Carcamo

Departamento de Matematicas

Universidad Autonoma de Madrid

[email protected]

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 1

Page 2: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Estructura de este tema

• Intervalo de confianza (IC).

• IC para la media de una poblacion normal.

• Distribuciones asociadas a la normal.

• IC para poblaciones normales.

• IC para datos emparejados y normales.

• IC para proporciones.

• IC para la distribucion de Poisson.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 2

Page 3: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Intervalos de confianza

La estimacion puntual nos proporciona un valor concreto comoaproximacion de un parametro desconocido. Sin embargo, engeneral no se precisa la incertidumbre existente en dichaestimacion.

La estimacion por intervalos nos proporciona un intervalo devalores donde el parametro se puede encontrar, junto con un nivelde exactitud o fiabilidad de la estimacion, el nivel de confianza.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 3

Page 4: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Intervalos de confianza

Un intervalo de confianza (IC) para un parametro es unintervalo, calculado a partir de la muestra, que contiene alparametro con un alto grado de seguridad.

La formula general de los intervalos que vamos a estudiar es:

IC =[Estimador ∓ Margen de error]

En general, el centro del intervalo es el estimador del parametroen el que estamos interesados. Aunque esto no ocurrira en todoslos intervalos que veremos en este tema.

El margen de error depende

• de la precision del estimador utilizado,

• del grado de seguridad con el que queremos que el intervalocontenga al parametro (el nivel de confianza).

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 4

Page 5: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la media de una poblacion normal(varianza conocida)

Queremos estimar la longitud media de una especie de peces (encm.), µ. Para ello extraemos una muestra de 12 peces para la quela longitud media es x = 24,93.

Esto significa que µ ≈ 24,93. Por supuesto, µ 6= 24,93. Sitomaramos otros 12 peces distintos nos habrıa resultado unaestimacion de µ diferente.

Un IC es una forma de precisar que significa µ ≈ 24,93.

Suposicion: Suponemos que la poblacion es normal y que ladesviacion tıpica de la poblacion es conocida y vale σ = 0,25.

Como X ∼ N(µ, 0,25/√

12) = N(µ, 0,072), sabemos que valorespodrıamos esperar si tomaramos muchas muestras de tamano 12.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 5

Page 6: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la media de una poblacion normal(varianza conocida)

Como Z = X−µ0,072 ∼ N(0, 1), aproximadamente para el 95% de las

muestras de tamano 12 se cumple:

−0,072× 1,96 < X − µ < 0,072× 1,96.

NH0,1L

Área 0,95

-1.96 0 1.96

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 6

Page 7: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la media de una poblacion normal(varianza conocida)

Aproximadamente para el 95 % de las muestras de tamano 12 secumple:

−0,072× 1,96 < X − µ < 0,072× 1,96.

Las desigualdades anteriores son equivalentes a:

X − 0,072× 1,96 < µ < X + 0,072× 1,96.

Aproximadamente para el 95 % de las muestras de tamano 12 secumple que µ ∈ [X ∓ 0,1411].

Confiamos (con un nivel del 95 %) en que la unica muestra de laque disponemos sea una de las que verifican la condicion.

Decimos que [24,93∓ 0,1411] es un IC para µ de nivel 95%.Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 7

Page 8: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la media de una poblacion normal(varianza conocida)

Cuestiones:

• Con los mismos datos del ejemplo anterior calcula dosintervalos cuyos nivel de confianza sean 90 % y 99 %.

• Se ha obtenido x = 24,93 pero la muestra era de 36 peces enlugar de 12. Calcula un intervalo de nivel 95 %.

• Se ha obtenido x = 24,93 con una muestra de 36 peces peroσ = 1 en lugar de σ = 0,25. Calcula un intervalo de nivel95 %.

Formula general: Un IC con nivel de confianza 1− α para lamedia de una poblacion normal con σ conocida viene dado por:

IC1−α(µ) =

[x ∓ zα/2

σ√n

]Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 8

Page 9: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la media de una poblacion normal(varianza conocida)

IC1−α(µ) =

[x ∓ zα/2

σ√n

]Aparecen tres cantidades variables: la confianza, 1− α; eltamano muestral, n; la semiamplitud o error, E = zα/2

σ√n.

• A mayor tamano muestral, n, se reduce el intervalo deconfianza (se reduce el error).

• A mayor confianza exigida, 1− α, aumenta el intervalo deconfianza (aumenta el error).

Nota: Cualesquiera dos de estas tres cantidades permiten determinar la otra

tercera. Fijado un nivel de confianza, podemos encontrar el tamano de la

muestra necesario para que el error de la estimacion sea tan pequeno como

queramos. Esto ocurre en el resto de los intervalos de confianza que veremos.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 9

Page 10: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Interpretacion del nivel de confianza

• Si tenemos muchas realizaciones muestrales para estimar unparametro, con cada realizacion obtendremos distintosintervalos de confianza. Entre estos algunos contendran elverdadero valor del parametro y otros no.

• Al tomar muchos intervalos, la proporcion de ellos quecontiene al parametro sera aproximadamente el (1− α)100 %.

• Tecnicamente, estamos un (1− α)100 % seguros de que elprocedimiento para generar el intervalo de confianza produceun intervalo conteniendo el verdadero valor del parametro.Esta es la razon por la que se llama nivel de confianza y no deprobabilidad.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 10

Page 11: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Interpretacion del nivel de confianza

• Poblacion: normal con media µ = 0 y σ = 1.

• Se extraen 100 muestras de tamano n = 20.

• Para cada muestra se calcula x y el intervalo de confianza paraµ de nivel 95 % (suponemos varianza poblacional conocida):

IC0,95(µ) =

[x ∓ z0,025

σ√n

].

• Se representa un histograma de las 100 medias obtenidas,ası como los 100 intervalos (en verde si contienen el valor 0 yen rojo si no).

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 11

Page 12: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Interpretacion del nivel de confianza

Medias

Fre

cuen

cias

−0.4 −0.2 0.0 0.2 0.4 0.6

05

1015

2025

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5

−3−2

−10

12

3

Intervalos

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 12

Page 13: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Si σ no es conocida y la poblacion no es normal

Como no conocemos σ, sustituimos en la formula σ por suestimacion s calculada a partir de la muestra.

Debido al TCL, cuando el tamano muestral n es suficientementegrande la formula sigue dando un intervalo de confianzaaproximadamente valido:

IC1−α(µ) ≈[x ∓ zα/2

s√n

].

El nivel de confianza ya no es exactamente 1− α. Este nivel esaproximado.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 13

Page 14: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Margen de error y mınimo tamano muestral

Al radio o semiamplitud del intervalo se le suele llamar margen deerror, E . En la situacion anterior:

E = zα/2s√n.

El margen de error depende de:• El nivel de confianza deseado, a traves de zα/2. Se suele

tomar α = 0,05 lo que da z0,025 = 1,96 ≈ 2.• La heterogeneidad de la poblacion, medida a traves de s.• El tamano muestral n.

Calculo del mınimo tamano muestral: Fijado un nivel deconfianza 1− α, si queremos un error menor que una cantidadcualquiera E , necesitaremos un tamano muestral:

n ≥(szα/2

E

)2

.

Nota: Un calculo similar se podra efectuar para los diferentesintervalos que veremos en este tema.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 14

Page 15: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Si σ no es conocida y la poblacion es normal

• Cuando la poblacion es normal y σ no es conocida, es posibledar un IC exacto incluso cuando el tamano muestral espequeno.

• Para ello, basta mirar en unas tablas distintas. En lugar debuscar zα/2 en las tablas de la normal, buscamos tn−1,α/2 enlas tablas de la distribucion t de Student. La formula del ICqueda

IC1−α(µ) =

[x ∓ tn−1,α/2

s√n

].

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 15

Page 16: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Distribucion t de Student

• La distribucion t de Student con n − 1 grados de libertad(tn−1) es la distribucion de

X − µ

S/√

n

en una poblacion normal.

• La forma de la densidad de tn es similar a la de la normal. Essimetrica alrededor de cero.

• Sin embargo, la distribucion tn da mas probabilidad a valoreslejanos al centro.

• Si n es grande tn ∼= N(0, 1).

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 16

Page 17: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Densidad de la distribucion t-Student

−5 0 50

0.1

0.2

0.3

0.4

Densidad de la t

N(0,1)t5

t2

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 17

Page 18: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Tablas de la distribucion t-Student

3

TABLA 2: DISTRIBUCIÓN t DE STUDENT

Puntos de porcentaje de la distr ibución t

D r

0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005

1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578 2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600 3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924 4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610 5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869 6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959 7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408 8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041 9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781

10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587

11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437 12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318 13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221 14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140 15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015 17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965 18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922 19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883 20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850

21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819 22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792 23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768 24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745 25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725

26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707 27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689 28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674 29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660 30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646

40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551 60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460 120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373

� 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,290

Ejemplo Para

� = 10 grados de

libertad: P[ t > 1.812] = 0.05 P[ t < -1.812] = 0.05

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 18

Page 19: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Cuestiones

Busca en las tablas de la distribucion t de Student un valor de cque verifique:

• Si tenemos n = 15 datos, la probabilidad de

X − µ

S/√

n> c

es 0,025.

• Si tenemos n = 15 datos, la probabilidad de

X − µ

S/√

n< c

es 0,75.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 19

Page 20: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Un ejemplo resuelto

El envenenamiento por DDT causa temblores y convulsiones. Enun estudio se ha administrado una dosis de DDT a 4 ratones y seha medido posteriormente en cada uno el periodo absolutamenterefractario, es decir, el tiempo que tardan sus nervios enrecuperarse tras un estımulo. Las 4 medidas en milisegundos son:

1,7 1,6 1,8 1,9

(a) Estima el periodo absolutamente refractario medio µ para toda la poblacion deratones de la misma cepa sujeta al mismo tratamiento con DDT.

(b) Calcula una estimacion de la desviacion tıpica del periodo absolutamenterefractario en la poblacion de ratones.

(c) Calcula un intervalo de confianza para µ con nivel de confianza 90 %. (Sesupone normalidad).

(d) Calcula otro intervalo, pero ahora con un nivel del 95 %.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 20

Page 21: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Un ejemplo resuelto

(a) La estimacion de µ es la media muestral:

x =1,7 + 1,6 + 1,8 + 1,9

4= 1,75.

(b) Una estimacion de la varianza poblacional es la cuasi-varianzamuestral:

s2 =(1,7− 1,75)2 + (1,6− 1,75)2 + (1,8− 1,75)2 + (1,9− 1,75)2

3

Por lo tanto s2 ≈ 0,017 y s =√

0,017 ≈ 0,13.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 21

Page 22: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Un ejemplo resuelto

(c) Como t3,0,05 = 2,353, un I.C. con nivel de confianza1− α = 0,90 es

IC0,90(µ) = [1,75∓ 2,353× 0,065] = [1,597 , 1,903].

Podemos afirmar que 1,597 < µ < 1,903 con un nivel de confianzadel 90 %.

(d) Como t3,0,025 = 3,182, un I.C. con nivel de confianza1− α = 0,95 es

IC0,95(µ) = [1,75∓ 3,182× 0,065] = [1,543 , 1,957].

Podemos afirmar que 1,543 < µ < 1,957 con un nivel de confianzadel 95 %.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 22

Page 23: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Cuestiones: IC para la media de una poblacion normal

• En un informe leemos que un intervalo de confianza para lapuntuacion media de los estudiantes espanoles en un test deingles es (267,8, 276,2) con una confianza del 95 %.

(a) Verdadero o falso: El 95 % de los estudiantes han tenidopuntuaciones entre 267,8 y 276,2

(b) ¿Cual fue la puntuacion media de los estudiantes de la muestrautilizada para calcular el intervalo?

(c) ¿Es correcto afirmar que la puntuacion media esta en elintervalo (267,8, 276,2)?

(d) ¿Es correcto decir que la puntuacion media pertenece alintervalo (267,8, 276,2) con probabilidad 0,95?

• Mirando en las tablas de la distribucion t-Student, determinaun valor c tal que la probabilidad de que una distribucionnormal estandar sea mayor que c es 0,2.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 23

Page 24: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Distribuciones asociadas a la normal

Para encontrar los intervalos de confianza para otros parametros deinteres bajo normalidad es necesario conocer algunas distribucionesde probabilidad asociadas a la normal.

• La distribucion χ2 de Pearson.

• La distribucion t de Student, que ya hemos visto.

• La distribucion F de Fisher

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 24

Page 25: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

La distribucion χ2 de Pearson

La distribucion χ2 de Pearson con n grados de libertad es ladistribucion de una variable aleatoria χ2

n con densidad como en eldibujo de abajo:

0 2 4 6 80

0.2

0.4

0.6

0.8

1

Densidad de la χ2n

χ21

χ22

χ23

χ24

χ25

Las probabilidades de la distribucion χ2 estan tabuladas.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 25

Page 26: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

La distribucion F de Fisher

F de Fisher con m y n grados de libertad:

Fm,n =1mχ2

m1nχ2

n

.

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7Densidad de la F

F5,3

F4,6

Observacion: Para el uso de las tablas hay que tener en cuentaque

Fm;n;1−α =1

Fn;m;α.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 26

Page 27: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC en poblaciones normales

Disponemos de una muestra aleatoria x1, . . . , xn de una poblacionnormal X ∼ N(µ, σ). Los intervalos de confianza para losparametros µ y σ2 son:

• Si σ es conocido, el intervalo para µ es:

IC1−α(µ) =

[x ∓ zα/2

σ√n

].

• Si σ es desconocido, el intervalo para µ es:

IC1−α(µ) =

[x ∓ tn−1,α/2

s√n

].

• El intervalo para σ2 es:

IC1−α(σ2) =

[(n − 1)s2

χ2n−1;α/2

,(n − 1)s2

χ2n−1;1−α/2

,

].

Nota: En este ultimo caso, el valor de la estimacion de σ2 noes el centro del intervalo de confianza.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 27

Page 28: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC en poblaciones normales

Sean x1, . . . , xm e y1, . . . , yn dos muestras independientes deX ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) respectivamente. Entonces, losintervalos de confianza para la diferencia de las medias son:

• Si σ1 y σ2 son conocido, el intervalo para µ1 − µ2 es:

IC1−α(µ1 − µ2) =

[(x − y)∓ zα/2

√σ2

1

m+

σ22

n

].

• Si σ1 = σ2 desconocido, el intervalo para µ1 − µ2 es:

IC1−α(µ1 − µ2) =

[(x − y)∓ tm+n−2;α/2 sp

√1

m+

1

n

],

donde

s2p =

(m − 1)s21 + (n − 1)s2

2

m + n − 2

es una media ponderada de las cuasivarianzas muestrales.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 28

Page 29: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC en poblaciones normales

Sean x1, . . . , xm e y1, . . . , yn dos muestras independientes deX ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) respectivamente. Entonces, losintervalos de confianza para la diferencia de las medias son:

• Si σ1 y σ2 son desconocidas, el intervalo para µ1 − µ2 es:

IC1−α(µ1 − µ2) =

[(x − y)∓ zα/2 tf ;α/2

√s21

m+

s22

n

],

donde f es el entero mas proximo a

(s21

m +s22n

)2

(s21/m)2

m−1 +(s2

2/n)2

n−1

.

• El intervalo para el cociente de varianzas σ21/σ2

2 es:

IC1−α

(σ2

1

σ22

)=

[s21/s2

2

Fm−1;n−1;α/2,

s21/s2

2

Fm−1;n−1;1−α/2

].

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 29

Page 30: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Un ejemplo en una poblacion normal

Ejemplo: Se quiere comparar la grasa corporal (en kg.) entrenadadoras olımpicas y corredoras olımpicas. Se observan lossiguientes datos:

Corredoras Nadadoras11.2 7.6 14.1 12.710.1 7.3 15.1 13.79.4 6.9 11.4 11.99.2 5.5 14.3 10.78.3 5.0 9.2 8.78.2 3.7

Suponiendo que la distribucion de las variables observadas esnormal con la misma varianza, calcular un intervalo de confianza al95 % para la diferencia media de grasa corporal entre ambos tiposde deportistas.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 30

Page 31: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Un ejemplo en una poblacion normal

Ejemplo (cont.): Suponiendo que las distribuciones de las dosvariables observadas son normales con distintas medias y distintasvarianzas, calcular un intervalo de confianza al 90 % para elcociente de las varianzas.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 31

Page 32: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Datos emparejados (y normales)

Sea (X1,Y1), . . . , (Xn,Yn) una muestra aleatoria de (X ,Y ) dondeX e Y no son independientes, pero los pares (Xi ,Yi ) sonindependientes entre sı.

Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos que ladiferencia D = X − Y ∼ N(µD = µ1 − µ2, σD). Entonces,

D1 = X1 − Y1, . . . ,Dn = Xn − Yn es una muestra aleatoria de D.

Podemos construir intervalos de confianza para µD = µ1 − µ2 ypara σD como se indica en las transparencias anteriores.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 32

Page 33: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

Ejemplo (Ensayo clınico cruzado): Se quieren comparar losefectos X de un nuevo medicamento con Y , los de otro yacomercializado. Se administran ambos a 14 personas coninsuficiencia respiratoria, asignando aleatoriamente a cada pacienteun tratamiento, y manteniendolo durante un mes. Luego se le da eltratamiento alternativo durante otro mes. En la cuarta semana decada tratamiento se observa la FEV1 (forced expiratory volume), elvolumen de aire que un paciente expulsa en un segundo, tras unainhalacion profunda.

Paciente X Y D Paciente X Y D1 2.9 3.9 -1.0 8 3.9 2.4 1.52 4.0 3.9 0.1 9 2.5 3.6 -1.13 3.4 3.3 0.1 10 6.5 2.1 4.44 3.2 4.3 -1.1 11 5.5 4.0 1.55 3.8 3.2 0.6 12 4.0 3.9 0.16 5.2 3.5 1.7 13 5.3 4.0 1.37 3.9 2.7 1.2 14 4.3 2.3 2.0

Calcular un intervalo de confianza al 90 % para la diferencia mediade FEV1 con ambos medicamentos.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 33

Page 34: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la proporcion p

Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X∼Bernoulli(p).Entonces, por el TCL,

Xaprox∼ N

(p,

√p(1− p)

n

)' N

(p,

√p(1− p)

n

),

siendo p = X .

IC1−α(p) ≈

[x ∓ zα/2

√x(1− x)

n

](aproximadamente,para n grande (n ≥ 30))

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 34

Page 35: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para la diferencia de proporciones p1 − p2

Sean X1, . . . ,Xm e Y1, . . . ,Yn muestras aleatorias independientesde X ∼ Bernoulli(p1) e Y ∼ Bernoulli(p2) respectivamente.Entonces

Xaprox∼ N

(p1,

√p1(1− p1)

m

)e Y

aprox∼ N

(p2,

√p2(1− p2)

n

),

siendo p1 = X y p2 = Y . El intervalo para la diferencia deproporciones p1 − p2 es:

IC1−α(p1 − p2) ≈

[(x − y)∓ zα/2

√x(1− x)

m+

y(1− y)

n

]

(aproximadamente, para m y n grandes).

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 35

Page 36: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para el parametro λ de una Poisson

Sea X1, . . . ,Xn una muestra aleatoria de X ∼ P(λ). Entonces, porel TCL,

Xaprox∼ N

(λ,

√λ

n

)' N

λ,

√λ

n

,

donde λ = X . De aquı se puede deducir un IC de confianzaaproximada 1− α,

⇒ IC1−α(λ) ≈

[x ∓ zα/2

√x

n

](aproximadamente,para n grande)

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 36

Page 37: Tema 4 Intervalos de confianza - matematicas.uam.esmatematicas.uam.es/~jesus.gonzalo/Est/Tema-BIO4.pdf · IC para la media de una poblaci´on normal (varianza conocida) Queremos estimar

IC para el parametro λ de una Poisson

Ejemplo: Lord Ernest Rutherford, el famoso fısico britanico deprincipios del siglo XX, se dedico a observar desintegracionesradiactivas en su laboratorio. Rutherford tomo n = 2608 intervalosde 7.5 segundos cada uno y contabilizo el numero X de partıculasque alcanzaban un contador en cada uno de esos intervalos. Susobservaciones fueron

Num. de partıculaspor intervalo detiempo (x)

0 1 2 3 4 5 6 7 8 9 10

Num. de intervalosde tiempo con xpartıculas observadas

57 203 383 525 532 408 273 139 45 27 16

Suponiendo que X sigue una distribucion de Poisson(λ), calcularun intervalo de confianza al 95% para λ.

Javier Carcamo Estadıstica. Tema 4: Intervalos de confianza 37