INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

22
! 2 ! 2 +1.96sd ! 2 -sd ! 2 -1.96sd ! 2 +sd 2.5% 2.5% INTERVALOS DE CONFIANZA densidad de b 2 condicional en que ! 2 = ! 2 sea verdadero 0 hipótesis nula H 0 : ! 2 = ! 2 0 0 0 0 0 0 Si el nivel de significación es 5%, la estimación obtenida (círculo pequeño) no nos permitiría rechazar la hipótesis nula. PREGUNTA: ¿QUÉ MIDE EL NIVEL DE SIGNIFICACIÓN? 1 región de aceptación para b 2 2.5% 2.5% Intervalos de Confianza densidad de b 2 condicional en que ! 2 = ! 2 sea verdadero 0 hipótesis nula H 0 : ! 2 = ! 2 0 ! 2 ! 2 +1.96sd ! 2 -sd ! 2 -1.96sd ! 2 +sd 0 0 0 0 0 2

Transcript of INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Page 1: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

!2 !2+1.96sd !2-sd !2-1.96sd !2+sd

2.5% 2.5%

INTERVALOS DE CONFIANZA

densidad de b2 condicional en que !2 = !2 sea verdadero

0 hipótesis nula H0: !2 = !2

0

0 0 0 0 0

Si el nivel de significación es 5%, la estimación obtenida (círculo pequeño) no nos permitiría rechazar la hipótesis nula. PREGUNTA: ¿QUÉ MIDE EL NIVEL DE SIGNIFICACIÓN? 1

región de aceptación para b2

2.5% 2.5%

Intervalos de Confianza

densidad de b2 condicional en que !2 = !2 sea verdadero

0 hipótesis nula H0: !2 = !2

0

!2 !2+1.96sd !2-sd !2-1.96sd !2+sd 0 0 0 0 0

2

Page 2: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Empecemos al revés: dado un valor estimado del parámetro, ¿cómo sabemos si rechazamos o no la hipótesis nula al nivel de significación del 5%?

Intervalos de Confianza

b2

3

b2

densidad de b2 condicional en que !2 = !2 sea verdadero

hipótesis nula H0: !2 = !2

Intervalos de Confianza

0 0

!2 0

H0: !2 = !2 .

Lo que hacemos es calcular la distribución suponiendo que la hipótesis nula es cierta.

0

4

Page 3: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2 condicional en que !2 = !2 sea verdadero

hipótesis nula H0: !2 = !2

Intervalos de Confianza

0 0

!2 !2+1.96sd !2-sd !2-1.96sd 0 0 0 0

Es decir, dibujamos la distribución de b2 condicional en que H0: !2 = !2 sea verdadero.

0

b2

Pero para ello, necesitamos conocer la desviación típica de la distribución. En un primer momento lo asumimos conocido. En este dibujo se observa que la hipótesis nula no se contradice con nuestra estimación. 5

Supongamos otra hipótesis nula

Intervalos de Confianza

hipótesis nula H0: !2 = !2

b2 !2 1

1

6

Page 4: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Habiendo dibujado la densidad de b2 condicional en que esta hipótesis sea verdadera, es posible observar qué hipótesis son compatibles con la estimación.

Intervalos de Confianza

!2 !2+1.96sd !2+sd !2-1.96sd 1 1 1 1 b2

hipótesis nula H0: !2 = !2

densidad de b2 condicional en que !2 = !2 sea verdadero

1 1

7

Aquí hay otra hipótesis nula.

Intervalos de Confianza

b2

hipótesis nula H0: !2 = !2

!2 2

2

8

Page 5: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

pero no es compatible con nuestra estimación.

Intervalos de Confianza

b2

hipótesis nula H0: !2 = !2

!2-sd !2-1.96sd !2+sd 2 2 !2 2 2

densidad de b2 condicional en que !2 = !2 sea verdadero

2 2

9

Existe por tanto un valor máximo de !2 compatible con nuestra estimación.

Intervalos de Confianza

b2

hipótesis nula H0: !2 = !2

!2 !2 + 1.96sd !2 - sd !2 + sd max max max max

densidad de b2 condicional en que !2 = !2 sea verdadero

max max

Llamaremos a éste !2. max

10

Page 6: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Intervalos de Confianza

b2

hipótesis nula H0: !2 = !2

max

!2 !2 + 1.96sd !2 - sd !2 + sd max max max max

densidad de b2 condicional en que !2 = !2 sea verdadero

max

rechazar si !2 > !2

b2 = !2 - 1.96 sd

!2 = b2 + 1.96 sd

rechazar si !2 > b2 + 1.96 sd

max max

Para rechazar la hipótesis, b2 debe caer en el área del 2.5% de la cola, por lo que debería ser 1.96 desviaciones típicas menor que !2

max.

max

11

densidad de b2 (1) condicional en que !2 = !2 sea verdadero (2) condicional en que !2 = !2 sea verdadero

Intervalos de Confianza

b2 !2 !2 -sd !2 -1.96sd !2 +sd min min min min

min

max

Este diagrama muestra los valores posibles de !2, conjuntamente con las distribuciones asociadas de b2.

!2 !2 + 1.96sd !2 - sd !2 + sd max max max max

(1) (2)

12

Page 7: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Intervalos de Confianza

b2 !2 !2 -sd !2 -1.96sd !2 +sd min min min min

!2 !2 + 1.96sd !2 - sd !2 + sd max max max max

(1) (2)

Cualquier valor en el intervalo!2min - !2

max sería compatible con el valor estimado para esta muestra. Este es el intevalo de confianza al 95% .

rechazar si !2 > !2 = b2 + 1.96 sd rechazar si !2 < !2 = b2 - 1.96 sd

95% intervalo de confianza: b2 - 1.96 sd < !2 < b2 + 1.96 sd

max min

13

Intervalos de Confianza

Desviación típica conocida

95% intervalo de confianza b2 - 1.96 sd < !2 < b2 + 1.96 sd 99% intervalo de confianza b2 - 2.58 sd < !2 < b2 + 2.58 sd

Desviación típica estimada

95% intervalo de confianza b2 - tcrit (5%) se < !2 < b2 + tcrit (5%) se 99% intervalo de confianza b2 - tcrit (1%) se < !2 < b2 + tcrit (1%) se

Cuando la desviación típica no es conocida, es necesario estimarla y la distribución ya no será una normal, sino una t.

De la misma manera, usando un test de significación al 1% para identificar las hipótesis compatibles con el valor estimado, es posible construir un intervalo al 99%.

!2min y !2

max estarán ahora a 2.58 desviaciones típicas a la derecha y a la izquierda de b2, respectivamente.

14

Page 8: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

CONTRASTES DE UNA COLA

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

!2 puede tomar dos posibles valores, !20, o !2

1.

15

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Un ejemplo es la duración de las baterías de un cargamento que hay que controlar, que pueden ser de larga o corta duración. La hipótesis nula es que son de CORTA duración.

16

Page 9: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Supongamos que el resultado de una muestra da lugar al punto azul. Dado este resultado no rechazaríamos la hipótesis nula.

17

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

En este caso rechazaríamos la hipótesis nula.

18

Page 10: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

O en este caso nos quedaríamos con la nula.

19

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Pero un resultado como éste nos introduce en un problema. El primer impulso es rechazar H0, dado que está en la región de rechazo H0.

20

Page 11: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Observad que este resultado muestral hace que rechazemos H0, pero contradice H1 mucho más.

21

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

La probabilidad de obtener un resultado como éste es mucho menor bajo H1 que bajo H0.

22

Page 12: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Por esta razón, debería eliminarse la cola baja de la zona de rechazo para H0. Es decir, solamente debería utilizarse la cola derecha como zona de rechazo.

23

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Por lo tanto, la probabilidad del Error Tipo I es 2.5%, el nivel de significación.

24

Page 13: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Sin embargo, es posible construir un contraste al 5% extendiendo la cola de rechazo, que empezará a 1.645 desviaciones típicas de la media. La razón que está detrás de un nivel del 5% es el intercambio entre el error Tipo I y Tipo II.

5%

25

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

5%

Observad que la lógica de eliminar la cola de la izquierda depende de que !21 sea mayor

que !20. Esto es generalizable al caso en que la hipótesis alternativa establece simplemente

que !2 es mayor que !20. Naturalmente, la hipótesis alternativa estará justificada por

cuestiones de índole económico o empírico. 26

Page 14: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 < !2

!2 +2sd !2 -2sd

0

0

0 0 0 0 0 1

Algunas veces, dada la hipótesis nula H0: !2 = !20, a partir de la teoría económica o

experiencia previa se podría eliminar la posibilidad de que !2 sea mayor que !20.

En este caso utilizaríamos un contraste a una sola cola, pero la cola izquierda. 27

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Empezaremos asumiendo que !2 toma solamente dos valores, !20 y !2

1. Supongamos que se realiza un contraste de dos colas al 5% de significatividad. Por tanto, si H0 es verdad, hay un riesgo del 5% de cometer el error tipo I.

Veamos ahora cómo un contraste a una sola cola mejora el intercambio del riesgo entre el error tipo I y II.

28

Page 15: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

2.5% 2.5%

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

Observar que bajo el error tipo II, la nula es falsa y alternativa es verdadera, por lo que la distribución sería la de la derecha. El área gris claro da la probabilidad de una estimación que esté en el area de aceptación de H0, condicional a que H1 es verdadera.

Sin embargo, si H0 fuera falsa, la probabilidad de no rechazarla cometiendo el error tipo II sería el área gris claro de la figura.

29

densidad de b2

!2 !2

Contrastes de una cola

!2 +sd !2 -sd

hipótesis nula: H0 : !2 = !2

hipótesis alternativa: H1 : !2 = !2

!2 +2sd !2 -2sd

0

1

0 0 0 0 0 1

5%

A pesar de ello, realizando un contraste de una cola con seguridad se disminuye el error tipo II.

Cuando la alternativa es H1: !2 > !20 o H1: !2 < !2

0, que es el caso más general, no es posible hacer el gráfico.

Por tanto, no se ha aumentado la probabilidad del error tipo I y se ha logrado reducir la probabilidad de cometer el error tipo II.

Sin embargo, el error Tipo II es menor que en el caso de las dos colas.

30

Page 16: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Interpretar esta Hipótesis Nula: ¿qué significa suponer que !2 = 0 ?.

Contrastes de una cola

modelo: Y = !1 + !2X + u

hipótesis nula: H0 : !2 = 0

31

densidad de b2

0

Contrastes de una cola

2.5% 2.5%

hipótesis nula: H0 : !2 = 0

hipótesis alternativa: H1 : !2 = 0

rechazar H0 rechazar H0 no rechazar H0

1.96 sd -1.96 sd

32

Page 17: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

densidad de b2

0

Contrastes de una cola

rechazar H0 no rechazar H0

1.65 sd

5%

hipótesis nula: H0 : !2 = 0

hipótesis alternativa: H1 : !2 > 0

Esto haría más factible el rechazo de H0 y por tanto, la demostración de que Y no está afectado por variaciones de X.

Naturalmente, si es posible justificar la utilización de un contraste de una sola cola, por ejemplo, con H1: !2 > 0, la zona de rechazo estaría a 1.65 sd por encima de cero.

33

densidad de b2

0

Contrastes de una cola

rechazar H0 no rechazar H0

1.65 sd

5%

hipótesis nula: H0 : !2 = 0

hipótesis alternativa: H1 : !2 > 0

El valor crítico de un contraste de una cola es siempre menor que de dos colas, por tanto, el error tipo II será menor.

Asumiremos que la desviación típica de b2 es conocida y que la distribución es normal. En la práctica, la desviación típica debe ser estimada y por tanto, es necesario utilizar una distribución t. A pesar de ello, el análisis es el mismo y por eso se opta por esta forma más sencilla.

34

Page 18: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

!

!

-

- = =

2

2 2

) (

) ˆ (

Y Y

Y Y

SCT

SCE R i

i

SCR SCE SCT + =

R2, es una medida de bondad del ajuste: pero es un estadístico, tiene una distribución y cabría preguntarse si podemos contrastar la bondad de dicho ajuste.

Contraste F de Bondad de Ajuste

35

!

!

-

- = =

2

2 2

) (

) ˆ (

Y Y

Y Y

SCT

SCE R i

i

SCR SCE SCT + =

Contraste F de Bondad de Ajuste

La nula en este caso es si el modelo tiene algún poder explicativo. Dado que sólo existe una variable explicativa, el contraste es equivalente a preguntarse si dicha variable explica los movimientos de la variable dependiente. 36

Page 19: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

!

!

-

- = =

2

2 2

) (

) ˆ (

Y Y

Y Y

SCT

SCE R i

i

) /( ) 1 (

) 1 /(

) (

) 1 (

) /(

) 1 /( ) , 1 ( 2

2

k n R

k R

k n TSS

RSS

k TSS

ESS

k n SCR

k SCE k n k F - -

- =

-

-

= -

- = - -

Contraste F de Bondad de Ajuste

El contraste F de bondad de ajuste se define en base al número k de parámetros estimados en el modelo: en el caso de una regresión simple, serían dos; n es el número de observaciones en el modelo. 37

!

!

-

- = =

2

2 2

) (

) ˆ (

Y Y

Y Y

SCT

SCE R i

i

SCR SCE SCT + =

) /( ) 1 (

) 1 /(

) (

) 1 (

) /(

) 1 /( ) , 1 ( 2

2

k n R

k R

k n SCT

SCR

k SCT

SCE

k n SCR

k SCE k n k F - -

- =

-

-

= -

- = - -

Contraste F de Bondad de Ajuste

F es una función monótona del R2.

38

Page 20: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Contraste F de Bondad de Ajuste

R2

F

39

Contraste F de Bondad de Ajuste

El estadístico F tendrá una distribución bajo la nula y, por tanto, podremos construirnos una región de rechazo. Por ejemplo, es posible construirse un contraste al 5%. Observar que el valor crítico dependerá del número de observaciones y variables explicativas.

R2

F

40

Page 21: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

!

!

-

- = =

2

2 2

) (

) ˆ (

Y Y

Y Y

SCT

SCE R i

i

SCR SCE SCT + =

Contraste F de Bondad de Ajuste

Observar que en el caso de la regresión simple, el contraste F es equivalente al t. La duda es si estos contrastes, al ser diferentes, pueden llevarnos a conclusiones contradictorias.

41

Contraste F de Bondad de Ajuste

Aquí demostramos que la respuesta es negativa, ya que el contraste F no es más que el cuadrado del contraste t. 42

Page 22: INTERVALOS DE CONFIANZA densidad de b2 hipótesis nula 0 ...

Contraste F de Bondad de Ajuste

43

Contraste F de Bondad de Ajuste

. reg Ingresos S

Source | SS df MS Number of obs = 570 ---------+------------------------------ F( 1, 568) = 65.64 Model | 3977.38016 1 3977.38016 Prob > F = 0.0000 Residual | 34419.6569 568 60.5979875 R-squared = 0.1036 ---------+------------------------------ Adj R-squared = 0.1020 Total | 38397.0371 569 67.4816117 Root MSE = 7.7845

------------------------------------------------------------------------------ Ingresos | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------- S | 1.073055 .1324501 8.102 0.000 .8129028 1.333206 _cons | -1.391004 1.820305 -0.764 0.445 -4.966354 2.184347 ------------------------------------------------------------------------------

Esta es la salida de los salarios por hora condicional a los años de estudio para una muestra de 570 trabajadores. 44