Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...

Análise da Regressão múltipla: MQO Assintótico

Capítulo 5 do WooldridgeCapítulo 5 do Wooldridge

Análise da Regressão múltipla: MQO Assintótico

y = β + β x + β x + . . . β x + uy = β0 + β1x1 + β2x2 + . . . βkxk + u

3. Propriedades assintóticasAntes, propriedades sobre amostras finitas de tamanho n

Inferência em grandes amostras

Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses.

3

testes de hipóteses.Essa normalidade exata vem da hipótese de os erros terem distribuição normal.Essa hipótese de erros normais implica que a distribuição de y, dados x’s, também é normal.

Inferência em grandes amostras (cont.)

Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira.Uma variável aleatória y que tenha distribuição normal deverá ter distribuição

4

distribuição normal deverá ter distribuição simétrica em torno de sua média.Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica.


Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA.

5

Variável dependente y: prateAnálise da variável dependente no gretl- Histograma - Estatísticas descritivas

Ver: estatísticas descritivas

Estatísticas Descritivas, usando as observações 1 - 1534para a variável 'prate' (1534 observações

válidas)

Média 87,363

6

Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex. 2,2584

Histograma de prate (variável, gráfico de frequência simples)

0.4

0.5

Fre

qu

ën

cia

re

lati

va

7 0

0.1

0.2

0.3

0 20 40 60 80 100

Fre

qu

ën

cia

re

lati

va

prate

Histograma de prate (variável, gráfico de frequência simples)

0.1

0.12

0.14prate

N(87,363 16,717)Estatística de teste para normalidade:

Qui-quadrado(2) = 1159,437 p-valor = 0,00000

8 0

0.02

0.04

0.06

0.08

0 20 40 60 80 100 120 140

De

nsid

ad

e


A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência.No exemplo demonstrado, devemos

9

No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes???NÃO!!!

Teorema do Limite Central

Baseado no teorema do limite central,

podemos mostrar que os estimadores de MQO

são assintoticamente normais.

Ou seja, para amostras grandes, eles seguem

10

Ou seja, para amostras grandes, eles seguem

uma distribuição normal aproximada.

A normalidade assintótica implica que

P(Z<z)→Φ(z) quando n →∞, ou seja, que

P(Z<z) ≈ Φ(z)

Teorema do Limite Central

O teorema central do limite diz que a

média amostral padronizada de qualquer

população com média µ e variância σ2 é

assintoticamente ~N(0,1), ou:

11

assintoticamente ~N(0,1), ou:

( )1,0~ N

n

YZ

aY

σµ−

=

Normalidade assintótica

( ) ( )( )

,,0Normal ~ˆ (i)

Markov,-Gauss de hipóteses as Sob

22j

a

jj an σββ −

∑

12

( )

( ) ( ) ( )1,0Normal ~ˆˆ (iii)

de econsistentestimador um é ˆ (ii)

ˆplim onde

22

212

a

jjj

ijj

ep

rna

βββ

σσ

−

= ∑−

Normalidade assintótica(cont.)

Como a distribuição t se aproxima da normal, dizemos que:

( ) ( )~ˆˆ −a

tep βββ

13

( ) ( ) 1~ˆˆ−−− kn

a

jjj tep βββ

Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média

condicional zero.

Como é feita a inferência??Os testes t e a construção dos intervalos de confiança são realizados exatamente damesma forma anterior, quandoconsiderávamos as hipóteses do ModeloLinear Clássico.

14

Linear Clássico.

( ) ( ) 1~ˆˆ−−− kn

a

jjj tep βββ

Como decidir se o seu tamanho de amostra é suficiente??

Se o tamanho da amostra é grande (pelo menos1500 observações, p.e.), isto é suficiente parausarmos o Teorema do limite central.Alguns econometristas acham que n = 30 é um tamanho satisfatório.

15

tamanho satisfatório.A qualidade da aproximação também dependedos graus de liberdade.Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmentenecessário para usar a aproximação t.

Outra estatística: estatística do multiplicador de Lagrange (LM)

Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F.A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as

16

A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão.Também chamada de estatística de escore.A estatística LM também é chamada de estatística nR2.

Estatística LM (cont)Suponha que tenhamos o modelo

y = β0 + β1x1 + β2x2 + . . . βkxk + u

A hipótese nula seja:

17

A hipótese nula seja:H0: βk-q+1 = 0, ... , βk = 0

q restrições de exclusão no modelo

A estatística LM existe apenas a estimação do modelo restrito

Estatística LM (cont)

~~...

~~110 qkqk uxxy ++++= −−βββ

18

regressão. desta é onde ,

) variáveisas todasm (i.e., ,...,, em ~de regressão a faça e ,~ resíduos, os pegue Agora,

22

21

uu

k

RnRLM

exxxu

u

=


Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis

19

correlacionado com cada uma dessas variáveis excluídas.Ou seja, o deve estar próximo de zero.Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido?

2uR


2

2

2~

q

q

q

a

de value-p o calcular apenas

ou , ãodistribuiç uma de ,c crítico valor

o escolher podemos então ;LM

χ

χ

χ

20

q de value-p o calcular apenas χ

Com uma amostra grande, o resultado dos testes F e LM devem ser similares.

Estatística LM: exemploModelo do crime (banco de dados: crime1.raw, dados de 2.725 homens nascidos em 1960 ou 1961 na Califórnia):

Variável dependente: narr86 – número de vezes que um homem foi preso

Variáveis independentes:- pcnv: proporção de prisões anteriores que levaram à

21

- pcnv: proporção de prisões anteriores que levaram à condenação.

- avgsen: sentença média cumprida de condenaçõespassadas.

- tottime: tempo total que o homem passou na prisão em1986 desde que atingiu a idade de 18 anos.

- Ptime86: meses passados na prisão em 1986.- qemp86: número de trimestres, em 1986, durante os quaiso homem esteve legalmente empregado.

Estatística LM: exemploTeste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados.

Ho: β2=β3=0

22

Ho: β2=β3=0

Passo 1: estimar a regressão sem estas variáveis.

Passo 2: regredir os resíduos desta regressão em todas variáveis independentes.

Modelo irrestrito

uqemptime

tottimeavgsenpcnvnarr

+++

++++=

86.86.

...86

54

3210

ββ

ββββ

Modelo 1: Estimativas OLS usando as 2725 observações 1-2725

Variável dependente: narr86

Variável Coeficiente Erro Padrão estatística-t p-valor

const 0,706061 0,0331524 21,2974 <0,00001 ***

pcnv -0,151225 0,040855 -3,7015 0,00022 ***

23

avgsen -0,00704866 0,0124122 -0,5679 0,57016

tottime 0,0120953 0,00957684 1,2630 0,20671

ptime86 -0,0392585 0,00891659 -4,4029 0,00001 ***

qemp86 -0,103091 0,0103972 -9,9152 <0,00001 ***

Média da variável dependente = 0,404404

Desvio padrão da variável dependente = 0,859077

Soma dos resíduos quadrados = 1924,39

Erro padrão dos resíduos = 0,841284

R2 não-ajustado = 0,0427554

R2 ajustado = 0,0409951

Estatística-F (5, 2719) = 24,2889 (p-valor < 0,00001)

Modelo restrito (passo 1)uqemptimepcnvnarr ++++= 86.86..86 5410 ββββ


Variável dependente: narr86


const 0,711772 0,0330066 21,5645 <0,00001 ***

pcnv -0,149927 0,0408653 -3,6688 0,00025 ***

24

pcnv -0,149927 0,0408653 -3,6688 0,00025 ***

ptime86 -0,0344199 0,008591 -4,0065 0,00006 ***

qemp86 -0,104113 0,0103877 -10,0227 <0,00001 ***

Média da variável dependente = 0,404404





R2 ajustado = 0,0402663

Estatística-F (3, 2721) = 39,0958 (p-valor < 0,00001)

Passo 2

uqemptime

tottimeavgsenpcnvuhat

+++

++++=

86.86.

...2

54

3210

ββ

ββββ


Variável dependente: uhat2


const -0,00571081 0,0331524 -0,1723 0,86325

pcnv -0,00129713 0,040855 -0,0317 0,97467

avgsen -0,00704866 0,0124122 -0,5679 0,57016

25

avgsen -0,00704866 0,0124122 -0,5679 0,57016

tottime 0,0120953 0,00957684 1,2630 0,20671

ptime86 -0,0048386 0,00891659 -0,5427 0,58741

qemp86 0,00102209 0,0103972 0,0983 0,92170

Média da variável dependente = 0





R2 ajustado = -0,000342319

Estatística-F (5, 2719) = 0,813569 (p-valor = 0,54)

Estatística LM

4,090,0015).(725.2LM

2

==

= unRLM

a

26

61,409,4

61,4%)10( críticovalor

~ 22

<=

=

LM

c

LMa

χ

Regra de rejeiçãoComparar LM com o valor crítico apropriado, c,

de uma distribuição qui-quadrado.

Se LM > c, a hipótese nula é rejeitada.

27

61,409,4 <=LM

Não podemos rejeitar a hipótese nula ao nível

de 10%!!!

P-valor

Podemos rejeitar a hipótese nula ao nível

de 15% pois o p-valor é menor (12,9%).

0,1294,09)( 22 =>χP

28

2

Pode consultar o p-valor no gretl: localizador de

p-valor, coloque o grau de liberdade e o valor

que corresponde a estatística t)

Qui-quadrado(2): área à direita de 4,09 = 0,12938

(à esquerda: 0,87062)

Eficiência assintótica

Existem outros estimadores consistentes além do de MQO.No entanto, sob as hipóteses Gauss-Markov, os de MQO terão as menores

29

Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes.

Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...

Documents

Transcript of Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...