Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...
Transcript of Análise da Regressão múltipla: MQO Assintótico · testes de hipóteses. 3 Essa normalidade...
Análise da Regressão múltipla: MQO Assintótico
Capítulo 5 do WooldridgeCapítulo 5 do Wooldridge
Análise da Regressão múltipla: MQO Assintótico
y = β + β x + β x + . . . β x + uy = β0 + β1x1 + β2x2 + . . . βkxk + u
3. Propriedades assintóticasAntes, propriedades sobre amostras finitas de tamanho n
Inferência em grandes amostras
Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses.
3
testes de hipóteses.Essa normalidade exata vem da hipótese de os erros terem distribuição normal.Essa hipótese de erros normais implica que a distribuição de y, dados x’s, também é normal.
Inferência em grandes amostras (cont.)
Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira.Uma variável aleatória y que tenha distribuição normal deverá ter distribuição
4
distribuição normal deverá ter distribuição simétrica em torno de sua média.Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica.
Inferência em grandes amostras (cont.)
Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA.
5
Variável dependente y: prateAnálise da variável dependente no gretl- Histograma - Estatísticas descritivas
Ver: estatísticas descritivas
Estatísticas Descritivas, usando as observações 1 - 1534para a variável 'prate' (1534 observações
válidas)
Média 87,363
6
Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex. 2,2584
Histograma de prate (variável, gráfico de frequência simples)
0.4
0.5
Fre
qu
ën
cia
re
lati
va
7 0
0.1
0.2
0.3
0 20 40 60 80 100
Fre
qu
ën
cia
re
lati
va
prate
Histograma de prate (variável, gráfico de frequência simples)
0.1
0.12
0.14prate
N(87,363 16,717)Estatística de teste para normalidade:
Qui-quadrado(2) = 1159,437 p-valor = 0,00000
8 0
0.02
0.04
0.06
0.08
0 20 40 60 80 100 120 140
De
nsid
ad
e
Inferência em grandes amostras (cont.)
A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência.No exemplo demonstrado, devemos
9
No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes???NÃO!!!
Teorema do Limite Central
Baseado no teorema do limite central,
podemos mostrar que os estimadores de MQO
são assintoticamente normais.
Ou seja, para amostras grandes, eles seguem
10
Ou seja, para amostras grandes, eles seguem
uma distribuição normal aproximada.
A normalidade assintótica implica que
P(Z<z)→Φ(z) quando n →∞, ou seja, que
P(Z<z) ≈ Φ(z)
Teorema do Limite Central
O teorema central do limite diz que a
média amostral padronizada de qualquer
população com média µ e variância σ2 é
assintoticamente ~N(0,1), ou:
11
assintoticamente ~N(0,1), ou:
( )1,0~ N
n
YZ
aY
σµ−
=
Normalidade assintótica
( ) ( )( )
,,0Normal ~ˆ (i)
Markov,-Gauss de hipóteses as Sob
22j
a
jj an σββ −
∑
12
( )
( ) ( ) ( )1,0Normal ~ˆˆ (iii)
de econsistentestimador um é ˆ (ii)
ˆplim onde
22
212
a
jjj
ijj
ep
rna
βββ
σσ
−
= ∑−
Normalidade assintótica(cont.)
Como a distribuição t se aproxima da normal, dizemos que:
( ) ( )~ˆˆ −a
tep βββ
13
( ) ( ) 1~ˆˆ−−− kn
a
jjj tep βββ
Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média
condicional zero.
Como é feita a inferência??Os testes t e a construção dos intervalos de confiança são realizados exatamente damesma forma anterior, quandoconsiderávamos as hipóteses do ModeloLinear Clássico.
14
Linear Clássico.
( ) ( ) 1~ˆˆ−−− kn
a
jjj tep βββ
Como decidir se o seu tamanho de amostra é suficiente??
Se o tamanho da amostra é grande (pelo menos1500 observações, p.e.), isto é suficiente parausarmos o Teorema do limite central.Alguns econometristas acham que n = 30 é um tamanho satisfatório.
15
tamanho satisfatório.A qualidade da aproximação também dependedos graus de liberdade.Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmentenecessário para usar a aproximação t.
Outra estatística: estatística do multiplicador de Lagrange (LM)
Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F.A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as
16
A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão.Também chamada de estatística de escore.A estatística LM também é chamada de estatística nR2.
Estatística LM (cont)Suponha que tenhamos o modelo
y = β0 + β1x1 + β2x2 + . . . βkxk + u
A hipótese nula seja:
17
A hipótese nula seja:H0: βk-q+1 = 0, ... , βk = 0
q restrições de exclusão no modelo
A estatística LM existe apenas a estimação do modelo restrito
Estatística LM (cont)
~~...
~~110 qkqk uxxy ++++= −−βββ
18
regressão. desta é onde ,
) variáveisas todasm (i.e., ,...,, em ~de regressão a faça e ,~ resíduos, os pegue Agora,
22
21
uu
k
RnRLM
exxxu
u
=
Estatística LM (cont)
Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis
19
correlacionado com cada uma dessas variáveis excluídas.Ou seja, o deve estar próximo de zero.Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido?
2uR
Estatística LM (cont)
2
2
2~
q
q
q
a
de value-p o calcular apenas
ou , ãodistribuiç uma de ,c crítico valor
o escolher podemos então ;LM
χ
χ
χ
20
q de value-p o calcular apenas χ
Com uma amostra grande, o resultado dos testes F e LM devem ser similares.
Estatística LM: exemploModelo do crime (banco de dados: crime1.raw, dados de 2.725 homens nascidos em 1960 ou 1961 na Califórnia):
Variável dependente: narr86 – número de vezes que um homem foi preso
Variáveis independentes:- pcnv: proporção de prisões anteriores que levaram à
21
- pcnv: proporção de prisões anteriores que levaram à condenação.
- avgsen: sentença média cumprida de condenaçõespassadas.
- tottime: tempo total que o homem passou na prisão em1986 desde que atingiu a idade de 18 anos.
- Ptime86: meses passados na prisão em 1986.- qemp86: número de trimestres, em 1986, durante os quaiso homem esteve legalmente empregado.
Estatística LM: exemploTeste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados.
Ho: β2=β3=0
22
Ho: β2=β3=0
Passo 1: estimar a regressão sem estas variáveis.
Passo 2: regredir os resíduos desta regressão em todas variáveis independentes.
Modelo irrestrito
uqemptime
tottimeavgsenpcnvnarr
+++
++++=
86.86.
...86
54
3210
ββ
ββββ
Modelo 1: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: narr86
Variável Coeficiente Erro Padrão estatística-t p-valor
const 0,706061 0,0331524 21,2974 <0,00001 ***
pcnv -0,151225 0,040855 -3,7015 0,00022 ***
23
avgsen -0,00704866 0,0124122 -0,5679 0,57016
tottime 0,0120953 0,00957684 1,2630 0,20671
ptime86 -0,0392585 0,00891659 -4,4029 0,00001 ***
qemp86 -0,103091 0,0103972 -9,9152 <0,00001 ***
Média da variável dependente = 0,404404
Desvio padrão da variável dependente = 0,859077
Soma dos resíduos quadrados = 1924,39
Erro padrão dos resíduos = 0,841284
R2 não-ajustado = 0,0427554
R2 ajustado = 0,0409951
Estatística-F (5, 2719) = 24,2889 (p-valor < 0,00001)
Modelo restrito (passo 1)uqemptimepcnvnarr ++++= 86.86..86 5410 ββββ
Modelo 2: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: narr86
Variável Coeficiente Erro Padrão estatística-t p-valor
const 0,711772 0,0330066 21,5645 <0,00001 ***
pcnv -0,149927 0,0408653 -3,6688 0,00025 ***
24
pcnv -0,149927 0,0408653 -3,6688 0,00025 ***
ptime86 -0,0344199 0,008591 -4,0065 0,00006 ***
qemp86 -0,104113 0,0103877 -10,0227 <0,00001 ***
Média da variável dependente = 0,404404
Desvio padrão da variável dependente = 0,859077
Soma dos resíduos quadrados = 1927,27
Erro padrão dos resíduos = 0,841603
R2 não-ajustado = 0,0413233
R2 ajustado = 0,0402663
Estatística-F (3, 2721) = 39,0958 (p-valor < 0,00001)
Passo 2
uqemptime
tottimeavgsenpcnvuhat
+++
++++=
86.86.
...2
54
3210
ββ
ββββ
Modelo 3: Estimativas OLS usando as 2725 observações 1-2725
Variável dependente: uhat2
Variável Coeficiente Erro Padrão estatística-t p-valor
const -0,00571081 0,0331524 -0,1723 0,86325
pcnv -0,00129713 0,040855 -0,0317 0,97467
avgsen -0,00704866 0,0124122 -0,5679 0,57016
25
avgsen -0,00704866 0,0124122 -0,5679 0,57016
tottime 0,0120953 0,00957684 1,2630 0,20671
ptime86 -0,0048386 0,00891659 -0,5427 0,58741
qemp86 0,00102209 0,0103972 0,0983 0,92170
Média da variável dependente = 0
Desvio padrão da variável dependente = 0,84114
Soma dos resíduos quadrados = 1924,39
Erro padrão dos resíduos = 0,841284
R2 não-ajustado = 0,00149385
R2 ajustado = -0,000342319
Estatística-F (5, 2719) = 0,813569 (p-valor = 0,54)
Estatística LM
4,090,0015).(725.2LM
2
==
= unRLM
a
26
61,409,4
61,4%)10( críticovalor
~ 22
<=
=
LM
c
LMa
χ
Regra de rejeiçãoComparar LM com o valor crítico apropriado, c,
de uma distribuição qui-quadrado.
Se LM > c, a hipótese nula é rejeitada.
27
61,409,4 <=LM
Não podemos rejeitar a hipótese nula ao nível
de 10%!!!
P-valor
Podemos rejeitar a hipótese nula ao nível
de 15% pois o p-valor é menor (12,9%).
0,1294,09)( 22 =>χP
28
2
Pode consultar o p-valor no gretl: localizador de
p-valor, coloque o grau de liberdade e o valor
que corresponde a estatística t)
Qui-quadrado(2): área à direita de 4,09 = 0,12938
(à esquerda: 0,87062)
Eficiência assintótica
Existem outros estimadores consistentes além do de MQO.No entanto, sob as hipóteses Gauss-Markov, os de MQO terão as menores
29
Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes.