FUNDAÇÃO GETÚLIO VARGAS ESCOLA DE PÓS-GRADUAÇÃO EM ...
Transcript of FUNDAÇÃO GETÚLIO VARGAS ESCOLA DE PÓS-GRADUAÇÃO EM ...
FUNDAÇÃO GETÚLIO VARGAS
ESCOLA DE PÓS-GRADUAÇÃO EM ECONOMIA
ARTHUR MOREIRA SAÚDE
METODOLOGIA DE PREVISÃO DE RECESSÕES:
UM ESTUDO ECONOMÉTRICO COM APLICAÇÕES
DE MODELOS DE RESPOSTA BINÁRIA
Rio de janeiro
2017
ARTHUR MOREIRA SAÚDE
METODOLOGIA DE PREVISÃO DE RECESSÕES:
UM ESTUDO ECONOMÉTRICO COM APLICAÇÕES
DE MODELOS DE RESPOSTA BINÁRIA
Dissertação para obtenção do grau de mestre
apresentada à Escola de Pós-Graduação em
Economia.
Área de concentração: Econometria.
Orientador: Dr. Eduardo Lima Campos
Rio de janeiro
2017
Ficha catalográfica elaborada pela Biblioteca Mario Henrique Simonsen/FGV
Saúde, Arthur Moreira
Metodologia de previsão de recessões: um estudo econométrico com aplicações de modelos de resposta binária / Arthur Moreira Saúde. – 2017.
35 f.
Dissertação (mestrado) - Fundação Getulio Vargas, Escola de Pós-Graduação em Economia. Orientador: Eduardo Lima Campos. Inclui bibliografia. 1. Recessão (Economia). 2. Ciclos econômicos. 3. Modelos econométricos. 4. Probit. 5. Logit. I. Campos, Eduardo Lima. II. Fundação Getulio Vargas. Escola de Pós-Graduação em Economia. III. Título. CDD – 338.5
Resumo
Este trabalho visa desenvolver um modelo econométrico capaz de antecipar,
com um ano de antecedência, recessões na economia dos Estados Unidos,
utilizando não só variáveis dos mercados monetários, que já são indicadores
antecedentes bastante utilizados por economistas, mas também dos
mercados de capitais. Utilizando-se dados de 1959 a 2016, pode-se observar
que o spread de juros de longo e curto prazo continua sendo uma variável
explicativa com excelente poder preditivo sobre recessões. Também
surgiram evidências de novas variáveis que possuem altíssimas
significâncias estatísticas, e que oferecem valiosas contribuições para as
regressões. Foram conduzidos testes fora da amostra que sugerem que as
recessões passadas teriam sido previstas com acurácia substancialmente
superior, caso o modelo Probit proposto tivesse sido utilizado no lugar do
modelo mais difundido na literatura econômica. Essa acurácia é evidente não
só na qualidade preditiva, mas também na redução do número de falsos
positivos e falsos negativos da regressão, e na robustez dos testes fora da
amostra.
Palavras-chave: Recessões. Ciclos Econômicos. Econometria. Modelos de
Resposta Binária. Probit. Logit.
Abstract
This paper aims to create an econometric model capable of anticipating
recessions in the United States economy, one year in advance, using not
only monetary market variables that are already used by economists, but also
capital market variables. Using a data span from 1959 to 2016, it was
observed that the yield spread continues to be an explanatory variable with
excellent predictive power over recessions. Evidence has also emerged of
new variables that have very high statistical significance, and which offer
valuable contributions to the regressions. Out-of-sample tests have been
conducted which suggest that past recessions would have been predicted
with substantially higher accuracy if the proposed Probit model had been
used instead of the most widespread model in the economic literature. This
accuracy is evident not only in the predictive quality, but also in the reduction
of the number of false positives and false negatives in the regression, and in
the robustness of the out-of-sample tests.
Keywords: Recessions. Economic Cycles. Econometrics. Binary Response
Models. Probit. Logit.
Sumário 1 Introdução ................................................................................................... 8
2 Metodologia .............................................................................................. 10
2.1 Modelos de Resposta Binária ............................................................. 10
2.2 Método Stepwise Backward ............................................................... 12
2.3 Testes de Aderência Aplicados a Modelos de Resposta Binária ....... 13
2.3.1 Pseudo-R2 ...................................................................................... 13
2.3.2 Percentage of Correct Predictions .................................................. 13
2.3.3 Teste Hosmer-Lemeshow............................................................... 13
2.4 Testes de Estacionariedade ............................................................... 14
2.4.1 Augmented Dickey-Fuller ............................................................... 14
2.4.2 KPSS .............................................................................................. 17
3 Dados e Análise Exploratória .................................................................... 19
3.1 Testes de Estacionariedade ............................................................... 23
4 Estimações ............................................................................................... 26
4.1 Regressões ........................................................................................ 26
4.2 Comparação dos modelos .................................................................. 27
4.2.1 Efeitos parciais ............................................................................... 30
4.2.2 Testes fora da amostra ................................................................... 31
5 Conclusão ................................................................................................. 33
6 Referências Bibliográficas......................................................................... 34
8
1 Introdução Recessões são períodos que trazem mal-estar a diversas partes interessadas.
A previsibilidade desses eventos já é estudada por economistas há algum tempo, não
só pelo efeito prejudicial que possuem sobre o produto de um país, mas também por
outros fatores negativos, como o desemprego e queda de renda.
A National Bureau of Economic Research (2010) define recessão com as
seguintes palavras:
“A recession is a period of falling economic activity spread across the economy,
lasting more than a few months, normally visible in real GDP, real income,
employment, industrial production, and wholesale-retail sales.”
(National Bureau of Economic Research, 2010)
Os Estados Unidos possuem forte influência econômica internacional, e crises
nesse país podem afetar o mundo inteiro. Por esse motivo, é de interesse não só de
economistas americanos, mas de diversas nacionalidades, prever recessões nessa
economia. Muitos trabalhos acadêmicos têm sido publicados com o objetivo de
investigar a previsibilidade de recessões.
Croushore e Marsten (2014) argumentam que a habilidade que os economistas
têm de prever recessões é limitada, pois normalmente são causadas por choques que
não podem ser antecipados. Por outro lado, Estrella e Mishkin (1996) elaboraram um
modelo Probit que utiliza a inclinação da estrutura a termo dos juros do tesouro
americano para prever recessões com poder preditivo satisfatório.
Rudebusch e Williams (2009) concluíram que um modelo que utilizasse somente
o spread de juros de longo e curto prazo teria previsto recessões com acurácia
superior à do Survey of Professional Forecasters1. Esses resultados foram replicados
por Croushore e Marsten (2014), que afirmam ter achado robustez em diversas
dimensões.
A relação encontrada entre o spread de juros e recessões sugere que os agentes
refletem suas expectativas sobre o futuro da economia no mercado monetário. Por
1 O Survey of Professional Forecasters é uma pesquisa de projeções macroeconômicas, realizada trimestralmente com economistas. A mesma é conduzida pelo Federal Reserve Bank of Philadelphia.
9
meio das decisões que tomam, os mesmos afetam as taxas de juros de longo e curto
prazo, o que explica o fato do spread de juros ter poder explicativo sobre recessões.
Barro e Ursúa (2009) utilizaram dados de longo prazo de 30 países diferentes,
com o objetivo de investigar se quebras de bolsas de valores estão correlacionadas
com depressões, que são definidas como declínios macroeconômicos de 10% ou
mais. Esses autores concluem que quebras de bolsas de valores possuem um poder
de previsão substancial para depressões.
Essa relação parece indicar que o mercado de capitais, assim como o mercado
monetário, também pode possuir indicadores antecedentes a recessões.
Nyberg (2010) propõe um modelo Probit dinâmico com indicadores de retorno
do mercado financeiro, e afirma ter encontrado previsões fora da amostra mais
precisas para as recessões de 2001 e 2008.
O objetivo do presente trabalho é especificar e estudar modelos Probit e Logit
para tentar prever a probabilidade da economia dos Estados Unidos entrar em
recessão no ano seguinte. Pretende-se ainda investigar o poder explicativo de
variáveis defasadas relacionadas a bolsas de valores, combinadas com a estrutura a
termo das taxas de juros do tesouro americano e outras variáveis, visando aprimorar
o modelo proposto por Estrella e Mishkin (1996), a partir dos resultados encontrados
por Barro e Ursúa (2009). Foi utilizado o software Matlab para todos os cálculos e
regressões.
10
2 Metodologia
2.1 Modelos de Resposta Binária Modelos de Resposta binária são adequados para previsão de variáveis binárias
com distribuição Bernoulli, e pertencem à família exponencial na forma canônica,
seguindo relações não lineares.
Wooldridge (2012) generaliza a classe de modelos de resposta binária da
seguinte forma:
��� = 1|�� = �� + � +⋯+���� (2.1)
y é a variável binária dependente.
� , ��, … , �� é o vetor de variáveis explicativas.
, �, … , � é o vetor de coeficientes da regressão, com 0 < G(z) < 1, ∀ z ∈ ℝ.
Wooldridge (2012) aponta que os modelos Logit e Probit são as funções de
ligação não lineares mais utilizadas em modelos de resposta binária. O mesmo autor
apresenta a função logística, também conhecida como logito, da seguinte forma:
��� = ��1 +�� (2.2)
O modelo probit é especificado pela função distribuição acumulada normal,
conforme mostrado na equação 2.3:
��� = � ���²�
√2!�
"#$� (2.3)
Wooldridge (2012) afirma que as estimativas desses modelos não podem ser
feitas via Mínimos Quadrados Ordinários, devido às não linearidades dos mesmos.
Esse mesmo autor recomenda que seja utilizado o método de Máxima
Verossimilhança, que consiste na maximização da equação de log-verossimilhança:
11
%�� = & �' ()*+��'�, + �1 − �'�()*+1 − ��'�,.'/
(2.4)
x é o vetor de variáveis explicativas.
β é o vetor de coeficientes.
G(.) é a função distribuição do modelo de resposta binária.
n é o tamanho da amostra.
Os desvios padrões assintóticos dos coeficientes de regressão podem ser
calculados a partir da matriz de variâncias assintóticas da Equação 2.5. Considerando
que β é um vetor de k x 1 parâmetros, incluindo o intercepto, temos uma matriz de
variâncias k x k, em que as raízes quadradas dos elementos da diagonal principal
correspondem aos desvios padrões assintóticos.
01234567 = �& +*5�'67,²�'′�'5�'67+1 − 5�'67,�
.
'/
" (2.5)
A partir do vetor de coeficientes 6estimado por máxima verossimilhança, e do
vetor de desvios padrão assintóticos, pode-se calcular a estatística t de cada
coeficiente, o que permite testar sua significância estatística.
Além da significância estatística, também estamos interessados em saber o
quanto cada variável explicativa influencia a probabilidade. No entanto, como estamos
trabalhando com funções não lineares, as derivadas das probabilidades, com relação
à determinada variável explicativa, dependerão do nível em que a função se encontra.
Por exemplo, para uma função distribuição ��� = 1|�� = �9�, o efeito parcial de um
coeficiente : será: �9��;<;=>�. Para efeitos de simplificação, foram calculados os
efeitos parciais para �9� = 1%, 25%, 50%, 75% e 99%.
12
2.2 Método Stepwise Backward Draper e Smith (1998) descrevem o Stepwise como um procedimento
automatizado de seleção de variáveis para um modelo de regressão, que baseia-se
em métodos pré-determinados. O método Stepwise Backward inicia a simulação
utilizando o modelo com todas as variáveis candidatas, e analisa a cada etapa uma
possível exclusão de variável. Caso os requisitos definidos sejam satisfeitos, a
variável é retirada, caso contrário o teste continua até que restem apenas as variáveis
escolhidas pelo método.
A Deviance é um dos fatores mais utilizados para testes stepwise, e também é
o padrão da função do Software Matlab. Dobson (2002) define a Deviance de um
modelo da seguinte forma:
? = 2+()* %�@ , �� − ()* %�@ABC, ��, (2.6)
@ é o vetor de parâmetros estimados para o modelo em questão.
@ABC é o vetor de parâmetros estimados para o modelo saturado.
O modelo saturado consiste em um modelo com o número máximo de
parâmetros que possa ser estimado, com o melhor poder explicativo possível. O
modelo saturado possui a mesma distribuição e função de ligação do modelo testado.
Dobson (2002) sugere que quando pretende-se encontrar a Deviance entre dois
modelos, podemos subtrair a Deviance do modelo 2 da Deviance do modelo 1:
D � = 2+log L�b , y� − log L�bKLM, y�, − 2+log L�b�, y� − log L�bKLM, y�, = 2+()* %�@ , �� − ()* %�@�, ��, (2.7)
? � tem distribuição assintótica Qui-quadrado, com graus de liberdade iguais a
diferença entre o número de parâmetros estimados nos modelos 1 e 2.
Em cada etapa do processo, é avaliado se há alguma variável capaz de trazer
um aumento estatisticamente significante de Deviance. O processo é repetido até que
sobrem apenas variáveis cujas exclusões não podem trazer melhorias ao modelo.
13
2.3 Testes de Aderência Aplicados a Modelos
de Resposta Binária Existem métodos específicos para teste da aderência de modelos de resposta
binária. Dentre eles, estão:
2.3.1 Pseudo-R2 O Pseudo-R2, proposto por McFadden (1974), é calculado pela equação 2.8:
NO�P$)Q2 = 1 −%A%� (2.8)
%A é a Log-verossimilhança do modelo estimado.
%� é a Log verossimilhança de um modelo estimado apenas com o intercepto.
2.3.2 Percentage of Correct Predictions O Percentage of Correct Predictions é descrito pela equação:
�R� = ∑ ��' == 1T'/ ��ŷ' ≥ W�+��' == 0��ŷ' < W�Z (2.9)
y[ é a variável binária de recessão observada.
ŷ[ é a probabilidade de recessão estimada.
N é o tamanho de ŷ[. W é o ponto de corte, onde ŷ' ≥ Wsignifica que o modelo está prevendo recessão
um ano à frente, e ŷ' < W indicará o contrário. Esse parâmetro será estimado de
maneira a maximizar o PCP do modelo, com o objetivo de obter melhores resultados
preditivos.
2.3.3 Teste Hosmer-Lemeshow Hosmer e Lemeshow (1980) propuseram um teste com o propósito de avaliar o
quão bem um modelo de resposta binária consegue aderir aos dados observados. O
teste consiste em ordenar as observações por probabilidades preditas, da maior para
a menor, e separá-las em grupos. Os mesmos autores sugerem a separação em 10
14
decis. É conduzido um teste cuja hipótese nula é que os valores esperados das
probabilidades preditas são iguais aos valores esperados observados, em cada grupo.
A estatística de teste está apresentada na equação 2.10. A mesma segue
distribuição qui-quadrado, com g-2 graus de liberdade.
Ĉ = & �^� − _�̀!̅���_�̀!b��1 − !̅��
c
�/ (2.10)
_�̀ é o número total de observações do k-ésimo grupo.
^� = ∑ �:de:/ corresponde ao número de respostas positivas observadas.
!̅� = ∑ A>f̂h.ei
de:/ é a probabilidade estimada média.
2.4 Testes de Estacionariedade Serão utilizados os testes Augmented Dickey-Fuller (Dickey e Fuller, 1979), mais
conhecido como ADF, e Kwiatkowski, Phillips, Schmidt and Shin (1992), mais
conhecido como KPSS, para testar as estacionariedades das séries de dados.
2.4.1 Augmented Dickey-Fuller O teste ADF é uma evolução do teste Dickey-Fuller tradicional, e consiste em
testar a hipótese nula de que γ = 0, ou seja, há raiz unitária, contra a hipótese
alternativa de que γ> 0, ou seja, não há raiz unitária. Para executar o teste ADF deve-
se primeiramente determinar se o modelo possuirá uma constante e se haverá a
presença de uma tendência determinística.
∆�k =l�k" +&'∆�k"'m +nko
'/� (2.11)
15
∆�k =2� + l�k" +&'∆�k"'m +nko
'/� (2.12)
∆�k =2� + l�k" + 2�p +&'∆�k"'m +nko
'/� (2.13)
As equações 2.11, 2.12 e 2.13 foram extraídas do exemplo apresentado por
Enders (2004). A primeira representa a equação de teste para o modelo sem drift e
sem tendência determinística, enquanto que a segunda representa o modelo com drift
e sem tendência determinística. A equação 2.13 apresenta o modelo mais completo,
onde há presença de constante e de tendência determinística.
Dickey e Fuller (1979) apontam que processos não estacionários não podem ser
avaliados com testes t tradicionais, uma vez que as distribuições dos mesmos não
são normais. Dessa forma, o procedimento Dickey e Fuller (1979) utiliza simulações
de Monte Carlo para obtenção dos valores críticos a serem utilizados. Cada uma das
três equações expostas anteriormente possui diferentes valores críticos para teste,
que também variam de acordo com o tamanho da amostra.
Campbell e Perron (1991) argumentam que, quando o modelo estimado utiliza
variáveis determinísticas que não estão presentes no processo real, perde-se poder
no teste, o que pode causar viés no coeficiente γ estimado. Os mesmos autores
também afirmam que o poder do teste é afetado quando uma variável determinística
que está no processo gerador de dados é omitida da regressão.
É necessário conhecer previamente se a série estudada possui tendência
determinística e constante em seu processo gerador para evitar as perdas de poder
mencionadas anteriormente. Porém, como na maior parte dos casos o processo
gerador não é conhecido, Enders (2004) modificou um procedimento originalmente
proposto por Dolado, Jenkinson e Sosvilla-Rivero (1990), representado na figura 1.
Esse procedimento tem o objetivo de criar uma metodologia para testar a presença
de raízes unitárias, utilizando o teste ADF, quando não se conhece a natureza do
processo gerador de dados da série em questão.
16
Figura 1
Antes de iniciar o procedimento, deve-se decidir qual será o tamanho k do vetor
, … , � a ser considerado no processo gerador. Será utilizado o valor de k que
minimiza o Coeficiente Bayesiano de Informação (BIC), para 0 ≤ k ≤ 100, que é
representado da seguinte maneira:
BIC = ln�n� k − 2ln�Ľ� (2.14)
Ľ é o valor máximo da equação de log-verossimilhança.
n é o número de observações.
k é o número de parâmetros presentes no modelo.
O primeiro passo é estimar a equação 2.13, que contém drift e tendência
determinística. Esse é o modelo com menor poder dos três, e por esse motivo, caso
w� seja rejeitada, pode-se concluir que não há raiz unitária. Caso w� não seja rejeitada,
17
deve-se testar se 2� e γ são conjuntamente iguais a zero, utilizando a estatística F de
uma regressão restrita a γ = 2� = 0. Se o teste não concluir que γ = 2� = 0, então se
deve testar γ = 0, utilizando-se a distribuição normal. A rejeição de w�, nesse último
teste, leva a conclusão que não há raiz unitária, enquanto que a não rejeição indica a
presença da mesma.
Caso o teste F conclua que 2� = 0|γ = 0, deve-se descartar a presença de uma
tendência determinística, e regredir a equação 2.12. Assim como no passo anterior, a
rejeição de w�fornece evidências de que não há raiz unitária. Caso não se rejeite w�,
deve-se testar a presença do intercepto, por meio de um teste F, a partir de uma
regressão restrita a γ = 2� = 0. Caso o teste tenha resultado negativo, a mesma
regressão deve ser repetida, utilizando-se a distribuição normal. Se γ for
estatisticamente igual a zero, conclui-se que há evidências sobre a presença da raiz
unitária e, caso contrário, que não há.
Se o passo anterior concluir que 2� = 0|γ = 0, o modelo deve ser especificado
sem o intercepto e sem a tendência determinística, como na equação 2.11. Nessa
etapa, a rejeição de w� implicará na conclusão de que não há evidências de raiz
unitária, enquanto que a não rejeição indica que há evidências de raiz unitária.
2.4.2 KPSS O teste KPSS, proposto por Kwiatkowski, Phillips, Schmidt e Shin em 1992, tem
o objetivo de fornecer evidências sobre estacionariedade em nível ou na tendência,
dependendo de como o modelo for formulado.
A equação 2.14 representa o modelo de teste com tendência, onde 3k =3k" +yk, e yk é uma variável aleatória independente e identicamente distribuída (i.i.d.), com
média 0 e variância z{�. Assume-se que nk é i.i.d. N(0,z|�).
�k = }p + 3k + nk (2.15)
A hipótese de estacionariedade é z{� = 0, que pode ser descrita como
estacionariedade em nível, quando assume-se } = 0, ou estacionariedade na
tendência, caso contrário.
18
Os resultados do teste KPSS serão utilizados para confirmar as conclusões dos
testes ADF. Ou seja, sempre que o teste ADF apontar para estacionariedade em nível,
ou na tendência, a mesma hipótese será colocada à prova no teste KPSS.
19
3 Dados e Análise Exploratória Foram utilizados dados de 1959 até 2016. As recessões são representadas por
uma variável dependente binária, que será construída a partir dos dados publicados
pelo National Bureau of Economic Research (2017), que identifica os períodos
correspondentes a todas as recessões ocorridas nos Estados Unidos desde 1854.
O Comitê de Datação de Ciclos Econômicos (CODACE), organizado Instituto
Brasileiro de Economia (IBRE), é uma iniciativa que tem por objetivo estabelecer
datações de referência para os ciclos econômicos do Brasil, e representa uma
alternativa de dados para obter-se datações de recessões na economia brasileira.
As variáveis explicativas consideradas foram:
A diferença entre a taxa de juros do tesouro americano de 10 anos e de 3 meses,
conforme proposto por Estrella e Mishkin (1996), extraída do Federal Reserve
Economic Data (2017) e denominada “Spread”. Havia dados de 01/04/1953 a
01/12/2016 disponíveis para o tesouro de 10 anos, e 01/01/1934 a 01/12/2016 para o
de 3 meses. Foram calculadas as diferenças utilizando as taxas de 01/04/1953 a
01/12/2016.
Alavancagem de investidores no mercado de capitais, medida pelo volume
financeiro total de operações short efetuadas na New York Stock Exchange (NYSE),
sobre o volume total de ativos comprados em margem, denominada “PctShort”. Os
dados foram obtidos do site oficial da NYSE (2017), e estavam disponíveis para o
período de 01/01/1959 a 01/12/2016. Não havia dados para a variável “Credit Balance
in Margin Accounts” no ano de 1966, as mesmas foram estimadas a partir de uma
interpolação linear dos dados de 01/12/1965 e 01/01/1967.
Retornos acumulados e volatilidades do prêmio de risco do CRSP, obtidos na
base de dados de French (2017), denominadas como “RetCRSP6a0m”,
“RetCRSP12a6m”, “RetCRSP18a12m”, “RetCRSP24a18m”, “VolCRSP6a0m”,
“VolCRSP12a6m”, “VolCRSP18a12m” e “VolCRSP24a18m”, onde “RetCRSP6a0m
corresponde ao retorno acumulado do último semestre, “VolCRSP6a0m” corresponde
à volatilidade acumulada do último semestre, e assim por diante.
20
Inflação acumulada dos Estados Unidos: medida pela variação do Consumer
Price Index (CPI), obtido da base de dados do Federal Reserve Economic Data (2017),
denominada como “Inf6a0m”, “Inf12a6m”, “Inf18a12m” e “Inf24a18m.
A tabela 1 apresenta a disponibilidade de dados de cada variável dependente
escolhida. Pode-se observar que há diferentes números de observações para cada
variável.
Tabela 1
21
Gráfico 1 - Spread
Gráfico 2 - PctShort
22
Gráfico 3 – Inflação acumulada de 6 meses
Gráfico 4 – Retorno acumulado CRSP dos últimos 6 meses
23
Gráfico 5 – Volatilidade acumulada CRSP dos últimos 6 meses
Os gráficos 1, 2, 3, 4 e 5 apresentam o comportamento de cada variável
explicativa candidata no modelo inicial, onde as zonas cinzas representam períodos
recessivos, conforme informação da NBER. Esse gráficos nos permite observar, por
inspeção visual, que algumas das séries podem ter seu comportamento afetado
quando estão próximas do acontecimento de recessões, o que é um bom sinal com
relação aos seus poderes explicativos.
3.1 Testes de Estacionariedade Para os testes de estacionariedade, serão utilizados todos os dados disponíveis
para cada variável, uma vez que os testes são feitos separadamente, com o objetivo
de aumentar sua robustez. Caso necessário, serão feitas transformações nas séries
para que tornem-se estacionárias.
Conforme sugerido pela Figura 1, começou-se estimando a equação 2.13, que
corresponde ao modelo Trend-Stationary (TS) no Matlab. Para definir o número de
lags a serem considerados, foram simulados 101 diferentes cenários para cada
modelo TS de cada variável, de 0 a 100 lags, e calculados os valores correspondentes
24
ao Coeficiente Bayesiano de Informação (BIC). Escolheu-se o número de lags que
minimiza esse coeficiente em cada variável, e então o teste ADF foi conduzido.
Tabela 2
A tabela 2 mostra que apenas a variável PctShort não teve a hipótese nula de
raiz unitária rejeitada. Foi efetuada uma regressão restrita a γ = 2� = 0 com essa
variável. A tabela 3 mostra que a hipótese nula de que γ = 2� = 0 não foi rejeitada, o
que sugere que as variáveis não são conjuntamente significantes ao nível de 5%.
Tabela 3
Seguindo o modelo proposto, a variável PctShort foi testada pelo ADF, utilizando
a equação 2.12, referenciada como "ARD" no Matlab. A tabela 4 mostra que a hipótese
nula de raiz unitária não foi rejeitada.
Tabela 4
Foi efetuado um novo teste F, agora utilizando a equação 2.11, para testar se γ
= 2� = 0. A tabela 5 mostra que as variáveis são estatisticamente insignificantes
conjuntamente.
25
Tabela 5
Foi efetuada uma última regressão com a variável PctShort, com a equação sem
tendência determinística e sem constante. O resultado do teste ADF foi de não rejeitar
a hipótese nula de raiz unitária.
Tabela 6
As mesmas variáveis foram submetidas ao teste KPSS. A tabela 7 mostra que
os resultados encontrados pelo KPSS, em sua maior parte, foram compatíveis com os
resultados do teste ADF. A variável PctShort mostrou-se não estacionária nos dois
modelos. Os mesmos modelos também tiveram a mesma conclusão, de
estacionariedade, para as demais variáveis, com exceção dos dados de volatilidade,
que foram apontados como estacionários no modelo ADF e não estacionários no
modelo KPSS.
Tabela 7
Foi tomada a primeira diferença da variável PctShort, com o objetivo de testar
sua estacionariedade novamente. A tabela 8 mostra que, após a diferenciação da
variável PctShort, quase todas as variáveis são apontadas como estacionárias pelos
26
métodos Augmented Dickey-Fuller e KPSS. Apesar das divergências encontradas nas
conclusões referentes às variáveis de volatilidade, será priorizado o resultado obtido
no ADF, considerando-se as mesmas como estacionárias.
Tabela 8
4 Estimações
4.1 Regressões As catorze variáveis explicativas e a variável dependente foram inicialmente
regredidas nos modelos Probit e Logit, sendo submetidas ao método Stepwise
Backward. O modelo proposto por Estrella e Mishkin (1996) também foi regredido com
os dados disponíveis.
27
Tabela 9
Pode-se observar que os Pseudo R2 e PCPs dos modelos Probit e Logit desse
trabalho são significantemente superiores ao modelo original proposto por Estrella e
Mishkin (1996). Foram obtidos Valores de Pseudo-R2 de 30,92% e 30,18%,
respectivamente, nos modelos Probit e Logit propostos, e 25,57% no modelo de
Estrella. Os PCPs dos modelos Probit e Logit, de 89,17% e 89,30% respectivamente,
também foram superiores o valor de PCP de 88,18% do modelo de Estrella.
Em todos os modelos, não houve evidências aos níveis usuais de significância
para rejeitar a hipótese nula do teste Hosmer-Lemeshow: as proporções observadas
e preditas são iguais em todos os decis considerados.
Obteve-se significâncias estatísticas de 1% em quase todos os coeficientes,
excetuando-se apenas a volatilidade dos prêmios de risco do CRSP, que é significante
a 5%.
4.2 Comparação dos modelos A tabela 10 exibe os dados utilizados para os testes Hosmer-Lemeshow de cada
modelo.
28
Tabela 10
A coluna “Nº Obs” exibe o número de observações presentes no decil, enquanto
que as colunas “Estimado” e “Observado” informam os números de recessões
estimadas e observadas, respectivamente, no decil correspondente.
O gráfico 6 mostra os desempenhos do modelo Probit sugerido, em laranja, e o
modelo de Estrela e Mishkin (1996), em azul. Por inspeção visual, pode-se perceber
que o primeiro modelo, em média, apresenta uma probabilidade maior em períodos
que antecedem recessões, e uma probabilidade menor nos outros casos.
O modelo proposto por Estrella possui uma probabilidade média de recessão de
32,73% em períodos que antecedem recessões, enquanto que o modelo probit
proposto pelo presente artigo apresenta 36,87%. Já em períodos que não antecedem
recessões, as probabilidades são, respectivamente, 10,51% e 9,84%. Essas são
características essenciais para um modelo de previsão, uma vez que se deseja prever
recessões com probabilidades altas, e ao mesmo tempo evitar falsos positivos.
29
Gráfico 6 – Probit Arthur e Probit Estrella
As principais diferenças dos modelos Probit podem ser observadas nas
recessões iniciadas em 1990, 2000 e 2007. É possível observar que o modelo probit
do referente trabalho fornece probabilidades substancialmente superiores às
probabilidades apresentadas no modelo de Estrella e Mishkin (1996), o que facilita a
antecipação desses eventos.
Na década de 1960 o modelo de Estrella e Mishkin (1996) apresenta um período
com probabilidade de quase 50%, em um momento que não antecedia recessões, o
que está bem próximo de ser um falso positivo. Por outro lado, o modelo Probit
proposto não apresenta esse overshoot, com probabilidades mais baixas. Essa é mais
uma característica positiva do segundo modelo, pois também há interesse de
minimizar falsos positivos.
30
Gráfico 7 – Logit Arthur e Probit Estrella
O gráfico 7 apresenta a comparação dos modelos Logit desenvolvido nesse
trabalho e o Probit de Estrella. Os resultados são bem parecidos com os do gráfico 6,
uma vez que a única diferença dos dois modelos é a função resposta.
4.2.1 Efeitos parciais As tabelas 11, 12 e 13 mostram os efeitos parciais dos modelos Probit, Logit e
Estrella, respectivamente. As mesmas exibem o efeito marginal do acréscimo de uma
unidade da variável independente em questão na probabilidade de recessão, quando
a mesma encontra-se em 1%, 25%, 50%, 75% e 99%.
Pode-se observar que os efeitos marginais de 1% e 99% são significativamente
inferiores aos demais. Isso sugere que, quando a probabilidade de recessão da
economia é demasiadamente alta ou baixa, o movimento isolado de uma variável
independente faz uma diferença menor que em outros casos.
31
Tabela 11 – Efeitos Parciais no modelo Probit
Tabela 12 – Efeitos Parciais no modelo Logit
Tabela 13 – Efeitos Parciais no modelo de Estrella
4.2.2 Testes fora da amostra O objetivo de um teste fora da amostra é testar a robustez de longo prazo do
modelo, e mostrar quais teriam sido os resultados das previsões, caso o mesmo
tivesse sido utilizado no passado.
Foram utilizados os 20 primeiros anos da amostra para calcular os coeficientes
de regressão iniciais de cada modelo. Esses coeficientes foram utilizados para prever
o próximo período, e então estimados novamente utilizando mais uma observação.
Repetiu-se esse processo até chegar-se à observação mais recente da amostra.
Também foram estimadas regressões fora da amostra com um modelo com
somente um intercepto, com o objetivo de apurar sua Log-verossimilhança, e utilizá-
la para cálculo dos Pseudo-R2 das demais regressões.
32
Tabela 14
A tabela 14 mostra que o modelo Probit proposto apresentou uma robustez maior de
longo prazo, com Pseudo R2 e PCP maiores nos testes fora da amostra. Os
PseudoR2 obtidos nesse teste são significativamente superiores aos obtidos nas
regressões originais. Esse resultado mostra que, apesar dos modelos testados terem
sua acurácia afetada nesse teste, o modelo comparativo que utiliza um intercepto, por
ser espúrio, foi ainda mais afetado.
Gráfico 8
O gráfico 8 mostra o desempenho de ambos os modelos nos testes fora da
amostra, onde a série laranja representa o Probit proposto por este trabalho, e o azul
o modelo proposto por Estrella e Mishkin (1996).
33
5 Conclusão
Os resultados econométricos apresentados sugerem que a relação entre spread
de juros e a probabilidade de recessão na Economia dos Estados Unidos, encontrada
por Estrella e Mishkin (1996), ainda é altamente significativa. Essa relação sugere que
o mercado monetário afeta diretamente as expectativas dos agentes econômicos com
relação ao output futuro da economia.
Com a extensão dos modelos propostos nesse trabalho, pode-se observar que
há evidências que essas expectativas também são refletidas no mercado de capitais,
representado pela alavancagem de investidores no mercado financeiro e a volatilidade
dos prêmios de risco de ações negociadas nas bolsas de valores dos Estados Unidos.
Essas relações são intuitivas no sentido econômico. Se os agentes percebem
que a economia produzirá PIBs menores no futuro, os mesmos tomarão decisões
levando em conta que as taxas de juros de longo prazo serão menores, o que afetará
o spread de longo e curto prazo. Adicionalmente, também haverá mais operações a
short nos mercados de capitais, em razão de uma possível retração na economia, que
pode afetar negativamente as bolsas de valores. No entanto, a relação negativa da
volatilidade dos prêmios de risco, apesar de estatisticamente significante, não parece
ser intuitiva no sentido macroeconômico.
Também encontrou-se uma significativa relação entre a probabilidade de
recessão e a taxa de inflação. Esse resultado é compatível com a literatura
macroeconômica, uma vez que taxas de inflação altas podem aumentar a
probabilidade da autoridade monetária adotar uma política monetária contracionista,
o que pode afetar negativamente o crescimento econômico da economia.
A previsibilidade de contrações econômicas sempre foi um desafio, e os
resultados apresentados são úteis para se obter previsões mais precisas, com um
menor número de Erros do tipo 1 e do tipo 2. Também abriu-se portas para novos
trabalhos acadêmicos, com o objetivo de construir modelos macroeconômicos que
sejam capazes de representar os mecanismos que estejam por trás das relações
apresentadas.
34
6 Referências Bibliográficas
BARRO, R. J.; URSUA, J. F. Stock-market crashes and depressions. NBER
Working paper 14760, 2009.
BOX, G. E. P.; PIERCE, D. A. Distribution of Residual Autocorrelations in
Autoregressive-Integrated Moving Average Time Series Models. Journal of the
American Statistical Association, 1970.
CAMPBELL J. Y; PERRON P. Pitfalls and opportunities: What
Macroeconomists Should Know about Unit Roots. NBER Macroeconomics
Annual, 1991.
CHAUVET, M.; POTTER, S. Forecasting Recessions Using the Yield Curve.
Federal Reserve Bank of New York, 2001.
CROUSHORE, D.; MARSTEN, K. The continuing power of theyield spread
in forecasting recessions. Research Department, Federal Reserve Bank of
Philadelphia, 2014.
DICKEY, D. A.,; FULLER, W. A. Distributionsofthe Estimators for
Autoregressive Time Series witha Unit Root. Journal of the American Statistical
Association, 1979.
DOBSON, J. A. An Introduction to Generalized Linear Models : second
edition. New York: Chapman & Hall, 2002.
DOLADO, J. J.; JENKINSON, T.; SOSVILLA-RIVERO, S. Cointegration and
Unit Roots. Journal of Economic Surveys, vol 4, nº 3, 1990.
DRAPER, N. R.; SMITH, H. Applied Regression Analysis . Wiley Interscience,
1998.
ENDERS, W. Applied Econometric Time Series. John Wiley & Sons, 2nd
edition, 2004.
ESTRELLA, A., & MISHKIN, F. S. The Yield Curve as a Predictor of U.S.
Recessions. Federal Reserve Bank of New York Current Issues in Economics and
Finance 2, 1996.
35
FEDERAL RESERVE ECONOMIC DATA. Consumer Price Index for All
Urban Consumers: All Items. Disponível em: <https://research.stlouisfed.org>
FRENCH, K. Current Research Returns. Disponível em: <
http://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_library.html>
HOSMER, D. W.; LEMESHOW, S. A goodness-of-fit test for the multiple
logistic regression model . Communications in Statistics, 1980.
KWIATKOWSKI, D.; PHILLIPS, P. C. B.; SCHMIDT, P. & SHIN, Y. Testing the
Null Hypothesis of Stationarity against the Alternative of a Unit Root: How Sure
Are We That Economic Time Series Have a Unit Root? Journal of Econometrics,
1992.
LIU, W.; MOENCH, E. What Predicts U.S. Recessions? Federal Reserve
Bank of New York. Staff Report No. 691, 2014.
MCFADDEN, D. L. Conditional Logit Analysis of Qualitative Choice
Behavior. New York: Academic Press, 1974.
NATIONAL BUREAU OF ECONOMIC RESEARCH. Business Cycle Dating
Committee . Cambridge, 2010.
NEW YORK STOCK EXCHANGE MARKET DATA. Securities market credit.
Disponível em: < http://www.nyxdata.com >
NYBERG, H. Dynamic Probit Models and Financial Variables in Re cession
Forecasting. Journal of Forecasting, 2010.
RUDEBUSCH, G. D. & WILLIAMS, J. C. Forecasting Recessions: The Puzzle
of the Enduring Power of the Yield Curve. Journal of Business and Economic
Statistics 27, no. 4: 492–503, 2009.
STOCK, J.; WATSON, M, Introduction to Econometrics, Prentice Hall, 3rd
edition, 2011.
THE NATIONAL BUREAU OF ECONOMICS RESEARCH. US Business Cycle
Expansions and Contractions. Disponível em: <http://www.nber.org/cycles.html>
VERBEEK, M. A Guide to Modern Econometrics. John Wiley and Sons,
2ndedition, 2004.
36
WOOLDRIDGE, J. Introductory Econometrics: A modern approach. South-
Western Cengage Learning, 5th edition, 2012.
WRIGHT, J. H. The Yield Curve and Predicting Recessions. Federal
Reserve Board, Washington, D.C. Divisions of Research & Statistics and Monetary
Affairs. Finance and Economics Discussion Series, 2006.