ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE … · IUVmáx utilizados referem-se à...
Transcript of ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE … · IUVmáx utilizados referem-se à...
ÍNDICE DE RADIAÇÃO ULTRAVIOLETA MÁXIMO DA CIDADE DE
NATAL: MODELAGEM VIA MÉTODO UNIVARIADO SARIMA. Alexandre Boleira Lopo; Maria Helena Constantino Spyrides; Paulo Sérgio Lucio.
Programa de Pós-Graduação em Ciências Climáticas - PPGCC-DFTE-UFRN Caixa Postal 1641, Campus Universitário Lagoa Nova, CEP 59072-970, Natal/RN
E-mail: [email protected], [email protected], [email protected]
Palavras-Chave: IUV, série temporal, estimação dos parâmetros, previsões, análise de resíduos.
Resumo: O objetivo desta pesquisa refere-se a construção de um modelo univariado SARIMA (auto-
regressivo integrado sazonal de médias móveis) ajustado à variabilidade do Índice de Radiação Ultravioleta
máximo (IUVmáx) mensal, com a finalidade de realizar a previsão desta variável a partir de seu
comportamento temporal/histórico (valores no passado) e componente sazonal. Os dados máximos de
IUVmáx utilizados referem-se à cidade de Natal-RN e ao período de 2001 a 2011. O método consistiu de
cinco etapas: (1) Imputação dos dados diários de IUVmáx; (2) Estudo descritivo da variabilidade do IUVmáx
mensal e anual; (3) Análise e decomposição da série temporal; (4) Construção do modelo SARIMA com
identificação, estimação dos parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx.
Concluiu-se que o modelo SARIMA (1,1,1) x (3,1,3)12 foi o mais adequado em função da normalidade e
independência dos seus resíduos.
1. INTRODUÇÃO
A Radiação no Ultravioleta (RUV) é apenas uma pequena parte do espectro solar, seu valor está na ordem
de 8% a 9% da radiação solar total incidente no topo da atmosfera terrestre para comprimentos de onda λ<
400 mnm, entretanto, a RUV é de grande importância na estruturação da atmosfera terrestre e também tem
grande ação na biosfera [8]. No ser humano a RUV é responsável pela síntese da vitamina D e em excesso
pode causar câncer da pele [4].
A justificativa deste artigo está relacionada ao aumento do Fluxo de Radiação Ultravioleta no Hemisfério
Sul causado pela queda da coluna total de ozônio e pelas alterações na cobertura de nuvens e refletividade
dos aerossóis apontados por [3] que analisou dados de 30 anos (1979-2008) do TOMS-Espectrômetro de
Mapeamento Total de Ozônio instalado em satélites da Agencia Espacial dos EUA (NASA).
O Índice de Radiação Ultravioleta (IUV) é inteiro e adimensional e descreve o nível ou intensidade de
RUV solar na superfície do planeta em relação ao seu o efeito fotobiológico, sendo classificado como
baixo 2), moderado ou médio 5), alto 7), muito alto 10) e extremo
. As precauções a serem tomadas pelo indivíduo, de acordo com essa classificação, se referem ao uso
de chapéus, roupas, óculos de sol, guarda-chuvas ou até mesmo a permanência dentro de casa [10].
Considerando a relevância do IUV e a importância de sua modelagem procurou-se o modelo ARIMA
(auto-regressivo integrado de médias móveis), pois trata-se de um modelo univariado com construção a partir
de um ciclo iterativo, no qual a escolha da estrutura do modelo é baseada nos próprios dados que descrevem
adequadamente processos lineares estacionários, processos lineares não estacionários homogêneos e
processos de memória longa, e podem ser generalizados pela inclusão de um operador sazonal SARIMA
(auto-regressivo integrado sazonal de médias móveis)[1]. Ressalta-se que o modelo ARIMA (p,d,q) e sua
variante sazonal SARIMA (p,d,q) x (P,D,Q) são meios poderosos e úteis para representar modelos de séries
temporais e para inferir previsões sobre os movimentos futuros da variável analisada, sendo esses escolhidos
para modelar a variabilidade de IUV (valor máximo diário) em função desta variável apresentar inúmeros
fatores incontroláveis relativos ao clima e sazonalidade [9].
O objetivo desse artigo é determinar um modelo de séries temporais univariado (SARIMA) para análise e
previsão de dados que correspondam à variabilidade do Índice de Radiação Ultravioleta (valor máximo ou
IUVmáx) da cidade de Natal-RN.
2. MATERIAIS E MÉTODOS
O método consistiu de cinco etapas: (1) Imputação dos dados diários de IUVmáx via técnica Preditive
Mean Matching (PMM); (2) Estudo descritivo da variabilidade do IUVmáx mensal e anual; (3) Análise e
decomposição da série temporal; (4) Construção do modelo SARIMA com identificação, estimação dos
parâmetros e análise dos resíduos; e (5) Previsões/simulações de IUVmáx via modelo SARIMA.
2.1 DADOS
Os dados mensais do IUV máx em Natal (5°48’S e 35°12’W) para o período de 2001 à 2010 foram
construídos a partir de dados diários obtidos no Laboratório de Variáveis Ambientais Tropicais (LAVAT) do
Instituto Nacional de Pesquisas Espaciais-Centro regional do Nordeste (INPE-CRN).
414
ISSN 2317-3297
2.2 IMPUTAÇÃO DE DADOS
Em função da presença de dados faltantes em 17,77% da série, aplicou-se técnica de imputação múltipla
via método da média preditiva ou Preditive Mean Matching [1, 2, 7] presente no aplicativo mice
(Multivariate Imputation by Chained Equatoins) do software R (disponível em http://www.r-project.org/).
2.3 ANÁLISE DA SÉRIE TEMPORAL
As propriedades observadas em uma série temporal (Xt) podem ser captadas assumindo-se a seguinte
forma de decomposição: . Sendo que Tt é uma componente de tendência, Ct é uma
componente cíclica ou sazonal e ɛt é uma componente aleatória ou ruído (a parte não explicada, que espera-se
ser puramente aleatória).
2.4 MÉTODO ARIMA E SARIMA
O ARIMA (método autoregressivo integrado de média móveis) é uma método paramétrico e estatístico
sendo descrito através de parâmetros assim dispostos (p,d,q). O termo p se refere a ordem da autoregressão
na série e corresponde a defasagens da série transformada. O termo d e refere-se ao número de
diferenciações que visam induzir estacionalidade da série.e está associada a palavra integrado. O termo q se
refere a média móveis dos resíduos ou as defasagens dos erros aleatórios e visa evitar a propagação dos
erros e incertezas. A parte sazonal é representada através de mais três parâmetros semelhantes, sendo assim
chamada de SARIMA. O SARIMA é definido por uma parte simples de parâmetros (p,d,q) e sazonal
composta de parâmetros (P,D,Q).
Para determinar os parâmetros são utilizadas as funções de autocorrelação (ACF) e autocorrelação
parcial (PACF). A análise da ACF visa identificar a estacionalidade e definir o termo de médias móveis (q
ou Q). A análise da função PACF possibilita identificar a ordem do termo autoregressivo (p ou P).
O processo de construção de modelos ARIMA proposto por [1] está assentado em um ciclo iterativo,
composto de três estágios: identificação, estimação e checagem do diagnóstico. A identificação consiste no
estabelecimento da ordem (p,d,q) ou, no caso sazonal,(p,d, q) x (P,D,Q), e deve ser determinada inicialmente.
Onde “d” são diferenças simples e “D”, as diferenças sazonais, em seguida deve- se realizar um processo de
checagem do diagnóstico, isto é, de verificação da acurácia do modelo estimado na etapa anterior, com a
finalidade de verificar se o modelo matemático está ajustado aos dados através de testes estatísticos. Caso se
verifique que um modelo não é adequado, o ciclo será repetido [1].
3.0. RESULTADOS
3.1-ETAPA 2-ESTUDO DESCRITIVO
Como mostra a Figura 3.1, na análise mensal, março apresentou os maiores IUVmáx (próximo a 13),
classificado como IUV extremo (> 11) conforme [9]. O ano com o maior valor médio foi 2007 (próximo a
11). A Figura e Tabela 3.1 apresentam os resultados do estudo descritivo do IUVmáx.
Figura 3.1 – Estudo descritivo mensal, anual e sazonal de IUVmáx.
Tabela 3.1 Estimação dos coeficientes, erro padrão e p-valor dos modelos.
IUV 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Mínimo 9,82 8,73 9,04 7,72 8,75 8,68 8,85 8,41 7,4 8,37 7,45
Média 11,24 10,82 11,06 10,69 11,03 10,91 11,35 10,62 10,36 10,96 10,24
Máximo 12,82 12,10 12,87 12,35 13,63 13,18 13,46 12,20 12,5 14,84 12,83
Fonte: Elaborada pelos autores.
415
ISSN 2317-3297
3.2 -ETAPA 3- ANÁLISE DA SÉRIE TEMPORAL
A série temporal foi decomposta na figura 3.2. O primeiro gráfico mostra as observações (dados
mensais) do IUVmáx. O gráfico seguinte mostra o componente da tendência (Trend) utilizando uma média
móvel. O terceiro gráfico demonstra a sazonalidade (Seasonal) da série, calculada pela média, para cada
unidade de tempo em todos os períodos e o último gráfico apresenta a parte residual (Remainder) através da
remoção de tendência e componente sazonal a partir da série de tempo original.
810
1214
obse
rved
10.4
10.8
11.2
trend
-2-1
01
2
seas
onal
-1.0
0.0
1.0
2.0
2002 2004 2006 2008 2010 2012
rand
om
Time
Decomposition of additive time series
Figura 3.2 – Estudo de tendência e sazonalidade do IUVmáx.
Pela análise do gráfico verifica-se a não estacionariedade da série e há forte presença sazonal. Fato este
também verificado na ACF, sendo assim é necessário realizar ao processo de diferenciar a série original para
torná-la estacionária [1].
3.1-ETAPA 4- IDENTIFICAÇÃO E ESTIMAÇÃO DOS PARÂMETROS E ANÁLISE DOS
RESÍDUOS DO MODELO SARIMA.
A série se tornou estacionária após a 1ª diferenciação simples e sazonal. Fato verificado pela ACF, em
seguida realizou-se a estimação dos parâmetros (p,q, P, Q). A Figura 3.3 retrata o processo.
0.0 0.5 1.0 1.5
-0.5
0.0
0.5
1.0
defasagem
fac
ACF da série original Série com 1ª diferenciação simples e sazonal
Anos
IUV
2002 2004 2006 2008 2010 2012
-1.5
-0.5
0.5
1.5
0 5 10 15 20 25 30 35
-0.4
0.0
0.4
0.8
Lag
fac
ACF da série diferenciada
0 5 10 15 20 25 30 35
-0.3
-0.2
-0.1
0.0
0.1
0.2
Lag
Parti
al A
CF
PACF da série diferenciada
Figura 3.3 – ACF da série original de IUVmáx e ACF e PACF da série diferenciada
Dentre os vários modelos testados, o modelo SARIMA (1,1,1)x(3,1,3)12, proporcionou o ajuste mais
adequado aos dados, cuja equação é: xt = -0,1785 xt-1–0,327xt-12 –0,0932xt-24 –0,906xt-36 -0,1562et-1 -
0,4076 et-12-0,3883 et-24 -0,1449et-36 + et. (3.1)
A análise dos resíduos constatou a sua normalidade através do Teste Shapiro-Wilk (p-valor= 0,093), sua
independência verificada pelo teste Box-Pierce (p-valor= 0,951) e os gráficos da ACF e PACF que indicaram
que os resíduos estão dentro do intervalo de confiança de 95%, verificando-se a existência do ruído branco.
416
ISSN 2317-3297
3.1-ETAPA 5- PREVISÕES/SIMULAÇÕES DE IUVmáx VIA MODELO SARIMA.
O modelo SARIMA (1,1,1) x (3,1,3)12 possibilitou a previsão da variabilidade do IUV máx para 12 passos
(meses), a partir do final da observação do ano 2011. A Figura 3.4 retrata esta previsão, sendo possível
identificar a sazonalidade nos dados previstos e a pequena diminuição do seu nível. Constata-se que devido
ao erro, o intervalo de confiança aumenta pra previsões mais distantes.
Figura 3.3 – Observações de IUVmáx e os resultados da previsão para 4 estações e 8 estações.
O modelo teve Critério de Informação de Akaike (AIC) igual a 223,61. O AIC é uma medida geral da
qualidade de ajustamento de modelos utilizado para comparação. Um modelo para a variável resposta Y é
considerado melhor que outro se tiver um AIC mais baixo. Para efeito de comparação o modelo ARIMA
(1,1,1) da série estudada teve AIC igual a 382,52.
4. CONSIDERAÇÕES FINAIS
Para tornar a série original estacionária fez-se uma diferenciação simples e sazonal e foram necessários
um termo autoregressivo simples (p), um termo média móvel simples (q), três termos autoregressivos
sazonais (P) e três termos médias moveis sazonais (Q), para que os resíduos se tornassem normalizados,
obtendo-se um modelo SARIMA (1,1,1) x (3,1,3)12, como descrito na equação nº 3.1, adequado para
previsão.
5. REFERENCIAS
[1] BOX, G.E.P.; JENKINS, G.M.; REINSEL, G.C. Time Series Analysis. Forecasting and Control. San
Francisco: Holden-day, 1976.
[2] BUUREN .V, S., OUDSHOORN , K.G. mice: Multivariate Imputation by Chained Equations in R.
Journal of Statistical Software, 45(3),p.1-67, 2011.
[3] HERMAN J.R. Global increase in UV irradiance during the past 30 years (1979–2008) estimated
from satellite data. Journal of Geophysical Research, vol. 115, 2010.
[4] BRASIL-INCA (Instituto Nacional de Câncer José Alencar Gomes da Silva). Estimativa 2012-
Incidência de Câncer no Brasil, Ministério da Saúde do Brasil, 2011.
[5] LEE-TAYLOR, J., MADRONICH, S.: Climatology of UV-A, UV-B, and Erythemal Radiation at the
Earth's Surface, 1979-2000 / National Center for Atmospheric Research Boulder, Colorado, 2007.
[6] LITTLE, RJA e RUBIN, DB. Statistical analysis with missing data. 2nd ed. New York: Wiley, 2002.
[7] LOPO, A.B. Imputação múltipla em dados do Índice de Radiação Ultravioleta da cidade de Natal
via Preditive Mean Matching (PMM). In: Anais do Congresso Brasileiro de Meteorologia. CBMET,
Gramado, 2012.
[8] MADRONICH, S. UV radiation in the natural and perturbed atmosphere. In: UV-B Radiation and
Ozone Depletion. Tevini, M. ed. Lewis Publisher, p. 17-69, 1993.
[9] MAKRIDAKIS, S.; WHEELWRIGHT, S.C.; HYNDMAN, J.R. Forecasting – Methods and
Applications. 3ª ed., New York: Wiley, 1998.
[10] WHO. Global Solar UV Index: A Practical Guide. World Health Organization, World Meteorological
Organization (WMO), United Nations Environment Program (UNEP), and International Commission on
Non-Ionising Radiation Protection (ICNRP), Geneva, 2002.
417
ISSN 2317-3297