Universidade Federal do Rio de Janeiro Instituto de Matem ... · Universidade Federal do Rio de...
Transcript of Universidade Federal do Rio de Janeiro Instituto de Matem ... · Universidade Federal do Rio de...
Universidade Federal do Rio de JaneiroInstituto de Matematica
Modelos de convolucao para dadosespaco-temporais
Geraldo Marcelo da Cunha
2009
Modelos de convolucao para dadosespaco-temporais
Geraldo Marcelo da Cunha
Tese de Doutorado submetida ao programa de
Pos-graduacao em Estatıstica do Instituto de
Matematica da Universidade Federal do Rio de
Janeiro como parte dos requisitos necessarios a
obtencao do grau de Doutor em Estatıstica.
Orientador: Dani Gamerman
Rio de Janeiro, julho de 2009
Modelos de convolucao para dadosespaco-temporais
Geraldo Marcelo da Cunha
Orientador: Dani Gamerman
Tese de Doutorado submetida ao programa de Pos-graduacao em Estatıstica do
Instituto de Matematica da Universidade Federal do Rio de Janeiro como parte dos
requisitos necessarios a obtencao do grau de Doutor em Estatıstica.
Aprovada por:
Presidente Prof. Dani Gamerman Profa. Esther Salazar
IM–UFRJ IM–UFRJ
Prof. Hedibert Freitas Lopes Prof. Ronaldo Dias
University of Chicago UNICAMP
Prof. Josemar Rodrigues
UFSCAR
Rio de Janeiro, Julho de 2009
Cunha, Geraldo Marcelo
Modelos de convolucao para dados espaco-temporais/
Geraldo Marcelo da Cunha. – Rio de Janeiro: UFRJ/IM,
2009.
xvii, 133 f. : il. ; 31cm.
Tese (Doutorado) – UFRJ/IM. Programa de Pos-
Graduacao em Estatıstica, 2009.
Orientador: Dani Gamerman
Referencias bibliograficas: p.101–106.
1. Estatıstica Matematica - Tese. I. Gamerman, Dani.
II. Universidade Federal do Rio de Janeiro. Instituto de
Matematica. III. Tıtulo.
Modelos de convolucao para dados espaco-temporais 1
Resumo
Nos recentes anos, uma serie de modelos para dados espacialmente correlacionados
surgiram no intuito de relaxar ou desconsiderar a suposicao de estacionaridade na
estrutura de covariancia. Alguns desses modelos utilizam a ideia de convolucao de
processos por funcoes nucleo. Partindo de modelos conhecidos na literatura (Fuentes
e Smith (2001); Fuentes (2002); Banerjee, Gelfand, Knight, e Sirmans (2004b)) um
novo modelo que considera estrutura de covariancia nao-estacionaria e apresentado. O
modelo e definido como uma mistura de processos estacionarios latentes ponderados por
componentes de misturas. Funcoes nucleo contınuas sao utilizadas para definir estas
componentes. Nossa abordagem consiste em a partir dos dados, estimar os parametros
de suavizacao das funcoes nucleo consideradas.
Seguindo adiante no trabalho, o modelo proposto para processos espaciais nao-
estacionarios e inserido no contexto de dados que variam no tempo e espaco. Dois
diferentes modelos dinamicos espaco-temporais sao propostos. O primeiro, considera
uma mesma estrutura espacial nao-estacionaria em todos os tempos. O segundo, ge-
neraliza o primeiro, permitindo tambem, que esta estrutura espacial evolua no tempo
atraves de seus parametros de suavizacao.
No ultimo capıtulo, dados de temperatura mınima mensal observados no estado do
Rio de Janeiro de 1961 a 2000 sao analisados considerando um modelo hierarquico que
incorpora nossa abordagem para a estrutura espacial nao-estacionaria.
Modelos de convolucao para dados espaco-temporais 1
Abstract
In recent years, different models for correlated spatial data emerged in order to relax
or disregard the stationarity assumption of covariance structure. Some of these mod-
els are built around kernel convolution of stationary processes. Starting from known
models in the literature (Fuentes e Smith (2001); Fuentes (2002); Banerjee, Gelfand,
Knight, e Sirmans (2004b)) a new model considering non-stationary covariance struc-
ture is presented. The model is defined as a weighted combination of latent stationary
processes by mixture components. Continuous kernel functions are used to define these
componentes. Our approach consists in estimation of the bandwidths in the kernels,
from the data.
Following on the work, the proposed model for spatial non-stationary processes is
inserted to account for data varying in time and space. Two different spatio-temporal
dynamic models are proposed. The first one considers the same non-stationary spatial
structure for all times. The second one generalizes the first one by allowing this spatial
structure to vary over time through their bandwidths parameters.
In the last chapter monthly minimum temperature data observed in Rio de Janeiro
state from 1961 to 2000 are analyzed considering a hierarchical model that incorporates
our non-stationary approach.
Modelos de convolucao para dados espaco-temporais 2
AGRADECIMENTOS
Inicialmente gostaria de agradecer ao meu orientador Dani Gamerman, pessoa pela
qual passei a admirar nos ultimos anos como pesquisador e ser humano. Este tra-
balho e fruto de muitos dos seus conselhos e intuicoes, ditos ou escritos muitas vezes
em pequenos rascunhos em pedacos de papel, ou em seu pequeno quadro branco, o
que sempre me surpreendia. Eu espero que esta relacao forneca frutos de amizade e
trabalhos futuros.
Gostaria tambem de agradecer pelas outras pessoas maravilhosas que conheci e que
participaram deste processo, todos professores do programa e meus amigos e colegas da
pos: Valmaria, Mario, Adelmo, Fidel, Esther e Fernando. Meus amigos da FIOCRUZ
que sempre me apoiaram e possibilitaram minha visita a Universidade Estadual da
Carolina do Norte.
Gostaria de agradecer a minha famılia e amigos distantes que sao o meu suporte
e dao razao ao meu viver. Meu pais, Mario e Ana, meus irmaos, Rosana e Marcio e
outros do coracao, Buda, Ivan, Alan, Alex primo, Didier, Alex Erikson, Edicleia, Tio
Romulo. A Lane que esteve comigo em boa parte deste perıodo. E finalmente, a Thati,
minha companheira, amiga e mulher que sempre me incentivou e incentiva em tudo o
que faco.
Durante este doutorado, outras coisas alegres e tristes ocorreram em minha vida,
sou grato a todas elas. Citando meu preferido poeta, Fernando Pessoa:
“...
Quem quere passar alem do Bojador
Tem que passar alem da dor.
Deus ao mar o perigo e o abysmo deu,
Mas nelle e que espelhou o ceu.”
Sumario
1 Processos espaciais via convolucao de processos 7
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Modelos para processos espaciais nao-estacionarios . . . . 10
1.3 Processos espaciais via convolucao de processos . . . . . 12
1.3.1 Processos estacionarios via convolucao de processos 12
1.3.2 Processos nao-estacionarios via convolucao de pro-
cessos com nucleos variando no espaco . . . . . . 16
1.3.3 Processos nao-estacionarios via convolucao de pro-
cessos localmente estacionarios . . . . . . . . . . . 17
1.4 Justificativa deste trabalho . . . . . . . . . . . . . . . . . 20
1.5 Organizacao da tese . . . . . . . . . . . . . . . . . . . . . 20
2 Processos nao-estacionarios via convolucao de processos
estacionarios latentes 24
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Definicao do modelo e suas propriedades . . . . . . . . . 25
2.3 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3
Modelos de convolucao para dados espaco-temporais 4
2.3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . 28
2.3.2 Verossimilhanca . . . . . . . . . . . . . . . . . . . 29
2.3.3 Distribuicoes a Priori e a Posteriori . . . . . . . . 29
2.4 Aspectos computacionais . . . . . . . . . . . . . . . . . . 32
2.4.1 Interpolacao . . . . . . . . . . . . . . . . . . . . . 35
2.5 Simulacoes . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.1 Estudo 1 . . . . . . . . . . . . . . . . . . . . . . 36
2.5.2 Estudo 2 . . . . . . . . . . . . . . . . . . . . . . 44
3 Modelo dinamico com estrutura de covariancia espacial
nao-estacionaria 51
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Modelo Proposto . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3.1 Verossimilhanca . . . . . . . . . . . . . . . . . . . 55
3.3.2 Distribuicao a Priori . . . . . . . . . . . . . . . . 55
3.3.3 Distribuicao a Posteriori . . . . . . . . . . . . . . 56
3.4 Aspectos computacionais . . . . . . . . . . . . . . . . . . 56
3.5 Simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Modelo dinamico com estrutura de covariancia espacial
dinamica nao-estacionaria 66
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2 Modelo Geral . . . . . . . . . . . . . . . . . . . . . . . . 67
Modelos de convolucao para dados espaco-temporais 5
4.3 Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.3.1 Verossimilhanca . . . . . . . . . . . . . . . . . . . 72
4.3.2 Distribuicao a Priori . . . . . . . . . . . . . . . . 72
4.3.3 Distribuicao a Posteriori . . . . . . . . . . . . . . 73
4.4 Aspectos computacionais . . . . . . . . . . . . . . . . . . 73
4.5 Simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5 Aplicacao 81
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.2 Modelo para variacoes na temperatura . . . . . . . . . . 82
5.2.1 Modelando a estrutura nao-estacionaria . . . . . . 83
5.2.2 Inferencia dos parametros do modelo . . . . . . . 85
5.2.3 Aspectos computacionais . . . . . . . . . . . . . . 86
5.2.4 Dados faltantes e interpolacao . . . . . . . . . . . 86
5.3 Exemplo simulado . . . . . . . . . . . . . . . . . . . . . . 87
5.4 Resultados da analise . . . . . . . . . . . . . . . . . . . . 88
5.4.1 Descricao dos dados e modelo . . . . . . . . . . . 88
5.4.2 Comparacao dos modelos . . . . . . . . . . . . . . 90
5.4.3 Estimacao do termo espacial . . . . . . . . . . . . 93
5.4.4 Estimacao da estrutura media . . . . . . . . . . . 93
5.5 Conclusao . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6 Consideracoes finais 100
Modelos de convolucao para dados espaco-temporais 6
Referencias Bibliograficas 103
Capıtulo 1
Processos espaciais via convolucao
de processos
1.1 Introducao
Nesta secao fazemos uma revisao breve e simples de modelos para dados espacialmente
correlacionados. O objetivo e apresentar algumas definicoes da teoria classica e chamar
atencao de como algumas propriedades desses modelos foram construıdas de modo a
facilitar a estimacao e interpretacao de seus parametros.
Considere uma regiao espacialmente contınua1 D ⊂ <2 na qual, somente para um
conjunto n de posicoes fixas s1, . . . , sn, sao conhecidas medidas de interesse Y =
(Y (s1), . . . , Y (sn))′. O objetivo final da analise estatıstica espacial e ser capaz de
fornecer a qualquer localizacao s0 ∈ D, onde nao se conhece o valor da medida de
interesse, a melhor estimativa Y (s0), a partir dos dados observados Y .
A funcao aleatoria Y (.) e chamada campo aleatorio. Uma abordagem usual na
modelagem de valores observados de um campo aleatorio e feita ao considerar Y de-
composto nas seguintes componentes:
1Pode-se considerar uma regiao definida em um espaco de dimensao L qualquer, onde L ≥ 1 e L e
um numero inteiro.
7
Modelos de convolucao para dados espaco-temporais 8
Y = (media)+(componente espacial)+(erro de medida) (1.1)
= µ+Z + ε,
onde µ representa uma media que pode, por exemplo, ter forma linear, isto e, µ = Xβ,
onde X e uma matriz (n × p) que acomoda p covariaveis associadas a media e β e
um vetor (p × 1) dos parametros associados a essas covariaveis. A componente Z
corresponde a um vetor (n× 1) de realizacao de um campo aleatorio espacial de media
0 e ε e um vetor (n×1) de erros de medida independentes e identicamente distribuıdos,
tal que ε e Z sao independentes. ε e comumente chamado de efeito pepita (Cressie,
1993).
Em muitas aplicacoes, o campo aleatorio espacial Z(.) e assumido Gaussiano, ou
diz-se simplesmente que Z(.) segue um processo Gaussiano.
De um modo geral, Z(.) segue um processo Gaussiano de media 0, se para qualquer
n ≥ 1, o conjunto de observacoes Z = (Z(s1), . . . , Z(sn))′ tem distribuicao normal
multivariada com media 0 e matriz de covariancia Ω. Vamos considerar a seguinte
notacao,
Z(.) ∼ PG(0,Ω).
No contexto da teoria espacial classica, e utilizada a simplificacao Ω = σ2Σ, onde
Σ e a matriz de correlacao dos dados e σ2 e a variancia, igual para todos os Z(s).
Assumindo que Y e condicionalmente independente dado os parametros e que o
processo Z(.) segue um processo Gaussiano podemos escrever:
Y | β,Z, σ2ε ∼ N
(Xβ +Z, σ2
ε I), (1.2)
onde σ2ε e a variancia do erro de medida ε.
Da expressao acima, podemos marginalizar em Z, obtendo
Y | β, σ2,Σ, σ2ε ∼ N
(Xβ, σ2Σ + σ2
ε I). (1.3)
Modelos de convolucao para dados espaco-temporais 9
Outra simplificacao util ocorre pela especificacao da matriz Σ definida a partir de
uma unica funcao de correlacao ρ entre medidas realizadas em dois pontos quaisquer
si e sj,
ρij = ρ(Z(si), Z(sj)).
Como esperado, ρij deve ser definido como uma funcao que decresca com o aumento
da distancia que separa as localizacoes si e sj. A geoestatıstica classica (Cressie, 1993)
apresenta uma classe parametrica de funcoes de correlacao ρ que dependem somente
do vetor diferenca entre os pontos si e sj.
Sendo mais especıfico, se ν = si− sj e o vetor da diferenca entre duas localizacoes
quaisquer si e sj e ρ e funcao somente dessa diferenca, ρ = ρ(ν), Z(.) e estacionario,
significando que a correlacao entre quaisquer dois pontos em D depende da orientacao
do vetor da diferenca entre os pontos e do modulo dessa diferenca. Caso ρ dependa
somente da distancia entre as localizacoes, ρ = ρ(|ν|), Z(.) e isotropico, e portanto, ρ
passa a nao depender mais da orientacao do vetor diferenca. Sendo assim, segue que
todo processo isotropico e tambem estacionario.
Como exemplo, temos abaixo a funcao de correlacao estacionaria Matern:
ρ =1
2ξ−1Γ(ξ)(2ξ1/2 | ν | φ)νκξ(2ξ
1/2φ | ν |),
onde κν e a funcao modificada de Bessel de terceira ordem. Neste caso, a matriz
de covariancias e totalmente especificada se conhecemos os parametros σ2, φ e ξ. O
parametro φ e o inverso da amplitude r (range) que mede como a correlacao decai
com a distancia. O parametro ξ e responsavel pela suavidade do processo sendo este
mais suave na medida em que ξ aumenta. O parametro σ2 e a variancia do processo.
Outras importantes funcoes de correlacao sao derivadas a partir da funcao de correlacao
Matern. Por exemplo, fazendo ξ → ∞ obtemos a funcao de correlacao gaussiana.
Fixando ξ = 12, obtemos a funcao de correlacao exponencial:
ρ = exp −φ | ν | .
Modelos de convolucao para dados espaco-temporais 10
Apesar de atraentes do ponto de vista da interpretacao e facil implementacao,
os modelos que consideram processos espaciais estacionarios/isotropicos sao limitados
dadas as suas especificacoes. Essas propriedades limitam uma possıvel complexidade
real na estrutura espacial que dados reais possam vir a ter. Recorre-se portanto a mode-
los espaciais mais elaborados, onde por exemplo, seja permitido a funcao de covariancia
variar sobre a regiao de estudo.
1.2 Modelos para processos espaciais nao-estacionarios
Devido ao avanco e maior utilizacao de procedimentos computacionalmente intensivos
nos recentes anos, uma serie de procedimentos surgiram no intuito de relaxar ou des-
considerar a suposicao de estacionaridade para dados espaciais.
Uma serie de procedimentos que obtiveram notorio reconhecimento na literatura
parte do artigo inicial de Sampson e Guttorp (1992) que sugerem um modelo de de-
formacao espacial para dados espaco-temporais onde a estacionaridade e assumida no
processo temporal enquanto e permitido ao processo espacial ser nao-estacionario. Eles
utilizam tecnicas de escalonamento multidimensional para transformar o espaco onde
se encontram as observacoes, em um espaco latente estacionario no qual procedimentos
de geoestatıstica classica podem ser aplicados. Seguindo essa linha, Schmidt e O’Hagan
(2003) propoem uma abordagem Bayesiana para este modelo.
Hass (1995) propoe uma abordagem baseada em janelas moveis para estruturas de
covariancia nao-estacionarias. Entretanto, uma desvantagem deste modelo e que ele
pressupoe isotropia nas janelas que incidem sobre as localizacoes.
Uma outra abordagem proposta por Nychka e Saltzman (1998) utiliza funcoes or-
togonais empıricas para modelar dados com estruturas de covariancia mais complexas.
Entretanto, o inconveniente deste metodo e a necessidade de que as localizacoes, onde
os dados foram coletados, sejam um subconjunto da grade onde e feita a interpolacao
dos dados.
Outras duas diferentes abordagens surgem da convolucao de processos por funcoes
nucleo (kernel). A primeira abordagem (Higdon, Swall, e Kern (1999); Swall (1999))
Modelos de convolucao para dados espaco-temporais 11
permite que nucleos normais bivariados possam variar no espaco e considera os proces-
sos como sendo um mesmo ruıdo branco ou um mesmo processo espacial estacionario
definido por um mesmo conjunto de parametros. Paciorek e Schervish (2004) e Pa-
ciorek e Schervish (2006) mostraram ser possıvel, a partir de outros nucleos, estabelecer
diferentes estruturas de covariancias nao-estacionarias. A segunda abordagem (Fuentes
e Smith (2001); Fuentes (2002)) utiliza um mesmo nucleo para diferentes centros,
mas processos espaciais estacionarios definidos por diferentes conjuntos de parametros.
Banerjee et al. (2004b) estende este modelo ao substituir os nucleos por funcoes ponde-
radas dos nucleos. Todos os trabalhos que consideram esta segunda abordagem fixam
os parametros de suavizacao em valores conhecidos, como sera discutido na proxima
secao.
Gelfand, Kottas, e MacEachern (2005b) definem processos nao estacionarios nao-
parametricos a partir da convolucao de processos de Dirichlet. Kottas, Duan, e Gelfand
(2008) utilizam uma abordagem equivalente a partir de um processo de Dirichlet cen-
trado em torno de uma normal multivariada. Ainda neste artigo, o modelo e estendido
para analise de dados espaco-temporais atraves de uma formulacao dinamica (West
e Harrison, 1997) para os efeitos aleatorios. Fuentes e Reich (2009) permitem aos
parametros de suavizacao que compoe a convolucao de processos de Dirichlet vari-
arem no espaco, para caracterizar a falta de estacionaridade na dependencia espacial
e dependencia cruzada, quando sao considerados processos espaciais multivariados.
Tambem, Fuentes, Henry, e Reich (2009) permitem ao parametro de suavizacao do
nucleo ser funcao espacial para explicar falta de estacionaridade em distribuicoes de
extremos, utilizando uma mistura nao-parametrica para dados de extremos de tempe-
ratura.
Para processos nao-estacionarios multivariados Schmidt e Gelfand (2003) e Gelfand,
Schmidt, Banerjee, e Sirmans (2004) utilizam modelos de coregionalizacao. Tambem
Calder (2003) e Calder (2007) propoem um modelo nao-estacionario com nucleos va-
riando espacialmente para dados espaco-temporais multivariados considerando modelos
dinamicos.
Ha ainda uma serie de modelos propostos na literatura para processos espaciais nao-
Modelos de convolucao para dados espaco-temporais 12
estacionarios. Uma revisao dos principais modelos pode ser encontrada em Banerjee,
Carlin, e Gelfand (2004a) e Smith (2001). Em portugues, a revisao de alguns desses
modelos pode ser encontrada em Schmidt e Sanso (2006).
A proxima secao e dedicada a uma melhor compreensao de modelos espaciais nao-
estacionarios envolvendo convolucao de processos.
1.3 Processos espaciais via convolucao de processos
1.3.1 Processos estacionarios via convolucao de processos
Considere uma grade de M pontos u1, ...,uM contidos em uma regiao D, como na
Figura 1.1 e suponha localizacoes (s1, . . . , sn) onde sao observadas as realizacoes de
um processo de interesse Z = Z(s1), . . . , Z(sn). Vejamos como isto pode ser obtido
a partir da convolucao de processos, de modo que Z represente a realizacao de um
processo espacial estacionario.
Inicialmente a cada um, m = 1, . . . ,M sao atribuıdas variaveis aleatorias ω(um)
independentes e identicamente distribuıdas,
ω(um) ∼ N(0, σ2
).
Deste modo, ω(um) representa um processo ruıdo branco.
Seja k(si − um;hm) o valor de uma funcao nucleo de centro um avaliada em si,
i = 1, . . . , n. O parametro hm e chamado de parametro de suavizacao. Quanto maiores
os valores de hm, m = 1, . . . ,M , mais suave e o processo final observado. De agora
em diante, a seguinte notacao sera considerada. Para um nucleo contınuo qualquer
k(.), onde u varia continuamente no espaco, k(si − u) = ku(si) representa o nucleo
centrado em u e avaliado em si. No caso em que u varia discretamente no espaco,
k(si − um) = km(si) representa o nucleo centrado em um e avaliado em si. Alem
disto, subentende-se um parametro de suavizacao para definir cada uma destas funcoes
nucleo.
Considerando ainda o caso discreto, se todos os parametros de suavizacao hm sao
Modelos de convolucao para dados espaco-temporais 13
0 2 4 6 8 10
02
46
810
u1 u2 u3 ……
…… u99 u100
s1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11s12
s13
s14
s15s1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11s12
s13
s14
s15
Figura 1.1: Grade formada de um pontos, m = 1, . . . , 100 em D = [0, 10] × [0, 10]. A cada um
e atribuıdo um processo ruıdo branco ω(um). A figura apresenta tambem o que poderiam ser as
possıveis localizacoes si, i = 1, . . . , 15 das medidas de interesse Z(si).
iguais para m = 1, . . . ,M , a realizacao de um processo estacionario Z(si) pode ser
obtida por convolver os processos ω(um) por km(si) atraves da soma finita,
Z(si) =M∑m=1
km(si)ω(um). (1.4)
Segue entao que Z e a realizacao de um processo Gaussiano no qual,
E[Z(si)] = E
[M∑m=1
km(si)ω(um)
]
=M∑i=m
km(si)E[ω(um)]
= 0,
Modelos de convolucao para dados espaco-temporais 14
V ar[Z(si)] = E
( M∑m=1
km(si)ω(um)
)2
= σ2
M∑m=1
km(si)2,
e:
Cov[Z(si), Z(sj)] = E[Z(si)Z(sj)]− E[Z(si)]E[Z(sj)]
= σ2
M∑m=1
km(si)km(sj)− 0
= σ2
M∑m=1
km(si)km(sj).
Na Figura 1.2 o processo estacionario foi gerado sobre a grade de pontos repre-
sentada pela Figura 1.1 considerando uma funcao nucleo normal padrao, km(s) =
12π
exp−1
2s′s
, ou seja, hm = 1 para m = 1, . . . ,M e um processo ruıdo branco de
variancia σ2 = 0.01.
A versao contınua de convolucao de processos, segue diretamente do limite da grade
de pontos formada por um cada vez mais densa,
Z(s) =
∫ku(s)ω(u)du. (1.5)
A variancia e covariancia de Z(si) sao dadas por,
V ar[Z(si)] = σ2
∫(ku(si))
2du, (1.6)
Cov[Z(si), Z(sj)] = σ2
∫ku(si)ku(sj)du. (1.7)
Uma demonstracao interessante da aproximacao discreta para a contınua de con-
volucao de processos pode ser encontrada em Smith (2001).
Na equacao (1.7), se δ = sj − u,
Modelos de convolucao para dados espaco-temporais 15
Figura 1.2: A realizacao de um processo estacionario e obtida a partir da convolucao do nucleo
normal padrao km(si) e um processo ruıdo branco ω(um) de variancia 0.01.
Cov[Z(si), Z(sj)] = σ2
∫k(si − u)k(sj − u)du
= σ2
∫k(si − sj + δ)k(δ)dδ
que depende somente do vetor da diferenca entre as localizacoes ν = si−sj e portanto,
Z(.) e estacionario.
A equacao (1.4) pode ser utilizada para gerar processos estacionarios cujas funcoes
de correlacao podem ser obtidas na sua forma explıcita, utilizando a relacao entre
a transformada de Fourier de Cov[si − sj ] e a transformada de Fourier do nucleo
k(si − sj). Uma discussao sobre este tema pode ser encontrada em Kern (2000).
Cabe ressaltar que os ruıdos brancos ω(um) podem ser substituıdos por realizacoes
de um mesmo processo estacionario definido por um conjunto de parametros fixados e
ainda assim, o processo Z(.) sera estacionario.
Na pratica, a versao discreta do modelo (1.4) e utilizada pois a integracao das es-
truturas de covariancias estabelecidas por (1.5) e de difıcil manipulacao por metodos
Modelos de convolucao para dados espaco-temporais 16
numericos. Uma das vantagens atribuıdas ao modelo (1.4) e a reducao da dimensionali-
dade no problema, quando M e pequeno em relacao ao numero de localizacoes (Higdon
(1998); Kern (2000)).
Calder (2003) estende o modelo discreto de convolucao de processos (1.4) para
modelos dinamicos (West e Harrison, 1997). Isso e feito ao definir componentes de
ruıdo ωt(um), m = 1, . . . ,M , t = 1, . . . , T , evoluindo no tempo.
1.3.2 Processos nao-estacionarios via convolucao de processos
com nucleos variando no espaco
No intuito de obter processos nao-estacionarios, duas diferentes abordagens sao moti-
vadas a partir de (1.4) e (1.5).
Uma primeira abordagem para processos nao-estacionarios proposta por Higdon
et al. (1999) e Swall (1999) e obtida ao se manterem os processos ruıdo branco ω(u),
mas serem definidos nucleos ksi(.) que variam de acordo com a localizacao si. O modelo
e entao representado por,
Z(si) =
∫ksi(u)ω(u)du, (1.8)
onde ksi(.) e um nucleo de centro si.
De modo que a funcao de covariancia do processo e dada por,
Cov[Z(si), Z(sj)] = σ2
∫ksi(u)ksj(u)du. (1.9)
Uma vez que Cov[Z(si), Z(sj)] depende tambem das localizacoes de si e sj, o
processo Z(.) e nao-estacionario.
Higdon et al. (1999) e Swall (1999) escolhem propositalmente a forma do nucleo,
ks(.), como a de uma normal bivariada com matriz de covariancias Λ(s). Como as
curvas de nıvel deste nucleo tem forma de elipse, eles utilizam elementos da equacao de
uma elipse (os focos, a area e um fator de expansao) como um modo de parametrizar
os elementos da matriz Λ(s). Alem disso, eles estabelecem que os focos dessa elipse
Modelos de convolucao para dados espaco-temporais 17
sigam um processo Gaussiano. A variacao dos focos permite que o modelo se ajuste a
estruturas complexas dos dados podendo eles exibir um comportamento suave ou nao.
Novamente na pratica, a integracao em (1.8) e aproximada pela soma finita,
Z(si) =M∑m=1
ksi(um)ω(um), (1.10)
sendo portanto a funcao de covariancia
Cov[Z(si), Z(sj)] = σ2
M∑m=1
ksi(um)ksj(um). (1.11)
1.3.3 Processos nao-estacionarios via convolucao de processos
localmente estacionarios
Nosso trabalho tem como ponto de partida uma outra abordagem baseada na con-
volucao de processos, proposta inicialmente por Fuentes e Smith (2001) e Fuentes
(2002). Esta abordagem difere da anterior por manter fixo o nucleo ku(s) e substituir
o unico processo ruıdo branco ω(u) por processos espaciais localmente estacionarios
Wη(u)(s) de media 0 e conjunto de parametros da funcao de covariancia η(u). Por
exemplo, se Wη(u)(.) representa um processo estacionario com funcao de correlacao
exponencial de parametros η(u) = (σ2u, φu), de modo que,
Wη(u)(.) ∼ PG(0, σ2
u exp −φu | si − sj |).
O modelo nao-estacionario e entao representado por,
Z(s) =
∫ku(s)Wη(u)(s)du. (1.12)
Fuentes e Smith (2001) resolvem a integral em (1.12) cobrindo a regiao de estudo
D por uma grade fina de pontos um, m = 1, . . . ,M . Definindo para cada um um
processo Wη(um)(.), os autores assumem que funcoes (por exemplo, logarıtmica) de cada
um dos parametros em η(um) variam no espaco segundo processos Gaussianos. Eles
impoem que cada nucleo ku(.) decresca rapidamente, a partir de seus parametros de
Modelos de convolucao para dados espaco-temporais 18
suavizacao de modo que para pontos si e sj proximos de um, Z(si) e Z(sj) sejam como
realizacoes de um mesmo processo estacionario de parametros η(um). Deste modo, o
processo observado global e nao-estacionario, mas retem localmente caracterısticas de
um processo estacionario.
Apesar das interessantes consideracoes teoricas e propriedades deste modelo descrito
em Fuentes e Smith (2001), parecem haver problemas praticos na convergencia dos
parametros por considerar a aproximacao da integral por uma grade fina de pontos
um (Barber (1999); Banerjee et al. (2004a)). Deste modo, a integral em (1.12) e de
fato aproximada por uma grade de pontos relativamente muito menor ao numero de
localizacoes (Fuentes (2002); Fuentes, Chen, Davis, e Lackmann (2005); Banerjee et al.
(2004b)).
Define-se portanto processos localmente estacionarios Wη(um)(si) = Wm(si), m =
1, . . . ,M , satisfazendo Cov[Wm(si),Wm′(sj)] = 0 para m 6= m′ de modo que assume-se
a versao discreta de (1.12),
Z(si) =M∑m=1
km(si)Wm(si). (1.13)
E facil ver que E[Z(si)] = 0, desde que os processos Wm(si) tem media 0 para
m = 1, . . . ,M . Pode-se mostrar tambem que,
Cov[Z(si), Z(sj)] =M∑m=1
km(si)km(sj)Cov[Wm(si),Wm(sj)], (1.14)
e que portanto o processo geral e nao-estacionario.
Nesta abordagem, os parametros de suavizacao hm dos nucleos km(.), m = 1, . . . ,M,
sao escolhidas e fixadas nos menores valores possıveis de modo que a estacionaridade
e aproximadamente obtida dentro de cada sub-regiao. Para isto, as amplitudes dos
parametros de suavizacao hm sao escolhidas em seus menores valores possıveis, satis-
fazendo km(si) > 0 para todo si em D . A proposta apresentada por Banerjee et al.
(2004b) estende o modelo ao substituir os nucleos km(si) por pesos ponderados dos
nucleos,
Modelos de convolucao para dados espaco-temporais 19
γm(si) =km(si)∑M
m′=1 km′(si),ou ainda, γm(si) = km(si)√∑M
m′=1 k2m′ (si)
; (1.15)
e o modelo (1.13) e entao reescrito como,
Z(si) =M∑m=1
γm(si)Wm(si). (1.16)
Estas duas abordagens apresentadas nos modelo (1.13) e (1.16) que fixam os parame-
tros de suavizacao hm, fazem uma particao de D similar a utilizada na Tesselagem de
Voronoi. Em outras palavras, o processo nao-estacionario e basicamente obtido pela
composicao de processos estacionarios ao inves de uma mistura destes processos. Como
um exemplo, considere uma regiao D = [0, 100] × [0, 100], com M = 4 centros como
dispostos na Figura 1.3. Considere tambem 40 localizacoes (s1, . . . , s40) e pesos pon-
derados (1.15, primeira equacao) definidos a partir de nucleos normais padrao, k(si) =
12π
exp−1
2(si)
′(si)
, ou seja, nucleos com parametros de suavizacao hm = 1. Tomando
como exemplo, a localizacao s37, temos2, k1(s37) = O(10−400), k2(s37) = O(10−311),
k3(s37) = O(10−280), k4(s37) = O(10−139), de modo que γ1(s37).= 0, γ2(s37)
.= 0,
γ3(s37).= 0, γ4(s37)
.= 1, e portanto, Z(s37) = W4(s37), independente dos valores ob-
servados em cada um dos processos W1(s37), W2(s37) e W3(s37). O mesmo ocorre para
cada uma das outras localizacoes que tem somente um peso relevante associado, de
modo que sao estabelecidas 4 sub-regioes descritas por 4 processos estacionarios. As-
sim, o processo resultante e globalmente nao-estacionario mas retendo uma estrutura
local estacionaria.
Esta abordagem leva a inversao de matrizes esparsas da dimensao dos dados. A
proposta adotada por Kim, Mallick, e Holmes (2006) define processos estacionarios
independentes em sub-regioes obtidas pela Tesselagem de Voronoi. Neste caso, ma-
trizes de dimensao do numero de localizacoes em cada uma das sub-regioes e que sao
invertidas, tornando esta abordagem computacionalmente mais atrativa.
2Se limn→∞f(n)g(n) = L, onde 0 ≤ L <∞, entao f(n) = O(g(n)).
Modelos de convolucao para dados espaco-temporais 20
1.4 Justificativa deste trabalho
Este trabalho e focado na extensao do modelo (1.16) por tratar cada um dos parametros
de suavizacao hm dos nucleos km(.) que definem γm(.), m = 1, . . . ,M , como parametros
do modelo. Essa abordagem e original uma vez que nao estamos propondo um modelo
de misturas de processos localmente estacionarios (1.13) e (1.16). Nosso modelo assume
processos estacionarios latentes que se misturam entre si, ponderados por componentes
de misturas a serem definidas no proximo capıtulo. Nosso modelo tambem se difere
dos modelos (1.13) e (1.16) por ser nao-estacionario nao so atraves dos processos esta-
cionarios latentes mas tambem atraves das componentes de mistura, uma vez que e
permitido a elas variarem no espaco.
Os procedimentos de inferencia e amostragem adotados para os parametros pos-
sui a vantagem de selecionar automaticamente o numero de componentes de misturas
envolvidas no problema. Este procedimento evita o uso de algoritmos de saltos re-
versıveis (Green, 1985) tornando o procedimento computacional relativamente simples.
Exemplos simulados do proximo capıtulo sugerem que mesmo considerando diferentes
criterios de mistura dos processos estacionarios envolvidos, os procedimentos de in-
ferencia e amostragem adotados sao eficazes na recuperacao dos parametros utilizados
na simulacao dos dados.
Este trabalho tambem se justifica por extender esta nova proposta para processos
espaciais nao-estacionarios em modelos espaco-temporais atraves de uma abordagem
de modelos dinamicos (West e Harrison, 1997) na qual duas propostas sao apresen-
tadas. A primeira extensao considera uma estrutura dinamica na media na qual a
estrutura espacial nao-estacionaria dos dados permanece constante ao longo tempo
enquanto, a segunda extensao, considera uma estrutura dinamica na media e uma
estrutura dinamica para a matriz de covariancia espacial nao-estacionaria dos dados.
1.5 Organizacao da tese
Esta tese e organizada da forma a seguir.
Modelos de convolucao para dados espaco-temporais 21
No Capıtulo 2 o modelo proposto para processos espaciais nao-estacionarios e
definido e suas propriedades sao estabelecidas. Partindo de uma abordagem Bayesiana,
o procedimento de inferencia e esquema de amostragem sao apresentados para os
parametros que compoem a funcao de covariancia do modelo. Dois exemplos simu-
lados sao apresentados. Estes estudos ilustram como o procedimento de inferencia e
de amostragem adotados sao capazes de identificar corretamente o numero de com-
ponentes do modelo, descartando aquelas nao existentes. Nestes estudos, o modelo
proposto e tambem comparado ao modelo de mistura de processos localmente esta-
cionarios no que diz respeito a capacidade preditiva destes modelos .
No Capıtulo 3, a funcao de covariancia do modelo proposto no Capıtulo 2 e inserida
no contexto de dados espaco-temporais. Para isso, e utilizada uma abordagem de mode-
los dinamicos para a media do processo (West e Harrison, 1997) na qual e sugerida a
matriz de covariancias das observacoes ser nao-estacionaria. O modelo proposto neste
capıtulo considera que esta estrutura de covariancia nao evolua no tempo. Todo o
procedimento de inferencia e esquemas de amostragem sao apresentados para todos os
parametros do modelo. Ao final, um exemplo simulado de regressao dinamica e uti-
lizado para exemplificacao. Para os parametros de variancia dos coeficientes dinamicos
da regressao duas prioris sao sugeridas, a Gamma Invertida e a Semi-Cauchy. Alem
disso, o efeito delas na estimativa a posteriori dos parametros e analisada.
O Capıtulo 4 estende o modelo estabelecido no Capıtulo 3 ao permitir que estrutura
de covariancia nao-estacionaria evolua no tempo. Isso e feito por definir uma estrutura
dinamica para os parametros de suavizacao. Por serem positivos, a distribuicao log-
normal e utilizada na construcao da estrutura dinamica desses parametros. Essas
distribuicoes sao parametrizadas de modo que a cada evolucao no tempo o parametro
de suavizacao tenha media igual ao valor do parametro de suavizacao no tempo anterior.
No final do capıtulo um exemplo simulado e utilizado para exemplificar este modelo
dinamico de estrutura de covariancia dinamica.
No Capıtulo 5 e apresentado um estudo das alteracoes climaticas sofridas no estado
do Rio de Janeiro a partir da analise dos dados de temperatura mınima mensal de
1961 a 2000. O modelo considerado e baseado em uma especificacao hierarquica onde
Modelos de convolucao para dados espaco-temporais 22
os dados sao modelados atraves de uma estrutura de regressao para a media e um
termo de ruıdo espacialmente estruturado com uma representacao nao-estacionaria.
Ao final, este modelo e comparado a outros que consideram para o termo espacial, um
modelo de mistura de processos localmente estacionarios e um unico processo espacial
estacionario.
O Capıtulo 6 traca os plano de trabalhos futuros e possıveis extensoes para os
modelos.
Modelos de convolucao para dados espaco-temporais 23
+
+
+
+
+
+
+
+
+
+
+
+
+
++
+
+
+
+
+
+
+
+
+
+
+
+
+
+
++
++
+
++
+
+
+
+
0 20 40 60 80 100
020
4060
8010
0
longitude
latit
ude 37
u1 u2
u3 u4
0 20 40 60 80 100
020
4060
8010
0
longitude
latit
ude
u1 u2
u3 u4
Figura 1.3: Localizacoes de 40 pontos (s1, . . . , s40) de medidas de interesse Z(si) e centros dos
processos localmente estacionarios (u1,u2,u3,u4) (acima) e como esses pontos sao alocados a cada
uma das sub-regioes (abaixo) a partir dos seus respectivos pesos γm(si), m = 1, . . . , 4. Por exemplo,
o ponto s37 e alocado a sub-regiao 4, pois s37 esta mais proximo de u4 que dos outros centros.
Capıtulo 2
Processos nao-estacionarios via
convolucao de processos
estacionarios latentes
2.1 Introducao
Neste capıtulo apresentamos uma nova representacao nao-estacionaria para processos
espaciais. O modelo e formalmente definido e suas propriedades sao estabelecidas.
Partindo de uma abordagem Bayesiana, o procedimento de inferencia e esquema de
amostragem sao apresentados para o conjunto de parametros que compoem o modelo.
Um estudo simulado e utilizado para mostrar como as estrategias de inferencia
e de amostragem adotadas selecionam o numero correto de misturas envolvidas na
construcao do processo espacial nao-estacionario. Neste estudo, sao comparadas as
capacidades preditivas do modelo proposto e modelo de mistura de processos localmente
estacionarios. Outro estudo e utilizado para mostrar que o modelo proposto e capaz
de identificar um processo nao-estacionario definido a partir da mistura de processos
localmente estacionarios.
24
Modelos de convolucao para dados espaco-temporais 25
2.2 Definicao do modelo e suas propriedades
O modelo proposto e introduzido aqui. Considere M sub-regioes em D de centros
um, m = 1, . . . ,M e para cada uma dessas sub-regioes defina processos estacionarios
latentes Wm(.) seguindo um processo Gaussiano de media 0 e funcao de covariancia
definida por parametros η(um). Os processos Wm(.) sao independentes, isto e, para
todo i, j = 1, · · · , n, Wm(si) e Wm′(sj) sao independentes para todo m 6= m′ e si,
sj ∈ D. Seja tambem,
γ(si − um) = γm(si)
a componente de mistura associada ao processo Wm(.).
A restricao de idenficabilidadeM∑m=1
γm(si) = 1, e considerada da mesma forma como
em Banerjee et al. (2004b).
Se km(si −um) = km(si) representa uma funcao nucleo, esta restricao e facilmente
satisfeita se as componentes de mistura γm(si) sao definidas como pesos relativos,
γm(si) =km(si)∑M
m′=1 km′(si).
Note que em nossa abordagem, os nucleos km(.) dependem de seus respectivos
parametros de suavizacao desconhecidos hm. Quanto maior o valor de hm maior a
influencia da componente m sobre o processo observado na regiao.
O processo nao-estacionario e obtido pela mistura (convolucao) discreta,
Z(s) =M∑m=1
γm(s)Wm(s), (2.1)
para cada s ∈ D.
A equacao (2.1) fornece uma media ponderada dos processos e pode ser vista como
uma generalizacao espacial da estimacao dos parametros de suavizacao de Nadaraya
(1964) e Watson (1964) em modelos de regressao.
Modelos de convolucao para dados espaco-temporais 26
Alem disso, e esperado que com uma escolha adequada de componentes, esta re-
presentacao finita forneca uma aproximacao representativa da mistura contınua subja-
cente,
∫γu(s)Wu(s)du, (2.2)
como sugerido em Fuentes e Smith (2001). Note que os centros e suas correspondentes
regioes de vizinhanca sao meramente uma aproximacao para a forma de convolucao
infinita. Deste modo, eles nao precisam necessariamente estar relacionados a alguma
caracterıstica local especıfica da regiao. De fato, eles sao um artefato para a apro-
ximacao finita e as componentes do modelo podem nao ter uma interpretacao espacial
associadas as suas localizacoes especıficas.
Dada estas especificacoes do modelo segue que a esperanca, variancia e covariancia
do processo obtido sao,
E [Z(si)] = E
[M∑m=1
γm(si)Wm(si)
]= 0,
V ar[Z(si)] = V ar
[M∑m=1
γm(si)Wm(si)
]
= E
[M∑m=1
γm(si)Wm(si)
]2
=M∑m=1
[γm(si)]2 V ar[Wm(si)] e
Modelos de convolucao para dados espaco-temporais 27
Cov[Z(si), Z(sj)] = Cov
[M∑m=1
γm(si)Wm(si),M∑
m′=1
γm′(sj)Wm′(sj)
]
= E
[(M∑m=1
γm(si)Wm(si)
)(M∑
m′=1
γm′(sj)Wm′(sj)
)]
=M∑m=1
M∑m′=1
γm(si)γm′(sj)E [Wm(si)Wm′(sj)]
=M∑m=1
γm(si)γm(sj)Cov [Wm(si),Wm(sj)] .
A nao-estacionaridade e obtida porque os pesos γm(si) podem variar no espaco
atraves de seus parametros de suavizacao hm e os processos Wm(.) podem tambem
variar no espaco atraves de seus parametros η(um) que os definem. Banerjee et al.
(2004a) observam que esta abordagem apresenta algumas similaridades qualitativas
com o modelo proposto por Higdon et al. (1999).
O modelo (1.16) proposto por Banerjee et al. (2004b) pode ser visto como um caso
especial do modelo (2.1) quando os valores de hm, m = 1, . . . ,M , sao pequenos o
suficiente para evitar uma interacao entre as componentes do modelo, definindo assim
processos localmente estacionarios. Neste caso, se uma localizacao si e mais proxima
do centro um que dos demais centros entao γm(si) ≈ 1 e γm′(si) ≈ 0 para todo
m′ 6= m. Entao Z(si) ≈ Wm(si). O mesmo raciocınio pode ser aplicado a todas
as localizacoes em D, implicando uma representacao de processo aproximadamente
estacionario para todas as localizacoes, mas variando no espaco uma vez que diferentes
localizacoes podem estar mais proximas de diferentes centros. Note tambem que no
caso em que M = 1 e h1 e suficientemente grande, γ1(si) = 1 para todo si ∈ D, e
portanto Z(si) = W1(si) define um unico processo estacionario em toda regiao.
Uma possıvel interpretacao para o modelo (2.1) e a seguinte: para todo ponto
s ∈ D, o processo observado Z(s) e uma mistura de processos estacionarios latentes
Wm(s), ponderados por componentes de mistura γm(s). Naturalmente, os parametros
η(um) das funcoes de covariancia Wm(s) estimados nao podem ser comparados com os
parametros estimados da funcao de covariancia de outros modelos, por exemplo, com
Modelos de convolucao para dados espaco-temporais 28
o modelo de mistura de processos localmente estacionarios (1.16).
E bastante conhecido o fato de que os parametros de suavizacao desempenham um
papel mais importante do que a forma do nucleo em modelos de mistura e suavizadores
via nucleo (ver por exemplo, Epanechnikov (1969)). O mesmo efeito e valido aqui.
Algumas suposicoes a respeito do nucleo e funcao de covariancia sao agora assumidas
para serem consideradas neste capıtulo e capıtulos subsequentes.
Vamos considerar o seguinte nucleo Gaussiano,
km(si − um) =1
2π|Λm|−
12 exp
−1
2(si − um)′Λ−1
m (si − um)
, (2.3)
onde Λm =
h2m 0
0 h2m
e que os processos estacionarios de mistura sejam isotropicos
e Gaussianos com variancia σ2m e funcao de correlacao espacial de amplitude 1/φm,
para m = 1, . . . ,M . Ou seja,
Wm(.) ∼ PG(0, σ2
m exp(−φm|si − sj|)), (2.4)
de modo que a funcao de covariancia do modelo proposto (2.1) sera dada por,
Cov[Z(si), Z(sj)] =∑M
m=1 γm(si)γm(sj)σ2m exp(−φm|si − sj|).
Note que outras possibilidades mais elaboradas na definicao do nucleo sao possıveis,
por exemplo, a utilizacao de nucleos Gaussianos anisotropicos correlacionados como
em Higdon et al. (1999) ou nucleos mais gerais como os estabelecidos em Paciorek e
Schervish (2006). Note tambem que outras diferentes funcoes de correlacao para os
processos estacionarios latentes poderiam ser consideradas.
2.3 Inferencia
2.3.1 Introducao
Sejam as observacoes ao longo do tempo denotadas por Z = (Z ′1, . . . ,Z′T )′, onde
Zt = (Zt(s1), . . . , Zt(sn))′. Dadas as especificacoes em (2.3) e (2.4), σ = (σ1, . . . , σM)
Modelos de convolucao para dados espaco-temporais 29
e φ = (φ1, . . . , φM) representam os parametros das funcoes de covariancia dos processos
Wm(.) e h = (h1, . . . , hM) os parametros de suavizacao que compoem as componentes
de mistura γm(.) O conjunto de parametros a serem estimados e Θ = (σ,φ,h). Vamos
supor inicialmente que as observacoes Zt, t = 1, . . . T sao independentes para t 6= t′ e
que a estrutura espacial nao-estacionaria seja a mesma para todos os tempos,
Z|Θ ∼ N(0,Ω⊗ IT ), (2.5)
onde Ω =∑M
m=1σ2mAmR(φm)Am, Am = diag(γm(s1), . . . , γm(sn)) , [R(φm)]i,j =
exp(−φm|si − sj|) e In e a matriz identidade n-dimensional. Esta especificacao e
tal que (2.5) pode ser facilmente incorporado a um modelo mais geral, como um ruıdo
espacialmente estruturado nao-estacionario.
A partir de cada uma das amostras observadas Zt = (Zt(s1), . . . , Zt(sn))′ o objetivo
e interpolar Zt(.) nao observado em localizacoes (sn+1, . . . , sn+k). As respostas nao-
observadas nessas localizacoes, Znot = (Zt(sn+1), . . . , Zt(sn+k))
′ no tempo t sao obtidas
atraves de E[Znot |Zt].
2.3.2 Verossimilhanca
Dado o conjunto de observacoes Z = (Z ′1, . . . ,Z′T )′ e Θ = (σ,φ,h) o conjunto de
todos os parametros do modelo, a funcao de verossimilhanca e dada por,
p(Z | Θ) ∝T∏t=1
| Ω |−12 exp
−1
2Z ′tΩ
−1Zt
(2.6)
∝ | Ω |−T2 exp
−1
2
T∑t=1
Z ′tΩ−1Zt
.
2.3.3 Distribuicoes a Priori e a Posteriori
A distribuicao a priori dos parametros e assumida na forma
Modelos de convolucao para dados espaco-temporais 30
p(Θ) = p(σ)p(φ)p(h)
=M∏m=1
p(σm)p(φm)p(hm).
Embora pareca razoavel, na ausencia de informacao a priori relevante, assumir pri-
oris Gama e Gama-Invertida pouco informativas para aos parametros de suavizacao,
variancias e amplitudes, estudos pilotos simulados mostraram que estas distribuicoes
tiveram impacto na posteriori desses parametros. Berger, Oliveira, e Sanso (2001) con-
sideram o uso de prioris de referencia para estes parametros quando se tem um unico
processo Gaussiano isotropico definido para toda regiao. Em nosso caso, o exercıcio de
obter estas prioris e complicado pois estamos definindo um processo nao-estacionario
como mistura de diferentes processos Gaussianos. Alem disso, esta mistura tambem
considera parametros de suavizacao dos nucleos a serem estimadas. Algumas outras
distribuicoes alternativas foram testadas, mas bons resultados foram geralmente obti-
dos com distribuicoes a priori semi-Cauchy (half-Cauchy) sugeridas por Gelman (2006).
Se κ e um dado parametro com distribuicao semi-Cauchy, entao sua densidade e pro-
porcional a
p(κ) ∝(
1 +(κc
)2)−1
, (2.7)
se κ > 0 e 0, caso contrario.
A Figura 2.1 mostra como essa priori se comporta para diferentes valores do parametro
de escala c.
Gelman (2006) sugere o uso dessas prioris para o parametro desvio-padrao e nao
para a variancia para evitar distribuicoes a posteriori improprias.
Um cuidado especial deve ser tomado para a especificacao a priori dos parametros
de suavizacao hm.
Modelos de convolucao para dados espaco-temporais 31
Seja s− um = (xm, ym). Entao, para todo m,
γm(s) =km(s)∑M
m′=1 km′(s)
=
12πh2
mexp
− 1
2h2m
[x2m + y2
m]
∑Mm′=1
12πh2
m′exp
− 1
2h2m′
[x2m′ + y2
m′ ]
=
12πh2
mexp
− 1
2h2m
[x2m + y2
m]
12πh2
mexp
− 1
2h2m
[x2m + y2
m]
+ c
Segue diretamente que limhm→∞ γm(s) = 0 e que limhm→0 γm(s) = 0. Esses calculos
mostram que γm(s) → 0 quando hm → ∞ e γm(s) → 0 quando hm → 0. Assim, a
verossimilhanca perfilada de hm (que depende de hm somente atraves de Ω, que depende
de hm somente atraves de γm(s)) converge para o mesmo valor se hm converge para 0
ou infinito. Ou seja, se L(hm;Y ,Θ−hm) representa a verossimilhanca perfilada de hm,
limhm→∞
L(hm;Y ,Θ−hm) = limhm→0
L(hm;Y ,Θ−hm). (2.8)
Deste modo, os parametros de suavizacao devem ser adicionalmente restritos a um
suporte finito a fim de se verificar a possibilidade de sua convergencia para 0. Se isto
acontece, esta componente de mistura e desnecessaria e pode ser removida do modelo.
Esta observacao fornece um procedimento simples para determinacao do numero de
componentes. Um exercıcio simulado na proxima secao e outro no capıtulo 5 fornecerao
maiores evidencias da adequacao desta abordagem. Neste caso, outras alternativas
complexas para estimar o numero desconhecido de componentes sao evitadas.
Os centros das componentes de mistura sao alocados em torno da regiao de interesse
a fim de cobri-la adequadamente. Consideracoes especıficas sobre as caracterısticas
locais das sub-regioes podem ser utilizadas tambem. Elas podem, mas nao necessaria-
mente precisam ser interpretadas em associacao com os aspectos fısicos locais. De fato,
eles sao utilizados na intencao de se fazer uma aproximacao adequada da representacao
espacial infinitamente dimensional. Os centros sao assumidos fixados neste trabalho
mas podem tambem ser estimados como em Fuentes, Chaudhuri, e Holland (2007).
Modelos de convolucao para dados espaco-temporais 32
0 50 100 150
0.0
0.2
0.4
0.6
0.8
1.0
σσm
Den
sida
de
c=25c=10c=5
Figura 2.1: Densidades proporcionais de uma distribuicao Semi-Cauchy para tres diferentes valores
da constante c = 5, 10, 25. A distribuicao apresenta cauda pesada e sugere prioris pouco informativas.
A combinacao das especificacoes a priori acima com a verossimilhanca (2.6) fornece
a distribuicao a posteriori pelo teorema de Bayes,
p(Θ | Z) ∝ | Ω |−T2 exp
−1
2
T∑t=1
Z ′tΩ−1Zt
M∏m=1
p(σm)p(φm)p(hm). (2.9)
Como usualmente ocorre em modelos com este grau de complexidade, e difıcil ex-
trair informacoes analiticamente e algum mecanismo de aproximacao deve ser uti-
lizado. Dentre as poucas alternativas disponıveis, um algoritmo MCMC hıbrido com
amostrador de Gibbs (ver capıtulo 5), passos de Metropolis-Hastings e slice sampling foi
escolhido. No restante do texto que segue, Θ−ξ denota o vetor completo de parametros
sem seu componente ξ.
2.4 Aspectos computacionais
As condicionais completas de σm, φm e hm sao respectivamente proporcionais a,
Modelos de convolucao para dados espaco-temporais 33
p(σm | Θ−σm) ∝ | Ω |−T2 exp
−1
2
T∑t=1
Z ′tΩ−1Zt
p(σm). (2.10)
p(φm | Θ−φm) ∝ | Ω |−T2 exp
−1
2
T∑t=1
Z ′tΩ−1Zt
p(φm). (2.11)
p(hm | Θ−hm) ∝ | Ω |−T2 exp
−1
2
T∑t=1
Z ′tΩ−1Zt
p(hm). (2.12)
Cada um dos parametros σm, φm, m = 1, . . . ,M e amostrado individualmente por
passos de Metropolis. Por aproveitarem da mesma estrutura da funcao de verossimi-
lhanca e terem distribuicao a priori semi-Cauchy, os passos de amostragem de cada um
dos parametros σm e φm, m = 1, . . . ,M no algoritmo MCMC sao parecidos. O quadro
abaixo apresenta como exemplo, como um elemento σm pode ser amostrado.
Algoritmo: Metropolis-Hastings para σm, m = 1, . . . ,M .
A cada passo da iteracao i+ 1 do algoritmo de Metropolis-Hastings,
• Gere cada componente σ(p)m proposto, a partir de uma proposta de transicao
Gama-Invertida (GI) com media σ(i)m e variancia σ
2(i)m
∆σm,
σ(p)m ∼ GI
[∆σm + 2, σ(i)
m (∆σm + 1)].
• Aceite σ(p)m com probabilidade,
B(σ(i)m , σ
(p)m ) = min
1,p(σ
(p)m | Θ(i)
−σm)q(σ(p)m → σ
(i)m )
p(σ(i)m | Θ(i)
−σm)q(σ(i)m → σ
(p)m )
onde q(.) e a densidade da proposta de transicao e p(.) e fornecida pela equacao
(2.10).
Amostrar os parametros de suavizacao hm eficientemente requer utilizar outra es-
trategia mais especıfica. E importante ser capaz de reconhecer quando a convergencia
Modelos de convolucao para dados espaco-temporais 34
deles vai para 0 o que implicaria na remocao deste componente do modelo. O algoritmo
slice sampling proposto por Neal (2003) e utilizado com este fim. Agarwal e Gelfand
(2005) utilizam este algoritmo no contexto espacial e relatam as vantagens sobre os
esquemas de reamostragem e Metropolis.
O quadro abaixo apresenta como exemplo, como um elemento hm pode ser amostrado.
Algoritmo: Slice Sampling para hm, m = 1, . . . ,M .
• Amostre aleatoriamente h(1)m da distribuicao uniforme [0, R] e um ponto S da
distribuicao uniforme[0, L(Θh
(1)m ;Y )
], onde L(Θh
(1)m ;Y ) e a verossimilhanca de
h(1)m e valores correntes dos outros parametros.
• O ponto S define um slice horizontal na funcao de verossimilhanca. Um novo
ponto h(2)m e amostrado da distribuicao condicional completa de hm ate que ele
esteja dentro do slice.
Maiores detalhes tecnicos que tornam o uso deste algoritmo viavel como a utilizacao
de um esquema de amostragem com retracao (shrinkage sampling scheme) e o uso do
algoritmo na escala logarıtmica podem ser encontrados em Neal (2003) e Agarwal e
Gelfand (2005).
Nossa abordagem consiste em definir suportes iniciais [0, R] de amplitudes largas
em relacao a regiao de estudo para todos os parametros de suavizacao hm. Se um dado
parametro de suavizacao nao converge, indo para R, o algoritmo e reinicializado para
um novo e menor suporte [0, R1], ondeR1 < R, para este parametro de suavizacao. Esta
estrategia fornece bons resultados em exercıcios simulados, como descrito na proxima
secao, provendo indicacoes claras da relevancia de um dado componente adicionado
ao modelo. Ela tambem evita o uso de algoritmos de saltos reversıveis (Green, 1985)
para determinar o numero de componentes tornando o procedimento computacional
relativamente simples.
Modelos de convolucao para dados espaco-temporais 35
2.4.1 Interpolacao
As respostas nao-observadasZnot = (Zt(sn+1), . . . , Zt(sn+k))
′ para localizacoes (sl, . . . , sl+k)
no tempo t sao obtidas atraves de E[Znot |Zt], onde Zno
t |Zt representa a distribuicao
preditiva, cuja densidade e dada por
p(Znot |Zt) =
∫p(Zno
t ,Θ|Zt)dΘ (2.13)
=
∫p(Zno
t |Zt,Θ)p(Θ|Zt)dΘ
≈1
G
G∑g=1
p(Znot |Zt,Θ
(g))
onde p(Znot |Zt,Θ) tem distribuicao condicional normal surgindo da distribuicao normal
conjunta de Znot e Zt, e por ultimo Θ(1), . . . ,Θ(G) sao amostras da distribuicao a
posteriori p(Θ|Zt) obtidas pelo algoritmo MCMC descrito. Cabe observar tambem
que E[Znot |Zt] e V ar[Zno
t |Zt] podem ser obtidos pelas aproximacoes:
E(Znot |Zt) = E [E(Zno
t |Zt,Θ)]
≈1
G
G∑g=1
E(Znot |Zt,Θ
(g))
V ar(Znot |Zt) = E [V ar(Zno
t |Zt,Θ)] + V ar [E(Znot |Zt,Θ)]
≈1
G
G∑g=1
V ar(Znot |Zt,Θ
(g))
+
1
G
[E(Znot |Zt,Θ
(g))− E (Zno
t |Zt)] [E(Znot |Zt,Θ
(g))− E (Zno
t |Zt)]′.
2.5 Simulacoes
Dois diferentes estudos simulados sao considerados nesta secao. Estes estudos servem
para ilustrar as vantagens obtidas quando os parametros de suavizacao das com-
ponentes de mistura sao estimadas no modelo. Em ambos os estudos foram con-
sideradas n = 30 localizacoes (s1, . . . , s30) em D = [0, 100] × [0, 100] e 5 centros
Modelos de convolucao para dados espaco-temporais 36
(u1, u2, u3, u4, u5). Os valores dos parametros da funcao de covariancia dos proces-
sos estacionarios de media 0 foram, σ21 = 1.0, σ2
2 = 5.0, σ23 = 2, σ2
4 = 3, σ25 = 0.5 e
φ1 = 0.040, φ2 = 0.015, φ3 = 0.025, φ4 = 0.020, φ5 = 0.030). A partir desse conjunto
de parametros e valores fixados, T = 200 realizacoes independentes foram geradas,
(Z ′1, . . . ,Z′200)′, onde Zt = (Zt(s1), . . . , Zt(s30))′.
Os algoritmos de estimacao dos parametros utilizado em todos os exemplos e si-
mulacoes deste trabalho, foram implementados no programa Ox; as simulacoes e analise
dos dados feitas no R.
2.5.1 Estudo 1
Neste primeiro estudo, supomos observacoes de um processo nao-estacionario definido
a partir da mistura de cinco processos estacionarios. Entretanto, para um destes pro-
cessos, a componente de mistura e gerada a partir de parametro de suavizacao proximo
de 0. Isto significa na realidade que apenas quatro destes processos sao utilizados para
gerar os dados. Nossos interesses neste estudo sao: 1) mostrar como o procedimento de
amostragem para o modelo proposto e capaz de diferenciar o parametro de suavizacao
proximo de 0. Neste caso, isso implica que esta componente se faz desnecessaria no
modelo e deve ser removida; 2) Comparar a capacidade preditiva em termos da media
e variancia do modelo proposto (modelo I) com o modelo de misturas de processos
localmente estacionarios (modelo II) considerando os mesmos cinco centros e com o
modelo de misturas de processos localmente estacionarios (modelo III) considerando
os quatro centros que de fato possuem pesos associados.
Os dados foram gerados a partir dos parametros de suavizacao h1 = 0.01, h2 =
30, h3 = 20, h4 = 40, h5 = 15. A Figura 2.2 apresenta as curvas de nıvel das compo-
nentes de mistura γ1(.), γ2(.), γ3(.), γ4(.) e γ5(.) que sao observadas ao considerarmos
estas componentes para o vetor h. Esta especificacao faz com que a correlacao obser-
vada nos dados varie de 0.004 a 0.7989.
Modelo I
No algoritmo de estimacao foi inicialmente assumido um suporte relativamente largo
Modelos de convolucao para dados espaco-temporais 37
0 20 40 60 80 100
020
4060
8010
0
γγ1
longitude
latit
ude
u1
u2 u3
u4 u5
0 20 40 60 80 100
020
4060
8010
0
γγ2
longitude
latit
ude
u1
u2 u3
u4 u5
0.2 0.4 0.6
0.8
0 20 40 60 80 100
020
4060
8010
0
γγ3
longitude
latit
ude
u1
u2 u3
u4 u5
0.2
0.4
0.6
0.8
0 20 40 60 80 100
020
4060
8010
0
γγ4
longitude
latit
ude
u1
u2 u3
u4 u5
0.2
0.4 0.6
0.8
0 20 40 60 80 100
020
4060
8010
0
γγ5
longitude
latit
ude
u1
u2 u3
u4 u5
0.2 0.4
0.6 0.8
Figura 2.2: Curvas de nıvel de cada uma das componentes de mistura γ1(.), γ2(.), γ3(.),γ4(.) e
γ5(.) em D. As curvas fornecem uma ideia da influencia de cada componente nas observacoes Zt(si).
de 0 a 100 para cada um dos 5 parametros de suavizacao hm considerados. Este e
um limite bastante elevado, uma vez que maxm hm = 40. As distribuicoes a priori
Semi-Cauchy foram assumidas com c = 30. A Figura 2.3 apresenta a verossimilhanca
perfilada para cada hm, onde a concentracao em torno de 0 somente e observada para a
componente no. 1. A Figura 2.4 apresenta os tracos para os 5 parametros de suavizacao.
Ela mostra que embora os parametros que influenciam no processo observado sejam
bem estimados a distribuicao para h1 se acumula no limite superior do intervalo. Ou-
tras exemplos simulados mostram que nem sempre os parametros de suavizacao que
influenciam o processo observado sao bem estimadas quando um destes parametros
nao converge (veja o exemplo simulado do capıtulo 5). De qualquer maneira ha uma
indicacao de problemas de convergencia e a discussao da secao anterior ja indicava que
isto poderia indicar h1 concentrado em torno de 0. O algoritmo de amostragem foi
reiniciado com um suporte mais curto [0, 15], somente para h1. A Figura 2.5 mostra
que todas as distribuicoes dos parametros de suavizacao ficam concentradas em torno
de seus verdadeiros valores, incluindo h1 que se concentra em torno de 0. Isto indica
que esta componente e desnecessaria e nao deve ser incluıda no modelo.
Modelos de convolucao para dados espaco-temporais 38
0 50 100 150 200
−15
50−
1450
−13
50−
1250
h1
log(
Ver
ossi
milh
ança
)
0 50 100 150 200
−15
50−
1450
−13
50−
1250
h2
log(
Ver
ossi
milh
ança
)
0 50 100 150 200
−15
00−
1400
−13
00
h3
log(
Ver
ossi
milh
ança
)
0 50 100 150 200
−15
50−
1450
−13
50−
1250
h4
log(
Ver
ossi
milh
ança
)
0 50 100 150 200
−17
00−
1600
−15
00−
1400
−13
00
h5
log(
Ver
ossi
milh
ança
)
Figura 2.3: Log das funcoes de verossimilhanca perfilada para h1, h2, h3, h4 e h5.
iteração
h 1
0 1000 2000 3000 4000 5000
4050
6070
8090
100
iteração
h 2
0 1000 2000 3000 4000 5000
3040
5060
70
iteração
h 3
0 1000 2000 3000 4000 5000
2040
6080
iteração
h 4
0 1000 2000 3000 4000 5000
3040
5060
7080
9010
0
iteração
h 5
0 1000 2000 3000 4000 5000
2030
4050
6070
80
Figura 2.4: Tracos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizontal)
considerando o suporte [0, 100] for h1.
O Algoritmo e reiniciado excluindo a componente 1. A Tabela 2.1 confirma o achado
visual da Figura 2.5 para os outros parametros do modelo. Quando os parametros de
Modelos de convolucao para dados espaco-temporais 39
iteração
h 1
0 1000 2000 3000 4000 5000
02
46
8
iteração
h 2
0 1000 2000 3000 4000 5000
2030
4050
6070
80
iteração
h 3
0 1000 2000 3000 4000 5000
2030
4050
6070
80
iteração
h 4
0 1000 2000 3000 4000 5000
3040
5060
7080
iteração
h 5
0 1000 2000 3000 4000 5000
2040
6080
100
Figura 2.5: Tracos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizontal)
considerando o suporte [0, 15] para h1.
suavizacao e numero de componentes sao corretamente estimados, todos os parametros
podem ser identificados e eles sao bem estimados.
Modelo II
Para obter as estimativas do modelo II cada um dos valores de hm e fixado como
igual a 1. Este valor gera automaticamente 5 processos que sao localmente esta-
cionarios. A Tabela 2.2 fornece as estimativas obtidas para σ2m e φm, m = 1, . . . , 5.
Modelo III
O modelo III difere do modelo II no fato de que somente as componentes 2, 3, 4 e
5, que de fato possuem pesos associados ao processo observado, sao consideradas. Este
novo esquema gera 4 processos que sao localmente estacionarios. A Tabela 2.3 fornece
as estimativas obtidas para σ2m e φm, m = 2, . . . , 5.
Comparacao dos modelos
As estimativas de σ2m e φm obtidas pelo modelo I (Tabela 2.1) nao podem ser
comparadas com as estimativas obtidas pelo modelo II (2.2) e modelo III (2.3). As
Modelos de convolucao para dados espaco-temporais 40
Tabela 2.1: Valores estimados de parametros a posteriori para o Modelo I e seus respectivos
intervalos de credibilidade de 95%.
Parametros Verdadeiros valores Medias a posteriori I.C. 95 %
σ22 5.0 4.7 (4.1, 5.2)
σ23 2.0 2.2 (2.0, 2.5)
σ24 3.0 3.1 (2.5, 3.6)
σ25 0.5 0.5 (0.4, 0.6)
φ2 0.015 0.015 (0.013, 0.018)
φ3 0.025 0.021 (0.018, 0.025)
φ4 0.020 0.019 (0.016, 0.024)
φ5 0.030 0.031 (0.026, 0.038)
Tabela 2.2: Valores estimados de parametros a posteriori para o Modelo II e seus respectivos
intervalos de credibilidade de 95%.
Parametros Medias a posteriori I.C. 95 %
σ21 1.2 (1.0, 1.4)
σ22 2.4 (2.1, 2.7)
σ23 1.6 (1.4, 1.9)
σ24 1.8 (1.6, 2.1)
σ25 0.4 (0.4, 0.5)
φ1 0.025 (0.0203, 0.030)
φ2 0.018 (0.015, 0.022)
φ3 0.023 (0.018, 0.027)
φ4 0.033 (0.028, 0.039)
φ5 0.033 (0.028, 0.039)
Modelos de convolucao para dados espaco-temporais 41
Tabela 2.3: Valores estimados de parametros a posteriori para o Modelo III e seus respectivos
intervalos de credibilidade de 95%.
Parametros Medias a posteriori I.C. 95 %
σ22 2.3 (2.0, 2.6)
σ23 1.6 (1.4, 1.8)
σ24 1.7 (1.5, 1.9)
σ25 0.4 (0.4, 0.5)
φ2 0.017 (0.015, 0.020)
φ3 0.024 (0.020, 0.028)
φ4 0.021 (0.018, 0.025)
φ5 0.033 (0.029, 0.038)
estimativas destes parametros, obtidas pelos modelos II e III revelam o grau de nao-
estacionaridade do processo global e podem ser interpretadas, pois cada uma delas
corresponde a uma distinta sub-regiao de estacionaridade. Os parametros estimados
pelo modelo I nao podem ser interpretados dada a misturas dos processos pelas com-
ponentes de mistura.
Uma vez que estamos tratando de um estudo simulado, conhecemos a verdadeira dis-
tribuicao condicional [Znot |Zt] e podemos comparar diretamente a esperanca e variancia
condicionais E[Znot |Zt] e V ar[Zno
t |Zt] com suas respectivas estimativas obtidas pelos
modelos I, II e III. Para isto, observacoes geradas em 256 pontos de uma grade regular
foram geradas e guardadas para comparacao.
A Figura 2.6 apresenta os verdadeiros valores de E[Znot |Zt] no tempo t = 10 e os
valores interpolados para estes pontos obtidos a partir das equacoes descritas na sub-
secao 2.4.1. E nıtido observar que as estimativas obtidas pelo Modelo I sao superiores,
as obtidas pelos modelos II e III. De fato, a soma dos resıduos quadrados sao 0.019
(modelo I), 3.733 (modelo II) e 7.539 (modelo III). O mesmo cenario ocorre para outros
diferentes valores de t.
As verdadeiras variancias V ar[Znot |Zt] sao as mesmas para todo t. A Figura 2.7
Modelos de convolucao para dados espaco-temporais 42
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
Figura 2.6: Verdadeira esperanca condicional E[Zno10 |Z10] (acima e a esquerda) no tempo t = 10
e suas estimativas fornecidas pelo Modelo I (acima e a direita), Modelo II (abaixo e a esquerda) e
Modelo III (abaixo e a direita).
apresenta estes verdadeiros valores e os valores interpolados para estes pontos obtidos
no tempo t = 10. Os graficos revelam que o modelo I recupera estas variancias,
enquanto que os outros modelos fornecem estimativas que sobreestimam ou subestimam
estes valores em algumas regioes. A soma dos resıduos quadrados das variancias sao
0.02 (modelo I), 5.64 (modelo II) e 5.94 (modelo III).
Estas estimativas ruins dos valores estimados E[Znot |Zt] e V ar[Zno
t |Zt] obtidos
Modelos de convolucao para dados espaco-temporais 43
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
Figura 2.7: Verdadeira variancia condicional V ar[Zno|Z] (acima e a esquerda) e suas estimativas
fornecidas pelo Modelo I (acima e a direita), Modelo II (abaixo e a esquerda) e Modelo III (abaixo e
a direita) no tempo t = 10.
pelos modelos II e III acabam por influenciar na capacidade de interpolacao real dos
dados. Por exemplo, considere o ponto se = (53.3, 46.7). A Figura 2.8 apresenta os
valores verdadeiros observados de Zt(se) para t = 1, . . . , 200 (em ordem crescente),
contra as estimativas da media e respectivos intervalos de credibilidade de 95%. A
qualidade dos intervalos de confianca e valores preditos obtidos pelo modelo I sao
notavelmente superiores aqueles obtidos pelos modelos II e III. O tamanho medio
dos intervalos para o Modelo I (4.39) e menor quando comparado ao tamanho dos
Modelos de convolucao para dados espaco-temporais 44
intervalos obtidos pelos modelos II e III (6.28, 5.45 respectivamente). Alem disso,
o erro quadratico medio, EQM =∑T
t=1(E[Zt(se)|Zt]−Zt(se))2
Te menor para o modelo I
(0.84) comparado aos modelos II e III (1.49, 1.30 respectivamente).
Este exemplo simulado mostra que quando um processo nao-estacionario subjacente
e de fato dado pela mistura de processos estacionarios latentes como no modelo (2.1),
parte da capacidade preditiva e perdida ao se considerar os modelos de misturas de
processos localmente estacionarios. Este estudo tambem revela que o mecanismo de
amostragem adotado e capaz de identificar o numero correto de misturas, bem como
quais devem ser as componentes a serem consideradas no modelo. Este esquema e
robusto no sentido de recuperar os parametros utilizados no processo de simulacao.
No capıtulo 5 dados reais de temperatura mınima mensal para o estado do Rio de
Janeiro sao modelados. Esta aplicacao mostra a importancia cientıfica de considerar
abordagens mais elaboradas para misturas de processos, envolvendo a estimacao dos
parametros de suavizacao dos nucleos.
2.5.2 Estudo 2
Neste segundo estudo, supomos observacoes de um processo nao-estacionario global
definido a partir da mistura de cinco processos localmente estacionarios. Portanto
todas os parametros de suavizacao utilizados no processo de estimacao tem seus valores
relativamente pequenos, iguais a 1. Nosso interesse neste estudo e mostrar que o
procedimento de amostragem para o modelo proposto e capaz de estimar parametros
de suavizacao suficientemente pequenos que possam identificar os processos localmente
estacionarios em suas respectivas sub-regioes. O modelo proposto sera chamado de
modelo I e o modelo de mistura de processos localmente estacionario, modelo II.
Os dados foram gerados a partir de parametros de suavizacao h1 = 1, h2 = 1, h3 =
1, h4 = 1, h5 = 1. A Figura 2.9 apresenta as curvas de nıvel dos componentes de mistura
γ1(.), γ2(.), γ3(.), γ4(.) e γ5(.) que sao observadas ao considerarmos estas componentes
para o vetor h. Esta especificacao faz com que a correlacao observada nos dados varie
de aproximadamente 0 a 0.8280.
Modelos de convolucao para dados espaco-temporais 45
0 50 100 150 200
−4
−2
02
4
t
inte
rval
os
0 50 100 150 200
−4
−2
02
4
t
inte
rval
os
0 50 100 150 200
−4
−2
02
4
t
inte
rval
os
Figura 2.8: Valores interpolados (-) de Zt(.) para a localizacao se e seus respectivos intervalos
de credibilidade de 95% para o modelo proposto (acima) e para o modelo de mistura de processos
localmente estacionarios (abaixo). Os verdadeiro valores simulados Zt(se) sao representados por ∆.
Modelos de convolucao para dados espaco-temporais 46
0 20 40 60 80 100
020
4060
8010
0
γγ1
longitude
latit
ude
u1
u2 u3
u4 u5
0.2
0.4
0.6
0.8 1
0 20 40 60 80 100
020
4060
8010
0
γγ2
longitude
latit
ude
u1
u2 u3
u4 u5
0.2 0.4
0.6
0.8 1
0 20 40 60 80 100
020
4060
8010
0
γγ3
longitude
latit
ude
u1
u2 u3
u4 u5
0.2
0.4 0.6
0.8
1
0 20 40 60 80 100
020
4060
8010
0
γγ4
longitude
latit
ude
u1
u2 u3
u4 u5
0.2 0.4 0.6 0.8 1
0 20 40 60 80 100
020
4060
8010
0
γγ5
longitude
latit
ude
u1
u2 u3
u4 u5
0.2 0.4
0.6
0.8 1
Figura 2.9: Curvas de nıvel de cada uma das componentes de mistura γ1(.), γ2(.), γ3(.),γ4(.) e
γ5(.) em D. As curvas fornecem uma ideia da influencia de cada componente e respectivo processo
estacionario m nas observacoes Zt(si).
Modelo I
No algoritmo de estimacao foi inicialmente assumido um suporte de 0 a 100 para
cada um dos 5 parametros de suavizacao hm considerados. Este e um limite bastante
elevado, uma vez que maxm hm = 1. As distribuicoes a priori semi-Cauchy foram as-
sumidas com c = 30. A Figura 2.10 mostra os tracos para os 5 parametros. Inicialmente
o algoritmo sugere que h3 e h4 estejam proximos de 0. O algoritmo e reiniciado com um
suporte [0, 3] para estes 2 parametros e os tracos passam a indicar h1 tambem proximo
de 0 (Figura 2.11). Este procedimento continua e apos certo cuidado com as taxas
de aceitacao dos outros parametros nos passos de Metropolis, chega-se a um resultado
final indicado pelos tracos da Figura 2.12. Neste caso eles indicam todas parametros de
suavizacao com amplitudes proximas de 1. Estes valores sao suficientemente pequenos
para definir processos localmente estacionarios.
Modelo II
Para obter as estimativas do modelo de misturas de processos localmente esta-
Modelos de convolucao para dados espaco-temporais 47
iteração
h 1
0 1000 2000 3000 4000 5000
2040
6080
100
iteração
h 2
0 1000 2000 3000 4000 5000
1020
3040
50
iteração
h 3
0 1000 2000 3000 4000 5000
5060
7080
9010
0
iteração
h 4
0 1000 2000 3000 4000 5000
2040
6080
100
iteração
h 5
0 1000 2000 3000 4000 5000
2040
6080
100
Figura 2.10: Tracos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizon-
tal) considerando o suporte [0, 100].
iteração
h 1
0 1000 2000 3000 4000 5000
6070
8090
100
iteração
h 2
0 1000 2000 3000 4000 5000
3035
4045
5055
60
iteração
h 3
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
iteração
h 4
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
iteração
h 5
0 1000 2000 3000 4000 5000
2040
6080
100
Figura 2.11: Tracos do slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha horizon-
tal) considerando o suporte [0, 3] para h3 e h4.
Modelos de convolucao para dados espaco-temporais 48
iteração
h 1
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
2.0
2.5
iteração
h 2
0 1000 2000 3000 4000 5000
0.5
1.0
1.5
2.0
2.5
iteração
h 3
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
2.0
2.5
3.0
iteração
h 4
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
2.0
2.5
3.0
iteração
h 5
0 1000 2000 3000 4000 5000
0.0
0.5
1.0
1.5
2.0
2.5
3.0
Figura 2.12: Tracos do slice sampling para hm, m = 1, . . . , 5 para dois diferentes pontos de partida
e verdadeiros valores (linha horizontal) considerando o suporte [0, 3].
cionarios cada um dos parametros hm teve seu valor fixado em 1. Os outros parametros
do modelo foram estimados.
Comparacao dos modelos
A Tabela 2.4 compara as estimativas obtidas para o modelo I e modelo II. Os
resultados indicam nao haver diferencas significativas nas estimativas dos parametros
σ2m e φm considerando estes modelos.
As estimativas de σ2m e φm, m = 1, . . . , 5, do modelo I ficam muito proximas das
estimativas obtidas pelo modelo II. Alem disto, os valores de cada um dos hm obtidos
pelo modelo I sao pequenos, tais que para cada si, um dos valores de γm(si) e igual a
1 para algum m e aproximadamente 0 para os outros valores de m. Por causa disto,
as predicoes obtidas pelo modelo I sao proximas das predicoes obtidas pelo modelo II,
que sao proximas dos dados simulados.
A Figura 2.13 apresenta os verdadeiros valores de E[Znot |Zt] no tempo t = 10 e os
valores interpolados para os modelos I e II. A figura revela que as estimativas obtidas
por estes modelos sao proximas da verdadeira esperanca. Alem disso, nao existem
Modelos de convolucao para dados espaco-temporais 49
Tabela 2.4: Valores estimados dos parametros a posteriori do estudo simulado 2 e seus respectivos
intervalos de credibilidade de 95%. Dois modelos sao comparados: o modelo proposto (modelo I) que
estima os os parametros hm e o modelo de misturas de processos localmente estacionario (modelo II)
para o qual os valores de hm foram fixados em 1.
Modelo I Modelo II
verdadeiro estimado 2.5% 97.5% estimado 2.5% 97.5%
σ21 1.0 0.8 0.7 0.9 0.8 0.8 1.0
σ22 5.0 4.7 4.1 5.6 4.6 4.1 5.2
σ23 2.0 2.0 1.8 2.3 2.0 1.8 2.4
σ24 3.0 2.7 2.4 3.1 2.8 2.4 3.3
σ25 0.5 0.5 0.4 0.5 0.5 0.4 0.5
φ1 0.040 0.045 0.038 0.052 0.046 0.038 0.053
φ2 0.015 0.015 0.013 0.018 0.015 0.013 0.018
φ3 0.025 0.025 0.020 0.028 0.024 0.020 0.029
φ4 0.020 0.021 0.018 0.026 0.021 0.017 0.024
φ5 0.030 0.032 0.028 0.037 0.031 0.026 0.036
h1 1 2.4 2.0 2.5 - - -
h2 1 2.3 2.2 2.3 - - -
h3 1 2.3 2.2 2.3 - - -
h4 1 2.3 1.6 2.9 - - -
h5 1 2.4 1.9 2.9 - - -
Modelos de convolucao para dados espaco-temporais 50
diferencas significativas entre as estimativas das esperancas obtidas por estes modelos.
−2
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
−2
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
−2
−1
0
1
2
3
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
Figura 2.13: Da esquerda para a direita: Verdadeira esperanca condicional E[Zno10 |Z10] no
tempo t = 10, estimativa fornecida pelo Modelo I e estimativa fornecida pelo modelo II.
A Figura 2.14 apresenta os verdadeiros valores de V ar[Znot |Zt] no tempo t = 10 e os
valores interpolados para os modelos I e II. A figura revela que as estimativas obtidas
por estes modelos sao proximas da verdadeira variancia. Alem disso, nao existem
diferencas significativas entre as estimativas das variancias obtidas por estes modelos.
0.0
0.5
1.0
1.5
2.0
2.5
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
0.0
0.5
1.0
1.5
2.0
2.5
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
0.0
0.5
1.0
1.5
2.0
2.5
0 20 40 60 80 100
0
20
40
60
80
100
longitude
latit
ude
Figura 2.14: Da esquerda para a direita: Verdadeira Variancia condicional V ar[Zno10 |Z10] no
tempo t = 10, estimativa fornecida pelo Modelo I e estimativa fornecida pelo modelo II.
Mostramos neste exemplo que o procedimento de amostragem para o modelo pro-
posto e capaz de identificar os processos localmente estacionarios e seus respectivos
parametros. Este exemplo reforca a ideia de se considerar a estimacao dos parametros
de suavizacao dos nucleos em modelos de misturas de processos estacionarios. As-
sim, nao se perde nada ao considerar estruturas mais gerais para a correlacao espacial
mesmo que a estrutura de dependencia dos dados seja mais simples.
Capıtulo 3
Modelo dinamico com estrutura de
covariancia espacial
nao-estacionaria
3.1 Introducao
Em muitas situacoes reais, observacoes que sao correlacionadas espacialmente sao ob-
servadas durante o tempo, fazendo com elas tambem estejam correlacionadas no tempo.
Neste capıtulo a estrutura de covariancias nao-estacionaria do modelo proposto (2.1)
do capıtulo anterior e inserida neste contexto. Uma abordagem de modelos dinamicos
(West e Harrison, 1997) para dados espaco-temporais que considera as observacoes
contınuas no espaco e discretas no tempo e utilizada. Diferentes modelos para dados
espaco-temporais na literatura, sao baseados em modelos dinamicos (Gelfand, Baner-
jee, e Gamerman (2005a); Paez, Gamerman, e Oliveira (2005a); Sanso, Schmidt, e
Nobre (2008); Paez, Gamerman, Landim, e Salazar (2008); Lopes, Salazar, e Gamer-
man (2008)).
Considerando convolucao de processos, a utilizacao de modelos dinamicos para da-
dos espaco-temporais univariados pode ser encontrada em Higdon (2002). O seguinte
modelo como extensao do modelo estacionario via convolucao de processos e proposto,
51
Modelos de convolucao para dados espaco-temporais 52
Yt(s) =M∑m=1
k(s− um)ωt(um) + µ+ εs,t
ωt(um) = ωt−1(um) + vm,t
onde ωt(um) ∼ N(0, σ2) representa um ruıdo branco no tempo t. Alem disso, εs,t e vm,t
sao erros independentes e identicamente distribuıdos, εs,t ∼ N(0, σ2ε ) e vm,t ∼ N(0, σ2
v).
Calder (2003) tambem propoe a extensao deste modelo para dados espaco-temporais
multivariados.
Utilizando uma abordagem parecida ao modelo nao-estacionario proposto por Hig-
don et al. (1999), Stroud, Muller, e Sanso (2001) propoem um modelo dinamico espaco-
temporal na qual a superfıcie media do processo e modelada como uma mistura pon-
derada local de regressores lineares. No caso, a ponderacao e feita atraves de nucleos
variando no espaco.
Partindo de uma abordagem diferente da considerada em modelos de espaco de
estados, Fuentes et al. (2005) fazem uma extensao espaco-temporal da funcao de co-
variancia dos modelos de mistura de processos localmente estacionarios (1.15). No
artigo, padroes de correntes de vento observados no tempo sao modelados a partir do
seguinte modelo hierarquico,
Yt(s) =k∑i=1
βi,t(s)fi,t(s) + εt(s)
βi,t(s) = ξi,t + ξi,t(s)
ξi,t = ξi,t−1 + wt
ξi,t(s) = ξi,t−1(s) + ηt(s),
onde wt e ηt(s) sao processos ruıdo branco independentes e εt(s) tem funcao de co-
variancia nao-separavel e nao-estacionaria, definida por uma mistura de processos es-
paciais Wm(.) localmente estacionarios ,
Cov[εti(si), εtj(sj)] =M∑m=1
k(si)k(sj)Cov1[Wm(si),Wm(sj)]Cov2[ti − tj],
Modelos de convolucao para dados espaco-temporais 53
onde Cov1(.) e uma funcao de covariancia espacial estacionaria e Cov2(.) e uma funcao
de covariancia temporal estacionaria.
3.2 Modelo Proposto
Seja Y t = (Yt(s1), . . . , Yt(sn))′ o processo observado em localizacoes s1, . . . , sn, no
tempo t, t = 1, . . . , T . Vamos considerar o seguinte argumento heurıstico para o
modelo dinamico a ser proposto. Seja o modelo espacial geral proposto em (1.1) sem
o erro de medida,
Y t = µt +Zt,
de modo que o processo observado no tempo t seja decomposto em uma media que
evolui no tempo, mais a realizacao de um campo aleatorio espacial Zt de media 0
que evolui, ou nao, no tempo. Supondo que Zt nao evolua no tempo, seja Wm =
(Wm(s1) . . . ,Wm(sn))′ o vetor com as realizacoes de um m-esimo processo estacionario
Wm,t(.), m = 1, . . . ,M, em s1, . . . , sn e Am = diag(γm(s1 − um), . . . , γm(sn − um)),
a matriz diagonal formada pelas componentes de mistura relacionadas a este m-esimo
processo. Suponha tambem para Wm(.) uma funcao de covariancia estacionaria expo-
nencial Cov [Wm(si),Wm(sj)] = σ2m exp(−φm|si − sj|). Entao segue que,
Zt =M∑m=1
AmWm,t.
De modo que, se Wm e Wm′ sao independentes para todo m 6= m′,
E [Zt] = 0,
V ar [Y t] =∑M
m=1σ2mAmR(φm)Am,
onde [R(φm)]i,j = exp(−φm|si − sj|).
Denotando Cov [Zt] = Ω, segue que Y t ∼ Nn(µt,Ω) e este resultado e utilizado
para definir uma equacao para as observacoes como indicado em (3.1) .
Modelos de convolucao para dados espaco-temporais 54
Considerando que µt = F ′tθt, a equacao de evolucao do sistema (3.2) e obtida a
partir de θt e definimos o seguinte modelo dinamico espaco-temporal:
Y t = F ′tθt + ωt, ωt ∼ Nn(0,Ω) (3.1)
θt = Gtθt−1 + νt, νt ∼ Np(0,V ) (3.2)
com distribuicao a priori θ0 ∼ Np(m0, c0) e V ∼ WIn0(S0). Alem disso, definimos
θt = (θt,1, . . . , θt,p)′, F t e Gt sao matrizes de elementos conhecidos e WI representa
a distribuicao Wishart Invertida. Supomos tambem que ωt e νt sao independentes e
mutuamente independentes.
Cada elemento de Ω e dado por,
Ωi,j = Cov[Yt(si), Yt(sj)] (3.3)
=M∑m=1
γm(si)γm(sj)Cov[Wm(si),Wm(sj)], (3.4)
onde Wm(.) , m = 1, . . . ,M , sao processos estacionarios com Cov[Wm(si),Wm′(sj)] = 0
para m 6= m′. Como no capıtulo anterior, sao aqui considerados processos Gaus-
sianos com variancia σ2m e funcao de correlacao espacial de amplitude 1/φm, para
m = 1, . . . ,M .
Cada uma das componentes de mistura γm(si) e definida a partir de pesos relativos
de nucleos contınuos km(si),
γm(si) =km(si)∑M
m′=1 km′(si), (3.5)
e portanto, satisfazem a restricaoM∑m=1
γm(si) = 1. Como no capıtulo anterior iremos
considerar nucleos Gaussianos.
Comparando este modelo aos modelos descritos na sub-secao 3.1, destacamos as
seguintes diferencas. Nosso modelo se diferencia do modelo dinamico espaco-temporal
Modelos de convolucao para dados espaco-temporais 55
proposto por Higdon (2002) e Calder (2003) por considerar nao-estacionaridade para es-
trutura espacial dos dados. Enquanto que os modelos dinamicos espaco-temporais pro-
postos por Higdon et al. (1999) e Stroud et al. (2001) permitem a nao-estacionaridade
espacial dos dados somente atraves dos parametros de suavizacao dos nucleos que po-
dem variar espacialmente, nosso modelo considera que tanto estes parametros, quanto
os parametros dos processos estacionarios latentes podem variar espacialmente. Em-
bora Fuentes et al. (2005) proponham um modelo espaco-temporal que considera uma
funcao de covariancia espaco-temporal, nao-estacionaria espacialmente e nao-separavel,
sua abordagem nao e inserida no contexto de modelos dinamicos, conhecidos por suas
inumeras vantagens no que diz respeito a estimacao e implementacao do modelo.
3.3 Inferencia
3.3.1 Verossimilhanca
Sejam θ = (θ1, . . . ,θT ), σ = (σ1, . . . , σM), φ = (φ1, . . . , φM), h = (h1, . . . , hM), e
defina Θ = (θ,θ0,σ,φ,h,V ) o conjunto de todos os parametros do modelo. Dado
um conjunto de observacoes Y = (Y 1, . . . ,Y T )′, temos a seguinte funcao de verossi-
milhanca,
p(Y | Θ) ∝T∏t=1
| Ω |−12 exp
−1
2(Y t − F ′tθt)′Ω−1(Y t − F ′tθt)
(3.6)
∝ | Ω |−T2 exp
−1
2
T∑t=1
(Y t − F ′tθt)′Ω−1(Y t − F ′tθt)
.
3.3.2 Distribuicao a Priori
A distribuicao a priori dos parametros e dada por,
p(Θ) =
[T∏t=1
p(θt|θt−1,V )
][M∏m=1
p(σm)p(φm)p(hm)
]p(θ0)p(V ). (3.7)
Modelos de convolucao para dados espaco-temporais 56
Como no capıtulo 2, prioris semi-Cauchy (Gelman, 2006) sao utilizadas para cada
um dos parametros σm, φm e hm, m = 1, . . . ,M (ver sub-secao 2.3). As prioris para
θt, t = 1, . . . , T , seguem uma estrutura hierarquica definida pela equacao (3.2). Sao
estabelecidas distribuicoes a priori pouco informativas para θ0 ∼ Np[m0, c0], com c0
grande e V ∼ WIn0(S0), com n0 pequeno.
3.3.3 Distribuicao a Posteriori
A distribuicao a posteriori e obtida combinando a funcao de verossimilhanca e in-
formacao a priori,
p(Θ | Y ) ∝ | Ω |−T2 exp
−1
2
T∑t=1
(Y t − F ′tθt)′Ω−1(Y t − F ′tθt)
(3.8)[
T∏t=1
p(θt|θt−1,V )
][M∏m=1
p(σm)p(φm)p(hm)
]p(θ0)p(V ).
Como a expressao acima nao possui forma fechada, o algoritmo MCMC e utilizado
na amostragem de todos os parametros.
3.4 Aspectos computacionais
O esquema de amostragem a partir do algoritmo MCMC se da a partir das condicionais
completas de todos os parametros (ou blocos de parametros). Utilizamos amostrador
de Gibbs caso o parametro apresente a condicional completa com forma conhecida ou
caso contrario, utilizamos passos de Metropolis - Hastings ou slice sampling.
Modelos de convolucao para dados espaco-temporais 57
Amostrando θ
Os elementos do vetor de estados latentes θ = (θ1, . . . ,θT ) sao amostrados uti-
lizando o algoritmo FFBS ( forward filtering backward sampler) proposto por Fruhwirth-
Schnater (1994) e Carter e Kohn (1994) . Dada a estrutura markoviana da equacao de
sistema de um modelo linear dinamico, esse algoritmo fornece amostras do conjunto
completo de vetores θ = (θ1, . . . ,θT ). Esse metodo de simulacao e mais eficiente que
simular estado por estado, ou seja, a partir das distribuicoes condicionais completas de
cada um dos θt, t = 1, . . . , T .
Para utilizar o FFBS, aproveitamos as equacoes de atualizacao do filtro de Kalman
(West e Harrison, 1997).
Filtro de Kalman
Seja Dt−1 = (y1, . . . ,yt−1) o conjunto de observacoes ate o tempo t− 1 e suponha
conhecida a informacao no tempo t = 0,
(θ0 |D0) ∼ N(m0,C0)
.
Deste modo as equacoes de atualizacao, a cada instante t sao:
• Posteriori em t− 1:
Para alguma media mt−1 e matriz de covariancias Ct−1,
(θt−1 |Dt−1) ∼ N(mt−1,Ct−1)
.
• Posteriori em t,
(θt |Dt−1) ∼ N(at,Rt),
com
Modelos de convolucao para dados espaco-temporais 58
at = Gtmt−1 e Rt = GtCt−1G′t + V .
• Previsao um passo a frente,
(yt |Dt−1) ∼ N(f t,Qt),
com
ft = F ′tat e Qt = F ′tRtF′t + Ω.
• Posteriori em t,
(θt |Dt) ∼ N(mt,Ct),
com
mt = at +At, Ct = Rt −AtQtA′t
At = RtF tQ−t 1 e et = yt − f t.
Todas as medias mt e variancias Ct obtidas pelo filtro de Kalman sao armazenadas
para serem entao utilizadas no algoritmo FFBS descrito a seguir.
Algoritmo: FFBS
• A partir do filtro de Kalman calculamos e guardamos as medias e variancias mt
e Ct, t = 1, . . . , T .
• Amostramos um vetor de (θT | DT ). Neste passo, utilizamos a equacao da
posteriori em T do filtro de Kalman.
• Recursivamente amostramos de (θt−1 | θt,DT ) para t = T − 1, . . . , 2, da sua
distribuicao condicional dada por
Modelos de convolucao para dados espaco-temporais 59
(θt−1 | θt,DT ) ∼ N[(G′tV
−1Gt +C−1t−1)−1(G′tV
−1θt +C−1t−1mt−1), (G′tV
−1Gt +C−1t−1)−1
].
Amostrando θ0
A distribuicao condicional completa de θ0 tem forma conhecida,
(θ0 | Θ−θ0) ∼ N[(C−1
0 +G′1V−1G1
)−1 (C−1
0 m0 +G′1V−1θ1
),(C−1
0 +G′1V−1G1
)−1],
obtida a partir do FFBS.
Amostrando os elementos σm, φm, hm,Os passos de amostragem de cada um dos parametros σm, φm e hm, m = 1, . . .M, no
algoritmo MCMC sao os mesmos que foram apresentados na sub-secao 2.3, adaptando-
se apenas a forma das condicionais completas. Por exemplo, a condicional completa
de σm e dada por,
p(σm | Θσm) ∝| Ω |−T2 exp
−1
2
T∑t=1
(yt − F ′tθt)′Ω−1(yt − F ′tθt)
p(σm) (3.9)
Como as condicionais completas desses parametros nao tem forma conhecida, passos
de Metropolis sao utilizados para σm e φm. A amostragem dos parametros de suavizacao
hm e feita por slice sampling, como descrito no capıtulo 2.
Amostrando V
A distribuicao condicional completa de V possui forma conhecida, e e tambem
Wishart Invertida, dada por
(V | Θ−V ) ∼ WIn∗0 [S∗0], (3.10)
onde n∗0 = pT + 1 e S∗0 = 1n∗0
[∑Tt=1(θt −Gtθt−1)(θt −Gtθt−1)′ + n0S0
].
Modelos de convolucao para dados espaco-temporais 60
3.5 Simulacao
Este exemplo simulado, considera o seguinte modelo de regressao dinamica com n = 40
e T = 400,
Y t = F ′tθt + ωt, ωt ∼ N40[0,Ω]; t = 1, . . . , 400 (3.11a)
θt = θt−1 + νt, νt ∼ N3[0,V ] (3.11b)
onde,
θt = (θt,1, θt,2, θt,3)′,
F ′t =
1 x11 x12
1 x21 x22
.... . .
...
1 xn1 xn2
, ∀t,
V =
σ2
1v 0 0
0 σ22v 0
0 0 σ23v
.
Deste modo, F ′t corresponde a uma matriz de planejamento constituıda por duas
covariaveis supostamente observadas e uma covariavel para o intercepto. As covariaveis
observadas foram geradas de duas distintas distribuicoes normais. Alem disso,Gt = I3.
No processo de simulacao foi considerada a mistura de M = 4 diferentes proces-
sos estacionarios. Os parametros considerados foram σ2 = (1.0, 2.0, 5.0, 1.5), φ =
(0.04, 0.06, 0.08, 0.04). Para obter as componentes de mistura γm(.) foram considera-
dos parametros de suavizacao h = (12, 15, 10, 20). Para simular os estados latentes, a
matriz de covariancia V = diag(0.07, 0.04, 0.09) foi considerada. As observacoes foram
geradas em 40 localizacoes aleatoriamente distribuıdos em D = [0, 100]× [0, 100].
Modelos de convolucao para dados espaco-temporais 61
Prioris pouco informativas foram assumidas para todos os parametros. As dis-
tribuicoes a priori para cada um dos parametros da matriz de covariancia nao-estacionaria
foram semi-Cauchy com c = 30. Para θ0 foi considerado θ0 ∼ N3[0, 100I3].
Foi assumido que V = diag(σ21v, σ
22v, σ
23v). Para o conjunto de variancias σ2
lv,
l = 1, 2, 3, duas prioris foram testadas. Inicialmente distribuicoes a priori Gama In-
vertidas independentes de media 2 e variancia infinita, σ2lv ∼ GI(2, 2) que sao condi-
cionalmente conjugadas, e distribuicoes a priori semi-Cauchy (com c = 30) para a raiz
quadrada destes parametros, σlv, l = 1, 2, 3. No caso em que foram consideradas as
prioris Gamma Invertidas, as distribuicoes condicionais completas de σ2lv, l = 1, 2, 3,
sao independentes e dadas por,
σ2lv | Θ−σ2
lv∼ GI
(α +
T
2, β +
1
2
[T∑t=1
(θt,l − θt−1,l)2
]). (3.12)
Na Tabela 3.1 sao apresentadas as estimativas e intervalos de credibilidade de 95%
dos parametros que nao evoluem no tempo, considerando as prioris Gama Invertida
e semi-Cauchy para os elementos de V . Podemos observar que ao utilizar a priori
Gama Invertida, as estimativas σ1v e σ2v sao sobre-estimadas. Esta situacao parece
fazer referencia a situacao na qual uma priori Gama Invertida aparentemente pouco
informativa influencia as estimativas a posteriori de parametros de variancia, quando
estas variancias sao de fato pequenas (Gelman, 2006).
Nas Figuras 3.1, 3.2 e 3.3 sao apresentadas as densidades marginais a posteriori
dos conjuntos de parametros que constituem a matriz de covariancia espacial nao-
estacionaria, quando sao consideradas as prioris semi-Cauchy para os parametros σlv,
l = 1, 2, 3. As figuras tambem mostram os verdadeiros valores utilizados no processo
de simulacao. Essas figuras e a tabela 3.1 mostram que todos os parametros sao
relativamente bem estimados. Todos os intervalos de credibilidade de 95% contiveram
os parametros utilizados no processo de simulacao.
A Figura 3.4 descreve o comportamento a posteriori dos coeficientes de regressao
ao longo do tempo. Os valores estimados desses parametros acompanham a evolucao
dos verdadeiros coeficientes.
Modelos de convolucao para dados espaco-temporais 62
Tabela 3.1: Valores estimados a posteriori dos parametros e seus respectivos intervalos de cre-
dibilidade de 95% utilizando prioris Gama Invertida (Modelo I) para os parametros σ2lv, l = 1, 2, 3 e
utilizando prioris Semi-Cauchy para os parametros σlv (Modelo II).
Parametro Verdadeiro Modelo I Modelo II
σ21 1.00 0.99 (0.91, 1.09) 0.95 (0.87, 1.06)
σ22 2.00 1.98 (1.83, 2.13) 2.04(1.89, 2.21)
σ23 5.00 5.07 (4.67, 5.52) 4.72 (4.35, 5.08)
σ24 1.50 1.55 (1.43, 1.69) 1.45 (1.35, 1.55)
φ1 0.040 0.040 (0.035, 0.044) 0.044 (0.038, 0.050)
φ2 0.060 0.060 (0.054, 0.067) 0.056 (0.050, 0.062)
φ3 0.080 0.076 (0.066, 0.086) 0.089 (0.080, 0.098)
φ4 0.040 0.040 (0.036, 0.045) 0.042 (0.038, 0.045)
h1 12.0 12.4 (11.8, 12.9) 11.8 (11.2, 12.3)
h2 15.0 16.2 (14.7, 17.8) 14.5 (13.5, 15.8)
h3 5.0 5.1 (4.9, 5.3) 5.0 (4.8, 5.2)
h4 20.0 20.8 (19.5, 22.0) 19.9 (18.2, 21.5)
σ21ν 0.070 0.169 (0.118, 0.252) 0.109 (0.052, 0.194)
σ22ν 0.040 0.048 (0.042, 0.055) 0.044 (0.039, 0.051)
σ23ν 0.090 0.096 (0.084, 0.111) 0.086 (0.074, 0.099)
Modelos de convolucao para dados espaco-temporais 63
1 2 3 4 5
02
46
8
Pos
terio
ri
σσ12 σσ2
2 σσ32σσ4
2
Figura 3.1: Densidades marginais a posteriori dos parametros σ21 , σ2
2 , σ22 e σ2
4 e verdadeiros valores
utilizados na simulacao representados pelas linhas verticais.
0.04 0.06 0.08 0.10
050
100
150
200
Pos
terio
ri
φφ1 == φφ4 φφ2 φφ3
Figura 3.2: Densidades marginais a posteriori dos parametros φ1, φ2, φ3 e φ4 e verdadeiros valores
utilizados na simulacao representados pelas linhas verticais.
Modelos de convolucao para dados espaco-temporais 64
5 10 15 20
01
23
4
Pos
terio
ri
h1 h2h3 h4
Figura 3.3: Densidades marginais a posteriori dos parametros h1, h2, h3 e h4 e verdadeiros valores
utilizados na simulacao representados pelas linhas verticais.
Modelos de convolucao para dados espaco-temporais 65
tempo
θθ 1
0 100 200 300 400
1618
2022
2426
tempo
θθ 2
0 100 200 300 400
01
23
45
6
tempo
θθ 3
0 100 200 300 400
−6
−4
−2
0
Figura 3.4: Evolucao do coeficiente de regressao θt,1, t = 1, . . . , 400, (grafico de cima) ao longo
do tempo (linha cheia escura), estimativas a posteriori (linha azul cheia) e intervalos de credibilidade
de 95% (linhas azuis tracejadas). Os outros dois graficos apresentam os mesmos resultados para θt,2
(grafico do meio) e para θt,3 (grafico de baixo). Os intervalos de credibilidade para θt,2 e θt,3 nao
podem ser vistos nas figuras pois sao demasiadamente pequenos e proximos dos verdadeiros valores.
Capıtulo 4
Modelo dinamico com estrutura de
covariancia espacial dinamica
nao-estacionaria
4.1 Introducao
O objetivo deste capıtulo e permitir que a estrutura de covariancia espacial nao-
estacionaria do modelo dinamico espaco-temporal (3.1) e (3.2) possa mudar ao longo
do tempo. Do ponto de vista das aplicacoes, este modelo se justifica diante a possi-
bilidade de que fenomenos fısicos que ocorram paralelamente ao processo estudado no
tempo possam provocar mudancas na estrutura de covariancia espacial dos processos
estudados.
Como motivacao para o que se pretende, considere o seguinte exemplo. Para M = 4
componentes de misturas e t = 1, . . . , 8 intervalos discretos de tempo, seja Zt(si) =∑4m=1 γm,t(si)Wm(si), onde cada um dos Wm(.) representa um processo estacionario de
media 0 e diferente funcao de covariancia exponencial e cada um dos γm,t(.) representa
uma componente de mistura que evolui de forma diferente no tempo. Observacoes
sao simuladas no tempo t = 1 a partir dos valores gerados Wm(si) e γm,1(si), m =
1, . . . , 4. No tempo, t = 2, os valores observados de Wm(si), sao mantidos fixos, mas
66
Modelos de convolucao para dados espaco-temporais 67
as componentes de mistura evoluem para γm,2(si) segundo alguma funcao. O processo
evolui em t = 3, . . . , 8, de forma analoga a evolucao no tempo 2. A Figura 4.2 mostra
como os processos poderiam entao evoluir na medida em que γm,t(.) evoluısse no tempo
atraves de hm,t (Figura 4.1).
Figura 4.1: Evolucao dos parametros de suavizacao hm,t, m = 1, . . . , 4, nos tempos t = 1, . . . , 8.
4.2 Modelo Geral
Seja Y t = (Yt(s1), . . . , Yt(sn))′ o processo observado nas localizacoes s1, . . . , sn no
tempo t, t = 1, . . . , T . O modelo dinamico espaco-temporal de estrutura espacial nao-
estacionaria evoluindo no tempo e dado pelo conjunto de equacoes (4.1), (4.2), (4.3) e
(4.4) descritas a seguir.
Modelos de convolucao para dados espaco-temporais 68
Figura 4.2: Evolucao dos processos Zt(si) na medida em que os parametros de suavizacao hm,t
variam em t = 1, . . . , 8. Os valores de hm,t estao representados como raios das circunferencias indi-
cadas.
Y t = F ′tθt + ωt, ωt ∼ Nn[0,Ωt] (4.1)
θt = Gtθt−1 + νt, νt ∼ Np[0,V ] (4.2)
e distribuicao a priori θ0 ∼ Np(m0, c0),V ∼ WIn0(S0).
Como definido no capıtulo 3, θt = (θt,1, . . . , θt,p)′ e um vetor de estados, F t e Gt sao
matrizes constituıdas de elementos conhecidos e WI representa a distribuicao Wishart
Invertida. E suposto que ωt e νt sejam independentes e mutuamente independentes.
Cada elemento de Ωt e dado por,
Ωi,j,t = Cov[Yt(si), Yt(sj)] (4.3)
=M∑m=1
γm,t(si)γm,t(sj)Cov[Wm(si),Wm(sj)],
ondeWm(.) , m = 1, . . . ,M , sao processos estacionarios tais que Cov[Wm(si),Wm′(sj)] =
0 para m 6= m′.
Modelos de convolucao para dados espaco-temporais 69
Cada uma das componentes de mistura γm,t(s) e definida a partir de pesos relativos
de nucleos contınuos km,t(s) que mudam ao longo do tempo atraves da relacao
γm,t(s) =km,t(s)∑M
m′=1 km′,t(s),
e portanto, satisfazem a restricaoM∑m=1
γm,t(s) = 1. Alem disso, os nucleos km,t(s)
satisfazem a km,t(s) = k(s − um;hm,t), isto e, a variacao desses nucleos ao longo do
tempo e causada apenas pela mudanca de hm ao longo do tempo.
A estrutura dinamica em hm,t e construıda da seguinte forma. Seja ht = (h1,t, . . . , hM,t),
os M parametros de suavizacao considerados no tempo t. Assumindo que hm,t e hm′,t
sejam independentes para todo m 6= m′, ht segue uma distribuicao log-normal multi-
variada:
(ht | ht−1) ∼ logN(τ t−1,ψt−1) (4.4)
onde τ t−1 = (τ1,t−1, . . . , τM,t−1) e ψt−1 = diag(ψ1,t−1, . . . , ψM,t−1). Cada um dos
parametros ψm,t−1 e τm,t−1 sao definidos de modo que cada um dos parametros de
suavizacao hm,t tenha distribuicao log-normal com E [hm,t|hm,t−1] = hm,t−1 e variancia
constante no tempo para cada componente m, V ar [hm,t|hm,t−1] = λ2h,m. Para isso,
τm,t−1 e ψm,t−1 sao parametrizados da seguinte forma:
ψm,t−1 = log
(1 +
λ2h,m
h2m,t−1
), (4.5)
τm,t−1 = log(hm,t−1)− 1
2ψm,t−1. (4.6)
Modelo de parametros de suavizacao constantes no tempo
O modelo dinamico descrito no Capıtulo 3, segue diretamente, fazendo λ2h,m = 0 para
todo m.
Neste caso, segue que V ar [hm,t|hm,t−1] = 0 e portanto, ψm,t−1 = 0 e τm,t−1 =
log(hm,t−1) de modo que a distribuicao log-normal se degenera a hm,t = hm,t−1 = hm,
Modelos de convolucao para dados espaco-temporais 70
para todo t.
Modelo com parametros de suavizacao variando em intervalos de tempos
maiores
Embora o modelo geral descrito na secao 4.2 seja teoricamente plausıvel, nossas con-
clusoes obtidas a partir de exercıcios de simulacao mostram que ao considerar os
parametros de suavizacao evoluindo concomitantemente com os dados, conduz a pro-
blemas de identificabilidade, que interfere na estrutura da posteriori dos parametros,
implicando em problemas de convergencia.
Deste modo, vamos assumir que os parametros de suavizacao evoluam em intervalos
de tempos discretos maiores do que evoluam as observacoes Y t, t = 1, . . . , T . Para fa-
cilitar as expressoes que virao a seguir, suponha que o intervalo de tempo t = 1, . . . , T
possa ser particionado em B sub-intervalos de mesmo tamanho l. De fato, o inter-
valo t = 1, . . . , T tambem poderia ser particionado em B sub-intervalos de tamanhos
quaisquer bastando fazer pequenas modificacoes nas equacoes que vem a seguir.
Vamos supor que para cada tempo b′, b = 1, . . . , B, hm,l(b−1)+1 = . . . = hm,lb e
denotar este conjunto de parametros de suavizacao que sao iguais no tempo b′, por
hm,b′ . Por exemplo, hm,1′ representa os primeiros l parametros de suavizacao que sao
iguais, hm,1 = . . . = hm,l = hm,1′ , na unidade de medida do tempo t. Feitas estas
consideracoes, segue que Ωl(b−1)+1 = . . . = Ωlb = Ωb′ .
A estrutura dinamica em hm,b′ e construıda analogamente aquela descrita na secao
4.2. Seja hb′ = (h1,b′ , . . . , hM,b′), as M componentes de mistura no tempo b′. Assumindo
que hm,b′ e hm′,b′ sao independentes para todo m, hb′ segue uma distribuicao log-normal
multivariada:
(hb′ | h(b−1)′) ∼ logN(τ (b−1)′ ,ψ(b−1)′) (4.7)
onde τ (b−1)′ = (τ1,(b−1)′ , . . . , τM,(b−1)′) e ψ(b−1)′ = diag(ψ1,(b−1)′ , . . . , ψM,(b−1)′). Os
parametros ψm,(b−1)′ e τm,(b−1)′ sao definidos de modo que cada um dos parametros
de suavizacao hm,b′ tenha distribuicao log-normal com E[hm,b′ |hm,(b−1)′
]= hm,(b−1)′ e
Modelos de convolucao para dados espaco-temporais 71
variancia constante no tempo dentro de cada sub-regiao m, V ar[hm,b′ |hm,(b−1)′
]= λ2
h,m.
Para isso, τm,(b−1)′ e ψm,(b−1)′ sao parametrizados como:
ψm,(b−1)′ = log
(1 +
λ2h,m
h2m,(b−1)′
), (4.8)
τm,(b−1)′ = log(hm,(b−1)′)−1
2ψm,(b−1)′ . (4.9)
O procedimento de inferencia e aspectos computacionais descritos a seguir levam
em consideracao o modelo descrito acima que considera os parametros de suavizacao
variando em intervalos de tempos maiores.
As seguintes suposicoes a respeito do nucleo e funcao de covariancia sao assumidas.
Vamos considerar o seguinte nucleo Gaussiano que pode evoluir no tempo a partir de
hm,t, dado por
km,t(si) =1
2π|Λm,t|−
12 exp
−1
2(si − um)′Λ−1
m,t(si − um)
,
onde Λm,t =
h2m,t 0
0 h2m,t
.
Vamos supor que os processos estacionarios de mistura sejam isotropicos e Gaus-
sianos com variancia σ2m e funcao de correlacao espacial de amplitude 1/φm, para
m = 1, . . . ,M ,
Wm(.) ∼ PG(0, σ2
m exp(−φm|si − sj|)), (4.10)
de modo que a funcao de covariancia do modelo proposto (4.3) e dada por,
Cov[Z(si), Z(sj)] =∑M
m=1 γm,t(si)γm,t(sj)σ2m exp(−φm|si − sj|).
Neste caso, podemos utilizar a seguinte notacao matricial para representar a matriz
Ωt,
Ωt =∑M
m=1σ2mAm,tR(φm)Am,t, (4.11)
onde Am,t = diag(γm,t(s1−um), . . . , γm,t(sn−um)) e [R(φm)]i,j = exp(−φm|si− sj|).
Modelos de convolucao para dados espaco-temporais 72
4.3 Inferencia
4.3.1 Verossimilhanca
Sejam θ = (θ1, . . . ,θT ), σ = (σ1, . . . , σM), φ = (φ1, . . . , φM), h = (h2′ , . . . ,hB′),
λh = (λh,1, . . . , λh,M) e defina Θ = (θ,θ0,σ,φ,h,h1′ ,λh,V ) o conjunto de todos os
parametros do modelo. Dado um conjunto de observacoes realizadas Y = (Y 1, . . . ,Y T )′,
a funcao de verossimilhanca e dada por,
p(Y | Θ) ∝T∏t=1
| Ωt |−12 exp
−1
2(Y t − F ′tθt)′Ω−1
t (Y t − F ′tθt). (4.12)
Desde que Ωl(b−1)+1 = . . . = Ωlb = Ωb′ para b = 1, . . . , B, esta verossimilhanca pode
ser reescrita como,
p(Y | Θ) ∝B∏b=1
| Ωb′ |−l2 exp
−1
2
T∑t=1
(Y t − F ′tθt)′Ω−1t (Y t − F ′tθt)
. (4.13)
4.3.2 Distribuicao a Priori
A distribuicao a priori dos parametros e dada por,
p(Θ) =
[T∏t=1
p(θt|θt−1,V )
][M∏m=1
p(σm)p(φm)p(hm)
][B∏b=2
p(hb′|h(b−1)′)
][
M∏m=1
p(λh,m)
]p(θ0)p(V )p(h1′). (4.14)
Distribuicoes a priori semi-Cauchy (Gelman, 2006) pouco informativas sao uti-
lizadas para cada um dos parametros σm, φm, hm e λh,m(ver sub-secao 2.3). As prioris
para θt seguem uma estrutura hierarquica descrita pela equacao (4.2). Sao estabele-
cidas tambem, prioris pouco informativas para θ0 ∼ Np[m0, c0], V ∼ Wn0(S0) e
h1′ ∼ logN [τ 0′ ,ψ0′ ].
Modelos de convolucao para dados espaco-temporais 73
4.3.3 Distribuicao a Posteriori
A distribuicao a posteriori e obtida combinando a funcao de verossimilhanca e in-
formacao a priori,
p(Θ | Y ) ∝B∏b=1
| Ωb′ |−l2 exp
−1
2
T∑t=1
(Y t − F ′tθt)′Ω−1t (yt − F ′tθt)
[
T∏t=1
p(θt|θt−1,V )
][M∏m=1
p(σm)p(φm)p(hm)
][B∏b=2
p(hb′|h(b−1)′)
][M∏m=1
p(λh,m)
]p(θ0)p(V )p(h1′). (4.15)
Como a expressao acima nao possui forma fechada o algoritmo MCMC e utilizado
para amostrar todos os parametros.
4.4 Aspectos computacionais
O esquema de amostragem a partir do algoritmo MCMC se da a partir das condicionas
completas de todos os parametros (ou blocos de parametros). Utilizamos o amostrador
de Gibbs caso o parametro apresente a condicional completa com forma conhecida ou
caso contrario, utilizamos passos de Metropolis.
Amostrando θ e θ0
As componente de θ sao amostrados utilizando o mesmo algoritmo FFBS descrito
na sub-secao 3.4, substituindo Ω por Ωt. O mesmo vale para θ0.
Amostrando os elementos hb′, b = 2, . . . , B − 1
A condicional completa do vetor de parametros de suavizacao hb′ = (h1,b′ , . . . , hM,b′),
para b = 2, . . . , B − 1 e dada por,
Modelos de convolucao para dados espaco-temporais 74
p(hb′ | Θ−hb′ ) ∝ | Ωb′ |−l2
l∏q=1
exp
−1
2(ybl−q+1 − F ′tθbl−q+1)′Ω−1
j′ (ybl−q+1 − F ′tθbl−q+1)
p(h(b+1)′ |hb′)p(hb′ |h(b−1)′). (4.16)
Desde que (hb′ | h(b−1)′) segue a distribuicao log-normal descrita em (4.4),
p(h(b+1)′|hb′) ∝M∏m=1
ψ−0.5m,b′ exp
−1
2(g(b+1)′ − τ b′)′ψ−1
b′ (g(b+1)′ − τ b′),
p(hb′ |h(b−1)′) ∝M∏m=1
h−1m,b′ exp
−1
2(gb′ − τ (b−1)′)
′ψ−1(b−1)′(gb′ − τ (b−1)′)
,
onde gb′ = log(hb′).
Como a condicional completa nao tem forma conhecida, utilizamos passos de Metropolis-
Hastings para amostrar cada bloco hb′ . Alguns cuidados devem ser tomados na escolha
da distribuicao proposta. O algoritmo e descrito a seguir.
Algoritmo: Metropolis-Hastings para hb′ .
A cada passo da iteracao i+ 1 do algoritmo de Metropolis-Hastings,
• Gere cada elemento h(p)m,b′ do vetor h
(p)b′ proposto, a partir de uma proposta de
transicao log-normal com media h(i)m,b′ e variancia ∆h constante,
h(p)m,b′ ∼ logN
[log(h
(i)m,b′)−
1
2log
(1 +
∆h
(h(i)m,b′)
2
), log
(1 +
∆h
(h(i)m,b′)
2
)].
• Aceite h(p)b′ com probabilidade,
B(h(i)b′ ,h
(p)b′ ) = min
1,p(h
(p)b′ | Θ
(i)−hb′
)q(h(p)b′ → h
(i)b′ )
p(h(i)b′ | Θ
(i)−hb′
)q(h(i)b′ → hpb′)
onde q(.) e a densidade da proposta de transicao e p(.) e fornecido pela equacao
(4.16).
Modelos de convolucao para dados espaco-temporais 75
Amostrando h1′
A condicional completa de h1′ = (h1,1′ , . . . , hM,1′) e dada por,
p(h1′ | Θ−h1′) ∝ | Ω1′ |−
l2
l∏q=1
exp
−1
2(yq − F ′tθq)′Ω−1
1′ (yq − F ′tθq)
p(h2′|h1′)p(h1′). (4.17)
onde,
p(h2′ |h1′) ∝M∏m=1
ψ−0.5m,1′ exp
−1
2(g2′ − τ 1′)
′ψ−11′ (g2′ − τ 1′)
.
p(h1′) ∝M∏m=1
h−1m,1′ exp
−1
2(g1′ − τ 0′)ψ
−10 (g1′ − τ 0′)
.
O esquema de amostragem e feito atraves por Metropolis-Hastings de modo similar
ao algoritmo utilizado em hb′ , b = 2, . . . , B − 1.
Amostrando hB′
A condicional completa de hB′ = (h1,B′ , . . . , hM,B′) e dada por,
p(hB′ | Θ−hB′ ) ∝ | ΩB′ |−l2
l∏q=1
exp
−1
2(yBl−q+1 − F ′tθBl−q+1)′Ω−1
B′ (yBl−q+1 − F ′tθBl−q+1)
p(hB′ |h(B−1)′). (4.18)
onde,
p(hB′ | h(B−1)′) ∝M∏m=1
h−1m,B′ exp
−1
2(gB′ − τ (B−1)′)
′ψ−1(B−1)′(gB′ − τ (B−1)′)
.
O esquema de amostragem e feito por Metropolis-Hastings de modo similar ao
algoritmo utilizado em hb′ , b = 2, . . . , B − 1.
Modelos de convolucao para dados espaco-temporais 76
Amostrando os elementos σm, φm, m = 1, . . . ,M
Por aproveitarem da mesma estrutura da funcao de verossimilhanca e terem dis-
tribuicoes a priori semi-Cauchy, os passos de amostragem de cada um dos parametros
σme φm no algoritmo MCMC sao parecidos aos do Capıtulo 2.
As condicionais completas para σm e φm sao proporcionais a,
p(σm | Θσm) ∝B∏b=1
| Ωb′ |−l2
T∏t=1
exp
−1
2(yt − F ′tθt)′Ω−1
t (yt − F ′tθt)p(σm). (4.19)
p(φm | Θσm) ∝B∏b=1
| Ωb′ |−l2
T∏t=1
exp
−1
2(yt − F ′tθt)′Ω−1
t (yt − F ′tθt)p(φm). (4.20)
Amostrando V
A condicional completa de V possui forma conhecida , e e Wishart Invertida,
(V | Θ−V ) ∼ WIn∗0 [S∗0], (4.21)
onde n∗0 = pT + 1 e
S∗0 =1
n∗0
[T∑t=1
(θt −Gtθt−1)(θt −Gtθt−1)′ + n0S0
].
Amostrando λh,m, m = 1, . . . ,M
A condicional completa de cada λh,m, o desvio-padrao de (hm,1′ , . . . , hm,B′), m =
1, . . . ,M e proporcional a,
p(λh,m | Θ−λh,m) ∝
[B∏b=2
p(hm,b′|hm,(b−1)′)
]p(λh,m).
Por nao ter distribuicao condicional completa conhecida, λh,m e amostrado por
Metropolis-Hastings.
Modelos de convolucao para dados espaco-temporais 77
4.5 Simulacao
Neste exercıcio de simulacao, um modelo dinamico de primeira ordem e considerado
fixando n = 100, T = 1200, B = 15 e M = 4,
Y t = θt + ωt, ωt ∼ N100[0,Ωt] (4.22)
θt = θt−1 + νt, νt ∼ N100[0, σ2νIn],
onde Ωi,j,t = Cov[Yt(si), Yt(sj)] =∑4
m=1 γm,t(si)γm′,t(sj)σ2m exp(−φm|si−sj|) e hm,l(b−1)+1 =
. . . = hm,lb = hm,b′ , para b = 1, . . . , 15.
Alem disso,
(hm,b′ | hm,(b−1)′) ∼ logN(τm,(b−1)′ , ψm,(b−1)′). (4.23)
onde ψm,(b−1)′ e τm,(b−1)′ sao como definidos em (4.5) e (4.6).
Note que como T = 1200 e B = 15 estamos assumindo que os parametros de
suavizacao estao evoluindo a cada 80 unidades de tempo dos dados.
Os valores considerados para os parametros foram σ2 = (1.0, 2.0, 5.0, 1.5), φ =
(0.04, 0.06, 0.08, 0.04). Para simplificar, foi considerada uma mesma variancia na evolucao
dos parametros de suavizacao, λ2h,1, . . . , λ
2h,4 = λ2
h igual a 0.5. Os valores de ht foram
gerados a partir de um vetor inicial (12, 15, 10, 20). O valor de σ2ν foi fixado em 0.5.
Fixados os parametros e valores acima, observacoes foram geradas em 100 loca-
lizacoes em D = [0, 100]× [0, 100] ao longo de T = 1200 unidades de tempo.
Foram assumidas prioris pouco informativas, θ0 ∼ Nn[0, 100I1200] ,σ2ν ∼ GI(2, 2)
e h1′ ∼ logN [1, diag(100)]. Como neste caso, V = σ2νIn, a distribuicao a condicional
completa de σ2ν e:
σ2ν | Θ−σ2
ν∼ GI
(α +
nT
2,1
2
[T∑t=1
(θt − θt−1)′(θt − θt−1) + β
]).
Na Tabela 4.1 sao apresentadas as estimativas e intervalos de credibilidade de 95%
dos parametros que nao evoluem no tempo.
Modelos de convolucao para dados espaco-temporais 78
Tabela 4.1: Valores estimados a posteriori dos parametros que nao evoluem no tempo e seus
respectivos intervalos de credibilidade de 95% .
Intervalo de credibilidade
Parametro Verdadeiro Estimado 2.5% 97.5%
σ21 1.00 1.03 0.99 1.07
σ22 2.00 2.01 1.93 2.09
σ23 5.00 5.07 4.94 5.23
σ24 1.50 1.54 1.49 1.60
φ1 0.040 0.038 0.036 0.040
φ2 0.060 0.060 0.057 0.063
φ3 0.080 0.080 0.078 0.083
φ4 0.040 0.039 0.037 0.041
λ2h 0.50 0.55 0.32 0.97
σ2ν 0.50 0.50 0.48 0.51
Nas Figuras 4.3 e 4.4 sao apresentadas as densidades marginais a posteriori dos
conjuntos de parametros σ2 = (σ21, . . . , σ
24) e φ = (φ1, . . . , φ4) e os verdadeiros valores
utilizados no processo de simulacao. Essas figuras e a tabela 4.1 mostram que todos os
parametros sao bem estimados. Todos os intervalos de credibilidade de 95% contiveram
o verdadeiros valores dos respectivos parametros utilizados na simulacao.
A Figura 4.5 descreve a evolucao de θt,10, t = 1, . . . 1200 e os intervalos de credi-
bilidade de 95% desses parametros. Os intervalos acompanham a verdadeira evolucao
temporal deste parametro. O mesmo ocorre para outros parametros θt,i, i 6= 10.
A Figura 4.6 apresenta a evolucao de cada um dos parametros de suavizacao hm,b′ ,
b′ = 1, . . . , 15. Cada um dos 4 parametros estimados a posteriori acompanham as
evolucoes temporais de seus respectivos verdadeiros valores. Os verdadeiros valores
hm,b′ utilizados na simulacao dos dados estao contidas nos respectivos intervalos de
credibilidade de 95%.
Modelos de convolucao para dados espaco-temporais 79
1 2 3 4 5
05
1015
20
Pos
terio
ri
σσ12 σσ2
2 σσ32σσ4
2
Figura 4.3: Densidades marginais a posteriori dos parametros σ21 , σ2
2 , σ22 e σ2
4 e verdadeiros valores
utilizados na simulacao representados pelas linhas verticais.
0.04 0.05 0.06 0.07 0.08
010
020
030
040
0
Pos
terio
ri
φφ1 == φφ4 φφ2 φφ3
Figura 4.4: Densidades marginais a posteriori dos parametros φ1, φ2, φ3 e φ4 e verdadeiros valores
utilizados na simulacao representados pelas linhas verticais.
Modelos de convolucao para dados espaco-temporais 80
0 200 400 600 800 1000 1200
−50
510
1520
25
tempo
θθ 10
Figura 4.5: Evolucao de θt,10 (pontos), para t = 1, . . . , 1200 e intervalo de credibilidade de 95%
desses parametros a posteriori (linha tracejada azul).
2 4 6 8 10 12 14
1011
1213
14
tempo
h 1
2 4 6 8 10 12 14
1113
15
tempo
h 2
2 4 6 8 10 12 14
910
1214
tempo
h 3
2 4 6 8 10 12 14
1820
2224
tempo
h 4
Figura 4.6: Evolucoes de hm,b′ , m = 1, . . . , 4 e b = 1, . . . , 15 simulados (linha cheia escura), valores
estimados (linha cheia azul) e intervalos de credibilidade de 95% (linha tracejada azul).
Capıtulo 5
Aplicacao
5.1 Introducao
As alteracoes climaticas tem sido tema de grande interesse publico e muitas linhas de
investigacao em todo o mundo, em diferentes areas da Ciencia. O ultimo relatorio
divulgado pela instituicao ganhadora do Nobel International Panel Climate Change
(IPCC, 2007) indica um aumento medio no aquecimento global e uma projecao de
aproximadamente 0.2 graus Celsius por decada. De fato, ha evidencias conflitantes no
que diz respeito deste controverso topico.
Embora o European Climate Support Network (ECSN, 1995) relate um aumento
da temperatura no ultimo seculo na maior parte da Europa, ha evidencias conflitantes
sobre este assunto. Por exemplo, Sahsamanoglou e Makrogiannis (1991) analisam
as diferencas de tendencias de temperaturas ao longo da regiao do Mediterraneo nos
ultimos 40 anos. A diversidade fisiografica e os inumeros efeitos sofridos pela regiao
levam a uma diferenciacao dos efeitos ocorridos no leste e oeste da regiao. Um efeito
resfriamento ou falta de qualquer tendencia e observada no leste, enquanto um efeito
de aquecimento e observado na regiao oeste.
Esta variabilidade e esperada e e principalmente devida a variabilidade climatica
natural, alem da nebulosidade, gases de efeito estufa, aerossois e ciclos de carbono
troposfericos, bem como fatores locais, tais como o crescimento urbano, irrigacao e
81
Modelos de convolucao para dados espaco-temporais 82
desertificacao. A presenca de importantes caracterısticas locais e as mudancas ocorridas
tornam relevantes o estudo das alteracoes climaticas ao nıvel regional.
O estado do Rio de Janeiro possui uma area de 43.653 km2 e uma ampla diversidade
fısica, incluindo montanhas, planıcies e alguns declives acentuados nas proximidades do
litoral. Essa diversidade contribui para um clima variando de tropical a mesotermal,
com perıodos que variam de secos a umidos. A dispersao populacional e altamente
irregular, de muito alta densidade em torno da baıa de Guanabara onde reside sua
capital, ate uma baixa densidade em suas regioes centro-sul e nordeste.
O objetivo deste trabalho e analisar as mudancas climaticas que ocorreram no
estado a partir de dados de temperatura coletados por estacoes de monitoramento em
todo o estado durante as ultimas decadas. O modelo estatıstico e baseado em uma
especificacao hierarquica na qual os dados sao modelados atraves de uma estrutura de
regressao para a media e uma representacao espacial nao-estacionaria para o termo de
ruıdo espacialmente estruturado. Ao termo de regressao tambem contem dependencia
espacial atraves de seus coeficientes e suas covariaveis.
5.2 Modelo para variacoes na temperatura
Os dados se constituem das temperaturas mınimas mensais registradas entre Janeiro de
1961 a Dezembro de 2000, totalizando T = 480 instantes de tempo, em n = 37 locais
no estado do Rio de Janeiro, como apresentado na Figura 5.1. Os dados sao reco-
lhidos por diferentes instituicoes governamentais, ligadas a rede do Instituto Nacional
de Meteorologia (INMET) e ao Centro de Previsao de Tempo e Estudos Climaticos
(CPTEC) do Instituto Nacional de Pesquisas Espaciais (INPE). Cada valor observado
de temperatura yt(si) no local si, i = 1, . . . , n e tempo t, t = 1, . . . , T , e explicado como
a soma de uma media dependente do espaco e do tempo e uma componente espacial
nao-estacionaria
yt(si) = µt(si) + εt(si). (5.1)
Modelos de convolucao para dados espaco-temporais 83
Formulacoes alternativas podem tambem ser consideradas. Por exemplo, a inclusao
de termos de erros nao estruturados com um erro de medida e/ou efeito pepita ou
correlacao temporal entre os erros.
A estrutura media e dada por uma forma linear com variaveis explicativas que
podem mudar no tempo e espaco
µt(s) =∑p
βp(s, t)fp(s, t), (5.2)
onde fp(s, t) sao variaveis relevantes para temperatura e βp(si, t) sao seus respectivos
coeficientes. Os efeitos dos valores das covariaveis podem mudar no espaco, como em
Gelfand, Kim, Sirmans, e Banerjee (2003) e Paez, Gamerman, e de Oliveira (2005b), ou
no espaco e tempo, como em Huerta, Sanso, e Stroud (2004) e Gelfand et al. (2005a).
As covariaveis consideradas nesta aplicacao foram a altitude, um harmonico de
perıodo 12 para representar o ciclo sazonal da temperatura em um ano e o tempo.
A mudanca climatica no tempo e determinada por caracterısticas globais e locais.
Portanto, poderia ser inadequado assumir ela como fixa no espaco. O efeito do tempo
βt e assumido ser espacialmente estruturado e modelado de acordo com um processo
Gaussiano isotropico para permitir aumentos/decrescimentos diferentes em cada local.
Assim, o vetor de coeficientes do efeito do tempo β = (β1, . . . , βn) e estruturado como
β ∼ N[b1, σ2
β exp (−φβ|si − sj|)]. (5.3)
A media global b representa a tendencia global para toda regiao, mas cada localizacao
pode ter um efeito diferente do tempo em sua temperatura. Os hiperparametros σ2β e
φβ controlam a incerteza sobre a regiao de interesse a respeito da tendencia media b
dos efeitos especıficos dos locais e a similaridade espacial entre eles, respectivamente.
5.2.1 Modelando a estrutura nao-estacionaria
O modelo de misturas apresentado nos capıtulos anteriores e considerado aqui. Como
definido no Capıtulo 2, sao considerados M diferentes centros u1, . . . ,uM localizados
em uma regiao D. Processos estacionarios Wm(.) de media 0, com funcao de covariancia
que dependem de parametros ηm e componentes de mistura γm(.) sao associados a
Modelos de convolucao para dados espaco-temporais 84
Figura 5.1: Localizacoes das estacoes de monitoramento e centros das componentes no estado do
Rio de Janeiro.
cada um dos centros um, para m = 1, ...,M . Deste modo, a componente espacial
nao-estacionaria e dada por
ε(s) =M∑m=1
γm(s)Wm(s), (5.4)
para cada localizacao s ∈ D.
Novamente e utilizada a restricaoM∑m=1
γm(si) = 1, de modo que cada componente
de mistura γm(s) representa o peso relativo de uma funcao nucleo contınua km(s), que
depende de um parametro de suavizacao hm de acordo com
γm(s− um) =km(s)∑M
m′=1 km′(s), ∀s ∈ D. (5.5)
Modelos de convolucao para dados espaco-temporais 85
A formulacao do modelo (5.4) implica que ε(·) e um processo espacial de media 0 e
funcao de covariancia
Cov (ε(si), ε(sj)) =M∑m=1
γm(si)γm(sj)Cov (Wm(si),Wm(sj)) . (5.6)
Nesta aplicacao os nucleos sao assumidos como Gaussianos e os processos esta-
cionarios de mistura assumidos serem isotropicos e Gaussianos com variancia σ2m e
funcao de correlacao exponencial de amplitude 1/φm, para m = 1, ...,M .
5.2.2 Inferencia dos parametros do modelo
Sejam as observacoes denotadas por Y = (Y ′1, . . . ,Y′T )′, onde Y t = (Yt(s1), . . . , Yt(sn))′,
t = 1, . . . , T . Entao, o modelo dado por (5.1), (5.2), (5.3) e (5.4) pode ser escrito na
forma matricial como
Y ∼ N [Xβ,Ω⊗ IT ]
β ∼ N [b1n,W ]
onde β =(β, β
)′, β = (β0, βx, βc, βs) e o vetor dos coeficientes de regressao fixados,
os elementos de Ω sao dados por Ωi,j =∑M
m=1 γm(si)γm(sj)σ2m exp (−φm|si − sj|) e os
elemento de W por W i,j = σ2β exp (−φβ|si − sj|), 1n e o vetor n-dimensional de 1’s e
In e a matriz identidade n-dimensional.
Denotando por σ = (σ1, . . . , σM), φ = (φ1, . . . , φM) e h = (h1, . . . , hM), o conjunto
de parametros a serem estimados e Θ = (β, b, σβ, φβ,h,σ,φ). A funcao de verossimi-
lhanca e
L(Θ;Y ) ∝T∏t=1
|Ω|−12 exp
−1
2(Y t −X tβ)′Ω−1 (Y t −X tβ)
, (5.7)
onde X t e a sub-matriz de X correspondente ao tempo t. A distribuicao a priori para
os coeficientes de regressao fixados e a media b dos coeficientes do tempo sao assumidas
independentes e vagas com variancias grandes ω e c0 respectivamente. Alem disso, e
Modelos de convolucao para dados espaco-temporais 86
assumido que os parametros da media mencionados acima sao independentes dos outros
parametros.
Como discutido no Capıtulo 2, distribuicoes a priori semi-Cauchy foram assumi-
das para os parametros de suavizacao, variancias e amplitude (range) que definem o
processo nao-estacionario.
A combinacao das especificacoes das prioris acima com a verossimilhanca (5.7)
fornece a distribuicao a priori via teorema de Bayes. Dada a complexidade desta ex-
pressao um algoritmo hıbrido MCMC com amostrador de Gibbs, passos de Metropolis-
Hastings e slice sampling foi utilizado.
5.2.3 Aspectos computacionais
A distribuicao condicional completa de β e dada por
[β|Θ−β,Y ] ∼ N[βp,V p
], (5.8)
onde V p =(V −1 +
∑Tt=1X
′
tΩ−1X t
)−1
, βp = V p
(V −1µβ +
∑Tt=1X
′
tΩ−1Y t
), µβ =(
b, b1n
)′e V = diag (ω,W ). A distribuicao condicional completa de b e facil-
mente obtida como [b|Θ−b,Y ] ∼ N [m1, c1], com c1 =(1′W−11 + c−1
0
)e m1 =
c1
(1′W−1β +m0c
−10
).
Cada parametro σβ, φβ, σm e φm, m = 1, . . . ,M e amostrado individualmente com
passos de Metropolis. A amostragem dos parametros de suavizacao e realizada atraves
de slice sampling (Capıtulo 2).
5.2.4 Dados faltantes e interpolacao
Uma caracterıstica comum de conjunto de dados de meio-ambiente e a ausencia de
dados em trechos de tempo. Isto pode ser causado por uma serie de razoes, incluindo
a manutencao da estacao, falha inesperada do equipamento de medicao, dentre outros.
Dados faltantes devem ser manuseados e contabilizados no procedimento de inferencia.
Para algum tempo t dado, o modelo induz uma distribuicao normal conjunta para o
vetor de dados nao-observados Y not e dados observados Y o
t com matriz de covariancia
Modelos de convolucao para dados espaco-temporais 87
Ω, que depende dos parametros do modelo Θ. Assim, um exercıcio simples para obter
a distribuicao condicional completa dos dados faltantes e considerar [Y not |Y o
t ,Θ] ∼N[Xno
t β + Ω12Ω−122 (Y o
t −Xotβ) ,Ω11 −Ω12Ω
−122 Ω′12
]. As matrizes Ω11, Ω12 e Ω22 sao
os blocos correspondentes de Ω. Como essa e a distribuicao e condicional completa
de Y not , ela pode ser facilmente amostrada. Assim, o dado faltante e naturalmente
incorporado ao ciclo do MCMC.
Comentarios parecidos podem ser feitos sobre a interpolacao das observacoes para
qualquer outro local da regiao de interesse. Este exercıcio de interpolacao e usualmente
referido como krigagem e fornece uma estrutura natural de passar as informacoes dos
locais monitorados para toda a regiao de interesse. Para isso no entanto, uma operacao
semelhante a krigagem deve ser realizada previamente aos coeficientes de regressao
dependentes espacialmente.
5.3 Exemplo simulado
Esta secao e utilizada para ilustrar a adequacao do modelo, do procedimento de
amostragem e tambem da selecao do numero de componentes. Dados foram simulados
em condicoes semelhantes aos dados originais de temperatura observados no estado do
Rio de Janeiro. Em particular, as localizacoes seguem o padrao das 37 estacoes de
monitoramento dos dados reais e os centros das componentes sao os mesmos utilizados
na analise dos dados reais.
Quatro centros de componentes u2, u3, u4 e u5 foram utilizados na geracao dos
dados. Um centro adicional u1, com h1 ≈ 0 que nao possui efeito no processo e
incluıdo no modelo para ser testado. Como nos exemplos simulados do Capıtulo 2, e
esperado que um procedimento inferencial apropriado possa estimar h1 proximo de 0,
confirmando a irrelevancia desta componente.
Os hiperparametros restantes foram tomados como σ22 = 1.4, σ2
3 = 35.7, σ24 = 2.9,
σ25 = 0.5, φ2 = 8.4 × 10−1, φ3 = 1.7 × 10−4, φ4 = 6.7 × 10−2, φ5 = 8.3 × 10−1 ,
h2 = 90.2, h3 = 110.5, h4 = 77.1 e h5 = 78.1. Foi tambem assumido que b = 9.6× 10−4
e β foi gerado com φβ = 10−3 e σ2β = 3.4 × 10−5. A maior parte destes valores
Modelos de convolucao para dados espaco-temporais 88
representam condicoes semelhantes as encontradas na analise dos dados reais. As
correlacoes observadas variam de 0.6 a 0.9. Finalmente, Y = (Y ′1, . . . ,Y′T )′ foi gerado
com T = 480 tempos e utilizando a matriz de planejamento dos dados reais X.
Na pratica, informacoes sobre os hiperparametros nao sao geralmente disponıveis.
Assim, foi inicialmente assumido um suporte grande de 0 a 250 kms para os 5 parametros
de suavizacao hm consideradas, m = 1, . . . , 5. Este e um limite bastante significativo
desde que maxm hm = 110.5. Foram assumidas distribuicoes semi-Cauchy para os
parametros com c = 30. A Figura 5.2 apresenta a verossimilhanca perfilada de cada
parametro de suavizacao hm, onde a concentracao em torno de 0 somente e observada
para a componente nao existente no. 1. A Figura 5.3 mostra os tracos dos 5 parametros
de suavizacao. Ela mostra que elas sao mal estimadas e a distribuicao de h1 se acu-
mulam no limite superior do intervalo. Esses sao claras indicativos de problemas de
convergencia e como discutido no Capıtulo 2 indicam h1 concentrado proximo de 0.
O algoritmo foi reiniciado com um suporte menor [0, 50], somente para h1. A Figura
5.4 mostra que todos os parametros de suavizacao sao agora bem estimadas com os
valores gerados se concentrando em torno de seus verdadeiros valores, incluindo h1 que
se concentra em torno de 0. Isso indica que esta componente nao precisa ser incluıda
no modelo.
A Tabela 5.1 confirma os achados visuais da Figura 5.4 para os outros hiper-
parametros do modelo. Quando os parametros de suavizacao e o numero de compo-
nentes sao corretamente estimados, todos os parametros do modelo podem ser identifi-
cados e sao bem estimados. Assim, o procedimento de estimacao e sua implementacao
computacional parecem estar robustas para serem utilizados em dados reais.
5.4 Resultados da analise
5.4.1 Descricao dos dados e modelo
Os dados consistem da temperatura mınima mensal de Janeiro de 1961 a Dezembro de
2000 (T = 480 meses) observados em n = 37 estacoes de monitoramento, localizados
Modelos de convolucao para dados espaco-temporais 89
0 100 200 300 400 500 600
−56
00−
5200
−48
00−
4400
h1
log(
Lile
lihoo
d)
0 100 200 300 400 500 600
−11
000
−90
00−
7000
−50
00
h2
log(
Lile
lihoo
d)
0 200 400 600 800 1000
−18
000
−14
000
−10
000
−60
00
h3
log(
Lile
lihoo
d)
0 200 400 600 800
−65
00−
6000
−55
00−
5000
−45
00
h4
log(
Lile
lihoo
d)
0 200 400 600 800
−60
00−
5500
−50
00−
4500
h5
log(
Lile
lihoo
d)
Figura 5.2: Funcoes das verossimilhancas perfiladas para h1, h2, h3, h4 e h5.
como indicado na Figura 5.1. A temperatura mınima foi escolhida por ser mais sensitiva
a mudancas ambientais que podem ocorrer em uma regiao geografica (Oke, Klysik, e
Bernhofer, 2006). Os valores de temperatura mınima somente foram considerados
quando pelo menos 5 medias diarias foram coletadas para cada mes. Caso contrario, a
medida foi registrada como dado faltante.
Cinco centro u1, u2, u3, u4 e u5 foram originalmente considerados. Eles foram
dispostos em 5 sub-regioes A1, A2, A3, A4 e A5 que se distinguem de acordo com suas
caracterısticas geograficas. A1 possui um terreno acidentado com densidade alta de
florestas; A2 e uma regiao plana densamente povoada, com vegetacao esparsa; A3 e
a regiao mais elevada com cadeias montanhas e floresta densa; A4 possui topografia
plana com lagos e lagoas enquanto que A5 e tambem uma regiao plana.
Tres modelos foram considerados e avaliados em suas performances preditivas. O
modelo geral baseado em uma mistura de processos estacionarios latentes discutidos
aqui e referido como M1. O modelo que considera processos localmente estacionarios
e referido como M2. E finalmente, o modelo mais simples com um unico processo
estacionario e referido como M3. O modelo M2 pode ser obtido como um caso especial
Modelos de convolucao para dados espaco-temporais 90
iteration
h 1
0 1000 2000 3000 4000 5000
100
150
200
250
iteration
h 2
0 1000 2000 3000 4000 5000
8090
100
110
120
iteration
h 3
0 1000 2000 3000 4000 5000
110
120
130
140
150
iteration
h 4
0 1000 2000 3000 4000 5000
7075
8085
9095
iteration
h 5
0 1000 2000 3000 4000 5000
7075
8085
9095
100
105
Figura 5.3: Tracos gerado pelo slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha
horizontal) considerando o suporte [0, 250] para h1.
do modelo M1 assumindo as amplitudes dos parametros de suavizacao pequenos e
conhecidos. O modelo M3 pode ser obtido como caso especial do modelo M2 assumindo
uma unica componente com parametro de suavizacao grande.
As componentes escalares de β e b tem distribuicao normal a priori com variancia
grande. Cada um dos σm, φm, hm, σβ e φβ possuem distribuicoes a priori semi-Cauchy
vagas.
5.4.2 Comparacao dos modelos
O desempenho dos modelos foi avaliado atraves de sua capacidade preditiva. Uma
possibilidade e um procedimento de validacao cruzada mas este poderia ser um processo
demorado para os modelos estruturados considerados. Outra possibilidade e a de deixar
apenas um pequeno numero de estacoes fora da analise e avaliar a performance conjunta
de previsao para eles. Este procedimento sempre suscita duvidas sobre a influencia que
a escolha de uma estacao particular possa ter sobre o resultado. Optamos por uma
estrategia mais geral realizando a previsao de 500 observacoes (cerca de 3% do total
Modelos de convolucao para dados espaco-temporais 91
iteration
h 1
0 1000 2000 3000 4000 5000
05
1015
2025
30
iteration
h 2
0 1000 2000 3000 4000 5000
8590
9510
010
511
0
iteration
h 3
0 1000 2000 3000 4000 5000
110
115
120
125
130
iteration
h 4
0 1000 2000 3000 4000 5000
7580
8590
95
iteration
h 5
0 1000 2000 3000 4000 5000
7580
8590
9510
010
5
Figura 5.4: Tracos gerado pelo slice sampling para hm, m = 1, . . . , 5 e verdadeiros valores (linha
horizontal) considerando o suporte[0, 50] para h1.
do conjunto de dados) amostradas aleatoriamente nos locais e tempo, que ficaram de
fora da analise.
A Tabela 5.2 apresenta o sumario de alguns criterios para comparacao dos modelos.
O modelo nao-estacionario M2 se saiu melhor que o modelo estacionario M3, como
esperado para uma regiao diversificada. Isto mostra que a hipotese de estacionaridade
espacial nao e apropriada para este estudo. Os erros preditos para o modelo M1 sao
substancialmente menores do que os erros encontrados para os outros modelos. Os
intervalos de credibilidade do modelo M1 tambem sao menores do que os dos outros
dois modelos. Isto e obtido sem sacrificar a sua cobertura, que e igualmente boa. A
Figura 5.5 mostra um sumario grafico das predicoes. Os intervalos de M1 parecem
exibir um padrao mais estavel enquanto que aqueles de M2 mostram um padrao mais
disperso de largura. Isso e devido provavelmente ao pressuposto de estacionaridade
local, que favorece a uma maior variacao nas informacoes associadas a cada local, em
contraste com a completa nao-estacionaridade.
A media a posteriori dos hiperparametros para M2 foram σ21 = 1.61, σ2
2 = 1.60,
Modelos de convolucao para dados espaco-temporais 92
Tabela 5.1: Sumario da estimacao para as variancias e amplitudes dos processos (media a posteriori
e intervalos de credibilidade de 95% para os dados simulados).
Parametros Valores verdadeiros Medias a posteriori I.C. 95 %
σ22 1.4 1.4 (1.3, 1.5)
σ23 35.7 35.1 (31.2, 39.7)
σ24 2.9 2.9 (2.8, 3.2)
σ25 0.5 0.5 (0.5, 0.6)
φ2 0.84 0.88 (0.70, 1.10)
φ3 1.7× 10−4 1.1× 10−4 (1.6× 10−4, 2.0× 10−4)
φ4 0.067 0.063 (0.056, 0.072)
φ5 0.83 0.062 (0.22, 1.32)
Tabela 5.2: Comparacao entre os modelos M1, M2 e M3 na predicao de 500 observacoes sele-
cionadas dentre as localizacoes e tempos. SDA e a soma dos desvios absolutos entre valores observados
e preditos. PROP e a proporcao de vezes que os intervalos preditivos de 95% contem o verdadeiro
valor e TMI e o tamanho medio dos 500 intervalos.
Model SDA PROP TMI
M1 290.5 94.2 2.9
M2 371.7 94.2 3.3
M3 389.3 93.8 3.6
Modelos de convolucao para dados espaco-temporais 93
σ23 = 1.42, σ2
4 = 1.04 , σ25 = 1.03, φ1 = 0.012, φ2 = 0.044, φ3 = 0.009, φ4 = 0.011 e
φ5 = 0.012. Os resultados para as componentes 1 e 2 e resultados para as componentes
4 e 5 foram parecidos. Assim, um modelo M22 revisado contendo apenas 3 componentes
foi considerado com os centros formados por u3 e as localizacoes medias entre os pares
de centros vizinhos. Este modelo revisado teve uma performance preditiva pior que
M2 e nao foi considerado.
A mensagem geral destes resultados e de que os dados parecem exibir uma de-
pendencia espacial complexa. Considerar estacionaridade local e superior a estacionari-
dade global mas a descricao nao-estacionaria que e proposta e superior a uma descricao
localmente estacionaria. Assim, somente os resultados para M1 sao descritos abaixo.
5.4.3 Estimacao do termo espacial
As densidades marginais a posteriori e medias a posteriori dos hiperparametros do
termo espacial sao mostrados na Figura 5.6. O problema de convergencia descrito
na estimacao do parametro de suavizacao h1 foi observado. O algoritmo foi entao
reiniciado sem esta componente e os problemas nao mais estiveram presentes. Deste
modo, o modelo com somente 4 componentes e considerado para M1.
Mais uma vez, nenhuma tentativa de interpretacao para as componentes do modelo
e feita aqui e nao ha sentido em se fazer comparacoes entre os parametros estimados
a partir dos modelos M1 e M2, apesar da sua aparente similaridade. A Figura 5.7
apresenta os nıveis de contorno das funcoes componentes estimadas γh(.), para h =
2, 3, 4, 5, geradas pelo modelo M1. Elas indicam correlacoes afetadas para pontos em
regioes bem alem de suas imediacoes, o que reforca a necessidade de um modelo que
va alem da estacionaridade local.
5.4.4 Estimacao da estrutura media
A Tabela 5.3 mostra a estimacao dos coeficientes fixados da estrutura media. Os efeitos
sazonais e da elevacao sao significantes como esperado. Este ultimo e compatıvel com
o decrescimo de 0.65oC usualmente citado na literatura (Ahrens, 2000).
Modelos de convolucao para dados espaco-temporais 94
10 15 20 25
10
15
20
25
Predicted values
Ob
se
rve
d v
alu
es
10 15 20 25
10
15
20
25
Predicted values
Ob
se
rve
d v
alu
es
Figura 5.5: Sumario do exercıcio de predicao para 500 observacoes selecionadas aleatoriamente:
as medianas sao representadas pela linha cheia e os intervalos de predicao de 95% pela linha de pontos.
Acima: M1; abaixo: M2.
A tendencia no tempo apresenta resultados conflitantes. A tendencia linear global
b parece ser irrelevante, mas um numero substancial de locais indicam um aumento
significante na temperatura e um numero substancial de locais tambem indicam um
significante decrescimo na temperatura. Resultados similares foram obtidos para os
Modelos de convolucao para dados espaco-temporais 95
−1 0 1 2 3 4
02
46
810
Poste
rior
σσ22 σσ3
2σσ42σσ5
2
−10 −8 −6 −4 −2 0 2 4
01
23
4
Poste
rior
φφ2 == φφ5φφ3 φφ4
70 80 90 100 110
0.00
0.05
0.10
0.15
0.20
0.25
Poste
rior
h2 h3h4 h5
Figura 5.6: Densidades marginais estimadas a posteriori dos hiperparametros e suas medias a
posteriori (linha vertical). Os parametros σ2m e φm, m = 2, . . . , 5 aparecem na escala logarıtmica para
melhor inspecao visual. As unidades de medida para os parametros de suavizacao e amplitudes e
kilometros.
Modelos de convolucao para dados espaco-temporais 96
0 100 200 300 4000
5015
025
0
γγ2
x
y
u2
u3
u4
u5
0.2
0.4
0.6
0 100 200 300 400
050
150
250
γγ3
x
y
u2
u3
u4
u5
0.1
0.2
0.3
0.4
0.5
0 100 200 300 400
050
150
250
γγ4
x
y
u2
u3
u4
u5
0.2
0.2
0.3
0.4
0.5
0.6
0.7
0 100 200 300 4000
5015
025
0
γγ5
x
y
u2
u3
u4
u5
0.2
0.4
0.6
0.8
Figura 5.7: Nıveis de contorno das componentes estimadas γh(.), for h = 2, 3, 4, 5, geradas pelo
modelo M1.
modelo M2 e M3. A Figura 5.8 apresenta um sumario grafico da estimacao destes
coeficientes. Suas medias estimadas variaram desde um aumento de 1.26oC por decada
ate um declınio de 1.68oC por decada. Estes resultados confirmam a importancia
tendencias no tempo especıficas para cada local.
As estimativas pontuais para φβ e σ2β foram respectivamente 1.01 e 2.5 × 10−5. A
Figura 5.9 apresenta os valores interpolados dos coeficientes de tendencia no tempo
para todo o estado do Rio de Janeiro. Embora a amplitude tenha sido pequena,
duas regioes distintas emergem na figura. Os resultados mostram um significativo
aumento na temperatura em torno do centro u2, correspondente a area metropolitana
da cidade do Rio de Janeiro. Esta e a area do estado onde os valores de temperaturas
mais elevadas sao observadas. Isto parece especialmente relevante na parte oeste da
baıa da Guanabara onde a cidade do Rio de Janeiro se encontra, com urbanizacao e
industrializacao intensas. Os resultados mostram tambem um declınio na regiao em
torno do centro u3. Esta e uma regiao caracterizada por uma densa cobertura de
Modelos de convolucao para dados espaco-temporais 97
Tabela 5.3: Sumario dos coeficientes de regressao estimados.
coeficiente media I.C. 95%
intercepto 20.07 (19.88, 20.27)
cos 1.43 (1.25, 1.58)
sin 1.80 (1.69, 1.91)
altitude -0.0062 (-0.0063, -0.0061)
tendencia global -0.0010 (-0.0033, 0.0010)
0 5 10 15 20 25 30 35
−0.
015
−0.
010
−0.
005
0.00
00.
005
0.01
0
ββi
Est
imat
ed v
alue
s
_ _ _
_
_
_
_
_
_ _
_ _
_
_
_
_ _
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
__
_
_
_
Figura 5.8: Estimativas pontuais e intervalos para as tendencias no tempo especıfica para os locais
βi,i = 1, . . . , 37 para o modelo M1.
floresta e cadeias de montanhas. Esta e a area do estado onde valores de temperatura
mais baixas sao observadas. O mapa tambem mostra um aumento de temperatura
ao redor das cidades de Cabo Frio e Campos. Ambas cidades tiveram um substancial
aumento na urbanizacao nas ultimas decadas devido ao turismo e atividade petrolıfera,
respectivamente. Pela figura 5.9 parece haver um padrao de que locais de temperaturas
mais elevadas estao se tornando mais quentes e que locais de temperatura menos elevada
Modelos de convolucao para dados espaco-temporais 98
estao se tornando mais frios, mas isso precisa ser confirmado por estudos posteriores.
0 100 200 300 400
050
100
150
200
250
x
y
Figura 5.9: Valores interpolados do aumento/declınio na temperatura para o estado do Rio de
Janeiro.
5.5 Conclusao
Esta aplicacao propoem uma nova abordagem para predicao e analise de mudancas
climaticas no estado do Rio de Janeiro. A implementacao utiliza um modelo nao-
estacionario baseado em uma convolucao finita de processos estacionarios latentes. As
vantagens de nossa abordagem sao apresentadas e constrastadas favoravelmente contra
alternativas que assumem estacionaridade global e nao-estacionaridade baseada em
estacionaridade local. Os modelos sao bem estimados e o numero de componentes
podem ser identificados do procedimento de estimacao a partir dos dados.
A analise de temperatura mınima mostrou a necessidade em se considerar modelos
espaco-temporais mais elaborados para regioes de grande diversidade geografica. Os
Modelos de convolucao para dados espaco-temporais 99
dados revelaram a ausencia de uma tendencia global no tempo para a temperatura indi-
cada, mas um crescimento disperso da temperatura em areas largamente urbanizadas,
areas de temperaturas elevadas se aquecendo e areas de florestas, de temperaturas mais
baixas se tornando mais frias.
Capıtulo 6
Consideracoes finais
Os trabalhos desenvolvidos ate o presente momento indicam novas possibilidades de
procedimentos para analise de dados espacialmente correlacionados de forma nao-
estacionaria. O modelo espacial proposto no Capıtulo 2 e modelos espaco-temporais
propostos nos Capıtulos 3 e 4 foram testados e analisados para exemplos simulados.
Os exemplos simulados do capıtulo 2 mostraram basicamente que: a) o mecanismo de
amostragem adotado e capaz de identificar o numero correto de misturas, bem como
quais devem ser as componentes a serem consideradas no modelo. Este esquema e
robusto no sentido de recuperar os parametros utilizados no processo de simulacao;
b) quando um processo nao-estacionario subjacente e de fato dado pela mistura de
processos estacionarios latentes o modelo proposto e superior no que diz respeito a ca-
pacidade preditiva quando comparado ao modelo de misturas de processos localmente
estacionario (Fuentes e Smith (2001); Fuentes (2002); Banerjee et al. (2004b)); e c) nao
se perde em nada ao considerar estruturas mais gerais, como as descritas no capıtulo
2 mesmo que a estrutura de dependencia espacial dos dados seja mais simples.
No capıtulo 5 dados de temperatura mınima mensal do estado do Rio de Janeiro
foram analisados atraves de um modelo hierarquico definido como uma media de-
pendente de covariaveis explicativas mais a realizacao de um processo espacial nao-
estacionario como descrito no Capıtulo 2. Alem disso, um conjunto de coeficientes
espacialmente estruturados foram considerados as tendencias lineares em cada uma
das localizacoes. Nossa abordagem se mostrou util ao estabelecer o numero de mis-
100
Modelos de convolucao para dados espaco-temporais 101
turas a serem consideradas, a partir dos dados. Nosso modelo tambem apresentou
melhor capacidade preditiva quando comparado ao modelo de misturas de processos
localmente estacionarios e ao modelo que considera um unico processo estacionario
para toda a regiao.
O exemplo simulado apresentado do capıtulo 4, mostrou que o esquema de inferencia
e de amostragem adotados foi robusto no sentido de recuperar os parametros utilizados
no processo de simulacao. Deste modo, o proximo passo e realizar a aplicacao com
dados reais de estrutura espaco-temporal complexa que possa ser modelado de acordo
com a abordagem discutida no Capıtulo 4. Uma opcao seriam considerar os dados
de temperatura em escala maior, por exemplo, a regiao sudeste ou o Brasil. Embora
tenhamos desenvolvido o procedimento de inferencia e amostragem na situacao onde
a matriz de covariancia evolui em intervalos de tempos maiores do que evoluem os
dados, outras possıveis abordagens deverao tambem ser testadas. Por exemplo, a de se
considerar as variancias dos processos estacionarios mudando no tempo, conjuntamente
ou nao com os parametros de suavizacao; ou ainda, considerar que estes parametros
mudam no tempo, condicionadas a um conjunto de possıveis covariaveis associadas.
Outras extensoes, podem ser consideradas, no sentido de imputar efeito sazonal
a evolucao da estrutura espacial nao-estacionaria. Seguindo nesta linha, poderia se
assumir uma matriz de covariancia para cada uma das estacoes do ano (ou meses do
ano). Neste caso, cada uma dessas matrizes levariam em conta todas as informacoes
relativas aquela estacao (ou mes) ao mesmo tempo mas estariam condicionalmente as-
sociadas ao conjunto de informacoes da estacao (ou mes) anterior. Isto e naturalmente
obtido no contexto de modelos dinamicos. Para todo m, m = 1, . . . ,M , seja o vetor
sazonal de fatores no tempo t, dado por, hm,t = (hm,t, hm,t−1, . . . , hm,t−p+1)′ onde p
e o comprimento do ciclo sazonal. A equacao dinamica para o vetor e definida no
logaritmo,
log(ht) = α log(ht−1) + ξt. (6.1)
Modelos de convolucao para dados espaco-temporais 102
onde α =
0 1 0 . . . 0
0 0 1 . . . 0...
......
. . ....
0 0 0 . . . 1
1 0 0 . . . 0
e uma matriz permutacao e ξt ∼ N(0,W ).
Outra abordagem para processos espaciais nao-estacionarios sao os modelos de de-
formacao espacial, que tiveram como ponto de partida, o artigo de Sampson e Guttorp
(1992). Partindo do espaco das observacoes originais D, eles consideram uma funcao
de correlacao do processo espacial referente a um espaco latente L, onde se aplicam
isotropia e estacionaridade. Seguindo essa ideia, Schmidt e O’Hagan (2003) propoem
uma abordagem Bayesiana na qual o mapeamento entre os espacos D e L seja repre-
sentado por uma funcao d(.) que segue um processo Gaussiano. Recentemente, Castro
(2009) considera extensoes desse modelo, inserindo-o no contexto de modelos dinamicos
para a media do processo e mantendo a estrutura espacial nao-estacionaria definida
pelo modelo de deformacao constante ao longo de todos os tempos. Em outro modelo
Castro (2009) considera que esta estrutura espacial possa tambem mudar ao longo do
tempo atraves da inclusao de uma equacao dinamica para a funcao deformacao d(.).
Embora modelos baseados na deformacao espacial sejam um dos metodos mais estuda-
dos para processos nao-estacionarios, assim como os modelos baseados em convolucao,
nao existe na literatura trabalhos considerando estudos simulados, ou aplicacoes com
dados reais, com o objetivo de comparar os modelos de deformacao espacial com os
modelos baseados na convolucao de processos. Nos esperamos, em breve, comparar as
capacidades preditivas destes modelos atraves de aplicacoes com dados reais e dados
simulados.
Neste trabalho e considerado que os dados tenham distribuicao gaussiana. Entre-
tanto, muitas vezes nao e possıvel fazer esta suposicao para dados gerais, dado sua
distribuicao assimetrica. Neste caso, utilizar transformacoes como por exemplo, o log-
aritmo dos dados, levam a dificuldades na interpretacao dos parametros do modelo.
Deste modo, a extensao dos modelos descritos para dados da famılia exponencial seria
bastante interessante. Neste caso, poderiam ser ajustados tambem, dados de contagem
que rotineiramente aparecem na area da saude. Outra saıda seria considerar uma
Modelos de convolucao para dados espaco-temporais 103
abordagem nao-parametrica mais irrestrita sobre a distribuicao dos dados atraves de
os modelos nao-parametricos de misturas baseados em processos de Dirichlet (Gelfand
et al. (2005b); Kottas et al. (2008)).
Referencias Bibliograficas
Agarwal, D. e Gelfand, A. (2005), “Slice sampling for simulation based fitting of spatial
data models,” Statistics and Computing, 15, 61–69.
Ahrens, A. D. (2000), Essentials of Meteorology: an invitation to the atmosphere,
Brooks Cole.
Banerjee, S., Carlin, B., e Gelfand, A. (2004a), Hierarchical Modeling and Analysis for
Spatial Data, Chapman & Hall.
Banerjee, S., Gelfand, A., Knight, J., e Sirmans, C. (2004b), “Spatial modelling of house
prices using normalized distance-weighted sums of stationary processes,” Journal of
Business and Economic Statistics, 22, 206–213.
Barber, J. (1999), “Modeling and prediction of non-stationary environmental pro-
cesses,” Tese de doutorado, North Carolina State University.
Berger, J. O., Oliveira, V., e Sanso, B. (2001), “Objective bayesian analysis of spatially
correlated data,” Journal of the American Statistical Association, 96, 1361–1374.
Calder, C. A. (2003), “Exploring latent structure in spatial temporal processes using
process convolutions,” Tese de doutorado, ISDS, Duke University.
— (2007), “Dynamic factor process convolution models for multivariate sace-time data
with application to air quality assessment,” Environmental and Ecological Statistics,
14, 229–247.
Carter, C. K. e Kohn, R. (1994), “On Gibbs sampling for state space models,”
Biometrika, 81, 541–553.
104
Modelos de convolucao para dados espaco-temporais 105
Castro, F. (2009), Modelos dinamicos para deformacoes espaciais, Exame de Quali-
ficacao de Doutorado, Instituto de Matematica, DME-UFRJ, Rio de Janeiro, Brasil.
Cressie, N. (1993), Statistical for spatial Data, New York: Wiley.
ECSN (1995), Climate of Europe: Recent Variation, Present State and Future
Prospects, KNMI, De Bilt.
Epanechnikov, V. (1969), “Nonparametric estimates of a multivariate probability den-
sity,” Theory of Probability and its Applications, 14, 153–158.
Fruhwirth-Schnater, S. (1994), “Data augmentation and dynamic linear models,” Jour-
nal of Time Series Analysis, 15, 183–202.
Fuentes, M. (2002), “Spectral methods for nonstationary spatial processes,”
Biometrika, 89, 197–210.
Fuentes, M., Chaudhuri, A., e Holland, M. D. (2007), “Bayesian entropy for spatial
sampling design of environmental data,” Environmental and Ecological Statistics, 14,
323–340.
Fuentes, M., Chen, L., Davis, J. M., e Lackmann, G. M. (2005), “Modeling and pre-
dicting complex space-time structures and patterns of coastal wind fields,” Environ-
metrics, 16, 449–464.
Fuentes, M., Henry, J., e Reich, B. J. (2009), “Nonparametric spatial models for ex-
tremes: application to extreme temperature data,” Tech. rep., Statistics Department,
North Carolina State University. Institute of Statistics Mimeo Series 2621.
Fuentes, M. e Reich, B. J. (2009), “Multivariate spatial nonparametric modelling via
kernel processes mixing,” Tech. rep., Statistics Department, North Carolina State
University. Instute of Statistics Mimeo Series 2622.
Fuentes, M. e Smith, R. (2001), A New class of nonstationary spatial models, Relatorio
tecnico, North Carolina State University.
Modelos de convolucao para dados espaco-temporais 106
Gelfand, A., Banerjee, S., e Gamerman, D. (2005a), “Spatial process modelling for
univariate and multivariate dynamic spatial data,” Environmetrics, 16, 465–479.
Gelfand, A., Kim, H., Sirmans, C., e Banerjee, S. (2003), “Spatial modeling with spa-
tially varying coefficient processes,” Journal of the American Statistical Association,
98, 387–396.
Gelfand, A., Kottas, A., e MacEachern, S. (2005b), “Bayesian nonparametric spatial
modeling with Dirichlet process mixing,” Journal of the American Statistical Asso-
ciation, 100, 1021–1035.
Gelfand, A., Schmidt, A., Banerjee, S., e Sirmans, C. (2004), “Nonstationary mul-
tivariate process modeling through spatially varying coregionalization,” Test, 13,
263–312.
Gelman, A. (2006), “Prior Distributions for Variance Parameters in Hierarchical Mod-
els,” Bayesian Analysis, 1, 515–533.
Green, P. J. (1985), “Reversible jump Markov chain Monte Carlo computation and
Bayesian model determination,” Biometrika, 82, 711–732.
Hass, T. (1995), “Local prediction of a spatio-temporal process with an application to
wet sulfate deposition,” Journal of the American Statistical Association, 90, 1189–
1199.
Higdon, D. (1998), “A process-convolution approach to modelling temperatures in the
North Atlantic Ocean,” Environmental and Ecological Statistics, 5, 173–190.
— (2002), “Space and space-time modeling using process convolutions,” in Quantitative
Methods for Current Environmental Issues, eds. Anderson, C., Barnett, V., Chatwin,
P. C., e El-Shaarawi, A. H., Springer Verlag, pp. 37–56.
Higdon, D., Swall, J., e Kern, J. (1999), “Non-stationary spatial modelling,”
in Bayesian Statistics 6 - Proceedings of the Sixth Valencia Meeting, eds.
J. M. Bernardo, J. O. Berger, A. P. D. e Smith, A. F. M., Claredon Press - Ox-
ford, pp. 761–768.
Modelos de convolucao para dados espaco-temporais 107
Huerta, G., Sanso, B., e Stroud, J. R. (2004), “A spatio-temporal model for Mexico
city ozone levels,” Applied Statistics, 53, 231–248.
IPCC (2007), Climate Change 2007: The Physical Science Basis. Contribution of
Working Group I to the Fourth Assessment Report of the IPCC, Cambridge Uni-
versity Press.
Kern, J. C. (2000), “Bayesian Process-Convolution Approaches to specifying Spatial
Dependence Structure,” Tese de doutorado, Tese de doutorado, Duke University,
Durham, NC 27708.
Kim, H., Mallick, B., e Holmes, C. (2006), “Analyzing spatial data using piecewise
Gaussian processes,” Journal of the American Statistical Association, 100, 653–668.
Kottas, A., Duan, J., e Gelfand, A. (2008), “Modeling disease incidence data with
spatial and spatio temporal Dirichlet process mixtures,” Biometrical Journal, 50,
29–42.
Lopes, H., Salazar, E., e Gamerman, D. (2008), “Spatial dynamic factor analysis,”
Bayesian Analysis, 3(4), 759–792.
Nadaraya, E. A. (1964), “On Estimating Regression,” Theory of Probability and its
Applications, 9, 141–142.
Neal, R. M. (2003), “Slice sampling,” The Annals of Statistics, 3, 705–767.
Nychka, D. e Saltzman, N. (1998), “Design of Air Quality Networks,” in Case studies
in environmental statistics, ed. in Statistics, L. N., Springer verlag, pp. 51–76.
Oke, T., Klysik, K., e Bernhofer, C. (2006), “Editorial: Progress in urban climate,”
Theoretical and Applied Climatology, 84, 1–2.
Paciorek, C. e Schervish, M. (2004), “Nonstationary covariance functions for Gaussian
process regression,” Advances in Neural Information Processing Systems, 16, 273–
280.
Modelos de convolucao para dados espaco-temporais 108
— (2006), “Spatial modelling using a new class of nonstationary covariance functions,”
Environmetrics, 17, 483–506.
Paez, M., Gamerman, D., Landim, D., e Salazar, E. (2008), “Spatially-varying dynamic
coefficient models,” Journal of Statistical Planning and Inference, 138, 1038–1058.
Paez, M., Gamerman, D., e Oliveira, V. (2005a), “Interpolation performance of a
spatio-temporal model with spatially varying coefficients: application to PM10 con-
centrations in Rio de Janeiro,” Environmental and Ecological Statistics, 12, 169–193.
Paez, M. S., Gamerman, D., e de Oliveira, V. (2005b), “Interpolation performance
of a spatio-temporal model with spatially varying coefficients: application to PM10
concentrations in Rio de Janeiro,” Environmental and Ecological Statistics, 12, 169–
193.
Sahsamanoglou, H. e Makrogiannis, T. (1991), “Temperature trends over the Mediter-
ranean region,” Theoretical and Applied Climatology, 45, 183–192.
Sampson, P. e Guttorp, P. (1992), “Nonparametric estimation of nonstationary spatial
covariance structure,” Journal of the American Statistical Association, 87, 108–119.
Sanso, B., Schmidt, A., e Nobre, A. (2008), “Interpolation performance of a spatio-
temporal model with spatially varying coefficients: application to PM10 concentra-
tions in Rio de Janeiro,” Canadian Journal of Statistics, 36, 239–258.
Schmidt, A. e Gelfand, A. (2003), “A Bayesian Coregionalization Approach for Multi-
variate Pollutant Data,” Journal of Geophysical Research-Atmospheres, 108, 6783.
Schmidt, A. e O’Hagan, A. (2003), “Bayesian inference for nonstationary spatial co-
variance structures via spatial deformations.” Journal of the Royal Statistical Society
Series B, 65, 743–758.
Schmidt, A. e Sanso, B. (2006), Modelagem Bayesiana da Estrutura de Covariancia
de Processos Espaciais e Espaco-Temporais, Minicurso 17o Simposio Nacional de
Probabilidade e Estatıstica, ABE. Caxambu, MG, Brasil.
Modelos de convolucao para dados espaco-temporais 109
Smith, R. (2001), Environmental Statistics, Relatorio Tecnico, University of North
Carolina.
Stroud, J. R., Muller, P., e Sanso, B. (2001), “Dynamic model for spatio-temporal
data,” Journal of the Royal Statistical Society, B,, 63, 673–689.
Swall, J. L. (1999), “Non-Stationary spatial modeling using a process convolution
approach,” Tese de doutorado, Tese de doutorado, Duke University, Durham, NC
27708.
Watson, G. S. (1964), “Smooth regression analysis,” Shankya series A, 26, 359–372.
West, M. e Harrison, J. (1997), Bayesian Forecasting and Dynamic Models, New York:
Springer - Second Edition.