Curso Análisis Estadístico de Datos Climáticos Tema: SERIES TEMPORALES II Mario Bidegain (FC) –...
-
Upload
joaquin-onate -
Category
Documents
-
view
16 -
download
1
Transcript of Curso Análisis Estadístico de Datos Climáticos Tema: SERIES TEMPORALES II Mario Bidegain (FC) –...
Curso
Análisis Estadístico de Datos Climáticos
Tema: SERIES TEMPORALES II
Mario Bidegain (FC) – Alvaro Diaz (FI) – Marcelo Barreiro (FC)
Universidad de la República
Montevideo, Uruguay
2009
CONTENIDO
Análisis espectral. Espectro de Potencia.
Filtros estadísticos.
Espectro cruzado. Periodicidades y cuasiperiodicidades. Separación de “señal” y “ruido”.
Análisis en el dominio de frecuencias
• El análisis en el dominio de frecuencia implica representar la serie de datos en términos de contribuciones hechas en escalas de tiempo diferentes. Por ejemplo, una serie de tiempo de datos horarios de temperaturas de una ubicación en latitudes medias por lo general expondrá fuertes variaciones en la escala de tiempo diaria (correspondiente al ciclo diurno de calentamiento solar) y en la escala de tiempo anual (debido a la marcha de las estaciones).
• En el dominio de tiempo, estos ciclos aparecerón como grandes valores
positivos de la función de autocorrelación cerca de 24 horas para el ciclo diurno, y 24 × 365 = 8760 horas para el ciclo anual.
• Pensando en la misma serie de tiempo en el dominio de frecuencia, hablamos de fuertes contribuciones a la variabilidad total de la serie temporal en los períodos de 24 y 8760 horas, o en frecuencias de 1/24 = 0.0417 1/h y 1/8760 = 0.000114 1/h.
Análisis Armónico - Funciones Seno y Coseno
• El análisis armónico consiste en representar las fluctuaciones o variaciones en una serie de tiempo como la suma de una serie de funciones de coseno y seno.
• Estas funciones trigonométricas son armónicas en el sentido que ellos son elegidas para tener frecuencias que exponen los múltiplos de números enteros de la frecuencia fundamental decidida por el tamaño de la muestra (p. ej., la longitud) de la serie de datos.
Funciones PeriódicasFunciones Periódicas
Una Función Periódica f(t) cumple la siguiente propiedad para todo valor de t.
f(t)=f(t+T)
A la constante mínima para la cual se cumple lo anterior se le llama el periodo de la función
Repitiendo la propiedad se puede obtener:f(t)=f(t+nT), donde n=0,1, 2, 3,...
)2
cos(
T
tAYt
•A, amplitud de la oscilación.
•T, período.
, desfase.
-1,5
-1
-0,5
0
0,5
1
1,5
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99
A
T
-1,5
-1
-0,5
0
0,5
1
1,5
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99
DESFASE = PI/2
)cos( tAYt
)sen()cos( tbtaYt titi
t eiba
eiba
Y )22
()22
(
Expresiones alternativas:
Funciones PeriódicasFunciones Periódicas
Serie Trigonométrica de FourierSerie Trigonométrica de Fourier
Algunas funciones periódicas f(t) de periodo T pueden expresarse por la siguiente serie, llamada Serie Trigonométrica de Fourier
f(t) = ½ a0 + a1cos(0t)+a2cos(20t)+...
+ b1sen(0t)+b2sen(20t)+...
Donde 0=2/T.
Es decir,
])tn(senb)tncos(a[a)t(f1n
0n0n021
Serie Trigonométrica de FourierSerie Trigonométrica de Fourier
Es posible escribir de una manera ligeramente diferente la Serie de Fourier, si observamos que el término ancos(n0t)+bnsen(n0t) se puede escribir como
Podemos encontrar una manera más compacta para expresar estos coeficientes pensando en un triángulo rectángulo:
)tn(sen
ba
b)tncos(
ba
aba 02
n2n
n02
n2n
n2n
2n
Serie Trigonométrica de FourierSerie Trigonométrica de Fourier
Con lo cual la expresión queda
n2n
2n
n
n2n
2n
n
senba
b
cosba
a
an
bn
2n
2nn baC
n
)tn(sensen)tncos(cosC 0n0nn
)tncos(C n0n
Serie Trigonométrica de FourierSerie Trigonométrica de Fourier
Si además definimos C0=a0/2, la serie de Fourier se puede escribir como
Así,
y
1n
n0n0 )tncos(CC)t(f
2n
2nn baC
n
n1n a
btan
Componentes y armónicasComponentes y armónicas
Así, una función periódica f(t) se puede escribir como la suma de componentes sinusoidales de diferentes frecuencias n=n0.
A la componente sinusoidal de frecuencia n0: Cncos(n0t+n) se le llama la enésima armónica de f(t).
A la primera armónica (n=1) se le llama la componente fundamental y su periodo es el mismo que el de f(t)
A la frecuencia 0=2f0=2/T se le llama frecuencia angular fundamental.
Amplitudes y PeriodogramaAmplitudes y Periodograma
La componente de frecuencia cero C0, es el valor promedio de f(t) en cada periodo.
Los coeficientes Cn y los ángulos n son respectivamente las amplitudes y los ángulos de fase de las armónicas.
La descomposición de la varianza puede presentarse en un grófico de potencia media o varianza de la armónica en función de la frecuencia y esto se denomina Espectro de línea de Fourier o Periodograma
El PeriodogramaEl Periodograma
-6
-4
-2
0
2
4
6
20 40 60 80 100 120 140 160 180 200
C I C L O 10
5
10
15
20
0 5 10 15 20 25
FRECPE
RDG
El periodograma se asimila a un “sintonizador” de un receptor de radio, así, la serie que observamos sería la señal emitida por una radio y el periodograma no sería mas que el dial que busca en que frecuencia se “oye” mejor la señal emitida.
El Periodograma: formulaciónEl Periodograma: formulación
k
itiiipt tbtaY
1
)sencos(
“Modelo” que sigue la serie observada:
Asumimos que las frecuencias, w, son:
N
pii
2 kpi ,...,1
N
t
t
N
Ya
10ˆ
N
totp tpY
Na
1
cos2
ˆ
N
totp tpY
Nb
1
sen2ˆ
N
ttN tY
Na
12/ cos
1ˆ
Se determinan los parámetros, a y b, según:
0
22
2
)()(
ppp
baI
Se calcula el periodograma
I(w)
El Periodograma: InterpretaciónEl Periodograma: InterpretaciónEl periodograma mide aportaciones a la varianza total de la serie de componentes periódicos de una frecuencia determinada (w).Si el periodograma presenta un “pico” en una frecuencia, indica que dicha frecuencia tiene mayor “importancia” en la serie que el resto.
ciclo1=cos(2*pi*t/10)+cos(2*pi*t/40)+cos(2*pi*t/20)+cos(2*pi*t/25)+u
N=200; 200/10=20; 200/40=5; 200/20=10; 200/25=8
0
5
10
15
20
0 50 100 150
FREC
PER
DG
0
5
10
15
20
0 5 10 15 20 25
FREC
PER
DG
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
20 40 60 80 100 120 140 160 180 200-1.0
-0.8
-0.6
-0.4
-0.2
0.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
20 40 60 80 100 120 140 160 180 200
0
1
2
3
4
0 50 100 150
De izquierda a derecha aumenta la frecuencia (disminuye el período)
El Periodograma: InterpretaciónEl Periodograma: Interpretación
El Periodograma y la transformada de FourierEl Periodograma y la transformada de FourierEl periodograma está basado en una herramienta matemática denominada Transformada de Fourier, según la cual una serie, que cumpla determinados requisitos, puede descomponerse como suma de un número finito o infinito de frecuencias. Del mismo modo, a partir de la representación frecuencial puede recuperarse la serie original a través de la Transformada Inversa de Fourier.
En este punto, es preciso señalar las diferencias existentes entre procesos discretos periódicos, aperiódicos y estocásticos en términos frecuenciales:• Las series periódicas presenta un periodograma discreto, es decir, solo existe "masa" espectral en aquellas frecuencias contenidas en la serie, siendo éstas un número discreto. • Las series aperiódicas presentan un periodograma continúo, es decir, existe "masa" en un "infinito" número de frecuencias. • Las series estocásticas presentan densidad espectral en un rango continúo de frecuencias.
SERIE PERIODICA SERIES APERIODICAS
PERIODOGRAMA PERIODOGRAMA
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
20 40 60 80 100 120 140 160 180 200
0
5
10
15
20
0 50 100 150
FREC
PE
RD
G
0
20
40
60
80
100
20 40 60 80 100 120 140 160 180 200
0
2000
4000
6000
8000
10000
12000
0 50 100 150
FREC
PE
RD
G
SERIES ESTOCASTICAS
PERIODOGRAMA (DE ESA REALIZACION)
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
0 50 100 150
FREC
PE
RD
G
-3
-2
-1
0
1
2
3
20 40 60 80 100 120 140 160 180 200
Estimación del EspectroEstimación del EspectroEl espectro o densidad espectral se define para procesos estocásticos estacionarios como la transformada de Fourier de la función de autocovarianza (teorema de Wiener-Khintchine). Su estimador “natural” es el periodograma, antes visto. Como hemos comprobado es un instrumento adecuado para la detección de procesos periódicos puros, sin embargo en el caso de procesos estocásticos presenta serias limitaciones, las más importantes son la inconsistencia y la correlación asintóticamente nula entre ordenadas del periodograma. Esto implica que no converja al verdadero “espectro” cuando la muestra se amplia y que el periodograma muestre un comportamiento errático.
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
0 50 100 150
FREC
PE
RD
G
w
h(w)
-pi pi
Estimación del EspectroEstimación del Espectro:
METODOS NO PARAMÉTRICOS
A fin de solucionar los problemas antes comentados se propone, en este tipo de métodos, ponderar el espectro por unos valores denominados “ventanas espectrales”
)1(
)1(
)(ˆ2
1)(
N
Nr
ri rReh
)1(
)1(
)(ˆ)(2
1)(
N
Nr
ri rRerh
Estimador sin aplicar “ventanas”
Estimador con “ventanas”
Existe un amplio número de “ventanas espectrales”, Tukey, Parzen, Hamming, etc.
Estimación del EspectroEstimación del Espectro
METODOS NO PARAMÉTRICOSSi bien la utilización de ventanas espectrales permite eliminar la inconsistencia y la irregularidad del periodograma como estimador, el que se suavicen las ordenadas del periodograma introduce la dificultad de diferenciar frecuencias próximas.
x1=cos(2*pi*t/(200/15))+cos(2*pi*t/(200/17))+u
0
5
10
15
20
0 10 20 30 40
FREC
PE
RD
G
PERIODOGRAMA NO SUAVIZADO
0.0
0.5
1.0
1.5
2.0
2.5
3.0
0 10 20 30 40
FREC
DE
NS
IDA
D2
PERIODGRA MA S UAVIZADO MEDIA NTE UNA VENTA NA DE TUKEY-HA NNING (M =50)
Estimación del EspectroEstimación del Espectro
METODOS PARAMÉTRICOS
Los métodos paramétricos, parten de suponer “conocido” el PGD, y modelizado en general a través de un proceso ARMA, a partir del cual se puede recuperar una estimación del espectro.
Si la serie observada responde a un modelo ARMA (p,q):
qtqtttptpttt bbbYaYaYaY ...... 22112211
El espectro equivale a:
2...1
...1)(
2
2221
2221
ipp
ii
iqq
ii
Y
eaeaea
ebebebh
- 8
- 6
- 4
- 2
0
2
4
6
8
2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0
Y 4
0
5
10
15
20
0 20 40 60 80
FREC
PER
DG
PERIODOGRAMA (NO ALISADO)
-0.5
0.0
0.5
1.0
1.5
2.0
0 20 40 60 80
FREC
DEN
SID
AD
2
PERIODOGRAMA ALISADO ( VENTANA TUKEY-HANNING)
0 0.5 1 1.5 2 2.5 30
50
100
150
200
250
300
350
Frecuencia (0-pi)
Serie original
Estimaciones del espectro
0
50
1 00
1 50
200
250
300
350
400
450
0
2
4
6
8
1 0
1 2
1 4
1 6
1 8PARAMETRICO NO ALISADO ALISADO
COMPARACION METODOS DE ESTIMACION
Espectro Cruzado IEspectro Cruzado I
La relación general entre dos series climáticas puede estudiarse a través de funciones de correlación cruzada, pero la existencia de un desplazamiento temporal de una serie respecto de la otra o de correlaciones positivas en un rango de frecuencias y negativas en otro deben detectarse por técnicas algo mas elaboradas. La herramienta adecuada es el Espectro Cruzado, basado en la transformada de Fourier de la covarianza cruzada, que determina la relación entre las dos series en el dominio de frecuencias evaluando la contribución de una frecuencia a la covarianza cruzada total.
La transformada de Fourier de la función Rxy (ζ) define la densidad coespectral de potencias o espectro cruzado.
El espectro cruzado permite evaluar el grado de correlación entre las componentes de alta y baja frecuencia de las dos series temporales.
Espectro Cruzado IIEspectro Cruzado IIComo la función de covarianza cruzada no es una función par, Gxy (f) es en general compleja y por lo tanto
Gxy (f) = Cxy(f) – i Qxy(f)
Donde Cxy es el COESPECTRO y Qxy es la CUADRATURA
El Coespectro especifica la contribución de cada frecuencia f a la covarianza cruzada total de las series x(t) y y(t) para un desplazamiento temporal nulo. La Cuadratura mide la contribución a la covarianza total cuando una de las series se desplaza temporalmente para dar un desplazamiento de 90° en la fase para una frecuencia dada.
El espectro cruzado también puede representarse en forma polar:
Gxy(f) = IGxy(f)I exp(-i θxy(f))
Donde Gxy(f) = sqrt(Cxy2 + Qxy
2) es el espectro de Amplitudes y
θxy(f) = 360/2π arctg(Qxy/Cxy) es el espectro de Fases (en grados)
La bondad de la relación entre las variables x(t) y y(t) para las distintas frecuencias se puede obtener de la función de Coherencia:
Kxy2 = IGxy(f)I2/Gx(f) Gy(f) 0 < Kxy
2 < 1
Espectro Teórico Espectro Teórico Modelos autorregresivos AR(1)Modelos autorregresivos AR(1)
En el caso más simple de un proceso AR (1) los valores positivos de la autocorrelación inducen una memoria en la serie de tiempo que tiende a dejar de lado variaciones a corto plazo (de alta frecuencia) en la serie, y acentuar las de baja frecuencia. En términos del espectro, estos efectos conducen a más concentración de la densidad en frecuencias menores, y menos densidad en frecuencias más altas. Además, estos efectos son cada vez más fuertes cuanto más cerca a 1.
Estas ideas son cuantificadas por la función de densidad espectral teórica para los procesos AR (1) :
Espectro Teórico Espectro Teórico Modelos autorregresivos AR(1)Modelos autorregresivos AR(1)
Espectro Teórico Espectro Teórico Modelos autorregresivos AR(2)Modelos autorregresivos AR(2)
El AR (1) el proceso con = 0 en realidad consiste en la serie de datos no correlacionados. Estos no exponen ninguna tendencia de acentuar altas o bajas frecuencias, entonces su espectro es constante, o chato. Como decíamos otra vez por analogía con la luz visible, se le llama a esto el ruido blanco debido a la igual mezcla de todas las frecuencias. Finalmente, el AR (1) el proceso con Φ = +0 6 tiende a producir variaciones erráticas a corto plazo en la serie de tiempo, causando correlaciones negativas en desplazamientos impares y correlaciones positivas en desplazamientos pares. (Esta clase de estructura de correlación es rara en las series temporales atmosféricas.) el espectro para este proceso está incrementado en las altas frecuencias y deprimido en las bajas frecuencias bajas, Estas series se conocen como procesos de ruido azul.
En particular el espectro para el proceso AR (2):
Espectro Teórico Espectro Teórico Modelos autorregresivos AR(2) Modelos autorregresivos AR(2)
El AR (2) procesos es interesante debido a su capacidad para exponer una amplia variedad de comportamientos, incluyendo pseudoperiodicidades. Esta diversidad es reflejada en varias formas de los espectros.
Los procesos con Φ = 0.9 Φ = -0.6, y Φ = -0.9 Φ = -0.5, exponen pseudoperiodicidades, como es indicado por los amplias picos en sus espectros en frecuencias intermedias.
Los procesos con Φ = 0.3 Φ = 0.4 exponen la mayor parte de su variación en bajas frecuencias, pero también muestra un pequeño máximo en altas frecuencias.
El espectro para los procesos con Φ = 0.7 Φ = -0. 2 se parece a los espectros rojos de la figura anterior, aunque con un más amplio máximo de baja frecuencia.
Espectro Teórico Espectro Teórico Modelos autorregresivos AR(2)Modelos autorregresivos AR(2)
Significación estadística de los picos Significación estadística de los picos espectrales en relación a un ruido rojoespectrales en relación a un ruido rojo
Imaginemos una serie temporal hipotética de longitud n = 200 para el cual las estimaciones de la autocorrelación con lag 1 y la varianza de ruido blanco son r1 = 0.6 y s2, respectivamente. Un candidato razonable para describir el comportamiento de estos datos es una serie del tipo AR (1) con estos dos parámetros.
Relación señal/ruidoRelación señal/ruidoLa relación señal/ruido (en inglés Signal to noise ratio SNR o S/N) se define como la relación que hay entre la intensidad o potencia de la señal y la intensidad o potencia del ruido que la corrompe.
Espectro para la precipitaciónEspectro para la precipitaciónde verano en Saint Louis (Missouri)de verano en Saint Louis (Missouri)
Espectro para la velocidadEspectro para la velocidaddel viento en New Jersey del viento en New Jersey
(Van der Hoven 1957)(Van der Hoven 1957)
Espectro para la velocidadEspectro para la velocidaddel viento en New Jersey IIdel viento en New Jersey II
(Van der Hoven 1957)(Van der Hoven 1957)