Zmiany strukturalne i/a zjawisko długiej pamięci w szeregach
czasowych
Robert Kozarski SGH
Zjawisko długiej pamięci (long memory) lub zależności długookresowej (long range dependance) oznacza, że funkcja autokorelacyjna szeregu czasowego
wygasa w tempie hiperbolicznym, a nie wykładniczo jak to jest w przypadku procesów mających
reprezentację w postaci procesu ARMA.
Tym samym pojawiające się zaburzenia są długo oddziałują na zachowanie się badanego zjawiska,
lub inaczej obserwacje odległe w czasie są nadal od siebie zależne
(skorelowane).
Zjawisko długiej pamięci zostało zaobserwowane po raz pierwszy przez
hydrologa i konstruktora tam na Nilu Harolda Hursta (Hurst [1951]),
który zauważył, że tradycyjne metody zawodzą w przypadku prognozowania
poziomu Nilu. Wprowadził wykładnik Hursta H (pierwotnie oznaczył to jako k) będący miarą
zmienności poziomu zmienności wody
Własność długiej pamięci można zdefiniować (por. Baillie [1996]):
n
njjn
lim
1) Jeśli proces dyskretny proces ma funkcje autokorelacyjną dla opóźnień j. tx j
,)(lim0
f
2) Funkcja gęstości spektralnej jest nieograniczona dla częstotliwości
,2
n
j
3) Bardziej ogólna definicja (Heyde, Yang [1997]):
22
1
2
1 )(lim
n
n
n xx
xx
.,,2,1 nj
Jedną klase dla procesów długiej pamięci -procesy samopodobne (self similar processes) z paramerem d
wprowadził Madelbrot i Ness (Mandelbrot, Ness [1968]).Są one uogólnieniem
ułamkowego ruchu Browna (fractional brownian motion), gdzie:
)5,0;5,0(d lub )1;0(d
Drugą klasą modeli są modele ARFIMA jako pewna generalizacja modeli ARIMA wprowadzone przez Grangera i Joeux
(Granger, Joeux [1981]).
,)()1)(( ttd LxLL );0(~ 2 IIDt
1 1)(
)()1(
j
kd
jd
LdjL
Wprowadzając pojęcie współczynnika Hursta H i współczynnika integracji ułamkowej d
mamy do czynienia ze zjawiskiem długiej pamięci, gdy:
1lim)1(2 H
j
j cj
Czyli, funkcja autokorelacyjna zbiega wraz ze wzrostem opóźnienia zbiega do funkcji autokorelacyjnej ułamkowego procesu Gaussowskiego (pierwsze przyrosty ułamkowego ruchu Browna).
5,0Hd
1lim)5,0(2 d
j
j cj
Analogicznie używając funkcji gęstości spektralnej możemy stwierdzić, że:
1)(
lim 210 H
c
f
Własności procesu w zależności od parametrów H, d
0<d<0,5 0,5<H<1 Długa pamięć, stacjonarność, persystencja**
-0,5<d<0 0<H<0,5 Krótka pamięć, stacjonarność, antypersystentny
d=0 H=0,5 Niezależność, brak pamięci*, biały szum
0,5<=d<1 . Proces niestacjonarny, I(1), persystentny,
** persistency – trwałość, trwałe utrzymywanie kierunków zmian*-standard short memory
Tak więc wartość współczynnika d lub H może świadczyć o występowaniu lub braku w szeregu czasowym długiej pamięci.
Wśród ekonometryków jest duże zainteresowanie estymacją parametrów d i H (Baillie [1996]) wskazujących na istnienie lub nie zjawiska długiej pamięci w szeregu. Pomija się jednak często dwie ważne kwestie:
1) Testowanie zajścia zmian strukturalnych w szeregach z długą pamięcią (Hidalgo, Robinson [1996] (Lobato, Savin [1997], Engle, Smith [1999], Granger, Hyung [1999], Diebold, Inoue [1999]).
1) Estymacja d lub H bez zwracania uwagi na pojawianie się zmian strukturalnych(Teverovsky, Taqqu [1997], Kramer, Sibbertsen [2000], Wright [1998]).
Zmiany strukturalne vs długa pamięć
1. Zjawisko pozornej długiej pamięci (spurious long memory) procesu może często być generowane przez zachodzące zmiany strukturalne lub trendy występujące w badanych danych
Typowe dla procesów z długa pamięcią hiperboliczne zanikanie funkcji autokorelacyjnej, może być również generowane dla szeregów z krótka pamięcią, w których występują zmiany strukturalne.
2. Własność długiej pamięci może powodować występowanie pozornych zmian strukturalnych (Kramer, Siebbertsen [2000], Siebbertsen [2003]).
Niektóre testy na występowanie zmian strukturalnych, mogą dawać mylne wynikiwskazując na występowanie zmian strukturalnych tam gdzie ich nie ma.
Testy CUSUM na występowanie zmian strukturalnych w szeregach z długą pamięcią
Rozważamy równanie regresji (estymowane MNK):
gdzie:
Weryfikujemy hipotezę alternatywną, że zaszła nieoczekiwana zmiana strukturalna parametru regresji. Statystyka testująca ma postać:
,ttt xy
nt ,,2,1
Test MNK–CUSUM zaproponowany przez Ploberger, Kramer [1992].
)(sup10
nCTS
gdzie
n
ttn n
C
1ˆ
1)(
);0(~ 2 IIDt
)(nCW przypadku, gdy odchylenia resztowe są białym szumem rozkładStatystyki zbiega do standardowego ruchu Browna. Natomiast
)()(
dn Bn
C czyli ułamkowego ruchu Browna z parametrem d.
Test standardowy CUSUM zaproponowany przez Brown, Durbin, Evans [1975].
Wykorzystuje rekursywne reszty z modelu regresji: ,ttt xy Statystyka testowa ma postać:
nkt
xXXxf
f
xy
nW
WS
t
tt
tt
t
t
ttt
n
kttn
nn
,,1
))(1
ˆ
ˆ
1)(
21
)(sup)(
1)1()1(''
)1('
1
10
Podobnie jak w przypadku MNK-CUSUM rozkład statystyki
czyli ułamkowego ruchu Browna.
)()(
dd
n Bn
W
Aby to zbadać wygenerowano proces mający reprezentacje ARFIMA (0,d,0) (algorytm Davies-Harte’a (Davis, Harte [1987]))
dla d = 0; 0,1; 0,2; 0,3; 0,4, czyli w przypadkach kiedy reszty wykazują własność długiej pamięci.
Sibbertsen [2000] udowodnił, że dla dużych prób w przypadku ułamkowego zintegrowania reszt modelu,rozkład statystyk testowych w przypadku braku zmian
strukturalnych zbiega do nieskończoności. Czyli w efekcie odrzucamy hipotezę o braku
zmian strukturalnych w procesie.Tym samym testy nie są odporne na zjawisko długiej pamięci.
Dla testu MNK-CUSUM
Dla testu standardowego CUSUM
Wybrane estymatory parametru d mające znaczenie w wykrywaniu zmian strukturalnych
Metoda wariancyjna
Metoda GPH
Metoda TGPH
Metoda falkowa
O istnieniu zmian strukturalnych może również świadczyć zachowanie się estymatora parametru d.
Metoda wariancyjna
Zaproponowana przez Teverowsky, Taqqu [1997] i Giraitis [2000].
2/
1
)()(
/
1
)()(
1)1(
)(
/
1/
1
/,,2,1
,1
mn
k
m
k
m
k
mn
k
m
k
m
k
km
mktt
m
k
xxmn
V
xmn
x
mnk
xm
x
Estymator d jest uzyskiwany graficzne poprzez wykres ln(V) w zależności od różnych wartości i ln(m). Jeśli szereg wykazuje długą pamięć wykres powinien być linia prostą ze współczynnikiem b = 2d-1
Wyniki estymacji metodą wariancyjną w przypadku zachodzących zmian strukturalnych
Teverovsky i Taqqu [1997] pokazali, że w przypadku pozornej długiej pamięci wykres ln (V) w zależności od ln(m) nie jest linią prostą tylko ma przebieg wykładniczy z ujemnym współczynnikiem kierunkowym. Takie zachowanie może wskazywać na zachodzące zmiany strukturalne, które generują pozorne zjawisko długiej pamięci.
Metoda GPH – log periodogramu
Zaproponowana przez Geweke, Porter-Hudak [1983]
2
1
)2(
2
1)(
n
t
it
tjxjex
nI
Niech
txbędzie periodogramem procesu
Estymator parametru d wyznaczany jest MNK z równania regresji postaci:
,ln)ln(2ln)(ln jjjx dcI
Gdzie: n
jj
2 oznacza j-ta częstotliwość Fouriera,,,2,1 5
4
nj
Jednak GPH jest wrażliwy na zmiany strukturalne występujące w badanym procesie
Metoda tapered GPH – zawężonego periodogramu
Zaproponowany przez Velsaco [1999] oraz Hurvitch,Ray [1995]
21
0
1
2,
2
1)(
n
t
ti
ttn
tt
jxnjexw
wI
Gdzie:
n
tw j
)5,0(2cos1
2
1
Rozważamy periodogram procesu: tt xw
Oznacza tzw. taper-zawężacz, czyli czynnik, który redukuje w pewnym stopniu wpływ niskich i niestacjonarnych częstotliwości, jak również zmian strukturalnych i występujących trendów.
Wykrywanie istnienia zmian strukturalnych z wykorzystaniem Estymatorów GPH i TGPH
Sibbertsen [2002] wykazał, że różnica powstała z porównania wartości estymatorów GPH i TGPH jest wyznacznikiem tegoczy w badanym szeregu występuje długa pamięć lub zmiany strukturalne.
GPH<<TGPHZmiany strukturalne
lub trend
GPH TGPH Długa pamięć
Estymator falkowy (wavelet) (Jensen [1999]), są odporne na zaburzenia ze strony zmian strukturalnych, jednak odporność zależy od wyboru rodzaju falki.
Sibbertsen [2002] i Abry, Vietch [1998], proponują falkę Daubechies rzędu czwartego gdyż estymator d zbudowany na jej podstawie chrakteryzuje największą odpornością na występujące zmiany strukturalne.
Estymatory falkowe w estymacji d
Bootstrapowe wersje testów Bartlett’a i Cramera von Misses’aZarys metody
Rozważamy równanie regresji: ttt xy Interesuje nas, czy parametr regresji pozostaje stały w czasie. Testem, którybędzie weryfikować hipotezę o stałości parametru będzie:
- test Bartlett’a (test supremum);- Cramera von Misses’a (test odległości).
Powyższe dwa testy maja zastosowanie w przypadku szeregów z krótką pamięcią. Rozszerzenie ich na modele z długą pamięcią powoduje, że ich postać zależy odnieznanych wartości estymatorów, których rozkład jest określony w sposób przybliżony. Wykorzystując metody boostrapowe możemy wyznaczyć rozkład empiryczny i na jego podstawie zweryfikować hipotezę o zmianie wartości parametru modelu regresji.
Hidalgo i Lazarova [2003] proponują, aby równanie regresji rozszerzyć do postaci:
wpp
ntnxz
zxy
t
t
tttt
0
1
gdzie )0( nn okres zajścia (ewentualnej) zmiany strukturalnej.
Wyznaczamy estymatory MNK parametrów regresji . i Przekształcając równanie regresji na dziedzinę częstościową otrzymujemy:
1,,2,1
)()()()(
nj
wwww jujzjxjy
gdzie:
n
t
it
td edn
w12
1)(
Estymatory w dziedzinie częstościowej wyznacza się z:
1
1
1
1
1
1
1
1
1
1
1
1
1
)(
)(
)()(
)()(
)(ˆ)(ˆ
n
jjzy
n
jjxy
n
jjzz
n
jjzx
n
jjxz
n
jjxx
I
I
II
II
Dyskretna transformata Fouriera
Dziedzina częstościowa jest stosowana, gdyż bootstrapowanie nie wymaga wyznaczania różnych parametrów (tuning parameters) np. długości okna
w metodzie blokowej, należącej do metod bootstrapowych dla szeregów czasowych
W wyniku dalszych analiz okazuje się, że rozkład statystyki:̂ zależy od
nieznanych parametrów . i Których zgodne estymatory mają postać:
n
ttt
n
jjuujxx
xxn
IIn
1
'
1
1ˆˆ
2
1ˆ
)()(4ˆ
)1(
)1()(~~
ˆ)(ˆ
)(
BB
W szczególnych przypadkach funkcjonały ruchu Browna są znane i kwantyle Rozkładu można łatwo wyznaczyć. W innych przypadkach należy te funkcjonały wyznaczać symulacyjnie. Alternatywną metodą obliczenia wartości krytycznych Rozkładu statystyki jest metoda bootstrap. Zasadniczym celem tej metody jest zastąpienie nieznanego rozkładu rozkładem empirycznym wyznaczonym na podstawie badanej próby (szeregu czasowego).
1. Obliczamy wartości estymatorów parametrów modelu regresji
tttt zxy 2. Obliczamy wartość dyskretnej transformaty Fouriera:
oraz wyznaczamy reszty teoretyczne tttt zxyu ˆˆˆ
n
t
it
tjujeu
nw
1ˆ ˆ
2
1)(
3. Wyznaczamy jej postać znormalizowaną
1,,2,1,
)(1
1)(
11
)(1
1)(
)(1
1
21
1ˆˆ
1
1ˆˆ
ˆ
nj
wn
wn
wn
ww
n
j
n
jjuju
n
jjuju
ju
i spośród otrzymanych elementów dla kolejnych j, losujemy niezależnie n-1 elementów .
4. Generujemy próbę boostrapową składającą się z następujących elementów
*ˆ0
* )()(ˆ)( jjujxjy www
*
1
*
2
*
1 ,,, n
5. Wyznaczamy wartości bootstrapowe szukanych estymatorów parametrów
6. Wyznaczamy poziomy bootstrapowe statystyk testujących
,ˆsup *
)1(
*
n
jnKS
njn
n
nj jnj
n
n
jn
nCvM
)1(2
**
)()(ˆ1
7. Porównujemy poziomy statystyk testowych otrzymanych z metody Bootstrapowej z poziomem nominalnym dla określonego α (z dystrybuanty rozkładu normalnego). Wyznaczamy frakcję pprzypadków kiedy hipoteza o braku zmian strukturalnych została odrzucona.
1
1
1
1
1
1
1
1
1
1
1
1
1
*
*
)(
)(
)()(
)()(
)(ˆ)(ˆ
*
*
n
jjzy
n
jjxy
n
jjzz
n
jjzx
n
jjxz
n
jjxx
I
I
II
II
KS KS CvM CvMdx du 5% 10% 5% 10%n=320 0 4,7 9,7 6,6 13,20 0,2 5,8 11,3 7 12,30,2 0 4,9 9,5 6,3 11,90,2 0,2 6,3 11,6 6,8 12,7n=640 0 4,9 11,3 6,3 12,60 0,2 6,8 13 6,5 12,70,2 0 5,5 10,9 6 12,30,2 0,2 6,5 11,9 6,6 12,6n=1280 0 4,7 10,8 5 10,50 0,2 5,8 11,9 5,7 10,20,2 0 4,8 10,4 5,4 11,10,2 0,2 5,7 10,7 5,5 10,9n=2560 0 5,3 10,4 5,1 10,60 0,2 5,8 10,7 5 10,80,2 0 5,1 10,2 4,9 100,2 0,2 5,4 10,7 4,3 10,4
Wyniki testów bootstrapowych
Hipoteza o braku zmian strukturalnych była w większości
przypadków przyjmowana tak więc rozkład empiryczny wyznaczony zapomocą procedury bootstrapowej
dobrze „imituje” rozkład asymptotyczny.
Top Related