Analiza szeregów czasowych

Analiza szeregów czasowych

dr Małgorzata Radziukiewicz

Szereg czasowy

Szereg czasowy (chronologiczny)

zbiór wartości badanej cechy lub wartości określonego zjawiska zaobserwowanych w różnych momentach (przedziałach) czasu uporządkowany chronologicznie

Przykłady szeregów czasowych

Szeregi czasowe dotyczące zjawisk społeczno-ekonomicznych

- nakład książek i broszur w latach 1990-1997 (w mln egz.); - wartość produkcji w pewnym przedsiębiorstwie w latach

1993 – 2002 (w mld zł.); - produkcja energii elektrycznej w latach (w mln kWh); - skup mleka w woj. poznańskim w latach 1989 -1995(w mln

litrów); - liczba zawartych małżeństw w Polsce w latach 1989 – 1993

(w tys.) itp..

Szeregi czasowe

Szeregi czasowe dotyczące zjawisk społeczno-ekonomicznych można przedstawić w formie graficznej – elementy szeregu prezentowane są przez punkty płaszczyzny o współrzędnych (t,y), które łączy się odcinkami linii prostej

Dłuośc linii kolejowych w Polsce w latach 1990-2004

3

4

5

6

7

8

9

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

lata

tys.

km

nakład książek i broszur w latach 1990-1997 (w mln egz.)

W badanym 8-elementowym szeregu czasowym występuje składowa systematyczna w postaci trendu oraz wahania przypadkowe.

Ocena wzrokowa wykresu wskazuje, ze do opisu przebiegu zmiennej można wykorzystać funkcję liniową

Nakład książek i broszur w latach 1990-1997

60

80

100

120

140

160

180

200

1990 1991 1992 1993 1994 1995 1996 1997

w m

ln e

gzem

plar

zy

wartości rzeczywiste

nakład książek i broszur w latach 1990-1997 (w mln egz.)

Parametry modelu liniowego oszacowano MNK. Obliczenia związane z szacowaniem parametrów linii trendu, wyznaczeniem miar „dobroci”dopasowania, prognozy punktowej i prognozy przedziałowej, błędów prognoz zawarte są w prezentacji pt. ”Szeregi czasowe”.

Wartości rzeczywiste i teoretyczne zmiennej przedstawia rysunek obok.

Nakład książek i broszur w latach 1990-1997

60

80

100

120

140

160

180

200

1990 1991 1992 1993 1994 1995 1996 1997

w m

ln e

gzem

plar

zy

wartości rzeczywiste

wartości teoretyczne

wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002

(w mld zł.) Ocena wzrokowa wykresu

wskazuje, ze w badanym szeregu czasowym występuje składowa systematyczna w postaci trendu rosnącego oraz wahania przypadkowe.

Wzrost wartości zmiennej jest jednak coraz szybszy. W takim przypadku możemy zastosować funkcję o rosnącym tempie wzrostu, np. funkcję wykładniczą.

Wykładniczą funkcję trendu sprowadza się do postaci liniowej przez logarytmowanie, a następnie szacuje się jej parametry za pomocą MNK – zob. prezentację pt. ”Wykładniczy model trendu”.

Wykresy przedstawiają wartości rzeczywiste, teoretyczne i prognozy zmiennej

wartość produkcji w latach 1993-2002 (w mld zł)

4,5 3,5 4,1 57,6

11

16,1 15,5

21

26,4

0

5

10

15

20

25

30

1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

mld

zł

3,1 4,0 5,0 6,4 8,110,2

12,916,4

20,7

26,2

33,2

42,1

53,3

0

10

20

30

40

50

60

mld

zł

produkcja prognoza

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Analiza wzrokowa wykresu wartości zmiennej prognozowanej wskazuje, że zużycie energii w firmie cechuje się liniową tendencją rozwojową oraz wahaniami sezonowymi.

Zadanie:wyznaczyć prognozy zużycia energii na następne dwa kwartały 2008 roku.

Kwartalne zużycie energii elektrycznej w latach 2005-2007

2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

rok 2005 2006 2007

kw. I II II IV I II II IV I II III IV

Y 2,8 3,7 3,0 4,6 3,0 4,2 3,5 5,0 3,5 4,7 4,0 5,3


Poziom zjawiska gospodarczego, które odzwierciedla szereg czasowy, wykazuje różnego rodzaju zmiany:

zmiany określające pewien ogólny kierunek (tendencję rozwojową) czyli tzw. trend;

wahania cykliczne, czyli koniunkturalne (wahania o kresie dłuższym niż rok, które z grubsza odpowiadają cyklom koniunkturalnym);

wahania sezonowe powtarzające się periodycznie w pewnych określonych porach każdego roku lub miesiąca;

wahania nieregularne (które trudno zanalizować i ująć w pewien określony schemat): wahania katastrofalne

spowodowane przez zdarzenia historyczne (wojna, katastrofy żywiołowe, epidemie);

wahania przypadkowe będące wynikiem działania wielkiej liczby przyczyn ubocznych.

Produkcja energii elektrycznej w Polsce w latach 1991-1994 (w mln kWh)

8000

9000

10000

11000

12000

13000

14000

15000

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

miesiące


Rys.1. Składowe szeregu czasowego

wahania cykliczne

wahania sezonowe

trend

wahania przypadkowe

Yt

czas


Każdą obserwację szeregu czasowego możemy więc rozłożyć na trzy składniki lub czynniki:- trend (T);- sezonowość (S);- składnik przypadkowy (U).

Charakter powiązań między trendem, sezonowością i zmiennością losową w szeregach:

- powiązania addytywne:

- i multiplikatywne:

gdzie: yt - obserwacje szeregu czasowego Tt - trend i wahania cykliczne St - sezonowość Ut - zmienność o charakterze losowym (czynnik przypadkowy). Subskrypt t oznacza, że analizujemy zachowanie się zjawiska w czasie.

)1(U + S + T = y tttt

)2(U S T = y tttt


Analiza statystyczna może dotyczyć wszystkich składników szeregu czasowego.

Zwykle dąży się do wyodrębnienia poszczególnych składników szeregu czasowego i pomiaru ich wielkości – dlatego analizę szeregu czasowego określa się jako jego „dekompozycję”.

W celu „dekompozycji” szeregu stosuje się wiele różnych metod statystycznych.

Wyznaczenie z szeregu trendu jest najprostsze. Zadanie wyznaczenia trendu – funkcji f(t) – jest nazywane

wygładzaniem (wyrównywaniem) szeregu czasowego. Możemy tego dokonać stosując jedną z dwóch metod: - metodę analityczną (modelowanie rozwoju zjawiska z

uwzględnieniem analizy regresji – określamy postać funkcji charakteryzującą tendencję rozwojową szeregu i wyznaczamy jej parametry);

- metodę mechaniczną.


Metoda analitycznego wyrównywania szeregów polega na założeniu, że jego tendencję rozwojową (trend) da się przedstawić na wykresie za pomocą pewnej linii matematycznej np. prostej, krzywej wykładniczej itp. o określonym wzorze analitycznym.

Metoda analitycznego wyrównania opiera się na dwóch rodzajach dowolnie przyjętych założeń: krzywa, którą uważa się za najlepsze wyrównanie szeregu ma

określony z góry charakter analityczny; mogą istnieć różne kryteria, na podstawie których ocenia się

"najlepsze dopasowanie krzywej" do wykresu danego szeregu.

Jeżeli oba założenia zostaną ustalone, poszukiwana krzywa jest określona jednoznacznie i wyznaczenie jej analitycznego wzoru jest tylko sprawą rachunkową.

Po wyborze postaci funkcji trendu i oszacowaniu jej parametrów, dokonuje się oceny jakości otrzymanego modelu.

Model wykorzystujemy do sporządzania prognoz.


Przyszłą wartość zmiennej Y uzyskuje się przez ekstrapolację funkcji trendu tj. przez podstawienie do modelu w miejsce zmiennej czasowej numeru momentu lub okresu T, na który wyznaczamy prognozę:

nTdlaTfY P

T )(


Rozważamy przypadek, gdy w szeregu czasowym występują wahania sezonowe.

Odpowiedni model musi więc zawierać parametry i zmienne charakteryzujące te wahania w poszczególnych fazach tego cyklu.

Dla uproszczenia rozważań i zapisu rozpatrujemy zjawisko o rocznym cyklu wahań z kwartałami jako fazami tego cyklu.


2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007



2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

Zakładając, że funkcja trendu jest liniowa a wahania okresowe (kwartalne) nakładają się na tendencję rozwojową w sposób addytywny sformułujemy model następująco:

gdzie: Xt,i (i=1,2,3,4; t=1,2,3…,n) są zmiennymi zero-jedynkowymi reprezentującymi poszczególne fazy cyklu

)1(4,43,32,21,1 tttttt XXX Xt + = Y


Zmienne zero-jedynkowe:

Parametry stojące przy zmiennych zero-jedynkowych (λi) charakteryzują absolutną wielkość wahań okresowych w poszczególnych kwartałach.

Założenia dotyczące składnika losowego εt są takie same jak w modelu nie uwzględniającym wahań okresowych.

)2(..0

.1{, kwpozobserwacjidla

kwtegoiobserwacjidlaX it


Kolumny macierzy X są liniowo zależne

)3(

1000121

0100111

0010101

000191

100081

010071

001061

000151

100041

010031

001021

000111

X


W modelu należy jedną spośród zmiennych przedstawić jako kombinację pozostałych (oznacza to eliminację tej zmiennej).

Zastąpimy zmienną Xt,1 przez kombinację liniową otrzymaną z zależności:

)5(1

)4(1

4,3,2,1,

,

tttt

it

XXXX

czyliX


W wyniku podstawienia model (1) przyjmie następującą postać:

)6(]1[ 4,43,32,24,3,2,1 tttttttt XXX XXXt + = Y

)7()()()()( 4,143,132,121 ttttt X XXt + = Y


Model tendencji rozwojowej z liniową funkcją trendu oraz wahaniami sezonowymi przyjmie zatem postać:

gdzie : yt – poziom zjawiska w okresie t, - stała, - parametr przy zmiennej czasowej, - parametr przy zmiennej Xt,i

εt – składnik losowy dla okresu t

)7()()()()( 4,143,132,121 ttttt X XXt + = Y

)( 1 +

)( 1 i


Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym modelu regresji, uzyskujemy podstawę do szacowania parametrów funkcji trendu za pomocą MNK.

dane niezbędne do obliczeń:X – macierz wartości zmiennych objaśniających (kolumny są liniowo niezależne)Y- wektor zaobserwowanych wartości zmiennej Y

3,5

0,4

7,4

5,3

0,5

5,3

2,4

0,3

6,4

0,3

7,3

8,2

Y

100121

010111

001101

00091

10081

01071

00161

00051

10041

01031

00121

00011

X


wektor ocen parametrów modelu trendu z wahaniami sezonowymi

obliczamy ze wzoru:

)8(

548,1

187,0

994,0

106,0

569,2

~

14

13

12

1

a

)9()(~ 1 yXXXa TT


Wybrane wyniki (obliczenia w Excel) wskazują, iż model jest dobrze dopasowany do danych empirycznych (parametry strukturalne są statystycznie istotne, współczynniki φ2 i V przyjmują wartości bardzo małe):

PODSUMOWANIE - WYJŚCIE

Statystyki regresjiWielokrotność R 0,995918125R kwadrat 0,991852912Dopasowany R kwadrat 0,987197433Błąd standardowy 0,093859064Obserwacje 12

ANALIZA WARIANCJIdf SS MS

Regresja 4 7,5075 1,876875Resztkowy 7 0,061666667 0,008809524Razem 11 7,569166667

Współczynniki Błąd standardowy t StatPrzecięcie 2,56875 0,068243081 37,6411788t 0,10625 0,008296048 12,80730366z2 0,99375 0,077083333 12,89189189z3 0,1875 0,078411182 2,39124057z4 1,547916667 0,080575651 19,21072495


Model zużycia energii elektrycznej w firmie jest postaci:

interpretacja: 2,569 – jest oceną wyrazu wolnego modelu (7) na który składa się wyraz

wolny i odchylenie okresowe dla I kwartału z modelu w postaci wyjściowej (5);

0,106 – ocena współczynnika trendu, wyraża tendencję rozwojową zużycia energii elektrycznej i jest interpretowany jako średni kwartalny wzrost zużycia energii w firmie (w mln kWh) w latach 2005-2007;

0,994- ocena parametru stojącego przy zmiennej Xt,2 reprezentuje odchylenie sezonowe zużycia energii dla II kwartału w porównaniu z I kwartałem. Oznacza, że z tytułu wahań sezonowych zużycie energii w firmie w II kwartale każdego roku jest wyższe o 0,994 mln kWh od zużycia w I kwartale;

Podobnie (jak ocenę parametru stojącego przy zmiennej Xt,2 ) interpretuje się oceny 0,187 i 1,548 parametrów przy Xt,3 oraz Xt,4 .

)992,0(548,1187,0994,0106,0569,2ˆ 24,

)080,0(3,

)078,0(2,

)077,0()008,0()068,0( RX XXt = Y tttt


Prognoza zużycia energii w firmie:

w I kwartale 2008 roku

w II kwartale 2008 roku

947,3

0548,10187,00994,013106,0569,2

13

13

P

P

Y

= Y

047,5

0548,10187,01994,014106,0569,2

14

14

P

P

Y

= Y


Kwartalne zużycie energii elektrycznej w firmie w latach 2005-2007 (w mln kWh) i prognoza na I i II kwartał 2008 roku

2,00

2,50

3,00

3,50

4,00

4,50

5,00

5,50

6,00

1 2 3 4 1 2 3 4 1 2 3 4 1 2

2005 2006 2007 2008

prognoza

zużycie energii

Analiza szeregów czasowych

Documents

Transcript of Analiza szeregów czasowych