Analiza szeregów czasowych

27
Analiza szeregów czasowych dr Małgorzata Radziukiewicz

description

Analiza szeregów czasowych. dr Małgorzata Radziukiewicz. Szereg czasowy. Szereg czasowy (chronologiczny ) zbiór wartości badanej cechy lub wartości określonego zjawiska zaobserwowanych w różnych momentach (przedziałach) czasu uporządkowany chronologicznie. - PowerPoint PPT Presentation

Transcript of Analiza szeregów czasowych

Page 1: Analiza szeregów czasowych

Analiza szeregów czasowych

dr Małgorzata Radziukiewicz

Page 2: Analiza szeregów czasowych

Szereg czasowy

Szereg czasowy (chronologiczny)

zbiór wartości badanej cechy lub wartości określonego zjawiska zaobserwowanych w różnych momentach (przedziałach) czasu uporządkowany chronologicznie

Page 3: Analiza szeregów czasowych

Przykłady szeregów czasowych

Szeregi czasowe dotyczące zjawisk społeczno-ekonomicznych

- nakład książek i broszur w latach 1990-1997 (w mln egz.); - wartość produkcji w pewnym przedsiębiorstwie w latach

1993 – 2002 (w mld zł.); - produkcja energii elektrycznej w latach (w mln kWh); - skup mleka w woj. poznańskim w latach 1989 -1995(w mln

litrów); - liczba zawartych małżeństw w Polsce w latach 1989 – 1993

(w tys.) itp..

Page 4: Analiza szeregów czasowych

Szeregi czasowe

Szeregi czasowe dotyczące zjawisk społeczno-ekonomicznych można przedstawić w formie graficznej – elementy szeregu prezentowane są przez punkty płaszczyzny o współrzędnych (t,y), które łączy się odcinkami linii prostej

Dłuośc linii kolejowych w Polsce w latach 1990-2004

3

4

5

6

7

8

9

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

lata

tys.

km

Page 5: Analiza szeregów czasowych

nakład książek i broszur w latach 1990-1997 (w mln egz.)

W badanym 8-elementowym szeregu czasowym występuje składowa systematyczna w postaci trendu oraz wahania przypadkowe.

Ocena wzrokowa wykresu wskazuje, ze do opisu przebiegu zmiennej można wykorzystać funkcję liniową

Nakład książek i broszur w latach 1990-1997

60

80

100

120

140

160

180

200

1990 1991 1992 1993 1994 1995 1996 1997

w m

ln e

gzem

plar

zy

wartości rzeczywiste

Page 6: Analiza szeregów czasowych

nakład książek i broszur w latach 1990-1997 (w mln egz.)

Parametry modelu liniowego oszacowano MNK. Obliczenia związane z szacowaniem parametrów linii trendu, wyznaczeniem miar „dobroci”dopasowania, prognozy punktowej i prognozy przedziałowej, błędów prognoz zawarte są w prezentacji pt. ”Szeregi czasowe”.

Wartości rzeczywiste i teoretyczne zmiennej przedstawia rysunek obok.

Nakład książek i broszur w latach 1990-1997

60

80

100

120

140

160

180

200

1990 1991 1992 1993 1994 1995 1996 1997

w m

ln e

gzem

plar

zy

wartości rzeczywiste

wartości teoretyczne

Page 7: Analiza szeregów czasowych

wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002

(w mld zł.) Ocena wzrokowa wykresu

wskazuje, ze w badanym szeregu czasowym występuje składowa systematyczna w postaci trendu rosnącego oraz wahania przypadkowe.

Wzrost wartości zmiennej jest jednak coraz szybszy. W takim przypadku możemy zastosować funkcję o rosnącym tempie wzrostu, np. funkcję wykładniczą.

Wykładniczą funkcję trendu sprowadza się do postaci liniowej przez logarytmowanie, a następnie szacuje się jej parametry za pomocą MNK – zob. prezentację pt. ”Wykładniczy model trendu”.

Wykresy przedstawiają wartości rzeczywiste, teoretyczne i prognozy zmiennej

wartość produkcji w latach 1993-2002 (w mld zł)

4,5 3,5 4,1 57,6

11

16,1 15,5

21

26,4

0

5

10

15

20

25

30

1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

mld

3,1 4,0 5,0 6,4 8,110,2

12,916,4

20,7

26,2

33,2

42,1

53,3

0

10

20

30

40

50

60

mld

produkcja prognoza

Page 8: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Analiza wzrokowa wykresu wartości zmiennej prognozowanej wskazuje, że zużycie energii w firmie cechuje się liniową tendencją rozwojową oraz wahaniami sezonowymi.

Zadanie:wyznaczyć prognozy zużycia energii na następne dwa kwartały 2008 roku.

Kwartalne zużycie energii elektrycznej w latach 2005-2007

2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

rok 2005 2006 2007

kw. I II II IV I II II IV I II III IV

Y 2,8 3,7 3,0 4,6 3,0 4,2 3,5 5,0 3,5 4,7 4,0 5,3

Page 9: Analiza szeregów czasowych

Analiza szeregów czasowych

Poziom zjawiska gospodarczego, które odzwierciedla szereg czasowy, wykazuje różnego rodzaju zmiany:

zmiany określające pewien ogólny kierunek (tendencję rozwojową) czyli tzw. trend;

wahania cykliczne, czyli koniunkturalne (wahania o kresie dłuższym niż rok, które z grubsza odpowiadają cyklom koniunkturalnym);

wahania sezonowe powtarzające się periodycznie w pewnych określonych porach każdego roku lub miesiąca;

wahania nieregularne (które trudno zanalizować i ująć w pewien określony schemat): wahania katastrofalne

spowodowane przez zdarzenia historyczne (wojna, katastrofy żywiołowe, epidemie);

wahania przypadkowe będące wynikiem działania wielkiej liczby przyczyn ubocznych.

Produkcja energii elektrycznej w Polsce w latach 1991-1994 (w mln kWh)

8000

9000

10000

11000

12000

13000

14000

15000

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

miesiące

Page 10: Analiza szeregów czasowych

Analiza szeregów czasowych

Rys.1. Składowe szeregu czasowego

wahania cykliczne

wahania sezonowe

trend

wahania przypadkowe

Yt

czas

Page 11: Analiza szeregów czasowych

Analiza szeregów czasowych

Każdą obserwację szeregu czasowego możemy więc rozłożyć na trzy składniki lub czynniki:- trend (T);- sezonowość (S);- składnik przypadkowy (U).

Charakter powiązań między trendem, sezonowością i zmiennością losową w szeregach:

- powiązania addytywne:

- i multiplikatywne:

gdzie: yt - obserwacje szeregu czasowego Tt - trend i wahania cykliczne St - sezonowość Ut - zmienność o charakterze losowym (czynnik przypadkowy). Subskrypt t oznacza, że analizujemy zachowanie się zjawiska w czasie.

)1(U + S + T = y tttt

)2(U S T = y tttt

Page 12: Analiza szeregów czasowych

Analiza szeregów czasowych

Analiza statystyczna może dotyczyć wszystkich składników szeregu czasowego.

Zwykle dąży się do wyodrębnienia poszczególnych składników szeregu czasowego i pomiaru ich wielkości – dlatego analizę szeregu czasowego określa się jako jego „dekompozycję”.

W celu „dekompozycji” szeregu stosuje się wiele różnych metod statystycznych.

Wyznaczenie z szeregu trendu jest najprostsze. Zadanie wyznaczenia trendu – funkcji f(t) – jest nazywane

wygładzaniem (wyrównywaniem) szeregu czasowego. Możemy tego dokonać stosując jedną z dwóch metod: - metodę analityczną (modelowanie rozwoju zjawiska z

uwzględnieniem analizy regresji – określamy postać funkcji charakteryzującą tendencję rozwojową szeregu i wyznaczamy jej parametry);

- metodę mechaniczną.

Page 13: Analiza szeregów czasowych

Analiza szeregów czasowych

Metoda analitycznego wyrównywania szeregów polega na założeniu, że jego tendencję rozwojową (trend) da się przedstawić na wykresie za pomocą pewnej linii matematycznej np. prostej, krzywej wykładniczej itp. o określonym wzorze analitycznym.

Metoda analitycznego wyrównania opiera się na dwóch rodzajach dowolnie przyjętych założeń: krzywa, którą uważa się za najlepsze wyrównanie szeregu ma

określony z góry charakter analityczny; mogą istnieć różne kryteria, na podstawie których ocenia się

"najlepsze dopasowanie krzywej" do wykresu danego szeregu.

Jeżeli oba założenia zostaną ustalone, poszukiwana krzywa jest określona jednoznacznie i wyznaczenie jej analitycznego wzoru jest tylko sprawą rachunkową.

Po wyborze postaci funkcji trendu i oszacowaniu jej parametrów, dokonuje się oceny jakości otrzymanego modelu.

Model wykorzystujemy do sporządzania prognoz.

Page 14: Analiza szeregów czasowych

Analiza szeregów czasowych

Przyszłą wartość zmiennej Y uzyskuje się przez ekstrapolację funkcji trendu tj. przez podstawienie do modelu w miejsce zmiennej czasowej numeru momentu lub okresu T, na który wyznaczamy prognozę:

nTdlaTfY P

T )(

Page 15: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Rozważamy przypadek, gdy w szeregu czasowym występują wahania sezonowe.

Odpowiedni model musi więc zawierać parametry i zmienne charakteryzujące te wahania w poszczególnych fazach tego cyklu.

Dla uproszczenia rozważań i zapisu rozpatrujemy zjawisko o rocznym cyklu wahań z kwartałami jako fazami tego cyklu.

Kwartalne zużycie energii elektrycznej w latach 2005-2007

2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

Page 16: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Kwartalne zużycie energii elektrycznej w latach 2005-2007

2

2,5

3

3,5

4

4,5

5

5,5

1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

Zakładając, że funkcja trendu jest liniowa a wahania okresowe (kwartalne) nakładają się na tendencję rozwojową w sposób addytywny sformułujemy model następująco:

gdzie: Xt,i (i=1,2,3,4; t=1,2,3…,n) są zmiennymi zero-jedynkowymi reprezentującymi poszczególne fazy cyklu

)1(4,43,32,21,1 tttttt XXX Xt + = Y

Page 17: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Zmienne zero-jedynkowe:

Parametry stojące przy zmiennych zero-jedynkowych (λi) charakteryzują absolutną wielkość wahań okresowych w poszczególnych kwartałach.

Założenia dotyczące składnika losowego εt są takie same jak w modelu nie uwzględniającym wahań okresowych.

)2(..0

.1{, kwpozobserwacjidla

kwtegoiobserwacjidlaX it

Page 18: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Kolumny macierzy X są liniowo zależne

)3(

1000121

0100111

0010101

000191

100081

010071

001061

000151

100041

010031

001021

000111

X

Page 19: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

W modelu należy jedną spośród zmiennych przedstawić jako kombinację pozostałych (oznacza to eliminację tej zmiennej).

Zastąpimy zmienną Xt,1 przez kombinację liniową otrzymaną z zależności:

)5(1

)4(1

4,3,2,1,

,

tttt

it

XXXX

czyliX

Page 20: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

W wyniku podstawienia model (1) przyjmie następującą postać:

)6(]1[ 4,43,32,24,3,2,1 tttttttt XXX XXXt + = Y

)7()()()()( 4,143,132,121 ttttt X XXt + = Y

Page 21: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Model tendencji rozwojowej z liniową funkcją trendu oraz wahaniami sezonowymi przyjmie zatem postać:

gdzie : yt – poziom zjawiska w okresie t, - stała, - parametr przy zmiennej czasowej, - parametr przy zmiennej Xt,i

εt – składnik losowy dla okresu t

)7()()()()( 4,143,132,121 ttttt X XXt + = Y

)( 1 +

)( 1 i

Page 22: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym modelu regresji, uzyskujemy podstawę do szacowania parametrów funkcji trendu za pomocą MNK.

dane niezbędne do obliczeń:X – macierz wartości zmiennych objaśniających (kolumny są liniowo niezależne)Y- wektor zaobserwowanych wartości zmiennej Y

3,5

0,4

7,4

5,3

0,5

5,3

2,4

0,3

6,4

0,3

7,3

8,2

Y

100121

010111

001101

00091

10081

01071

00161

00051

10041

01031

00121

00011

X

Page 23: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

wektor ocen parametrów modelu trendu z wahaniami sezonowymi

obliczamy ze wzoru:

)8(

548,1

187,0

994,0

106,0

569,2

~

14

13

12

1

a

)9()(~ 1 yXXXa TT

Page 24: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Wybrane wyniki (obliczenia w Excel) wskazują, iż model jest dobrze dopasowany do danych empirycznych (parametry strukturalne są statystycznie istotne, współczynniki φ2 i V przyjmują wartości bardzo małe):

PODSUMOWANIE - WYJŚCIE

Statystyki regresjiWielokrotność R 0,995918125R kwadrat 0,991852912Dopasowany R kwadrat 0,987197433Błąd standardowy 0,093859064Obserwacje 12

ANALIZA WARIANCJIdf SS MS

Regresja 4 7,5075 1,876875Resztkowy 7 0,061666667 0,008809524Razem 11 7,569166667

Współczynniki Błąd standardowy t StatPrzecięcie 2,56875 0,068243081 37,6411788t 0,10625 0,008296048 12,80730366z2 0,99375 0,077083333 12,89189189z3 0,1875 0,078411182 2,39124057z4 1,547916667 0,080575651 19,21072495

Page 25: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Model zużycia energii elektrycznej w firmie jest postaci:

interpretacja: 2,569 – jest oceną wyrazu wolnego modelu (7) na który składa się wyraz

wolny i odchylenie okresowe dla I kwartału z modelu w postaci wyjściowej (5);

0,106 – ocena współczynnika trendu, wyraża tendencję rozwojową zużycia energii elektrycznej i jest interpretowany jako średni kwartalny wzrost zużycia energii w firmie (w mln kWh) w latach 2005-2007;

0,994- ocena parametru stojącego przy zmiennej Xt,2 reprezentuje odchylenie sezonowe zużycia energii dla II kwartału w porównaniu z I kwartałem. Oznacza, że z tytułu wahań sezonowych zużycie energii w firmie w II kwartale każdego roku jest wyższe o 0,994 mln kWh od zużycia w I kwartale;

Podobnie (jak ocenę parametru stojącego przy zmiennej Xt,2 ) interpretuje się oceny 0,187 i 1,548 parametrów przy Xt,3 oraz Xt,4 .

)992,0(548,1187,0994,0106,0569,2ˆ 24,

)080,0(3,

)078,0(2,

)077,0()008,0()068,0( RX XXt = Y tttt

Page 26: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Prognoza zużycia energii w firmie:

w I kwartale 2008 roku

w II kwartale 2008 roku

947,3

0548,10187,00994,013106,0569,2

13

13

P

P

Y

= Y

047,5

0548,10187,01994,014106,0569,2

14

14

P

P

Y

= Y

Page 27: Analiza szeregów czasowych

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Kwartalne zużycie energii elektrycznej w firmie w latach 2005-2007 (w mln kWh) i prognoza na I i II kwartał 2008 roku

2,00

2,50

3,00

3,50

4,00

4,50

5,00

5,50

6,00

1 2 3 4 1 2 3 4 1 2 3 4 1 2

2005 2006 2007 2008

prognoza

zużycie energii