Day 9 Forecasting Time Series With Arma and Arima Models

30
Economics 20 - Prof. Anderson 1 Dbáo chui thi gian sdng mô hình ARMA và ARIMA Nguyn Ngc Anh Trung tâm Nghiên cu Chính sách và Phát trin Nguyn VitCường Đạihc Kinh tế Quc dân

description

bjjbjb

Transcript of Day 9 Forecasting Time Series With Arma and Arima Models

Page 1: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 1

Dự báo chuỗi thời gian sử dụngmô hình ARMA và ARIMA

Nguyễn Ngọc AnhTrung tâm Nghiên cứu Chính sách và Phát triển

Nguyễn Việt CườngĐại học Kinh tế Quốc dân

Page 2: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 2

Mô hình chuỗi thời gian đơn(Univariate time series models)

Mô hình ARMA cho các dãy số cân bằngMô hình AR và các tính chất của mô hìnhMô hình MA và tính chất của mô hình

Là mô hình mà ta dự đoán giá trị tương lai của môhình dựa trên các giá trị quá khứ của dãy sốSử dung để dự báo ngắn hạnKhông có tính lý thuyết, không giống mô hình cấutrúc (structural models)

Page 3: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 3

Phương pháp Box Jenkins

Box and Jenkins (1970) là những người đầutiên thực hiện việc ước lượng mô hìnhARMA một cách có hệ thống: Gồm 3

1. Xây dựng/xác định mô hình -Identification

2. Ước lượng Estimation3. Kiểm định mô hình - Model

diagnostic checking

Page 4: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 4

Phương pháp Box Jenkins

Bước 1: Xây dựng môKiểm định nghiệm đơn vị, xem xem có

cần lấy sai phân số liệu hay Xác định bậc p và q

Page 5: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 5

Phương pháp Box Jenkins

Bước 2:Ước lượng các tham số của mô hình

Việc ước lượng có thể được thực hiện bằngphương pháp khả năng cực đại hoặc, bìnhphương cực tiểu phi tuyến

Bước 3: Kiểm địnhKiểm định dựa trên phần dư của mô hình

Page 6: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 6

Dãy số nhiễu trắng

Nếu dãy số thời gian εt là nhiễu trắng ta cóvơi mọi t:

0sfor0)ε,ε(Covσ)ε(Var

0)ε(E

stt

2t

t

≠==

=

Page 7: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 7

Chỉ xét các dãy số cân bằng

Xem các phần bài giảng trước về định nghĩa củamột dãy số cân bằngHai yếu tố cơ bản để xây dưng mô hình ARMA vàđể dự báo là:

Hàm tự tương quan của mẫu (sample autocorrelation function - ACF)Hàm tự tương quan một phần của mẫu (sample partial autocorrelation function - PACF)

Page 8: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 8

Hàm số tự tương quan của mẫu (SAMPLE AUTOCORRELATION FUNCTION) (còn được gọi là correlogram)

( ) ( ) ,...2,1,0k)Y(raV)Y(raV

Y,YvoCrY,YrroCktt

kttkktt ±±===

−−

Chúng ta muốn ước lượng rk với k=1,2,3,… Có thể làm điều này một cách dễ dàng trong STATA với lệnh AC

Page 9: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 90 5 10

-0.75

-0.50

-0.25

0.00

0.25

0.50

0.75

1.00ACF-u

Hàm ACF của dãy nhiễu trắng (400 quan sát lấy từphân phối chuẩn N(0,1) )

Page 10: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 10

Hàm tự tương quan một phần của mẫu (sample partial autocorrelation function - PAC)

The kth order estimated or sample PAC coefficient, denoted here , is obtained as the parameter estimate of in the kth order autoregression

kkφkφ

tktk2t21t10t εYφ...YφYφφY +++++= −−−

Page 11: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 110 5 10

-0.75

-0.50

-0.25

0.00

0.25

0.50

0.75

1.00PACF-u Hàm PACF của mẫu của một dãy

nhiễu trắng

Page 12: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 12

Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc nhất AR (1), thì sẽ có dạng

)σ NID(0, ~ ε

T1,...,= t, ε + Yφ + φ = Y2

t

t1-t10t

Page 13: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 13

Dãy số tự qui (autoregressive processes) Nếu Y là một dãy số tự qui bậc p AR (p), thì sẽ có dạng

)σ NID(0, ~ ε

T1,...,= t, ε + Yφ + ... + Yφ + φ = Y2

t

tp-tp1-t10t

Page 14: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 140 50 100 150 200 250 300 350 400

0

1

2

3

4

5

6

7

8 Y2 Y2 an AR(1) series: Y2t = 2 +0.5Y2t-1 + εt

Page 15: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 15

Dãy số trung bình trượt MA (1) Nếu Y là một dãy số trung bình trượt bậc nhất MA (1), thì Y sẽ có dạng

εθ+ε+γ=Y 1-t1tt

Dãy MA (q) Nếu Y là một dãy trung bình trượt bậc q thì Y sẽ có dạng

εθεθεθεγ q-tq2-t21-t1tt +... +++ + = Y

Page 16: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 160 50 100 150 200 250 300 350 400

-1

0

1

2

3

4

5

Y1 An MA(2) process

Page 17: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 17

Dãy số ARMA

Y là một dãy số ARMA (p,q) :

qtq1t1tptp1t1t εθ...εθεYφ...YφαY −−−− +++++++=

Page 18: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 18

Một dãy số/mô hình ARMA(p,q) nếu lựa chọn được bậc p và q phù hợp, có thể mô phỏng (mimic) bất kỳ một dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử

dụng các thong tin trong quá khứ của Yt (ước lượng mô hình)

Thì chúng ta có thể sử dụng mô hình ARMA để dự báo các giá trị trong tương lai của Yt.

Page 19: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 19

Dãy số tự qui và hàm số tự tương quan (ACF)và hàm tương quan một phần (PACF) Với một dãy số AR(p) thuần túy ta có: Hàm số tự tương quan (ACF) có xu hướng giảm dần khi k tăng lên Hàm số tự tương quan một phần (PACF) sẽ có xu hướng Cho ta biết một điểm cắt (a cut off point), điểm cắt này tương ứng với việc hàm số tự tương quan một phần sẽ khác 0 vcác k ≤ p, nhưng sẽ bằng 0 (xấp xỉ) với k>p.

Page 20: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 20

0 5 10

-0.5

0.0

0.5

1.0ACF-Y2

0 5 10

-0.5

0.0

0.5

1.0PACF-Y2

Y2, an AR(1) series

Page 21: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 21

Dãy số MA và hàm tự tương quan (ACF) và hàm tự tương quan một phần PACF Khi ước lượng các hàm ACF và PACF, thì chúng có các đặc điểm sau để phân biệt đối với dãy số MA (q) thuần túy • Hàm ACF có điểm cắt (cut-off point) là điểm mà hệ số tự tương quan rk

có giá trị xấp xỉ bằng không, với mọi k>q • Hàm PACF có xu hướng giảm dần khi k tăng lên

Page 22: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 22

0 5 10

-0.5

0.0

0.5

1.0ACF-Y1

0 5 10

-0.5

0.0

0.5

1.0PACF-Y1

MA(2) series

Page 23: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 23

Một số điểm lưu ý

1: Với mô hình MA(q), ACFq+1 = ACFq+2 = … = 0.2: Với mô hình AR(q), PACFp+1 = PACFp+2 = …= 0.3: Nhiễu trắng, ACF1 = ACF2 = … = PACF1 = PACF2 = … = 0.

Page 24: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 24

Mô hình ACF PACFNhiễu trắng Tất cả đều bằng 0 Tất cả đều bằng 0

MA(1) Bằng 0 sau 1 bước trễ Giảm dần từ bước trễ thứ 1

MA(2) Bằng 0 sau 2 bước trễ Giảm dần từ bước trễ thứ 2

MA(q) Bằng 0 sau q bước trễ Giảm dần từ bước trễ thứ q

AR(1) Giảm theo cấp số nhân (geometric) tình từbước trễ thứ 1

Bằng 0 sau 1 bước trễ

AR(2) Giảm theo cấp số nhân (geometric) tình từbước trễ thứ 2

Bằng 0 sau 2 bước trễ

AR(p) Giảm theo cấp số nhân (geometric) tình từbước trễ thứ p

Bằng 0 sau p bước trễ

ARMA(1,1) Giảm theo cấp số nhân (geometric) tình từbước trễ thứ 1

Giảm từ bước trễ thứ 1

ARMA(p,q) Giảm theo cấp số nhân (geometric) tình từbước trễ thứ p

Giảm từ bước trễ thứ q

Đặc điểm của mô hình ARMA

Page 25: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 25

Kiểm định tự tương quan Để kiểm định giả thuyết dưới dạng

0 :Hvói 0 = :H kak0 ≠ρρ Chúng ta sử dụng hệ số ước lượng tự tương quan, rk, để làm xấp xỉ thay cho (proxies) hệ số tự tương quan thật (true autocorrelation coefficients) và sử dụng hàm phân phối xấp xỉ nếu giả thuyết trống là đúng là:

) T1 0, N(~ rk

Như vậy, khoảng tin cậy 95% có thể được xây dựng như sau

T2 rk ±

Page 26: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 26

Kiểm định tự tương quan từng phần Để kiểm định xem liệu các hệ số tự tương quan từng phần (PAC) ở một độ trễ nào có có khác 0 về mặt thống kê hay không, chúng ta có thể thực hiện như sau. Gọi kkφ là hệ số tương quan từng phần ở bậc k và kkφ là ước lượng dựa trên mẫu. Chúng ta muốn kiểm định giả thuyết sau

0 φ :H vs0 = φ :H kkakk0 ≠

Chúng ta sử dụng hệ số ước lượng của hệ số tương quan từng phần dựa trên mẫu để thay thế cho tham só thực và sử dụng hàm phân phối xấp xỉ (với điều kiện là giả thuyết trông đúng)

) T1 0, N(~ φkk

Nhu vậy chúng ta có thể xây dựng được khoảng tin cậy 95% để sử dụng cho việc kiểm định như sau

T2 φkk ±

Page 27: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 27

Các bước tiếp theo của phương pháp BOX JENKINS Có 2 bước tiếp theo cần thực hiện: 1. Ước lượng các tham số của mô hình ARMA cho biến Y 2. Tiến hành dự báo (động – dynamic forecast)đối với Y dựa trên mô

hình ARMA vừa ước lượng được. Dự báo động có thể được tiến hành theo phương pháp đệ qui (recursively).

δ + εθ + εθ + ε+ Yφ + Yφ = Y 1-T2T11+T1-T2T11+T

Dự báo một kỳ tiếp theo (one step/period ahead forecast) chính là kỳ vọng toán có điều kiện của YT+1 dựa trên số liệu quá khứ Y (conditional upon the past history of Y), và có dạng như sau

δ + εθ + εθ + Yφ + Yφ = Y 1-T2T11-T2T11+T

Page 28: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 28

Chúng ta biết một mô hình ARMA(p,q) nếu chọn được bậc p và q thích hợp có thể mô tả bất kỳ dãy số thời gian nào Điều này có nghĩa là với một dãy số thời gian bất kỳ Yt, nếu ta có thể: • Tìm được giá trị phù hợp của p và q (xác định mô hình), và • Ước lượng được các tham số của mô hình ARMA model sử dụng các thong

tin trong quá khứ của Yt (ước lượng mô hình) Thì sau đó chúng ta có thể sử dụng mô hình ARMA vừa ước lượng để dự báo giá trị của Yt trong tương lai. Mục tiêu của chúng ta là dự báo Y trong k giai đoạn trong tương lai. Gọi T là kỳ hiện tại, và gọi $YT+1 là giá trị dự báo của kỳ kế tiếp, và $YT i+ là giá trị dự báo của kỳ T+i trong tương lai, i có thể nhận giá trị từ 1 tới k (i = 1, ...k).

Page 29: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 29

Giá trị dự báo của kỳ thứ 2, YT+2 , là

δ + εθ + Yφ + Yφ = Y T2T21+T12+T

Trong biểu thức này, ta sử dụng số dự báo của kỳ trước YT+1 làm biến giải thích

Page 30: Day 9 Forecasting Time Series With Arma and Arima Models

Economics 20 - Prof. Anderson 30

Dãy số thời gian không cân bằng: Mô hình ARIMA Nếu dãy số Y không cân bằng, thì ta sẽ xử lý như thế nào? Lời giải: Biến đổi số liệu để dãy số trở nên cân bằng. Phương pháp hay dung là lấy sai phân cho đến khi dãy số cân bằng (Thường thì chỉ cần sai phân 1-2 lần là dãy số cân bằng) Gọi dãy số đã sai phân này là biến Z. Sau đó ước lượng mô hình ARMA và dự báo với biến Z. Cuối cùng, tiến hành tích hợp (integrate – reverse the process) cbáo Z để thu được ước lượng của Y