ANALISIS DATA BERKALA - Pusdiklat BPSpusdiklat.bps.go.id/diklat/bahan_diklat/BT_Analisis...
Transcript of ANALISIS DATA BERKALA - Pusdiklat BPSpusdiklat.bps.go.id/diklat/bahan_diklat/BT_Analisis...
ANALISIS DATA BERKALA
1
Diklat Fungsional Statistisi Tingkat AhliBadan Pusat StatistikAngkatan 21 Tahun 2020
Jimmy Ludin
APA ITU DATA DERET BERKALA ???
Data yang dikumpulkan dari waktu ke
waktu;
Digunakan untuk menggambarkan
perkembangan suatu kegiatan;
Data berkala yang khas merupakan
kombinasi dari 4 (empat) komponen;
2
Apa contoh data deret berkala?
• Luas panen padi
• Harga saham
• Curah hujan
• Tingkat kecelakaan di jalan tol
• Jumlah penumpang angkutan
3
Ada berapa KOMPONEN VARIASI DATA BERKALA?
Ada 4 (empat) Komponen:
Gerakan yang berjangka panjang (Long
term movement);
Gerakan/Variasi sikli (Cyclical variations);
Gerakan/Variasi Musim (Seasonal
Movement/variations);
Variasi random (random movement).
4
1. Gerakan Berjangka Panjang(Long term movement)
Suatu gerakan jangka panjang (10 tahun atau lebih) yang
menunjukkan arah perkembangan secara umum
(cenderung menuju ke satu arah, naik atau turun).
Tahun (X) Tahun (X)
Y Y
Trend Positif
Y = a + b.X
Trend Negatif
Y = a – b.X 5
Pelanggan
0
10
20
30
40
50
60
70
80
2000
2002
2004
2006
2008
Tahun
Pelanggan
Penjualan
0
20
40
60
80
100
120
140
160
2000
2002
2004
2006
2008
Tahun
Penjualan
Contoh lain dari trend (kecenderungan)
6
2. Gerakan / Variasi Sikli(Cyclical variations)
Suatu gerakan/variasi jangka panjang disekitar garis trend
yang bergerak agak beraturan dalam jangka waktu
tertentu (tiap 3 th, 5 th atau lebih).
Cth : Gerakan yang menunjukkan jangka waktu kemakmuran,
kemunduran dan pemulihan.
Siklus Indeks Saham Gabungan
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
94 95 96 97 98 99 00 01 02
Tahun
IHSG
7
3. Gerakan/Variasi Musim (Long term movement)
Suatu gerakan yang mempunyai pola secara teratur
secara musiman.
Cth : Kecenderungan belanja menjelang Hari Raya.
Produksi Padi Permusim
0
10
20
30
I-
98
II-
98
III-
98
I-
99
II-
99
III-
99
I-
00
II-
00
III-
00
I-
01
II-
01
III-
03
Triw ulan
Pro
duks
i (0
00 t
on)
Pergerakan Inflasi 2002
0
0,5
1
1,5
2
2,5
1 2 3 4 5 6 7 8 9 10 11 12
Bulan
Infla
si (
%)
Variasi Musim Produk Pertanian
Variasi Inflasi Bulanan
8
4. Variasi Random(Random Movement)
Suatu gerakan/variasi yang disebabkan oleh faktor
kebetulan, sehingga sangat sulit untuk diterka kurun waktu
kejadiannya.
Cth : Biasanya karena adanya bencana alam, perang dll.
9
DASAR PEMIKIRAN ANALISA DATA BERKALA
Rumusan secara pasti (matematis) hubungan antara
keempat komponen terhadap variasi data berkala
sampai saat ini belum ada.
Secara umum analisa data berkala selalu didasarkan
pada anggapan bahwa nilai data berkala merupakan
hasil kali dari keempat komponen variasinya.
Dengan asumsi tersebut hubungan secara matematis
dari keempat komponen tersebuat adalah :
Db = Ts .Vs .Vm .R
Dimana : Db = Data berkala Ts = Trend sekuler
Vs = Variasi sikli Vm = Variasi musim
R = Random
10
PENENTUAN GARIS TREND
11
METODE RATA-RATA BERGERAK(Rata-rata bergerak sederhana)
Metode rata-rata bergerak sering digunakan untuk mengrata-
ratakan data berkala yang bervariasi dengan cara mencari
nilai rata-rata data berkala beberapa tahun, sehingga
diperoleh nilai rata-rata yang bergerak secara teratur atas
dasar jumlah tahun tertentu.
Metode ini tidak memberikan ketentuan berapa tahun yang harus digunakan sebagai dasar pengrataan.
Makin banyak jumlah tahun yang digunakan akan semakin
mulus grafik yang diperoleh dan makin intensif kita
menghilangkan variasi musim, random dan sikli.
Jika kita gunakan 3 tahun sebagai dasar pencarian rata-rata,
maka teknik ini disebut rata-rata bergerak per 3 tahun, dst.
12
METODE RATA-RATA BERGERAK(Rata-rata bergerak tertimbang)
Pada prinsipnya prosedur yang digunakan adalah
sama dengan metode rata-rata bergerak
sederhana.
Dalam prosedur ini data berkala diberikan
penimbang sebelum dirata-ratakan.
Penimbang yang digunakan adalah binomial,
sesuai dengan jumlah tahun yang digunakan,
misalnya untuk rata-rata bergerak per 3 tahun maka
koefisien 1, 2, 1 sebagai penimbang.
13
Metode semi rata - rata
• Dengan cara mencari rata – rata kelompok data
• Langkah :– Kelompokan data menjadi dua kelompok
– Hitung rata – rata hitung dan letakkan di tengah kelompok ( K1 dan K2), menjadi nilai konstanta (a) dan letak tahun merupakan tahun dasar
– Hitung selisih K2 – K1• K2 – K1 > 0 = Tren positif
• K2 – K1 < 0 = Tren negatif
14
Lanjutan………….
• Langkah berikut – Tentukan nilai perubah tern (b) dengan cara :
b =
– Persamaan tren ; Y’ = a + b.X
Untuk mengetahui besarnya tren, masukan nilai (X) pada persamaan
– Untuk data ganjil, data (tahun) tengah dapat dihilangkan atau dihitung dua kali
K2 – K1
th dasar 2 – th dasar 1
15
Contoh
Tahun Penjualan Rata 2 Nilai X tahun dasar
2000 2005
2000 150 -2 -6
2001 140 -1 -5
2002 125 131.0 0 -4
2003 110 1 -3
2004 130
2004 130 2 -2
2005 150 3 -1
2006 156 152.8 4 0
2007 160 5 1
2008 168 6 2
Untuk Nilai (a)-2002 = 131.0-2006 = 152.8
Untuk Nilai (b)= (152.8 – 131.0)/(2006 – 2002)= 5.45
16
Lanjutan …….
• Maka persamaan tren
– Tahun dasar 2002
Y’ = 131+ 5.45 (X)
– Tahun dasar 2006
Y’ = 152.8 + 5.45 (X)
• Peramalan tahun 2009
– Y’ = 131+ 5.45 (7) = 169.15
– Y’ = 152.8 + 5.45 (3) = 169.15
17
Metode kuadrat terkecil
• Dengan menentukan garis tren yang mempunyai jumlah terkecil dari kuadrat selisihdata asli dengan data pada garis tren
• Persamaan ; Y’ = a + b. (X)
• Mencari nilai koefisien
a = (∑ Y ) / n
b = (∑XY) / (∑X)2
18
Contoh KasusTahun Penjualan Kode X Y.X X²
Y (tahun)
2000 150 -3.5 -525 12.25
2001 140 -2.5 -350 6.25
2002 125 -1.5 -187.5 2.25
2003 110 0.5 55 0.25
2004 150 0.5 75 0.25
2005 156 1.5 234 2.25
2006 160 2.5 400 6.25
2007 168 3.5 588 12.25
Total 1159 289.5 42
a 144.875
b 6.89285714
= 1159 / 8
=289.5 / 42
Persamaan trenY’ = a + b(X)Y’ = 144.875 +
6.8928 (X)
Peramalan tahun2008 :(X) = 4.5Maka :Y’ = 144.875 +
6.8928. (4.5)Y’ = 175.892
19
Memilih Tren yang baik
• Dalam memilih metode tren yang baik dapat digunakan ukuran ketepatan
• Ukuran ketepatan Adalah seberapa tepat sebuah alat peramalan tersebut menduga kejadian yang sebenarnya
• Alat ukur yaitu ∑(Y – Y’)2 paling kecil
20
Variasi Musiman
• Variasi musiman berhubungan dengan perubahan atau fluktuasi dalam musim-musim tertentu atau tahunan
• Fluktuasi dalam satuan
– Bulanan
– Triwulan
– Semester
• Jadi perubahan < 1 tahun
21
Metode Perhitungan Variasi Musim
• Metode rata – rata sederhana
• Metode rata – rata dengan tren
• Metode rata – rata bergerak
22
Metode rata – rata sederhana
• Asumsi bahwa pengaruh tren dan siklus yang tidak beraturan tidak besar dan dapat dianggap tidak ada
• Indeks musim
= [Rata-rata perkuartal x 100] / Rata-rata total
• Lihat contoh
23
Contoh kasus data tingkat produksi dalam 3 kuartal
Produksi Triwulan
Tahun Padi (ton) I II III
2001 63 25 20 18
2002 77 32 25 20
2003 75 23 32 20
2004 82 28 30 24
2005 89 31 33 25
2006 90 32 35 23
Total 476 171 175 130
Rata-rata 79.33 28.50 29.17 21.67
Rata-rata total 26.44
= 79.33 / 3 Rata-rata triwulan
24
Contoh kasus data tingkat produksi dalam 3 kuartal
• Menentukan indek musim
– I = ( 28.50 x 100 ) / 26.44 = 107.79
– II = ( 28.17 x 100 ) / 26.44 = 106.54
– II = ( 21.67 x 100 ) / 26.44 = 81.96
• Jika direncanakan panen padi tahun 2008 sebesar 120 ton, maka :
– Rata-rata total setiap triwulan
= 120 / 3 = 40 ton
– Maka untuk mencari target per-triwulan :
= ( Indek musim x rata-rata total ) / 100
25
Contoh kasus data tingkat produksi dalam 3 kuartal
• Menentukan target per triwulan
– I = ( 107.79 x 40 ) / 100 = 43.116 ton
– II = ( 106.54 x 40 ) / 100 = 42.616 ton
– II = ( 81.96 x 40 ) / 100 = 32.784 ton
Perkiraan produksi padi
Setiap triwulan
26
Metode rata – rata dengan tren
• Suatu metode rata – rata yang disesuaikan dengan tren
• Perbandingan antara nilai data asli dengan nilai tren
• Rumusan :
Indeks musim = x 100Nilai data asli
Nilai tren
27
Persamaan Metode Rata – rata dengan Tren
• Persamaan tren
Y = a + b.(X)
• Koefisien a
a = ∑Y / n
• Koefisien b
b = ∑XY / X²
28
Contoh kasus
Produksi
Tahun Y X XY X²
2001 63 -2.5 -157.5 6.25
2002 77 -1.5 -115.5 2.25
2003 75 -0.5 -37.5 0.25
2004 82 0.5 41 0.25
2005 89 1.5 133.5 2.25
2006 90 2.5 225 6.25
Total 476 89 17.5
a 79.333
b 5.086
a = 476/6
b = 89/17.529
Contoh kasus
• Persamaan tren
Y = 79.333 +
5.086 (X)
• Masukan nilai X ke persamaan, maka akan diperoleh nilai Y’
Produksi
TH Y X XY X² Y' Y - Y'
2001 63 -2.5 -157.5 6.25 66.618 -3.618
2002 77 -1.5 -115.5 2.25 71.704 5.296
2003 75 -0.5 -37.5 0.25 76.790 -1.790
2004 82 0.5 41 0.25 81.876 0.124
2005 89 1.5 133.5 2.25 86.962 2.038
2006 90 2.5 225 6.25 92.048 -2.048
Total 476 89 17.5 475.998
30
Contoh kasus
• Menghitung indeks musim
• Th 2002
= (77 / 71.70) x 100
= 107.39
Produksi Indek
Tahun Y Y' Musim
2001 63 66.62 94.57
2002 77 71.70 107.39
2003 75 76.79 97.67
2004 82 81.88 100.15
2005 89 86.96 102.34
2006 90 92.05 97.7831
Metode Rasio Rata – rata Bergerak
• Suatu metode yang dilakukan dengan cara membuat rata – rata bergerak
• Indeks musim rasio rata-rata bergerak :
Indeks musim = Nilai ratio x faktor koreksi
= Data asli / data rata-rata bergerak
= (100 x n ) / jumlah rata-rata selama n
32
Contoh Kasus
Tahun Triwulan Data asli Total bergerak Rata - Indeks -
3 triwulan rata Ratio
I 60
2005 II 65 195 65.00 100
III 70 210 70.00 100
I 75 223 74.33 101
2006 II 78 233 77.67 100
III 80 233 77.67 103
I 75 223 74.33 101
2007 II 68 213 71.00 96
III 70
Total 641 1530 510.00 701
60 + 65 + 70 = 195
65 + 70 + 75 = 210
(75 / 74.33) x 100
33
Contoh Kasus
Triwulan
Tahun I II III
2005 100 100
2006 101 100 103
2007 101 96
Rata-rata 67 99 68
Total rata-rata 234
Faktor koreksi 1,284
= (100 x 3 ) / 234
Indeks musim kuartalan :Triwulan I = 67 x 1,284 = 86,028Triwulan II= 99 x 1,284 = 127,116Triwulan III= 68 x 1,284 = 87,312
Angka indek triwulanini yang digunakansebagai peramalanselanjutnya
(67 + 99 + 68) / 3
34
Contoh Menentukan Rata – Rata bergerak
Triwulan Data asli Rata - rata bergerak per
3 4 5
I 60
II 65 65 68
III 70 70 72 70
I 75 74 76 74
II 78 78 77 76
III 80 78 75 75
I 75 74 73 74
II 68 71 53
III 70
(60+65+70) / 3
(60+65+70+75) / 4
(60+65+70+75+78) / 5
35
Analisa Variasi Siklus
• Variasi siklus – Suatu perubahan atau gelombang naik dan turun
dalam suatu periode dan berulang pada periode lain
• Dalam perekonomian mengalami gelombang siklus, yaitu :– Resesi– Pemulihan– Ledakan - boom– Krisis
Mempunyai
Periode disebut
Lama siklus
36
Indek Siklus
• Komponen data berkala
– Y = T x S x C x I
• Dimana Y, T dan S diketahui, maka CI diperoleh dengan cara :
– Y / S = T.C.I
– T.C.I adalah data normal, maka unsur tren (T) dikeluarkan
– C.I = TCI / T
37
Contoh Kasus
Tahun Triwulan Y T S TCI =Y/S CI=TCI/T C
I 60 47.56
2005 II 65 53.47 100.00 65.00 121.56
III 70 59.39 100.00 70.00 117.87 117.75
I 75 65.31 100.90 74.33 113.82 113.58
2006 II 78 71.22 100.43 77.67 109.05 107.85
III 80 77.14 103.00 77.67 100.68 99.74
I 75 83.06 100.90 74.33 89.50 89.99
2007 II 68 88.97 95.77 71.00 79.80
III 70 94.89
Total 641
T = Y’ (kuadrat terkecil
Indeks musim
C = Rata-rata bergerak dari CI
C : indeks
yang men
yatakan
adanya
pengaruh
siklus da
lam data
38
Analisa gerak Tak Beraturan
• Gerak tak beraturan – Irregular movement
– Suatu perubahan kenaikan dan penurunan yang tidak beraturan baik dari sisi waktu dan lama dari siklusnya
• Penyabab gerak tak beraturan
– Perang
– Krisis
– Bencana alam dll
39
Indeks Gerak Tak Beraturan
• Komponen data berkala sudah diketahui
– Y = T x S x C x I
– CI = Faktor siklus
– C = Siklus
• Maka I = CI / C
40
Contoh Kasus
Tahun Triwulan Y T S TCI =Y/S CI=TCI/T C I
I 60 47.56
2005 II 65 53.47 100.00 65.00 121.56
III 70 59.39 100.00 70.00 117.87 117.75 100.10
I 75 65.31 100.90 74.33 113.82 113.58 100.21
2006 II 78 71.22 100.43 77.67 109.05 107.85 101.11
III 80 77.14 103.00 77.67 100.68 99.74 100.94
I 75 83.06 100.90 74.33 89.50 89.99 99.45
2007 II 68 88.97 95.77 71.00 79.80
III 70 94.89
Total 641
Indek tak beraturan
I2005.3 = 117.87 /117.75
= 100.10
41
ARIMA
(Autoregressive Integrated Moving Average)
42
Batasan (Syarat) ARIMA
• Data wajib bersifat stokastik – data sekarang dipengaruhi oleh data periode
sebelumnya– Lihat Grafik Auto Correlation Function (ACF)
• Data harus bersifat Stationer– Jika tidak stasioner harus distasionerkan dulu dengan
differencing
• Memiliki deret minimal 50 observasi– bisa kurang bisa lebih tergantung pola data
• Beberapa Uji harus terpenuhi untukmendapatkan model yang baik
43
Tahapan Pemodelan ARIMA
1. Identifikasi Model
2. Estimasi Parameter
3. Validasi Model (Diagnostic Cheking)
4. Peramalan (Forecast)
44
Keluarga ARIMA
• Autoregressive (AR) : dipengaruhi oleh data padaperiode sebelumnya
• Moving Average (MA) : dipengaruhi oleh residual data periode sebelumnya
• Autoregressive Moving Average (ARMA) : dipengaruhi oleh data dan residual periodesebelumnya
• Autoregressive Integrated Moving Average (ARIMA) : dipengaruhi oleh data dan residual periode sebelumnya yang di differencing
• Musiman/Seasonal ARIMA (SARIMA)
45
Model AR(p)
• Contoh AR(1) :
1 1 2 2 ...t t t p t p tZ Z Z Z a
1 1t t tZ Z a
46
Model MA(q)
• Contoh MA(1) :
1 1t t tZ a a
2 2t t 1 t 1 t q t qZ a θ a θ a ... θ a
47
Model ARMA(p,q)
• Contoh ARMA(1,1) :
1 1t t t 1 t 1Z Z a θ a
1 1 2 2 2 2...t t t p t p t 1 t 1 t q t qZ Z Z Z a θ a θ a ... θ a
48
Model ARIMA(p,d,q)
• Contoh ARIMA (1,1,1)
• Dimana:
1t t tW Z Z
1 1t t t 1 t 1W W a θ a
49
Model SARIMA(P,D,Q)s
• Contoh Model SARIMA (1,1,1)12
• dimana:
1t t tW Z Z
1 12t t t 1 t 12W W a a
50
Langkah2 Pemodelan ARIMA
1. Melihat stasioneritas data
– Plot data, Plot ACF, atau ADF Test
2. Identifikasi beberapa kemungkinan model yang bisa dibentuk dengan melihat lag yang signifikanpada plot ACF dan plot PACF (lihat tabel)
3. Estimasi parameter Model ARIMA, ujisignifikansi parameter, dan nilai AIC
4. Periksa asumsi residual dengan uji kenormalan residual dan uji residual correlogram
51
Stasioneritas Data
• Plot ACF
• Tes ADF (Augmented Dickey Fuller)
– H0 : data deret waktu tidak stasioner
– H1 : data deret waktu stasioner
52
PACF dan ACF
• PACF : Fungsi autokorelasi parsial adalahkorelasi antara 2 data setelah pengaruh daridata yang lain dihilangkan
• ACF : hubungan antar pasangan data
53
Dying down fairly quickly versus extremely slowly
Dying down fairly quickly
Lag k8
1
-1
0
Lag k8
1
-1
0
Dying down extremely slowly
stationary time series (usually)
nonstationary time series (usually)
54
ACF for stationary time series
1
-1
0Lag k8
1
-1
0Lag k8
1
-1
0Lag k8
1
-1
0Lag k8
cuts off
dies down (exponential)
dies down (exponential)
dies down (sinusoidal)
no oscillation
oscillation
55
Identifikasi Model
• Metode Correlogram
• Salah satu metode yang biasa digunakanuntuk mengidentifikasi model ARIMA yaitumenggunakan plot partial autocorrelation function (PACF) dan plot autocorrelation function (ACF)
• mengidentifikasi ordo (p) autoregressive (AR) dan ordo (q) moving average (MA) dari model ARIMA
56
Bentuk PACF dan ACF u/ ARIMA
Model ACF PACF
AR(p) turun cepat secara
eksponensial / sinusoidal terputus setelah lag p
MA(q) terputus setelah lag q turun cepat secara
eksponensial / sinusoidal
ARMA(p,q) turun cepat setelah lag (q-p) turun cepat setelah lag (p-q)
Sumber:Wei, W.W.S., 1990. Time Series Univariate and Multivariate Methods, Addison Wesley Publishing Company Inc, Canada.
57
58
Estimasi parameter Model ARIMA
• Gunakan software gretl
59
Uji signifikansi parameter dan nilai AIC
60
Uji Kenormalan Residual
61
Uji Residual Correlogram
62