ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik...

73
ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA BUMI MENGGUNAKAN POISSON HIDDEN MARKOV MODELS DAN ALGORITMA EM (Studi Kasus Banyaknya Gempa Bumi di Wilayah Sumatra Barat sampai Nusa Tenggara Timur) ROSYID SURYANDARU PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2015 M/1436 H

Transcript of ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik...

Page 1: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA BUMI

MENGGUNAKAN POISSON HIDDEN MARKOV MODELS DAN

ALGORITMA EM

(Studi Kasus Banyaknya Gempa Bumi di Wilayah Sumatra Barat

sampai Nusa Tenggara Timur)

ROSYID SURYANDARU

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2015 M/1436 H

Page 2: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

i

ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA

BUMI MENGGUNAKAN POISSON HIDDEN MARKOV

MODELS DAN ALGORITMA EM (Studi Kasus Banyaknya Gempa Bumi di Wilayah Sumatra Barat sampai Nusa

Tenggara Timur)

Skripsi

Sebagai Salah Satu Syarat Untuk Memperoleh

Gelar Sarjana Sains

Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh:

Rosyid Suryandaru

108094000024

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2015/1436 H

Page 3: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

ii

PENGESAHAN UJIAN

Skripsi berjudul “Estimasi Model Terbaik Banyaknya Gempa Menggunakan

Poisson Hidden Markov Models dan Algoritma EM” yang ditulis oleh Rosyid

Suryandaru, NIM 108094000024 telah diuji dan dinyatakan lulus dalam sidang

Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif

Hidayatullah Jakarta pada hari Kamis, 8 Januari 2015. Skripsi ini telah diterima

untuk memenuhi salah satu persyaratan dalam memperoleh gelar Sarjana strata satu

(S1) Program Matematika.

Menyetujui:

Penguji 1,

Dr. Nina Fitriyati, M.Kom

NIP. 19760414 200604 2 001

Penguji 2,

Irma Fauziah, M.Sc

NIP. 19800703 201101 2 005

Pembimbing 1,

Suma’inna, M.Si

NIP. 19791208 200701 2 015

Pembimbing 2,

Mahmudi, M.Si

Mengetahui,

Dekan Fakultas Sains dan Teknologi,

Dr. Agus Salim, M.Si

NIP. 19720816 199903 1 003

Ketua Program Studi Matematika,

Yanne Irene, M.Si

NIP. 19741231 200501 2 018

Page 4: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

iii

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-

BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN

SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI

ATAU LEMBAGA MANAPUN.

Jakarta, 8 Januari 2015

Rosyid Suryandaru

108094000024

Page 5: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

iv

PERSEMBAHAN

Alhamdulillahirobbil’alamin, segala puji bagi Allah, Tuhan Semesta Alam

Skripsi ini saya persembahkan untuk Ibuku tercinta Sri Kus Indrati, Kakak-

kakakku, Pilon dan seluru keluarga besarku, dan juga Keluarga besar Prodi

Matematika, serta semua pihak yang terlibat di dalamnya.

Semoga selalu diridhoi Allah SWT, selalu dalam lindungan-Nya, serta selalu

dibukakan pintu rahmat, kasih sayang, dan hidayah-Nya

Amin

MOTTO

A good student never will forget a good teacher :’)

Lebih baik salah karena melakukan sesuatu dari pada tidak pernah

salah karena tidak pernah melakukan sesuatu

Page 6: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

v

ABSTRAK

Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi

Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di bawah

bimbingan Suma’inna, M.Si dan Mahmudi, M.Si.

Penelitian dilakukan dengan dilatarbelakangi oleh wilayah Indonesia yang

merupakan salah satu wilayah yang rawan akan gempa bumi. Secara umum,

banyaknya peristiwa gempa bumi memiliki karakteristik distribusi Poisson. Akan

tetapi terjadi overdispersi relatif terhadap distribusi poisson. Salah satu cara dalam

mengatasi overdispersi khususnya pada distribusi poisson adalah dengan

menggunakan Poisson Hidden Markov Models (PHMMs), yang kemudian

mengaplikasikan algoritma EM (Expectation Maximisation Algorithm) pada

masing-masing model untuk memdapatkan parameter estimasinya. Dari model-

model yang diperoleh, selanjutnya dipilih model terbaik berdasarkan nilai AIC

(Akaike Information Criterion) terkecil. Data yang digunakan adalah data

sekunder, yaitu data banyaknya gempa bumi di wilayah Sumatra Barat sampai

Nusa Tenggara Timur tahun 2008-2013 dengan magnitudo ≥5 Skala Richter yang

terjadi pada kedalaman gempa bumi dangkal yaitu ≤60 Km.

Dari penelitia yang dilakukan didapat 3 model PHMM, yaitu model dengan

keadaan tersembunyi, yaitu 𝑚 = (2,3,4). Berdasarkan nilai AIC, model dengan 3

keadaan tersembunyi merupakan model estimasi banyaknya gempa bumi terbaik

dengan nilai AIC sebesar 537,429. Hasil estimasi parameter dari model terbaik

PHMM, yaitu model dengan 3 keadaan tersembunyi, nilai estimasi parameter rata-

rata banyaknya gempa bumi yang terjadi sebanyak 2,8446121 ≈ 3 peristiwa dalam

kurun waktu 15 hari.

Kata kunci: Overdispersi, Mixture Distribution, Rantai Markov, Peluang

forward backward, PHMMs, algoritma EM, AIC.

Page 7: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

vi

ABSTRACT

Rosyid Suryandaru, The Best Model Estimation for Many Earthquake Happen

with Using EM Algorithm in Poisson Hidden Markov Models. Under guidance Suma’inna, M.Si and Mahmudi, M.Si.

This research was conducted with Indonesian zone that one of zone have

often earthquake happen. In other hand, many earthquake happen have a

characteristic poisson of distribution. But often be relative overdisversion. One of

method to solve overdisversion on poisson distribution specifically is with using

Poisson Hidden Markov Models (PHMMs) that so applied EM algorithm

(Expectation Maxsimisation Algorithm) on every models to generated estimation

value. From every models resulted, next selecting the best model obtained from

the least AIC value (Akaike Information Criterion). In this thesis, using secondary

data, that is data of many earthquake happen in Sumatra Barat till Nusa Tenggara

Timur on 2008-2013 with magnitude ≥ 5 SR that happen in earthquake low

deepen is ≤ 60 km.

From this research exist 3 PHMM models, that is hidden model happen,

with m= (2,3,4). Obtained AIC value, 3 of hidden model happen is the best model

estimation of many earthquake happen with weight of AIC value is 537,429.

Estimation parameter result from the best model of PHMM is 3 of hidden happen

model, average of estimation parameter value in many earthquake happen is

2,8446121≈3 moment of 15 day.

Keywords: Overdisversion, Mixture Distribution, Markov Chain, Forward

Backward Probability, PHMMs, EM Algirithm, AIC.

Page 8: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

vii

KATA PENGANTAR

بسم هللا اار حمن اار حيم

Assalamu’alaikum Warahmatullahi Wabarakatuh

Alhamdulillah, Segala puji bagi Allah, Tuhan Semesta Alam, yang senantiasa

melimpahkan rahmat dan nikmat-Nya kepada kita semua, tak terkecuali pada penulis,

hingga penulis dapat menyelesaikan skripsi “Estimasi Model Terbaik Banyaknya

Gempa Bumi Menggunakan Poisson Hidden Markov Models dan Algoritma EM”

dengan studi kasus “Banyaknya Gempa Bumi di Wilayah Sumatra Barat sampai Nusa

Tenggara Timur”. Shalawat serta salam senantiasa tercurah kepada Nabi Muhammad

SAW, manusia luar biasa karena kecerdasannya, kemuliaan akhlaqnya, keluhuran

budi pekertinya, dan sunnah-sunnah Rasulullah yang tetap subur.

Dalam penyusunan skripsi ini, penulis banyak mendapat dorongan, semangat,

dan bimbingan serta kritikan dan sara dari berbagai pihak. Oleh karena itu, pada

kesempatan ini penulis ingin mengucapkan terima kasih kepada:

1. Orang tuaku (Bapak Surais, Ibu Sulasmi dan Ibu Sumariyati), Kakakku (Mas

Wahid) dan adikku (Zulfikar) tercinta serta seluruh keluarga besar penulis yang

selalu memberikan kasih sayang dan selalu mendoakan penulis sehingga dapat

menyelesaikan skripsi ini,

2. Dr. Agus Salim, M.Si, selaku Dekan Fakultas Sains dan Teknologi Universitas

Islam Negeri Syarif Hidayatullah Jakarta,

Page 9: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

viii

3. Ibu Yanne Irene, M.Si, selaku Ketua Program Studi Matematika Fakultas Sains

dan Teknologi UIN Syarif Hidayatullah Jakarta,

4. Ibu Suma’inna, M.Si, selaku Pembimbing I dan Mahmudi, M.Si, selaku

Pembimbing II. Mohon maaf atas semua kesalahan penulis selama ini, serta

terima kasih banyak atas waktu dan kesabarannya dalam membimbing penulis

dalam menyelesaikan penelitian ini,

5. Seluruh dosen dan karyawan Program Studi Matematika, yang telah mengajarkan

banyak hal yang sangat bermanfaat bagi penulis.

6. Saudara-saudaraku, Mas Karno, Wawan, Degleng, Bono, Mas Adi, dan teman-

teman KremboL,

7. Shilvia ♥, yang selalu sabar dan tidak pernah berhenti memberi semangat

penulis.

8. Sahabat-sahabat terbaikku selama mengenyam pendidikan di UIN Jakarta

khususnya Math’08, Putra, Deny, Munir, Tedy, Ucok Lah, Azmi, Rijak,

Nijaruddin, Sopyan Lampung, Ustad Luqman, dll,

9. Teman-teman Himatika UIN Jakarta.

10. Teman-teman Kosan Antalaklai (Mas Kiki dan Mbak Desi, Ka Ucal, bos Rengki,

Furqon, Kochar, Dolay, Ega, Angga, Mukmin, Cahyadi, Hanip, Mali, Yopy,

Azom, Zul, Onay, Awan) Bu Kosan Antalaklai, serta semua pihak yang telah

membantu penulis.

Page 10: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

ix

Penulis menyadari bahwa masih banyak kelemahan dan kekurangan yang

terdapat pada skripsi ini. Atas dasar itulah penulis memohon maaf yang sebesar-

besarnya kepada semua pihak jika terdapat kesalahan yang kurang berkenan. Namun,

saran dan kritik selalu penulis harapkan demi perbaikan pada penelitian selanjutnya.

Akhir kata, harapan yang besar bahwa skripsi ini dapat bemanfaat dan

memberikan kontribusi yang berarti, baik bagi penulis khususnya dan bagi pembaca

umumnya.

Wassalamu’alaikum Warahmatullahi Wabarakatuh

Jakarta, 8 Januari 2015

Penulis

Page 11: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

x

DAFTAR ISI

HALAMAN JUDUL ........................................................................................ i

PENGESAHAN UJIAN ................................................................................... ii

PERNYATAAN ................................................................................................ iii

PERSEMBAHAN DAN MOTTO ................................................................... iv

ABSTRAK ........................................................................................................ v

ABSTRACT ...................................................................................................... vi

KATA PENGANTAR ...................................................................................... vii

DAFTAR ISI ..................................................................................................... x

DAFTAR TABEL ............................................................................................ xii

DAFTAR GAMBAR ........................................................................................ xiii

DAFTAR LAMPIRAN .................................................................................... xiv

BAB I PENDAHULUAN

1.1 Latar Belakang .............................................................................. 1

1.2 Rumusan Masalah ......................................................................... 3

1.3 Batasan Masalah ........................................................................... 3

1.4 Tujuan Penelitian .......................................................................... 4

1.5 Manfaat Penelitian ........................................................................ 4

BAB II LANDASAN TEORI

2.1 Peluang dan Variabel Acak ........................................................... 5

2.2 Distribusi Poisson ......................................................................... 6

2.3 Independent Mixture Models ........................................................ 9

2.4 Rantai Markov ............................................................................... 11

2.5 PHMMs (Poisson Hidden Markov Models) .................................. 17

2.6 Penskalaan Komputasi Likelihood ................................................ 22

Page 12: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

xi

2.7 Estimasi Algoritma EM (Expectaton Maximisation Algorithm)

pada HMM .................................................................................... 23

2.8 Pemilihan Model Berdasarkan AIC ............................................... 27

BAB III METODE PENELITIAN

3.1 Sumber Data .................................................................................. 29

3.2 Tahap Persiapan Data ................................................................... 30

3.3 Tahap Pemodelan ........................................................................... 30

3.4 Pemilihan Model Terbaik .............................................................. 34

3.5 Alur Peneliitian .............................................................................. 35

BAB IV PEMBAHASAN

4.1 Deskripsi Data ............................................................................... 36

4.2 Pengecekan Overdispersi Data ..................................................... 38

4.3 Pemodelan Banyaknya Gempa Bumi dengan PHMMs ................ 39

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan ................................................................................... 47

5.2 Saran ............................................................................................. 47

DAFTAR PUSTAKA ........................................................................................ 48

LAMPIRAN ....................................................................................................... 50

Page 13: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

xii

DAFTAR TABEL

Tabel 2.1 Peluang Keadaan Cuaca ..................................................................... 15

Tabel 3.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa

Tenggara Timur Tahun 2008-2013 .................................................... 29

Tabel 4.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa

Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman ≤60

Km Tahun 2008-2013 ...................................................................... 36

Tabel 4.2 Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra Barat

sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5

Skala Richter pada Kedalaman ≤60 Km Periode 15 Hari Tahun

2008-2013 ......................................................................................... 38

Tabel 4.3 Statistik Deskriptif Banyaknya Gempa Bumi di Propinsi Sumatra

Barat sampai Propinsi Nusa Tenggara Timur Periode 15 Hari

Tahun 2008-2013 ............................................................................... 39

Tabel 4.4 Hasil Perhitunggan Parameter 𝛌 dan Parameter 𝛅 pada 2 Keadaan

Tersembunyi ...................................................................................... 41

Tabel 4.5 Peluang pada 2 Keadaan Tersembunyi .............................................. 42

Tabel 4.6 Parameter Input 𝛌, 𝛅, dan 𝚪 pada masing-masing PHMM .............. 43

Tabel 4.7 Parameter Estimasi Algoritma EM pada masing-masing PHMM ..... 45

Page 14: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

xiii

DAFTAR GAMBAR

Gambar 2.1 Matriks Peluang Transisi Satu Langkah berukuran 𝑚 ×𝑚 ......... 14

Gambar 2.2 Graf Dasar HMM ......................................................................... 18

Gambar 3.1 Alur Penelitian ............................................................................. 35

Gambar 4.1 Sebaran Data Gempa Bumi dengan Magnitudo ≥5 SK pada

Kedalaman ≤60 Km Tahun 2008-2013 ........................................ 37

Gambar 4.2 Peta Sebaran Gempa Bumi dengan Magnitudo ≥5 Skala Richter

pada Kedalaman ≤60 Km Tahun 2008-2013 ................................ 37

Gambar 4.3 Sebaran Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra

Barat sampai Propinsi Nusa Tenggara Timur dengan Magnitudo

≥5 Skala Richter pada Kedalaman ≤60 Km Periode 15 Hari

Tahun 2008-2013 .......................................................................... 39

Gambar 4.4a Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 2

Keadaan Tersembunyi .................................................................. 43

Gambar 4.4b Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 3

Keadaan Tersembunyi .................................................................. 44

Gambar 4.4c Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 4

Keadaan Tersembunyi .................................................................. 44

Page 15: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

xiv

DAFTAR LAMPIRAN

Lampiran 1. Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa

Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman ≤60 Km

Tahun 2008-2013 ................................................................................ 50

Lampiran 2. Peta Sebaran Gempa Bumi .................................................................. 51

Lampiran 3. Banyaknya Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi

Nusa Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman

≤60 Km Periode 15 Hari Tahun 2008-2013 ......................................... 52

Lampiran 4. Kode Komputasi Software R untuk Peluang Forward dan Peluang

Backward pada PHMM ........................................................................ 53

Lampiran 5. Kode Komputasi Software R untuk Estimasi EM pada PHMM .......... 54

Lampiran 6. Parameter Estimasi Algoritma EM untuk 𝑚 = 2 ................................. 55

Lampiran 7. Parameter Estimasi Algoritma EM untuk 𝑚 = 3 ................................. 56

Lampiran 8. Parameter Estimasi Algoritma EM untuk 𝑚 = 4 ................................. 57

Page 16: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Indonesia merupakan negara kepulauan yang secara astronomis terletak di

60LU-11

0LS dan antara 95

0BT-141

0 BT dan secara geografis teletak diantara dua

benua, yaitu Benua Asia dan Benua Australia, serta diantara dua samudera, yaitu

Samudera Hindia dan Samudera Pasifik. Dan secara geologis wilayah Indonesia

dilalui oleh dua jalur pegunungan muda dunia, yaitu Pegunungan Mediterania di

sebelah barat dan Pegunungan Sirkum Pasifik di sebelah timur, atau berada di

kawasan dengan sebutan "Pacific Ring of Fire", yaitu sebuah zona dimana banyak

memiliki gunung berapi yang aktif sehingga sering terjadi gempa bumi vulkanik.

Selain gempa bumi vulkanik, Indonesia juga rawan akan gempa bumi tektonik,

dikarenakan letak Indonesia berada pada pertemuan empat lempeng tektonik yaitu

lempeng Benua Asia, lempeng Benua Australia, lempeng Samudera Hindia, dan

lempeng Samudera Pasifik[10].

Sejumlah peristiwa bencana gempa bumi dengan magnitudo besar telah tejadi

10 tahun terakhir di sejumlah wilayah di Indonesia. Peristiwa gempa bumi tersebut

antara lain gempa bumi di Aceh pada tanggal 26 Desember 2004 yang

mengakibatkan terjadinya bencana tsunami, gempa bumi Nias pada tanggal 28 Maret

2005, gempa bumi di Yogyakarta pada tanggal 27 Mei 2006, di Pangandaran 17 Juli

Page 17: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

2

2006, Tasikmalaya 2 September 2009 dan gempa bumi Padang Pariaman pada

tanggal 30 September 2009. Tidak kurang dari 177.701 orang meninggal dunia akibat

peristiwa tersebut[11].

Secara umum, karakteristik peristiwa banyaknya gempa bumi dalam periode

tertentu didekati oleh distribusi Poisson, dengan sifat khas yang dimiliki yaitu rata-

rata dan variansinya memiliki nilai yang sama. Akan tetapi, terkadang dalam

pengaplikasian distribusi Poisson, khususnya pada kasus kegempaan, terjadi

overdispersi relatif dikarenakan sifat tersebut tidak sepenuhnya terpenuhi, sehingga

mengakibatkan ketidaktepatan distribusi sebagai model. Terjadinya overdispersi pada

distribusi tertentu diduga disebabkan adanya beberapa pengelompokan data pada

distribusi tersebut, dengan masing-masing kelompok memiliki parameter yang

berbeda-beda. Salah satu metode untuk mengatasi masalah pengamatan overdispersi

adalah dengan mengunakan Mixture Model (model campuran)[5].

Hidden Markov Models (HMMs) adalah perluasan dari rantai Markov dimana

distribusi hasil pengamatannya bergantung pada keadaan proses Markov yang tidak

teramati (unobserved). Distribusi marginal dari HMMs merupakan distribusi

campuran. Pada kasus kegempaan, HMMs lebih dikenal dengan istilah PHMMs

(Poisson Hidden Markov Models). Dalam PHMMs, setiap observasinya dihasilkan

oleh salah satu dari 𝑚 keadaan tersembunyi (hidden state)[5]. PHMMs diaplikasikan

untuk mengidentifikasi pola-pola barisan keadaan yang tidak teramati yang

mendasari barisan observasi.

Page 18: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

3

Pada penelitian ini, peneliti tertarik untuk membangun sebuah model

banyaknya gempa bumi menggunakan metode PHMMs serta mencari nilai estimator

parameternya dengan menggunakan Alogorima EM (Expectation Maximization

Algorithm). Wilayah penelitian yang diteliti adalah wilayah Propinsi Sumatra Barat

hingga Propinsi Nusa Tenggara Timur Indonesia.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah dikemukakan, rumusan masalah dalam

penulisan ini antara lain:

1. Bagaimana membangun model untuk mengestimasi banyaknya gempa bumi

menggunakan PHMMs?

2. Apakah model terbaik untuk mengestimasi banyaknya gempa bumi di wilayah

Propinsi Sumatra Barat hingga Propinsi Nusa Tenggara Timur menggunakan

metode PHMMs dengan Algoritma EM?

3. Bagaimana hasil estimasi parameter banyaknya gempa bumi dengan

menggunakan metode PHMMs?

1.3 Batasan Masalah

Ruang lingkup pembahasan dalam skripsi ini hanya membahas banyaknya

peristiwa gempa bumi yang terjadi di wilayah Propinsi Sumatra Barat hingga

Page 19: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

4

Propinsi Nusa Tenggara Timur dengan besar magnitudo gempa bumi ≥5 Skala

Richter pada kedalaman gempa dangkal yaitu ≤60 Km.

1.4 Tujuan Penulisan

Tujuan penelitian ini adalah:

1. Membangun model untuk mengestimasi banyaknya gempa bumi menggunakan

PHMMs,

2. Mencari model banyaknya gempa bumi terbaik untuk wilayah Propinsi Sumatra

Barat hingga Propinsi Nusa Tenggara Timur menggunakan metode PHMMs

dengan estimasi algoritma EM,

3. Mencari nilai estimasi parameter banyaknya gempa bumi dengan menggunakan

metode PHMMs.

1.5 Manfaat Penelitian

Manfaat penelitian ini diantaranya adalah:

1. Dapat diketahui nilai estimasi rata-rata banyaknya gempa bumi di wilayah

Propinsi Sumatra Barat hingga Propinsi Nusa Tenggara Timur.

2. Sebagai tambahan pengetahuan tentang PHMMs dan pengaplikasian Algoritma

EM untuk PHMMs.

3. Sebagai bahan referensi bagi peneliti lain yang ingin mengaplikasikan PHMMs

dan Algoritma EM untuk bidang yang lain.

Page 20: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

5

BAB II

LANDASAN TEORI

2.1 Peluang dan Variabel Acak

A. Teori Peluang

Misalkan 𝑆 adalah ruang sampel dari suatu eksperimen acak dan 𝑨 adalah

kumpulan semua titik sampel yang bisa dibentuk dari 𝑆. Peluang pada 𝑆 adalah

kumpulan semua fungsi 𝑃 dengan domain 𝐴 ke daerah hasil [0,1] yang memenuhi

sifat sebagai berikut[1]:

1. 0 ≤ 𝑃(𝐴) ≤ 1,∀𝐴 ∈ 𝑨,

2. 𝑃 ∅ = 0,

3. 𝑃 𝑆 = 1

Peluang terjadinya 𝐵 bila diketahui bahwa suatu kejadian lain 𝐴 telah terjadi

disebut dengan peluang bersyarat dan dilambangkan dengan 𝑃(𝐵|𝐴). Lambang

𝑃(𝐵|𝐴) dibaca “peluang terjadinya 𝐵 bila 𝐴 terjadi” atau lebih singkatnya lagi

“peluang 𝐵, bila 𝐴 diketahui”. Jika 𝐴 dan 𝐵 adalah 𝑆, maka peluang bersyarat 𝐵 bila

𝐴 diketahui didefinisikan sebagai[1]:

𝑃 𝐵 𝐴 = 𝑃(𝐴∩𝐵)

𝑃(𝐴) , dengan 𝑃 𝐴 > 0 (2.1)

Jika kejadian 𝐴 dan 𝐵 keduanya dapat terjadi sekaligus, maka[1]:

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 .𝑃 𝐵 𝐴 (2.2)

Page 21: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

6

Berdasarkan kaidah penggandaan umum, jika dalam suatu percobaan kejadian-

kejadian 𝐴1,𝐴2 ,𝐴3,… dapat terjadi, maka[1]:

𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3 ∩ …∩ 𝐴𝑘

= 𝑃 𝐴 𝑃 𝐴2 𝐴1 𝑃 𝐴3 𝐴1 ∩ 𝐴2 … 𝑃 𝐴𝑘 𝐴1 ∩ 𝐴2 ∩ …∩ 𝐴𝑘−1 (2.3)

B. Variabel Acak

Misal 𝐸 adalah sebuah percobaan dangan ruang sampel 𝑆. Peubah acak atau

variabel acak didefinisikan sebagai sebuah fungsi 𝑋 yang memetakan setiap anggota

𝑠 ∈ 𝑆 dengan sebuah bilangan real 𝑋(𝑠)[2].

Jika dalam ruang sampel mengandung titik sampel yang berhingga banyaknya

atau suatu deretan anggota yang banyaknya sama dengan banyaknya bilangan bulat

(terhitung), maka variabel acak yang didefinisikan pada ruang sampel tersebut adalah

variabel acak diskrit[2].

2.2 Distribusi Poisson

Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak 𝑋, dimana

banyaknya hasil percobaan terjadi selama selang waktu tertentu atau pada daerah

tertentu, disebut dengan percobaan Poisson[1]. Selang waktu yang dimaksud

misalkan: semenit, sehari, seminggu, sebulan, setahun, dan sebagainya. Sedangkan

daerah tertentu yang dimaksud misalkan: suatu luasan, volume, bagian bahan dan

sebagainya. Dalam contoh kasus misalkan:

a. Banyaknya dering telepon per jam di kantor,

Page 22: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

7

b. banyaknya kecelakaan mobil per hari di jalan tol,

c. banyaknya nasabah yang mengantri di bank dalam waktu satu jam,

d. banyaknya tikus sawah per hektar,

e. banyaknya bakteri dalam satu tetes air,

f. banyaknya kesalahan ketik per halaman dan sebagainya.

Karakteristik percobaan Poisson adalah sebagai berikut[1]:

1. Banyaknya hasil percobaan yang terjadi dalam selang waktu atau daerah

tertentu, tidak bergantung pada banyaknya hasil percobaan yang terjadi pada

selang waktu atau daerah lain yang terpisah.

2. Peluang terjadinya suatu hasil percobaan selama selang waktu yang singkat

sekali atau dalam suatu daerah yang kecil, sebanding dengan panjang selang

waktu tersebut atau besarnya daerah tersebut, dan tidak bergantung pada

banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah

tersebut.

3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang

waktu yang singkat atau daerah yang kecil dapat diabaikan.

Bilangan 𝑋 yang menyatakan banyaknya hasil percobaan dalam suatu percobaan

Poisson disebut peubah acak Poisson, dan sebaran peluangnya disebut dengan

distribusi Poisson[1]. Distribusi Poisson pertama kali ditemukan oleh S.D. Poisson

(1781–1840), seorang ahli matematika berkebangsaan Perancis. Distribusi Poisson

Page 23: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

8

disebut juga distribusi peristiwa yang jarang terjadi, dimana melibatkan jumlah

percobaan (𝑛) yang besar dengan peluang sukses (𝑝) sangat kecil[3].

Variabel acak 𝑋 dikatakan berdistribusi Poisson dengan parameter 𝜆 > 0,

dinotasikan 𝑋 ~ Poisson(𝜆), jika 𝑋 mempunyai fungsi massa peluang (PMF)[4]:

𝑝 𝑥 = 𝑒−𝜆𝜆𝑥

𝑥 !, 𝑥 = 0, 1, 2,…

0 , 𝑥 lainnya.

(2.4)

Persamaan (2.4) memenuhi syarat-syarat PMF dikarenakan[4]:

(i) 𝑝 𝑥 ≥ 0 karena 𝜆 > 0

(ii) Total peluangnya adalah 1 dikarenakan:

𝑝 𝑥

𝑥

= 𝑒−𝜆𝜆𝑥

𝑥!

𝑥=0

= 𝑒−𝜆 𝜆𝑥

𝑥!

𝑥=0

= 𝑒−𝜆𝑒𝜆 = 1

Variable acak berdistribusi Poisson umumnya digunakan untuk menyatakan

banyaknya peristiwa yang terjadi dalam satu satuan waktu, misalnya banyaknya

kecelakaan mobil per hari di jalan tol selama bulan Oktober, banyaknya mobil yang

lewat selama 10 menit di suatu ruas jalan, banyaknya antrian nasabah bank dalam

waktu satu jam, dan sebagainya. Distribusi Poisson mempunyai Fungsi Pembangkit

Momen (MGF)[4]:

𝑀 𝑡 = 𝐸 𝑒𝑡𝑥 = 𝑒𝑡𝑥𝑝 𝑥

𝑥=0

= 𝑒𝑡𝑥𝜆𝑥𝑒−𝜆

𝑥!

𝑥=0

= 𝑒−𝜆 (𝜆𝑒𝑡)𝑥

𝑥!

𝑥=0

= 𝑒−𝜆𝑒𝜆𝑒𝑡

= 𝑒𝜆(𝑒 𝑡−1) (2.5)

Page 24: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

9

untuk setiap 𝑡 ∈ ℝ. Karena

𝑀′ 𝑡 = 𝑒𝜆(𝑒 𝑡−1) 𝜆𝑒𝑡

dan

𝑀′′ 𝑡 = 𝑒𝜆(𝑒 𝑡−1) 𝜆𝑒𝑡 + 𝑒𝜆(𝑒 𝑡−1) 𝜆𝑒𝑡 2

maka

𝜇 = 𝑀′ 0 = 𝜆 (2.6)

dan

𝜎2 = 𝑀′′ 0 − 𝜇 = 𝜆 + 𝜆2 − 𝜆2 = 𝜆 (2.7)

Hasil tersebut memperlihatkan bahwa pada distribusi Poisson mempunyai ciri khas

bahwa mean (𝜇) dan variansinya (𝜎2) memiliki nilai yang sama dengan parameternya

(𝜆).

2.3 Independent Mixture Models

Pada distribusi Poisson dengan fungsi massa peluang 𝑝 𝑥 = 𝑒−𝜆𝜆𝑥/𝑥!

memiliki sifat khas bahwa nilai variansi sama dengan nilai mean (persamaan 2.6 dan

2.7). Akan tetapi ketika nilai variansi sampel (𝑠2) lebih besar dari rata-rata sampelnya

(𝑥 ) maka akan mengakibatkan overdispersi relatif pada distribusi Poisson dan

ketidaktepatan distribusi sebagai model. Salah satu metode dalam mengatasi

pengamatan overdispersi yaitu dengan mengunakan Mixture Model (model

campuran)[5].

Page 25: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

10

Mixture Models dirancang untuk mengakomodasi heterogenitas yang tidak

teramati (unobserved) pada populasi, dimana populasi dimungkinkan terdiri dari

kelompok-kelompok yang tidak teramati[5]. Sebagai contoh misalkan 𝑋 adalah

distribusi banyaknya bungkus rokok yang dibeli oleh pelanggan di supermarket. Para

pelanggan tersebut dapat dibagi menjadi beberapa kelompok, misalkan dibagi

menjadi dua kelompok yaitu perokok pasif dan perokok aktif. Jika banyaknya

bungkus rokok yang dibeli oleh masing-masing kelompok pelanggan berdistribusi

Poisson, maka distribusi 𝑋 belum tentu berdistribusi Poisson dan memungkinkan

terjadinya overdispersi relatif pada distribusi tersebut. Anggaplah masing-masing

kelompok berdistibusi Poisson memiliki rata-rata 𝜆1 dengan peluang 𝛿1 dan 𝜆2

dengan peluang 𝛿2 = 1−𝛿1, dimana dalam menentukan nilai rata-rata tersebut

didasarkan pada beberapa mekanisme acak lain yang disebut “proses parameter”. Jika

proses parameter dimana serangkaian variabel acaknya saling bebas (independent)

dan banyaknya juga saling bebas maka proses tersebut disebut “mixture independen”

(independent mixture)[5].

Secara umum, distribusi campuran yang saling bebas (independent mixture

distribution) terdiri dari sejumlah bilangan/komponen yang berhingga (𝑚 komponen)

dan distribusi pencampuran yang dipilih dari komponen tersebut. Misalkan 𝛿1,… , 𝛿𝑚

adalah peluang pada masing-masing 𝑚 komponen dan misalkan 𝑝 1 ,… ,𝑝 𝑚

adalah peluang fungsi densitas masing-masing komponen tersebut. Misalkan 𝑋

Page 26: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

11

menyatakan variabel acak yang memiliki disribusi campuran. Peluang fungsi densitas

𝑋 didefinisikan sebagai[5]:

𝑝 𝑥 = 𝛿𝑖𝑝𝑖 𝑥

𝑚

𝑖=1

(2.8)

Sehingga, untuk kasus diskrit, peluang fungsi densitas 𝑋 adalah[5]:

Pr 𝑋 = 𝑥 = Pr 𝑋 = 𝑥 𝐶 = 𝑖 Pr 𝐶 = 𝑖

𝑚

𝑖=1

(2.9)

Misalkan 𝑌𝑖 adalah komponen variabel acak dengan peluang fungsi densitas 𝑝 𝑥 .

Nilai harapan distribusi campuran X didefinisikan sebagai[5]:

E 𝑋 = Pr 𝐶 = 𝑖 E 𝑋 𝐶 = 𝑖

𝑚

𝑖=1

= 𝛿𝑖E 𝑌𝑖

𝑚

𝑖=1

(2.10)

Secara umum, nilai harapan untuk distribusi campuran X dengan 𝑘 moment

adalah[5]:

E 𝑋𝑘 = 𝛿𝑖E 𝑌𝑖𝑘

𝑚

𝑖=1

,𝑘 ∈ ℕ (2.11)

dimana nilai variansi campuran untuk kasus dua komponen adalah:

Var 𝑋 = 𝛿1Var 𝑌1 + 𝛿2Var 𝑌2 + 𝛿1𝛿2(E 𝑌1 − E 𝑌2 )2 (2.12)

2.4 Rantai Markov

A. Pengantar Stokastik

Proses stokastik didefinisikan sebagai proses menyusun dan mengindeks

sekumpulan variabel acak { 𝐶𝑡 , 𝑡 ≥ 0}, dengan indeks 𝑡 berada pada sekumpulan

Page 27: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

12

𝑇[6]. Sehingga 𝑇 dinamakan ruang parameter atau ruang indeks ∀ 𝑡 ∈ 𝑇, dengan 𝑡

merupakan parameter bilangan bulat tak negatif yang merepresentasikan karakteristik

terukur yang kita perhatikan pada waktu 𝑡.

Himpunan variabel acak 𝐶𝑡 pada proses stokastik menggambarkan keadaaan

(state) sistem pada waktu 𝑡. State merupakan posisi atau keadaan yang akan

ditentukan klasifikasinya. Misalkan {𝐶𝑡 , 𝑡 = 0,1,2,… ,𝑇} adalah barisan peubah acak

dengan ruang keadaan himpunan bilangan berhingga (finite). Jika 𝐶𝑡 = 𝑖, 𝑖 ∈ ℤ+,

maka kita katakan bahwa proses tersebut pada waktu 𝑡 berada pada keadaan 𝑖.

B. Definisi Proses Markov

Pada tahun 1906, A.A. Markov seorang ahli matematika dari Rusia yang

merupakan murid Chebysev mengemukakan teori ketergantungan variabel acak dari

proses acak yang dikenal dengan proses Markov[7]. Proses Markov adalah proses

stokastik yang mempunyai sifat bahwa jika nilai 𝐶𝑡 telah diketahui, maka 𝐶𝑠 di mana

𝑠 > 𝑡 tidak dipengaruhi oleh 𝐶𝑢 di mana 𝑢 < 𝑡. Dengan kata lain, Proses Markov

merupakan fenomena dimana kejadian masa datang hanya dipengaruhi oleh masa

sekarang dan tidak dipengaruhi oleh masa lalu.

C. Rantai Markov Diskrit

Analisis rantai Markov (Markov Chain Analysis) merupakan suatu teknik

peluang yang menganalisis pergerakan peluang dari suatu keadaan ke keadaan

Page 28: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

13

lainnya. Proses stokastik {𝐶𝑡 ∶ 𝑡 ∈ ℕ} dikatakan sebuah rantai Markov dengan waktu

diskrit jika untuk setiap 𝑡 ∈ ℕ berlaku[5]:

Pr 𝐶𝑡+1 𝐶𝑡 ,𝐶𝑡−1 ,… ,𝐶1) = Pr 𝐶𝑡+1 𝐶𝑡) (2.13)

Definisi tersebut dapat diinterpretasikan bahwa untuk suatu rantai Markov, sebaran

bersyarat dari sembarang keadaan yang akan datang {𝐶𝑡+1} dengan syarat keadaan

pada masa lalu adalah {𝐶𝑡−1 ,… ,𝐶1} dan keadaan sekarang adalah {𝐶𝑡}, adalah bebas

terhadap semua keadaan yang lalu dan hanya bergantung dari keadaan sekarang (kita

definisikan 𝐂(𝑡) sebagai kejadian {𝐶1 ,𝐶2 ,… ,𝐶𝑡}). Persamaan (2.13) dapat ditulis

sebagai berikut[5]:

Pr 𝐶𝑡+1 𝑪(𝑡)) = Pr 𝐶𝑡+1 𝐶𝑡) (2.14)

Kuantitas terpenting yang terkait dengan rantai Markov adalah peluang

bersyarat yang disebut dengan peluang transisi (transition probabilities) dimana pada

kasus rantai Markov homogen persamaannya adalah sebagai berikut:

𝛾𝑖𝑗 = Pr 𝐶𝑛+1 = 𝑗 𝐶𝑛 = 𝑖) (2.15)

untuk semua 𝑖, 𝑗,𝑛 = {1,2,… }. Nilai 𝛾𝑖𝑗 merupakan elemen dari 𝚪(1), yaitu elemen

dari matriks peluang transisi satu langkah (one-step transition probabilities matrix).

Kita definisikan 𝚪 1 = 𝚪. Nilai 𝛾𝑖𝑗 menyatakan peluang bahwa jika proses rantai

Markov berada pada keadaan 𝑖, maka keadaan berikutnya ke keadaan 𝑗 setelah satu

langkah dan memenuhi syarat-syarat berikut[6]:

a. 𝛾𝑖𝑗 ≥ 0, untuk semua 𝑖, 𝑗 = {1, 2, 3, ..., 𝑚}

b. 𝛾𝑖𝑗 = 1, untuk semua 𝑖 = {1, 2, 3, ..., 𝑚}

Page 29: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

14

dimana 𝑚 menyatakan banyaknya keadaan pada rantai Markov dengan jumlah

masing-masing baris pada matriks 𝚪 sama dengan 1.

1 2 ⋯ 𝑚

𝚪 1 = 𝚪 =

12⋮𝑚

𝛾11 𝛾12 ⋯ 𝛾1𝑚

𝛾21 𝛾22 ⋯ 𝛾2𝑚

⋮ ⋮ ⋱ ⋮𝛾𝑚1 𝛾𝑚2 ⋯ 𝛾𝑚𝑚

Gambar 2.1 Matriks Peluang Transisi Satu Langkah

berukuran m × m

Pada peluang transisi 𝑡 langkah, yaitu peluang bahwa suatau proses yang

mula-mula berada pada keadaan 𝑖 akan berpindah pada keadaan 𝑗 setelah 𝑡 langkah

didefinisikan sebagai[5]:

𝛾𝑖𝑗 (𝑡) = Pr 𝐶𝑠+𝑡 = 𝑗 𝐶𝑠 = 𝑖) (2.16)

untuk semua 𝑖, 𝑗, 𝑠, 𝑡 ∈ ℕ. Nilai 𝛾𝑖𝑗 (𝑡) merupakan elemen matriks 𝚪(𝑡) (t-step

transition probabilities matrices). Berdasarkan persamaan Chapman Kolmogorov

matriks peluang transisi 𝑡 langkah dapat ditentukan dengan mengalikan matriks 𝚪

sebanyak 𝑡 kali dengan persamaan sebagai berikut[5]:

𝚪 𝑡 + 𝑢 = 𝚪 𝑡 .𝚪 𝑢 , untuk semua 𝑡,𝑢 ∈ ℕ (2.17)

Persamaan Chapman Kolmogorov mengimplikasikan bahwa

𝚪 𝑡 = 𝚪 1 𝒕, untuk semua 𝑡 ∈ ℕ

Sejauh ini, semua peluang yang ditentukan merupakan peluang bersyarat.

Misalnya 𝚪(𝑡) adalah peluang bahwa pada waktu ke 𝑡 proses berada pada keadaan 𝑗

dengan syarat keadaan mula-mula adalah 𝑖. Pada sebaran tidak bersyarat rantai

Markov, nilai peluang sebaranya ditentukan oleh sebaran peluang pada keadaan awal

Page 30: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

15

(initial state). Peluang tidak bersyarat (unconditional probabilities) Pr(𝐶𝑡 = 𝑗) dari

rantai Markov berada pada keadaan tertentu pada waktu ke 𝑡 didefinisakan sebagai

vektor baris sebagai berikut[5]:

𝐮 𝑡 = ( Pr 𝐶𝑡 = 1 ,… , Pr 𝐶𝑡 = 𝑚 ), 𝑡 ∈ ℕ (2.18)

dimana 𝐮 1 merupakan peluang pada keadaaan awal (initial distribution) rantai

Markov. Sehingga, untuk mengetahui peluang keadaan pada waktu 𝑡 + 1 diperoleh

persamaan[5]:

𝐮 𝑡 + 1 = 𝐮 𝑡 𝚪 (2.19)

Sebagai contoh, misalkan peluang besok akan terjadi hujan bergantung pada

keadaan cuaca hari ini, serta tidak bergantung pada keadaan cuaca sebelumnya (sifat

rantai Markov). Misalkan diberikan peluang transisi satu langkah rantai Markov

dengan dua keadaan, dimana keadaan jika cuaca hujan = 1 dan jika cuaca cerah = 2

dengan peluang transisinya ditunjukkan pada tabel berikut:

Tabel 2.1 Peluang Keadaan Cuaca

Hari ke 𝑡+1

𝑡 Hujan Cerah

Hujan 0,9 0,1

Cerah 0,6 0,4

Tabel di atas menjelaskan bahwa peluang cuaca besok akan hujan sebesar 0,9 dengan

syarat jika cuaca hari ini hujan dan sebesar 0,1 jika cuaca hari ini adalah cerah.

Matriks peluang transisi 𝚪 untuk memodelkan kondisi di atas adalah:

1 2

𝚪 = 12

0,9 0,10,6 0,4

Page 31: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

16

Jika cuaca hari ini (𝑡 = 1) adalah cerah, maka peluang tidak bersyarat cuaca hari ini

adalah (lihat Persamaan (2.18)):

𝐮 1 = Pr 𝐶1 = 1 , Pr 𝐶1 = 2 = (0 , 1)

dan peluang cuaca untuk 𝑡 = {2, 3,… }, yaitu peluang cuaca pada hari-hari berikutnya

adalah (lihat Persamaan (2.19)):

𝐮 2 = Pr 𝐶2 = 1 , Pr 𝐶2 = 2 = 𝐮 1 .𝚪 = (0,6 , 0,4)

𝐮 3 = Pr 𝐶3 = 1 , Pr 𝐶3 = 2 = 𝐮 2 .𝚪 = (0,78 , 0,22), dan seterusnya.

Jadi, peluang tidak bersyarat jika cuaca hari ini cerah maka peluang bahwa cuaca 2

hari yang akan datang akan turun hujan sebesar 0,78 dan cuaca akan cerah sebesar

0,22.

Pada rantai Markov, setelah proses Markov berjalan dalam jangka yang

panjang (𝑡 → ∞), peluang yang dihasilkan akan bernilai tetap, dengan kata lain akan

menuju stasioner. Hal ini berarti, proses Markov memiliki peluang yang konvergen

ke suatu nilai yang sama, dimana proses tersebut tidak lagi bergantung pada keadaan

awal (𝒖 1 ). Rantai Markov dengan matriks peluang transisi 𝚪, dikatakan memiliki

distribusi yang stasioner 𝜹 (vektor baris dengan elemen tak negatif) jika[5]:

𝛅𝚪 = 𝛅 dan 𝛿𝑖

𝑚

𝑖=1

= 1 (2.20)

Dalam contoh kasus cuaca sebelumnya, perhitungan 𝛅 yang stasioner pada rantai

Markov dengan matriks peluang transisi keadaan cuaca 𝚪 diperoleh dengan

menggunakan Sistem Persamaan Linear (SPL) sebagai berikut:

Page 32: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

17

𝛿1 = 0,9𝛿1 + 0,6𝛿2 dan 𝛿1 + 𝛿2 = 1

sehingga diperoleh 𝛿1 = 6

7 dan 𝛿2 =

1

7 atau dapat ditulis 𝛅 =

1

7 (6 , 1). Artinya, dalam

jangka panjang, peluang cuaca cerah akan konvergen ke 1

7 dan peluang cuaca hujan

konvergen ke 6

7.

2.5 Poisson Hidden Markov Models (PHMMs)

Poisson Hidden Markov Models (PHMMs) merupakan perluasan dari HMMs

(Hidden Markov Models), dimana setiap observasinya dihasilkan oleh salah satu dari

𝑚 keadaan tersembunyi (hidden state) yang berdistribusi Poisson. Dalam memahami

PHMMs, berikut dijelaskan mengenai dasar teori Hidden Markov Model (HMM),

distribusi marginal dan moment HMM, serta likelihood HMM.

1. Hidden Markov Model (HMM)

Hidden Markov Model merupakan sebuah proses stokastik yang terdiri dari

dua bagian. Bagaian pertama adalah bagian yang tidak teramati (unobserved)

{𝐶𝑡 , 𝑡 ∈ ℕ} yang memenuhi sifat Markov, yang disebut juga sebagai “proses

parameter” (parameter process). Bagian kedua adalah bagian yang

teramati/terobservasi {𝑋𝑡 , 𝑡 ∈ ℕ}, yang disebut juga sebagai “proses keadaan

bergantung” (state-dependent process) dimana distribusi 𝑋𝑡 hanya bergantung pada

kondisi saat 𝐶𝑡 dan bukan bergantung pada keadaan terobservasi sebelumnya 𝑋𝑡−1.

Representasi HMMs ditunjukkan pada Gambar 2.7[5].

Page 33: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

18

Gambar 2.2 Graf Dasar HMM

Hidden Markov Model {𝑋𝑡 , 𝑡 ∈ ℕ} merupakan distribusi campuran yang

bergantung, dengan 𝐗(𝑡) dan 𝐂(𝑡) mewakili kejadian masa lalu dari waktu 1 hingga

waktu 𝑡, yang disimpulkan model sederhana tersebut dengan persamaan[5]:

Pr 𝐶𝑡 𝐂(𝑡−1)) = Pr 𝐶𝑡 𝐶𝑡−1), 𝑡 = 2, 3,… (2.21)

Pr 𝑋𝑡 𝐗(𝑡−1),𝐂(𝑡)) = Pr 𝑋𝑡 𝐶𝑡), 𝑡 ∈ ℕ (2.22)

Jika rantai Markov {𝐶𝑡} mempunyai 𝑚 keadaaan tersembunyi, kita katakan {𝑋𝑡}

adalah HMM dengan 𝑚 keadaaan.

Pada kasus pengamatan diskrit, jika rantai Markov pada waktu 𝑡 berada pada

keadaan 𝑖 maka fungsi masa peluang (pmf) 𝑋𝑡 didefinisikan sebagai[5]:

𝑝𝑖 𝑥 = Pr 𝑋𝑡 = 𝑥 𝐶𝑡 = 𝑖), 𝑖 = 1, 2,… ,𝑚 (2.23)

Distribusi 𝑝𝑖 dengan 𝑚 keadaan tersembunyi dapat dikatakan sebagai distribusi

keadaan bergantung (state-dependent distributions).

2. Distribusi Marginal dan Moment HMM

Didefinisikan 𝑢𝑖 𝑡 = Pr(𝐶𝑡= 𝑖) untuk 𝑡 = 1,… ,𝑇. Distribusi univariat

observasi 𝑋𝑡 untuk nilai diskrit sebagai berikut[5]:

Page 34: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

19

Pr 𝑋𝑡 = 𝑥 = Pr(𝐶𝑡 = 𝑖)

𝑚

𝑖=1

Pr 𝑋𝑡 = 𝑥 𝐶𝑡 = 𝑖)

= 𝑢𝑖 𝑡 𝑝𝑖 𝑥

𝑚

𝑖=1

(2.24)

Persamaan (2.21) dapat ditulis kedalam bentuk matriks sebagai berikut:

Pr 𝑋𝑡 = 𝑥 = 𝑢1 𝑡 ,… , 𝑢𝑚 𝑡 𝑝1 𝑥 0⋮ ⋱ ⋮0 𝑝𝑚 𝑥

1⋮1

= 𝐮 𝑡 𝐏 𝑥 𝟏′

dimana 𝐏 𝑥 didefinisikan sebagai matrik diagonal utama dengan elemen diagonal

utama ke 𝑖 adalah 𝑝𝑖 𝑥 . Berdasarkan Persamaan (2.19) bahwa 𝐮 𝑡 = 𝐮 1 𝚪𝑡−1

diperoleh:

Pr 𝑋𝑡 = 𝑥 = 𝑢 1 𝚪𝑡−1 𝐏 𝑥 𝟏′ (2.25)

Persamaan (2.25) berlaku jika rantai Markov adalah homogen dan tidak harus

stasioner. Jika kita asumsikan rantai Markov stasioner dengan distribusi stasioner 𝛅,

dimana 𝛅𝚪𝑡−1 = 𝜹 maka[5]:

Pr 𝑋𝑡 = 𝑥 = 𝛅𝐏 𝑥 𝟏′ (2.26)

Pada kasus distribusi bivariat, dimana terdapat empat variabel acak

𝑋𝑡 ,𝑋𝑡+𝑘 ,𝐶𝑡 ,𝐶𝑡+𝑘 dengan 𝑘 ∈ +ℤ, distribusi marginalnya adalah[5]:

Pr 𝑋𝑡 = 𝑣,𝑋𝑡+𝑘 = 𝑤

= Pr 𝑋𝑡 = 𝑣,𝑋𝑡+𝑘 = 𝑤,𝐶𝑡 = 𝑖,𝐶𝑡+𝑘 = 𝑗

𝑚

𝑗=1

𝑚

𝑖=1

Page 35: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

20

= Pr(𝐶𝑡 = 𝑖) 𝑝𝑖 𝑣 Pr(𝐶𝑡+𝑘 = 𝑗|𝐶𝑡 = 𝑖) 𝑝𝑗 (𝑤)

𝑚

𝑗=1

𝑚

𝑖=1

= 𝑢𝑖 𝑡 𝑝𝑖 𝑣 𝛾𝑖𝑗 (𝑘) 𝑝𝑗 (𝑤)

𝑚

𝑗=1

(2.27)

𝑚

𝑖=1

Persamaan (2.27) dapat ditulis kedalam bentuk matriks sebagai berikut:

Pr 𝑋𝑡 = 𝑣,𝑋𝑡+𝑘 = 𝑤 = 𝐮 𝑡 𝐏 𝑣 𝚪𝑘 𝐏 𝑤 𝟏′ (2.28)

Jika rantai Markov stasioner maka:

Pr 𝑋𝑡 = 𝑣,𝑋𝑡+𝑘 = 𝑤 = 𝛅𝐏 𝑣 𝚪𝑘 𝐏 𝑤 𝟏′ (2.29)

Pada kasus stasioner, nilai harapan keadaan bergantung (state-dependent)

E 𝑔(𝑋𝑡) dan E 𝑔(𝑋𝑡 ,𝑋𝑡+𝑘) untuk setiap fungsi 𝑔 adalah sebagai berikut:

E 𝑔(𝑋𝑡) = 𝛿𝑖E 𝑔(𝑋𝑡) 𝐶𝑡 = 𝑖

𝑚

𝑖=1

(2.30)

dan

E 𝑔(𝑋𝑡 ,𝑋𝑡+𝑘) = E 𝑔(𝑋𝑡 ,𝑋𝑡+𝑘 |𝐶𝑡 = 𝑖,𝐶𝑡+𝑘 = 𝑗) 𝛿𝑖 𝛾𝑖𝑗 (𝑘)

𝑚

𝑖 ,𝑗=1

= E 𝑔1 𝑋𝑡 𝐶𝑡 = 𝑖 E 𝑔2(𝑋𝑡+𝑘)|𝐶𝑡+𝑘 = 𝑗 𝛿𝑖 𝛾𝑖𝑗 𝑘 (2.31)

𝑚

𝑖 ,𝑗=1

dimana 𝑔 𝑋𝑡 ,𝑋𝑡+𝑘 = 𝑔1(𝑋𝑡)𝑔2(𝑋𝑡+𝑘) dan 𝛾𝑖𝑗 𝑘 = (𝚪𝑘 )𝑖𝑗 , untuk setiap 𝑘 ∈ ℕ.

Persamaan (2.30) dan Persamaan (2.31) berguna untuk mendapatkan nilai kovarian

dan korelasi pada HMMs. Sebagai contoh, misalkan jika terdapat dua keadaan HMM

dimana rantai Markov berdistribusi Poisson dan stasioner maka:

Page 36: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

21

E 𝑋𝑡 = 𝛿1𝜆1 + 𝛿2𝜆2;

Var 𝑋𝑡 = E 𝑋𝑡 + 𝛿1𝛿2 𝜆2 − 𝜆1 2 ≥ E 𝑋𝑡 ;

Cov 𝑋𝑡 ,𝑋𝑡+𝑘 = 𝛿1𝛿2 𝜆2 − 𝜆1 2(1− 𝛾12 − 𝛾21)𝑘 , untuk setiap 𝑘 ∈ ℕ.

3. Likelihood HMMs

Misalkan diketahui barisan observasi 𝑥1, 𝑥2,… , 𝑥𝑇 yang dihasilkan oleh

model. Peluang likelihood 𝐿𝑇 pada barisan obsevasi tersebut dimana diberikan 𝑚

keadaaan HMM yang memiliki distrbusi inisial/awal 𝛅 dan matriks peluang transisi 𝚪

pada rantai Markov, dan peluang keadaan bergantung (state-dependent probability)

𝑝𝑖 yang merupakan elemen dari matriks 𝐏 𝑥 sebagai berikut[5]:

𝐿𝑇 = Pr 𝐗 𝑻 = 𝐱 𝑻 = 𝛅𝐏 𝑥1 𝚪𝐏 𝑥2 𝚪𝐏 𝑥3 … 𝚪𝐏(𝑥𝑇)𝟏′ (2.32)

Jika 𝛅, yaitu distribusi 𝐶1 adalah distribusi stasioner pada rantai Markov, maka:

𝐿𝑇 = Pr 𝐗 𝑻 = 𝐱 𝑻 = 𝛅𝚪𝐏 𝑥1 𝚪𝐏 𝑥2 𝚪𝐏 𝑥3 … 𝚪𝐏(𝑥𝑇)𝟏′

Misalkan kita definisikan vektor 𝜶𝑡 , untuk 𝑡 = 1, 2,… ,𝑇 (lihat Persamaan (2.32))

dengan

𝜶𝑡 = 𝛅𝐏 𝑥1 𝚪𝐏 𝑥2 …𝚪𝐏 𝑥𝑡 = 𝛅𝐏 𝑥1 𝚪𝐏(𝑥𝑠)

𝑡

𝑠=2

Sehingga kita peroleh:

𝜶1 = 𝛅𝐏 𝑥1

𝜶𝑡 = 𝜶𝑡−1𝚪𝐏 𝑥𝑡 untuk 𝑡 = 2, 3, … ,𝑇

𝐿𝑇 = 𝜶𝑇𝟏′

Page 37: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

22

dengan 𝜶0 = 𝛅 untuk kasus rantai Markov stasioner. Elemen dari 𝜶𝑡 biasanya

dikenal dengan peluang forward dimana akan dijelaskan pada sub bab berikutnya[5].

2.6 Penskalaan Komputasi Likelihood (Scaling the Likelihood Computation)

Pada kasus distribusi state-dependent diskrit, hasil peluang elemen 𝜶𝑡 akan

semakin kecil nilainya saat 𝑡 meningkat, dan pada akhirnya dibulatkan menjadi 0,

atau biasa disebut underflow. Salah satu cara dalam mengatasi masalah underflow

digunakan penskalaan likelihood, yaitu menghitung nilai log dari likelihood, atau bisa

disebut dengan penskalaan vektor peluang forward 𝜶𝑡 . Didefinisikan sebuah vektor,

untuk 𝑡 = 0,1,… ,𝑇 adalah[5]:

𝜙𝑡 = 𝜶𝑡/𝑤𝑡

dimana 𝑤𝑡 = 𝛼𝑡(𝑖)𝒊 = 𝜶𝑡𝟏′.

Pertama kita perhatikan akibat langsung dari definisi 𝝓𝑡 dan 𝑤𝑡 :

𝑤0 = 𝜶0𝟏′ = 𝛅𝟏′ = 1;

𝜙𝑡 = 𝛅;

𝑤𝑡𝜙𝑡 = 𝑤𝑡−1𝜙𝑡−1𝐁𝑡 ; (2.33)

𝐿𝑇 = 𝜶𝑇𝟏′ = 𝑤𝑇 𝜙𝑇𝟏

′ = 𝑤𝑇

dimana kita definisikan 𝐁𝑡 adalah sebuah matriks dengan 𝐁𝑡 = 𝚪𝐏 𝑥𝑡 . Karena

𝐿𝑇 = 𝑤𝑇 = (𝑤𝑡/𝑤𝑡−1)𝑇𝑡=1 , berdasarkan Persamaan (2.33) diperoleh:

𝑤𝑡 = 𝑤𝑡−1(𝝓𝑡−1𝐁𝑡𝟏′)

dan sehingga

Page 38: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

23

log 𝐿𝑇 = log 𝑤𝑡𝑤𝑡−1

= log 𝝓𝑡−1𝐁𝑡𝟏′

𝑇

𝑡=1

𝑇

𝑡=1

2.34

2.7 Estimasi Algoritma EM (Expectation Maximisation Algorithm) pada HMM

Salah satu metode umum yang digunakan untuk mengestimasi parameter-

parameter pada HMMs adalah dengan menggunakan metode Algoritma EM

(Estimation Maximization Algorithm). Dalam konteks HMMs, algoritma EM dikenal

sebagai algoritma Baum-Welch, dimana rantai Markov pada HMM adalah homogen

dan tidak diharuskan stasioner. Parameter HMM yang diestimasi dengan Algoritma

EM adalah distribusi keadaan bergantung 𝑝𝑖 , matriks peluang transisi 𝚪, dan

distribusi inisial 𝛅. Dalam penerapannya, Algoritma EM membutuhkan perangakat

yaitu peluang forward dan peluang backward, dimana kedua peluang tersebut dapat

digunakan untuk prediksi state[5].

1. Peluang Forward

Peluang forward 𝜶𝑡 untuk 𝑡 = 1, 2, … , 𝑇 didefinisikan sebagai vektor baris[5]:

𝜶𝑡 = 𝛅𝐏 𝑥1 𝚪𝐏 𝑥2 …𝚪𝐏 𝑥𝑡 = 𝛅𝐏 𝑥1 𝚪𝐏(𝑥𝑠)

𝑡

𝑠=2

(2.35)

dengan 𝜹 adalah distribusi inisial rantai Markov. Berdasarkan definisi peluang

forward di atas, untuk 𝑡 = 1, 2, … , 𝑇 −1, dapat ditulis 𝜶𝑡+1 = 𝜶𝑡𝚪𝐏 𝑥𝑡+1 , atau

dalam bentuk skalar:

𝛼𝑡+1 𝑗 = 𝛼𝑡 𝑖

𝑁

𝑖=1

𝛾𝑖𝑗 𝑝𝑗 𝑥𝑡+1 ,

Page 39: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

24

Artinya, 𝛼𝑡 𝑗 dimana 𝑗 adalah komponen 𝜶𝒕 adalah peluang bersama Pr(𝑋1 =

𝑥1,𝑋2 = 𝑥2,… ,𝑋𝑡 = 𝑥𝑡 ,𝐶𝑡 = 𝑗)

Dalil Peluang Forward[5]:

Untuk 𝑡 = 1, 2,… ,𝑇 dan 𝑗 = 1, 2,… ,𝑚,

𝛼𝑡 𝑗 = Pr 𝐗 𝑡 = 𝐱 𝑡 ,𝐶𝑡 = 𝑗

2. Peluang Backward

Peluang backward 𝜷𝑡 untuk 𝑡 = 1, 2, … , 𝑇 didefinisikan sebagai vektor baris[5]:

𝜷′𝑡 = 𝚪𝐏 𝑥𝑡+1 𝚪𝐏 𝑥𝑡+2 …𝚪𝐏 𝑥𝑇 𝟏′ = 𝚪𝐏 𝑥𝑠

𝑡

𝑠=𝑡+1

𝟏′ (2.36)

dimana untuk 𝑡 = 𝑇, 𝜷𝑇 = 1. Berdasarkan definisi peluang backward di atas,

untuk 𝑡 = 1, 2, … , 𝑇 −1, dapat ditulis 𝜷′𝑡 = 𝚪𝐏 𝑥𝑡+1 𝜷′𝑡+1.

Dalil Peluang Backward[5]:

Untuk 𝑡 = 1, 2,… ,𝑇 − 1 dan 𝑖 = 1, 2,… ,𝑚,

𝛽𝑡 𝑖 = Pr 𝑋𝑡+1 = 𝑥𝑡+1,𝑋𝑡+2 = 𝑥𝑡+2,… ,𝑋𝑇 = 𝑥𝑇 ,𝐶𝑡 = 𝑖 ,

dengan ketentuan bahwa Pr 𝐶𝑡 = 𝑖 > 0. Dalam notasi lebih sederhana dapat

ditulis:

𝛽𝑡 𝑖 = Pr 𝐗𝑡+1𝑇 = 𝐱𝑡+1

𝑇 𝐶𝑡 = 𝑖 ,

dimana 𝐗𝑎𝑏 merupakan vektor (𝑋𝑎 ,𝑋𝑎+1,… ,𝑋𝑏 ).

Dalil di atas mengidentifikasi 𝛽𝑡(𝑖) sebagai peluang bersyarat, yaitu peluang

obeservasi 𝑥𝑡+1,… , 𝑥𝑇 dimana diberikan rantai Markov berada pada keadaan 𝑖

pada waktu 𝑡.

Page 40: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

25

3. Peluang Forward dan Peluang Backward

Gabungan antara peluang forward dan peluang backward 𝛼𝑡 dan 𝛽𝑡 dapat

diterapkan untuk menghitung peluang Pr 𝐗 𝑇 = 𝐱 𝑇 ,𝐶𝑡 = 𝑖 , dimana gabungan

peluang tersebut dibutuhkan dalam pengaplikasian algoritma EM pada HMMs.

Dalil Peluang Forward dan Peluang Backward[5]:

Untuk 𝑡 = 1, 2,… ,𝑇 dan 𝑖 = 1, 2,… ,𝑚,

𝛼𝑡 𝑖 𝛽𝑡 𝑖 = Pr 𝐗 𝑇 = 𝐱 𝑇 ,𝐶𝑡 = 𝑖 ,

dan akibatnya 𝜶𝒕𝜷′𝒕 = Pr 𝐗 𝑇 = 𝐱 𝑇 = 𝐿𝑇 , untuk setiap 𝑡.

Dan dalam pengaplikasian algoritma EM pada HMMs juga dibutuhkan dua sifat

berikut[5]:

Dalil Peluang Forward dan Peluang Backward[5]:

Petama, untuk 𝑡 = 1, 2,… ,𝑇,

Pr 𝐶𝑡 = 𝑗 𝐗 𝑇 = 𝐱 𝑇 = 𝛼𝑡 𝑗 𝛽𝑡 𝑗 / 𝐿𝑇; (2.37)

dan yang kedua, untuk 𝑡 = 2,… ,𝑇

Pr 𝐶𝑡−1 = 𝑗,𝐶𝑡 = 𝑘 𝐗 𝑇 = 𝐱 𝑇 = 𝛼𝑡−1 𝑗 𝛾𝑗𝑘 𝑝𝑘 𝑥𝑡 𝛽𝑡 𝑘 / 𝐿𝑇 (2.38)

Pada HMM, yaitu dimana barisan keadaan rantai Markov tidak teramati,

dimungkinkan terdapat data hilang (missing value) pada barisan tersebut, yang

berakibat data tidak lengkap (incomplete data). Algoritma EM merupakan sebuah

metode iteratif yang juga berfungsi untuk menghitung estimasi maksimum likelihood

(maximum likelihood estimation) untuk data tidak lengkap, sehingga diperoleh data

Page 41: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

26

lengkap log-likelihood[5]. Dalam setiap iterasi Algoritma EM terdapat 2 tahap, yaitu

tahap Ekspektasi atau tahap E (E-step) dan tahap Maksimisasi atau tahap M (M-step).

Pada kasus HMM, barisan keadaan 𝑐1 , 𝑐2 ,… , 𝑐𝑇 rantai Markov dengan

variabel acak nol-satu didefinisikan sebagai[5]:

𝑢𝑗 𝑡 = 1 jika dan hanya jika 𝑐𝑡 = 𝑗, (𝑡 = 1, 2,… , 𝑇)

dan

𝑣𝑗𝑘 𝑡 = 1 jika dan hanya jika 𝑐𝑡−1 = 𝑗 dan 𝑐𝑡 = 𝑘 (𝑡 = 2, 3,… , 𝑇).

Data lengkap log-likelihood (CDLL) HMM, yaitu dimana terdapat barisan observasi

𝑥1 , 𝑥2 ,… , 𝑥𝑇 serta data hilang 𝑐1 , 𝑐2 ,… , 𝑐𝑇 , adalah[5]:

log Pr(𝐗 𝑻 , 𝐜 𝑻 )

= 𝑢𝑗 1

𝑚

𝑗=1

log 𝛿𝑗 + 𝑣𝑗𝑘 𝑡

𝑇

𝑡=2

𝑚

𝑘=1

log 𝛾𝑗𝑘

𝑚

𝑗=1

+ 𝑢𝑗 𝑡

𝑇

𝑡=1

log 𝑝𝑗 𝑥𝑡

𝑚

𝑗=1

(2.39)

= Bentuk 1 + Bentuk 2 + Bentuk 3

dimana 𝜹 adalah distribusi inisial rantai Markov (distribusi 𝐶1) yang tidak diharuskan

stasioner. Proses atau 2 tahapan Algoritma EM pada HMM adalah sebagai berikut:

1. Tahap E (E-step)

Mengganti semua nilai 𝑣𝑗𝑘 dan 𝑢𝑗 𝑡 dengan ekpektasi bersyaratnya jika

diberikan observasi 𝐱 𝑇 [5]:

𝑢 𝑗 𝑡 = Pr 𝐶𝑡 = 𝑗| 𝐱 𝑇 = 𝛼𝑡 𝑗 𝛽𝑡 𝑗 /𝐿𝑇; (2.40)

dan

𝑣 𝑗𝑘 𝑡 = Pr 𝐶𝑡−1 = 𝑗,𝐶𝑡 = 𝑘| 𝐱 𝑇 = 𝛼𝑡−1 𝑗 𝛾𝑗𝑘 𝑝𝑘 𝑥𝑡 𝛽𝑡 𝑘 /𝐿𝑇. (2.41)

Page 42: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

27

Sebagai catatan bahwa dalam perhitungan pada E-step, diperlukan peluang

forward dan peluang backward pada HMM (Persamaan (2.37) dan Persamaan

(2.38), dimana untuk peluang forward tidak mengasumsikan rantai Markov{𝐶𝑡}

stasioner. Akan tetapi pada peluang backward tidak terpengaruh dengan

stasioneritas rantai Markov{𝐶𝑡}[5].

2. Tahap M (M-step)

Setelah mengganti nilai 𝑣𝑗𝑘 dan 𝑢𝑗 𝑡 dengan 𝑢 𝑗 𝑡 dan 𝑣 𝑗𝑘 𝑡 , langkah

berikutnya adalah memaksimalkan CDLL (Persamaan (2.39)), yang berkenaan

dengan tiga set parameter, yaitu distribusi inisial 𝜹, matriks peluang transisi 𝚪,

dan parameter distribusi state-dependen (dalam kasus Poisson-HMM adalah

𝜆1, 𝜆2,… , 𝜆3)[5].

Kedua langkah algoritma EM di atas diulang hingga mencapai kekonvergenan pada

masing-masing parameter.

2.8 Pemilihan Model berdasarkan AIC (Akaike Information Criterion)

Akaike Information Criterion (AIC) diperkenalkan pertama kali oleh Akaike

(1974) untuk mengidentifikasikan model dari suatu dataset. Metode ini merupakan

salah satu dari metode yang menerapkan pendekatan Maximum Likelihood[9].

Persamaan AIC dalam melakukan pemilihan model adalah sebagai berikut[5]:

𝐀𝐈𝐂 = −2 log 𝐿 + 2𝑝, (2.42)

dimana log 𝐿 adalah log-likelihood pada model dan 𝑝 adalah banyaknya parameter

bebas pada model. Misalakan, jika model diberikan 2 keadaan tersembunyi 𝑚 = 2,

Page 43: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

28

maka model tersebut memiliki parameter bebas sebanyak 𝑝 = 𝑚2 + 𝑚− 1 = 5. Hal

tersebut dikarenakan parameter 𝚪 memiliki parameter bebas sebanyak 𝑚2, parameter

𝛅 sebanyak 𝑚 − 1, dan parameter 𝛌 sebanyak 𝑚 parameter bebas.

Page 44: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

29

BAB III

METODOLOGI PENELITIAN

3.1 Sumber Data

Data yang digunakan dalam penelitian ini adalah data gempa bumi

Wilayah II dari mulai tanggal 4 Maret 2008 hingga 17 Desember 2013. Data yang

diambil berbentuk data sekunder yang diambil dari Balai Besar Meteorologi dan

Geofisika Wilayah II Ciputat dengan cakupan wilayah dari Propinsi Sumatra

Barat (Sumbar) hingga Propinsi Nusa Tenggara Timur (NTT). Dari data tersebut

menjelaskan waktu, sistem koordinat, kedalaman serta besarnya kekuatan pada

gempa bumi yang terjadi. Berikut adalah data gempa bumi wilayah dari Propinsi

Sumatra Barat hingga Propinsi Nusa Tenggara Timur:

Tabel 3.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa

Tenggara Timur Tahun 2008-2013

Tanggal/Bulan/Tahun Jam Menit Detik Lintang Bujur Kedalaman

(Km)

Magnitudo

(SR)

04/03/2008 09 45 41,0 -3,26 102,06 10,00 4,2

16/03/2008 23 05 28,0 -2,95 100,80 57,00 5,4

19/03/2008 11 18 21,0 -3,09 102,15 25,00 4,4

20/03/2008 08 26 53,9 -8,33 104,25 33,00 4,4

....

....

....

....

....

....

....

....

13/12/2013 05 29 41 -6,74 102,66 30,18 4,9

13/12/2013 15 22 12 -6,82 102,59 33,05 4,3

16/12/2013 09 03 11 -6,80 102,58 34,31 5,0

Page 45: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

30

3.2 Tahap Persiapan Data

Berdasarkan tujuan penelitian ini, yaitu mencari model estimasi

banyaknya gempa bumi terbaik menggunakan metode estimasi algoritma EM

(Estimation Maximization algorithm) pada PHMM (Poisson Hidden Markov

Models), maka data yang perlu dipersiapkan adalah data banyaknya gempa bumi.

Peneliti menyaring data pada Tabel 3.1 berdasarkan kriteria kekuatan gempa

bumi, yaitu gempa bumi dengan magnitudo ≥5 Skala Richter yang terjadi

kedalaman gempa bumi dangkal yaitu ≤60 Km dari permukaan terjadinya gempa

bumi tersebut[12]. Data hasil penyaringan, selanjutnya dihitung banyaknya gempa

bumi yang terjadi dalam kurun waktu atau periode tertentu dengan kriteria yang

sudah dijelaskan di atas.

Dari proses pengambilan data banyaknya gempa bumi di atas, data

memiliki karakteristik distribusi Poisson. Sehingga, langkah berikutnya adalah

melakukan pengecekan overdispersi data terhadap distribusi Poisson, yaitu

dengan membandingkan nilai rata-rata dan variansi dari data banyaknya gempa

bumi. Jika nilai variansi lebih besar dibandingkan dengan nilai rata-ratanya, maka

data terjadi overdispersi terhadap distribusi Poisson.

3.3 Tahap Pemodelan

A. Penentuan Parameter Input

Penentuan Parameter Input merupakan tahapan dalam mencari nilai

parameter awal untuk masing-masing model, yaitu mencari parameter rata-rata

banyaknya gempa bumi 𝜆𝑖 = 𝜆1,… , 𝜆𝑚 dimana untuk setiap 𝜆𝑖 memliki kriteria

Page 46: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

31

distribusi Poisson dengan peluang awal kejadiannya 𝛅 dan matriks peluang

transisi 𝚪. Sebagai contoh, misalkan diketahui barisan variabel acak banyaknya

peristiwa gempa bumi {𝑋𝑡 , 𝑡 = 1,… , 50 } hasil dari suatu observasi dengan

periode tertentu, dimana 𝑋𝑡 memiliki karakteristik distribusi Poisson sebagai

berikut:

𝑋𝑡 = {7,7,12,8,7,7,4,6,8,8,7,8,7,4,1,3,8,9,10,11,10,2,6,12,10,16,7,1,

5,6,4,11,12,7,15,10,10,2,5,5,10,13,16,11,5,6,7,14,11,14}

Karena s2 ≈ 14,01 > 𝑥 ≈ 8,1 maka terjadi overdispersi terhadap distribusi

Poisson. Sehingga, diduga terdapat pengelompokan data yang tidak teramati

(unobseved) pada variabel observasi, misalkan pada periode tertentu, rata-rata

banyaknya peristiwa gempa bumi terjadi dengan intensitas tinggi dan sedikit.

Misalkan diberikan 2 kelompok keadaan tersembunyi (𝑚 = 2) dengan kelompok

tersembunyi 1 panjang interval kelas banyaknya gempa bumi dari 1 sampai 6 dan

interval kelas sisanya masuk dikelompok tersembunyi 2. Berdasarkan pembagian

kelompok di atas diperoleh tiga parameter sebagai berikut:

1. 𝜆1 = (4+6+4+1+3+2+6+1+5+6+4+2+5+5+5+6)/16

= 4,0625

𝜆2 = (7+7+12+8+7+7+8+8+7+8+7+8+9+10+11+10+12+10+16+7+11+

12+7+15+10+10+10+13+16+11+7+14+11+14)/34

= 10

2. 𝛿1 = 16

50 = 0,32

𝛿2 = 34

50 = 0,68

Page 47: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

32

𝜆1 𝜆2 𝜆1 𝜆2

3. 𝚪 = 𝜆1

𝜆2

9/15 6/156/33 27/33

= 𝜆1

𝜆2

0,6 0,40,18 0,82

Dari hasil perhitungan di atas, dipeoleh nilai rata-rata kejadian gempa

bumi pada kelompok 1 sebesar 4,0625 dan pada kelompok 2 sebesar 10 kejadian,

atau dapat dinotasikan dalam bentuk vektor baris 𝛌 = (4,0625 , 10), dengan

peluang inisial/awal kejadiannya 𝛅 =(0,32 , 0,68) dan mariks peluang transisi

kelompok keadaan tersembunyi 𝚪. Berlaku juga untuk model dengan 𝑚 = {3,4,5}

dalam mendapatkan ketiga parameter tersebut. Ketiga perameter, yaitu 𝛌, 𝛅, dan 𝚪

pada masing-masing model kemudian dimasukkan kedalam software R versi

2.12.0 sebagai parameter input untuk mendapatkan model estimasi parameter

tersebut.

B. Estimasi Parameter PHMMs dengan Algoritma EM

Salah satu metode umum yang digunakan dalam mengestimasi HMMs

adalah dengan menggunakan metode Algoritma EM (Estimation Maximization

algorithm). Perangakat yang diperlukan sebelum menerapkan Algoritma EM

adalah menghitung nilai peluang forward dan peluang backward yang

ditunjukkan pada Persamaan (2.35) dan Persamaan (2.36). Masing-masing hasil

dari peluang forward dan peluang backward tersebut kemudian dilakukan

penskalaan likelihood (Scaling the Likelihood Computation) untuk mengatasi

Page 48: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

33

kasus underflow yang ditunjukkan pada Persamaan (2.34). Berikut adalah

algoritma dalam penerapan penskalaan likelihood pada Persamaan (2.34):

set 𝜙0 ← 𝛅 dan 𝑙 ← 0

untuk 𝑡 = 1, 2, ... , 𝑇

𝐯 ← 𝜙𝑡−1𝚪𝐏 𝑥𝑡

𝑢 ← 𝐯𝟏′

𝑙 ← 𝑙 + log 𝑢

𝜙𝑡 = 𝐯/𝑢

return l

Sebagai catatan bahwa 𝚪 dan 𝐏 𝑥𝑡 adalah matriks berukuran 𝑚 × 𝑚, 𝐯 dan 𝑢

adalah vektor dengan panjang 𝑚, dan 𝑙 adalah skalar log-likelihood yang

diakumulasikan.

Algoritma EM terdiri dari dua langkah yaitu Tahap E (E step) dan Tahap

M (M step). Tahap E merupakan langkah dalam menghitung ekspektasi bersyarat

dari data yang hilang (missing data) berdasarkan Persamaan (2.40) dan Persamaan

(2.41). Hasil dari E step kemudian mengganti data pengamatan yang hilang

sehingga diperoleh data lengkap log-likelihood (complete data log-likelihood).

Dari data lengkap log-likelihood kemudian dimaksimalkan pada Tahap M untuk

masing-masing bentuk (lihat Persamaan (2.39)). Berikut adalah solusi dalam

penerapan pada Tahap M:

Bentuk 1

Set → 𝛿𝑗 = 𝑢 𝑗 1 / 𝑢 𝑗 1 𝑚𝑗=1 = 𝑢 𝑗 1

Bentuk 2

Set → 𝛾𝑗𝑘 = 𝑓𝑗𝑘 / 𝑓𝑗𝑘𝑚𝑘=1 , dimana 𝑓𝑗𝑘 = 𝑣 𝑗𝑘 𝑡

𝑇𝑡=2 .

Page 49: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

34

Bentuk 3

untuk Poisson-HMM, 𝑝𝑗 𝑥 = 𝑒−λ 𝑗 . λ𝑗𝑥/𝑥!

Set → 0 = 𝑢 𝑗 𝑡

𝑡

(−1 + 𝑥𝑡/λ𝑗 );

sehingga:

Set → λ 𝑗 = 𝑢 𝑗 𝑡 𝑥𝑡

𝑇

𝑡=1

𝑢 𝑗 𝑡

𝑇

𝑡=1

.

3.4 Pemilihan Model Terbaik

Kriteria dalam pemilihan model estimasi terbaik pada penelitian ini adalah

berdasarkan nilai AIC (Akaike Information Criterion). Kriteria AIC didefinisikan

pada Persamaan (2.42), yaitu:

AIC = −2 𝑙𝑜𝑔 𝐿 + 2𝑝,

dimana 𝑙𝑜𝑔 𝐿 adalah nilai log-likelihood masing-masing model dan 𝑝 adalah

jumlah parameter pada model tersebut. Pada penelitian ini akan dicari 3 model

estimasi dengan menggunakan metode Algoritma EM, yaitu model dengan

keadaan tersembunyi 𝑚 = (2, 3, 4). Model estimasi terbaik berdasarkan kriteria

AIC adalah model yang memiliki nilai AIC terkecil.

Page 50: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

35

Data

3.5 Alur Penelitian

Gambar 3.1 Alur Penelitian

Mulai

Penyaringan Data

Menghitung

Banyaknya Gempa

Penentuan input

Parameter PHMMs

Pengecekan

Overdispersi

Selesai

Estimasi Parameter

Algoritma EM

Menghitung Peluang

Forward dan Backward

Tahap Persiapan

Data

Kesimpulan

(Model Terbaik)

Penskalaan

Likelihood

Tahap Pemodelan

Page 51: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

36

BAB IV

HASIL DAN PEMBAHASAN

4.1 Deskripsi Data

Data dalam penelitian ini adalah data gempa bumi di sepanjang Propinsi

Sumatra Barat (Sumbar) sampai Propinsi Nusa Tenggara Timur (NTT) dari

tanggal 4 Maret 2008 hingga tahun 17 Desember 2013 yang kemudian disaring

berdasarkan besarnya magnitudo yaitu ≥5 Skala Richter yang terjadi pada

kedalaman gempa bumi dangkal yaitu ≤60 Km dari permukaan terjadinya gempa

bumi tersebut[12]. Kriteria penyaringan data tersebut didasarkan pada besarnya

resiko dan bahaya yang ditimbulkan oleh gempa bumi tersebut, khususnya bagi

masyarakat di sepanjang wilayah yang diamati. Berikut adalah data gempa bumi

dari hasil penyaring berdasarkan magnitudo dan kedalaman yang telah ditentukan

di atas:

Tabel 4.1 Data Gempa Bumi di Propinsi Sumatra Barat

sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 SK

pada Kedalaman ≤60 Km Tahun 2008-2013

Tanggal/Bulan/Tahun Lintang Bujur Kedalaman

(Km)

Magnitudo

(SR)

16/3/2008 -2,95 100,80 57 5,4

31/3/2008 -3,00 100,89 20 5,2

02/4/2008 -4,26 102,64 31 6,1

03/4/2008 -4,19 102,22 20 5,0

...

...

...

...

...

28/11/2013 -0,26 98,562 51,39 5,1

10/12/2013 -57,27 101,99 11,62 5,3

16/12/2013 -6,799 102,57 34.31 5,0

Page 52: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

37

dan berikut adalah sebaran data gempa bumi beserta peta sebarannya berdasarkan

Tabel 4.1:

Gambar 4.1 Sebaran Data Gempa Bumi dengan Magnitudo ≥5 SK

pada Kedalaman ≤60 Km Tahun 2008-2013

Gambar 4.2 Peta Sebaran Gempa Bumi dengan Magnitudo ≥5 Skala Richter

pada Kedalaman ≤60 Km Tahun 2008-2013

Pada Gambar 4.1 terlihat bahwa terjadinya peristiwa gempa bumi dengan

magnitudo berskala richter besar, lebih sering diikuti dengan semakin rapatnya

Page 53: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

38

frekuensi gempa bumi yang terjadi dalam periode yang berdekatan. Serta pada

Gambar 4.2 terlihat bahwa, peristiwa gempa bumi pada wilayah yang diteliti

paling sering terjadi di wilayah barat Pulau Sumatra dan begitu pula di bagian

selatan Pulau Jawa. Hal ini disebabkan kedua wilayah tersebut dilewati oleh

lempengan tektonik Samudera Hindia yang mengakibatkan berpotensi besar

sering terjadinya gempa bumi.

4.2 Pengecekan Overdispersi Data

Pengecekan overdispersi dilakukan pada data banyaknya gempa bumi

dalam periode 15 hari. Cara yang dilakukan adalah menghitung banyaknya

kejadian gempa bumi pada Tabel 4.1. dalam periode 15 hari, kemudian

membandingakan nilai rata-rata dan variansi dari data tersebut. Jika nilai variansi

banyaknya gempa bumi dalam periode 15 hari lebih besar dari pada nilai rata-

ratanya maka terjadi overdispersi terhadap data tersebut. Diperoleh data

banyaknya gempa bumi dalam periode 15 hari sebanyak 141 data, yang disajikan

pada Tabel 4.2 dan untuk sebaran datanya ditunjukkan pada Gambar 4.2.

Tabel 4.2 Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra Barat sampai

Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 Skala Richter pada

Kedalaman ≤60 Km Periode 15 Hari Tahun 2008-2013

15 Hari

Ke-

Banyaknya

Gempa ≥5 SK

1 3

2 2

3 1

...

...

139 0

140 1

141 2

Page 54: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

39

Gambar 4.3 Sebaran Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra

Barat sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 Skala

Richter pada Kedalaman ≤60 Km Periode 15 Hari Tahun 2008-2013

Dari proses pengambilan data banyaknya gempa bumi pada Tabel 4.2,

karakteristik pengambilan datanya mengikuti pengambilan data yang berdistribusi

Poisson. Tahap selanjutnya adalah tahap pengecekan overdispersi data banyaknya

gempa bumi terhadap distribusi Poisson. Berikut adalah statistik deskriptif

berdasarkan data pada Tabel 4.2:

Tabel 4.3 Statistik Deskriptif Banyaknya Gempa Bumi di Propinsi Sumatra Barat

sampai Propinsi Nusa Tenggara Timur Periode 15 Hari Tahun 2008-2013

𝑁 𝑥 s2 Maksimum Minimum

141 2,035461 4,148733 14 0

Dari Tabel 4.3 terilihat bahwa nilai s2 ≈ 4,15 > 𝑥 ≈ 2,036. Sehingga, data

banyaknya gempa bumi pada Tabel 4.2 terjadi overdispersi terhadap distribusi

Poisson. Oleh karena itu, untuk analisis selanjutnya dapat digunakan PHMMs.

4.3 Pemodelan Banyaknya Gempa Bumi dengan PHMMs (Poisson Hidden

Markov Models)

Pada penelitian ini akan dicari model estimasi banyaknya gempa bumi

terbaik dari tiga model. Tiga model tersebut adalah model dengan keadaan

Page 55: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

40

tersembunyi, yaitu 𝑚 = (2,3,4). Penulis hanya memodelkan hingga keadaan

tersembunyi 𝑚 = 4 dikarenakan data tidak memadai untuk keadaan tersembunyi

𝑚 ≥ 5. Metode yang digunakan adalah metode PHMMs (Poisson Hidden Markov

Models) dengan estimasi Algoritma EM (Expectation Maximisation Algorithm).

Berikut ini adalah langkah-langkah yang dilakukan beserta hasil pengolahannya

untuk mendapatkan ketiga model estimasi banyaknya gempa bumi tersebut serta

penentuan model yang terbaik.

A. Penentuan Parameter Input

Pada tahap ini adalah menghitung nilai 𝛌 = 𝜆1,… , 𝜆𝑚 , yaitu parameter

rata-rata banyaknya gempa bumi per-15 hari, dengan peluang awal kejadiannya

𝛅 = (𝛿1, … , 𝛿𝑚) dan matriks peluang transisi keadaan tersembunyi 𝚪 berukuran

𝑚 × 𝑚. Langkah awal dalam mencari parameter-parameter tersebut adalah

membuat tabel distribusi frekuensi dari data banyaknya gempa bumi (Tabel 4.2),

dengan jumlah kelas pada tabel distribusi frekuensi tersebut ditentukan oleh

banyaknya keadaan tersembunyi yang diberikan. Pada peneliti ini, peneliti

mengambil nilai range 0 sampai 11 banyaknya gempa bumi untuk pembagian

interval masing-masing kelas secara seragam. Sebagai contoh model dengan

𝑚 =2, misalkan jika diberikan 2 keadaan tersembunyi dengan rata-rata banyaknya

gempa bumi 𝛌 = 𝜆1,𝜆2 , maka terdapat 2 kelas dengan panjang interval masing-

masing kelasnya:

𝑐 = range

banyaknya kelas =

12

2 = 6

Page 56: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

41

Berdasarkan nilai 𝑐 di atas, ruang sampel banyaknya gempa bumi yang ada pada

keadaan tersembunyi 1 adalah {0,1,2,3,4,5} dan sisanya masuk pada keadaan

tersembunyi 2. Langkah selanjutnya adalah memasukkan data pada Tabel 4.2 ke

masing-masing kelompok keadaan tersembunyi berdasarkan ruang sampelnya,

sehingga diperoleh nilai parameter 𝛌 = λ1, λ2 . Parameter 𝛅 = (𝛿1,𝛿2), yaitu

peluang awal pada keadaan tersembunyi 1 dan keadaan tersembunyi 2, diperoleh

dengan menghitung jumlah frekuensi pada masing-masing kelompok keadaan

tersembunyi dan kemudian frekuensi dari masing-masing kelompok tersebut

dibagi dengan frekuensi keseluruhan keadaan tersembunyi. Hasil perhitungan

parameter 𝛌 dan 𝛅 untuk kasus 2 keadaan tersembunyi disajikan pada Tabel 4.4

berikut:

Tabel 4.4 Hasil Perhitunggan Parameter 𝝀 dan Parameter 𝜹

pada 2 Keadaan Tersembunyi

15 HARI

KE-

BANYAKNYA

GEMPA ≥ 5 SK

KEADAAN

TERSEMBUNYI

BANYAKNYA GEMPA

KEADAAN

TERSEMBUNYI 1

BANYAKNYA GEMPA

KEADAAN

TERSEMBUNYI 2

1 3 1 3 -

2 2 1 2 -

3 1 1 1 -

4 4 1 4 -

5 2 1 2 -

6 6 2 - 6

....

..

....

..

......

....

..

....

..

139 0 1 0 -

140 1 1 1 -

141 2 1 2 -

𝑓 141 133 8

𝛌 1,699248 7,625

𝛅 133/141 = 0,943262 133/8 = 0,056738

Berdasarkan Tabel 4.4, diperoleh nilai 𝛌 = (1,699248 , 7,625) dan nilai

𝛅 = (0,943262 , 0,056738). Artinya, dalam periode waktu 15 hari, keadaan

Page 57: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

42

tersembunyi 1 memiliki nilai rata-rata banyaknya gempa sebesar 1,699248

kejadian dengan peluang awal kejadiannya sebesar 0,943262 dan 7,625 adalah

rata-rata kejadian pada keadaan tersembunyi 2 dengan peluang awal sebesar

0,056738.

Nilai parameter 𝚪, yaitu matriks peluang transisi keadaan tersembunyi,

dimana elemen-elemen pada matriks tersebut diperoleh dengan cara menghitung

frekuensi pada masing-masing kemungkinan perpindahan keadaan tersembunyi

yang kemudian dibagi dengan jumlah total masing-masing baris keadaan

tersembunyi. Pada kasus 2 keadaan tersembunyi, terdapat empat kemungkinan

perpindahan keadaan tersembunyi yang ditunjukkan pada Tabel 4.5 berikut:

Tabel 4.5 Peluang pada 2 Keadaan Tersembunyi

𝜆𝑖 1 2

1 125/132 7/132

2 7/8 1/8

sehingga diperoleh matriks peluang transisi pada 2 keadaan tersembunyi sebagai

berikut:

1 2

𝚪 = 1

2

0,94697 0,05303

0,875 0,125

Berdasarkan matriks peluang transisi di atas dapat diartikan, jika periode ini

berada pada keadaan tersembunyi 1, maka peluang 15 hari yang akan datang

berada pada keadaan tersembunyi 1 adalah 0,946970. Jika periode ini berada pada

Page 58: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

43

keadaan tersembunyi 1, maka peluang 15 hari yang akan datang berada pada

keadaan tersembunyi 2 adalah 0,05303 dan seterusnya.

Proses perhitungan parameter 𝛌, 𝛅, dan 𝚪, dimana diberikan keadaaan

tersembunyi 𝑚 = 3 dan 𝑚 = 4 dilakukan dengan cara yang sama. Berikut adalah

tabel lengkap hasil dari proses perhitungan parameter 𝛌, 𝛅, dan 𝚪 dengan

keadaaan tersembunyi 𝑚 = (2,3,4), serta Gambar 4.4 yang merupakan hasil dari

pengelompokan masing-masing keadaan tersembunyi:

Tabel 4.6 Parameter Input 𝝀, 𝜹, dan 𝜞 pada masing-masing PHMM

Model 𝑖 𝛌 𝛅 𝚪

1 2 3 4

𝑚 = 2 1 1,699248 0,943262 0,94697 0,05303 - -

2 7,625 0,056738 0,875 0,125 - -

𝑚 = 3

1 1,336207 0,822695 0,826087 0,156522 0,017391 -

2 4,73913 0,163121 0,826087 0,173913 0 -

3 11,5 0,014184 0,5 0,5 0 -

𝑚 = 4

1 0,924731 0,659575 0,68478 0,26087 0,03261 0,02174

2 3,5 0,283688 0,625 0,325 0,05 0

3 6,333333 0,042553 0,66667 0,33333 0 0

4 11,5 0,014184 0,5 0 0,5 0

Gambar 4.4a Hasil Pengelompokan Data Banyaknya Gempa Bumi

pada 2 Keadaan Tersembunyi

Page 59: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

44

Gambar 4.4b Hasil Pengelompokan Data Banyaknya Gempa Bumi

pada 3 Keadaan Tersembunyi

Gambar 4.4c Hasil Pengelompokan Data Banyaknya Gempa Bumi

pada 4 Keadaan Tersembunyi

B. Penaksiran Parameter-parameter PHMMs dengan Algorima EM

Pada bagian ini adalah menghitung nilai estimasi parameter 𝛌 , 𝛅 dan 𝚪

untuk masing-masing model dengan menggunakan algoritma EM (Expectation

Maximisation Algorithm). Setelah diperoleh hasil estimasi parameter, langkah

selanjutnya adalah membandingkan nilai AIC (Akaike Information Criterion)

dimana nilai AIC yang terkecil adalah model estimasi banyaknya gempa bumi

terbaik. Perhitungan estimasi algorima EM dikerjakan dengan menggunakan

software R versi 2.12.0 dengan nilai toleransi sebesar 1𝑒 − 06. Berikut adalah

hasil output estimasi parameter dengan Algoritma EM pada masing-masing

keadaan tersembunyi:

Page 60: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

45

Tabel 4.7 Parameter Estimasi Algoritma EM pada masing-masing PHMM

Model 𝑝 −𝑙 AIC 𝑖 𝛌 𝛅 𝚪

1 2 3 4

𝑚 = 2 5 268,7069 547,4138 1 1,611815 1 0,905652 0,094348 - -

2 5,597163 0 0,786729 0,213271 - -

𝑚 = 3 11 257,7146 537,4292

1 0,852232 0 0,831224 0,145735 0,023041 -

2 2,844612 1 0,152336 0,847664 0 -

3 12,31558 0 0 1 0 -

𝑚 = 4 19 255,53 549,060

1 0,861266 0 0,854086 0,1294405 0 0,016474

2 2,257127 1 0,060919 0,3065668 0,632514 0

3 3,802863 0 0,240358 0,7596419 0 0

4 13,75019 0 0 0 1 0

Berdasarkan Tabel 4.7, yaitu hasil estimasi dengan menggunakan

Algoritma EM pada PHMMs, terlihat bahwa nilai AIC terkecil berada pada saat

diberikan 3 keadaaan tersembunyi yaitu sebesar 537,429. Sehingga dapat

dikatakan bahwa model dengan 3 keadaaan tersembunyi merupakan model terbaik

dari pada model dengan 𝑚 = 2 dan 𝑚 = 3. Hal tersebut dikarenakan pada model

𝑚 = 3, memiliki selisih antara nilai 𝑙 dengan nilai 𝑝 yang lebih besar dari pada

model dengan 𝑚 = 2 dan 𝑚 = 4, yang mengakibatkan nilai AIC kecil. Berikut

adalah hasil estimasi parameter dari model terbaik PHMM, yaitu model dengan 3

keadaan tersembunyi:

𝛌 = 0,8522318, 2,844612, 12,3155828 ;

𝛅 = 0,1,0 ;

𝚪 = 0,8312241 0,1457353 0,023040620,152336 0,847664 0

0 1 0 ;

dengan nilai ekpektasi dan varansi PHMM:

Page 61: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

46

E 𝑋𝑡 = 𝛿𝑖𝜆𝑖

3

𝑖=1

= 𝛿1𝜆1 + 𝛿2𝜆2 + 𝛿3𝜆3

= (0×0,8522318) + (1×2,844612) + (0×12,3155828)

= 2,8446121

Var 𝑋𝑡 = E 𝑋𝑡 = 2,8446121

Sehingga dapat disimpulkan bahwa dari ketiga model estimasi banyaknya

gempa bumi di sepanjang Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara

Timur, model dengan 3 keadaan tersembunyi merupakan model estimasi

banyaknya gempa bumi terbaik dengan nilai estimasi parameter rata-rata

banyaknya gempa bumi yang terjadi sebanyak 2,8446121 ≈ 3 peristiwa dalam

kurun waktu 15 hari.

Page 62: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

47

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Kesimpulan yang dapat diambil berdasarkan hasil dan pembahasan

sebelumnya adalah sebagai berikut:

1. Model penentuan rata-rata banyaknya gempa bumi dapat menggunakan

metode PHMM (Poisson Hidden Markov Model) dengan estimasi Algoritma

EM (Expectation Maximisation Algorithm).

2. Model terbaik banyaknya gempa bumi pada penelitian ini adalah model

dengan 3 keadaaan tersembumyi dengan nilai estimasi parameter rata-rata

banyaknya gempa adalah 2,8446121 peristiwa dalam kurun waktu 15 hari.

5.2 Saran

Dalam penelitian ini, peneliti hanya melakukan analisis penentuan

mendapatkan model banyaknya gempa bumi terbaik berdasarkan kriteria

pengujian. Oleh sebab itu, penulis mempunyai saran untuk peneliti lain yang juga

tertarik dengan materi ini:

1. Pada penelitian selanjutnya, estimasi parameter banyaknya gempa bumi

terbaik dapat dilakukan dengan mempertimbangkan pembagian lokasi

pengamatan berdasarkan sebaran gempa bumi yang paling sering terjadi.

2. Penelitian ini dapat dilanjutkan kembali untuk memprediksi banyaknya gempa

bumi pada periode berikutnya.

Page 63: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

48

DAFTAR PUSTAKA

[1] Walpole, Ronald E. 1993, Pengantar Statistika, Edisi ketiga, Jakarta: Gramedia

Pustaka Utama

[2] Herrhyanto Nar, Gantini Tuti, 2009, Pengantar Statistika Matematis, Bandung:

Yrama Widya.

[3] J. Supranto, 2009, Statistik Teori dan Aplikasi, Edisi ketujuh Jilid 2, Jakarta:

Erlangga.

[4] Nurhayati, Nunung, Teori Peluang (PAM 2231)-Unsoed.

[5] Zucchini, Walter dan Iain L, MacDonald, 2009, Hidden Markov Models for Time

Series, London: CRC Press.

[6] Hillier, F. S., dan Lieberman, G. J. 2008, Introduction to Operation Research, 8th

Edition Jilid 2, Yogyakarta: Andi.

[7] R. Rabiner, Lawrence, A Tutorial on Hidden Markov Models and Selected

Applications in Speech Recognition, IEEE, Vol. 77, No. 2, Februari, 1989.

[8] Taylor Howard, Karlin Samuel, 1984, An Introduction to Stochastic Modeling,

London: Academic press.

[9] Agusta, Yudi, Mixture Modelling Menggunakan Prinsip Minimum Message

Length, Jurnal Sistem dan Informatika Vol. 1 (Agustus 2005), 1-16, Denpasar:

STIKOM Bali.

Page 64: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

49

[10] Zonasi Gempa bumi di Indonesia, http://www.academia.edu/4517794/Zonasi-

_Gempa_bumi_di_Indonesia, [1/8/2014 08.57 WIB].

[11] Daftar gempa bumi di Indonesia, http://id.wikipedia.org/wiki/Daftar_gempa-

_bumi_di_Indonesia, [5/8/2014 08.45 WIB].

[12] Gempa Bumi, http://id.wikipedia.org/wiki/Gempa_bumi, [4/7/2014 10.45 WIB].

Page 65: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

50

Data Gempa Bumi

di Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara Timur

dengan Magnitudo ≥5 Skala Richter

pada Kedalaman ≤60 Km Tahun 2008-2013

Date Magnitudo

(SR)

16-03-2008 5,40

31-03-2008 5,20

02-04-2008 6,10

03-04-2008 5,00

22-04-2008 5,30

27-04-2008 5,40

27-04-2008 5,50

01-05-2008 5,40

03-05-2008 5,70

03-05-2008 5,10

18-05-2008 6,00

20-05-2008 6,10

21-05-2008 5,30

21-05-2008 5,70

21-05-2008 5,40

23-05-2008 5,00

18-06-2008 5,00

20-06-2008 5,30

24-06-2008 5,50

07-07-2008 5,10

09-07-2008 5,60

11-07-2008 6,10

12-07-2008 5,00

20-07-2008 5,90

24-07-2008 5,00

08-08-2008 6,00

08-08-2008 5,70

08-08-2008 5,00

20-08-2008 5,20

22-08-2008 5,20

26-08-2008 6,60

29-08-2008 5,10

31-08-2008 5,00

08-09-2008 5,40

⋮ ⋮

22-11-2011 5,20

27-11-2011 5,40

29-11-2011 5,30

16-12-2011 5,20

19-12-2011 5,00

22-12-2011 5,10

22-12-2011 5,00

30-12-2011 5,30

05-01-2012 5,10

24-02-2012 5,00

28-03-2012 5,20

06-04-2012 5,50

06-04-2012 5,10

30-04-2012 5,00

27-05-2012 5,20

04-06-2012 5,90

19-06-2012 5,10

07-07-2012 5,00

03-09-2012 6,10

04-09-2012 5,00

04-09-2012 5,20

04-09-2012 5,20

11-09-2012 5,30

13-09-2012 5,10

13-09-2012 5,40

14-09-2012 6,20

15-09-2012 5,70

15-09-2012 5,30

18-09-2012 5,20

09-11-2012 5,30

10-11-2012 5,10

21-11-2012 5,40

22-11-2012 5,20

25-12-2012 5,10

30-12-2012 5,00

31-01-2013 5,00

02-02-2013 5,00

06-02-2013 5,30

13-02-2013 5,30

25-03-2013 5,20

05-04-2013 5,00

08-04-2013 5,60

16-04-2013 5,20

16-04-2013 5,00

06-05-2013 5,10

30-05-2013 5,30

03-06-2013 5,10

11-06-2013 5,10

13-06-2013 5,40

22-06-2013 5,10

06-07-2013 6,00

09-07-2013 5,60

09-07-2013 5,10

18-07-2013 5,00

24-07-2013 5,20

14-08-2013 5,00

22-08-2013 5,10

23-09-2013 5,20

11-10-2013 5,30

14-10-2013 5,00

28-11-2013 5,10

10-12-2013 5,30

16-12-2013 5,00

Page 66: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

51

Page 67: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

52

Banyaknya Peristiwa Gempa Bumi

di Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara Timur

dengan Magnitudo ≥5 Skala Richter pada Kedalaman ≤60 Km

Periode 15 Hari Tahun 2008-2013

15

HARI

KE-

BANYAKNYA

GEMPA

≥ 5SK

1 3

2 2

3 1

4 4

5 2

6 6

7 0

8 3

9 4

10 2

11 3

12 4

13 4

14 1

15 3

16 5

17 1

18 5

19 2

20 2

21 6

22 2

23 0

24 0

25 0

26 1

27 1

28 1

29 0

30 0

31 3

32 3

33 0

34 3

35 3

36 1

37 9

38 2

39 6

40 4

83 2

84 3

85 1

86 2

87 1

88 3

89 1

90 2

91 4

92 1

93 4

94 2

95 0

96 0

97 1

98 0

99 0

100 3

101 0

102 1

103 0

104 2

105 1

106 1

107 0

108 0

109 0

110 4

111 7

112 0

113 0

114 0

115 4

116 0

117 0

118 2

119 0

120 2

121 2

122 0

123 0

124 2

125 3

126 1

127 0

128 2

129 2

130 1

131 4

132 1

133 1

134 1

135 0

136 1

137 2

138 0

139 0

140 1

141 2

Page 68: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

53

Kode Komputasi Software R untuk Peluang Forward dan Backward pada PHMM.

pois.HMM.lalphabeta <- function(x,m,lambda,gamma,delta=NULL) { if(is.null(delta))delta <- solve(t(diag(m)-gamma+1),rep(1,m)) n <- length(x) lalpha <- lbeta<-matrix(NA,m,n) allprobs <- outer(x,lambda,dpois) foo <- delta*allprobs[1,] sumfoo <- sum(foo) lscale <- log(sumfoo) foo <- foo/sumfoo lalpha[,1] <- log(foo)+lscale for (i in 2:n)

{ foo <- foo%*%gamma*allprobs[i,] sumfoo <- sum(foo) lscale <- lscale+log(sumfoo) foo <- foo/sumfoo lalpha[,i] <- log(foo)+lscale }

lbeta[,n] <- rep(0,m) foo <- rep(1/m,m) lscale <- log(m) for (i in (n-1):1)

{ foo <- gamma%*%(allprobs[i+1,]*foo) lbeta[,i] <- log(foo)+lscale sumfoo <- sum(foo) foo <- foo/sumfoo lscale <- lscale+log(sumfoo) }

list(la=lalpha,lb=lbeta) }

Page 69: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

54

Kode Komputasi Software R untuk Estimasi EM pada PHMM. pois.HMM.EM <- function(x,m,lambda,gamma,delta,maxiter=1000,tol=1e-6,...) { n <- length(x) lambda.next <- lambda gamma.next <- gamma delta.next <- delta for (iter in 1:maxiter)

{ lallprobs <- outer(x,lambda,dpois,log=TRUE) fb <- pois.HMM.lalphabeta(x,m,lambda,gamma,delta=delta) la <- fb$la lb <- fb$lb c <- max(la[,n]) llk <- c+log(sum(exp(la[,n]-c))) for (j in 1:m) {

for (k in 1:m) { gamma.next[j,k] <- gamma[j,k]*sum(exp(la[j,1:(n-1)]

+lallprobs[2:n,k]+lb[k,2:n]-llk)) }

lambda.next[j] <- sum(exp(la[j,]+lb[j,]-llk)*x)/sum(exp(la[j,]+lb[j,]-llk)) } gamma.next <- gamma.next/apply(gamma.next,1,sum) delta.next <- exp(la[,1]+lb[,1]-llk) delta.next <- delta.next/sum(delta.next) crit <- sum(abs(lambda-lambda.next)) + sum(abs(gamma-gamma.next)) + sum(abs(delta-delta.next)) if(crit<tol)

{ np <- m*m+m-1 AIC <- -2*(llk-np) return(list(lambda=lambda,gamma=gamma,delta=delta,mllk=-llk,AIC=AIC)) }

lambda <- lambda.next gamma <- gamma.next delta <- delta.next }

}

Page 70: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

55

MODEL 2 STATE ALGORITMA EM

Iterasi 𝜸𝟏𝟐 𝜸𝟐𝟏 𝝀𝟏 𝝀𝟐 𝜹𝟏 −𝒍

1 0,05224961 0,8657903 1,731595 7,099168 0,98671385 269,25270

2 0,05429220 0,8548018 1,726842 6,928970 0,99603296 268,97910

30 0,08365144 0,8061127 1,640528 5,871929 1 268,71590

50 0,08919704 0,7965288 1,625604 5,725293 1 268,70880

100 0,09333757 0,7887221 1,614518 5,621742 1 268,70700

500 0,09434776 0,7867287 1,611815 5,597163 1 268,70690

750 0,09434777 0,7867287 1,611815 5,597163 1 268,70690

1000 0,09434777 0,7867287 1,611815 5,597163 1 268,70690

Konvergen 0,09434777 0,7867287 1,611815 5,597163 1 268,70690

Page 71: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

56

MODEL 3 STATE ALGORITMA EM

Iterasi 𝜸𝟏𝟐 𝜸𝟏𝟑 𝜸𝟐𝟏 𝜸𝟐𝟑 𝜸𝟑𝟏 𝜸𝟑𝟐

1 0,1599348 0,01206616 0,8145327 0 0,1982348 0,8017652

2 0,1618725 0,01100507 0,80069415 0 0,06828712 0,9317129

30 0,1519598 0,02309635 0,15926120 0 0 1

50 0,1460954 0,02304903 0,15249610 0 0 1

100 0,1457358 0,02304063 0,15233620 0 0 1

500 0,1457353 0,02304062 0,15233600 0 0 1

750 0,1457353 0,02304062 0,15233600 0 0 1

1000 0,1457353 0,02304062 0,15233600 0 0 1

Konvergen 0,1457353 0,02304062 0,152336 0 0 1

MODEL 3 STATE ALGORITMA EM

Iterasi 𝝀𝟏 𝝀𝟐 𝝀𝟑 𝜹𝟏 𝜹𝟐 −𝒍

1 1,4429880 4,2916670 12,165311 0,770955014 0,228785052 266,9192

2 1,4607280 4,1488420 12,7771740 0,68873699 0,31126097 265,0246

30 0,8523790 2,8533920 12,2878520 0 1 257,7232

50 0,8515037 2,8443633 12,3163394 0 1 257,7146

100 0,8522308 2,8446117 12,3155839 0 1 257,7146

500 0,8522318 2,8446121 12,3155828 0 1 257,7146

750 0,8522318 2,8446121 12,3155828 0 1 257,7146

1000 0,8522318 2,8446121 12,3155828 0 1 257,7146

Konvergen 0,8522318 2,8446121 12,3155828 0 1 257,7146

Page 72: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

57

MODEL 4 STATE ALGORITMA EM

Iterasi 𝜸𝟏𝟐 𝜸𝟏𝟑 𝜸𝟏𝟒 𝜸𝟐𝟏 𝜸𝟐𝟑 𝜸𝟐𝟒

1 0,2845207 0,02411115 0,01433387 0,56246940 0,04379472 0

2 0,2837699 0,02088013 0,01347044 0,52169900 0,04394784 0

30 0,1548558 0,00000119 0,01747817 0,11956610 0,09171166 0

50 0,1460763 0 0,01722440 0,11024430 0,11694570 0

100 0,1396978 0 0,01699953 0,10075460 0,17113420 0

500 0,1295602 0 0,01647856 0,06141822 0,63201140 0

750 0,1294455 0 0,01647393 0,06094021 0,63249300 0

1000 0,1294405 0 0,01647373 0,06091941 0,63251380 0

1500 0,1294403 0 0,01647372 0,06091846 0,63251480 0

2000 0,1294403 0 0,01647372 0,06091846 0,63251480 0

Konvergen 0,1294403 0 0,01647372 0,06091846 0,63251480 0

MODEL 4 STATE ALGORITMA EM

Iterasi 𝜸𝟑𝟏 𝜸𝟑𝟐 𝜸𝟑𝟒 𝜸𝟒𝟏 𝜸𝟒𝟐 𝜸𝟒𝟑

1 0,58797890 0,4120211 0 0,1747956 0 0,82520444

2 0,52423990 0,4757601 0 0,0480094 0 0,95199060

30 0,25324450 0,7467555 0 0 0 1

50 0,27441180 0,7255882 0 0 0 1

100 0,27265320 0,7273468 0 0 0 1

500 0,23972794 0,7602721 0 0 0 1

750 0,24033186 0,7596681 0 0 0 1

1000 0,24035812 0,7596419 0 0 0 1

1500 0,24035932 0,7596407 0 0 0 1

2000 0,24035932 0,7596407 0 0 0 1

Konvergen 0,24035932 0,7596407 0 0 0 1

Page 73: ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA …...v ABSTRAK Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di

58

MODEL 4 STATE ALGORITMA EM

Iterasi 𝝀𝟏 𝝀𝟐 𝝀𝟑 𝝀𝟒 𝜹𝟏 𝜹𝟐 𝜹𝟑 −𝒍

1 1,0668800 3,2461260 5,3857540 12,5653080 0,345648072 0,620369282 0,03375290 266,9108

2 1,0885540 3,1354070 5,1396950 13,2102780 0,1454705 0,82953450 0,02499426 262,5749

30 0,7959117 2,5150618 5,3842984 13,8249372 0 1 0,00000001 255,9739

50 0,8136253 2,4884172 5,1595332 13,8284619 0 1 0 255,9359

100 0,8293037 2,4385864 4,7956545 13,8341688 0 1 0 255,8944

500 0,8609924 2,2568877 3,8030547 13,7504940 0 1 0 255,5300

750 0,8612545 2,2571168 3,8028711 13,7501980 0 1 0 255,5300

1000 0,8612659 2,2571267 3,8028632 13,7501852 0 1 0 255,5300

1500 0,8612664 2,2571272 3,8028628 13,7501846 0 1 0 255,5300

2000 0,8612664 2,2571272 3,8028628 13,7501846 0 1 0 255,5300

Konvergen 0,8612664 2,2571272 3,8028628 13,7501846 0 1 0 255,5300