ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU ... · DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA...
Transcript of ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU ... · DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA...
ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI
RIAU BERDASARKAN TIPE PENUTUPAN LAHAN
ANESIA MEILA ROSA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Analisis Data Deret
Waktu Hotspot Provinsi Riau Berdasarkan Tipe Penutupan Lahan adalah benar
karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam
bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Januari 2014
Anesia Meila Rosa
NIM G64114002
ABSTRAK
ANESIA MEILA ROSA. Analisis Data Deret Waktu Hotspot Provinsi Riau
Berdasarkan Tipe Penutupan Lahan. Dibimbing oleh IMAS SUKAESIH
SITANGGANG.
Riau merupakan salah satu provinsi di Indonesia yang kerap kali menjadi salah
satu Provinsi dengan tingkat kebakaran tertinggi dan menimbulkan polemik ke
negara tetangga.Identifikasi pola terjadinya kebakaran berdasarkan waktu dapat
dilakukan dengan pengolahan data sebaran titik panas (hotspot) Provinsi
Riau.Pada penelitian ini, digunakan analisis dengan mendekomposisi data deret
waktu untuk mengidentifikasi pola data hotspot. Metode yang digunakan untuk
klasifikasi adalah conditional inference tree dan k nearest neighbor yang tersedia
dalam perangkat komputasi statistika R. Dekomposisi data deret waktu yang
dihasilkan mampu menunjukkan pola titik panas kurun waktu tahun 2001 hingga
tahun 2012. Klasifikasi data deret waktu memiliki akurasi tertinggi sebesar 33.3%
saat menggunakan tujuh kelas target tipe penutupan lahan dengan periode waktu
bulanan.
Kata kunci: conditional inference tree, data deret waktu, dekomposisi data, k
nearest neighbour, titik panas
ABSTRACT
ANESIA MEILA ROSA. Time Series Hotspot Data Analysis Based on Land
Cover Type. Supervised by IMAS SUKAESIH SITANGGANG.
Riau is a province in Indonesia which has high occurences of forest fires and also
causes polemics to its neighboring countries. Fire occurences identification can be
performed by processing hotspot distribution data. In this research, decomposition
of the time series data was used to identify hotspot occurence patterns.
Decomposition of time series data shows several patterns of hotspot over the year
2001 to 2012. In addition, classification methods namely conditional inference
tree and k-nearest neighbor were applied to create classifiers for hotspot data
based on land cover types. The highest accuracy of classifier is 33.3% for the
dataset with seven target classes of land cover types in monthly period.
Keywords: conditional inference tree, data decomposition, hotspot, k nearest
neighbour, time series data
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer
ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI
RIAU BERDASARKAN TIPE PENUTUPAN LAHAN
ANESIA MEILA ROSA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Penguji:
1 M Asyhar Agmalaro, SSi MKom
2 Toto Haryanto, SKom MSi
Judul Skripsi : Analisis Data Deret Waktu Hotspot Provinsi Riau Berdasarkan
Tipe Penutupan Lahan
Nama : Anesia Meila Rosa
NIM : G64114002
Disetujui oleh
Dr. Imas S Sitanggang, SSi MKom
Pembimbing
Diketahui oleh
Dr Ir. Agus Buono, MSi MKom
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu wa Ta'ala atas
segala karunia-Nya sehingga skripsi ini berhasil diselesaikan. Tema yang dipilih
dalam penelitian yang dilaksanakan sejak bulan Juni 2013 ini ialah data deret
waktu, dengan judul Analisis Data Deret Waktu Hotspot Provinsi Riau
Berdasarkan Tipe Penutupan Lahan.
Terima kasih penulis ucapkan kepada Ibu Imas S Sitanggang selaku
pembimbing. Ungkapan terima kasih juga disampaikan kepada suami, ayah, ibu,
mama, papa, serta seluruh keluarga besar, atas segala doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, Januari 2014
Anesia Meila Rosa
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 1
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
Data Penelitian 2
Alur Penelitian 3
Praproses data 3
Dekomposisi Data Deret Waktu 4
Klasifikasi data deret waktu dengan k-NN dan conditional inference tree 4
Analisis Model Klasifikasi 4
Lingkungan Pengembangan 4
HASIL DAN PEMBAHASAN 5
Pengumpulan Data 5
Praproses Data Deret Waktu 6
Dekomposisi data deret waktu 8
Pola Distribusi Hotspot Untuk Setiap Kelas Tipe Penutupan Lahan 10
Klasifikasi data deret waktu dengan metode conditional inference tree 10
Klasifikasi data deret waktu dengan k-NN 14
SIMPULAN DAN SARAN 15
Simpulan 15
Saran 15
DAFTAR PUSTAKA 16
LAMPIRAN 13
RIWAYAT HIDUP 15
DAFTAR TABEL
1 Data hotspot Provinsi Riau tahun 2008 (NASA, 2013) 2 2 Tipe lahan penutupan Provinsi Riau (data spasial Provinsi Riau 2008) 3 3 Kelas penutupan lahan yang dipakai pada penelitian 6 4 Hasil klasifikasi dengan data hotspot harian Provinsi Riau tahun 2001
hingga 2012 menggunakan metode conditional inference tree 12 5 Hasil klasifikasi dengan data hotspot bulanan Provinsi Riau tahun 2001
hingga 2012 menggunakan metode conditional inference tree 13 6 Akurasi pohon keputusan data hotspot 2001-2012 menggunakan
metode conditional inference tree 13
7 Akurasi klasifikasi data uji hotspot 2013 menggunakan metode
conditional inference tree 14 8 Akurasi klasifikasi data hotspot 2001-2012 menggunakan metode k-NN
dengan leave one out cross validation 14 9 Akurasi klasifikasi data hotspot data uji hotspot 2013 menggunakan
metode k-NN 14
DAFTAR GAMBAR
1 Diagram alur penelitian 3
2 Diagram alur praproses data deret waktu hotspot 3
3 Jumlah titik panas Provinsi Riau tahun 2001-2012 (Data hotspot spasial
Provinsi Riau, 2013) 5
4 Titik panas berdasarkan area penutupan lahan kurun waktu 2001 hingga
2012 (Data hotspot spasial Provinsi Riau, 2013) 6
5 Data hotspot sebelum dilakukan clipping dan query sederhana 7
6 Jumlah titik panas harian Provinsi Riau tahun 2001-2012 8
7 Trend data deret waktu hotspot Provinsi Riau tahun 2001-2012 9
8 Indeks musiman data deret waktu hotspot Provinsi Riau tahun 2001-
2012 9
9 Irregular component data deret waktu hotspot Provinsi Riau tahun
2001-2012 9
10 Data sampel hotspot kelas (plantation) tahun 2001 hingga 2005 10
11 Data sampel hotspot untuk masing-masing kelas penutupan lahan
plantation, dryland forest, agricultural fied, dan shrubs 10
12 Pohon keputusan yang dihasilkan oleh data hotspot harian tahun 2001
hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan
sebagai kelas target 11
13 Pohon keputusan yang dihasilkan oleh data hotspot bulanan tahun 2001
hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan
sebagai kelas target 12
PENDAHULUAN
Latar Belakang
Kebakaran hutan merupakan fenomena yang sering terjadi di Indonesia
khususnya Provinsi Riau. Dalam selang beberapa tahun kebakaran hutan di
wilayah ini menimbulkan polemik hingga negara tetangga. Keluhan dari beberapa
negara tetangga pun tak terelakkan. Menkokesra Agung Laksono yang dikutip
oleh Merdeka (2013) mengatakan, hal ini tidak hanya dialami oleh Indonesia saja,
negara-negara Eropa seperti Jerman dan Hungaria pun juga mengalaminya. Jika
peristiwa ini dapat dicegah atau diberikan penanggulangan yang baik dampak
yang sebelumnya marak terjadi akan berkurang.
Kebakaran merupakan permasalahan yang terus berulang dengan waktu dan
tempat tertentu. Tentunya informasi yang terkandung dalam data persebaran
hotspot dapat digunakan untuk tindakan preventif atau pertimbangan kebijakan
lainnya karena masalah tersebut. Untuk itu diperlukan analisis yang melibatkan
aspek waktu dan tempat terjadinya hotspot.
Anderson dan Bowen (2000) menyatakan bahwa terdapat tujuh zona
kebakaran besar yang terdapat di pulau Sumatera. Zona ini terletak di bagian
propinsi Sumatera Utara, Riau, Jambi, Sumatera Barat, Bengkulu dan Sumatera
Selatan. Kebakaran terus menerus terjadi pada tujuh zona ini selama kurun waktu
tahun 1996 hingga tahun 2000. Anderson dan Bowen juga menjelas bahwa hanya
ujung-ujung pulau Sumatera yaitu Aceh dan Provinsi Lampung yang bebas dari
zona kebakaran walaupun lahan basah Lampung (Way Kambas) dan Aceh
(Singkil dan Babah Rot) telah mengalami kerusakan akibat kebakaran.
Penelitian ini menggunakan data persebaran hotspot yang didapat dari
deteksi satelit Terra dan Aqua MODIS (Moderate-resolution Imaging
Spectroradiometer) milik NASA (National Aeronautics and Space
Administration), serta digunakan pula data penutupan lahan Provinsi Riau sebagai
penentu kelas target. Data tersebut merupakan data deret waktu yang memiliki
informasi spasial yang akan dicari pola dan aturan-aturan klasifikasinya dengan
teknik data mining. Sebagian besar masalah forecasting melibatkan penggunaan
data deret waktu. Data deret waktu merupakan variabel yang berorientasi waktu
atau urutan kejadian (Montgomery et al. 2008). Untuk memodelkan klasifikasi
data deret waktu ini digunakan metode klasifikasi data deret waktu yaitu
conditional inference tree dan k nearest neighbor (k-NN).
Tujuan Penelitian
Penelitian ini bertujuan:
1 Menganalisis data deret waktu untuk melihat kecenderungan pola hotspot
Riau selama 12 tahun (tahun 2001 sampai dengan tahun 2012).
2 Membuat klasifikasi data hotspot Provinsi Riau menggunakan metode
conditional inference tree dan k-NN berdasarkan tipe penutupan lahan.
2
Manfaat Penelitian
Penelitian ini diharapkan dapat menggambarkan karakteristik data deret
waktu hotspot berdasarkan tipe penutupan lahan yang dapat menjadi bahan
pertimbangan pencegahan dan penanggulangan kebakaran hutan di daerah Riau.
Ruang Lingkup Penelitian
1. Data yang digunakan adalah data hotspot Provinsi Riau (tahun 2001 sampai
dengan 2012), data penutupan lahan Provinsi Riau tahun 2008, dan data
hotspot Provinsi Riau tahun 2013 sebagai data uji untuk klasifikasi dengan
k-NN.
2. Metode yang digunakan untuk klasifikasi adalah conditional inference tree dan
k-NN yang tersedia di perangkat komputasi statistik R.
3. Analisis mencakup dekomposisi data deret waktu hotspot, pola hotspot
berdasarkan tipe penutupan lahan, dan klasifikasi data deret waktu hotspot
berdasarkan tipe penutupan lahan.
METODE
Data Penelitian
Data yang digunakan pada penelitian ini adalah data hotspot Provinsi Riau
tahun 2001 hingga tahun 2012 yang di peroleh dari NASA, dan data penutupan
lahan tahun 2008 (land cover) Provinsi Riau sebagai kelas target. Tabel 1
merupakan data hotspot bulanan Provinsi Riau tahun 2008. Kolom “total hotspot
per bulan” menggambarkan jumlah hotspot yang muncul di Provinsi Riau setiap
bulannya. Tabel 2 merupakan data luas lahan penutupan Provinsi Riau tahun 2008.
Data tipe lahan penutupan tahun 2008 ini akan digunakan sebagai kelas target.
Tabel 1 Data hotspot Provinsi Riau tahun 2008 (NASA 2013)
Bulan Total hotspot per
bulan
Januari 227
Februari 1318
Maret 58
April 71
Mei 731
Juni 329
Juli 411
Agustus 2001
September 217
Oktober 38
November 102
Desember 147
3
Tabel 2 Tipe lahan penutupan Provinsi Riau (data spasial Provinsi Riau 2008)
Tipe Land Cover Luas Area (km2)
Plantation 28,417.13
Dryland forest 17,497.66
Agricultural field 20,294.21
Shrubs 8176.02
Natural forest 8,110.41
Bare land 3029.42
Swamp & Mangrove 3,746.12
Alur Penelitian
Pembuatan model klasifikasi data hotspot serta analisis polanya dapat
diwujudkan dengan menggunakan perangkat lunak R. Pemodelan data tersebut
dibagi menjadi beberapa tahap seperti yang ditunjukkan pada Gambar 1.
Mulai
Data Hotspot
Time Series &
Penutupan Lahan
Praproses
Dekomposisi
data time series
Pembuatan model
klasifikasi dan prediksi
kelas time series hotspot
Analisis model
klasifikasiSelesai
Gambar 1 Diagram alur penelitian
Praproses data
Sebelum data hotspot diolah menggunakan R studio, data spasial terlebih
dahulu diolah menggunakan Quantum GIS 1.8.0 Lisboa untuk mendapatkan data
hotspot yang terdeteksi di Provinsi Riau dari tahun 2001 hingga tahun 2012.
Selanjutnya data tersebut di-import ke basis data menggunakan PostgreSQL 9.1
yang telah terintegrasi dengan PostGIS 2.0. Kemudian dilakukan query pada data
yang diperlukan hingga didapatkan data yang dibutuhkan untuk klasifikasi. Agar
data yang telah di-query sesuai dengan kode yang telah dibuat di R, digunakan
Microsoft Excel 2007 sebagai perangkat lunak pembantu. Diagram alur praproses
data dapat dilihat pada Gambar 2.
MulaiImport shape
file ke QGIS
Query sederhana
data spasial
Export shapefile
hasil query
Import shapefile
ke PostGreSQL
Query semua
data yang
diperlukan
Sesuaikan Format
data menjadi csv
menggunakan Excel
Selesai
Gambar 2 Diagram alur praproses data deret waktu hotspot
4
Dekomposisi Data Deret Waktu
Dekomposisi data deret waktu dalam penelitian ini meliputi penghitungan
empat faktor dalam data hotspot yaitu trend (T), siklis (C), irregular (I), dan
seasonal (S). Rasyad (2003) menjelaskan gerakan seasonal terjadi berulang-ulang
dengan gerakan yang teratur artinya naik turunnya gerakan terjadi pada waktu-
waktu tertentu yang sama atau berdekatan. Gerakan trend (T) yang berlangsung
jangka panjang yaitu suatu gerakan yang menunjukkan arah perkembangan secara
umum. Garis trend sangat berguna untuk membuat ramalan (forecasting).
Gerakan siklis adalah variasi jangka panjang di sekitar garis trend. Gerakan ini
dapat terulang untuk jangka waktu tertentu, tetapi dapat juga tidak berulang.
Gerakan atau variasi yang tidak teratur (irregular) yaitu gerakan atau variasi yang
sifatnya sporadic, misalnya naik turunnya produksi karena banjir yang sifatnya
jarang terjadi.
Klasifikasi data deret waktu dengan k-NN dan conditional inference tree
Menurut Zhao (2013), metode klasifikasi k-NN juga dapat digunakan
untuk mengklasifikasikan data deret waktu berdasarkan kedekatan objek dalam
data tersebut. Han dan Kamber (2011) menyatakan kedekatan objek biasanya
didefinisikan sebagai sebuah fungsi jarak antara dua data. Fungsi jarak yang
umumnya digunakan adalah jarak Euclidean. Misalkan terdapat dua data X1 =
(x11, x12, … , x1n) menyatakan data uji dan X2 = (x21, x22, … , x2n) menyatakan data
latih, jarak Euclidean-nya sebagai berikut:
ist , 2 √∑ i 2i 2
n
i
Selain metode klasifikasi k-NN, penelitian ini juga menerapkan metode
conditional inference tree yang tersedia pada party package dalam perangkat
lunak R. Metode conditional inference tree merupakan pengembangan algoritme
recursive binary partitioning (Zhao 2013).
Analisis Model Klasifikasi
Sistem diuji dengan menghitung akurasi, yaitu jumlah data yang berhasil
dikenali benar oleh metode klasifikasi conditional inference tree dan k-NN.
Persamaan berikut digunakan untuk menghitung akurasi (Buono et al. 2004) :
umlah klasi ikasi benar
umlah seluruhn a
Lingkungan Pengembangan
Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk
penelitian ini adalah sebagai berikut :
Perangkat keras berupa komputer personal dengan spesifikasi:
Processor Intel® Dual Core 1.7GHz
Memory 1.5 GB
5
Harddisk 160 GB
Perangkat lunak:
Sistem operasi Microsoft Windows 8
Quantum GIS 1.8.0 Lisboa untuk pengolahan dan visualisasi data spasial
PostgreSQL 9.1 sebagai sumber manajemen basis data
PostGIS 2.0 sebagai ekstensi PostgreSQL untuk analisis data spasial
Tool komputasi statistik R
Microsoft Excel 2007 untuk mengolah data
HASIL DAN PEMBAHASAN
Pengumpulan Data
Pada penelitian ini, data yang digunakan adalah :
1. Data persebaran hotspot
Data persebaran hotspot yang digunakan adalah data tahun 2001
sampai dengan tahun 2012. Data ini memiliki atribut longitude, latitude, dan
acq_date. Atribut longitude dan latitude merupakan informasi spasial yang
digunakan untuk menginterpretasikan letak hotspot dalam peta geografis
Provinsi Riau sedangkan atribut acq_date merupakan keterangan tanggal
terjadinya hotspot di titik tertentu. Gambar 3 menunjukkan jumlah hotspot
yang tersebar di Provinsi Riau selama kurun waktu tahun 2001 hingga tahun
2012. Terlihat bahwa tahun 2005, 2006, 2009, dan 2012 merupakan tahun-
tahun yang memiliki catatan jumlah hotspot tertinggi berdasarkan satelit
MODIS Terra dan Aqua.
Gambar 3 Jumlah titik panas Provinsi Riau tahun 2001-2012 (Data
hotspot spasial Provinsi Riau, 2013)
2. Data penutupan lahan (land cover)
Kemunculan titik panas pada Provinsi Riau terdapat pada
penggunaan lahan seperti lahan perkebunan (plantation), hutan kering
(dryland forest), lahan pertanian (agricultural field), semak (shrubs),
hutan alam (natural forest), lahan kosong (bare land), serta rawa dan
bakau (swamp and mangrove). Gambar 4 menunjukkan selama kurun
1677
5954 6874
4251
11453 11124
4094
5650
10895
4100
6840 7820
0
2000
4000
6000
8000
10000
12000
14000
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Jumlah Hotspot
6
waktu tahun 2001 sampai dengan tahun 2012 titik panas paling banyak
ditemukan pada area perkebunan (plantation).
Secara akumulatif dari tahun 2001 hingga tahun 2012, titik panas
paling banyak muncul pada area plantation yaitu sebanyak 35739 titik
(Gambar 4). Menurut penelitian Januarisky tahun 2012 yang
menggunakan data hotspot di Provinsi Kalimantan Barat, kemunculan
tertinggi di area perkebunan umumnya disebabkan oleh aktivitas
penyiapan lahan. Untuk lahan berupa rawa dan bakau (swamp &
mangrove), disebabkan oleh sulitnya mencari lahan untuk kegiatan
berladang. Ini menyebabkan sebagian masyarakat mulai beralih
memanfaatkan hutan rawa sebagai area pertanian menggunakan teknik
pembakaran untuk membuka lahan.
Gambar 4 Titik panas berdasarkan area penutupan lahan kurun waktu
2001 hingga 2012 (Data hotspot spasial Provinsi Riau, 2013)
Praproses Data Deret Waktu
Pada penelitian ini digunakan 2 (dua) jenis data sebagai data latih yaitu
data harian hotspot dengan tujuh kelas target dan data bulanan hotspot dengan
tujuh kelas target (Tabel 3). Data latih terdiri dari 84 record yang merupakan
gabungan data dari masing-masing kelas target yaitu sebanyak 12 data (12 tahun)
per kelas.
Tabel 3 Tujuh Kelas penutupan lahan yang dipakai pada penelitian
7 Kelas land cover
Plantation
Dryland forest
Agricultural field
Shrubs
Natural forest
Bare land
Swamp & mangrove
35739
13004 10813
7983 6004 5904
1405
0
5000
10000
15000
20000
25000
30000
35000
40000
Total Hotspot
7
Berikut ini adalah tahapan praproses dalam penelitian ini :
1. Import shape file ke Quantum GIS
Pada awalnya, data hotspot yang didapatkan dari NASA merupakan
shape file yang mengandung data hotspot di Provinsi Riau dan luar area
Riau dalam jangka waktu tertentu. Untuk mendapatkan data hotspot yang
hanya terdapat di Provinsi Riau saja, dapat dilakukan query spasial
menggunakan Quantum GIS atau menggunakan PostgreSQL.
2. Query sederhana pada data spasial
Query sederhana ini meliputi clipping hotspot yang terdapat di area
penutupan lahan Provinsi Riau, query pengelompokan hotspot berdasarkan
tahun, dan query pemecahan fail area penutupan lahan menjadi beberapa
shape file. Gambar 5 adalah contoh data hotspot yang belum dilakukan
clipping dan masih terdiri dari kumpulan data hotspot selang beberapa
tahun.
Gambar 5 Data hotspot sebelum dilakukan clipping dan query sederhana
Setelah proses clipping, dilakukan query pengelompokan hotspot
berdasarkan tahun. Satu shape file yang didapat dari NASA terdiri dari
catatan hotspot dalam kurun waktu beberapa tahun. Untuk itu diperlukan
query agar data hotspot Provinsi Riau terpisah dalam layer yang berbeda-
beda berdasarkan tahun.
Query sederhana yang terakhir adalah query pemecahan data
penutupan lahan berdasarkan kelompoknya. Ada 13 tipe area penutupan
lahan pada data asli. Pada penelitian ini 13 tipe area tersebut
disederhanakan lagi menjadi 7 (tujuh). Hasil dari query ini adalah tujuh
layer yang merupakan tujuh area penutupan lahan.
3. Export shape file hasil query
Hasil query yang telah berbentuk layer di Quantum GIS dapat
diubah menjadi shape file. Pada penelitian ini hasil export shape file akan
berguna sebagai back up layer untuk diolah selanjutnya pada PostgreSQL.
Export layer akan menghasilkan fail dengan ekstensi .shp yang kemudian
dapat di-import ke dalam PostgreSQL.
8
4. Import shape file ke PostgreSQL
Agar PostgreSQL dapat membaca shape file yang berisi informasi
spasial, terlebih dahulu dipasang postGIS yang terintegrasi dengan
PostgreSQL. Satu buah shape file yang telah di export melalui Quantum
GIS akan menjadi satu buah tabel pada PostgreSQL. Tahap ini
menghasilkan tabel hotspot Provinsi Riau tahun 2001 hingga tahun 2012
dan tabel area penutupan lahan yang telah dipecah menjadi tujuh bagian.
5. Query semua data yang dibutuhkan
Data yang dibutuhkan untuk dijadikan kelas target dalam metode
klasifikasi penelitian ini adalah area penutupan lahan. Karenanya perlu
dicari data hotspot tiap tahun tertentu yang terdapat di masing-masing area
penutupan lahan agar hasil yang didapat adalah data hotspot yang terbagi
dalam tujuh kelas area penutupan lahan untuk setiap tahun.
Data yang dibutuhkan untuk membentuk pohon keputusan dengan
conditional inference tree dan klasifikasi dengan k-NN adalah jumlah
hotspot per satuan waktu. Jumlah hotspot bisa didapat dengan menghitung
jumlah tanggal yang sama (dengan syntax group by acq_date) untuk setiap
area penutupan lahan selama kurun waktu tahun 2001 hingga tahun 2012.
6. Sesuaikan format data menggunakan excel
Hotspot di Provinsi Riau tidak muncul di area lahan penutupan
setiap hari. Oleh karena itu, data hasil query yang dihasilkan dengan
PostgreSQL tidak dapat langsung diproses seperti format data yang
dibutuhkan dalam syntax R, yaitu jumlah hotspot di hitung per hari atau
per bulan selama 12 tahun. Di excel perhitungan jumlah data tersebut
dapat dihitung dengan cepat dan rapi serta dalam format yang diinginkan.
Pa a penelitian ini igunakan ata engan ekstensi “. ata” sebagai ail
masukan data latih dan data uji.
Dekomposisi data deret waktu
Gambar 6 adalah grafik jumlah hotspot harian Provinsi Riau selama kurun
waktu tahun 2001 hingga tahun 2012 yang didapat dari hasil praproses. Selama
kurun waktu 12 tahun tersebut, tahun 2012 tercatat memiliki jumlah hotspot
tertinggi oleh NASA dengan satelit MODIS yaitu pada tanggal 10 bulan Agustus
sebanyak 761 titik.
Gambar 6 Jumlah titik panas harian Provinsi Riau tahun 2001-2012
9
Gambar 7 merupakan visualisasi dari perkembangan arah data hotspot
secara umum (trend). Dengan teknik dekomposisi aditif dihasilkan trend yang
tidak linier maupun kuadratik, trend hotspot Provinsi Riau selang waktu 2001
hingga 2012 adalah acak dari tahun ke tahun. Namun demikian apabila di lihat
trend pada masing-masing tahun, jumlah hotspot akan signifikan naik atau
signifikan turun disekitar waktu pergantian tahun. Hal ini dapat kita lihat pada
waktu awal pergantian tahun 2002, 2003, 2006, 2008, 2009, 2011 yang naik
secara signifikan. Demikian pua halnya dengan awal pergantian tahun 2004, 2005,
2007, dan 2010 yang turun secara signifikan.
Gambar 7 Trend data deret waktu hotspot Provinsi Riau tahun 2001-2012
Gambar 8 merupakan indeks musiman data deret waktu hotspot Provinsi
Riau tahun 2001 hingga tahun 2012. Indeks musiman atau seasonal index
merupakan gerakan data musiman yang memiliki pola yang sama (siklis) karena
terus mengulang tiap waktu tertentu. Berdasarkan pola tersebut, dapat kita lihat
bahwa kemunculan hotspot tertinggi untuk setiap tahunnya adalah pada
pertengahan tahun dan terendah menjelang akhir tahun. Hotspot tertinggi pada
pertengahan tahun dikarenakan puncak kekeringan terjadi pada akhir musim
kemarau sekitar bulan juli hingga agustus. Hotspot terendah menjelang akhir
tahun terjadi karena akhir tahun merupakan musim penghujan.
Gambar 8 Indeks musiman data deret waktu hotspot Provinsi Riau tahun 2001-
2012
Irregular component merupakan pola data yang tidak teratur dan tidak
termasuk ke dalam trend dan siklis (Gambar 9). Irregular component sifatnya
jarang terjadi.
Gambar 9 Irregular component data deret waktu hotspot Provinsi Riau tahun
2001-2012
10
Pola Distribusi Hotspot Untuk Setiap Kelas Tipe Penutupan Lahan
Gambar 10 merupakan data sampel hotspot untuk setiap kelas penutupan
lahan Provinsi Riau. Label angka 1, 13, 25, dan 37 merupakan nomor urut data
sampel yang di ambil. Data dengan nomor urut 1 hingga 12 merupakan data kelas
1 (plantation) selama 12 tahun (2001 hingga 2012), demikian pula dengan nomor
urut 13 hingga 24 merupakan data kelas 2 (dryland forest), nomor urut 25 hingga
36 merupakan kelas 3 (agricultural field), nomor urut 37 hingga 48 merupakan
kelas 4 (shrubs), nomor urut 49 hingga 60 merupakan data kelas 5 (natural
forest), nomor urut 61 hingga 72 merupakan data kelas 6 (bare land), dan sisanya
adalah data kelas 7 (swamp and mangrove). Dapat dilihat pada masing-masing
data sampel (Gambar 11), bahwa masing-masing kelas memiliki kemiripan. Hal
ini dapat dilihat dari tingginya angka hotspot menjelang hari ke 200. Kemiripan
data pada masing-masing kelas juga menggambarkan bahwa lahan penutupan
memiliki korelasi yang sangat kecil terhadap data hotspot.
Gambar 10 Data sampel hotspot kelas
(plantation) tahun 2001
hingga 2005
Gambar 11 Data sampel hotspot
untuk masing-masing kelas
penutupan lahan plantation,
dryland forest, agricultural fied,
dan shrubs
Klasifikasi data deret waktu dengan metode conditional inference tree
Berikut ini (Gambar 12) adalah decision tree yang terbentuk dari data
hotspot harian 7 dengan 7 (tujuh) kelas target dan tahun 2001 – 2012. Berdasarkan
pohon keputusan tersebut, ada 4 buah leaf node yang berarti dapat dibuat 4 aturan.
Aturan yang terbentuk dari conditional inference tree diatas adalah sebagai
berikut:
1. Aturan 1 (leaf node = 7)
Jika pada hari ke 226 terdapat hotspot lebih dari 16 (>16), maka hotspot
terjadi di plantation dengan peluang 85%.
11
2. Aturan 2 (leaf node = 6)
Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16) dan pada
hari ke 115 terdapat hotspot lebih dari 1 buah (> 1), maka hotspot terjadi
di plantation dengan peluang 100%.
3. Aturan 3 (leaf node = 5)
Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16) dan hari ke
115 terdapat hotspot kurang dari atau sama dengan 1 buah (<= 1), dan
hari ke 61 terdapat lebih dari 26 hotspot, maka hotspot terjadi di
plantation dengan peluang 100%.
4. Aturan 4 (leaf node = 4)
Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16), hari ke 115
terdapat hotspot kurang dari atau sama dengan 1 buah (<= 1), dan hari
ke 61 terdapat kurang dari atau sama dengan (<=) 26 hotspot, maka
hotspot terjadi di dryland forest, shrubs, natural forest, bare land,
swamp and mangrove dengan peluang 14.28%.
Gambar 12 Pohon keputusan yang dihasilkan oleh data hotspot harian tahun 2001
hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan
sebagai kelas target
Klasifikasi berdasarkan pohon keputusan dengan data hotspot harian
(Gambar 12) hanya dapat mengklasifikasikan data ke dalam dua kelas yaitu kelas
1 (plantation) dan kelas 2 (dryland forest). Akibatnya klasifikasi data kelas 3, 4,
5, 6, dan 7 akan selalu salah (Tabel 4). Hal ini menjadi salah satu faktor penyebab
rendahnya akurasi. Pohon keputusan ini (Gambar 12) memiliki akurasi terhadap
data training sebesar 28.5% dengan ketepatan klasifikasi terhadap kelas 1 dan
kelas 2 sebesar 100%. Dengan demikian dapat dikatakan bahwa pohon keputusan
(Gambar 12) hanya akan mengklasifikasikan dengan baik pada data dengan kelas
1 dan 2 saja.
12
Tabel 4 Hasil klasifikasi dengan data hotspot harian Provinsi Riau tahun 2001
hingga 2012 menggunakan metode conditional inference tree
Kelas Jumlah
Record
Hasil Klasifikasi
1 2 3 4 5 6 7
1 12 12 0 0 0 0 0 0
2 12 0 12 0 0 0 0 0
3 12 1 11 0 0 0 0 0
4 12 0 12 0 0 0 0 0
5 12 0 12 0 0 0 0 0
6 12 0 12 0 0 0 0 0
7 12 0 12 0 0 0 0 0
Berdasarkan pohon keputusan pada Gambar 13, ada 3 buah leaf node yang
berarti dapat dibuat 3 aturan klasifikasi. Aturan yang terbentuk dari conditional
inference tree tersebut adalah sebagai berikut:
1. Aturan 1 (leaf node = 5)
Jika pada bulan ke 4 terdapat hotspot lebih dari 33 (>33, maka hotspot
terjadi di plantation dengan peluang 75% .
2. Aturan 2 (leaf node = 4)
Jika pada bulan ke 4 terdapat hotspot kurang dari 33 (<=33) dan lebih dari
3, maka hotspot terjadi di lahan gundul (bare land) pada bulan tersebut
adalah 29% .
3. Aturan 3 (leaf node = 3)
Jika pada bulan ke 4 terdapat hotspot kurang dari 33 (<=33) dan kurang
dari atau sama dengan 3 hotspot, maka hotspot terjadi di area rawa dan
hutan bakau (swamp & mangrove) dengan peluang 40%
Gambar 13 Pohon keputusan yang dihasilkan oleh data hotspot bulanan tahun
2001 hingga tahun 2012 menggunakan 7 (tujuh) area penutupan
lahan sebagai kelas target
13
Klasifikasi berdasarkan pohon keputusan dengan data hotspot bulanan
(Gambar 13) hanya dapat mengklasifikasikan data ke dalam tiga kelas yaitu kelas
1 (plantation), kelas 6 (Bare Land) dan kelas 7 (Swamp and Mangrove).
Akibatnya klasifikasi terhadap data kelas 2, 3, 4, dan 5 akan selalu salah (Tabel
5). Hal ini juga menjadi salah satu faktor penyebab rendahnya akurasi klasifikasi.
Pohon keputusan dengan data bulanan (Gambar 13) memiliki akurasi terhadap
data training sebesar 38 %. Pohon keputusan ini dapat mengklasifikasikan dengan
benar pada kelas 1 sebanyak 9 dari 12 record (benar 75%), benar
mengklasifikasikan pada kelas 6 sebanyak 12 dari 12 record (benar 100%), dan
benar mengklasifikasikan pada kelas 7 sebanyak 11 dari 12 record (benar 91.6%).
Tabel 5 Hasil klasifikasi dengan data hotspot bulanan Provinsi Riau tahun 2001
hingga 2012 menggunakan metode conditional inference tree
Kelas Jumlah
Record
Hasil Klasifikasi
1 2 3 4 5 6 7
1 12 9 0 0 0 0 3 0
2 12 2 0 0 0 0 5 5
3 12 1 0 0 0 0 11 0
4 12 0 0 0 0 0 8 4
5 12 0 0 0 0 0 5 7
6 12 0 0 0 0 0 12 0
7 12 0 0 0 0 0 1 11
Berdasarkan Tabel 6, akurasi tertinggi diperoleh ketika satuan waktu yang
dipakai adalah hotspot per bulan yaitu sebesar 38%. Rendahnya akurasi ini
disebabkan oleh tren data hotspot yang acak serta kemiripan pola distribusi data
masing-masing kelas. Demikian pula halnya dengan akurasi untuk data bulanan,
selalu lebih tinggi daripada akurasi data harian. Ini disebabkan atribut waktu yang
digunakan lebih sedikit daripada atribut waktu data hotspot harian dengan
kemiripan pola distribusi yang lebih rendah bila dibandingkan dengan data harian.
Tabel 6 Akurasi pohon keputusan data hotspot 2001-2012 menggunakan metode
conditional inference tree
Data Set Pohon Keputusan Akurasi
Waktu Jumlah
Kelas
Jumlah
Node
Jumlah
Daun (%)
Harian tahun 2001 – 2012 7 7 4 28.5
Bulanan tahun 2001 – 2012 7 5 3 38.0
Tabel 7 merupakan akurasi data uji menggunakan data hotspot Provinsi
Riau tahun 2013 dengan rata-rata akurasi 14.3%. Didapat akurasi yang sama besar
antara data bulanan dan data harian tahun 2013 dengan tujuh kelas lahan
penutupan. Nilai 14.3% didapat dari hasil klasifikasi yang hanya mampu
mengklasifikasikan 1 (satu) objek dengan benar dari 7 objek data uji.
14
Tabel 7 Akurasi klasifikasi data uji hotspot 2013 menggunakan metode
conditional inference tree
Data /Jumlah kelas Akurasi (%)
Harian / 7 kelas 14.3
Bulanan / 7 kelas 14.3
Klasifikasi data deret waktu dengan k-NN
Tabel 8 menunjukkan akurasi tertinggi diperoleh ketika parameter k yang
dipakai adalah k = 10 dan k = 15 dengan rata-rata akurasi sebesar 24.4%. Rata-
rata akurasi terendah diperoleh ketika parameter k yang dipakai adalah k = 5 yaitu
22.61%. Rendahnya akurasi untuk data harian disebabkan tren data hotspot yang
acak dan kemiripan pola distribusi data masing-masing kelas. Akurasi untuk data
bulanan selalu lebih tinggi daripada akurasi data harian. Ini disebabkan oleh
atribut waktu yang digunakan lebih sedikit dengan kemiripan pola distribusi yang
lebih rendah bila dibandingkan dengan data harian.
Tabel 8 Akurasi klasifikasi data hotspot 2001-2012 menggunakan metode k-NN
dengan leave one out cross validation
Data /Jumlah kelas Akurasi (%)
Rata-rata
k = 5 k = 10 k = 15 k = 20
Harian / 7 kelas 14.28 16.66 15.47 14.3 15.17
Bulanan / 7 kelas 30.95 32.14 33.33 32.14 32.14
Dalam penelitian dengan metode k-NN, digunakan data deret waktu hotspot
Provinsi Riau tahun 2013 sebagai data uji. Data uji dimulai dengan data uji dari
tanggal 1 Januari 2013 hingga tanggal 22 Desember 2013 dikarenakan jalannya
penelitian berlangsung hingga tanggal tersebut. Tabel 9 berikut adalah akurasi
klasifikasi yang diperoleh dengan menggunakan metode k-NN.
Rata-rata akurasi data uji pada Tabel 9 tertinggi sebesar 39.32% diperoleh
ketika menggunakan dataset bulanan, sedangkan rata-rata akurasi terendah
diperoleh ketika menggunakan dataset bulanan yaitu 25.02%.
Tabel 9 Akurasi klasifikasi data hotspot data uji hotspot 2013 menggunakan
metode k-NN
Data /Jumlah kelas Akurasi (%)
Rata-rata
k = 5 k = 10 k = 15 k = 20
Harian / 7 kelas 28.6 28.6 28.6 14.3 25.025
Bulanan / 7 kelas 42.9 42.9 28.6 42.9 39.325
15
SIMPULAN DAN SARAN
Simpulan
Berdasarkan penelitian yang telah dilakukan terhadap data deret waktu hotspot,
didapat kesimpulan bahwa :
1. Kemunculan hotspot tertinggi untuk setiap tahun adalah pada pertengahan
tahun (bulan juli dan agustus) dan terendah menjelang akhir tahun
2. Untuk data latih tahun 2001 hingga tahun 2012, rata-rata akurasi
klasifikasi terbaik didapat menggunakan metode conditional inference tree
dengan dataset bulanan yaitu sebesar 38%, sedangkan metode k-NN
memiliki rata-rata akurasi tertinggi pada dataset bulanan sebesar 32.14%.
3. Dari klasifikasi dengan data uji tahun 2013 diperoleh rata-rata akurasi
klasifikasi terbaik menggunakan metode k-NN dengan dataset bulanan
yaitu sebesar 39.32% sedangkan metode conditional inference tree
memiliki rata-rata akurasi 14.3% pada semua dataset.
Saran
Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara lain :
1. Uji coba penelitian dilakukan lebih spesifik dengan wilayah yang lebih
sempit dengan data yang lebih banyak.
2. Penggunaan metode lain untuk klasifikasi agar akurasi yang didapat
menjadi lebih baik.
3. Mencari prediktor berdasarkan data cuaca dan iklim
16
DAFTAR PUSTAKA
Anderson IP, Bowen MR. 2000. Fire Zones And The Threat To The Wetlands Of
Sumatera, Indonesia. Palembang (ID) : Dinas Kehutanan Provinsi Sumatera
Selatan.
Buono A, Marimin, Putri D. 2004. Klasifikasi Penutup dan Penggunaan Lahan
Pada Multispectral Image dari Landsat Thematic Mapper Menggunakan
Probabilistic Neural Network. Jurnal Ilmiah – Ilmu Komputer. 2(2):1-13.
Han J, Kamber M, Pei J. 2011. Data Mining Concepts and Techniques. 3rd
Edition. Massachusetts (US): Morgan Kaufmann Publishers.
Januarisky H A. 2012. Pola sebaran titik panas (hotspot) dan keterkaitannya
dengan perubahan penggunaan lahan [skripsi]. Bogor(ID): Institut Pertanian
Bogor.
Merdeka. 2013. Ini penyebab kebakaran hutan di Riau yang diprotes Singapura
[Internet]. (tanggal diperbaharui 19 Juni 2013 [diakses tanggal 1 juli 2013]).
Tersedia pada: http://www.merdeka.com/peristiwa/ini-penyebab-kebakaran-
hutan-di-riau-yang-diprotes-singapura.html
Montgomery DC, Jennings CL, Kulahci M. 2008. Introduction to Time Series
Analysis and Forecasting. New Jersey (US) : John Wiley & Sons Inc.
Rasyad R. 2003. Metode Statistik Deskriptif. Jakarta (ID) : Grasindo.
Zhao Y. 2013. R and Data Mining: Examples and Case Studies [Internet].
Elsevier. (tanggal diperbaharui 25 April 2013 [diunduh tanggal 1 juli
2013]).Tersedia pada: http://www.rdatamining.com/docs
17
RIWAYAT HIDUP
Penulis adalah putri pertama dari lima bersaudara pasangan Bapak
Fahrurrozi dan Ibu Suningsih, dilahirkan di Palembang pada tanggal 14 Mei 1989.
Penulis menyelesaikan pendidikan Sekolah Menengah Atas di SMA Negeri
1 Talang Kelapa, Kabupaten Banyuasin, Sumatera Selatan pada tahun 2006. Pada
tahun yang sama penulis melanjutkan pendidikan sebagai mahasiswa di Politeknik
Negeri Sriwijaya jurusan Teknik Komputer di kota Palembang dan lulus tahun
pada bulan Oktober 2009. Tahun 2009 penulis sempat menempuh pendidikan
ekstensi di Universitas Sriwijaya jurusan Sistem Komputer hingga awal tahun
2010.
Setelah bekerja di PT. Schlumberger sebagai field system assistant, penulis
melanjutkan kembali studi ke jenjang S1 pada tahun 2011 di Program Sarjana
Alih Jenis Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Institut Pertanian Bogor.