Makalah

27
ANALISIS PERBINCANGAN TOPIK BANJIR DI INDONESIA DALAM SOSIAL MEDIA TWITTER TAHUN 2014 (Studi Kasus: Data twitter tentang banjir tanggal 26 januari 2014) Oleh: Surya Prangga 1 1 Mahasiswa Jurusan Statistika Universitas Islam Indonesia ABSTRAK Perkembangan media komunikasi memudahkan pengguna untuk melakukan pertukaran informasi, ide dan gagasan. Salah satu media sosial yang berkembang di masyarakat adalah twitter. Dengan menggunakan twitter memungkinkan pengguna untuk berinteraksi dengan berbagai pengguna lain diseluruh dunia dengan membahas berbagai masalah maupun topik yang sedang berkembang atau yang sedang hangat diperbincangkan. Di Indonesia sekarang ini sedang hangatnya diperbincangkan masalah banjir yang terjadi di DKI Jakarta. sehingga menarik untuk dilakukan analisis terkait topik tersebut. Adapun analisis yang digunakan adalah analisis data mining yang terpusat pada metode Asosiasi, clustering, dan word cloud dengan menggunakan program R. Kata kunci: Banjir, Data mining, Asosiasi, clustering, word cloud PENDAHULUAN

description

makalah data mining

Transcript of Makalah

ANALISIS PERBINCANGAN TOPIK BANJIR DI INDONESIA DALAM SOSIAL MEDIA TWITTER TAHUN 2014(Studi Kasus: Data twitter tentang banjir tanggal 26 januari 2014)

Oleh: Surya Prangga11Mahasiswa Jurusan Statistika Universitas Islam Indonesia

ABSTRAK

Perkembangan media komunikasi memudahkan pengguna untuk melakukan pertukaran informasi, ide dan gagasan. Salah satu media sosial yang berkembang di masyarakat adalah twitter. Dengan menggunakan twitter memungkinkan pengguna untuk berinteraksi dengan berbagai pengguna lain diseluruh dunia dengan membahas berbagai masalah maupun topik yang sedang berkembang atau yang sedang hangat diperbincangkan. Di Indonesia sekarang ini sedang hangatnya diperbincangkan masalah banjir yang terjadi di DKI Jakarta. sehingga menarik untuk dilakukan analisis terkait topik tersebut. Adapun analisis yang digunakan adalah analisis data mining yang terpusat pada metode Asosiasi, clustering, dan word cloud dengan menggunakan program R.

Kata kunci: Banjir, Data mining, Asosiasi, clustering, word cloud

PENDAHULUANLingkungan pesisir merupakan lingkungan yang sangat dinamis dengan berbagai penggunaan lahan yang sangat komplek (Marfai dan King, 2008a; Aerts et al, 2009; Marfai 2011). Indonesia sebagai Negara kepulauan mempunyai daerah pesisir yang merupakan kawasan yang sangat rawan untuk terkena bencana (Marfai dan King, 2008c). Salah satu bencana yang terjadi di kawasan pesisir adalah bencana banjir (Mardiatno, 2007; Blackett dan Hume, 2007). IPCC (2007) menyebutkan bahwa kenaikan muka air laut di dunia pada Tahun 2100 akan bertambah sekitar 18 cm sampai dengan 59 cm. Menurut KOMPAS Nasional (2014), Berbagai bencana yang terjadi di Indonesia saat ini bukanlah sesuatu yang tiba-tiba. Ada proses yang mendahuluinya, tetapi tidak sepenuhnya disadari berisiko buruk bagi manusia. Banjir, termasuk banjir bandang, dan juga tanah longsor yang setiap tahun terus bertambah bagaimanapun merupakan akibat perilaku manusia. Di Jawa, banjir hampir merata di seluruh wilayah, dari Jawa Barat hingga Jawa Timur. Banjir di Kabupaten Subang, Jawa Barat, menyebabkan jalur utama pantura putus, mulai dari Kecamatan Patokbeusi, Ciasem, Sukasari, Pamanukan, hingga Pusakajaya. Ketinggian air di ruas jalan tersebut hingga 60 sentimeter. Hingga berita ini diturunkan, jalur utama pantura Subang masih macet total dengan panjang antrean sekitar 1,5 kilometer di kedua arah. Pada akhir tahun lalu, banjir juga menyebabkan jalur selatan di wilayah perbatasan Kabupaten Kebumen dan Purworejo di Jawa Tengah terputus. Saat itu sejumlah wilayah selatan Jateng banjir akibat meluapnya sejumlah sungai. Saat ini, banjir di Jateng terjadi di sejumlah wilayah utara, seperti Kota dan Kabupaten Pekalongan, Kota Semarang, Kabupaten Kudus, serta Kabupaten Pati. Banjir di wilayah utara Jateng ini cenderung lama surut karena pada saat bersamaan terjadi pasang air laut. Banjir di Kota dan Kabupaten Pekalongan, misalnya, terjadi sejak tiga hari lalu (Inggried Dwi, 2014). Pesisir Pekalongan merupakan salah satu kawasan pesisir utara Pulau Jawa yang saat ini selalu menghadapi bencana pesisir berupa banjir dan genangan. Analisis bencana banjir rob penting dilakukan dalam kaitannya dengan pengelolaan pesisir terpaduan untuk menunjang pembangunan daerah (Kraas, 2007; Ward et al, 2010).Di luar Jawa, banjir terjadi di sejumlah wilayah di Pulau Sumatera, Kalimantan, Sulawesi, hingga Papua. Di sejumlah wilayah bahkan terjadi banjir bandang, seperti di Manado, Sulawesi Utara; Kabupaten Dinggala, Sulawesi Tengah, dan di Kabupaten Pesisir Selatan, Sumatera Utara. Banjir di Jakarta juga semakin parah. Hujan deras yang mengguyur hulu sungai dan wilayah Jabodetabek membuat saluran air dan 13 sungai di Jakarta meluap dan menggenangi 564 rukun tetangga di 30 kecamatan di DKI Jakarta. Ketinggian air sekitar 5 sentimeter hingga 3 meter. Kondisi ini membuat 30.784 warga harus mengungsi (Inggried Dwi, 2014).Jakarta merupakan salah satu daerah yang rawan banjir. Karena hampir setiap kali musim penghujan, wilayah Jakarta selalu terendam air. Secara geomorfologis, 40% wilayah Jakarta terdiri dari dataran rendah pantai dengan ketinggian kurang dari 10m, bahkan di beberapa tempat berada di kurang lebih 1m di bawah muka air pasang (maksimum). Jakarta merupakan daerah aliran 13 sungai yang bermuara di Teluk Jakarta. Daerah aliran 13 sungai juga menyebar merata di semua wilayah Jakarta. Oleh karena itu, secara alamiah daerah dengan ketinggian rendah akan terendam. (Riena, 2013). Di sisi lain, hampir 40 persen wilayah di Jakarta berada di bawah permukaan laut. Kondisi ini diperparah dengan terus menurunnya permukaan tanah mencapai 18 cm/tahun (berdasarkan penelitian Hasanuddin Z. Abidin, 2008), dan meningkatnya tinggi permukaan air laut hingga 8 mm/tahun (berdasarkan penelitian Sutisna S., dkk, 2002) dikutip oleh Robin Hartanto (2013) pada berita.yahoo.com. Ada beberapa penyebab terjadinya banjir yang ada di Indonesia khususnya daerah Jakarta diantaranya yaitu: rob, penurunan muka tanah, saluran drainase tidak memadai, tingginya curah hujan lokal dan di hulu, sumbatan sampah, menurunnya daya dukung lingkungan di hulu dan daerah aliran sungai (DAS), serta penurunan tanah. Tanda-tanda terjadi penurunan tanah adalah saluran air patah, miring, atau berubah arah, bangunan retak-retak, dan jalan menjadi lebih tinggi dari bangunan secara signifikan (Kopertis12, 2013). Menurut Fakhrudin (2013), banjir sangat dipengaruhi oleh curah hujan, tutupan lahan, dan sistem drainase. Curah hujan sulit untuk dikontrol. Sistem drainase dapat dikelola jika tutupan lahan dikelola dengan baik (HumasLIPI, 2013). Berangkat dari maraknya berbagai media yang banyak memperbincangkan masalah terkait bencana banjir yang ada di Jakarta dan seluruh wilayah di Indonesia Tahun 2014 ini dan dari berbagai penelitian yang membahas masalah banjir di Jakarta. Oleh karena itu, makalah ini akan membahas topik terkait kepopuleran kata banjir dilihat dari sisi jejaring sosial salah satunya yaitu twitter. Banyak hal yang menarik untuk dilihat ketika pengguna tersebut membuat tweet dengan kata banjir. Selain itu juga akan dilihat seberapa besar hubungan yang terbentuk antara kata-kata yang ditweet secara bersamaan dengan kata banjir. Adapun tehnik yang digunakan yaitu tehnik data mining yang terpusat pada analisis text mining.

Tinjauan PustakaPenelitian Mita Noveria (2007:116-117) peneliti LIPI Jakarta, yang bertajuk Bencana Alam Dari Sisi Kependudukan: Penyabab dan Dampaknya menyimpulkan bahwa, bencana alam tidak bisa terpisahkan dari konteks masyarakat. Karena masyarakat disamping menjadi korban sekaligus menjadi pelaku bencana dan penyebab bencana, khususnya bencana banjir dan tanah longsor.Menurut buku Crowd yang ditulis oleh yuswohady, engagement merupakan salah satu hal penting di era social media. Namun, menurut penelitian yang dilakukan oleh Amira Dewiningtyas dan Yudi Pramudiana dari Institut Manajemen Telkom, salah satu temuannya menyebutkan bahwaengagement yang dilakukan oleh beberapa akun official twitter yang menjadi objek penelitian masih di bawah ekspektasi audiensnya. Penelitian tersebut dipublikasikanInternational Conference on Economics Marketing and ManagementIPEDR Vol.28 (2012) (2012) IACSIT Press, Singapore.

Batasan MasalahAdapun cakupan masalah yang akan dibahas dan dianalisis pada makalah ini yaitu terkait kata banjir yang terjadi di Indonesia yang terdapat pada jejaring sosial twitter sedangkan untuk kata selain itu tidak termasuk dalam bahasan ini.

Tujuan PenelitianTujuan dari penelitian ini adalah:Mencari hubungan (asosiasi) dari kata-kata yang paling sering muncul dengan kata-kata banjir dan Membuat pengelompokan/klaster terhadap kata-kata yang memiliki kemiripan satu dengan yang lainnya.

METODOLOGI PENELITIANData yang digunakan pada penelitian ini adalah data tentang banjir yang ada di Indonesia dimana data tersebut diperoleh dari jejaring sosial twitter yang diambil langsung secara online pada tanggal 26 Januari 2014 pukul 10:43 WIB karena pada tanggal dan waktu tersebut berbagai media massa maupun jejaring sosial twitter masih maraknya membahas peristiwa banjir yang terjadi di Indonesia. Adapun program bantuan dalam mengolah data tersebut dengan menggunakan program R. Data sekunder ini terdiri dari 199 dokumen yang di dalamnya membahas tentang banjir.PopulasiPopulasi dari penelitian ini adalah seluruh kicauan-kicauan (tweet) tentang banjir atau yang memuat kata-kata tentang banjir.Sampel dan Teknik Pengambilan SampelSampel yang diperoleh yakni 199 tweet tentang banjir atau memuat kata-kata banjir serta teknik pengambilan sampel yang digunakan pada penelitian ini adalah menggunakan teknik sampling acak sederhana.

LANDASAN TEORIPerangkat Lunak RR adalah suatu kesatuan software yang terintegrasi dengan beberapa fasilitas untuk manipulasi, perhitungan dan penampilan grafik yang handal. R berbasis pada bahasa pemrograman S, yang dikembangkan oleh AT&T Bell Laboratories (sekarang Lucent Technologies) pada akhir tahun 70 an. R merupakan versi gratis dari bahasa S dari software (berbayar) yang sejenis yakni S-PLUS yang banyak digunakan para peneliti dan akademisi dalam melakukan kegiatan ilmiahnya. (Didi, 2013)

BanjirMenurut BNPB (2012), Banjir adalah peristiwa atau keadaan dimana terendamnya suatu daerah atau daratan karena volume air yang meningkat.

Twitter Twitter diciptakan oleh Jack Dorsey pada bulan juli 2006 di bawah perusahaan Odeo Corp. Kesuksesan twitter membuat banyak situs lain meniru konsepnya, kadang menawarkan layanan spesifik lokal suatu negara atau menggabungkan dengan layanan lainnya. Suatu sumber bahkan menyebutkan bahwa paling tidak ada 111 situs web yang memiliki layanan mirip dengan twitter. Menggunakan layanan twitter pun tampaknya jauh lebih mudah daripada layanan jejaring pertemanan lainnya. Pengguna bisa mengirimkan pesan singkat melalui beberapa cara, bisa melalui situs twitter secara langsung, melalui SMS, atau melalui aplikasi twitter lainnya seperti Twirl, Snitter, atau Twitterfox yang merupakan aplikasi tambahan untuk browser Firefox.Dalam Twitter, ada tiga hal yang penting selain menuliskan artikel dengan batasan 140 karakternya itu, yaitu following, follower, dan update. Disinilah sebenarnya letak keunikan dan manfaat lainnya dari Twitter. Fitur yang menarik lagi adalah pengguna dapat share video atau foto dari fitur media stream flock dengan hanya men-drag foto atau video tersebut. Belum lagi fitur menulis artikel pada blog pribadi tanpa harus login pada blog tersebut (Dianita, 2010). Sementara teori dari Evans (2008) terkait strategi blogging dijabarkan ke dalam 4 hal berikut:-Transparent-Willingness to listen-Willingness to act- Twitter EtiqquetteDidukung oleh Claxton (2008) yang menyatakan, strategi yang tepat dalamcoorporate blogging akan mampu menghasilkan sense of community. Tak ketinggala,untuk mengidentifikasi benefits apa saja yang terjadi di ranah social media , teori dari kotler (2010) digunakan. Benefit yang dimaksud dalam penelitian tersebut dijabarkan sebagai berikut:-Information benefit-Social Benefit-Sharing Benefit-Emotional Benefit

Data miningSecara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar (Davies, 2004). Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2007). Data mining, sering juga disebut sebagai knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar (Santosa, 2007). dikutip dari Sigit Prabowo (2013).

Metode Data MiningAssociation Rules (Aturan Asosiasi)Menurut Atje Setiawan (2009), Assosiation Rule merupakan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minsup) dan syarat minimum untuk confidence (minconf) pada sebuah database. Dalam menentukan suatu Association Rule umumnya terdapat dua ukuran kepercayaan (interestingness measure), yaitu support dan confidence. Kedua ukuran ini akan digunakan untuk interesting association rules dengan dibandingkan dengan batasan yang telah ditentukan. Batasan inilah yang terdiri dari minsup dan minconf. Assosiation Rule Mining adalah suatu prosedur untuk mencari hubungan antar item dalam suatu dataset. Dimulai dengan mencari frequent itemset, yaitu kombinasi yang paling sering terjadi dalam suatu itemset dan harus memenuhi minimum support. Dalam tahap ini akan dicari kombinasi item yang memnuhi syarat minimum dari nilai support dalam database. Untuk mendapatkan nilai support untuk sebuah item A dapat diperoleh dari rumus berikut :(2.1)Sementara itu, untuk mencari nilai support dari 2-item dapat diperoleh dari rumus berikut : (2.2)Setelah semua frequent item dan Large itemset ditemukan, dapat dicari semua Association Rules yang memenuhi syarat minimum untuk confidence (minconf) dengan menggunakan rumus berikut ini :(2.3)

Metode ClusteringMetode clustering mempartisi data ke dalam kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama (Refaat, 2007). Tujuan dari clustering ini adalah untuk meminimalisasi fungsi tujuan yang ditetapkan dalam proses clustering, yang umumnya berusaha meminimalisasi variasi dalam suatu cluster dan memaksimalisasi variasi antar cluster. Dikutip dari Tamsir Hasudungan Sirait (2011).K-Means K-Means merupakan suatu metode untuk melakukan pengalokasian data ke masing-masing cluster. Alokasi data tersebut didasarkan perbandingan jarak antara data dengan centroid setiap cluster, dengan persamaan sebagai berikut (Yudi Agusta, 2007):(2.4)dimana:: Keanggotaan data ke-k ke cluster ke-i: Nilai centroid cluster ke-iAdapun fungsi objektif dalam metode K-Means adalah sebagai berikut:(2.5)dimana:N: Jumlah datac: Jumlah cluster: Keanggotaan data ke-k ke cluster ke-i: Nilai centroid cluster ke-iDengan mempunyai nilai 1 jika suatu data merupakan anggota suatu kelompok dan 0 bila sebaliknya. Pusat centroid dihitung dengan persamaan: (Yudi Agusta, 2007)(2.6)

Text MiningText mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen (Raymond, 2006).Tahapan dalam Text Mining:1. Tokenizing: tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.2. Filtering: tahap mengambil kata-kata penting dari hasil token. Bias menggunakan algoritma stop list (membuang kata yang kurang penting) atau word list (menyimpan kata penting).3. Stemming: tahap mencari root kata (kata dasar) dari tiap kata hasil filtering.4. Tagging: tahap mencari bentuk awal/root dari tiap kata lampau atau kata hasil stemming.5. Analyzing: tahap penentuan seberapa jauh keterhubungan antar kata-kata antar dokumen yang ada.

WordcloudWord Cloud adalah visualisasi dari kata-kata popular yang biasanya terkait dengan kata kunci pada internet dan data teks. Word Cloud paling sering digunakan untuk menyoroti istilah popular atau yang menonjol berdasarkan frekuensi penggunaan. (PBC Information, 2013)

HASIL DAN PEMBAHASAN

Gambar 1. A term-document matrixBerdasarkan gambar di atas menjelaskan bahwa total tweet yang diperoleh terkait topik banjir yaitu sebanyak 199 tweet dan terdapat sebanyak 941 topik yang berkaitan dengan topik banjir.Untuk melihat topik yang sering dibicarakan seputar banjir dapat dilihat pada grafik berikut ini.

Gambar 2. Most Popular TermsBerdasarkan gambar di atas menjelaskan terkait topik yang paling sering dikicaukan secara bersamaan dengan topik banjir. Kata-kata tersebut muncul berdasarkan frekuensi minimal sebanyak 40 kali diucapkan/dikicaukan dalam 199 tweet yang diperoleh. Dapat dilihat bahwa selain kata banjir terdapat kata titik, melanda, rendam, pln, pelanggan, Jakarta dan lain sebagainya yang merupakan bagian dari most Popular Terms. Topik-topik yang termasuk dalam most popular terms tersebut dapat divisualisasikan dengan menggunakan word cloud seperti tampilan di bawah ini.

Gambar 3. Tampilan Word CloudBerdasarkan tampilan word cloud di atas dapat dilihat bahwa topik utama yaitu banjir ditulis dengan ukuran yang lebih besar dan kemudian kata-kata yang lain seperti sejak, rendam, Jakarta, pln, akan, dan meter di tulis dengan ukuran yang lebih kecil disbanding dengan topik utama karena memiliki frekuensi kicauan yang lebih sedikit dibandingkan dengan topik utama begitu seterusnya sampai kata-kata yang ditulis dengan ukuran yang kecil. Akan tetapi pada tampilan word cloud terdapat lebih banyak topik yang divisualisasikan, karena pada kasus ini peneliti menetukan batas minimum frekuensi untuk sebuah topik agar muncul di visualisasi word cloud yakni sebanyak 10 kali kicauan lebih sedikit apabila dibandingkan pada grafik most popular terms sebelumnya. Dengan kata lain bahwa setiap topik yang dibicarakan atau dikicaukan bersamaan dengan topik banjir minimal sebanyak 10 kali maka akan divisualisasikan dalam word cloud tersebut.Apabila ingin melihat asosiasi atau hubungan antara topik utama yaitu banjir dengan topik lainnya yang dikicaukan secara bersamaan dapat dilihat pada table berikut.

Tabel 1. Asosiasi Topik Banjir dengan topik lainnya26 Januari 2014

Banjir

beberapa0.75

besar0.75

titik0.75

dki0.74

melanda0.74

pelanggan0.72

kwh0.70

meter0.70

akan0.65

sejak0.65

rendam0.63

jakarta0.62

pln0.53

ganti0.52

Pada asosiasi ini peneliti mengambil batas minimal nilai asosiasi sebesar 0,50 yang artinya bahwa kata-kata yang akan ditampilkan memiliki peluang kemunculan secara bersamaan dengan topik utama minimal memiliki frekuensi sebesar 50% yang tersusun dalam satu kalimat. Pada tabel di atas topik yang berasosiasi dengan kata banjir salah satunya adalah kata pln, apabila ingin melihat lebih dalam asosiasi kata pln dengan banjir dapat dilihat pada tabel berikut.Tabel 2. Asosiasi Topik Banjir dengan topik lainnya26 Januari 2014

pln

rendam0.93

akan0.86

ganti0.81

kwh0.81

meter0.78

pelanggan0.78

beberapa0.75

besar0.75

titik0.75

melanda0.73

Dari tabel di atas dapat diketahui bahwa ketika berbicara topik banjir kemudian berbicara terkait topik pln maka topik yang berasosiasi dengan topik pln yakni topik-topik yang mengarah pada rendam, akan, ganti, kwh, meter, pelanggan, beberapa, besar, titik, melanda. Topik yang lebih luas yang bias ditangkap yakni akibat terendam banjir, pln akan mengganti kwh meter pelanggan. Hal ini sesuai dengan topik yang sering dibahas oleh media-media elektronik yang memberitahukan bahwa banjir besar melanda DKI Jakarta, mengakibatkan beberapa titik macet. Hal ini bias dibuktikan dengan melihat tweet atau kicauan aslinya seperti gambar berikut.

Gambar 4. Penggalan data tweetDari berbagai dokumen atau topik yang ada dapat dibentuk menjadi beberapa klaster yang masing-masing klaster terdiri dari topik-topik yang saling terkait. Adapun klaster yang terbentuk dari kicauan terkait banjir dapat dilihat pada tabel berikut.Tabel 3. Klastering katacluster 1antisipasi banjir bencana ciliwung

cluster 2banjir korban hujan Jakarta

cluster 3pln ganti rendam banjir

cluster 4banjir beberapa besar dki

Berdasarkan tabel di atas terbentuk 4 klaster dengan menggunakan metode K-means clustering dengan hasil klaster 1 terdiri dari kata antisipasi, banjir, bencana, ciliwung. Klaster 2 terdiri dari kata banjir, korban, hujan, Jakarta. Klaster 3 terdiri dari kata pln, ganti, rendam, banjir dan yang terakhir klaster 4 terdiri dari kata banjir, beberapa, besar, dki. Sehingga dapat diperkirakan pernyataan-pernyataan yang dapat ditangkap dari setiap klaster yaitu seperti klaster 1 bahwa harus antisipasi terhadap bencana banjir dari sungai ciliwung, klaster 2 menyatakan banyak korban banjir akibat hujan yang terjadi di Jakarta, klaster 3 menyatakan akibat terendam banjir, pln akan mengganti kwh meter pelanggan dan klaster 4 menyatakan banjir besar melanda DKI Jakarta, mengakibatkan beberapa titik macet.

KESIMPULANAnalisis data mining dengan menggunakan metode asosiasi yang diaplikasikan pada topik terkait banjir dimana data diambil pada tanggal 26 januari 2014 dari jejaring sosial twitter menghasilkan beberapa kesimpulan bahwa keterkaitan atau asosiasi dari topik banjir menghasilkan hubungan dengan topik-topik yang lain seperti dki, melanda, Jakarta, pln, ganti, rendam, dan sebagainya dimana dari kata-kata yang memiliki keterkaitan tersebut dapat terbentuk menjadi 4 klaster dimana klaster 1 dapat diperkirakan menghasilkan pernyataan bahwa warga harus antisipasi terhadap bencana banjir dari sungai ciliwung, klaster 2 menghasilkan pernyataan banyak korban banjir akibat hujan yang terjadi di Jakarta, klaster 3 menghasilkan pernyataan banjir besar melanda DKI Jakarta, mengakibatkan beberapa titik macet. Klaster 4 menyatakan banjir besar melanda DKI Jakarta, mengakibatkan beberapa titik macet. Saran1. Dalam melakukan tahapan analisis untuk penulisan selanjutnya sebaiknya menambah perbendaharaan kata yang banyak dalam stop words agar diperoleh topik yang tepat.2. Dalam melakukan tahapan analisis twitter ditambah dengan membandingkan dengan teknik yang lain sehingga didapatkan hasil yang lebih baik.3. Menentukan tema yang tepat atau topik pembahasan yang terbaru.

DAFTAR PUSTAKAAbidin, Hasanudin. Z. (2008). Peranan Geodesi Satelit Dalam Memahami Dinamika Bumi Di Wilayah Indonesia. Bandung: Balai Pertemuan Ilmiah ITB.Aerts, J.; Bowman, M.; Dircke, P.; Major, D.; dan Marfai, M.A. 2009. Connecting Delta Cities, About Global Coastal Cities and Future Chalanges. VU University Press, Amsterdam, The Netherlands.Agusta, Yudi. (2007). K-Means-Penerapan, Permasalahan dan Metode Terkait. Bali: STIKOM.Blackett, P. dan Hume, T. 2007. Community Involvement in Coastal Hazard Mitigation: Some Insight into Process and Pitfalls. Paper disampaikan dalam seminar Politics of Planning Conference 2007. New Zealand Planning Institute.BNPB. (2012). Definisi dan Jenis Bencana. Opini. 9 Oktober 2012. http://www.bnpb.go.id/page/read/5/definisi-dan-jenis-bencana. Diakses 28 Januari 2014Claxton, Lena and Alison Woo. (2008). How to say it: Marketing with new media, USA, Prentice Hall Press.Davies, A. (2004). Finding Proof of Learning in a One-to-One Computing Classroom. Courtenay, BC: Connections Publishing.Evans, Dave. (2008). Social Media Marketing: An hour a day, Canada, Wiley Publishing, Inc.Hartanto. Robin. (2013). Fakta-fakta Banjir Jakarta. Opini. 21 Januari 2013. http://id.berita.yahoo.com/blogs/newsroom-blog/fakta-fakta-banjir-jakarta-040106137.html [3 Februari 2014]International Panel for Climate Change (IPCC). 2007. Climate Change 2007: The Physical Science Basis. Cambridge University Press, Cambridge.HumasLIPI. (2013). Banjir dan Longsor Bisa Diprediksi dan Diantisipasi. Diskusi Publik. 27 Maret 2013.http://www.fisika.lipi.go.id/in/?q=node/392853 [04 Februari 2014]Kopertis12. (2013). Penurunan Tanah Jakarta Beban yang Semakin Tinggi. Opini. 28 Januari 2013.http://www.kopertis12.or.id/2013/01/28/penurunan-tanah-jakarta-beban-yang-semakin-tinggi.html [4 Februari 2014]Kotler, Philip and Kevin Lane Keller. (2010). Marketing Management 13th Edition, New Jersey, USA. Prentice Hall.Kraas, F. 2007. Megacities and global change: key priorities. Geographical Journal, 173 (1), 79-82.Mardiatno, D. 2007. Kajian spasio-temporal kejadian bencana alam periode 1907-2006 di indonesia. Jurnal Kebencanaan Indonesia, 1(3), 151 - 160.Marfai, M.A. dan King, L. 2008a. Tidal inundation mapping under enhanced land subsidence in Semarang, Central Java Indonesia. Environmental Geology, 55, 1507-1518.Marfai, M.A.; King, L.; Sartohadi, J.; Sudrajat, S.; Budiani, S.R. dan Yulianto, F. 2008. The impact of tidal flooding on a coastal community in Semarang, Indonesia. Environmentalist, 28, 237-248.Marfai, M.A. 2011. The hazard of coastal erosion in Central Java Indonesia: an overview. GEOGRAFIA, Malaysia Journal of Society and Space, 7(3), 19.Maulida, Nurul. (2012). Proposal Penelitian twiiter sebagai sosial media bagi remaja. Opini. 23 Desember 2012.http://maulidanurul18.wordpress.com/2012/12/23/proposal-penelitian-twitter-sebagai-sosial-media-bagi-remaja/. Diakses 28 Januari 2014.Milanie, Dianita. (2010). Motif Mahasiswa Surabaya Dalam Menggunakan Situs Twitter di Internet. Surabaya: FISIP UPN VeteranMooney, Raymond J. (2006). Machine Learning Text Categorization. University of Texas at Austin.Nandonurhadi. (2013). Data Penelitian Mengenai Twitter Audiens Community di Industri Televisi Indonesia. Opini. 21 Februari 2013.http://nandonurhadi.wordpress.com/2013/02/21/data-penelitian-mengenai-twitter-dan-audiens-community-di-industry-televisi-di-indonesia/ [4 Februari 2014]PBC Information. (2013). Word Cloud Definition. Retrieved 01 27, 2014,from PBC Information:http://www.peachbelt.com/information/thePBCis/wordcloudPrabowo, Sigit. (2013). Makalah Data Mining. Jakarta: Fakultas Ilmu Komputer UPNPramudiana, Yudi dan Amira Dewiningtias. (2012). The Utilization of Twitter Social Media and Its Benefits Toward the Development of Audience Community in Indonesias TV Industry. Singapore: 2012 International Conference on Economics Marketing and Management IPEDR Vol.28 (2012)(2012) IACSIT Press.Pramudiono, I., (2007), Algoritma Apriori, http://datamining.japati.net/cgi-bin/indodm.cgi?bacaarsip&1172210143 [4 Februari 2014].Pramudiono, I. (2007). Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-datamining.zip [4 Februari 2014]Pratondo, B.J. (2002). Sistem Pengendalian Banjir di JABODETABEK.http://bebasbanjir2025.wordpress.com/10-makalah-tentang-banjir-2/bj-pratondo/. Diakses 28 Januari 2014Samputri, Riena. (2013). Contoh Proposal Penelitian Banjir di Jakarta. Opini. 4 Juni 2013.http://ryunana.blogspot.com/2013/06/contoh-proposal-penelitian-banjir-di.html [3 februaru 2014]Santosa Budi. 2007, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Graha Ilmu, YogyakartaSetiawan, Atje, Fathimah Fatihul, Rudi Rosadi. (2009). Asosiasi Data Mining Menggunakan Algoritma FP-Growth Untuk Market Basket Analysis. Bandung: FMIPA UNPAD. Ward P.J.; Marfai, M.A.; Yulianto F.; Hizbaron, D.R.; dan Aerts, J.C.J.H. 2010. Coastal inundation and damage exposure estimation: a case study for Jakarta. Natural Hazards, 56, 899-916.Wedhaswary, Inggried Dwi. (2014). Indonesia Darurat Bencana. Opini. 20 Januari 2014.http://nasional.kompas.com/read/2014/01/20/0713023/Indonesia.Darurat.Bencana. [04 Januari 2014]