Volume 19 Nomor 2 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
KOMPARASI ALGORITMA K-MEANS DENGAN K-MEDOIDS DALAM
KLASTERISASI WILAYAH RAWAN BENCANA DI KABUPATEN
SITUBONDO
Ganang Aji Pambudhi.
Ahmad Homaidi.
Firman Santoso.
1,2,.
Jurusan Teknologi Informasi.
Fakultas Sains dan Teknologi.
Universitas Ibrahimy Jl.
KHR.
Syamsul Arifin No.
Sukorejo.
Situbondo 68374.
Jawa Timur.
Indonesia E-mail : .
ganankaji@gmail.
com, .
ahmadhomaidi@ibrahimy.
firman4bi@gmail.
ABSTRAK
Data dari Badan Penanggulangan Bencana Daerah Kabupaten Situbondo menunjukkan bahwa banyak bencana terjadi di Kabupaten Situbondo, baik yang disebabkan oleh alam maupun non-alam.
Pemerintah dapat menentukan prioritas penanggulangan bencana dengan menggunakan hasil dari pembagian wilayah berdasarkan tingkat kerawanan bencana.
Dengan menetapkan prioritas, sumber daya yang terbatas dapat dialokasikan ke wilayah yang paling membutuhkan.
Dengan menggunakan pemodelan clustering, proses data mining dapat menggunakan data kejadian bencana untuk mengelompokkan daerah yang rawan bencana.
Tujuan dari penelitian ini adalah untuk membandingkan pemodelan clustering daerah rawan bencana menggunakan algoritma K-Means dan K-Medoids, yang didasarkan pada data kejadian bencana dari tahun 2019 hingga 2023.
Penelitian ini dilakukan dengan melihat hasil cluster dari kedua algoritma ini, menggunakan dataset yang sama dan jumlah cluster yang sama, yaitu tiga cluster.
Hasil penelitian menunjukkan bahwa algoritma K-Means memiliki nilai indeks Davies-Bouldin (DBI) yang lebih baik .
daripada K-Medoids .
Hasil ini menunjukkan bahwa algoritma K-Means lebih efektif dalam mengelompokkan daerah Kabupaten Situbondo yang rawan bencana berdasarkan data kejadian bencana.
Kata kunci : Bencana.
Data Mining.
K-Means.
K-Medoids.
Clustering.
Davies-Bouldin Index
ABSTRACT
Regional Disaster Management AgencyAos data reported that many disaster events happened in Situbondo Regency, both caused by natural and non-natural factors.
The government can determine priorities in disaster management by utilizing the results of grouping regions based on disaster vulnerability.
Level.
Setting priorities allows limited resources to be allocated to areas of greatest need.
The data mining process can use disaster event data to group disaster-prone areas by using clustering modeling.
Therefore, this research aims to compare the clustering modeling of disaster-prone areas using the K-Means and K-Medoids algorithms based on disaster event data from 2019 to 2023.
This research was carried out by looking at the cluster results of these two algorithms, using the same dataset and number of clusters, namely three clusters.
The research results showed that the K-Means algorithm had a better Davies-Bouldin index (DBI) value .
than K-Medoids .
These results indicated that the K-Means algorithm was more effective in classifying disaster-prone areas of Situbondo Regency based on disaster event data.
Keywords: Disaster.
Data Mining.
K-Means.
K-Medoids.
Clustering.
Davies-Bouldin Index
PENDAHULUAN
1 Latar Belakang Penelitian Kabupaten Situbondo adalah salah satu daerah di Jawa Timur yang berpotensi untuk terjadi Kabupaten Situbondo terdiri dari tujuh belas , dimana masing-masing kecamatan memiliki karakteristik geografis yang berbeda-beda.
Bagian utara wilayah kabupaten situbondo merupakan perairan yang berbatasan langsung dengan selat madura.
Tidak hanya garis Pantai yang membentang dari ujung barat sampai ujung timur, pada bagian selatan juga terdapat Kawasan pegunungan atau dataran tinggi.
Tercatat banyak kerugian harta benda dan korban terdampak bencanayang diakibatkan oleh berbagai bencana alam dan non-alam.
Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
173-179 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Sesuai dengan Undang-Undang Nomor 24 tahun 2007, upaya penanggulangan bencana membutuhkan perencanaan yang matang, terarah, dan Undang-undang tersebut mendefinisikan penyelenggaraan penanggulangan bencana sebagai serangkaian tindakan yang mencakup kebijakan terkait pembangunan yang dapat menyebabkan bencana, pencegahan bencana, tindakan darurat, dan rehabilitasi .
Beragamnya jenis bencana di Kabupaten Situbondo menjadi tantangan tersendiri untuk dapat menciptakan inovasi serta strategi mitigasi bencana.
Data dan informasi kebencanaan akan bermanfaat dalam perencanaan strategis penanggulanan bencana sehingga dapat dijadikan bahan untuk menetapkan kebijakan.
Data mining merupakan proses untuk mengidentifikasi pola dan pengetahuan berharga dari data yang ada.
Data dan informasi perlu diolah menjadi pengetahuan sehingga dapat di analisis lebih lanjut serta menambah nilai manfat dari suatu data.
Dengan mempertimbangkan karakteristik data kejadian bencana yang diperoleh dari Badan Penanggulangan Bencana Daerah Kabupaten Situbondo, metode data mining yang digunakan adalah clustering menggunakan algoritma K-Means dan K-Medoids.
Daerah rawan bencana yang ada di Kabupaten Situbondo akan dikelompokkan dengan metode ini.
Penelitian ini diharapkan dapat membantu pihak terkait merumuskan kebijakan untuk mengurangi risiko bencana dengan menggunakan algoritma K-Means dan K-Medoids.
Selain menerapakan proses data mining tujuan dari penelitian ini juga untuk membandingkan algoritma yang paling optimal untuk menghasilkan klaster atau kelompok wilayah rawan bencana.
Melalui penelitian ini diharpakan dapat meningkatkan kewaspadaan dan kesiapsiagaan terhadap bencana.
2 Tinjauan Penelitian Nanda dan rekan-rekannya dalam jurnal "MALCOM: Indonesian Journal of Machine Learning and Computer Science" melakukan penelitian untuk membandingkan penggunaan algoritma K-Means dan K-Medoids dalam pengelompokan data kemisikinan.
Penelitian ini menunjukkan bahwa algoritma K-Means lebih efektif dalam pengelompokan dibandingkan K-Medoids.
Mereka menemukan bahwa dengan Davies Bouldin Index (DBI) sebesar 0,041, pengelompokan terbaik terjadi saat k=8 untuk K-Means, sementara KMedoids mencapai hasil terbaik saat k=2 dengan DBI 0,52 .
Penelitian selanjutnya juga dilakukan oleh Mala Nafilah.
Nining Rahaningsih.
Raditya Danar Dana dalam jurnal AyJATI .
urnal Mahasiswa dan Teknik Informatik.
Ay dengan tujuan untuk membandingkan pengelompokan produk pertanian menggunakan algoritma K-Means dan K-medoids.
Berdasarkan hasil perbandingan antara K-Means dan K-Medoids, ditemukan bahwa K-Means mencapai nilai DBI sebesar 0,368 dengan pembagian data menjadi 3 klaster, sedangkan K-Medoids mencapai nilai DBI sebesar 0,706 dengan pembagian data menjadi 8 klaster.
Melihat hasil percobaan, dapat disimpulkan bahwa nilai optimal untuk K-Means adalah 0,368 dengan pengelompokan menjadi 3 klaster .
Kecocokan dan relevansi topik dengan perbandingan algoritma pengelompokan daerah rawan bencana K-Means dan K-Medoids ditunjukkan oleh kedua penelitian.
Adapun hal penting yang disampaikan oleh kedua penelitian tersebut adalah terkait pemilihan algoritma menjadi sangat penting dalam memperoleh hasil data mining berupa cluster.
Penentuan daerah rawan bencana pemilihan algoritma yang tepat sesuai dengan karakteristik dataset diharapkan dapat mengahsilkan pengelompokan daerah rawan bencana berdasarkan 3 tingkat kerawanan yaitu rendah, sedang, dan tinggi.
Hasil dari kedua penelitian yang sudah dilakukan sebelumnya menjadi dasar untuk melakukan penelitian yang hampir sama dengan dataset yang berbeda.
3 Landasan Teori Data Mining Data mining adalah gabungan yang terpadu antara pengetahuan bisnis dan analisis statistik yang diperoleh dari data.
Proses ini menggunakan berbagai teknik seperti statistik, matematika, kecerdasan buatan, simulasi, dan machine mengidentifikasi informasi yang relevan dari berbagai basis data yang berskala besar.
Salah satu tujuan dari data mining adalah mengelompokan atau klasterisasi data ke dalam segmen-segmen yang lebih kecil berdasarkan karakteristik tertentu dan lebih homogen.
Clustering Merupakan metode pengelompokan data yang bertujuan untuk menmpatkan data, pengamatan, atau kelompok ke dalam kelas- kelas.
Penggunaan Pemodelan clustering dapat diterapkan pada dataset yang tidak memiliki label atau klasifikasi .
K-Means Penerapan algoritma K-Means adalah salah satu teknik yang bisa dipakai untuk melakukan pengelompokan data.
K-Means membagi data ke Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
173-179 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika dalam satu atau lebih kelompok berdasarkan kesamaan karakteristik.
Algoritma K-Means bekerja dengan cara mengelompokkan data ke dalam K cluster berdasarkan kedekatan atau jarak antara titik data dan centroid.
Nilai rata-rata digunakan sebagai pusat cluster .
K-Medoids K-Medoids adalah sebuah algoritma yang mirip dengan K-Means, namun menggunakan titik-titik data aktual .
sebagai representasi dari setiap cluster, bukan centroid seperti pada KMeans.
Algoritma K-Medoids menghasilkan model klaster dengan cara memilih objek sebagai representasi pusat klaster untuk masing-masing klaster.
METODE PENELITIAN
Dalam penelitian yang berkaitan dengan pengelompokan daerah bencana, model teknik analisis data CRISP-DM (Cross-Industry Standard Process for Data Minin.
dapat digunakan, dimana model ini masih digunakan secara luas dalam bidang data mining.
Model proses data mining CRISP-DM diawali dengan penentuan permasalahan .
, adapun topik permasalahan yang ingin diteliti adalah data kejadian bencana yang masih belum dimanfaatkan secara maksimal menjadi suatu pengetahuan serta menambah nilai manfaat data itu sendiri.
Proses CRISP-DM terdiri dari enam tahapan: pemahaman bisnis, pemahaman data, mempersiapkan data, modeling, evaluasi, dan penerapan.
, yang kemudian dapat dijelasakan melalui gambar berikut.
mengidentifikasi tujuan bisnis serta permasalahan yang ingin diselesaikan dengan menggunakan data mining.
Tahap ini akan menghasilkan rencana awal untuk mencapai tujuan bisnis.
Data Understanding Tahapan pemahaman data dimulai setelah tujuan bisnis telah ditentukan.
Tujuan dari tahapan ini adalah untuk mengumpulkan data yang relevan dengan tujuan bisnis.
Data yang terkumpul kemudian di eksplorasi untuk lebih memahami karakteristik suatu data sehingga dapat ditindak Data Preparation Tahapan ini berisi kegiatan terkait persiapan data mentah sampai akhirnya siap untuk dijadikan Adapun cara untuk mdapatkan dataset yang siap untuk dijadikan pemodelan dapat dilakukan pembersihan data, transformasi data, dan mereduksi data.
Modeling Beberapa kegiatan yang dilaksanakan pada tahap ini meliputi pemilihan dan penerapan teknik permodelan sesuai dengan karakterisktik dataset.
Selain itu pada tahapan ini juga dilakukan pemilihan algoritma sesuai dengan jenis pemodelan data mining yang digunakan.
Evaluation Tujuan dari tahapan ini untuk mengevaluasi hasil pemodelan berupa model data mining salah satunya adalah klaster.
Tujuan yang ditetapkan pada tahapan Kegiatan Bisnis Understanding akan dapat dilihat tingkat keberhasilannya pada tahap ini.
Selain itu juga dilakukan pengujian terhadap performansi dari model yang dihasilkan.
Deployment Setelah mendapatkan kesimpulan mengenai hasil penggunaan data mining, maka selanjutnya adalah melakukan dokumentasi terhadap hasil penelitian sehingga penerapan data mining dapat dimanfaatkan untuk berbagai bidang.
HASIL DAN DISKUSI
1 Bisnis Understanding Gambar 1.
Tahapan CRISP-DM Berikut adalah penjabaran dari tahapan menggunakan metodologi CRISP-DM :
Bisnis Understanding Pemahaman bisnis merupakan tahapan pertama dalam CRISP-DM, dimana peneliti terlebih dahulu memahami objek penelitian.
Pengetahuan terkait objek penelitian dibutuhkan untuk Badan Penanggulangan Bencana Daerah Kabupaten Situbondo adalah unit kerja di lingkungan pemerintah kabupaten situbondo yang memiliki tugas dan fungsi utama untuk melaksanakan semua aspek terhadap usaha penanggulangan bencana yang mencakup pencegahan bencana, penanganan darurat, rehabilitasi, dan rekonstruksi.
Pergeseran paradigma penanggulangan bencana yang cenderung bersifat reaktif, dimana fokus penanggulangan bencana berada pada fase darurat bergeser menuju pendekatan Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
173-179 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika yang bersifat preventif yaitu mitigasi bencana.
Dalam penanggulangan bencana.
Badan Penanggulangan Bencana Daerah Kabupaten Situbondo menghadapi masalah karena sumber daya yang terbatas, terutama dalam hal anggaran.
Mempertimbangkan adanya keterbatasan tersebut maka diperlukan penentuan prioritas daerah atau wilayah rawan bencana di Kabupaten Situbondo yang terdiri dari 17 Kecamatan.
Berdasarkan permasalahan tersebut maka klasterisasi dapat bermanfaat untuk mengelompokan daerah rawan bencana, dimana kelompok atau klaster daerah rawan bencana tersebut dapat menjadi pengetahuan untuk menentukan prioritas penanggulangan bencana yang efektif dan efisien.
i: Erupsi Gunung Api j: Kebakaran gedung dan pemukiman k: Gagal Teknologi l: Konflik Sosial Selain itu juga dilakukan pemisahan data kecamatan untuk mengorganisasi data dan menghindari redundansi, sehingga terdapat tabel tambahan berupa data kecamatan.
Berikut adalah tabel tabel kecamatan Tabel 2.
Data Kecamatan Nama Kecamatan 2 Data Understanding Data Kebencanaan yang relevan dalam menentukan daerah rawan bencana adalah data Penelitian menggunakan data kejadian bencana kabupaten Situbondo dari tahun 2019 hingga 2023.
Adapun data yang termuat antara lain nama kecamatan, jumlah kejadian, jenis bencana, serta tahun dengan jumlah 204 baris.
Sebagian besar data yang disajikan bertipe numerik serta tidak ada yang menunjukan kategorisasi dan klasifikasi.
Data mentah tersebut masih belum dapat menyajikan informasi yang jelas terkait jumlah kejadian bencana berdasarkan wilayah yaitu kecamatan termasuk jenis bencana.
Oleh karena itu dibuat tabel baru yang berisi rekapitulasi jumlah data kejadian bencana pada tahun 2019 sampai dengan tahun 2023 berdasarkan wilayah kecamatan dan jenis bencana.
Berikut adalah tabel rekapitulasi kejadian bencana :
Tabel 1.
Rekapitulasi Kejadian Bencana Nama Kecamatan Situbondo Panji Kapongan *keterangan atribut a: Banjir b: Tanah Longsor c: Gelombang pasang dan Abrasi d: cuaca ekstrem e: kekeringan f: Kebakaran hutan dan lahan g: Gempabumi h: Tsunami Situbondo Panji Kapongan 3 Data Preparation Pada tahapan ini dilakukan proses perbaikan dan peneysuaian terhadap data awal sampai siap untuk dijadikan dataset.
Adapun proses pertama yang dilakukan adalah melakukan relasi antara tabel kecamatan dengan tabel rekapitulasi kejadian Selanjutnya melakukan seleksi terhadap atribut, dari total 14 atribut menjadi 13 atribut.
Sehingga di peroleh dataset sesuai tabel berikut :
Tabel 3.
Dataset Berikut adalah penjelasan terhadap masing-masing atribut yang pada dataset :
Atribut Tabel 4.
Penjelasan Atriibut Deskripsi Tipe Data Nilai numerik untuk kode kecamatan Nilai numerik yang berisi jumlah kejadian bencana banjir Nilai numerik yang berisi jumlah kejadian tanah longsor Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
173-179 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Atribut Tipe Data Deskripsi Nilai numerik yang berisi jumlah kejadian gelombang pasang dan Nilai numerik yang berisi jumlah kejadian cuaca ekstrem Nilai numerik yang berisi jumlah kejadian Nilai numerik yang berisi jumlah kejadian kebakaran hutan dan Nilai numerik yang berisi jumlah kejadian gempa bumi Nilai numerik yang berisi jumlah kejadian Nilai numerik yang berisi jumlah kejadian erupsi gunung api Nilai numerik yang berisi jumlah kejadian kebakaran gedung dan Nilai numerik yang berisi jumlah kejadian gagal teknologi Nilai numerik yang berisi jumlah kejadian konflik sosial 4 Modeling Pada tahapan ini dilakukan pemodelan menghasilkan model berupa klaster.
Dalam menghasilkan model berupa klaster, algoritma KMeans dan K-Medoids digunakan bersama dengan alat data mining seperti RapidMiner.
Peneliti menetapkan jumlah klaster atau nilai k sebanyak 3 Peneliti menggunakan aplikasi RapidMiner untuk membantu proses data mining.
Skema percobaan pertama adalah dengan melakukan pemodelan menggunakan algoritma KMeans.
Langkah awal yang dilakukan adalah dengan menetapkan angka klaster, yaitu jumlah klaster yang ingin dihasilkan.
Sebagaimana jumlah nilai klaster yang sudah ditetapkan oleh peneliti yaitu 3 klaster.
Tentu saja Hasil pemodelan menunjukkan adanya 3 klaster, dengan klaster 0 memiliki 10 item, klaster 1 memiliki 3 item, dan klaster 2 memiliki 4 item.
Hasil model cluster terhadap dataset dapat dilihat pada tabel Tabel 5.
Klaster Algoritma K-Means Klaster 0 Klaster 1 Klaster 2 Berdasarkan tabel diatas dapat disimpulkan Penggunaan K-Means mengelompokan wilayah rawan bencana berdasarkan jumlah kejadian per jenis bencana menghasilkan klaster tingkat rendah .
yaitu kecamatan situbondo, panji, mangaran, jangkar, besuki, jatibanteng, bungatan, banyuglugur, asembagus, dan Kemudian klaster tingkat sedang .
berada di kecamatan banyuputih, panarukan, dan Klaster tingkat tinggi .
berada di kecamatan arjasa, mlandingan, suboh, dan Algoritma K-Medoids akan digunakan pada skema percobaan pemodelan data mining selanjutnya, dan algoritma ini juga dapat membantu dalam Dataset dan jumlah klaster yang ditentukan sama dengan jumlah percobaan sebelumnya yaitu 3 klaster.
Tiga klaster yang dibuat dengan pemodelan adalah klaster 0 dengan sebelas item, klaster 1 dengan empat item, dan klaster 2 dengan dua item.
Tabel berikut menunjukkan hasil penggunaan algoritma tersebut.
Tabel 6.
Klaster Algoritma K-Medoids Klaster 0 Klaster 1 Klaster 2 Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
173-179 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Klaster 0 Klaster 1 Klaster 2 Gambar 3.
Hasil Pengujian DBI K-Medoids Perbadingan terhadap hasil pengujian kedua algoritma tersebut dapat dilihat pada tabel berikut :
Tabel 7.
Hasil Perbandingan Algoritma Pemodelan Clustering Algoritma Jumlah k Nilai DBI K-Means K-Medoids Berdasarkan hasil sebaran klaster di setiap data maka wilayah yang termasuk tingkat rendah .
meliputi kecamatan situbondo, panji, mangaran, jangkar, arjasa, besuki, mlandingan, jatibanteng, banyuglugur, asembagus, dan kapongan.
Selanjunya untuk wilayah yang berada di tingkat sedang .
meliputi kecamatan banyuputih, panarukan, kendit, dan bungatan.
Wilayah dengan tingkat tinggi .
berada di wilayah sumber malang dan suboh.
Hasil perbandingan menunjukkan bahwa nilai DBI yang diperoleh dari clustering dengan algoritma KMeans lebih unggul dibandingkan dengan nilai DBI yang diperoleh dari clustering dengan K-Medoids.
Hal ini terlihat dari nilai DBI algoritma K-Means yang lebih rendah yaitu 0,853 untuk jumlah cluster dan dataset yang sama.
5 Evaluation 6 Deployment Setelah percobaan pemodelan clustering telah dilaksanakan maka tahapan selanjutnya adalah mengevaluasi hasil klaster yang didapatkan.
Evaluasi dilakukan dengan cara membandingkan penggunaan algoritma K-means dengan algoritma K-Medoids.
Sebelum membandingkan kedua algoritma tersebut terlebih dahulu mengecek kinerja 3 klaster terhadap masing-masing algoritma menggunakan DaviesBouldin index (DBI).
Pengujian DBI masing-masing masing algoritma dilakukan menggunakan aplikasi RapidMiner dengan memasukan operator cluster distance performance.
Berikut tampilan hasil pengujian terhadap algoritma K-Means :
Setelah melakukan evaluasi terhadap hasil analisis data mining yaitu klaster, maka selanjutnya adalah memperkenalkan model atau hasil analisis tersebut melalui penyusunan laporan dan Laporan hasil analis diharapkan dapat membantu dalam pengambilan keputusan dalam aspek kebencanaan.
Gambar 2.
Hasil Pengujian DBI K-Means Pengujian terhadap algoritma K-Medoids dapat dilihat pada gambar berikut :
KESIMPULAN DAN SARAN
Pengelompokan daerah rawan bencana sangat penting untuk membantu pihak berwenang dalam menentukan prioritas penanggulangan bencana, merencanakan strategi mitigasi, dan meningkatkan kesadaran masyarakat terhadap risiko bencana.
Berdasarkan nilai Davies-Bouldin Index (DBI), algoritma K-Means mengungguli K-Medoids dalam klasifikasi wilayah rawan bencana.
Temuan pengelompokan ini dapat digunakan untuk memperbaiki kebijakan dan prosedur mitigasi masyarakat di daerah rawan bencana.
Studi ini dapat menjadi landasan bagi penelitian selanjutnya mengenai algoritma atau metode tambahan yang dapat digabungkan sehingga dapat meningkatkan Diterima Redaksi :24 Juli 2024 | Selesai Revisi : 23 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
presisi dan efisiensi pengelompokan daerah rawan
DAFTAR PUSTAKA