Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta Pengembangan Model Pengelompokan Jenis Bencana Alam di Jawa Barat menggunakan Algoritma K-Means Panji Adi Pura1. Martanto2. Arif Rinaldi Dikananda3. Dede Rohman4 STMIK IKMI CIREBON1234 panjiadiepura69@gmail. com1 , martantomusijo@gmail. com2 , rinaldi21crb@gmail. dederohman17@gmail. Abstrak - Salah satu masalah terbesar yang dihadapi masyarakat Jawa Barat adalah bencana alam. Analisis berbasis data diperlukan untuk memahami pola kejadian bencana dan mendukung kebijakan mitigasi yang efektif karena berbagai jenis bencana. Untuk menganalisis data kejadian bencana di Jawa Barat selama periode 2020Ae2023, penelitian ini menggunakan pendekatan Knowledge Discovery in Databases (KDD). Tahapan KDD meliputi pembuatan dataset, preprocessing untuk normalisasi dan penanganan data hilang, serta transformasi guna menentukan atribut utama. Algoritma K-Means digunakan dalam proses data mining untuk mengelompokkan wilayah berdasarkan jenis bencana dan intensitasnya. Tahap terakhir adalah interpretasi hasil, yang bertujuan untuk memahami pola distribusi bencana. Hasil klasterisasi menghasilkan lima kluster utama. Cluster 0 menunjukkan dominasi kejadian banjir dan kebakaran lahan, sering ditemukan di dataran rendah dengan karakteristik lingkungan yang rawan pembakaran liar. Cluster 1 didominasi oleh kejadian tanah longsor di wilayah perbukitan yang curah hujannya tinggi. Cluster 2 mencerminkan kombinasi kejadian hujan angin dan kekeringan di daerah pedesaan dengan sumber daya air terbatas. Cluster 3 menunjukkan kejadian bencana dengan frekuensi rendah dan distribusi yang merata, seringkali terkait dengan daerah urban. Sementara itu. Cluster 4 memiliki tingkat heterogenitas tertinggi, mencakup berbagai jenis bencana dengan intensitas bervariasi di wilayah pegunungan dan lembah. Kualitas klasterisasi diukur menggunakan Davies-Bouldin Index (DBI) sebesar 0. 085, mengindikasikan pemisahan kluster yang baik. Selain itu, analisis Performance Vector menunjukkan jarak total antarkluster sebesar 2. 311, dengan jarak terbesar pada Cluster 4 . penelitian ini diharapkan dapat membantu dalam perencanaan dan alokasi sumber daya yang lebih tepat sasaran untuk mitigasi Kata Kunci: K-Means, bencana alam, agregasi, pengurangan bencana. Jawa Barat. Abstract - One of the biggest problems faced by the people of West Java is natural disasters. Databased analysis is necessary to understand disaster occurrence patterns and support effective mitigation policies due to various types of disasters. To analyze disaster occurrence data in West Java during the period 2020Ae2023, research uses the Knowledge Discovery in Databases (KDD) approach. The KDD stages include dataset creation, preprocessing for normalization and handling missing data, as well as transformation to determine key attributes. The K-Means algorithm is used in the data mining process to cluster regions based on the type and intensity of disasters. The final stage is result The clustering results in five main clusters. Cluster 0 shows a dominance of flood and land fire events, often found in lowland areas with environmental characteristics prone to wildfires. Cluster 1 is dominated by landslide events in hilly areas. Cluster 2 reflects a combination of wind and drought events in rural areas with limited water resources. Cluster 3 shows low-frequency disaster events with an even distribution, often related to urban areas. Meanwhile. Cluster 4 has the highest level of heterogeneity, encompassing various types of disasters with varying intensities in mountainous and valley regions. The quality of clustering is measured using the Davies-Bouldin Index (DBI) of 0. 085, indicating good cluster separation. Performance Vector analysis shows a total cluster distance of 2. 311, with the largest distance in Cluster 4. this research is expected to assist in more targeted planning and resource allocation for disaster mitigation. Keywords: K-Means, natural disasters, aggregation, disaster reduction. West Java. ISSN: 2338-9761 (Onlin. Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta PENDAHULUAN Indonesia memiliki tingkat kerawanan bencana yang sangat tinggi akibat kondisi geologis dan geografisnya yang unik. Hal ini menjadikan Indonesia sebagai salah satu negara yang paling rentan terhadap berbagai jenis bencana alam. Salah satu wilayah yang memiliki tingkat kerawanan tinggi adalah Jawa Barat, yang sering mengalami bencana seperti banjir, gempa bumi, tanah longsor, dan puting Kejadian bencana di wilayah ini tidak hanya menyebabkan kerugian materi yang signifikan tetapi juga ancaman serius terhadap keselamatan jiwa dan kerusakan sosialekonomi yang mendalam. Dalam menghadapi kondisi tersebut, mitigasi bencana berbasis data menjadi langkah yang sangat penting mengurangi risiko, serta memastikan respons cepat terhadap bencana yang terjadi (Rosaliyah & Nurhakim, 2. Seiring informasi, algoritma machine learning seperti KMeans telah terbukti memiliki potensi besar dalam membantu identifikasi pola risiko bencana melalui analisis data yang lebih Algoritma ini parameter tertentu, seperti jenis bencana, intensitasnya, dan karakteristik wilayah yang Menurut (Kusnadi & Putri, 2. menunjukkan bahwa penggunaan K-Means sangat efektif dalam mengidentifikasi daerah rawan bencana di Indonesia. Temuan mereka membuktikan bahwa metode ini dapat mendukung perencanaan mitigasi yang lebih tepat sasaran. (Halik & Septiana, 2. menunjukkan keberhasilan algoritma ini dalam memprediksi wilayah rawan bencana di Jawa Barat, menjadikan K-Means sebagai metode yang relevan dalam penanganan risiko bencana yang lebih efisien. Lebih lanjut, (Hermanto et al. , 2. menemukan bahwa K-Means dapat digunakan untuk mengelompokkan wilayah dengan risiko serupa, sehingga membantu otoritas lokal dalam menyusun strategi mitigasi yang lebih Studi yang dilakukan (Ramadhani et , 2. memanfaatkan metode clustering untuk memprediksi risiko gempa bumi di Pulau Jawa. Sementara itu, (Reviantika et al. , 2. menggunakan K-Means untuk menganalisis pola gempa di wilayah yang sama. Meskipun hasil penelitian ini cukup menjanjikan, kedua studi tersebut masih memiliki keterbatasan karena belum mempertimbangkan data dari jenis bencana lain, seperti banjir atau tanah longsor, yang sering terjadi secara bersamaan di wilayah Jawa Barat. Penelitian (Baldah et al. , 2. menggarisbawahi bahwa algoritma K-Means ISSN: 2338-9761 (Onlin. mampu memberikan hasil yang signifikan dalam mengidentifikasi daerah rawan bencana di tingkat provinsi, termasuk di Jawa Barat. Namun, mereka juga mencatat bahwa tantangan utama dalam penelitian ini adalah kurangnya integrasi data historis dan real-time, yang dapat mengurangi akurasi dalam prediksi risiko bencana. Keterbatasan ini juga ditekankan oleh (Agustina & Mulyawan, 2. yang menyoroti perlunya sistem klasifikasi yang lebih komprehensif untuk mengelompokkan wilayah berdasarkan risiko multi-bencana. Menurut (Pratama et al. , 2. algoritma KMeans memiliki potensi untuk mengatasi kesenjangan dalam pengelompokan wilayah rawan bencana. Dengan mempertimbangkan berbagai jenis bencana secara bersamaan. KMeans gambaran risiko yang lebih holistik. Penemuan ini sejalan dengan temuan (Halik & Septiana, yang menunjukkan efektivitas algoritma ini dalam memanfaatkan data historis untuk mendukung perencanaan mitigasi. Namun, pengembangan model yang lebih kompleks dengan mempertimbangkan data multi-bencana dan faktor lainnya, seperti perubahan iklim atau potensi bencana sekunder. Penelitian mengembangkan model clustering berbasis algoritma K-Means guna mengidentifikasi kluster wilayah rawan bencana di Jawa Barat. Model ini akan mencakup analisis terhadap berbagai jenis bencana, seperti banjir, gempa bumi, tanah longsor, dan puting beliung. Dengan pendekatan ini, penelitian diharapkan manajemen risiko bencana, peningkatan kesiapsiagaan masyarakat, dan penguatan kebijakan mitigasi berbasis data yang lebih Selain itu, hasil penelitian ini diharapkan menjadi dasar bagi pengembangan teknologi lebih lanjut dalam manajemen bencana, khususnya dengan memanfaatkan machine II. METODOLOGI PENELITIAN Metode Penelitian Dalam penelitian ini, metode analisis data Knowledge Discovery Database (KDD) Analisis data ini melibatkan langkah-langkah seperti pengumpulan data, pemilihan, transformasi, penambahan informasi yang relevan, pemodelan, evaluasi, dan interpretasi hasil. Metode ini memberikan dasar untuk mengidentifikasi pola dan gagasan yang dapat digunakan dalam proses pengambilan keputusan dan memperoleh pemahaman yang lebih baik tentang konteks data. Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta Sumber: (Maulana et al. , 2. Gambar 1. Proses Knowladge Discovery Database ( KDD ) . Data Selection Data bencana alam Kabupaten Cirebon dari lembaga penelitian mencakup informasi tentang Kabupaten. Jenis Bencana. Jumlah Kejadian, dan Tahun Kejadian. Ini adalah data komprehensif yang berasal dari sumber yang dapat dipercaya. Preprocessing Untuk mendukung analisis K-Means memperbaiki data yang hilang, melakukan normalisasi, dan mengubah formatnya. Transformation Menyediakan data untuk klasterisasi KMeans dengan mengidentifikasi karakteristik terkait dan menggunakan metrik jarak, seperti jarak geometri, untuk membandingkan dan mengelompokkan data berdasarkan kesamaan atau kedekatan antar data. Data Mining Menggunakan K-Means untuk mengumpulkan data bencana alam menggunakan analisis statistik dan visualisasi untuk mengevaluasi hasil klasterisasi data bencana alam untuk menemukan pola atau Proses mencakup analisis mendalam karakteristik setiap klaster untuk memberikan interpretasi yang signifikan tentang hasil klasterisasi. Knowledge Presentation Untuk menunjukkan hasil klasterisasi dengan jelas, buat laporan atau visualisasi yang terstruktur dan informatif. Temuan dan interpretasi disampaikan dalam berbagai format, seperti narasi, grafik, peta, atau tabel, sehingga lebih mudah dipahami dan membantu pengambilan keputusan. Sumber Data Data yang dikumpulkan dari Badan Penanggulangan Bencana Daerah (BPBD) Kabupaten Cirebon dikumpulkan melalui metode pengumpulan data sekunder dalam penelitian ini. Data yang digunakan mencakup tahun 2020Ae2023, memungkinkan analisis menyeluruh terhadap berbagai bencana selama tiga tahun tersebut. Dalam penelitian ini, 156 record peristiwa bencana dikumpulkan. Setiap ISSN: 2338-9761 (Onlin. catatan mengandung informasi lengkap, seperti waktu peristiwa, lokasi, dan data tambahan. Data ini memiliki delapan atribut yang menggambarkan berbagai elemen dan atribut bencana, termasuk jenis bencana dan lokasi Tujuan dari penelitian ini adalah untuk memberikan gambaran yang lebih mendalam tentang pola kejadian bencana di Kabupaten Cirebon selama periode tersebut melalui pengumpulan data yang terstruktur. Teknik Pengumpulan Data Data sekunder yang digunakan dalam studi dokumentasi adalah jumlah tingkat bencana alam berdasarkan lokasi kejadian. Data ini diperoleh dari Badan Penanggulangan Bencana Daerah (BPBD) Kabupaten Cirebon dan berisi jumlah kejadian bencana alam di Kabupaten Cirebon dari tahun 2020 hingga Data yang mencakup berbagai jenis bencana mencakup 156 record, yang akan dianalisis untuk memahami pola, efek, dan komponen yang berhubungan. Teknik Analisis Data Untuk melakukan proses clustering, terdapat beberapa tahapan yang harus diikuti, yaitu sebagai berikut: Menentukan berapa banyak kelompok . yang akan dibentuk. Langkah pertama adalah menentukan berapa banyak kelompok atau kelompok yang diinginkan, yang diwakili oleh nilai k. Jumlah cluster ini harus disesuaikan dengan tujuan analisis. Inisialisasi centroid secara acak. Setelah menetapkan nilai k, langkah selanjutnya adalah menginisialisasi posisi centroid secara acak. Centroid adalah titik pusat dari setiap cluster. Misalnya, jika kita memilih k = 3, maka akan ada tiga centroid yang ditandai sebagai C1. C2, dan C3, yang awalnya ditempatkan secara acak. Menentukan data point ke centroid Pada tahap ini, setiap data point akan dihitung jaraknya ke masingmasing centroid. Pengukuran jarak ini Euclidean distance untuk menentukan data point mana yang paling dekat dengan centroid tertentu, sehingga dapat dikelompokkan ke dalam cluster . Clusterkan setiap data berdasarkan jarak terdekatnya dengan centroid. Optimalisasi mengulangi langkah D dan E. Proses Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta Vol. 13 No. 1 - Tahun 2025 pengelompokan dan perhitungan ulang centroid akan dilakukan lagi dan lagi hingga pergerakan centroid berhenti atau hingga hasil yang diinginkan Tujuan dari proses ini adalah untuk meningkatkan ketepatan dan sesuai dengan standar yang telah i. HASIL DAN PEMBAHASAN Hasil Selection Proses ini melibatkan pemilihan dan seleksi data yang relevan tentang peristiwa Kemudian, dikelompokkan menjadi dataset yang akan digunakan dalam penelitian ini dengan menggunakan Rapidminer. Tabel 1. Dataset Bencana Alam 2020-2023 Kec. Arjawinangun Kec. Astanajapura Kec. Babakan Kec. Beber Kec. Ciledug Kec. Ciwaringin Kec. Depok Kec. Dukupuntang Kec. Gebang Kec. Gegesik Kec. Sedong Kec. Sumber Kec. Suranenggala ISSN: 2338-9761 (Onlin. Kec. Susukan Kec. Susukan Lebak Kec. Talun Kec. Tengahtani Kec. Waled Keterangan : : Nama Desa : Kebakaran Lahan : Banjir : Tanah Longsor : Kekeringan : Hujan dan Angin : Tahun Tabel 1 menunjukkan data yang dipilih dari dataset yang terdiri dari 156 record yang memiliki total 5 atribut. Data ini akan diolah Rapidminer penelitian ini. Preprocessing Sumber : Rosaliyah & Nurhakim . Gambar 2. Operator Read Excel. Select Attribut dan Set Role Gambar 2 menunjukkan antarmuka perangkat lunak menampilkan operator Read Excel. Select Attribute, dan Set Role untuk mempermudah impor dataset dari file Excel. Operator ini memungkinkan pengguna memuat data, memilih kolom relevan, dan mengatur peran atribut. Antarmuka dirancang dengan visualisasi jelas agar pengguna dapat memverifikasi dataset sebelum melanjutkan ke tahap analisis berikutnya. Sumber : Pratama & Yovi . Gambar 3. Data Static Missing Value Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta Setelah proses impor data selesai, nilai yang hilang dalam dataset ditampilkan secara statistik dalam Gambar 3. Langkah sebelum pengolahan menjadi penting untuk mendukung analisis yang lebih mendalam menggunakan algoritma K-Means. Tahap ini bertujuan mengidentifikasi dan menangani nilai yang hilang . issing valu. untuk meningkatkan kualitas data. Dengan membersihkan dataset, analisis dapat dilakukan menggunakan data yang bersih dan lengkap, memastikan hasil yang lebih akurat dan terpercaya. Nama Desa diberi peran sebagai Id untuk identitas unik, sementara atribut Tahun diberi peran sebagai Label untuk variabel target. Pengguna dapat menambah atau menghapus peran atribut menggunakan tombol Add Entry dan Remove Entry, lalu menyimpan pengaturan Apply. Pengaturan memastikan setiap atribut memiliki fungsi yang jelas sebelum proses analisis dilanjutkan. Transformation Sumber : Maulana & Ajay . Gambar 6. Perubahan Tipe Data Sumber : Halik & Septiana . Gambar 4. Tampilan Select Attribut Gambar pemilihan kolom data yang relevan untuk Terdapat dua bagian utama: Attributes di sebelah kiri yang berisi semua atribut dalam dataset, dan Selected Attributes di sebelah kanan yang menampilkan atribut yang telah Dalam contoh, atribut yang dipilih meliputi Banjir. Hujan dan Angin. Kebakaran Lahan. Kekeringan. Nama Desa. Tahun, dan Tanah Longsor. Proses ini bertujuan menyaring data agar hanya atribut penting yang digunakan, mempermudah langkah analisis Untuk menyimpan hasil seleksi, pengguna cukup mengklik tombol Apply. Gambar transformasi data, yang menunjukkan proses mengubah jenis data dari polynomial menjadi identifikasi dan perubahan nama atribut Transformasi ini adalah bagian penting dari pra-pemrosesan data untuk memastikan format data sesuai dengan kebutuhan analisis menggunakan algoritma K-Means. Dengan perubahan ini, data disusun dalam struktur yang lebih cocok, yang meningkatkan efisiensi dan akurasi proses clustering. Data Mining Sumber : Pratistha & Ragil Nike . Gambar 7. Operator K-Means Sumber : Hendrastuty & Nirwana . Gambar 5. Tampilan Set Role Gambar pengaturan peran atribut dalam dataset. Setiap atribut diberikan peran spesifik sesuai fungsinya dalam analisis. Misalnya, atribut ISSN: 2338-9761 (Onlin. Proses K-Means Clustering ditambahkan ke panel analisis, seperti yang ditunjukkan pada Gambar 7. Pengguna harus menentukan nilai K, yang berkisar antara 2 dan Mereka juga harus menetapkan batas maksimum run sebanyak 10. Selanjutnya, sebagai tipe pengukuran, dan jarak geometri Setelah mengatur parameter, respiration sistem. Proses clustering dimulai dengan mengklik tombol play. Algoritma Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta kemudian bekerja sesuai dengan parameter yang telah ditetapkan. Sumber: Penulis . Gambar 8. Operator Performance Distance Langkah berikutnya dalam analisis adalah menambahkan operator performance distance, seperti yang ditunjukkan pada Gambar 8. Operator ini digunakan untuk mengevaluasi kinerja model clustering yang telah dibangun, memungkinkan pengguna mengukur kualitas hasil dari algoritma KMeans. Dengan operator ini, analisis menjadi lebih mendalam, memberikan wawasan tentang efektivitas clustering dan distribusi data dalam setiap kluster. Intrepretation/Evaluation Gambar 10 Menunjukkan hasil data mining menggunakan algoritma K-Means, menghasilkan 5 cluster dari 156 record data yang dianalisis. Cluster 0 memiliki anggota terbanyak dengan 137 item, sedangkan Cluster 1 dan Cluster 2 masing-masing hanya memiliki 1 item. Cluster 3 berisi 2 item, dan Cluster 4 terdiri dari 15 item. Data yang di-cluster mencakup rentang tahun 2020 hingga 2023. Pembagian cluster ini mencerminkan pola dalam data, yang mungkin disebabkan oleh perbedaan karakteristik antarrecord dalam setiap cluster. Sumber : Kusnadi & Nahdi . Gambar 11. Hasil Perfomance Vector Berdasarkan Gambar Performance Vector sebesar 2. Untuk Cluster 0, jarak adalah 2. Cluster 1 dan Cluster 2 masing-masing 0. Cluster 3 550, dan Cluster 4 memiliki 4. Dengan temuan ini, nilai perhitungan DaviesBouldin Index (DBI) adalah 0. Sumber : Baldah & Azizah . Gambar 9. Hasil Intrepetation/Evaluation Gambar 9 menunjukkan hasil akhir dari proses data mining yang menggunakan algoritma K-Means. Proses ini berhasil menghasilkan lima kluster dari 156 rekord yang ada dalam dataset. Setiap kluster menunjukkan kelompok data yang memiliki kesamaan tertentu, yang memungkinkan pengguna memahami pola dan struktur yang tersembunyi dalam data. Hasil dari analisis ini membantu dalam pengambilan keputusan yang lebih baik karena mereka menjelaskan bagaimana data terdistribusi di antara kluster yang berbeda. Pembahasan Sumber : Rosaliyah & Nurhakim . Gambar 10. Hasil Cluster Model ISSN: 2338-9761 (Onlin. Sumber : Ramadhani & Devy Isya . Gambar 12 Scatter Plot Bencana Alam Gambar 12 menunjukkan bahwa dari tahun 2020-2023. Bencana alam yang paling umum adalah Kekeringan menempati posisi tertinggi dengan 85 kejadian di Kecamatan Sedong. Banjir berada di peringkat kedua setelah Kekeringan, dengan 20 kejadian di Kecamatan Waled. Selanjutnya, bencana Hujan dan Angin tercatat sebanyak 10 kejadian di Kecamatan Kedawung. Kebakaran Lahan termasuk kategori sedang, dengan 17 kejadian di Kecamatan Sumber. Sementara itu, bencana dengan jumlah kejadian paling sedikit adalah Tanah Longsor, hanya 1 kejadian di Kecamatan Depok. Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta Sumber : Reviantika & Ferin . Gambar 13. Cluster Model Visualizer Setelah proses clustering selesai, hasil Gambar menggunakan Cluster Model Visualizer, yang berperan dalam memvisualisasikan distribusi data di masing-masing cluster. Sumber : Virgo & Ismail . Gambar 14. Centroid Table Berdasarkan Centroid Table yang ditampilkan pada Gambar 4. 12, terdapat variasi nilai untuk setiap kategori bencana di masingmasing cluster. Pada kategori Kebakaran Lahan, nilai yang tercatat adalah 0. 248 untuk Cluster 0, 1 untuk Cluster 1, dan 17 untuk Cluster 2. Selanjutnya. Cluster 3 memiliki nilai 500, yang sama dengan nilai pada Cluster 3 lainnya, sementara Cluster 4 mencatat nilai 0. Untuk kategori Banjir. Cluster 0 mencatat nilai 0. 985, sedangkan baik Cluster 1 maupun Cluster 2 memiliki nilai 0. Pada Cluster 3, nilainya mencapai 1, sementara Cluster 4 menunjukkan angka tertinggi di antara semua cluster dengan nilai Pada kategori Tanah Longsor. Cluster 0 memiliki nilai 0. Baik Cluster 1 maupun Cluster 2 masing-masing mencatat nilai Sementara itu. Cluster 3 memiliki nilai 0, dan Cluster 4 menunjukkan nilai 0. Untuk kategori Kekeringan, nilai yang diperoleh cukup bervariasi. Cluster 0 memiliki nilai 0. diikuti oleh Cluster 1 dengan nilai yang jauh lebih tinggi, yaitu 85. Cluster 2 mencatat nilai 10, sementara Cluster 3 memiliki nilai signifikan Terakhir. Cluster 4 memiliki Pada kategori Hujan dan Angin, variasi nilai yang terlihat adalah 1. 314 untuk Cluster 0, dan 1 untuk Cluster 1. Kemudian. Cluster 2 memiliki nilai 6, sedangkan Cluster 3 mencatat Nilai untuk Cluster 4 tercatat ISSN: 2338-9761 (Onlin. Sumber : Chusyairi & Ahmad . Gambar 15. Record data 5 cluster Berdasarkan Gambar 15, penerapan algoritma K-Means pada 156 data record menghasilkan lima cluster dengan distribusi yang bervariasi. Cluster 0 mencakup 153 item, menjadikannya cluster terbesar, sementara Cluster 1 dan Cluster 2 masing-masing hanya memiliki 1 item. Cluster 3 terdiri dari 2 item, sedangkan Cluster 4 memiliki 15 item. Klasterisasi mempertimbangkan atribut bencana alam seperti Banjir. Tanah Longsor. Hujan dan Angin. Kekeringan, dan Kebakaran Lahan. Hasil klasterisasi menunjukkan bahwa kejadian Kekeringan paling dominan berada di Cluster 0, sedangkan Cluster 1 mencatatkan tingkat kejadian paling rendah. Pada kategori Banjir, kejadian tertinggi ditemukan di Cluster 0, sementara Cluster 4 memiliki tingkat kejadian yang lebih rendah. Kejadian Hujan dan Angin paling sering terjadi di Cluster 3, dengan tingkat kejadian paling rendah tercatat di Cluster 2. Untuk Tanah Longsor. Cluster 4 menunjukkan dominasi tertinggi, diikuti oleh tingkat sedang di Cluster 3, sedangkan kejadian paling sedikit tercatat di Cluster 1. Terakhir, kejadian Kebakaran Lahan paling banyak terjadi di Cluster 0, dan yang paling rendah terdapat di Cluster 1. Sumber : Maulana & Danar Dana . Gambar 16 Heatmap Gambar 16 menampilkan heatmap yang menunjukkan distribusi jenis bencana berdasarkan cluster hasil algoritma K-Means. Cluster 0, dengan 137 data titik, menunjukkan Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika : Jurnal Komputer Dan Informatika Universitas Bina Sarana Informatika Jakarta intensitas rendah untuk semua jenis bencana, menandakan wilayahnya relatif tidak rentan terhadap bencana tertentu. Sebaliknya. Cluster 1 dan Cluster 2, masing-masing hanya memiliki satu data titik, menunjukkan intensitas tinggi pada kategori tertentu, yaitu Kebakaran Lahan untuk Cluster 1 dan Kekeringan untuk Cluster 2, menandakan risiko spesifik terhadap bencana tersebut. Cluster 3, dengan dua data titik, juga memperlihatkan intensitas tinggi pada Kebakaran Lahan, serupa dengan Cluster 1. Sementara itu. Cluster 4, yang memiliki 15 data titik, menunjukkan intensitas tinggi pada Kekeringan, menandakan wilayahnya lebih rentan terhadap bencana tersebut. Pola distribusi ini membantu mengidentifikasi kerentanan bencana di wilayah Jawa Barat, memberikan wawasan tentang variasi risiko di setiap cluster dan jenis bencana tertentu. IV. KESIMPULAN Penelitian ini membuktikan bahwa K-Means mengelompokkan wilayah di Jawa Barat berdasarkan jenis dan intensitas bencana alam seperti banjir, kebakaran lahan, tanah longsor, kekeringan, dan hujan angin. Analisis data dari tahun 2020 hingga 2023 menghasilkan lima cluster dengan distribusi bencana yang Berdasarkan menggunakan Performance Vector, total jarak antar-cluster adalah 2. 311, yang mencerminkan Rincian jarak antar-cluster menunjukkan bahwa Cluster 0 memiliki jarak 098, mengindikasikan dominasi kejadian bencana di wilayah tersebut. Sementara itu. Cluster 1 dan Cluster 2 memiliki jarak 0. yang mencerminkan tingkat homogenitas data yang tinggi. Cluster 3 mencatatkan jarak 1. menunjukkan tingkat keberagaman sedang, sedangkan Cluster 4 memiliki jarak tertinggi heterogenitas paling tinggi di antara semua Dari analisis ini, diperoleh nilai DaviesBouldin Index (DBI) sebesar 0. 085, yang menunjukkan kualitas klasterisasi yang cukup baik, dengan pemisahan antar-cluster yang jelas dan tingkat kekompakan internal yang REFERENSI