BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Perbandingan Algoritma K-Means Dan K-Medoids Dalam Pengelompokkan Tingkat Kebahagiaan Provinsi Di Indonesia Citra Fathia Palembang1*. Muhammad Yahya Matdoan2. Septianti Permatasari Palembang3 1Fakultas Matematika dan Ilmu Pengetahuan Alam. Ilmu Komputer. Universitas Pattimura. Kota Ambon. Indonesia 2Fakultas Matematika dan Ilmu Pengetahuan Alam. Statistika. Universitas Pattimura. Kota Ambon. Indonesia 3Fakultas Pertanian. Agribisnis. Universitas Pattimura. Kota Ambon. Indonesia Email: 1fpchiet@gmail. com , 2keepyahya@gmail. com , 3Septiantipermatasari@gmail. (* : coressponding autho. AbstrakOeSaat ini yang terjadi, indikator keberhasilan pembangunan suatu wilayah masih ditentukan oleh sebatas faktor pertumbuhan ekonomi dan kemiskinan, padahal pengukuran dari segi ekonomi yang dicapai saja tidak tepat, pertumbuhan ekonomi yang tinggi tidak selalu menjanjikan kepuasan masyarakat, karena bisa saja timbulnya kesenjangan diantara masyarakat. maka yang harus lebih diperhatikan adalah pertumbuhan ekonomi yang bisa membahagiakan masyarakat tanpa adanya kesenjangan. Kebahagiaan penduduk suatu wilayah akan berpengaruh terhadap keberhasilan pembangunan dan perkembangan sosial di masyarakat. Kebahagiaan dapat digunakan sebagai salah satu ukuran yang dapat menggambarkan kesejahteraan yang dicapai oleh setiap individu. Pada penelitian dilakukan pengukuran dan pengelompokkan provinsi mana saja yang masuk ke dalam kelompok provinsi terbahagia dan kurang bahagia di indonesia dengan 3 vaiabel. kepuasa, perasaan dan makna hidup, menggunakan perbandingan algoritma k-Means dan k-Medoids kemudian diuji menggunakan aplikasi RapidMiner Studio. Berdasarkan nilai validitas DBI k-Medoids sebesar 0,648 lebih kecil daripada nilai validitas DBI k-Means 7,52. Menghasilkan 2 cluster yaitu cluster 0 . luster provinsi kurang bahagi. dan cluster 1 adalah cluster provinsi terbahagia Kata Kunci: Indeks. Cluster. Algoritma. K-Means. K-Medoids AbstractOe Currently what is happening, indicators of the success of a region's development are still determined by the factors of economic growth and poverty, even though the measurement in terms of the economics achieved is not accurate, high economic growth does not always promise community satisfaction, because there may be gaps between communities. then what must be paid more attention is economic growth that can make people happy without any gaps. The happiness of the residents of an area will affect the success of development and social development in the community. Happiness can be used as a measure that can describe the welfare achieved by each individual. In the study, measurements and groupings of which provinces were included in the happiest and less happy provinces in Indonesia were carried out with 3 variables. index of satisfaction, feelings and meaning of life, using the comparison algorithm k-Means and k-Medoids then tested using the RapidMiner Studio application. Based on the DBI k-Medoids validity value of 0. 648, it is smaller than the DBI k-Means validity value of 7. Produces 2 clusters, namely cluster 0 . he province cluster is less happ. and cluster 1 is the happiest province cluster Keywords: Index. Cluster. Algorithm. K-Means. K-Medoids PENDAHULUAN Kebahagiaan digunakan sebagai salah satu ukuran yang dapat menggambarkan kesejahteraan yang dicapai oleh setiap individu(BPS 2. Berbagai faktor yang dapat mempengaruhi kebahagiaan manusia, yaitu faktor demografi dan faktor ekonomi. Faktor demografi terdiri dari variabel umur, kesehatan, pendidikan, pernikahan dan jenis kelamin, sementara faktor ekonomi, pendapatan masih menjadi penentu utama kebahagiaan seseorang (Aryogi 2. Seiring bertambah usia, maka tingkat kebahagiaan seseorang juga akan meningkat, tetapi hanya terjadi sampai pada titik tertentu. Setelah melalui titik tersebut, pertambahan umur akan diikuti dengan penurunan kebahagiaan seseorang (T. Rahayu 2. , pernyataan tersebut dilengkapi oleh Easterlin, bahwa adanya penurunan kebahagiaan individu setelah usia 51 tahun disebabkan oleh kondisi kesehatan yang cenderung menurun dan adanya ekspektasi terhadap mortalitas . (Aryogi 2. Sementara itu, pendidikan yang baik yang diperoleh dari berbagai macam ilmu memiliki pengaruh besar terhadap diri seseorang dalam memberikan respon positif bagi diri sendiri dan pengaruhnya terhadap orang lain sehingga menjadi salah satu faktor yang dapat mempengaruhi kebahagiaan di kehidupan bermasyarakat. Pernikahan dapat membuat Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 830 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 hidup seseorang lebih lama, menjadi lebih sehat dan bahagia, baik laki-laki maupun perempuan memperoleh manfaat dari pernikahan, meskipun pakar menemukan bahwa laki-laki akan mendapat keuntungan yang lebih dari perempuan. Keuntungan tersebut bukan hanya orang yang menikah lebih sedikit terpapar perilaku yang beresiko, namun kualitas pernikahan dan kepercayaan juga mempengaruhi besar kecilnya keuntungan yang diterima (Fatimah and Nuqul 2. Selain berbagai faktor yang telah dijelaskan, seseorang dengan tingkat pendapatan yang lebih tinggi akan memiliki kemampuan yang lebih besar untuk memperoleh barang dan jasa serta akan memperoleh status sosial yang lebih tinggi (Setyo. Bambang. , hal ini akan memberikan kepuasan dan membuat diri menjadi lebih bahagia. Saat ini yang terjadi, indikator keberhasilan pembangunan suatu wilayah masih ditentukan oleh sebatas faktor pertumbuhan ekonomi dan kemiskinan, padahal pengukuran dari segi ekonomi yang dicapai saja tidak tepat, pertumbuhan ekonomi yang tinggi tidak selalu menjanjikan kepuasan masyarakat, karena bisa saja timbulnya kesenjangan diantara masyarakat. maka yang harus lebih diperhatikan adalah pertumbuhan ekonomi yang bisa membahagiakan masyarakat tanpa adanya Kebahagiaan penduduk suatu wilayah akan berpengaruh terhadap keberhasilan pembangunan dan perkembangan sosial di masyarakat (Pamungkas 2. Penelitian sebelumnya dilakukan oleh uci,dkk menggunakan algoritma k-Means clustering dalam menganalisis kasus perceraian pada pengadilan negeri bekasi dengan bantuan aplikasi RapidMiner dan memperoleh cluster yang optimal sebanyak 2 dengan Davies Bouldin Index (DBI) sebesar 0,766 berdasarkan data tahun 2017-2020 pada kota bekasi memiliki kecenderungan pola perceraian terhadap lama usia pernikahan(U. Rahayu et al. Peneliti lain, amin dalam memetakan provinsi indonesia berdasarkan indikator rumah layak huni menggunakan algoritma k-Means dengan 9 variabel menghasilkan 4 cluster, yaitu k. = 10 anggota, k. = 19 anggota, k. = 3 anggota dan k. = 2 anggota(Septianingsih 2. Sri Rahayu, dkk dalam penelitiannya mengelompokkan penduduk buta huruf menurut provinsi menggunakan data presentase penduduk buta huruf tahun 2009-2017 dengan algoritma kMedoids menghasilkan 3 cluster, 1 provinsi dengan tingkat cluster tertinggi, 12 provinsi cluster sedang dan 21 provinsi dengan cluster terendah(Ningsih et al. Sukma,dkk menggunakan algoritma k-Medoids clustering dalam mengelompokkan penyebaran covid di Indonesia dari 34 record menghasilkan 3 cluster masing-masing berupa 1 record pada cluster 1, 2 record pada cluster 2 dan 31 record pada cluster 3(Sindi et al. Dari penelitian-penelitian sebelumnya yang telah dilakukan dengan menggunakan algoritma k-Means juga dengan k-Medoids, untuk membedakan maka penulis memutuskan melakukan pengukuran dan pengelompokkan provinsi mana saja yang masuk ke dalam kelompok provinsi terbahagia dan kurang bahagia di indonesia menggunakan algoritma k-Means dan k-Medoids sehingga dapat menjadi suatu bahan pengambilan keputusan dalam pembangunan suatu wilayah/provinsi untuk dapat mensejahterakan masyarakat sehingga masyarakat setempat menjadi lebih bahagia dan menjadi lebih produktif. Dalam melakukan pengukuran dan pengelompokkan untuk penelitian tersebut, peneliti menerapkan teknik data mining dengan metode clustering. Data Mining yaitu suatu proses yang berkaitan antara satu dengan yang lain dalam menemukan informasi yang tersembunyi secara tidak langsung pada suatu data berupa pengetahuan (Priati and Ahmad 2. Sedangkan metode clustering merupakan suatu metode memisahkan sekumpulan data menjadi kelompok atau cluster tertentu berdasarkan kemiripan karakteristik yang satu sama dengan yang lain, sehingga dikelompokkan ke dalam satu cluster dan pastinya berbeda dengan data yang ada pada cluster lain (Bastian. Sujadi, and Febrianto n. METODE Metode penelitian yang digunakan yaitu analisis deskriptif kuantitatif dengan teknik Pengelompokkan provinsi terbahagia dan kurang bahagia menggunakan perbandingan algoritma k- Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 831 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Means Clustering dengan k-Medoids aplikasi RapidMiner. Data yang digunakan berupa data indeks kebahagiaan tahun 2021 seluruh provinsi di Indonesia. Berikut metode penelitian yang digunakan pada penelitian ini: Gambar 1 Metode Penelitian eza Gustrianda, and Dadang Iskandar Mulyana. Pada tahap Preprosesing data telah dilakukan data cleaning atau membersihkan data, memperhalus nosiy data serta mengkonsistensikan data, selanjutnya dengan menggunakan teknik min-Max Normalization dilakukan normalisasi data untuk menyamakan skala atribut data yang lebih kecil berupa angka 0 sampai 1 atau -1 sampai 1. za and Dadang 2. Dataset yang dinormalisasikan yaitu data indeks kebahagiaan indonesia tahun 2021 yang terdiri dari 34 provinsi dengan 3 pendekatan: indeks kepuasan hidup, indeks perasaan dan indeks makna hidup. Persamaan normalisasi data: Dataset yang telah dinormalisasikan dapat dilihat pada tabel 1. Tabel 1 Dataset yang telah dinormalisasikan Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 832 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. ISSN 2829-2049 . edia onlin. Hal 830-839 HASIL DAN PEMBAHASAN Implementasi Metode (Perhitungan secara manua. Algoritma k-Means Tentukan k . umlah cluste. yang diinginkan Jumlah cluster yang akan dibentuk sebanyak 2 dengan kelompok Terbahagia dan Kurang Bahagia Tentukan pusat cluster (Centroi. Ditentukan pusat cluster secara acak, diambil dari perhitungan nilai rata-rata tiap atribut kemudian dipilih yang terkecil dan sedang pada data ke-6 untuk centroid 1 dan ke-16 untuk centroid 2 dari 34 data Tabel 2 Centroid awal Hitung jarak objek dari centroid dengan rumus Euclidean Distance Setelah menghitung jarak dilanjutkan dengan menentukan nilai jarak euclidean terdekat antara centroid dengan dataset (C1 dan C. sehingga objek dapat diclusterisasikan ke dalam masingmasing cluster. Berikut hasil perhitungan jarak dan penentuan jarak terdekat pada tabel 3. Tabel 3 Iterasi 1 Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 833 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Dari iterasi 1, diperoleh anggota dari masing-masing cluster sebagai berikut. Tabel 4 Anggota cluster iterasi 1 Selanjutnya dilanjutkan iterasi ke-2 dengan menentukan kembali nilai centroid baru secara acak, kemudian ulangi lagi langkah perhitungan ke-3 dan langkah selanjutnya seperti pada iterasi pertama sebelumnya. Hasil yang diperoleh di iterasi ke-2 terlihat pada tabel 5. Tabel 5 Anggota cluster iterasi 2 Pada iterasi ke-2, anggota dari cluster 0 mengalami penambahan anggota yang berpindah dari cluster 1, begitupun sebaliknya cluster 1 mengalami pengurangan anggota. Lakukan iterasi ke-3 dengan langkah-langkah yang sama seperti pada iterasi ke-1 dan ke-2 untuk memastikan apakah masih terjadi perpindahan anggota antar cluster atau tidak. Tabel 6 Anggota cluster iterasi 3 Pada iterasi ke-3, proses perhitungan dihentikan karena hasil clustering bernilai tetap dan tidak mengalami perubahan atau perpindahan anggota ke cluster lain. Hasil akhir perhitungan iterasi ke3 memiliki anggota masing-masing cluster sebagai berikut pada tabel 7. Tabel 7 Hasil akhir clusterisasi k-Means Untuk detail anggota, kategori provinsi diwakilkan oleh id. Algoritma k-Medoids Tentukan k . umlah cluste. yang diinginkan Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 834 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Pada penelitian ini untuk perhitungan manual digunakan k sebanyak 2. Pilih data medoids sebanyak k dari n data Tabel 8 data medoids Centroid awal dipilih secara random data ke-33 dan ke-34 dari 34 data Hitung jarak masing-masing cluster sebagai kandidat medoids baru menggunakan Euclidean Distance. Setelah dilakukan perhitungan terhadap semua data, selanjutnya memilih cluster terkecil yang akan menjadi penentu cluster. Tabel 9 Iterasi 1 Dari iterasi 1, diperoleh anggota dari masing-masing cluster sebagai berikut. Tabel 10 Anggota cluster iterasi 1 Inisialisasi pusat cluster baru secara acak sebagai kandidat non-medoids. Selanjutnya dilanjutkan dengan iterasi ke-2 dengan pusat cluster baru yang ditentukan secara acak yaitu pada data ke-1 dan ke-2 Tabel 11 data non-medoids Lakukan perhitungan jarak data ke masing-masing non medoids menggunakan rumus Euclidean Distance seperti pada tabel 3 Iterasi 1 sehingga diperoleh hasil penghitungan jarak masingmasing cluster dan memilih cluster terkecil yang akan menjadi penentu cluster. Hasil perhitungan jarak pada iterasi ke-2 dapat dilihat pada tabel 5 Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 835 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Tabel 12 Iterasi 2 Dari iterasi ke-2, diperoleh anggota dari masing-masing cluster sebagai berikut. Tabel 13 Anggota cluster iterasi 2 Hitung simpangan dengan mencari selisih total cost baru dengan total cost lama S = 13,08 Ae 9,42 = 3,66 Karena selisih = 3,66 artinya hasil pengurangan cost atau jarak percobaan > 0 maka clustering berhenti pada tahap ini dan hasil cluster adalah pada percobaan pertama, namun apabila selisih yang didapatkan < 0 maka lakukan pencarian medoids baru lagi hingga mendapatkan selisih cost atau jarak hingga lebih dari 0. Berikut hasil akhir perhitungan dengan masing-masing anggota Tabel 14 Hasil akhir clusterisasi k-Medoids Pengujian Pengujian dilakukan menggunakan aplikasi RapidMiner Studio. Gambar 2 Proses mengclusterisasi algoritma pada RapidMiner Studio Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 836 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Gambar 3 Clusterisasi k-Means Gambar 4 Clusterisasi k-Medoids Untuk dapat menentukan metode terbaik yang digunakan dalam mengukur tingkat kebahagiaan provinsi di indonesia, maka digunakan Performance Vector untuk menampilkan nilai berdasarkan centroid cluster(Reza Gustrianda and Mulyana 2. Gambar 5 Performance Vector k-Means Gambar 6 Performance Vector k-Medoids Dari Performance Vector yang diperoleh, terlihat nilai validitas DBI pada algoritma k-Means adalah 0,752 sedangkan pada algoritma k-Medoids adalah sebesar 0,648. Cluster dengan nilai DBI terkecil adalah cluster yang terbaik(Badruttamam. Sudarno, and Maruddani 2. Oleh karena nilai validitas DBI pada k-Medoids lebih kecil maka clusterisasi tingkat kebahagiaan provinsi di indonesia lebih tepat menggunakan algoritma k-Medoids. Citra Fathia Palembang | https://journal. id/index. php/bullet | Page 837 BULLET : Jurnal Multidisiplin Ilmu Volume 01. No. 5 (Oktober Ae Novembe. 2022 ISSN 2829-2049 . edia onlin. Hal 830-839 Gambar 7 Visualisasi cluster algoritma k-Medoids Detail anggota cluster k-Medoids dapat dilihat pada tabel 15 berikut. Tabel 15 Anggota masing-masing cluster KESIMPULAN Berdasarkan penelitian yang telah dilakukan, mengukur dan mengelompokkan data berupa tingkat kebahagiaan provinsi di indonesia dengan 3 variabel yang terdiri dari indeks kepuasan hidup, indeks perasaan dan indeks makna hidup menggunakan perbandingan algoritma k-Means dan kMedoids dalam mencari metode yang tepat untuk menyelesaikan permasalahan, maka diperoleh algoritma k-Medoids lebih tepat dalam menyelesaikan kasus peneliti berdasarkan nilai validitas DBI yang dihasilkan yaitu sebesar 0,648 dibandingkan dengan nilai dari algoritma k-Means sebesar 0,752. Menghasilkan 2 cluster yaitu cluster provinsi terbahagia sebanyak 17 provinsi . dan cluster provinsi kurang bahagia juga sebanyak 17 provinsi . Hasil tersebut dapat menjadi bahan pengambilan keputusan pemangku kebijakan dalam meningkatkan kesejahteraan masyarakat demi pencapaian pembangunan di wilayah masing-masing. REFERENCES