JOINT (Journal of Information Technolog. Vol. 02 No 02 Agustus 2020, pp. ISSN: 2527-9467/. ISSN: 2656-7539 Algoritma K-Means Untuk Pengelompokkan Penyakit Pasien Pada Puskesmas Cigugur Tengah Castaka Agus Sugianto1. Ayu Hendrati Rahayu2. Aditia Gusman3 Program Studi Teknik Informatika - Politeknik TEDC Bandung Program Studi Rekam Medik dan Informasi Kesehatan - Politeknik TEDC Bandung Jl. Politeknik-Pesantren KM2 Cibabat Cimahi Utara Ae Cimahi - Jawa Barat - Indonesia 1castaka@poltektedc. 2ayuhendrati@poltektedc. 3aditiagusman19@gmail. IntisariAiPuskesmas Cigugur Tengah dalam setiap harinya melayani pasien sekitar 150 orang dari berbagai wilayah didaerah Cigugur Tengah. Dengan bertambahnya jumlah pasien tersebut, maka bertambah pula data pasien setiap harinya, sehingga sejumlah data tidak dapat dipelajari lebih lanjut dan data tersebut hanya digunakan sebagai arsip saja. Berdasarkan latar belakang tersebut, maka penulis ingin mengolah data tersebut untuk mengelompokan penyakit pasien berdasarkan penyakit akut dan penyakit tidak akut menggunakan teknik data mining dengan metode clustering dengan algoritma k-means dan algoritma k-medoids sebagai pembanding. Sehingga nantinya dapat membantu pihak Puskesmas Cigugur Tengah untuk mengetahui penyakit apa yang paling banyak diderita pasien, kemudian dapat membantu pihak pemerintah khususnya Dinas Kesehatan dalam pemberian penyuluhan kesehatan kepada masyarakat sekitar. Berdasarkan hasil pengujian dari algoritma k-means dan algoritma k-medoids, didapat cluster model untuk algoritma k-means sebanyak 241 items pada cluster_0 atau penyakit akut sebesar 96% dan 9 items pada cluster_1 atau penyakit tidak akut sebesar 4% dari 250 data, sedangkan untuk algoritma k-medoids sebanyak 224 items pada cluster_0 atau penyakit akut sebesar 90% dan 26 items pada cluster_1 atau penyakit tidak akut sebesar 10% dari 250 data, maka penyakit yang paling banyak diderita pasien pada Puskesmas Cigugur Tengah adalah penyakit akut sebesar 93%, dengan nilai Davies Bouldin untuk algoritma k-means 453 dan algoritma k-medoids sebesar -1. Dari hasil tersebut dapat dikatakan bahwa algoritma yang menghasilkan nilai Davies Bouldin terkecil dianggap sebagai algoritma yang lebih baik, maka dapat disimpulkan bahwa algoritma k-means lebih baik dari algoritma k-medoids yang menghasilkan nilai rata Ae rata Davies Bouldin sebesar -1. Kata kunciAi Data Mining. Clustering. Algoritma K-Means. Algoritma K-Medoids. Penyakit Akut dan Penyakit Tidak Akut. AbstractAi The Central Cigugur Community Health Center serves around 150 patients every day from various regions in the Central Cigugur area. Along with the increase in the number of patients, the patient's data is increased every day. So that a number of data cannot be studied further and the data is only used as an archive. Based on this background, the authors want to process the data to classify the patient's disease based on acute disease and non-acute disease using data mining techniques with clustering method with k-means algorithm and k-medoids algorithm as a comparison. So that later it can help the Cigugur Tengah Health Center to find out what diseases most suffer from patients, then can help the government especially the Health Service in providing health counseling to the surrounding community. Based on the test results of the k-means algorithm and the k-medoids algorithm, the cluster model for 241 items of cluster-0 or 96% of the k-means algorithm was obtained and 9 items for cluster__1 or non-acute illness for 4% of 250 data , whereas for the k-medoids algorithm as much as 224 items in cluster_0 or acute disease by 90% and 26 items in cluster _1 or non-acute diseases in the amount of 10% of 250 data, the most common disease suffered by patients at Cigugur Tengah Health Center is acute disease by 93%, with the Davies Bouldin value for the k-means algorithm of -0. 453 and the k-medoids algorithm of -1. From these results it can be said that the algorithm that produces the smallest Davies Bouldin value is considered a better algorithm, so it can be concluded that the k-means algorithm is better than the k-medoids algorithm which produces the average Davies Bouldin value of -1. KeywordsAi Data Mining. Clustering. K-Means Algorithm. K-Medoids Algorithm. Acute Disease and Non-Acute Disease. PENDAHULUAN Puskesmas merupakan salah satu instansi kesehatan yang berada ditingkat kecamatan, termasuk Puskesmas Cigugur Tengah yang berada di kecamatan Cimahi Tengah. Dalam rangka menciptakan pelayanan Instansi Kesehatan yang baik diperlukan tata kerja yang tertib, rapi, dan teliti sehingga menghasilkan informasi yang cepat, akurat, dan tepat waktu sesuai kebutuhan. Seperti instansi kesehatan pada umumnya. Puskesmas Cigugur Tengah juga memberikan pelayanan kesehatan bagi masyarakat setiap Setiap harinya. Puskesmas Cigugur Tengah melayani pasien sekitar 150 orang dari berbagai wilayah yang ada di daerah Cigugur Tengah. Seiring dengan bertambahnya jumlah pasien tersebut, maka bertambah pula data pasien pada setiap harinya, sehingga dari data yang banyak tersebut tidak dapat dipelajari lebih lanjut dan data tersebut hanya digunakan sebagai arsip Salah satu data yang perlu diperhatikan yaitu mengenai penyakit akut dan tidak akut yang banyak diderita pasien pada Puskesmas Cigugur Tengah. Sehingga nantinya dapat membantu pihak pemerintah khususnya Dinas Kesehatan untuk mengetahui penyakit apa yang paling banyak diderita dan juga bisa menjadi bahan acuan dalam pemberian penyuluhan kesehatan kepada masyarakat sekitar. Untuk mempermudah proses pengelolaan data yang banyak, suatu Instansi di perlukan suatu sistem dalam mengambil keputusan untuk mengetahui pengelompokkan penyakit berdasarkan penyakit akut dan tidak akut yang banyak diderita pasien pada Puskesmas Cigugur Tengah. Salah satunya yaitu menggunakan teknik Data Mining. Castaka. : Algoritma K-Means Untuk Pengelompokkan PenyakitA Sehingga data yang banyak tersebut dapat dimanfaatkan secara optimal, kemudian hasilnya dapat dijadikan bahan atau dasar penyuluhan kesehatan oleh Dinas Kesehatan Kota Cimahi. Data mining merupakan metode yang digunakan dalam pengolahan data berskala besar. Data yang diolah dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru, hasil dari pengolahan data tersebut dapat digunakan dalam menentukan keputusan. Dalam data mining juga terdapat metode - metode yang dapat digunakan seperti Classification. Clustering. Estimation. Prediction. Association . Clustering merupakan metode yang digunakan dalam data mining yang cara kerjanya mencari dan mengelompokkan data yang mempunyai kemiripan karakteristik antara data satu dengan data lainnya yang telah diperoleh . Teknik Clustering yang paling sering digunakan dalam data mining yaitu algoritma K-Means dan K-Medoids . Kelebihan dari algoritma KMeans ini mampu meminimalkan jarak antara data ke Pada dasarnya penggunaan algoritma ini dalam proses clustering tergantung pada data yang didapatkan dan yang ingin dicapai diakhir proses . Beberapa penelitian terutama clustering sering digunakan untuk pengelompokan penyakit diantaranya penelitian yang di lakukan oleh Ade Bastian. Harun Sujadi, dan Gigin Febrianto menerapakan algoritma k-means clustering analysis pada penyakit menular manusia cluster terbanyak yaitu penyakit diare. , yang di lakukan Anindya Khrisna Algoritma K-Means Pengelompokkan Penyakit Pasien pada Puskesmas Kajen Pekalongan hasilnya 376 penyakit akut dan 424 penyakit tidak akut dari total data 1000 . Parasian D P Silitonga dan Irene Sri dalam penelitianya Klusterisasi Pola Penyebaran Penyakit Pasien Berdasarkan Usia Pasien Dengan Menggunakan K-Means Clustering dari sejumlah pasien yang ada, persentasi usia pasien paling tinggi adalah pasien dengan usia tua dan kemudian pasien dengan usia parobaya. Sedangkan penelitian yang dilakukan Mentari Tri Indah Rahmayani terkait Analisis Clustering Tingkat Keparahan Penyakit Pasien Menggunakan Algoritma KMeans hasilnya masyarakat disekitar puskesmas Bandar Seikijang lebih banyak menderita penyakit sedang (C. dengan jenis penyakit dominan Infeksi Saluran Pernafasan Akut (ISPA), demam berdarah dan malaria. , penelitian lain oleh Fina Nasari dan Charles Jhony Manto Sianturi Algoritma K-Means Clustering Untuk Pengelompokkan Penyebaran Diare Di Kabupaten Langkat Hasilnya cluster 1 yaitu Kecamatan Batang Serangan. Brandan Barat dan Permata Jaya sebagai dan Kecamatan Hinai dan Sei Bingai menjadi pusat cluster 2 . Berdasarkan latar belakang di atas, maka penulis ingin mengelompkkan penyakit pasien kedalam kelompok penyakit akut dan penyakit tidak akut menggunakan teknik data mining dengan metode clustering dengan algoritma kmeans dan algoritma k-medoids sebagai pembanding. II. METODE PENELITIAN Dalam penelitian ini Ada 8 . tahapan yang akan dilakukan diantaranya: Menentukan Masalah Penentuan masalah yang penulis lakukan merupakan proses awal dalam penelitian ini. Proses ini sudah berlangsung di jelaskan pada pada latar belakang mengenai pengelompokan penyakit pasien kedalam penyakit akut dan tidak akut menggunakan algoritma K-Means algoritma KMedoids sebagai pembanding. Menentukan Tujuan dan Ruang Lingkup Menentukan tujuan dan ruang lingkup merupakan apa yang ingin di capai oleh penulis dalam penelitian serta batasan yang di pakai agar penelitian tidak terlalu melebar. Mencari Literature Mencari literature atau referensi dilakukan untuk mencari berbagai sumber yang berkaitan tentang data mining, clustering, dan algoritma k-means. Adapun metode yang digunakan yaitu melakukan Studi Pustaka Dalam penelitian ini menggunakan metode studi pustaka yang merupakan sebuah metode yang dilakukan dengan cara mengumpulkan dan mencari sumber dari buku, internet, jurnal yang berkaitan dengan penelitian yang Data - data yang dikumpulkan oleh penulis dari metode studi pustaka adalah : Materi tentang data mining. Materi tentang penyakit akut dan tidak akut. Materi tentang rapidminer. Mengumpulkan referensi jurnal yang memiliki korelasi denga data mining, clustering, algoritma kmeans dan algoritma k-medoids. Mengambil dataset penyakit pasien. Teori Ae teori yang digunakan pada penelitian ini. Pengumpulan Data Proses pengumpulan data mempunyai peranan yang penting dalam penelitian ini, karena metode pengumpulan data akan menentukan kualitas dan akurasi data yang akan dikumpulkan selama proses penelitian dengan berbagai macam metode pengumpulan data, penulis akan menggunakan metode pengumpulan data sebagai berikut : Data Primer Data primer adalah data yang diperoleh secara langsung dari sumber data tersebut yang berhubungan dengan penelitian yang dilakukan. Pada penelitian ini data yang digunakan diperoleh langsung dari Puskesmas Cigugur Tengah. Data Sekunder Data sekunder adalah data yang diperoleh secara tidak langsung, biasanya dari pihak kedua yang mengolah data untuk orang lain. Data sekunder dalam penelitian ini diperoleh dari journal, paper, artikel yang berkaitan dengan Data Mining. Clustering. Algoritma K-Means dan Algoritma KMedoids. Observasi Observasi merupakan metode pengumpulan data dengan cara mengamati secara langsung kejadian Dalam penelitian ini melakukan observasi di Puskesmas Cigugur Tengah yang JOINT (Journal of Information Technolog. beralamat di Jl. Abdul Halim No. 199 Kel. Cigugur Tengah Kec. Cimahi Tengah Kota Cimahi. Kegiatan yang di lakukan adalah mengambil data jenis penyakit pasien. Wawancara Wawancara merupakan metode pengumpulan data melalui tatap muka dan tanya jawab dengan Staf Puskesmas bagian data. Staf Dinas Kesehatan Kota Cimahi yang ditugaskan di Puskesmas Cigugur Tengah. Proses ini di lakukan dengan memberikan beberapa pertanyaan yang dapat dimanfaatkan dalam penelitian ini. Metode Yang Diusulkan Metode yang di usulkan merupakan proses untuk memudahkan dalam penelitian untuk lebih jelas bisa di lihat pada gambar 1. Gambar 1. Metode Yang Diusulkan Dataset Penyakit Pasien Dataset yang diambil untuk proses data mining ini diambil dari Puskesmas Cigugur Tengah dengan persetujuan dari Dinas Kesehatan Kota Cimahi. Jumlah data yang diambil adalah dari rentan tanggal 1 Januari 2017 sampai 31 Desember 2017 dengan jumlah 250 records. Preparasi Data Dilakukannya proses cleansing data. Proses cleansing data dilakukan untuk menghilangkan data yang tidak konsisten, atau menghapus atribut yang tidak Gambar 2. merupakan data dari Puskesmas Cigugur Tengah yang belum melalui proses cleansing data. Vol 02 No 02. Agustus 2020 Proses Proses clustering akan dilakukan pada rapidminer, yaitu proses pengelompokan data untuk mencari mana yang merupakan penyakit akut dan mana yang merupakan penyakit tidak akut. Algoritma yang digunakan adalah algoritma k-means. Aplikasi yang akan digunakan adalah rapidminer versi 7. Hasil Dengan data penyakit pasien Puskesmas Cigugur Tengah yang akan dikelompokkan ke dalam penyakit akut dan penyakit tidak akut. Pengelompokkan tersebut berdasarkan atribut kode penyakit, nama penyakit, jenis umur pasien dan juga jenis kelamin yang kemudian atribut tersebut akan diolah menggunakan rapidminer dengan menggunakan algoritma k-means yang akan menghasilkan cluster dan Untuk menghitung jarak antara data dengan pusat awal cluster menggunakan rumus persamaan euclidean distace sebagai berikut : yayyeOyeU = oc yco ( yaycnyc Oe yaycoyc ) 2 yc Dimana : Cik : pusat cluster Ckj : data Proses Dan Hasil Proses data mining yang di lakukan menggunakan algoritma k-means yang akan menghasilkan cluster dan Analisis Proses analisis dilakukan dengan cara mengamati dan menjelaskan hasil dari proses data mining menggunakan software rapidminer. Gambar 2. Dataset Penyakit Pasien Sedangkan pada gambar 3. merupakan data hasil Penarikan Kesimpulan Penarikan kesmpulan merupakan hasil dari proses pengujian dan analisis penelitian ini. dari cleansing data. HASIL DAN PEMBAHASAN Pengujian Algoritma K-Means Pada RapidMiner Proses pengujian data ini dilakukan tanpa melakukan perubahan apapun pada algoritma yang terdapat pada rapidminer. Pengujian dilakukan menggunakan algoritma k-means seperti digambarkan pada gambar 4. Gambar 3. Hasil Proses Cleansing Data Castaka. : Algoritma K-Means Untuk Pengelompokkan PenyakitA Gambar 4. Pemodelan Clustering K-Means Gambar 7. Pemodelan Clustering K-Medoids Hasil Data Cluster K-Means Dengan menggunakan pemodelan k-means clustering seperti gambar 4 diatas, dengan inisialisasi jumlah cluster sebanyak 2 buah, maka didapatkan hasil dengan cluster yang terbentuk adalah 2, sesuai dengan pendefinisian nilai k dengan jumlah cluster 0 ada 241 item, cluster 1 ada 9 item dengan total jumlah data sebanyak 250 adapun penjelasanya bisa dilihat pada gambar 5. Hasil Data Cluster K-Medoids Dengan menggunakan pemodelan k-medoids clustering seperti gambar 7 diatas, dengan inisialisasi jumlah cluster sebanyak 2 buah, maka didapatkan hasil dengan cluster yang terbentuk adalah 2, sesuai dengan pendefinisian nilai k dengan jumlah cluster 0 ada 224 item, cluster 1 ada 26 item dengan total jumlah data sebanyak 250 adapun penjelasanya bisa dilihat pada gambar 8. Gambar 5. Hasil Data Cluster K-Means Dimana akurasi berdasarkan rata-rata within centroid distance dapat dilihat pada gambar 6. Gambar 8. Hasil Data Cluster K-Medoids Dimana akurasi berdasarkan rata-rata within centroid distance dapat dilihat pada gambar 9. Gambar 6. Rata-rata centroid distance Gambar 9. Rata-rata centroid distance Pengujian Algoritma K-Medoids Pada RapidMiner Proses pengujian data ini dilakukan sebagai pembanding tanpa melakukan perubahan apapun pada algoritma yang terdapat pada rapidminer. Pengujian dilakukan menggunakan algoritma k-medoids seperti digambarkan pada gambar 7. Perbandingan Algoritma K-Means dan Algoritma K-Medoids Algoritma K-Means dan Algoritma K-Medoids sama sama menghasilkan dua cluster sesuai dengan yang dibutuhkan, dimana cluster pertama (C. merupakan penyakit akut dan cluster kedua (C. merupakan penyakit tidak akut. Hasil perbandingan dari Algoritma K-Means dan Algoritma K-Medoids dapat dilihat pada tabel 1 dan gambar JOINT (Journal of Information Technolog. Vol 02 No 02. Agustus 2020 means lebih baik dari algoritma k-medoids yang menghasilkan nilai rata Ae rata Davies Bouldin sebesar 1. Tabel 1 Tabel Hasil Perbandingan Algoritma K-Means dan Algoritma K-Medoids Algoritma Cluster_0 Cluster_1 Algoritma K- 241 items 9 items 224 items 26 items REFENSI Ong. AuImplementasi Algotritma K-means clustering untuk menentukan strategi marketing president university,Ay J. Ilm. Tek. Ind. , vol. 12, no, no. juni, pp. 10Ae20, 2013. Anggreini and S. Tresnawati. AuKomparasi Algoritma KMeans dan K-Medoids untuk menangani Strategi Promosi di Politeknik TEDC Bandung,Ay J. TEDC, vol. 14, no. 2, pp. 120Ae127, . Sugianto. AuAnalisis Komparasi Algoritma Klasifikasi Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan,Ay Techno. Com, vol. 14, no. 4, pp. 336Ae342, 2015, doi: 33633/tc. Anggreini. AuTeknik Clustering dengan Algoritma KMedoids untuk menangani Strategi Promosi di Politeknik TEDC Bandung,Ay Junral Teknol. Inf. dan Pendidik. , vol. 12, no. 2, pp. 1Ae 7, 2019. Sugianto and T. Apandi. AuAlgoritma K-Means Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan,Ay in Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK), 2015, pp. 77Ae81. Anggreini and I. Budi. AuTeknik Clustering Dengan Algoritma K-Means Untuk Menangani Strategi Promosi di Politeknik TEDC Bandung,Ay J. TEDC, vol. 13, no. 1, pp. 40Ae45, . Agustina. Yhudo. Santoso. Marnasusanto. Tirtana, and F. Khusnu. AuCLUSTERING KUALITAS BERAS BERDASARKAN CIRI FISIK MENGGUNAKAN METODE KMEANS Algoritma,Ay Clust. K-Means, pp. 1Ae7, 2012. Bastian. Sujadi, and G. Febrianto. AuPenerapan Algoritma KMeans Clustering Analysis Pada Penyakit Menular Manusia (Studi Kasus Kabupaten Majalengk. ,Ay J. Sist. Inf. , vol. 14, no. 26Ae32, 2018. Wardhani. AuImplementasi Algoritma K-Means untuk Pengelompokkan Penyakit Pasien pada Puskesmas Kajen Pekalongan,Ay J. Transform. , vol. 14, no. 1, pp. 30Ae37, 2016. Silitonga and I. Sri. AuKlusterisasi Pola Penyebaran Penyakit Pasien Berdasarkan Usia Pasien Dengan Menggunakan K-Means Clustering,Ay TIMES (Technology Informatics Comput. Syst. , vol. 6, no. 2, pp. 22Ae25, 2017. Rahmayani. AuAnalisis Clustering Tingkat Keparahan Penyakit Pasien Menggunakan Algoritma K-Means (Studi Kasus di Puskesmas Bandar Seikijan. ,Ay J. Inov. Tek. Inform. , vol. 1, no. 2, pp. 40Ae44, 2018. Nasari and C. Sianturi. AuPenerapan Algoritma K-Means Clustering Untuk Pengelompokkan Penyebaran Diare Di Kabupaten Langkat,Ay CogITo Smart J. , vol. 2, no. 2, pp. 108Ae119, 2016, doi: 10. 31154/cogito. Means Algoritma KMedoids Hasil Perbandingan K-Means K-Medoids Cluster_0 Cluster_1 Gambar 10. Grafik Hasil Perbandingan Algoritma K-Means dan Algoritma K-Medoids IV. KESIMPULAN Berdasarkan hasil pengujian yang telah dilakukan, maka dapat ditarik kesimpulan sebagai berikut : Dalam penelitian ini penulis ingin mengelompokan penyakit pasien kedalam penyakit akut dan tidak akut, maka jumlah cluster yang digunakan dalam penelitian ini sebanyak 2 cluster, yaitu cluster_0 dan cluster_1. Dimana cluster_0 untuk mengelompokan penyakit akut, sedangkan cluster_1 untuk mengelompokan penyakit tidak akut. Berdasarkan pengujian yang telah dilakukan pada rapidminer menggunakan algoritma k-means, maka didapatkan nilai performa berdasarkan rata Ae rata avg. within centroid distance sebesar -43954. 608, avg. within centroid distance_cluster_0 sebesar -21401. within centroid distance_clsuter_1 sebesar 647875. 778 dan Davies Bouldin sebesar -0. Berdasarkan hasil pengujian dari algoritma k-means dan algoritma k-medoids, didapat cluster model untuk algoritma k-means sebanyak 241 items pada cluster_0 atau penyakit akut dan 9 items pada cluster_1 atau penyakit tidak akut, sedangkan untuk algoritma kmedoids sebanyak 224 items pada cluster_0 atau penyakit akut dan 26 items pada cluster_1 atau penyakit tidak akut, dengan nilai Davies Bouldin untuk algoritma k-means sebesar -0. 453 dan algoritma k-medoids Dari hasil tersebut dapat dikatakan bahwa algoritma yang menghasilkan nilai Davies Bouldin terkecil dianggap sebagai algoritma yang lebih baik, maka dapat disimpulkan bahwa algoritma k- Castaka. : Algoritma K-Means Untuk Pengelompokkan PenyakitA alaman ini sengaja dikosongka.