Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Implementasi Data Mining dengan K-Means Clustering untuk Memprediksi Pengadaan Obat Putri Pratiwi Pane*. Yusuf Ramadhan Nasution. Mhd. Furqan Fakultas Sains dan Teknologi. Ilmu Komputer. Universitas Islam Negeri Sumatera Utara. Medan. Indonesia Email: 1,*putriipane2001@gmail. com, 2ramadhannst@uinsu. id, 3mfurqan@uinsu. Email Penulis Korespondensi: putriipane2001@gmail. Submitted: 06/02/2024. Accepted: 18/02/2024. Published: 20/02/2024 AbstrakOePusat Kesehatan Masyarakat (Puskesma. merupakan salah satu lembaga yang menyediakan pelayanan kesehatan. Untuk memberikan jaminan layanan kesehatan yang berkualitas, pihak puskesmas harus dapat melakukan pengelolaan manajemen stok persediaan obat agar menghindari risiko terjadinya kekurangan atau kelebihan stok obat yang ada. Oleh sebab itu tujuan dilakukannya penelitian ini adalah untuk melihat dan melakukan pengelompokan permintaan obat yang ada di Puskesmas Mandala dengan teknik clustering. Data yang digunakan adalah data permintaan obat yang ada pada puskesmas tersebut dimulai dari bulan Januari Ae Desember 2023. Dalam penerapannya, digunakan aplikasi atau software RapidMiner untuk melakukan pengelompokan dengan algoritma K-Means Clustering. Data obat yang ada akan dikelompokkan ke dalam 3 cluster, yaitu cluster 0 untuk permintaan obat tinggi, cluster 1 untuk permintaan obat menengah dan cluster 2 untuk permintaan obat rendah. Dari 28 data uji yang digunakan, didapatkan hasil cluster pertama yang terdiri 24 item, cluster kedua yang terdiri dari 3 item serta cluster ketiga terdiri dari 1 item dengan nilai Davies Bouldin Index yang didapatkan sebesar 0,276. Dari hasil penelitian ini, maka pihak Puskesmas dapat terus melakukan pengadaan obat pada jenis obat yang tergolong pada cluster permintaan tinggi agar kebutuhan obat dapat selalu terpenuhi. Kata Kunci: K-Means. Data Mining. Clustering. Obat-obatan. RapidMiner AbstractOeCommunity Health Center is one of the institutions that provides healthcare services. To ensure the provision of quality healthcare services, the Community Health Center management must be able to effectively manage medicine inventory to avoid the risks of shortages or excess stock. Therefore, the purpose of this research is to observe and perform clustering of medicine demands at Puskesmas Mandala using the K-Means Clustering technique. The data used includes medicine demand data from January to December 2023 at the health center. In its implementation, the RapidMiner application or software is utilized to perform clustering using the K-Means Clustering algorithm. The available medicine data will be grouped into 3 clusters: cluster 0 for high medicine demands, cluster 1 for moderate medicine demands, and cluster 2 for low medicine demands. Out of the 28 test data used, the results show the first cluster consisting of 24 items, the second cluster consisting of 3 items, and the third cluster consisting of 1 item with a Davies Bouldin Index value of 0. From this research, the Puskesmas can continue to procure medicine for the types classified under high-demand clusters to ensure that the medicine needs are consistently met. Keywords: K-Means. Data Mining. Clustering. Medicine. RapidMiner PENDAHULUAN Pusat Kesehatan Masyarakat (Puskesma. merupakan salah satu lembaga pelayanan kesehatan yang memiliki peranan penting dalam menyediakan layanan kesehatan bagi masyarakat . Puskesmas harus dapat memberikan pelayanan kesehatan dan pengobatan pasien dengan efektif dan efisien agar kesehatan masyarakat dapat selalu terjamin. Salah satu upaya yang dapat dilakukan adalah dengan mengelola ketersediaan obat yang Pengelolaan ketersediaan obat dilakukan dengan tujuan untuk menghindari kekurangan atau kelebihan stok yang berpotensi mengurangi kualitas pelayanan kesehatan . Perencanaan ketersediaan obat merupakan salah satu aspek penting dalam pengelolaan obat, karena perencanaan kebutuhan obat akan mempengaruhi pengadaan, pendistribusian dan pemakaian obat di unit pelayanan kesehatan . Dengan adanya perencanaan kebutuhan obat yang tepat, maka dapat memberikan efek pengadaan obat menjadi lebih efektif dan efisien sehingga tersedianya obat dengan jenis dan jumlah yang cukup sesuai dengan kebutuhan yang diperlukan. Kekurangan obat memiliki dampak negatif pada perawatan pasien dan berimplikasi pada pembiayaan yang mahal. Kelebihan persediaan obat juga akan menimbulkan masalah bagi rumah sakit. Obat yang menumpuk akan menjadi rusak dan kedaluwarsa, hal ini akan menimbulkan kerugian dimasa mendatang . Untuk menghadapi dinamika permintaan obat yang fluktuatif dan beragam, diperlukan adanya suatu sistem yang dapat menganalisa permintaan obat yang ada pada puskesmas. Permasalahan ini dapat diselesaikan dengan konsep keilmuan data mining. Pada dasarnya, data mining merupakan proses penggalian suatu data dengan tujuan mendapatkan informasi terbaru dengan menentukan pola atau aturan tertentu sehingga berguna dalam pengambilan keputusan . Sebenarnya jika dilakukan pengolahan lebih dalam terhadap data, maka akan didapatkan suatu informasi yang sangat berguna dan dapat dijadikan sebagai suatu pendukung keputusan . Klastering merupakan salah satu teknik yang ada pada data mining yang dapat mengelompokkan data ke dalam kelompok tertentu . Teknik ini dapat memberikan hasil analisis berupa pengelompokan permintaan obatobatan berdasarkan data historis yang ada. Algoritma K-Means merupakan algoritma yang paling popular dan banyak digunakan dalam melakukan klastering. Algoritma ini akan digunakan dikarenakan penggunaannya yang Copyright A 2024 the auhor. Page 286 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. cukup sederhana dan cepat dalam menangani permasalahan klastering dengan penggunaan data numerik dalam ukuran data yang cukup besar dan tersebar . Penelitian dengan menerapkan K-Means Clustering telah banyak dilakukan. Seperti pada penelitian implementasi metode improved k-means untuk mengelompokkan film. Hasil analisis yang didapatkan adalah pengelompokan film ke dalam 6 cluster dengan menggunakan atribut atau parameter seperti durasi, jumlah votes dan sutradara. Nilai akurasi yang didapatkan pada penelitian ini adalah sebesar 87. 2% yang menunjukkan bahwa metode ini dapat melakukan clustering dengan cukup baik . Selanjutnya penelitian yang menerapkan metode K-Means Clustering dalam menentukan jenis udang terlaris. Pada penelitian ini digunakan 82 data yang dikelompokkan ke dalam tiga klaster yaitu sebanyak 19 jenis udang kurang laris, 42 jenis udang laris dan 21 jenis udang yang terlaris . Pada penelitian lain menerapkan algoritma K-Means Clustering untuk mengelompokkan data penjualan toko fashion hijab. Dari 100 data yang digunakan, didapatkan hasil akhir pengelompokan ke dalam 3 cluster yaitu cluster sangat laris ada 11 item, cluster laris ada 55 item dan 34 item untuk cluster kurang laris . Lalu pada penelitian lain dilakukan penerapan algoritma k-means untuk melakukan pengelompokan penyebaran covid-a9 di provinsi Jawa Barat. Hasil penelitian didapatkan dengan mengelompokkan data ke dalam 3 klaster, yaitu klaster 1 untuk penyebaran paling tinggi sebanyak 2 kota, klaster 2 untuk penyebaran menengah diperoleh 5 kota, dan klaster 3 untuk penyebaran lebih sedikit sebanyak 20 kota . Dan pada penelitian lainnya juga menerapkan algoritma k-means clustering untuk mengelompokkan wilayah produksi tanaman obat ke dalam 3 klaster. Hasil yang didapatkan menunjukkan sebanyak 24 wilayah di cluster 0, 1 wilayah di cluster 1, dan 2 wilayah di cluster 2 . Dari beberapa penelitian yang ada sebelumnya, penelitian ini akan mencoba menerapkan algoritma k-means clustering untuk mengelompokkan data permintaan Berbeda dengan penelitian yang lain, penelitian sebelumnya menerapkan algoritma K-Means Clustering untuk melakukan pengelompokan beberapa permasalahan yang berbeda, seperti jenis udang, jenis film, daerah penyebaran coivd19, penjualan pakaian, dan wilayah produksi tanaman obat. Pada penelitian ini akan digunakan untuk mengelompokkan data permintaan obat yang ada pada puskesmas Mandala ke dalam 3 klaster yaitu rendah, sedang dan tinggi. Manfaat dari klastering permintaan obat ini akan dapat memberikan efisiensi manajemen persediaan, pengoptimalan ruang penyimpanan, dan pengurangan risiko kekurangan atau kelebihan stok. Dengan mengetahui kelompok permintaan obat-obatan yang serupa, lembaga kesehatan dapat mengembangkan strategi pengadaan dan penataan persediaan yang lebih terarah . Dengan demikian, penelitian ini memiliki potensi untuk memberikan kontribusi signifikan dalam konteks manajemen logistik di sektor kesehatan. Dengan adanya penelitian ini, harapannya pihak puskesmas mandala dapat meningkatkan efisiensi operasional, meminimalkan biaya, dan memberikan pelayanan kesehatan yang lebih baik kepada masyarakat. METODOLOGI PENELITIAN 1 Tahapan Penelitian Penelitian ini dilakukan dengan melakukan beberapa tahapan. Tahapan tersebut dimulai dari studi literatur, identifikasi masalah, penetapan tujuan, pengumpulan data, seleksi data, penerapan algoritma, evaluasi hingga proses analisis hasil. Gambar 1. Tahapan Penelitian Copyright A 2024 the auhor. Page 287 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Gambar 1 merupakan gambaran mengenai tahapan penelitian yang akan dilakukan. Proses awal dalam melakukan penelitian ini adalah melakukan studi literatur yang dilakukan dengan tujuan untuk mengumpulkan beberapa referensi mengenai algoritma yang akan digunakan sehingga peneliti dapat memahami dengan baik algoritma yang akan digunakan. Selanjutnya adalah melakukan pengidentifikasian permasalahan. Dalam penelitian ini ditemukan permasalahan kurangnya strategi manajemen pengelolaan obat yang ada di puskesmas Mandala. Oleh karena itu, peneliti akan mencoba menerapkan algoritma K-Means Clustering untuk melakukan prediksi pengadaan obat di masa yang akan datang dengan melakukan pengelompokan klaster berdasarkan data permintaan obat sebelumnya. Langkah selanjutnya adalah melakukan pengumpulan data yang dibutuhkan pada penelitian. Pada penelitian ini digunakan data historis permintaan obat yang ada pada puskesmas Mandala selama 1 tahun. Selanjutnya akan dilakukan pengolahan serta penerapan algoritma k-means clustering pada data yang ada untuk mendapatkan hasil klaster permintaan obat. Hasil klaster tersebut kemudian akan dianalisis, dan dapat digunakan oleh pihak puskesmas Mandala untuk melakukan strategi pengadaan obat di masa yang akan datang. 2 Data Mining Data mining merupakan suatu konsep yang diterapkan dalam mencari nilai lebih yang tersimpan di dalam database yang besar. Data mining ialah sebuah tahapan semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan yang bermanfaat yang tersimpan didalam database yang besar. Data mining juga mempunyai peran yang sangat penting dalam beberapa bidang dalam kehidupan sehari-hari antara lain ialah bidang industri, bidang cuaca, keuangan dan bidang ilmu dan teknologi. Salah satu teknik data mining yang ada adalah teknik klastering. Analisis cluster yaitu menemukan kumpulan objek hingga objek-objek dalam satu kelompok sama . unya hubunga. dengan yang lain dan berbeda . idak berhubunga. dengan objek-objek dalam kelompok lain. Tujuan dari analisis cluster adalah meminimalkan jarak di dalam cluster dan memaksimalkan jarak antar cluster. Clustering merupakan sebuah proses dalam pembentukkan kelompok dari sebuah data yang besar yang sebelumnya tidak diketahui kelompoknya berdasarkan kesamaan karakteristiknya. Berbeda dengan model prediksi atau klasifikasi, dataset yang digunakan untuk melakukan pengklasteran tidak memiliki variabel data target . 3 K-Means Clustering K-Means merupakan salah satu metode pengelompokan atau klastering yang berusaha membagi data yang ada ke dalam bentuk dua atau lebih kelompok. Clustering merupakan proses membagi objek ke dalam kumpulan objek sejenis yang memiliki kesamaan satu sama lain dan berbeda dengan objek di cluster lain . Dataset yang digunakan untuk melakukan pengklasteran tidak memiliki variabel data target . Algoritma K-Means Clustering merupakan salah satu algoritma yang dapat melakukan clustering dengan secara sederhana yang akan melakukan pengelompokan dengan melalui langkah iteratif. Gambar 2. Diagram Alir Algoritma K-Means Clustering Proses penerapan algoritma K-Means Clustering diawali dengan proses data processing. Tahapan ini dilakukan dengan tujuan untuk mempersiapkan data penelitian yang ada agar dapat diterapkan untuk dilakukan pembelajaran mesin. Proses selanjutnya adalah menentukan nilai cluster atau kelompok. Penentuan nilai kluster Copyright A 2024 the auhor. Page 288 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. dilakukan dengan tujuan agar output yang dihasilkan sesuai dengan banyaknya kluster yang diinginkan. Selanjutnya dilakukan penentuan nilai titik pusat cluster dan jarak data terhadap kluster serta pengelompokan data sesuai dengan nilai minimum jarak ke pusat cluster. Iterasi algoritma ini akan terus berjalan sampai keadaan dimana pusat cluster tidak berubah. Secara umum, cara kerja dari algoritma K-Means clustering adalah sebagai berikut . Menentukan k sebagai jumlah kluster yang diinginkan. Menentukan nilai random untuk pusat centroid . luster awa. sebanyak k. Nilai v diartikan sebagai nilai centroid pada kelompok. Variabel xi merupakan objek ke-I, di mana nilai objek berubah sesuai dengan iterasi. Dan variabel n adalah banyaknya objek/data/ Menghitung jarak setiap data input terhadap masing-masing centroid menggunakan rumus jarak Euclidean Distance. Berikut adalah persamaan pada rumus Euclidean Distance : Nilai d diartikan sebagai nilai jarak data ke pusat cluster. Variabel xi merupakan objek x ke-i dan variabel yi merupakan data y ke-i. Variabel n menjelaskan banyaknya objek/data Mengklasifikasikan data berdasarkan kedekatannya dengan centroid . arak terkeci. Memperbaharui nilai centroid. Nilai centroid baru diperoleh dari rata-rata cluster yang bersangkutan dengan menggunakan rumus 1. Melakukan perulangan dari langkah 2 hingga 5, sampai anggota tiap cluster tidak ada yang berubah. HASIL DAN PEMBAHASAN 1 Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data yang dikumpulkan di puskesmas Mandala. Data yang diambil merupakan data penjualan obat berdasarkan bulan Januari-Desember 2023. Kemudian data tersebut diseleksi dan akan digunakan untuk diolah untuk menentukan prediksi persediaan obat farmasi. Analisis ini dilakukan dengan tujuan melakukan prediksi atau peramalan mengenai hasil Ae hasil yang telah ditargetkan dengan suatu metode tertentu . Berikut merupakan dataset yang telah dikumpulkan: Tabel 1. Dataset Penelitian Nama Obat Acetylcystei ne 200 mg Alcohol Swab Amitriptyline 25 mg Antasida Asam ascorbat (Vit C) 50 mg Spuit 3ml / Nipro Spuit 5ml / Nipro Surgical Gloves Steril Jan Feb Mare Apr Mei Jun Jul Ags Sep Okt Nov Des Tabel 1 merupakan kumpulan dataset jenis obat yang didapatkan. Pada tabel tersebut dijelaskan terdapat 142 jenis obat dan banyaknya permintaan obat pada setiap bulannya selama satu tahun di Puskesmas Mandala. Sebelum digunakan, data penelitian di atas akan diolah terlebih dahulu agar dapat menghasilkan data penelitian yang baik. Copyright A 2024 the auhor. Page 289 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Tabel 2. Data Integration Nama Obat Acetylcysteine 200 mg Alcohol Swab /Serenity Amitriptyline 25 mg Antasida tablet Asam ascorbat (Vit C) 50 mg Spuit 3ml / Nipro Spuit 5ml / Nipro Surgical Gloves Steril 7,5 (Ambuma. Rerata Permintaan 20736,58 28230,33 272,3333 308,75 918,3333 Data pada tabel 2 merupakan hasil pengolahan data yang melalui tahapan data integration. Data integration dilakukan dengan menggabungkan data Ae data permintaan obat pada setiap bulannya ke dalam rerata pemakaian dalam satu tahun. Penggabungan data dilakukan dengan menjumlahkan seluruh permintaan dimulai dari bulan Januari Ae Desember 2023 kemudian dilakukan perhitungan rerata pemakaian. Sehingga, didapatkan atribut/parameter rerata permintaan. Atribut ini nantinya akan digunakan untuk menerapkan klastering dengan algortitma K-Means. 2 Penerapan K-Means Clustering Langkah awal dalam penerapan algoritma K-Means Clustering adalah menentukan nilai k atau jumlah cluster. Dalam penelitian ini, data akan dikelompokkan ke dalam 3 cluster, yaitu cluster 0 untuk penjualan kategori tinggi, cluster 1 untuk penjualan obat menengah, dan cluster 2 untuk penjualan kategori rendah. Selanjutnya adalah menentukan nilai centroid awal yang ditentukan secara acak. Berikut merupakan hasil penentuan nilai centroid awal : Tabel 3. Data Pusat Cluster Iterasi 1 No. Cluster Pusat 356,75 6487,667 Cluster Penentuan titik cluster pusat pada iterasi 1 dilakukan secara acak yang dipilih dari dataset yang ada. Dapat dilihat pada tabel 3, telah ditentukan nilai cluster pusat untuk setiap cluster. Diketahui nilai cluster pusat C0 adalah 356,75. cluster pusat C1 adalah 20102. dan cluster pusar C2 adalah 6487,667. Setelah didapatkan titik pusat awal cluster, kemudian dilakukan perhitungan jarak Euclidean dan mengelompokkan berdasarkan jarak terkecil sehingga akan didapatkan nilai centroid baru untuk acuan perhitungan berikutnya sampai nilai centroid sebelum dan sesudah bernilai sama. Hitung Euclidean Distance dari semua data ke tiap titik pusat pertama : Hitung Euclidean Distance dari semua data ke tiap titik pusat kedua : Copyright A 2024 the auhor. Page 290 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Hitung Euclidean Distance dari semua data ke tiap titik pusat ketiga : Hasil perhitungan Euclidean Distance dapat dilihat pada tabel di bawah ini: Tabel 4. Perhitungan Euclidean Distance Iterasi 1 Nama Obat Asam Asetil Salisilat (Asetosa. 80 mg Betametason cr 0,1% . ebagai Valera. Bisoprolol 5 mg Calcium Lactate 500 mg Chloramphenicole / Bufacetin salep kulit Codein 10 mg Dipenhydramine Injeksi Erythromycine 250 mg Gentamycine /Genoint salep mata 0,3% Gentamycine tetes mata 0,3% Jarak Cluster 114,4167 19630,83 114,41667 345,4167 20090,67 6476,334 345,41667 641,5833 1708,667 19163,07 18036,58 5489,334 4422,25 641,58333 1708,6667 257,6667 20002,92 6388,584 257,66667 132,3333 337,75 7402,417 19612,92 12342,83 5998,584 6468,667 132,3333 337,75 272,75 6403,667 272,75 20042,25 6427,917 Tabel 4 menunjukkan hasil perhitungan jarak dengan menerapkan algoritma K-Means Clustering. Nilai cluster ditentukan dengan melihat nilai jarak terkecil untuk setiap cluster. Sebagai contoh untuk data obat Asam Asetil Salsilat (Asetosa. diketahui nilai cluster C0 = 114,4. C1 = 19630,8. dan C2 = 6016,5. Nilai jarak terkecil terletak pada cluster 0, sehingga untuk data pada baris pertama nilai cluster nya terletak pada C0. Copyright A 2024 the auhor. Page 291 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. 3 Proses K-Means Clustering dengan RapidMiner RapidMiner merupakan salah satu software data mining pengolahan data set untuk mencari pola data sesuai dengan tujuan dari pengolahan data tersebut. RapidMiner memungkinkan pengguna untuk dengan mudah mengimpor, mengelola, dan menganalisis data dari berbagai sumber . Langkah awal yang dilakukan untuk menerapkan algoritma K-Means Clustering adalah dengan melakukan import dataset penelitian yang digunakan. Berikut merupakan tampilan ketika melakukan import dataset pada aplikasi RapidMiner: Gambar 3. Import Dataset Gambar 3 di atas menunjukkan proses import dataset penelitian ke dalam aplikasi RapidMiner. Hal ini dilakukan agar dataset yang telah ada dapat diakses atau digunakan dalam aplikasi sehingga dapat dilakukan proses penerapan algoritma K-Means. Setelah importing data, selanjutnya adalah membagi data ke dalam dua bagian yaitu data training dan data testing dengan rasio perbandingan 80% dan 20%. Sehingga jumlah data training yang digunakan sebesar 114 data dan data testing sebanyak sebesar 28 data. Gambar 4. Penggunaan Operator Split Data Proses gambar 4 di atas dilakukan untuk melakukan pembagian data pada aplikasi RapidMiner dengan menggunakan operator split data. Operator ini digunakan untuk membagi dataset menjadi dua subset data yaitu data training dan data testing. Nilai rasio merupakan nilai perbandingan untuk melakukan pembagian dataset Oleh karena itu nilai rasio diisi nilai 0,2 dan 0,8 agar menghasilkan rasio perbandingan dataset 20:80%. Kemudian untuk menerapkan algoritma K-Means Clustering digunakan operator Clustering yang telah disediakan di aplikasi RapidMiner. Karena yang digunakan 3 kategori. Selanjutnya melakukan pengaturan algoritma K-Means, yang diatur pada menu Parameter Clustering K Means dengan k=3. Sehingga tampilan model yang dibangun pada aplikasi RapidMiner adalah sebagai berikut: Copyright A 2024 the auhor. Page 292 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Gambar 5. Tampilan Rancangan Model Clustering Gambar 5 di atas merupakan tampilan desain model pada aplikasi RapidMiner untuk melakukan proses Digunakan tiga operator yaitu read excel, split data, dan clustering. Operator read excel digunakan untuk melakukan proses import dataset. Operator split data dipergunakan untuk membagi data dan operator clustering digunakan untuk menerapkan algoritma clustering pada data. Gambar 6. Menentukan Jumlah Cluster Seperti penjelasan sebelumnya, langkah awal dalam menerapkan proses clustering adalah menentukan nilai cluster. Gambar 6 menjelaskan proses penentuan nilai parameter cluster . pada aplikasi RapidMiner. Dalam penelitian ini ditentukan nilai cluster yaitu tiga. Tampilan output atau hasil yang muncul pada aplikasi RapidMiner dapat dilihat dalam dua bentuk yaitu example set dan text view cluster. Example set merupakan tampilan hasil cluster data secara keseluruhan sesuai dengan data yang telah dimasukkan. Sedangkan text view cluster merupakan tampilan ringkasan hasil clustering yang dilakukan. Gambar 7. Tampilan Text View Cluster Dari gambar 7, diketahui hasil text view cluster yang dikelompokkan ke dalam 3 cluster. Dari 28 data pengujian, didapatkan sebanyak 24 data jenis obat tergolong dalam cluster 0 (C. , 1 data jenis obat tergolong dalam cluster 1 (C. dan 3 data jenis obat tergolong dalam cluster 2 (C. Copyright A 2024 the auhor. Page 293 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Gambar 8. Tampilan Hasil Cluster Gambar 8 menjelaskan mengenai rincian pengklasteran data jenis obat. Dari gambar di atas dapat dilihat jenis obat apa saja yang tergolong ke dalam cluster C0,C1, dan C2. Selanjutnya, untuk memastikan akurasi model klastering yang dihasilkan dilakukan perhitungan nilai evaluasi Davies Bouldin Index. Untuk mengukur kinerja model klastering yang ada, maka digunakan operator pembantu yang ada pada aplikasi RapidMiner yaitu Cluster Distance Performance. Sehingga desain model akan tampak pada gambar di bawah ini: Gambar 9. Model Evaluasi Davies Bouldin Index Tampilan gambar di atas merupakan tampilan desain model evaluasi pada aplikasi RapidMiner. Dari gambar 9 dapat dilihat penggunaan berbagai operator yang dipergunakan untuk melakukan proses evaluasi kinerja model klastering yang dihasilkan. Gambar 10. Hasil Evaluasi Davies Bouldin Index Copyright A 2024 the auhor. Page 294 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 286-296 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Gambar 10 merupakan hasil akhir nilai evaluasi yang dihasilkan pada aplikasi RapidMiner sesuai dengan desain model pada gambar 9. Dapat diketahui bahwa dengan menggunakan parameter cluster k=3, diperoleh Davies Bouldin Index sebesar 0,276. Semakin kecil nilai davies bouldin index maka semakin baik cluster yang diperoleh dari pengelompokan menggunakan metode clustering . Berikut merupakan hasil pengklasteran 28 jenis data obat yang dirangkum kedalam bentuk tabel: Tabel 5. Hasil Klastering Permintaan Obat Data ke1 Nama Obat Asam Asetil Salisilat (Asetosa. 80 mg Betametason cr 0,1% . ebagai Valera. Bisoprolol 5 mg Calcium Lactate 500 mg Chloramphenicole / Bufacetin salep kulit Codein 10 mg Dipenhydramine Injeksi Erythromycine 250 mg Gentamycine /Genoint salep mata 0,3% Gentamycine tetes mata 0,3% Diazepam Inj 5mg/ml Prednison 5 mg Acetylcystein 200mg Captopril 25 mg Dulcolax Adult 10 mg Supp Hidrokortison 2,5 % cream Iliadin Anak 0. 025% Nasal Drops 10 ml (Oxymetazoline HCL) Natrium Diklofenac 50 mg Permetrin Krim 5% Ranitidin 150 mg Simvastatin 10 mg Zinc Sulfate Syrup 60 ml Sulfadoxine 500mg Primethamin 25mg Surgical Gloves Steril 7,5 (Ambuma. Tetracycline 500 mg Trihexyphenidyl Alkohol 95% 1L/ Medika Captopril 12,5 mg Kategori Penjualan Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Rendah Tinggi Tinggi Tinggi Sedang Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Rendah Tinggi Tinggi Tinggi Tinggi Rendah Dari tabel 5 di atas, dapat dilihat hasil pengklasteran 28 data jenis obat. Hasil tersebut menunjukkan bahwa proses pengklasteran dikelompokkan menjadi 3 jenis kategori di mana cluster pertama (C. terdiri dari 24 item, cluster kedua (C. yang terdiri dari 1 item serta cluster ketiga (C. terdiri dari 3 item. KESIMPULAN Dari hasil penelitian yang telah dilakukan oleh peneliti, maka dapat disimpulkan bahwa metode clustering dengan menggunakan algoritma K-Means dapat digunakan untuk mengelompokkan data penjualan obat farmasi UPT Puskesmas Mandala berdasarkan jumlah penjualannya selama tahun 2023 (Januari-Desembe. Klastering dikelompokkan ke dalam 3 kategori yaitu Cluster 0 untuk penjualan tinggi. Cluster 1 untuk penjualan menengah, dan Cluster 2 untuk penjualan rendah. Berdasarkan hasil penerapan dengan software RapidMiner didapatkan hasil pengelompokan dan pengujian yang terdiri dari tiga cluster yaitu cluster pertama (C. yang terdiri 24 item, cluster kedua (C. yang terdiri dari 3 item serta cluster ketiga (C. terdiri dari 1 item dengan nilai Davies Bouldin Index yang didapatkan sebesar 0,276. Hasil penerapan metode clustering ini dapat digunakan untuk membantu pihak UPT Puskesmas dalam melihat tingkat penjualan obat mereka. REFERENCES