Jurnal Pelita Teknologi. Vol. 2024, pp. PELITA TEKNOLOGI Journal homepage: jurnal. id,p-ISSN: 2301-475X, e-ISSN: 2656-7059 Implementasi Algoritma K-Means Clustering Meggunakan Rapid Miner Untuk Mengelompokan Penjualan Produk Pada Toko Sanjaya Sport Elkin Rilvani1. Muhamad Fikr 2 1,2Teknik Informatika. Fakultas Teknik. Universitas Pelita Bangsa Jl. Inspeksi Kalimalang No. Cibatu. Cikarang Selatan. Kab. Bekasi. Jawa Barat. Indonesia Korespondensi email: elkin. rilvani@pelitabangsa. Abstrak Informasi Artikel This study examines the implementation of the K- Diterima: 8 Juli 2024 means clustering algorithm using RapidMiner to Direvisi: 6 Agustus 2024 classify sports product sales data at Toko Sanjaya Dipublikasikan: 30 September 2024 Sport. The research addresses the lack of a sales analysis system capable of grouping products based on sales performance, which has hindered effective stock and promotional decision-making. The dataset includes 150 sales records from January to December 2024, with attributes such as product name, category, and price. The research follows the Knowledge Discovery in Database (KDD) stages: data selection, preprocessing, transformation, clustering using K-means, and evaluation with the Davies-Bouldin Index (DBI). The results generated three clusters: highly demanded products . , moderately demanded products . , and less demanded products . The DBI score of 0. indicates good clustering quality. Overall, the findings provide valuable insights to support better inventory management and sales strategy planning at Toko Sanjaya Sport. Pendahuluan Keywords Data Mining. K-means Clustering. RapidMiner. Product Sales. Davies- Bouldin Index. mampu mengelola data penjualan secara efektif agar dapat memahami pola permintaan Tanpa analisis yang tepat, data penjualan hanya menjadi arsip administratif dan belum memberikan kontribusi maksimal dalam mendukung pengambilan keputusan Penjualan peralatan olahraga saat ini tidak hanya dipengaruhi oleh jenis olahraga yang diminati, tetapi juga oleh faktor usia, gaya hidup, dan preferensi konsumen yang terus Aktivitas olahraga telah menjadi bagian dari kebutuhan masyarakat modern, sehingga permintaan terhadap perlengkapan Toko Sanjaya Sport sebagai salah satu usaha olahraga semakin meningkat dan beragam. ritel perlengkapan olahraga menyediakan Kondisi ini menuntut pelaku usaha untuk berbagai produk seperti perlengkapan bulutangkis, sepak bola, bola basket, dan alat Meskipun memiliki variasi produk yang cukup lengkap, toko ini masih menghadapi kendala dalam pengelolaan dan pemanfaatan data penjualan. Data transaksi yang tersedia hanya dicatat dalam laporan harian atau bulanan tanpa dilakukan analisis lebih lanjut. Akibatnya, pihak toko mengalami kesulitan dalam mengidentifikasi produk yang sangat laris, laris, maupun kurang laris, untuk mengelompokkan produk berdasarkan tingkat kelarisan . , . Berdasarkan latar belakang dan dukungan penelitian terdahulu, penelitian ini bertujuan menerapkan algoritma K-means Clustering menggunakan aplikasi RapidMiner untuk mengelompokkan data penjualan produk di Toko Sanjaya Sport ke dalam tiga kategori, yaitu sangat laris, laris, dan kurang laris. RapidMiner dipilih karena merupakan perangkat lunak data mining yang mendukung berbagai teknik analisis dan memudahkan proses pemodelan data secara visual . Dengan diharapkan pihak toko dapat memperoleh informasi yang lebih terstruktur guna mendukung strategi stok, promosi, dan pengambilan keputusan bisnis yang lebih efektif serta berbasis data. Untuk mengatasi permasalahan tersebut, diperlukan penerapan metode data mining sebagai pendekatan analitis dalam mengolah data historis menjadi informasi yang bernilai. Data mining merupakan proses analisis data dalam jumlah besar untuk menemukan pola atau hubungan tersembunyi yang dapat II. Metodologi digunakan sebagai dasar pengambilan keputusan . Salah satu teknik yang Penelitian ini dilaksanakan di Toko Sanjaya relevan dalam data mining adalah clustering. Sport yang berlokasi di Cikarang Utara dan yaitu proses pengelompokan data berdasarkan bergerak di bidang penjualan perlengkapan tingkat kemiripan karakteristik tertentu olahraga sejak tahun 2019. Objek penelitian sehingga data dalam satu kelompok memiliki berupa data penjualan produk olahraga kesamaan yang tinggi dibandingkan dengan periode Januari hingga Desember 2024 kelompok lainnya . , . dengan jumlah 125 dataset. Data yang digunakan merupakan data primer yang Metode clustering yang banyak digunakan diperoleh langsung dari pemilik toko melalui adalah algoritma K-means karena dinilai sederhana, efisien, dan mampu mengolah data dokumentasi, serta didukung oleh studi dalam jumlah besar dengan waktu yang relatif pustaka untuk memperkuat landasan teoritis. Algoritma ini bekerja dengan Teknik pengumpulan data ini bertujuan untuk menentukan jumlah cluster (K), memilih memastikan bahwa data yang dianalisis centroid awal, menghitung jarak setiap data relevan, valid, dan sesuai dengan kebutuhan mengelompokkan data berdasarkan jarak terdekat hingga mencapai kondisi stabil. Metode penelitian yang digunakan adalah Berbagai sebelumnya pendekatan data mining dengan algoritma Kmenunjukkan bahwa K-means efektif means Clustering diterapkan dalam analisis penjualan ritel, pengelompokan data. termasuk pada toko fashion dan toko olahraga. Jurnal Pelita Teknologi. Vol. 2024, pp. PELITA TEKNOLOGI Journal homepage: jurnal. id,p-ISSN: 2301-475X, e-ISSN: 2656-7059 Gambar 1 tahap metode penelitian Data mining merupakan proses analisis terhadap kumpulan data berukuran besar untuk menemukan pola atau informasi tersembunyi yang bermanfaat dalam pengambilan keputusan . Salah satu teknik dalam data mining adalah clustering, yaitu proses pengelompokan data berdasarkan tingkat kemiripan karakteristik tertentu sehingga data dalam satu kelompok memiliki kesamaan yang lebih tinggi dibandingkan dengan kelompok lain . , . Algoritma K-means mengelompokkan data secara efisien dengan pendekatan iteratif berbasis centroid . Tahapan Knowledge Discovery in Database (KDD) yang meliputi data selection, preprocessing, transformation, data mining, dan evaluation . Pada tahap awal dilakukan identifikasi dan perumusan masalah serta studi literatur. Selanjutnya, pada tahap preprocessing dilakukan seleksi atribut yang relevan, seperti nama produk, kategori, dan harga, serta pembersihan data dari duplikasi atau Tahap transformasi dilakukan dengan menyesuaikan format data agar sesuai untuk proses pemodelan, termasuk konversi data ke dalam format . csv sebelum diolah menggunakan perangkat lunak RapidMiner. Proses data mining dilakukan dengan K-means menggunakan RapidMiner sebagai alat bantu RapidMiner merupakan perangkat lunak yang mendukung berbagai teknik data mining dan memudahkan proses pemodelan secara visual . Pada tahap ini ditentukan jumlah cluster (K) sebanyak tiga kelompok, yaitu sangat laris, laris, dan kurang Proses iterasi dilakukan hingga posisi centroid stabil dan tidak terjadi perubahan signifikan pada hasil pengelompokan. Tahap akhir penelitian berupa evaluasi dan interpretasi hasil clustering untuk memastikan bahwa metode yang diterapkan berjalan dengan baik dan mampu menghasilkan segmentasi penjualan yang informatif. Hasil pengelompokan kemudian dianalisis untuk mengetahui distribusi produk dalam masingmasing cluster sehingga dapat digunakan sebagai dasar pengambilan keputusan terkait strategi persediaan dan penjualan di Toko Sanjaya Sport. Hasil penelitian diperoleh dari pengolahan 110 item data historis penjualan produk olahraga menggunakan algoritma K-Means Clustering. Data diimpor ke dalam RapidMiner dan melalui tahap praproses sebelum dilakukan pemodelan. Hasil dan Pembahasan Gambar 2 Preprocessed Data Tahap ini bertujuan memastikan data telah bersih dan siap digunakan dalam proses Proses inti penelitian ditunjukkan pada saat penambahan algoritma K-Means dengan parameter jumlah cluster (K) ditetapkan sebanyak tiga sesuai kategori produk, yaitu sangat laku, laku, dan kurang laku (Gambar 4. Gambar 3 Menabahkan Algoritma K-means Jurnal Pelita Teknologi. Vol. 2024, pp. PELITA TEKNOLOGI Journal homepage: jurnal. id,p-ISSN: 2301-475X, e-ISSN: 2656-7059 Hasil eksekusi model menghasilkan tiga cluster utama sebagaimana terlihat pada tampilan ExampleSet Result. Distribusi data menunjukkan bahwa cluster 0 berisi 15 item, cluster 1 berisi 41 item, dan cluster 2 berisi 69 Untuk memperjelas pemisahan antar cluster, visualisasi scatter/bubble digunakan guna menampilkan persebaran data berdasarkan jumlah penjualan dan kategori produk. Visualisasi ini menunjukkan perbedaan karakteristik masing-masing cluster secara lebih intuitif, sehingga memudahkan interpretasi hasil pengelompokan. Gambar 4 Tampilan Davies bouldin index Evaluasi kualitas clustering difokuskan pada metrik Davies-Bouldin Index (DBI) yang ditampilkan pada Gambar 4. Nilai DBI sebesar 0,667 menunjukkan bahwa hasil clustering memiliki tingkat pemisahan antar cluster yang baik serta tingkat kekompakan data dalam cluster yang cukup optimal. Dengan demikian, model K-Means yang diterapkan dinilai mampu menghasilkan pengelompokan yang representatif untuk mendukung analisis penjualan produk. Microsoft Excel, dapat disimpulkan bahwa metode clustering K-Means efektif digunakan untuk mengelompokkan data penjualan dan mendukung proses pengambilan keputusan berbasis data. Hasil pengujian menunjukkan terbentuknya tiga cluster, yaitu cluster 0 sebanyak 15 item . angat lari. , cluster 1 sebanyak 41 item . , dan cluster 2 sebanyak 16 item . urang lari. Dengan adanya pengelompokan ini, pemilik toko dapat lebih mudah mengetahui kategori produk berdasarkan tingkat penjualannya IV. Kesimpulan sehingga strategi stok dan promosi dapat Berdasarkan hasil penelitian yang telah disusun secara lebih tepat. dilakukan menggunakan algoritma K-Means Meskipun demikian, penelitian ini Clustering melalui perhitungan manual dan masih memiliki keterbatasan. Oleh karena itu, pengujian dengan bantuan tools RapidMiner disarankan agar penelitian selanjutnya menggunakan algoritma lain sebagai pembanding untuk melihat perbedaan tingkat . akurasi dan kualitas pengelompokan. Selain itu, jumlah dataset dapat diperbanyak agar hasil analisis menjadi lebih representatif dan Pengembangan lebih lanjut juga dapat dilakukan dengan menambahkan sistem pendukung atau integrasi dengan sistem informasi penjualan agar hasil clustering . dapat dimanfaatkan secara lebih optimal dalam pengambilan keputusan bisnis. Daftar Pustaka