JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 ISSN : 2985-4768 PENGELOMPOKAN DATA PENJUALAN ALAT PERABOTAN MENGGUNAKAN K MEANS DI TOKO EKA PERABOT KOTA TANGERANG Azis Suhendra Universitas Pamulang. Jl. Raya Puspitek. Buaran. Kec. Pamulang. Kota Tangerang Selatan. Banten. Indonesia, e-mail: azissuhendra05@gmail. Abstract This study uses the K-Means clustering algorithm to examine furniture sales patterns at Eka Perabot Store in Tangerang City. Understanding sales patterns can help the store develop better inventory management and marketing strategies. This study analyzed sales data to identify clustering patterns based on product price and quantity. Sales data collection, preprocessing, and the application of the K-Means algorithm using RapidMiner software were all part of the research process. The cleaned data was then grouped into clusters based on similar characteristics, resulting in product groups with specific characteristics, such as low-priced and high-selling products. The results showed that organizing with K-Means successfully divided products into categories appropriate to the store. The K-Means clustering method proved effective in helping Eka Perabot Store understand customer preferences and develop better sales strategies because each cluster has unique characteristics that can be used as a basis for business decision-making. Keywords: K-Means Clustering. Sales. Sales Patterns. Machine Learning. RapidMiner. Furniture Store Abstrak Studi ini menggunakan algoritma clustering K-Means untuk mempelajari pola penjualan alat perabotan di Toko Eka Perabot Kota Tangerang. Toko dapat membuat strategi pengelolaan persediaan dan pemasaran yang lebih baik dengan mengetahui pola penjualan. Penelitian ini menganalisis data penjualan untuk menemukan pola pengelompokan berdasarkan harga dan jumlah produk. Pengumpulan data penjualan, preprocessing, dan penerapan algoritma K-Means melalui perangkat lunak RapidMiner adalah semua bagian dari proses penelitian. Data yang telah bersih kemudian dikelompokkan ke dalam beberapa cluster berdasarkan kesamaan karakteristik, yang menghasilkan kelompok produk dengan karakteristik tertentu, seperti produk dengan harga rendah dan penjualan tinggi. Hasil penelitian menunjukkan bahwa pengorganisasian dengan K-Means berhasil membagi produk ke dalam beberapa kategori yang sesuai dengan toko. Metode K-Means Clustering terbukti efektif dalam membantu Toko Eka Perabot memahami preferensi pelanggan dan membuat strategi penjualan yang lebih baik karena setiap cluster memiliki karakteristik unik yang dapat digunakan sebagai dasar pengambilan keputusan Kata Kunci: Clustering K-Means. Penjualan. Pola Penjualan. Machine Learning. RapidMiner. Toko Perabotan https://jurnal. id/index. php/JORAPI/index JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 PENDAHULUAN Seiring berkembangnya teknologi informasi, pengelolaan data dalam dunia bisnis pun mengalami perubahan yang signifikan. Data tidak lagi sekadar catatan transaksi, tetapi data telah berkembang menjadi aset strategis yang dapat menambah nilai dianalisis dengan benar. Di industri retail, data penjualan merupakan sumber daya penting yang dapat diproses untuk memberikan wawasan tentang perilaku konsumen, tren pasar, dan kinerja produk. Namun tantangan bagi banyak perusahaan, termasuk Toko Eka Perabot Kota Tangerang, adalah menggunakan data yang semakin besar dan kompleks untuk mendukung keputusan bisnis yang lebih baik. Toko Eka Perabot merupakan toko yang menjual berbagai macam furniture rumah mulai dari wajan, panci, baskom hingga peralatan dapur lainnya. Volume penjualan toko ini cukup tinggi, dan data penjualan yang dihasilkan setiap harinya terus Namun, data penjualan tidak diproses secara sistematis untuk mengidentifikasi pola yang dapat membantu toko mengembangkan strategi yang lebih efektif, seperti manajemen inventaris, penetapan harga, dan strategi pemasaran. Selama ini Toko Eka Perabot mengelola data penjualan hanya dengan mencatat setiap transaksi tanpa melakukan analisis data secara mendalam. Akibatnya, toko kesulitan memahami produk mana yang paling laris, kapan waktu terbaik untuk menjalankan promosi, dan bagaimana mengelola stok dengan lebih efisien. Misalnya, produk dengan permintaan tinggi sering kali kehabisan stok, sedangkan produk dengan permintaan rendah tetap berada di rak untuk jangka waktu yang lama. Situasi ini menunjukkan bahwa Toko Eka Perabot membutuhkan suatu sistem yang dapat mengelompokkan data penjualannya dengan lebih baik sehingga informasi yang diberikan dapat digunakan untuk mengambil keputusan bisnis yang lebih akurat. IEE. TINJAUAN PUSTAKA Pengelompokan Secara umum. Pengelompokan adalah proses atau tindakan membagi objek, data, atau informasi ke dalam kelompok-kelompok berdasarkan fitur tertentu. Dalam arti yang lebih luas, pengelompokan dapat digunakan dalam berbagai domain, seperti data, bahasa, dan analisis statistik. Pengertian pengelompokan menurut (Arifatul Ulya et al. , 2. adalah untuk membagi kumpulan data menjadi berbagai kelompok berdasarkan kesamaan variabel atau fitur. Di mana data dikelompokkan berdasarkan centroid, atau pusat cluster, yang paling dekat dengannya. https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 Pengelompokan adalah salah satu teknik yang paling signifikan dalam data mining yang mengeksplorasi kumpulan data. Dalam beberapa decade terakhir, beberapa pendekatan pengelompokan dengan kinerja yang lebih baik telah diterpakan untuk berbagai aplikasi, seperti bidang psikologi dan ilmu sosial lainnya, biologi, statistik, pengenalan pola, pencarian informasi, machine learning, dan data (Zaki et al. , 2. Data Data merupakan salah satu komponen yang penting di era digital, seluruh aktivitas data akan terekam dan disimpan dalam media penyimpanan data atau database, sehingga data ini dapat diproses untuk mendapatkan informasi yang berguna. Data menurut Suharsimi Arikunto dalam jurnal Rike Limia Budiarti dan Gina Cendana, data adalah segala fakta dan angka yang dapat dijadikan bahan untuk menyusun suatu informasi. Sehingga dapat di artikan bahwa informasi adalah data yang sudah diolah untuk keperluan tertentu. (Limia Budiarti & Cendana, 2. Perabotan Perabotan adalah berbagai barang atau benda yang digunakan untuk melengkapi dan memfungsikan suatu ruang, baik di rumah, kantor, atau area komersial. Perabotan biasanya berfungsi sebagai tempat duduk, tempat kerja, atau tempat istirahat, dan termasuk kursi, meja, lemari, tempat tidur, rak, dan perangkat lainnya yang membantu membuat ruang menjadi nyaman dan Perabotan dapat dibuat dari berbagai bahan, seperti kayu, logam, plastik, atau kaca, dan sering dirancang untuk memberikan fungsionalitas dan menambah nilai estetika ruangan. Tujuan pemilihan dan penataan perabotan biasanya disesuaikan dengan tujuan dan gaya dekorasi ruang tersebut, sehingga perabotan tersebut tidak hanya memenuhi kebutuhan praktis tetapi juga mempercantik tampilan keseluruhan. Machine Learning Machine learning adalah cabang kecerdasan buatan yang memungkinkan algoritme untuk menemukan pola tersembunyi dalam kumpulan data, yang memungkinkan mereka untuk membuat prediksi pada data baru yang serupa tanpa melakukan pemrograman khusus untuk setiap tugas. Machine Learning tradisional menggunakan data dan alat statistik untuk memprediksi keluaran, menghasilkan wawasan yang dapat ditindaklanjuti. Aplikasi teknologi ini mencakup pemrosesan bahasa alami, pengenalan ucapan dan gambar, sistem rekomendasi, deteksi pengotomatisan tugas. JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 Menurut Faggella dalam jurnal (Bella Pratiwi, 2. Machine Learning adalah ilmu yang memungkinkan komputer bertindak seperti manusia, dimana mesin dapat secara otomatis belajar memahami lebih banyak seiring berjalannya waktu atau melalui pengalaman. Adapun metode machine learning yang perlu diketahui, antara lain : Supervised Learning Supervised learning merpukan salah satu metode machine learning dimana pada metode ini data yang digunakan adalah data yang memiliki kelas atau label di dalamnya. Data terbagi menjadi dua yaitu data latih dan data Data latih Reinforcement Learning digunakan untuk membentuk model, lalu model yang telah di bentuk itu di terapkan pada data uji, salah satu tujuannya adalah untuk mengetahui hasil atau output dan mengetahui tangka akurasinya. Beberapa algoritma supervised learning yang dapat digunakan antara lain seperti Decision Tree. Naive Bayes Classifier. K-NN. Artificial Neural Network, dan Support Vector Machine. Unsupervised Learning Metode unsupervised learning tidak perlu menggunakan data untuk "berlatih", akan tetapi model akan dibentuk dari cara mengidentifikasi pola, mengenali karakteristik data, dll. Biasanya, metode ini digunakan pada prosedur yang lebih rumit. Reinforcement Learning Reinforcement learning merupakan metode machine learning yang berfungsi untuk mengoptimalkan sistem. Terdapat dua tipe reinforcement learning. Beberapa manfaat yang didapatkan jika menggunakan metode ini perusahaan dan menghemat waktu dan . Data mining Data mining menurut David Hand adalah analisis terhadap data . iasanya data yang berjumlah/berukuran besa. untuk menemukan hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terbaru yang dipahami dan berguna bagi pemilik data tersebut. Data mining adalah proses untuk menemukan pola atau informasi yang berharga dan terpendam dari sejumlah besar data dengan menerapkan teknik ataupun motode tertentu. salah satu teknik data mining adalah teknik clustering. (Murdiaty et al. , 2. https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 Data mining adalah cara untuk menemukan informasi dalam suatu basis data. Ini juga dapat disebut sebagai proses mengekstraksi data dari kumpulan data atau informasi yang sangat besar. Pada dasarnya, data mining adalah bagian dari Knowledge Discovery in Database (KDD) (Yoliadi, 2. Berdasarkan pengertian Data Mining menurut para ahli penelitian diatas maka dapat disimpulkan data mining adalah proses menganalisis sejumlah besar data untuk menemukan pola atau informasi yang tersembunyi yang dapat bermanfaat bagi pemilik data. Ini dilakukan dengan menggunakan teknik tertentu seperti clustering dan merupakan komponen penting dari Knowledge Discovery in Database (KDD). Data mining juga memungkinkan identifikasi dan pemanfaatan hubungan antar data yang sebelumnya tidak terlihat. 6 Knowledge Discovery in Database (KDD) Menurut (Santoso, 2. dalam jurnal (Limia Budiarti & Cendana, 2. KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. METODE PENELITIAN Tahapan permasalahan bertujuan agar penelitian tersebut menghasilkan data yang benar dan tepat. Tahapan penelitian dapat dilihat pada Gambar di bawah ini. Gambar 1. Tahapan Penelitian Tahapan yang ada dalam penelitian ini mencakup kegiatan yang akan dilakukan diagram ini menggambarkan proses penelitian yang akan ditempuh JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 Tahapan yang akan dilakukan sebagai Pendahuluan Pada tahap ini penting untuk mengidentifikasi masalah dengan jelas dan terdefinisi dengan baik. Pengumpulan Data Pengumpulan mengumpulakan data yang diperlukan untuk penelitian dengan cara wawancara dengan kebagian keuangan dan Preprocesing Preprocesing adalah penting untuk memastikan bahwa data tersebut bersih dan valid. Hal ini dapat di lakukan dengan melakukan beberapa langkah yaitu: A Missing values adalah data yang hilang atau tidak tersedia. Missing values dapat dihapus, diimputasi, atau diabaikan, tergantung pada jenis data dan masalah yang ingin dipecahkan. A Outliers adalah data yang jauh berbeda dari nilai-nilai lain dalam dataset. Outliers dapat dihapus atau diimputasi, tergantung pada jenis data dan masalah yang ingin dipecahkan. A Normalisasi data adalah proses mengubah data menjadi skala yang sama. Normalisasi data dapat dilakukan dengan berbagai cara, seperti min-max scaling dan z-score normalization. Pengolahan Data Pada tahap ini data yang dikumupulkan diolah sesuai dengan tahapan Knowledge Discovery in Database (KDD) dengan menggunkan algoritma KMeans. Selanjutnya akan dilakukan pemrosesan data yang sebelumnya dari pengumupulan data dengan aplikasi RapidMiner. Clustering data dengan K-Means adalah teknik mengelompokkan data menjadi beberapa kelompok. Setiap kelompok memiliki karakteristik yang sama. Teknik ini dapat digunakan untuk mengidentifikasi pola dalam data. ISSN : 2985-4768 Membuat kesimpulan dari hasil penelitian yang dilakukan dan juga memberikan saran untuk pihak toko agar hasil dari penelitian ini menjadi lebih bermanfaat. proses KDD dimulai. Hasil dari data seleksi ini akan digunakan dalam proses data mining, disimpan di suatu berkas dan terpisah dari data operasional pengujian. Table 1. Data Selection Gambar 2. Proses KDD Kesimpulan dan Saran https://jurnal. id/index. php/JORAPI/index Data Cleaning Tahapan ini merupakan tahapan awal proses Knowledge Discovery in Database (KDD). Tahap ini, semua data mining value, berlebihan, dan tidak penting akan dibuang. Jika atribut dataset tidak ada atau kosong, data dianggap tidak memiliki nilai. Sebaliknya, jika atribut dataset lebih dari record berisikan nilai data yang sama, data dianggap redundant. Setelah data dibersihkan, data akan disimpan ke Microsoft Excel 2010 untuk langkah berikutnya. Berikut merupakan data yang sudah melalui tahap Cleaning. Transformation Data Tahap transformasi adalah tahap di mana data yang dipilih diubah sehingga sesuai untuk proses data Proses transformasi dalam KDD sangat kreatif dan bergantung pada jenis atau pola informasi yang akan dicari dalam basis data. Pada tahap ini, seluruh data operasional menghasilkan data pengelompokan atribut yang akan digunakan dalam proses data mining, yaitu atribut data jumlah dan kategori yang akan digunakan dalam proses data mining. JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 Pada atribut kategori data yang sebelumnya akan dilakukan perubahan data non-numeric ke bentuk numeric agar dapat diolah menggunakan algoritma KMeans. Proses Clustering Setelah data penjualan di Toko Eka Perabot pada bulan Januari hingga Februari 2025 berhasil dikumpulkan, kemudian dilakukan pengelompokan menggunakan metode K-Means Clustering. Algoritma K-Means digunakan untuk mengelompokkan 100 data penjualan dari toko tersebut. Dalam penelitian ini, dibentuk 3 kluster secara acak dengan 3 titik pusat awal, yaitu Centroid pertama, kedua, dan ketiga. Setelah titik pusat tersebut ditentukan, dihitung jarak antara setiap data penjualan ke masing-masing titik pusat dengan menggunakan metode Euclidean Distance. Selanjutnya, berdasarkan jarak terdekat hingga diperoleh titik pusat yang tidak berubah dan kluster yang sudah konvergen. Jika kluster belum konvergen, rumus rata-rata digunakan untuk mencari titik pusat baru selama proses Proses iterasi berhenti ketika kluster sudah konvergen dan titik pusat tidak berubah lagi. Pada penelitian ini, pengelompokan data penjualan Toko Eka Perabot menggunakan algoritma K-Means Clustering dilakukan secara komputerisasi dengan menggunakan software RapidMiner. Diagram K-Means Clustering pengelompokan data penjualan juga dibuat. HASIL DAN PEMBAHASAN Transformation Tahap transformasi adalah tahap di mana data yang dipilih diubah sehingga sesuai untuk proses data Proses transformasi dalam KDD sangat kreatif dan bergantung pada jenis atau pola informasi yang akan dicari dalam basis data. Pada tahap ini, seluruh data operasional menghasilkan data pengelompokan atribut yang akan digunakan dalam proses data mining, yaitu atribut data jumlah dan kategori yang akan digunakan dalam proses data mining. Pada atribut kategori data yang sebelumnya akan dilakukan perubahan data non-numeric ke bentuk numeric agar dapat diolah menggunakan algoritma KMeans. ISSN : 2985-4768 Metode K-Means Clustering Data siap untuk diolah dengan metode K-Means Clustering setelah melalui tahap pre-processing dan Perhitungan manual akan dilakukan menggunakan rumus jarak Euclidean dan data akan dipilih secara acak sebagai pusat cluster awal yaitu sebagai berikut: Menentukan Jumlah Cluster Untuk menentukan data penjualan yang banyak diminati, diminati, dan kurang diminati. Penelitian ini membutuhkan tiga cluster, banyak cluster tersebut telah diuji dengan metode Elbow yang menunjukan bahwa K=3 adalah cluster yang tepat untuk penelitian ini. Menentukan titik pusat awal Penelitian murah,menengah, dan mahal untuk menentukan titik pusat awal. Table 4. centroid awal Tabel di atas merupakan penentuan centroid awal yang digunakan untuk perhitungan data mining. Menghitung jarak object dengan centroidTable https://jurnal. id/index. php/JORAPI/index JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 Kemudian menghitung data dengan rumus Euclide Distance dengan rumus sebagai d( i,. = Oo. cn1ycn Oe yco1yco )2 . ca2ycn Oe yco2yco )2 Data ke 1 : Jarak ke C0 = Oo . Ae . A . - . A . Ae . A . Ae . A = 2 Jarak ke C1 = Oo . Ae . A . - . A . Ae . A . Ae . A = 6 Jarak ke C2 = Oo . Ae . A . - . A . Ae . A . Ae . A = 9 dan seterusnya, hitung hingga data ke 222 : sehingga menghasilkan seperti gambar di bawah ini : Tabel hasi perhitungan awal ISSN : 2985-4768 Selanjutnya tentukan Centroid baru atau ratarata data yang ada di masing-masing Cluster dengan Ocyco ya= ycu Ocyco ya= ycu Data 1 (Cluster . 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 2 3 2 ya =3 2 3 2 2 2 3 2 ya= ya = 2,308 Maka hasil Centroid Baru untuk Iterasi ke-1 adalah sebagai berikut: Table 6. Centroid baru Tabel di atas merupakan hasil dari perhitungan awal jarak object dengan centroid. https://jurnal. id/index. php/JORAPI/index Proses selanjutnya kembali ke menghitung jarak Euclide Distance dengan menggunakan Centroid baru untuk mendapatkan hasil dengan nilai rata-rata yang tidak berubah atau konvergen. Hasil perhitungan seluruhnya pada proses K-Means Clustering Iterasi ke 1 dapat terlihat pada tabel berikut: Table 7. Hasil Perhitungan Iterasi ke 1 JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 ISSN : 2985-4768 Gambar 4. Data yg ingin di uji Kemudian Sistem akan menampilkan Format Colums. Format tersebut dapat diubah sesuai type data. Dalam penelitian data train yang akan digunakan semua colom berisi data teks dan data angka maka format yang dipilih adalah polynominal dan integer. Format Colomns untuk bulan adalah polynominal. dan menu adalah polynominal . Serta Kode Menu adalah Integer dan Jumlah adalah Integer. Gambar 5. Format Data Data sudah berhasil masuk kedalam Rapid Miner Studio Lalu ulangi langkah perhitungan untuk menentukan cluster pada setiap iterasi sampai iterasi ke-n dengan posisi data cluster tidak berubah. Hasil akhir perhitungan dari jumlah 100 data menghasilkan C0 = 69 data. C1 = 7 data, dan C2 = 24 data yang dapat dilihat pada table berikut: Penerapan Algoritma K Means dengan Rapidminer Pada tahapan ini diawal dengan pemilihan data yang ingin di uji, dapat dilihat pada Gambar berikut: https://jurnal. id/index. php/JORAPI/index Gambar 6. Hasil Import Data Selanjutnya pengujian data > pilih menu Design > Drag and drop file Uji Data kedalam halaman process pada RapidMiner. JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 ISSN : 2985-4768 Proses ke 3 Gambar 7. Uji Data sambungkan retrieve Uji Data ke Clustering lalu pada pojok kanan paramenters K diubah untuk menentukan berapa Clustering yang akan dicari dan diproses. Proses ke 4 Gambar 8. Proses K Means Dibawah ini menampilkan hasil Clustering dimana data-data penduduk tersebut sudah tertera Clusternya. Proses ke 5 Gambar 9. Hasil data Dengan hasil jumlah Cluster 0 terdapat 7 items. Cluster 1 terdapat 15 items, dan Cluster 2 terdapat 8 item 1 Hasil Pengujian Proses ke 2 Proses ke 6 https://jurnal. id/index. php/JORAPI/index JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 220-229 ISSN : 2985-4768 Proses ke 7 Dari hasil analisa Cluster yang didapatkan data yang diukur untuk mencari jumlah Cluster yang paling baik untuk data penduduk Desa Rengasbandung dengan menggunakan Elbow Method sebagai berikut: Gambar 10. Metode Siku (Elbow Metho. Gambar diatas menunjukan bahwa Cluster yang paling baik digunakan adalah Cluster 3 karena pada Cluster 3 menunjukan sudut yang paling siku dengan hasil avgnya -430,29. Maka dari itu Cluster 3 merupakan Cluster yang paling baik untuk penelitian ini. KESIMPULAN 1 Berdasarkan kegiatan penelitian yang telah dilakukan, hasil implementasi dan pengujian menunjukkan bahwa https://jurnal. id/index. php/JORAPI/index Dari menggunakan analisis data Knowledge in Database dengan penerapan metode K-Means Clustering pada produk alat perabotan di Toko Eka Perabot, ditemukan 69 produk yang masuk ke dalam cluster 0 yang paling kurang diminat, 7 produk yang masuk ke dalam cluster 1 yang sangat diminati, dan 24 produk yang masuk ke dalam cluster 2 yang diminati. Dengan hasil tersebut. Toko Eka Perabot dapat mengetahui klasifikasi produk dan meningkatkan strategi penjualan berdasarkan data yang telah diperoleh. Dari hasil pengujian performa dalam penelitian ini menggunakan RapidMiner dengan alat avg. within centroid distance hingga proses ke-7, kemudian diukur menggunakan Elbow Method diperoleh nilai k-2 = -1577, 384, k-3 = -430,290, k-4 = 217,751, k-5 = -110,173, k-6 = -64,839, k-7 = -45,182. Dari hasil tersebut, cluster yang paling baik adalah cluster 3 yang menunjukkan sudut paling siku dengan nilai -430,290. Dengan hasil performa ini. Toko Eka Perabot dapat menerapkan metode ini untuk mengetahui klasifikasi terbaik dari data penjualan di toko tersebut. DAFTAR PUSTAKA