712
Progresif: Jurnal Ilmiah Komputer https://ojs.
stmik-banjarbaru.
id/index.
php/progresif/index Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 Perbandingan Algoritma K-Means dan DBSCAN dalam Pengelompokkan Data Penjualan Elektronik DOI: http://dx.
org/10.
35889/progresif.
Creative Commons License 4.
0 (CC BY AeNC) Tria Setyani1*.
Yulia Indriani2.
Muhammad Fadli3.
Erliyan Redy Susanto4 1,2,4Magister Ilmu Komputer.
Universitas Teknokrat Indonesia.
Bandar Lampung.
Indonesia 3Ekonomi dan Bisnis.
Politeknik Negeri Lampung.
Bandar Lampung.
Indonesia *e-mail Corresponding: tria_setyani@teknokrat.
Abstract This study aims to compare the performance of the K-Means and DBSCAN algorithms in clustering electronic sales data at CV Rey Gasendra.
Clustering methods are used to identify sales patterns based on the transaction intensity of each product.
The K-Means algorithm was implemented by determining the optimal number of clusters using the Elbow Method and Silhouette Score Meanwhile.
DBSCAN was applied using a density-based approach, which does not require specifying the number of clusters in advance and relies on eps and minPts parameters.
The results showed that K-Means produced more stable and interpretable clusters with a Silhouette Score of 0.
961, whereas DBSCAN excelled in detecting outliers and handling irregular data distributions, despite generating a large amount of noise.
Performance evaluation using metrics such as Silhouette Score.
Davies-Bouldin Index (DBI), and Sum of Squared Errors (SSE) indicated that K-Means is more suitable for structured product segmentation, while DBSCAN is more effective for exploring unusual sales patterns.
These findings can support data-driven business decisions, such as marketing strategies, inventory management, and product recommendations.
Keywords: K-Means.
DBSCAN.
Clustering.
Sales data.
Product segmentation Abstrak Penelitian ini bertujuan untuk membandingkan kinerja algoritma K-Means dan DBSCAN dalam pengelompokan data penjualan elektronik pada CV Rey Gasendra.
Metode clustering digunakan untuk mengidentifikasi pola penjualan berdasarkan intensitas transaksi setiap produk.
Algoritma KMeans diimplementasikan dengan penentuan jumlah klaster optimal menggunakan metode Elbow dan evaluasi Silhouette Score.
Sementara itu.
DBSCAN diimplementasikan dengan pendekatan berbasis kepadatan, tanpa memerlukan jumlah klaster awal, dan menggunakan parameter eps serta minPts.
Hasil penelitian menunjukkan bahwa K-Means memberikan hasil clustering yang lebih stabil dan mudah diinterpretasikan dengan Silhouette Score mencapai 0,961, sedangkan DBSCAN unggul dalam mendeteksi outlier dan menangani data dengan distribusi tidak beraturan, meskipun menghasilkan banyak noise.
Evaluasi performa berdasarkan metrik seperti Silhouette Score.
Davies-Bouldin Index (DBI), dan Sum of Squared Errors (SSE) menunjukkan bahwa KMeans lebih cocok digunakan untuk segmentasi produk penjualan yang terstruktur, sedangkan DBSCAN lebih efektif untuk eksplorasi pola penjualan yang tidak lazim.
Temuan ini dapat membantu pengambilan keputusan bisnis berbasis data, seperti strategi pemasaran, manajemen stok, dan rekomendasi produk.
Kata kunci: K-Means.
DBSCAN.
Clustering.
Data penjualan.
Segmentasi produk Pendahuluan Di era digital saat ini, informasi telah menjadi salah satu aset terpenting dalam pengambilan Kecepatan dan ketepatan dalam mengolah informasi berperan besar dalam meningkatkan efisiensi dan daya saing suatu entitas, termasuk dalam bidang penjualan.
Namun, banyaknya data yang tersedia sering kali belum memberikan manfaat optimal karena informasi yang relevan masih tersembunyi dalam kumpulan data yang besar dan kompleks.
Oleh karena itu, pemanfaatan metode analitik, khususnya teknik data mining, menjadi semakin penting untuk Perbandingan Algoritma K-Means dan DBSCAN dalam.
Tria Setyani Progresif e-ISSN: 2685-0877 membantu proses pengambilan keputusan yang berbasis data.
CV Rey Gasendra merupakan sebuah usaha yang bergerak di bidang penjualan handphone dan berbagai perangkat elektronik lainnya seperti kulkas, televisi, dan mesin cuci.
Dalam operasionalnya, perusahaan ini menghadapi permasalahan dalam mengelompokkan data penjualan produk berdasarkan pola tertentu.
Masalah ini menyebabkan kesulitan dalam memahami preferensi pelanggan dan tren pasar, sehingga berpengaruh terhadap efektivitas strategi penjualan.
Berdasarkan hasil analisis awal, data penjualan belum dikelompokkan secara sistematis, dan belum ada metode yang digunakan untuk mengetahui segmen pasar secara Sebagai solusi untuk mengatasi permasalahan tersebut, penerapan teknik clustering dalam data mining dapat digunakan untuk mengelompokkan data penjualan berdasarkan kemiripan Dua metode clustering yang umum digunakan adalah K-Means dan DBSCAN .
K-Means efektif dalam mengelompokkan data yang memiliki bentuk cluster yang jelas dan ukuran seragam, namun sensitif terhadap outlier dan membutuhkan jumlah cluster yang ditentukan di awal .
Sebaliknya.
DBSCAN dapat mendeteksi cluster dengan bentuk arbitrer dan secara otomatis mengabaikan outlier, tanpa harus menentukan jumlah cluster terlebih dahulu .
Studi sebelumnya menunjukkan bahwa pemilihan metode clustering yang tepat sangat bergantung pada karakteristik data yang digunakan .
, sehingga perlu dilakukan evaluasi terhadap masing-masing metode dalam konteks data penjualan elektronik di CV Rey Gasendra.
Penelitian ini bertujuan untuk membandingkan performa algoritma K-Means dan DBSCAN dalam mengelompokkan data penjualan di CV Rey Gasendra.
Hasil dari penelitian ini diharapkan dapat memberikan masukan dalam memilih metode clustering yang paling sesuai, sehingga dapat digunakan untuk mendukung strategi pemasaran, memahami perilaku konsumen, serta meningkatkan efektivitas pengelolaan data penjualan secara menyeluruh.
Tinjauan Pustaka Beberapa penelitian terdahulu telah mengkaji penggunaan algoritma clustering untuk pengelompokan data penjualan.
Algoritma K-Means pada data penjualan produk elektronik di Batam IT Mart dengan parameter jenis produk dan volume penjualan.
Hasil penelitian tersebut menghasilkan tiga klaster, yaitu produk dengan penjualan tinggi, sedang, dan rendah, yang dapat dimanfaatkan untuk strategi promosi .
Penelitian lain yang membandingkan tiga metode clustering, yaitu K-Means.
DBSCAN, dan Hierarchical Clustering pada data penjualan handphone di marketplace elektronik.
Penelitian ini menunjukkan bahwa metode Hierarchical menghasilkan nilai silhouette terbaik sebesar 0.
944, namun DBSCAN lebih efektif dalam menangani data dengan noise .
Memanfaatkan DBSCAN dengan bantuan metode Elbow untuk mengelompokkan data persediaan barang ritel, serta menilai keakuratan cluster berdasarkan parameter epsilon dan minPts .
Sementara itu, penelitian lain yang menerapkan K-Means untuk mengelompokkan data penjualan smartphone berdasarkan unit terjual, kapasitas memori, dan warna produk, dengan hasil evaluasi menggunakan silhouette coefficient mencapai 0.
Penelitian ini memiliki perbedaan signifikan dibandingkan penelitian sebelumnya.
Selain membandingkan secara langsung performa algoritma K-Means dan DBSCAN, penelitian ini dilakukan pada data penjualan riil CV Rey Gasendra yang memiliki karakteristik data variatif dan berpotensi mengandung outlier.
Penelitian ini juga menggunakan parameter yang lebih kompleks, seperti frekuensi pembelian, kategori produk, serta jumlah transaksi, dan mengevaluasi hasil klaster tidak hanya dari sisi teknis (Silhouette Scor.
, tetapi juga dari kesesuaiannya terhadap kebutuhan strategi bisnis perusahaan.
Oleh karena itu, penelitian ini menawarkan pendekatan yang lebih aplikatif dan relevan dalam konteks pengambilan keputusan di sektor ritel elektronik Metodologi Algoritma Kmeans dan DBSCAN Algoritma K-Means merupakan metode klasterisasi berbasis partisi yang membagi data ke dalam k klaster berdasarkan kedekatan jarak terhadap pusat klaster .
Proses iteratif algoritma ini dimulai dengan inisialisasi jumlah klaster .
dan penempatan centroid awal secara K-Means adalah salah satu metode clustering non-hierarki .
yang bertujuan untuk membagi kumpulan data ke dalam dua atau lebih kelompok .
Tujuan dari metode ini adalah mengelompokkan data yang memiliki karakteristik serupa ke dalam satu klaster, sementara data dengan ciri yang berbeda dimasukkan ke dalam klaster lain .
Secara umum, proses pengelompokan menggunakan algoritma K-Means dilakukan melalui langkah-langkah berikut:
Perbandingan Algoritma K-Means dan DBSCAN dalam.
Tria Setyani 714 e-ISSN: 2685-0877 Menentukan jumlah klaster .
yang diinginkan.
Membagi data ke dalam k klaster awal.
Menghitung pusat klaster .
untuk setiap kelompok berdasarkan data yang telah dikelompokkan, yang dapat dinyatakan dalam bentuk persamaan.
yaycn = ycA OcycA yc=1 ycuyc Keterangan:
C adalah centroid.
M adalah jumlah data, dan i menyatakan jumlah kelompok.
Setiap data akan dialokasikan ke centroid terdekat.
Perhitungan jarak antar data dan centroid dilakukan menggunakan rumus jarak Euclidean sebagaimana dinyatakan dalam yc ya .
cuycn , yaycn ) = ocyc=1 ycuycnyc Oe ycaycnyc )2 .
Kembali ke langkah 3 apabila masih ada data yang berpindah kelompok DBSCAN (Density-Based Spatial Clustering of Applications with Nois.
adalah salah satu algoritma awal yang memperkenalkan pendekatan clustering berbasis kepadatan, yang dikenal sebagai density-based clustering dalam ranah data mining.
Prinsip kerja DBSCAN didasarkan pada identifikasi area dengan kepadatan tinggi yang saling terhubung .
ensity-connecte.
Dalam metode ini, wilayah tertentu akan dibentuk menjadi sebuah klaster jika memenuhi jumlah minimum objek yang telah ditentukan.
Sementara itu, data yang tidak termasuk dalam klaster mana pun dianggap sebagai noise atau data luar yang tidak sesuai dengan pola klaster yang terbentuk .
Langkah-langkah dalam algoritma DBSCAN dapat dijelaskan sebagai berikut:
Menetapkan terlebih dahulu nilai parameter minPts dan eps.
Memilih titik awal p secara acak dari kumpulan data.
Mengulangi proses untuk setiap titik dalam dataset.
Menghitung nilai eps, yaitu jarak antara titik-titik yang berada dalam jangkauan kepadatan .
ensity reachabl.
dari titik p, dengan menggunakan rumus:
Jika jumlah titik dalam radius eps melebihi atau sama dengan minPts, maka titik p diklasifikasikan sebagai core point dan akan menjadi pusat dari klaster yang terbentuk.
Namun, apabila titik p hanya memiliki sedikit titik dalam jangkauannya dan tidak memenuhi syarat sebagai core point, serta tidak terdapat titik yang density reachable, maka titik tersebut dianggap sebagai border point atau noise, dan algoritma akan melanjutkan perhitungan pada titik lainnya.
Data dan Parameter Data yang digunakan dalam penelitian ini merupakan data transaksi penjualan elektronik di CV Rey Gasendra selama periode September hingga Desember 2024.
Dataset mencakup atribut seperti tanggal transaksi, jenis produk, jumlah barang terjual, harga satuan, dan total penjualan.
Data yang bersifat kategorikal seperti jenis produk dikonversi ke bentuk numerik, sedangkan variabel numerik dinormalisasi menggunakan Min-Max Scaler.
Parameter input untuk proses klasterisasi meliputi jumlah produk terjual, harga satuan, dan total penjualan.
Sementara itu, output yang menjadi luaran adalah label klaster hasil pengelompokan data.
Jumlah data yang digunakan sebanyak 240 entri transaksi.
Data yang memiliki nilai kosong .
issing valu.
atau duplikat dibersihkan pada tahap awal pra-pemrosesan.
Hasil dan Pembahasan 1 Sampel Data Penelitian Data penelitian ini diambil dari transaksi penjualan berbagai produk elektronik di CV Rey Gasendra selama periode September hingga Desember 2024.
Dataset terdiri dari total 240 entri transaksi dan mencakup lebih dari 60 jenis produk, termasuk handphone, televisi, mesin cuci, kulkas, dan perangkat elektronik lainnya.
Setiap kolom mewakili satu jenis produk dengan nilai berupa jumlah unit terjual.
Data awal telah melalui proses pembersihan, seperti penghapusan nilai Progresif: Vol.
No.
Agustus 2025: 712-721 Progresif e-ISSN: 2685-0877 kosong, baris duplikat, serta data tidak relevan, guna memastikan kualitas dan konsistensi data sebelum dilakukan proses analisis klasterisasi.
Table 1 Data Sampel Penelitian Jumlah Harga Terjual Satuan Samsung A03 Xiaomi Redmi Note 11 Polytron Speaker PAS LG Kulkas 2 Pintu Sharp TV LED 32 Inch Oppo A57 Samsung Mesin Cuci Front Load Philips Blender HR2116 LG LED TV 43 Inch Cosmos Kipas Angin 16 Inch Vivo Y21 Realme Narzo 50A Prime LG Mesin Cuci Twin Tub 9 Kg Aqua Kulkas 1 Pintu Samsung TV LED 40 Inch Polytron Blender PLD-310 Sanken Dispenser HWD-Z88 Panasonic Kipas Angin Stand Fan Electrolux Mesin Cuci 8 Kg Realme C55 NFC Produk Total Penjualan 2 Implementasi Algoritma Data penjualan elektronik di CV Rey Gasendra mencakup daftar produk, jumlah terjual, harga satuan, dan total penjualan selama periode penelitian.
Tahap pra-pemrosesan dilakukan untuk memastikan data yang digunakan bersih dan siap diolah pada tahap analisis clustering.
Langkah-langkah yang dilakukan meliputi penghapusan duplikasi nama produk, normalisasi penulisan nama agar konsisten, penghapusan entri dengan jumlah terjual nol .
, serta penyesuaian skala data jumlah terjual menggunakan metode normalisasi agar seluruh variabel berada dalam rentang yang seragam.
Hasil pra-pemrosesan data penjualan disajikan pada Tabel 2 berikut:
Table 2 Hasil Pra-pemrosesan Data Penjualan Jumlah Jumlah Terjual Nama Produk Terjual (Ternormalisas.
Samsung A03 Xiaomi Redmi Note 11 Polytron Speaker PAS LG Kulkas 2 Pintu Sharp TV LED 32 Inch Oppo A57 Samsung Mesin Cuci Front Load Philips Blender HR2116 LG LED TV 43 Inch Cosmos Kipas Angin 16 Inch Vivo Y21 Realme Narzo 50A Prime LG Mesin Cuci Twin Tub 9 Kg Aqua Kulkas 1 Pintu Samsung TV LED 40 Inch Sumber: Data penjualan elektronik CV Rey Gasendra .
iolah, 2.
Perbandingan Algoritma K-Means dan DBSCAN dalam.
Tria Setyani 716 e-ISSN: 2685-0877 Dengan pra-pemrosesan ini, data sudah bersih, terstandarisasi, dan siap digunakan pada tahap analisis selanjutnya.
3 Pengujian performance algoritma .
Implementasi Algoritma K-Means Algoritma K-Means digunakan untuk membagi produk menjadi beberapa kelompok berdasarkan pola penjualannya.
Jumlah kluster .
ditentukan menggunakan metode Elbow, dengan evaluasi nilai inertia untuk variasi nilai k = 2 hingga k = 6.
Berdasarkan grafik Elbow, nilai optimal diperoleh pada k = 4 .
Berdasarkan perhitungan, diperoleh empat klaster dengan rata-rata nilai ternormalisasi sebagai berikut:
Kluster 0 (Penjualan Renda.
: 0.
00 Ae 0.
Kluster 1 (Penjualan Sedan.
: 0.
30 Ae 0.
Kluster 2 (Penjualan Tingg.
: 0.
61 Ae 0.
Kluster 3 (Best-selle.
: 0.
81 Ae 1.
Table 3 Hasil Pengelompokan Produk dengan K-Means Nama Produk Jumlah Terjual Jumlah Terjual (Ternormalisas.
Kluster Samsung A03 Xiaomi Redmi Note 11 Polytron Speaker PAS LG Kulkas 2 Pintu Sharp TV LED 32 Inch Oppo A57 Samsung Mesin Cuci Front Load Philips Blender HR2116 LG LED TV 43 Inch Cosmos Kipas Angin 16 Inch Vivo Y21 Realme Narzo 50A Prime LG Mesin Cuci Twin Tub 9 Kg Aqua Kulkas 1 Pintu Samsung TV LED 40 Inch Sumber: Hasil pengolahan data penjualan CV Rey Gasendra .
Dengan hasil ini, perusahaan dapat menyusun strategi berbeda untuk setiap segmen produk, misalnya memberikan promosi khusus pada produk di kluster penjualan rendah atau memastikan stok cukup untuk produk best-seller.
Visualisasi hasil clustering ini akan dilakukan menggunakan PCA (Principal Component Analysi.
untuk mereduksi dimensi data ke dua dimensi agar dapat divisualisasikan dalam scatter plot.
Titik-titik warna menunjukkan alokasi kluster, sementara centroid ditandai dengan tanda bintang (*).
Implementasi Algoritma DBSCAN DBSCAN digunakan sebagai pendekatan non-parametrik untuk clustering, tidak memerlukan input jumlah kluster secara eksplisit.
Parameter utama yang disetel adalah eps .
arak maksimum antar titik tetangg.
dan min_samples .
umlah minimum titik untuk membentuk cluste.
Melalui eksperimen parameter, didapat nilai optimal: eps=0.
5, min_samples=5.
Hasil clustering DBSCAN menghasilkan tiga kluster utama dan beberapa outlier .
roduk dengan pola penjualan unik atau tidak releva.
Kluster 0: Produk dengan penjualan rendah Kluster 1: Produk dengan penjualan sedang Kluster 2: Produk dengan penjualan tinggi Outlier (-.
: Produk dengan pola penjualan yang tidak biasa atau jarang terjual Progresif: Vol.
No.
Agustus 2025: 712-721 Progresif e-ISSN: 2685-0877 Table 4 Hasil Pengelompokan Produk dengan DBSCAN Jumlah Jumlah Terjual Nama Produk Terjual (Ternormalisas.
Kluster Samsung A03 Xiaomi Redmi Note 11 Polytron Speaker PAS LG Kulkas 2 Pintu Sharp TV LED 32 Inch Oppo A57 Samsung Mesin Cuci Front Load Philips Blender HR2116 LG LED TV 43 Inch 10 Cosmos Kipas Angin 16 Inch 11 Vivo Y21 12 Realme Narzo 50A Prime 13 LG Mesin Cuci Twin Tub 9 Kg 14 Aqua Kulkas 1 Pintu 15 Samsung TV LED 40 Inch Sumber: Hasil pengolahan data penjualan CV Rey Gasendra .
Visualisasi juga dilakukan menggunakan PCA, di mana titik hitam menunjukkan outlier, dan titik berwarna lainnya menunjukkan kluster utama.
Visualisasi Hasil Clustering Berikut adalah deskripsi visualisasi hasil clustering:
Gambar 1.
Grafik Hubungan Jumlah Klaster Terhadap Skor silhouette Grafik Gambar 1 menunjukkan hubungan antara jumlah klaster .
dan skor silhouette pada algoritma K-Means.
Nilai silhouette mengukur seberapa baik objek cocok dengan klasternya sendiri dibandingkan dengan klaster lain.
Hasil menunjukkan bahwa nilai tertinggi terjadi pada k = 2, dengan skor sebesar 0,961, menandakan bahwa data paling optimal dibagi menjadi dua klaster Setelah k > 2, skor menurun drastis, menunjukkan bahwa menambah jumlah klaster tidak meningkatkan kualitas pengelompokan, bahkan justru memperburuknya.
Perbandingan Algoritma K-Means dan DBSCAN dalam.
Tria Setyani 718 e-ISSN: 2685-0877 Visualisasi K-Means Gambar 2.
Grafik Hasil Klasterisasi K-Means Grafik ini menampilkan hasil klasterisasi K-Means dengan k = 2 dalam ruang dua dimensi yang direduksi menggunakan PCA (Principal Component Analysi.
Masing-masing titik merepresentasikan satu transaksi penjualan elektronik yang telah diproyeksikan dari dimensi tinggi menjadi dua komponen utama.
Warna berbeda menunjukkan dua klaster utama:
A Klaster 0 .
: Mayoritas transaksi, cenderung merepresentasikan pembelian dalam jumlah kecil atau produk bernilai rendah.
A Klaster 1 .
: Kelompok minoritas dengan ciri transaksi bernilai tinggi atau pembelian dalam jumlah banyak.
Visualisasi ini memperkuat hasil dari Gambar 1 bahwa pembagian dua klaster sudah cukup baik untuk menggambarkan struktur utama dalam data.
Visualisasi DBSCAN Gambar 3.
Grafik Hasil Klasterisasi algoritma DBSCAN Visualisasi Gambar 3 memperlihatkan hasil klasterisasi menggunakan algoritma DBSCAN dalam ruang dua dimensi hasil reduksi PCA.
Warna berbeda menunjukkan masing-masing klaster padat .
otal 49 klaste.
, sedangkan titik berwarna abu-abu merepresentasikan titik noise, yaitu data yang tidak dimasukkan ke dalam klaster manapun oleh DBSCAN karena dianggap tidak cukup padat atau terisolasi.
Distribusi klaster terlihat tidak seragam, banyak klaster kecil muncul akibat sensitivitas parameter eps=0.
5 dan min_samples=5, sementara noise berjumlah sangat besar .
, menandakan banyak transaksi dianggap tidak membentuk pola yang konsisten.
Progresif: Vol.
No.
Agustus 2025: 712-721 Progresif e-ISSN: 2685-0877 Evaluasi Perbandingan Kinerja Evaluasi terhadap dua algoritma klasterisasi, yaitu K-Means dan DBSCAN, dilakukan untuk menentukan metode terbaik dalam mengelompokkan data penjualan elektronik pada CV Rey Gasendra.
Evaluasi mencakup beberapa aspek utama: akurasi segmentasi, deteksi outlier, stabilitas hasil, kemudahan interpretasi bisnis, dan efisiensi komputasi .
Akurasi Segmentasi (Silhouette Scor.
Kinerja klasterisasi pertama kali dievaluasi menggunakan Silhouette Score, yang mengukur seberapa baik data cocok dalam klasternya masing-masing dibandingkan dengan klaster Algoritma K-Means dengan jumlah klaster optimal k=2 memberikan nilai Silhouette Score sebesar 0,961, yang mengindikasikan bahwa hasil segmentasi sangat baik dan terpisah dengan jelas antar klaster.
Sebaliknya.
DBSCAN hanya memperoleh skor 0,234 setelah mengeluarkan data noise, menunjukkan bahwa bentuk klaster yang dihasilkan kurang terdefinisi dan tumpang tindih.
Kemampuan Deteksi Outlier Salah satu keunggulan DBSCAN adalah kemampuannya dalam mendeteksi outlier atau data yang tidak termasuk dalam klaster manapun.
Pada analisis ini.
DBSCAN berhasil mengidentifikasi 440 transaksi sebagai noise, yang sebagian besar merupakan transaksi unik atau tidak lazim seperti pembelian barang sangat mahal dalam jumlah kecil.
Sementara itu.
K-Means tidak secara eksplisit menangani outlier dan tetap memasukkan semua data ke dalam klaster, berpotensi menurunkan akurasi segmentasi jika terdapat transaksi ekstrem.
Stabilitas dan Konsistensi Algoritma K-Means menunjukkan kestabilan hasil yang tinggi selama parameter k ditentukan dengan benar.
Penggunaan metode Elbow dan evaluasi silhouette membantu dalam memilih nilai k yang optimal.
Sebaliknya, hasil DBSCAN sangat sensitif terhadap perubahan parameter eps dan min_samples.
Perubahan kecil dalam parameter ini dapat menghasilkan jumlah klaster yang sangat berbeda, menyebabkan fragmentasi klaster yang tinggi dan menurunkan Interpretasi dan Kegunaan Bisnis Dari sisi praktis, hasil klasterisasi K-Means jauh lebih mudah diinterpretasikan.
Dua klaster utama yang terbentuk dapat digambarkan sebagai:
Klaster pertama .
terdiri dari transaksi rutin bernilai rendah.
Klaster kedua berisi transaksi besar dengan nilai pembelian tinggi, seperti produk bundel atau barang premium.
Model ini secara langsung dapat dimanfaatkan untuk strategi pemasaran seperti promosi tersegmentasi, rekomendasi produk, atau manajemen stok.
Sebaliknya, hasil DBSCAN sulit untuk digunakan secara praktis karena banyaknya klaster kecil dan ketidakteraturan bentuk klaster, meskipun tetap bermanfaat untuk mendeteksi pola pembelian yang menyimpang dari tren umum.
Efisiensi Komputasi K-Means terbukti lebih efisien dalam waktu pemrosesan dan cocok digunakan untuk data berdimensi tinggi seperti transaksi penjualan multi-produk.
Proses pelatihan cepat dan hasil yang diperoleh stabil.
Sementara DBSCAN memerlukan waktu lebih lama, khususnya dalam dataset dengan banyak dimensi dan data sparsity tinggi, akibat kompleksitas perhitungan radius dan kepadatan lokal.
Pembahasan Penelitian ini dilakukan untuk menjawab permasalahan terkait pengelompokan data penjualan elektronik yang belum optimal di CV Rey Gasendra.
Dengan menggunakan algoritma K-Means dan DBSCAN, penelitian ini berhasil melakukan segmentasi terhadap produk-produk yang dijual berdasarkan karakteristik penjualannya.
Hasil klasterisasi dengan K-Means menunjukkan kelompok produk yang memiliki kemiripan dalam jumlah terjual dan total penjualan, sementara DBSCAN dapat mengidentifikasi produk-produk dengan pola penjualan yang menyimpang .
Temuan ini menunjukkan bahwa kedua algoritma memiliki potensi dalam mendukung pengambilan keputusan bisnis terkait strategi pemasaran dan pengelolaan stok Perbandingan Algoritma K-Means dan DBSCAN dalam.
Tria Setyani 720 e-ISSN: 2685-0877 Kinerja K-Means menghasilkan pembentukan klaster yang lebih terstruktur dan stabil, sehingga memudahkan interpretasi dalam konteks bisnis.
Di sisi lain.
DBSCAN memberikan keunggulan dalam mendeteksi data noise yang mencerminkan produk-produk yang tidak termasuk dalam pola umum penjualan, yang penting untuk evaluasi produk dengan penjualan rendah atau tidak stabil.
Penelitian ini memperkuat hasil studi terdahulu yang menyatakan bahwa K-Means cocok untuk data yang terdistribusi normal dan DBSCAN lebih unggul dalam menangani outlier.
Selain itu, penelitian juga juga menegaskan bahwa integrasi antara pemahaman algoritma berbasis centroid dan density dapat memberikan hasil klaster yang lebih kaya dalam konteks bisnis .
Kontribusi penting dari penelitian ini terletak pada penerapan dua algoritma clustering secara komparatif dalam konteks data penjualan ritel elektronik lokal.
Penelitian ini juga menambahkan nilai melalui evaluasi multi-metrik (Silhouette Score.
DBI.
SSE) dan penerapan data asli toko retail skala menengah.
Dengan demikian, hasil penelitian ini dapat memperluas pemanfaatan teknik data mining dalam pengelompokan produk untuk mendukung pengambilan keputusan strategis yang lebih tepat sasaran.
Simpulan Berdasarkan analisis dan hasil clustering menggunakan algoritma K-Means dan DBSCAN pada data penjualan produk elektronik di CV Rey Gasendra, dapat disimpulkan bahwa kedua metode memiliki keunggulan masing-masing dalam segmentasi data penjualan.
Algoritma K-Means efektif dalam mengelompokkan produk berdasarkan intensitas penjualan, terutama jika jumlah klaster telah diketahui sebelumnya, sehingga cocok untuk segmentasi yang bersifat terstruktur dan mudah diinterpretasikan secara bisnis.
Sementara itu.
DBSCAN menunjukkan keunggulan dalam mendeteksi outlier dan membentuk klaster tanpa perlu menentukan jumlah klaster di awal, menjadikannya lebih adaptif terhadap data yang memiliki pola distribusi tidak beraturan.
Dengan demikian.
DBSCAN dapat digunakan untuk mengidentifikasi produk dengan pola penjualan tidak lazim yang mungkin memerlukan strategi khusus.
Dengan memanfaatkan kedua metode secara bersamaan, perusahaan dapat menerapkan strategi bisnis berbasis data, seperti optimasi pengelolaan stok, perencanaan promosi, serta rekomendasi produk yang disesuaikan berdasarkan kelompok performa penjualan.
Hasil penelitian ini diharapkan dapat menjadi dasar dalam pengambilan keputusan strategis yang lebih tepat sasaran dan berorientasi pada data historis penjualan.
Referensi