P-ISSN: 2723-8202
E-ISSN: 2503-1171
Volume 9.
No 1.
April 2024.
Page: 17-25
KLASTERISASI DATA PENJUALAN TERLARIS PRODUK
KOSMETIK YOU MENGGUNAKAN ALGORITMA K-MEANS
Aprillia Anjani .
April Lia Hananto .
Tukino.
dan Shofa Shofiah Hilabi .
Jurusan Sistem Informasi.
Fakultas Ilmu Komputer.
Universitas Buana Perjuangan Karawang e-mail: si20.
aprilliaanjani@mhs.
Abstract [Classterization of best-selling sales data for your cosmetic products using the k-means algorith.
There are many types of businesses in Indonesia that attract people's attention and increase competition by creating creativity in various business ideas.
The Indonesian cosmetics and skin care company is a Y.
U brand dedicated to the beauty of Indonesian women, produced according to people's needs and current trends.
The task of data mining is to collect or group large amounts of data based on various predetermined criteria.
Cluster data mining is ideal for algorithms that can process data more efficiently, namely the K-Means algorithm.
The K-Means Clustering algorithm is a method used to combine several data streams to analyze data and determine the number of Clusters that have different characteristics from other data.
The expected result is to have a group of data that will influence the sales strategy in the next period so that you can find out which items are best sold and which items are less popular with customers.
This decision will minimize the losses previously received by PT Lintas Mandiri primarily on YOU cosmetics.
With this data, it can be grouped into 3 clusters based on the level of sales of a type of product.
Cluster 0 consists of 8 product items that have the best selling level, while in Cluster 1, which includes 12 product items in the best-selling category, and Cluster 2, which consists of 5 items.
Products that are not selling well in this Cluster show a steady or even decreasing trend from month to month with the Centroid value indicating the unpopularity of these products in the market.
Keywords: Clustering.
Cosmetics Sales Data.
Data Mining.
K-Means.
Best Selling Product.
Abstrak Ada banyak jenis bisnis di indonesia yang menyita fokus masyarakat serta meningkatkan kompetisi dengan menghasilkan kreativitas dalam berbagai gagasan bisnis.
Perusahaan kosmetik dan perawatan kulit indonesia merupakan brand kosmetik Y.
U yang didedikasikan untuk kecantikan wanita indonesia, diproduksi sesuai dengan kebutuhan masyarakat dan tren saat ini.
Tugas data mining adalah mengumpulkan atau mengelompokkan data dalam jumlah besar berdasarkan berbagai kriteria yang telah ditentukan.
Cluster data mining sangat ideal sebagai algoritma yang bisa mengelola data dengan cara lebih efisien, seperti algoritma K-Means.
Algoritma Clustering K-Means ialah prosedur yang digunakan untuk menggabungkan beberapa aliran data untuk menganalisis data dan menentukan jumlah Cluster yang memiliki karakteristik berbeda dari data lainnya.
Temuan yang diinginkan ialah terdapatnya kumpulan data yang berdampak bagi strategi penjualan pada periode berikutnya sehingga dapat mengetahui barang yang paling terlaris yang dijual dan barang yang kurang laris.
Kebijakan ini bisa menyusutkan defisit yang didapat oleh PT Jalur Mandiri utama dahulunya pada kosmetik YOU.
Dengan data tersebut dapat dikelompokan menjadi 3 Clustering yang didasarkan pada tingkat kesuksesan penjualan suatu jenis produk Cluster 0 yang terdiri dari 8 produk item yang memiliki tingkat penjualan laris.
Sedangkan Dalam Cluster 1 yang mencakup 12 item produk dengan kategori paling laris dan Cluster 2 yang terdiri dari 5 item produk yang tidak laris, dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar.
Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Kata Kunci: Clustering.
Data Penjualan Kosmetik.
Data Mining.
K-Means.
Produk Terlaris Pendahuluan Ada banyak jenis bisnis di Indonesia yang menyita fokus masyarakat serta meningkatkan kompetisi dengan menghasilkan kreativitas dalam berbagai gagasan bisnis.
Saat ini, barang konsumsi, atau kosmetik dan produk perawatan kulit, merupakan industri yang sangat populer (Amalina et al.
, 2.
Tidak dapat dipungkiri bahwa industri kosmetik dan perawatan kulit Indonesia selalu mengalami pertumbuhan serta terus digemari oleh seluruh lapisan masyarakat, khususnya perempuan (Lia Hananto et al.
, 2.
Setiap produk tentunya memiliki kelebihan yang membedakannya dengan kompetitor lainnya.
Perusahaan kosmetik dan perawatan kulit indonesia merupakan merek Y.
U atau perusahaan kosmetik dan perawatan kulit yang didedikasikan untuk kecantikan wanita indonesia, diproduksi sesuai dengan kebutuhan masyarakat dan tren saat ini (PT Jalur Mandiri Utama.
Penambangan data adalah metode komputer yang mencari pola tertentu dalam kumpulan data besar untuk membantu menemukan dan mengelompokkan informasi yang obyektif dan efektif (Agneresa et al.
, 2.
Tugas data mining adalah mengumpulkan atau mengelompokkan data dalam jumlah besar berdasarkan berbagai kriteria yang telah ditentukan (Tukino & Huda, 2.
Cluster data mining sangat ideal sebagai algoritma yang bisa mengelola data dengan cara lebih efisien, seperti algoritma K-Means (Mangku Negara et al.
, 2.
Algoritma Clustering K-Means adalah metode yang dipakai guna menggabungkan beberapa aliran data untuk menganalisis data dan menentukan jumlah Cluster yang memiliki karakteristik berbeda dari data lainnya.
Berdasarkan karya ( et al.
, 2.
Pada topik ini terdapat tiga Cluster dalam klasifikasi data penerapan dinamis K-Means hasil penelitian tahun 2021 ini.
Data mining adalah praktek mengeksplorasi informasi dalam dataset besar untuk mengidentifikasi keterkaitan, corak, serta kecenderungan yang signifikan (Lia Hananto et al.
, 2.
K-Means Clustering yakni prosedur penggabungan data non-hirarki yang membagi data menjadi cluster, mengumpulkan data dengan atribut serupa bersama-sama, serta memisahkan data dengan fitur yang berlainan ke dalam cluster yang tidak sama (Amalina et al.
, 2.
Algoritma K-Means termasuk partitioning (Pembelajaran et al.
, 2.
Clustering yang membagi data menjadi k wilayah terpisah.
Algoritma K-Means dikenal luas karena kesederhanaan serta kecepatannya dalam menggabungkan dataset besar serta data yang jauh dari pola utama amat cepat (Situmorang et al.
, 2.
Pada algoritma K-Means, masing-masing data mesti tergabung dalam satu kluster tertentu, namun pada setiap iterasi proses, ada kemungkinan bagi data tersebut untuk beralih ke kluster lain yang lebih sesuai (Darmi & Setiawan.
Temuan yang diinginkan ialah terdapatnya kumpulan data yang berdampak bagi strategi penjualan pada periode berikutnya sehingga dapat mengetahui barang yang terlaris dijual dan barang yang kurang disenangi Kebijakan ini bisa menyusutkan defisit yang didapat oleh PT Jalur Mandiri utama dahulunya pada kosmetik YOU (Yansah et al.
, 2.
Metode Pada prosedur yang dijalankan studi ini adalah seperti dibawah :
Gambar 1.
Alur Studi Tahapan Data Mining Tahapan data mining untuk pengelompokan produk skincare dan kosmetik you dimulai dengan cara sebagai berikut : proses Cleaning, yaitu membersihkan data dari aplikasi kasir yang telah dicetak.
Tahap selanjutnya adalah Integration, dimana data penjualan dikonsolidasikan pada lokasi yang sudah dipersiapkan.
Setelah itu.
Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans dilakukan tahap Selection untuk mengambil sampel data dari sejumlah data dahulunya untuk dipakai sebagai pembanding serta memastikan data tersebut sesuai dengan kebutuhan.
Algoritma K-Means Dibawah ini adalah proses algoritma Clustering K-Means didalam data mining:
Gambar 2.
Diagram Alur Penelitian Diagram tersebut menggambarkan langkah-langkah dalam algoritma K-Means, yang dapat disajikan sebagai Persiapkan data sesuai keperluan sebagai sampel.
Tetapkan banyaknya Cluster.
Tentukan angka Centroid atau pusat klaster.
Gunakan model Euclidean untuk menilai jarak antara setiap data dan centroid klaster dengan karakteristik yang serupa atau mirip:
yccycnyc = Oo.
cu1ycn Oe ycu1yc.
cU2ycn Oe ycU2yc.
2 A .
cuycoycn Oe ycuycoyc.
2 Dengan penjelasan :
Dij = Jarak data ke Ae i ke titik pusat (Cluster .
Xki = Data ke - i attribute data ke Ae k.
Xkj = Data ke Ae j attribut data je Ae j.
Results Penggabungan produk kosmetik relevan dengan kategori produk yang paling terlaris, laris, serta kurang laris supaya mudah dijangkau dan tidak ada penumpukan stok barang, langkah ini dijalankan dengan pengimplementasian algoritma kAimeans memakai rumus :
yccycnyc = Oo.
cu1ycn Oe ycu1yc.
cU2ycn Oe ycU2yc.
2 A .
cuycoycn Oe ycuycoyc.
Implementasi banyak Cluster (K) yakni 120 Cluster, setelah menentukan banyak Cluster, tetapkan titik fokus awal Cluster (Centroi.
Hasil dan Pembahasan Analisis Data Merekapitulasi data Bisa diketahui hasil perdagangan Kosmetik YOU selama satu tahun yaitu tahun 2023 terdapat beberapa barang yang menumpuk dan penjualan yang menurun.
Berikut data penjualan produk kosmetik di Guardian Resinda Tahun 2023.
Berikut data penjualan YOU pada tahun 2023 :
Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Tabel 1.
Data Penjualan Nama Produk
B10
B11
B12
Lipstik Matte Rouge Velvet Lipstik Matte Power Lip Cream Skintin Maskara Eyliner Sikncare Paket Acneplus Skincare Paket Golden Age Skincare Paket Radiance Up Skincare Paket Dazling Skincare Paket Radiance Glow Sunscreen Higliter Eysedow Loose Powder Highlighter Blush On Cushion Bb Cream Foundation Concealer Stay Lock Mist Facial Wash Hy Amino Body Serum Cleansing Balm Body Scrub Menentukan Jumlah Cluster Tujuan dari pemilihan nilai K adalah untuk menentukan jumlah Cluster yang optimal untuk data yang Nilai K akan mempengaruhi bagaimana data dikelompokkan dan hasil Clustering yang Pada contoh perhitungan ini akan dipilih nilai k = 3.
Menentukan nilai Centroid secara Acak Tabel 2.
Centroid 1 Centorid 1 Tabel 3.
Centroid 2 Centroid 2 Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Tabel 4.
Centroid 3 Centroid 3 Hitung Ruang Antara Setiap Data Dengan Centroid Memanfaatkan Matrik Jarak Euclidean Untuk Menentukan Cluster Data.
Pada tahapan ini peneliti menghitung jarak setiap data dengan nilai Centroid awal untuk menentukan Cluster setiap data pada iterasi 1 dengan memakai persamaan jarak Euclidean.
Selanjutnya ditentukan ruang yang terkecil pada data tersebut.
Proses ini kemudian berlanjut untuk setiap data dalam keseluruhan dataset.
Jarak antara setiap data dengan ketiga titik Centroid dihitung dan data tersebut nantinya akan ditempatkan ke dalam Cluster berdasarkan jarak paling terkecil.
Berikut hasil iterasi 1 :
Tabel 5.
Hasil Iterasi 1.
Nama Produk
Cluster
Lipstik Matte Rouge Velvet
1950,265
Lipstik Matte Power Lip Cream
4973,433
7130,053
5509,673
Skintint
3928,729
10252,02
3004,626
Maskara
6166,384
16561,84
5990,269
Eyeliner 2800,399 13183,42 1827,726 Skincare Paket Acneplus
10806,65
1370,782
10955,07
Skincare Paket Golden Age
3292,925
10077,16
3298,657
Skincare Paket Radiance Up 8042,917 4081,481 8274,998 Skincare Paket Dazling 1664,365 11538,84 Skincare Paket Radiance Glow
5559,058
16769,61
5005,777
Sunscreen
6161,521
6843,388
6143,317
Higliter 12047,55 Eysedow
4436,692
7591,502
4728,479
Loose Powder
3928,94
2368,564
Highlighter 4049,553 15552,18 3826,766 Blush On 9894,01 2611,837 9906,538 Cushion
3519,453
13223,26
2988,524
Bb Cream
6863,019
6507,687
6942,174
Foundation 3216,994 13824,06 2320,304 Concealer 8458,614 4057,455 8467,887 Stay Lock Mist
3123,313
9782,152
2654,727
Facial Wash Hy Amino
2884,931
2394,833
Body Serum
4509,221
15214,35
4701,322
Cleansing Balm
6878,704
6973,345
6730,29
Body Scrub
1950,265
12047,55
Hitung ulang posisi Centroid baru berdasarkan rata-rata Data Apabila Tahap berikutnya pada iterasi kedua untuk memperbarui pengelompokan data pada Cluster berdasarkan posisi Centroid yang sudah dihitung sebelumnya.
Proses perhitungan Centroid pada iterasi kedua dilakukan sebagai berikut:
A Lakukan penjumlahan dari semua nilai dalam setiap Cluster untuk mendapatkan total nilai dalam Cluster tersebut.
A Bagilah total nilai dalam setiap Cluster dengan jumlah data yang terdapat dalam Cluster tersebut, sehingga diperoleh rata-rata.
A Jadikan nilai rata-rata yang dihitung sebagai posisi Centroid baru untuk setiap Cluster.
Jalankan kembali langkah 3 hingga 5 hingga posisi Centroid tidak mengalami perubahan.
Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Berdasarkan hitungan yang telah dilakukan hasil pengelompokan pada iterasi 1 hingga 4 menghadapi sejumlah perubahan anggota Kelompok, membuat proses diteruskan sampai mencapai iterasi ke-4.
Pada iterasi ke-4, anggota Kelompok serupa dengan iterasi ke-3, membuat tidak ada lanjutan ke iterasi ke-5.
Berikut ialah temuan akhir dari pengelompokan yang dihasilkan.
Tabel 6.
Hasil Iterasi 1.
Nama Produk
Cluster
Lipstik Matte Rouge Velvet
3472,776468
8353,357849
2768,406436
Lipstik Matte Power Lip Cream
2536,082806
3786,725183
7085,88361
Skintint
2935,004572
6576,456938
4982,965418
Maskara
8504,328465
13354,6658
3915,257743
Eyeliner 4904,613771 9607,601215 2056,378417 Skincare Paket Acneplus
8481,55203
2610,6226
12775,63054
Skincare Paket Golden Age
1779,410813
6347,354024
5222,910079
Skincare Paket Radiance Up 5810,288258 1717,791856 9917,501417 Skincare Paket Dazling 3074,17993 7993,888501 2300,972518 Skincare Paket Radiance Glow
7980,332439
13262,92029
3022,351324
Sunscreen
4140,736364
3267,2093
8191,157104
Higliter 9624,930516 3749,588359 13801,10674 Eysedow
2915,673548
4217,754303
6320,705962
Loose Powder
4823,456089
9803,223149
2496,508634
Highlighter 6301,483352 11860,6126 3225,920674 Blush On 7601,384008 2373,950581 11562,28438 Cushion
5345,423074
9923,037796
1788,784232
Bb Cream
4635,399469
3122,145634
8999,067981
Foundation 5253,956951 10312,52328 825,6272531 Concealer 6276,482473 2189,521662 10047,31682 Stay Lock Mist
2171,183557
6087,902829
4662,289891
Facial Wash Hy Amino
5172,737422
10378,54769
309,645272
Body Serum
6923,823874
11941,28872
2751,363394
Cleansing Balm
4459,342378
3532,517744
8834,810818
Body Scrub
3372,369203
8422,824993
2182,624191
Pengolahan data dengan Rapid Miner Berikut adalah langkah dalam proses pemodelan dengan bantuan tool rapid miner :
Gambar 2.
Pemodelan data Algoritma K-Means Gambar di atas menunjukan pemodelan data dengan algoritma K-Means bantuan tool rapid miner.
Langkah dalam proses tersebut yaitu membuka software Rapid Miner dan membuat proses baru dengan menggunakan CTR N.
Langkah kedua melibatkan impor data penjualan kosmetik YOU, dengan menetapkan nama produk Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans sebagai identifikasi selanjutnya tambahkan operator K-Means sebagai algoritma pemodelan dengan nilai k=3.
Terapkan juga operator apply model untuk proses pemodelan menggunakan K-Means.
Selanjutnya, masukkan operator performance dan hubungkan dengan operator apply model untuk mengevaluasi performa model Clustering.
Langkah terakhir adalah mengklik tombol play untuk menjalankan proses klasifikasi.
Berdasarkan pemodelan dari percobaan di atas maka didapat nilai Davies Bouldin Index sebesar 0.
058 dengan hasil tiga kelompok produk.
Cluster pertama (Cluster .
dengan 8 item kategori laris.
Cluster kedua (Cluster .
memiliki 12 item dengan kategori paling laris.
Cluster ketiga (Cluster .
terdiri dari 5 item dengan kategori tidak laris.
Berikut adalah grafik nilai Centroid pada masing- masing kelas:
Gambar 3.
Distribusi anggota dalam 3 Cluster Distribusi anggota dalam 3 Cluster yang telah ditentukan dapat diperoleh dengan melihat grafik hasil pemodelan algoritma K-Means menggunakan Rapid Miner.
Grafik tersebut memvisualisasikan penyebaran anggota di antara Cluster dan informasi ini dapat diamati pada Gambar di bawah ini:
Gambar 4.
Hasil pengelompokan Pemodelan K-Means Kemudian untuk temuan interpretasi hasil dari kelompok yang didapatkan adalah memakai pemodelan K-Means Cluster 0 Cluster 0 terdiri dari 8 produk kosmetik yang memiliki tingkat penjualan terlaris.
Produk-produk dalam Cluster ini termasuk Lipstik Matte.
Power Lip Cream.
Skintint.
Skincare Paket Golden Age.
Sunscreen.
Eyeshadow.
BB Cream dan Stay Lock Mist.
Selama periode 12 bulan penjualan produk-produk dalam Cluster ini memiliki pertumbuhan penjualan yang cukup stabil.
Pada bulan pertama nilai Centroid Cluster 0 adalah 5174.
5 dan penjualan cenderung meningkat seiring berjalannya waktu mencapai nilai tertinggi pada bulan ke-12 sebesar 4912.
Hal ini menunjukkan bahwa produk-produk dalam Cluster ini memiliki permintaan yang kuat dari konsumen dan berpotensi untuk memberikan kontribusi terhadap pendapatan penjualan keseluruhan.
Cluster 1 Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim.
Vol.
9 No.
Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Cluster 1 mencakup 12 item produk dengan kategori paling laris.
Produk-produk pada Cluster 1 ini termasuk berbagai jenis kosmetik dan perawatan kulit seperti lipstik matte, maskara, eyeliner, paket perawatan kulit, bedak loose, highlighter, cushion, foundation, facial wash, body serum, dan cleansing Nilai Centroid untuk Cluster ini menunjukkan tren peningkatan penjualan dari bulan ke bulan sepanjang periode 12 bulan.
Hal ini menunjukan bahwa produk-produk dalam kategori ini memiliki permintaan yang stabil atau meningkat seiring berjalannya waktu.
Cluster 2 Cluster 2 terdiri dari 5 item produk yang tidak laris, termasuk Skincare paket acne plus.
Skincare paket radiance up, highliter, blush on, dan concealer.
Penjualan produk dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar.
Untuk menghitung akurasi dari perhitungan manual terhadap pemodelan dengan rapid miner dapat menggunakan rumus berikut : Berdasarkan temuan penjualan di atas dapat ditarik intisari yakni hasil akurasi perbandingan dari perhitungan manual terhadap pemodelan rapid miner yaitu sebesar 88% hasilnya sama.
Kesimpulan Dari penjelasan di atas, kesimpulan yang bisa ditarikl yakni, berdasarkan sampel data yang digunakan, produk kosmetik YOU dapat dikelompokkan menjadi 3 kategori berdasarkan tingkat kelarisan penjualannya.
Algoritma K-Means Clustering dapat diterapkan di PT Jalur Mandiri Utama untuk mengelompokkan jenis produk yang paling laris dalam penjualan.
Melalui proses pemrosesan sampel data yang sudah dijalankan.
Cluster 0 yang terdiri dari 8 produk item memiliki tingkat penjualan terlaris.
Selama periode 12 bulan penjualan produk-produk dalam Cluster ini memiliki pertumbuhan penjualan yang cukup stabil.
Berikutnya adalah Cluster 1 mencakup 12 item produk dengan kategori paling laris.
Sedangkan Cluster 2 terdiri dari 5 item produk yang tidak laris.
Penjualan produk dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar.
Daftar Pustaka