P-ISSN: 2723-8202 E-ISSN: 2503-1171 Volume 9. No 1. April 2024. Page: 17-25 KLASTERISASI DATA PENJUALAN TERLARIS PRODUK KOSMETIK YOU MENGGUNAKAN ALGORITMA K-MEANS Aprillia Anjani . April Lia Hananto . Tukino. dan Shofa Shofiah Hilabi . Jurusan Sistem Informasi. Fakultas Ilmu Komputer. Universitas Buana Perjuangan Karawang e-mail: si20. aprilliaanjani@mhs. Abstract [Classterization of best-selling sales data for your cosmetic products using the k-means algorith. There are many types of businesses in Indonesia that attract people's attention and increase competition by creating creativity in various business ideas. The Indonesian cosmetics and skin care company is a Y. U brand dedicated to the beauty of Indonesian women, produced according to people's needs and current trends. The task of data mining is to collect or group large amounts of data based on various predetermined criteria. Cluster data mining is ideal for algorithms that can process data more efficiently, namely the K-Means algorithm. The K-Means Clustering algorithm is a method used to combine several data streams to analyze data and determine the number of Clusters that have different characteristics from other data. The expected result is to have a group of data that will influence the sales strategy in the next period so that you can find out which items are best sold and which items are less popular with customers. This decision will minimize the losses previously received by PT Lintas Mandiri primarily on YOU cosmetics. With this data, it can be grouped into 3 clusters based on the level of sales of a type of product. Cluster 0 consists of 8 product items that have the best selling level, while in Cluster 1, which includes 12 product items in the best-selling category, and Cluster 2, which consists of 5 items. Products that are not selling well in this Cluster show a steady or even decreasing trend from month to month with the Centroid value indicating the unpopularity of these products in the market. Keywords: Clustering. Cosmetics Sales Data. Data Mining. K-Means. Best Selling Product. Abstrak Ada banyak jenis bisnis di indonesia yang menyita fokus masyarakat serta meningkatkan kompetisi dengan menghasilkan kreativitas dalam berbagai gagasan bisnis. Perusahaan kosmetik dan perawatan kulit indonesia merupakan brand kosmetik Y. U yang didedikasikan untuk kecantikan wanita indonesia, diproduksi sesuai dengan kebutuhan masyarakat dan tren saat ini. Tugas data mining adalah mengumpulkan atau mengelompokkan data dalam jumlah besar berdasarkan berbagai kriteria yang telah ditentukan. Cluster data mining sangat ideal sebagai algoritma yang bisa mengelola data dengan cara lebih efisien, seperti algoritma K-Means. Algoritma Clustering K-Means ialah prosedur yang digunakan untuk menggabungkan beberapa aliran data untuk menganalisis data dan menentukan jumlah Cluster yang memiliki karakteristik berbeda dari data lainnya. Temuan yang diinginkan ialah terdapatnya kumpulan data yang berdampak bagi strategi penjualan pada periode berikutnya sehingga dapat mengetahui barang yang paling terlaris yang dijual dan barang yang kurang laris. Kebijakan ini bisa menyusutkan defisit yang didapat oleh PT Jalur Mandiri utama dahulunya pada kosmetik YOU. Dengan data tersebut dapat dikelompokan menjadi 3 Clustering yang didasarkan pada tingkat kesuksesan penjualan suatu jenis produk Cluster 0 yang terdiri dari 8 produk item yang memiliki tingkat penjualan laris. Sedangkan Dalam Cluster 1 yang mencakup 12 item produk dengan kategori paling laris dan Cluster 2 yang terdiri dari 5 item produk yang tidak laris, dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar. Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Kata Kunci: Clustering. Data Penjualan Kosmetik. Data Mining. K-Means. Produk Terlaris Pendahuluan Ada banyak jenis bisnis di Indonesia yang menyita fokus masyarakat serta meningkatkan kompetisi dengan menghasilkan kreativitas dalam berbagai gagasan bisnis. Saat ini, barang konsumsi, atau kosmetik dan produk perawatan kulit, merupakan industri yang sangat populer (Amalina et al. , 2. Tidak dapat dipungkiri bahwa industri kosmetik dan perawatan kulit Indonesia selalu mengalami pertumbuhan serta terus digemari oleh seluruh lapisan masyarakat, khususnya perempuan (Lia Hananto et al. , 2. Setiap produk tentunya memiliki kelebihan yang membedakannya dengan kompetitor lainnya. Perusahaan kosmetik dan perawatan kulit indonesia merupakan merek Y. U atau perusahaan kosmetik dan perawatan kulit yang didedikasikan untuk kecantikan wanita indonesia, diproduksi sesuai dengan kebutuhan masyarakat dan tren saat ini (PT Jalur Mandiri Utama. Penambangan data adalah metode komputer yang mencari pola tertentu dalam kumpulan data besar untuk membantu menemukan dan mengelompokkan informasi yang obyektif dan efektif (Agneresa et al. , 2. Tugas data mining adalah mengumpulkan atau mengelompokkan data dalam jumlah besar berdasarkan berbagai kriteria yang telah ditentukan (Tukino & Huda, 2. Cluster data mining sangat ideal sebagai algoritma yang bisa mengelola data dengan cara lebih efisien, seperti algoritma K-Means (Mangku Negara et al. , 2. Algoritma Clustering K-Means adalah metode yang dipakai guna menggabungkan beberapa aliran data untuk menganalisis data dan menentukan jumlah Cluster yang memiliki karakteristik berbeda dari data lainnya. Berdasarkan karya ( et al. , 2. Pada topik ini terdapat tiga Cluster dalam klasifikasi data penerapan dinamis K-Means hasil penelitian tahun 2021 ini. Data mining adalah praktek mengeksplorasi informasi dalam dataset besar untuk mengidentifikasi keterkaitan, corak, serta kecenderungan yang signifikan (Lia Hananto et al. , 2. K-Means Clustering yakni prosedur penggabungan data non-hirarki yang membagi data menjadi cluster, mengumpulkan data dengan atribut serupa bersama-sama, serta memisahkan data dengan fitur yang berlainan ke dalam cluster yang tidak sama (Amalina et al. , 2. Algoritma K-Means termasuk partitioning (Pembelajaran et al. , 2. Clustering yang membagi data menjadi k wilayah terpisah. Algoritma K-Means dikenal luas karena kesederhanaan serta kecepatannya dalam menggabungkan dataset besar serta data yang jauh dari pola utama amat cepat (Situmorang et al. , 2. Pada algoritma K-Means, masing-masing data mesti tergabung dalam satu kluster tertentu, namun pada setiap iterasi proses, ada kemungkinan bagi data tersebut untuk beralih ke kluster lain yang lebih sesuai (Darmi & Setiawan. Temuan yang diinginkan ialah terdapatnya kumpulan data yang berdampak bagi strategi penjualan pada periode berikutnya sehingga dapat mengetahui barang yang terlaris dijual dan barang yang kurang disenangi Kebijakan ini bisa menyusutkan defisit yang didapat oleh PT Jalur Mandiri utama dahulunya pada kosmetik YOU (Yansah et al. , 2. Metode Pada prosedur yang dijalankan studi ini adalah seperti dibawah : Gambar 1. Alur Studi Tahapan Data Mining Tahapan data mining untuk pengelompokan produk skincare dan kosmetik you dimulai dengan cara sebagai berikut : proses Cleaning, yaitu membersihkan data dari aplikasi kasir yang telah dicetak. Tahap selanjutnya adalah Integration, dimana data penjualan dikonsolidasikan pada lokasi yang sudah dipersiapkan. Setelah itu. Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans dilakukan tahap Selection untuk mengambil sampel data dari sejumlah data dahulunya untuk dipakai sebagai pembanding serta memastikan data tersebut sesuai dengan kebutuhan. Algoritma K-Means Dibawah ini adalah proses algoritma Clustering K-Means didalam data mining: Gambar 2. Diagram Alur Penelitian Diagram tersebut menggambarkan langkah-langkah dalam algoritma K-Means, yang dapat disajikan sebagai Persiapkan data sesuai keperluan sebagai sampel. Tetapkan banyaknya Cluster. Tentukan angka Centroid atau pusat klaster. Gunakan model Euclidean untuk menilai jarak antara setiap data dan centroid klaster dengan karakteristik yang serupa atau mirip: yccycnyc = Oo. cu1ycn Oe ycu1yc. cU2ycn Oe ycU2yc. 2 A . cuycoycn Oe ycuycoyc. 2 Dengan penjelasan : Dij = Jarak data ke Ae i ke titik pusat (Cluster . Xki = Data ke - i attribute data ke Ae k. Xkj = Data ke Ae j attribut data je Ae j. Results Penggabungan produk kosmetik relevan dengan kategori produk yang paling terlaris, laris, serta kurang laris supaya mudah dijangkau dan tidak ada penumpukan stok barang, langkah ini dijalankan dengan pengimplementasian algoritma kAimeans memakai rumus : yccycnyc = Oo. cu1ycn Oe ycu1yc. cU2ycn Oe ycU2yc. 2 A . cuycoycn Oe ycuycoyc. Implementasi banyak Cluster (K) yakni 120 Cluster, setelah menentukan banyak Cluster, tetapkan titik fokus awal Cluster (Centroi. Hasil dan Pembahasan Analisis Data Merekapitulasi data Bisa diketahui hasil perdagangan Kosmetik YOU selama satu tahun yaitu tahun 2023 terdapat beberapa barang yang menumpuk dan penjualan yang menurun. Berikut data penjualan produk kosmetik di Guardian Resinda Tahun 2023. Berikut data penjualan YOU pada tahun 2023 : Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Tabel 1. Data Penjualan Nama Produk B10 B11 B12 Lipstik Matte Rouge Velvet Lipstik Matte Power Lip Cream Skintin Maskara Eyliner Sikncare Paket Acneplus Skincare Paket Golden Age Skincare Paket Radiance Up Skincare Paket Dazling Skincare Paket Radiance Glow Sunscreen Higliter Eysedow Loose Powder Highlighter Blush On Cushion Bb Cream Foundation Concealer Stay Lock Mist Facial Wash Hy Amino Body Serum Cleansing Balm Body Scrub Menentukan Jumlah Cluster Tujuan dari pemilihan nilai K adalah untuk menentukan jumlah Cluster yang optimal untuk data yang Nilai K akan mempengaruhi bagaimana data dikelompokkan dan hasil Clustering yang Pada contoh perhitungan ini akan dipilih nilai k = 3. Menentukan nilai Centroid secara Acak Tabel 2. Centroid 1 Centorid 1 Tabel 3. Centroid 2 Centroid 2 Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Tabel 4. Centroid 3 Centroid 3 Hitung Ruang Antara Setiap Data Dengan Centroid Memanfaatkan Matrik Jarak Euclidean Untuk Menentukan Cluster Data. Pada tahapan ini peneliti menghitung jarak setiap data dengan nilai Centroid awal untuk menentukan Cluster setiap data pada iterasi 1 dengan memakai persamaan jarak Euclidean. Selanjutnya ditentukan ruang yang terkecil pada data tersebut. Proses ini kemudian berlanjut untuk setiap data dalam keseluruhan dataset. Jarak antara setiap data dengan ketiga titik Centroid dihitung dan data tersebut nantinya akan ditempatkan ke dalam Cluster berdasarkan jarak paling terkecil. Berikut hasil iterasi 1 : Tabel 5. Hasil Iterasi 1. Nama Produk Cluster Lipstik Matte Rouge Velvet 1950,265 Lipstik Matte Power Lip Cream 4973,433 7130,053 5509,673 Skintint 3928,729 10252,02 3004,626 Maskara 6166,384 16561,84 5990,269 Eyeliner 2800,399 13183,42 1827,726 Skincare Paket Acneplus 10806,65 1370,782 10955,07 Skincare Paket Golden Age 3292,925 10077,16 3298,657 Skincare Paket Radiance Up 8042,917 4081,481 8274,998 Skincare Paket Dazling 1664,365 11538,84 Skincare Paket Radiance Glow 5559,058 16769,61 5005,777 Sunscreen 6161,521 6843,388 6143,317 Higliter 12047,55 Eysedow 4436,692 7591,502 4728,479 Loose Powder 3928,94 2368,564 Highlighter 4049,553 15552,18 3826,766 Blush On 9894,01 2611,837 9906,538 Cushion 3519,453 13223,26 2988,524 Bb Cream 6863,019 6507,687 6942,174 Foundation 3216,994 13824,06 2320,304 Concealer 8458,614 4057,455 8467,887 Stay Lock Mist 3123,313 9782,152 2654,727 Facial Wash Hy Amino 2884,931 2394,833 Body Serum 4509,221 15214,35 4701,322 Cleansing Balm 6878,704 6973,345 6730,29 Body Scrub 1950,265 12047,55 Hitung ulang posisi Centroid baru berdasarkan rata-rata Data Apabila Tahap berikutnya pada iterasi kedua untuk memperbarui pengelompokan data pada Cluster berdasarkan posisi Centroid yang sudah dihitung sebelumnya. Proses perhitungan Centroid pada iterasi kedua dilakukan sebagai berikut: A Lakukan penjumlahan dari semua nilai dalam setiap Cluster untuk mendapatkan total nilai dalam Cluster tersebut. A Bagilah total nilai dalam setiap Cluster dengan jumlah data yang terdapat dalam Cluster tersebut, sehingga diperoleh rata-rata. A Jadikan nilai rata-rata yang dihitung sebagai posisi Centroid baru untuk setiap Cluster. Jalankan kembali langkah 3 hingga 5 hingga posisi Centroid tidak mengalami perubahan. Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Berdasarkan hitungan yang telah dilakukan hasil pengelompokan pada iterasi 1 hingga 4 menghadapi sejumlah perubahan anggota Kelompok, membuat proses diteruskan sampai mencapai iterasi ke-4. Pada iterasi ke-4, anggota Kelompok serupa dengan iterasi ke-3, membuat tidak ada lanjutan ke iterasi ke-5. Berikut ialah temuan akhir dari pengelompokan yang dihasilkan. Tabel 6. Hasil Iterasi 1. Nama Produk Cluster Lipstik Matte Rouge Velvet 3472,776468 8353,357849 2768,406436 Lipstik Matte Power Lip Cream 2536,082806 3786,725183 7085,88361 Skintint 2935,004572 6576,456938 4982,965418 Maskara 8504,328465 13354,6658 3915,257743 Eyeliner 4904,613771 9607,601215 2056,378417 Skincare Paket Acneplus 8481,55203 2610,6226 12775,63054 Skincare Paket Golden Age 1779,410813 6347,354024 5222,910079 Skincare Paket Radiance Up 5810,288258 1717,791856 9917,501417 Skincare Paket Dazling 3074,17993 7993,888501 2300,972518 Skincare Paket Radiance Glow 7980,332439 13262,92029 3022,351324 Sunscreen 4140,736364 3267,2093 8191,157104 Higliter 9624,930516 3749,588359 13801,10674 Eysedow 2915,673548 4217,754303 6320,705962 Loose Powder 4823,456089 9803,223149 2496,508634 Highlighter 6301,483352 11860,6126 3225,920674 Blush On 7601,384008 2373,950581 11562,28438 Cushion 5345,423074 9923,037796 1788,784232 Bb Cream 4635,399469 3122,145634 8999,067981 Foundation 5253,956951 10312,52328 825,6272531 Concealer 6276,482473 2189,521662 10047,31682 Stay Lock Mist 2171,183557 6087,902829 4662,289891 Facial Wash Hy Amino 5172,737422 10378,54769 309,645272 Body Serum 6923,823874 11941,28872 2751,363394 Cleansing Balm 4459,342378 3532,517744 8834,810818 Body Scrub 3372,369203 8422,824993 2182,624191 Pengolahan data dengan Rapid Miner Berikut adalah langkah dalam proses pemodelan dengan bantuan tool rapid miner : Gambar 2. Pemodelan data Algoritma K-Means Gambar di atas menunjukan pemodelan data dengan algoritma K-Means bantuan tool rapid miner. Langkah dalam proses tersebut yaitu membuka software Rapid Miner dan membuat proses baru dengan menggunakan CTR N. Langkah kedua melibatkan impor data penjualan kosmetik YOU, dengan menetapkan nama produk Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans sebagai identifikasi selanjutnya tambahkan operator K-Means sebagai algoritma pemodelan dengan nilai k=3. Terapkan juga operator apply model untuk proses pemodelan menggunakan K-Means. Selanjutnya, masukkan operator performance dan hubungkan dengan operator apply model untuk mengevaluasi performa model Clustering. Langkah terakhir adalah mengklik tombol play untuk menjalankan proses klasifikasi. Berdasarkan pemodelan dari percobaan di atas maka didapat nilai Davies Bouldin Index sebesar 0. 058 dengan hasil tiga kelompok produk. Cluster pertama (Cluster . dengan 8 item kategori laris. Cluster kedua (Cluster . memiliki 12 item dengan kategori paling laris. Cluster ketiga (Cluster . terdiri dari 5 item dengan kategori tidak laris. Berikut adalah grafik nilai Centroid pada masing- masing kelas: Gambar 3. Distribusi anggota dalam 3 Cluster Distribusi anggota dalam 3 Cluster yang telah ditentukan dapat diperoleh dengan melihat grafik hasil pemodelan algoritma K-Means menggunakan Rapid Miner. Grafik tersebut memvisualisasikan penyebaran anggota di antara Cluster dan informasi ini dapat diamati pada Gambar di bawah ini: Gambar 4. Hasil pengelompokan Pemodelan K-Means Kemudian untuk temuan interpretasi hasil dari kelompok yang didapatkan adalah memakai pemodelan K-Means Cluster 0 Cluster 0 terdiri dari 8 produk kosmetik yang memiliki tingkat penjualan terlaris. Produk-produk dalam Cluster ini termasuk Lipstik Matte. Power Lip Cream. Skintint. Skincare Paket Golden Age. Sunscreen. Eyeshadow. BB Cream dan Stay Lock Mist. Selama periode 12 bulan penjualan produk-produk dalam Cluster ini memiliki pertumbuhan penjualan yang cukup stabil. Pada bulan pertama nilai Centroid Cluster 0 adalah 5174. 5 dan penjualan cenderung meningkat seiring berjalannya waktu mencapai nilai tertinggi pada bulan ke-12 sebesar 4912. Hal ini menunjukkan bahwa produk-produk dalam Cluster ini memiliki permintaan yang kuat dari konsumen dan berpotensi untuk memberikan kontribusi terhadap pendapatan penjualan keseluruhan. Cluster 1 Jurnal TIKA Fakultas Ilmu Komputer Universitas Almuslim. Vol. 9 No. Aprilia Anjani Ae Klasterisasi Data Penjualan Terlaris Produk Kosmetik You Menggunakan Algoritma KMeans Cluster 1 mencakup 12 item produk dengan kategori paling laris. Produk-produk pada Cluster 1 ini termasuk berbagai jenis kosmetik dan perawatan kulit seperti lipstik matte, maskara, eyeliner, paket perawatan kulit, bedak loose, highlighter, cushion, foundation, facial wash, body serum, dan cleansing Nilai Centroid untuk Cluster ini menunjukkan tren peningkatan penjualan dari bulan ke bulan sepanjang periode 12 bulan. Hal ini menunjukan bahwa produk-produk dalam kategori ini memiliki permintaan yang stabil atau meningkat seiring berjalannya waktu. Cluster 2 Cluster 2 terdiri dari 5 item produk yang tidak laris, termasuk Skincare paket acne plus. Skincare paket radiance up, highliter, blush on, dan concealer. Penjualan produk dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar. Untuk menghitung akurasi dari perhitungan manual terhadap pemodelan dengan rapid miner dapat menggunakan rumus berikut : Berdasarkan temuan penjualan di atas dapat ditarik intisari yakni hasil akurasi perbandingan dari perhitungan manual terhadap pemodelan rapid miner yaitu sebesar 88% hasilnya sama. Kesimpulan Dari penjelasan di atas, kesimpulan yang bisa ditarikl yakni, berdasarkan sampel data yang digunakan, produk kosmetik YOU dapat dikelompokkan menjadi 3 kategori berdasarkan tingkat kelarisan penjualannya. Algoritma K-Means Clustering dapat diterapkan di PT Jalur Mandiri Utama untuk mengelompokkan jenis produk yang paling laris dalam penjualan. Melalui proses pemrosesan sampel data yang sudah dijalankan. Cluster 0 yang terdiri dari 8 produk item memiliki tingkat penjualan terlaris. Selama periode 12 bulan penjualan produk-produk dalam Cluster ini memiliki pertumbuhan penjualan yang cukup stabil. Berikutnya adalah Cluster 1 mencakup 12 item produk dengan kategori paling laris. Sedangkan Cluster 2 terdiri dari 5 item produk yang tidak laris. Penjualan produk dalam Cluster ini menunjukkan tren tetap atau bahkan menurun dari bulan ke bulan dengan nilai Centroid menunjukkan ketidakpopuleran produk-produk tersebut di pasar. Daftar Pustaka