Institute of Research and Publication Indonesia MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage:https://journal. id/index. php/malcom Vol. 1 Iss. 1 April 2021, pp: 41-46 P-ISSN: 2797-2313 E-ISSN: 2775-8575 Market Basket Analysis with K-Means and FP-Growth Algorithm as Citra Mustika Pandawa Company Analisis Keranjang Pasar Menggunakan Algoritma K-Means dan FP-Growth pada PT. Citra Mustika Pandawa Sindhy Genjang Setyorini1*. Ega Kuslia Sari2. Lufty Rahma Elita3. Shinta Ayunda Putri4 1,2,3,4 Program Studi Sistem Informasi. Fakultas Sains dan Teknologi Univesitas Islam Negeri Sultan Syarif Kasim Riau Jl. HR. Soebrantas Km. 18 Panam Pekanbaru Riau E-Mail: 1sindhygenjang99@gmail. com, 2egakusliasari@gmail. luftyrahma@gmail. com, 4shintaikhtiar@gmail. Received Februari 28th 2021. Revised March 1st 2021. Accepted March 6th 2021 Corresponding Author: Sindhy Genjang Setyorini Abstract PT. Citra Mustika Pandawa is a company engaged in furniture, selling various household furniture such as sofas, televisions, dish racks, cabinets and so on. Observations on sales data transactions PT Citra Mustika Pandawa provide new knowledge and information about market conditions and customer interest in a product. Extracting this data provides knowledge about new branches of knowledge in overcoming problems from a data set, which is called data Data mining is the process of extracting information or something important or interesting into useful A well-known method in the retail business sector is the Association Rule or often known as a shopping cart analysis . arket basket analysi. Approach to analyzing market baskets using association rules. Research uses the association method to see the attraction between one item and another in transaction data. In processing transaction data, the FP-Growth and K-Means algorithms are used. The K-Means algorithm is useful for data clusters, so the FPGrowth algorithm is useful for the association process. Based on the Association Rule that has been formed in each cluster, it is known that there are 8 items / products that are often purchased by customers at PT. Citra Mustika Pandawa, namely Elite Dining Table. Asia Jaya Plate Shelf, 32 "Led Tv, 1p Escraft. Kitchen Set, 2t Washing Machine, and 1p Clothing Keywords: Association Rule. Data Mining. FP-Growth. K-Means. PT Citra Mustika Pandawa Abstrak PT. Citra Mustika Pandawa adalah perusahaan yang bergerak dibidang furniture, menjual berbagai perabotan dalam rumah tangga seperti, sofa, televisi, rak piring, lemari dan sebagainya. Pengamatan terhadap transaksi data penjualan PT. Citra Mustika Pandawa memberikan pengetahuan dan informasi baru tentang keadaan pasar serta keminatan pelanggan terhadap suatu produk. Metode yang terkenal dibidang bisnis retail adalah Association Rule atau sering dikenal dengan istilah analisa keranjang belanja . arket basket analysi. Pendekatan untuk menganalisa keranjang pasar dengan menggunakan aturan asosiasi. penelitian menggunakan metode asosiasi untuk melihat ketertarikan antara barang yang satu dengan yang lainnya dalam data transaksi. Dalam mengolah data transaksi digunakan algoritma FP-Growth dan K-Means. Algoritma K-Means berguna untuk cluster data, sehingga algoritma FP-Growth berguna untuk proses asosiasi. Berdasarkan Association Rule yang telah terbentuk pada tiap cluster diketahui bahwa terdapat 8 items/produk yang sering dibeli oleh pelanggan pada PT. Citra Mustika Pandawa yaitu produk Meja Makan Elite. Rak Piring Asia Jaya. Tv Led 32". Lemari Es 1p. Kitchen Set. Mesin Cuci 2t, dan Lemari Pakaian 1p. Kata Kunci: Association Rule. Data Mining. FP-Growth. K-Means. PT Citra Mustika Pandawa PENDAHULUAN Perkembangan teknologi informasi kini semakin canggih sampai memasuki segala segmen kehidupan manusia . Pemanfaatan teknologi informasi menghasilkan banyak data sehingga mudah sekali manusia mendapatkan banyak informasi terkait perekonomian, politik, kesehatan, pendidikan, teknologi, dan lain sebagainya . Banyak pekerjaan manusia sekarang dimanjakan dengan berbagai kemudahan teknologi Link: https://journal. id/index. php/malcom/article/view/62 MALCOM-1. : 41-46 informasi misalnya untuk perolehan informasi dengan sistem terkomputerisasi . Dalam dunia bisnis teknologi informasi masuk menciptakan persaingan bisnis dalam perdagangan dunia dengan ekonomi pasar bebas, sehingga memaksa para pelaku bisnis untuk senantiasa memikirkan strategi dan terobosan terbaru untuk dapat memenuhi permintaan pelanggan yang semakin tinggi sehingga dapat mempertahankan dan mengembangkan skala bisnis mereka . Untuk pencapaian bisnis pada tahap tersebut menuntut pelaku bisnis dapat memenuhi kebutuhan bisnis yaitu peningkatan kualitas dan kuantitas produk, pengurangan biaya operasional perusahaan, dan peningkatan pemasaran dan keuntungan perusahaan . Upaya yang dapat dilakukan untuk pemenuhan kebutuhan bisnis yaitu dengan cara analisa data perusahaan. Analisa data perusahaan menjadi salah satu acuan untuk menemukan strategi peningkatan penjualan dan pemasaran produk perusahaan. Sebagai data yang mempunyai transaksi dan peningkatan jumlah setiap harinya, data penjualan dimanfaatkan dan diolah menjadi informasi yang berguna dengan tujuan meningkatkan penjualan dan promosi produk . PT. Citra Mustika Pandawa adalah perusahaan yang bergerak dibidang furniture, menjual berbagai perabotan dalam rumah tangga seperti, sofa, televisi, rak piring, lemari dan sebagainya. Promosi dan penjualan PT. Citra Mustika Pandawa masih mencakup konsumen lokal sehingga pemasaran produk dan layanan belum maksimal. Produsen perlu menciptakan inovasi layanan terbaik dalam memasarkan produk yang kreatif, salah satu cara mengelola hubungan dengan pelanggan yaitu mengidentifikasi karakteristik pelanggan dengan membagi pelanggan sesuai kesamaan perilaku dan menyediakan rekomendasi produk yang tepat untuk mereka, karena perusahaan tidak dapat menentukan produk apa yang lebih diminati oleh konsumen dan dibeli secara bersamaan dalam satu transaksi. Pada setiap transaksi yang dilakukan seringkali hanya dibiarkan begitu saja menjadi arsip yang menumpuk tanpa mengetahui informasi yang didapatkan jika mengolah data tresebut, padahal informasi tersebut dapat membantu manajerial mengambil suatu kebijakan proses bisnis . Pengamatan terhadap transaksi data penjualan PT. Citra Mustika Pandawa memberikan pengetahuan dan informasi baru tentang keadaan pasar serta keminatan pelanggan terhadap suatu produk . Penggalian data tersebut memberikan pengetahuan tentang cabang ilmu baru dalam mengatasi masalah dari sebuah kumpulan data, yang disebut dengan data mining . Data mining adalah proses mengektrasksi informasi atau sesuatu yang penting atau menarik menjadi informasi yang berguna . Data mining memiliki kemampuan dalam proses pengolahan data dengan jumlah besar menggunakan teknik-teknik dan metode yang beragam . Metode yang terkenal dibidang bisnis retail adalah Association Rule atau sering dikenal dengan istilah analisa keranjang belanja . arket basket Market basket analysis memberikan informasi hubungan antar item, metode tersebut dapat dimanfaatkan dalam proses bisnis diantaranya dalam proses penjualan. Data penjualan yang diolah memberikan informasi hubungan data dengan pelanggan sehingga akan menghasilkan pola pembelian pelanggan, memberikan rekomendasi dan promosi produk . Kebutuhan market basket analysis berawal dari keakuratan dan manfaat yang dihasilkan dalam wujud aturan asosiasi . ssociation rul. dan dari polapola data yang dikaitkan dalam database . Keuntungan yang diperoleh perusahaan yaitu mendapatkan strategi pemasaran yang lebih tepat sasaran dan dapat menarik banyak pelanggan, karna produk yang dipromosikan merupakan barang yang dibutuhkan oleh pelanggan. Penelitian terbaru yang pernah dilakukan oleh Mustakim dan kawan-kawan . dengan judul AuMarket Basket Analysis Using Apriori and FP-Growth for Analysis Consumer Expenditure Patterns at Berkah Mart in Pekanbaru RiauAy menerapkan dua algoritma asosiasi yaitu Apriori dan FP-Growth. Tujuan dari penelitian tersebut adalah untuk mendapatkan aturan dan waktu yang dihasilkan oleh masing-masing algoritma, dengan kesimpulan yang diperoleh yaitu algoritma FP-Growth lebih efektif dalam menemukan frequent itemset dan pola pembelian pelanggan daripada Apriori . Pendekatan untuk menganalisa keranjang pasar dengan menggunakan aturan asosiasi. Namun, terdapat permasalahan teknis umum yang sering muncul yaitu berhubungan dengan teknik rekomendasi dimana aturan tersebut sering mengabaikan itemset besar dan informasi tentang ritel tidak tersedia, sehingga rekomendasi itemset yang diberikan tidak tepat . Untuk data yang besar hasil yang didapat kurang akurat . Solusi dari permasalahan tersebut yaitu dengan membentuk cluster berdasarkan atribut yang ada menjadi atribut yang sama kemudian menentukan pola asosiasi pada setiap kelompok, sehingga mempermudah memberikan rekomendasi produk . Teknik yang sudah diterapkan dalam berbagai bidang dan efektif digunakan sebagai analisis data eksploratori adalah clustering . Metode clustering dikelompokkan menjadi empat metode yaitu partitioning, hierarichal, grid-based, dan model-based. Clustering dengan metode partitioning memiliki kemampuan yaitu dapat menghasilkan partisi dari data, sehingga objek dalam cluster lebih mirip daripada objek yang berada pada cluster lain . Teknik yang masuk dalam metode partitioning salah satunya adalah K-Means. Pada penelitian ini akan digunakan metode asosiasi untuk melihat ketertarikan antara barang yang satu dengan yang lainnya dalam data transaksi. Dalam mengolah data transaksi digunakan algoritma FPGrowth dan K-Means. Algoritma K-Means berguna untuk cluster data, sehingga algoritma FP-Growth berguna untuk proses asosiasi. Sehingga diharapkan rekomendasi produk yang diberikan kepada pelanggan lebih akurat. Market Basket Analysis with K-Means and FP-Growth. (Stiorini et al, 2. ISSN(P): 2797-2313 ISSN(E): 2775-8575 METODOLOGI PENELITIAN Metodologi penelitian yang digunakan dalam penerapan algoritma k-means dan fp-growth dalam penelitian digambarkan dalam gambar1. Start Data Mentah Data Preprocessing Data Mentah Data Set Tentukan Jumlah Cluster Hitung Jarak Dengan Euclidean Distance Cluster Data Transaksi FP-Growth Pola Belanja Pelanggan Start Gambar 1. Metedologi Penelitian Data Mining Data mining adalah satu set yang digunakan untuk mengeksplorasi relasi-relasi kompleks pada suatu data set yang besar . , dan dalam dunia bisnis dapat digunakan untuk membantu steakholder dalam pengambilan keputusan . Data mining memiliki prinsip kerja menemukan, menggali, atau menambang pengetahuan dari suatu data. kemudian dioalah menjadi informasi yang bermanfaat . Analisa Keranjang Pasar Sebagai salah satu metode dari data mining, analisa keranjang basket . nalysis market baske. berfokus pada penemuan-penemuan dalam pola pembelian pelanggan dengan mengektraksi asosiai, riwayat, ata kejadian pada data transaksi. Berawal dari catatan data transaksi pada proses bisnis analisa keranjang bisnis didasarkan pada tiga matrik yaitu support, confidence, dan lift . K-Means Clustering adalah Proses mencari dan mengelompokkan terhadap data yang memiliki kemiripan karakteristik . , sehingga pada setiap kelompok memiliki kesamaan yang tingg dan memiliki perbedaan dengan obek pada kelompok lain . Pengelompokan ini sama dengan cara kerja otak manusia . yaitu MALCOM - Vol. 1 Iss. 1 April 2021, pp: 41-46 MALCOM-1. : 41-46 berusaha menempatkan objek yang mirip dalam satu kelompok dan membuat jarak antar kelompok sejauh mungkin . Clustering salah satu metode data mining yang bersifat tanpa arahan . , artinya penerapan clustering tidak mempunya data latihan . dan tidak memiliki target output . Salah satu teknik yang dapat membantu dalam pembuatan clustering adalah K-Means. K-means merupakan salah satu metode data cluster non hirarki yang mengelompokkan data menjadi satu atau lebih kelompok, dan metode yang terkenal dengan kecepatan dan kesederhanan pengolahan data . FP-Growth Asociation rules . turan asosias. yaitu teknik data mining yang memiliki kemampuan menemukan aturan asosiasi kombinasi item dan menemukan pola dalam menyelesaikan suatu masalah . dengan studi tentang Auapa bersama apaAy . FP-Growth adalah salah satu algoritma yang dipakai untuk menemukan himpunan data yang sering muncul bersamaan tanpa generasi kandidat . Dalam mengetahui pentingnya aturan asosiasi digunakan aturan Support dan Confidence . Support merupakan ukuran seberapa dominan suatu barang dari keseluruhan transaksi, sedangkan Confidence merupakan hubungan antar dua item berdasarkan suatu kondisi tertentu. Untuk mendapatkan nilai Support, nilai Confidence dan nilai Lift Ratio dapat digunakan Persamaan 1. Persamaan 2, dan Persamaan 3 . c, y. = yc. c O y. = ycyeayeayeNyeOyeIyeIyeayeEyeI. c Ie y. = yc. = ycyenyeayesyeCyeO ycyeeyeCyeayeiyeCyeUyeiyeO yeayeIyeayeOyeCyeayeIyenyeayeO ycyeiyeIyea yc ycyeiyeIyea yc ycyeayeiyeCyes ycyeeyeCyeayeiyeCyeUyeiyeO y yayaya% ycyenyeayesyeCyeO ycyeeyeCyeayeiyeCyeUyeiyeOyeoyeCyeayeO yeayeIyeayeOyeCyeayeIyenyeayeO ycyeiyeIyea yc yeIyeCyea ycyeiyeIyea yc ycyeOyeNyei ycyeCyeiyeOyea = ycyenyeayesyeCyeO ycyeeyeCyeayeiyeCyeUyeiyeO yeoyeCyeayeO yeayeIyeayeOyeCyeayeIyenyeayeO ycyeiyeIyea yc ycyeayeayeNyeOyeIyeIyeayeEyeI . c,y. y yayaya% . ycAyeOyesyeCyeO ycyeCyeiyeayeUyeCyea ycyeayeayeNyeOyeIyeIyeayeEyeI. c,y. HASIL DAN ANALISIS Pada penelitian ini menggunakan data transaksi dari PT. Citra Mustika Pandawa Cabang Pekanbaru. Dataset ini terdiri dari 483 data yang telah dilakukan preprocessing data. Pengelompokkan Data Penjualan dengan Algoritma K-Means Menggunakan Tools RapidMiner Selanjutnya dataset diproses menggunakan algoritma K-Means. K-Means merupakan algoritma yang melakukan pengelompokan objek berdasarkan jarak terdekat dengan pusat cluster ke kelompok yang memiliki kesamaan satu sama lain. Pada proses perhitungan menggunakan tools RapidMiner dilakukan percobaan jumlah cluster mulai dari 3 cluster hingga 5 cluster yang bertujuan untuk mendapatkan cluster terbaik dengan cara melihat nilai Davies Bouldin Index (DBI) setiap cluster. Nilai DBI yang paling homogen adalah DBI dengan nilai terkecil. Dari percobaan hasil 3 cluster hingga 5 cluster tersebut didapatlah nilai DBI pada setiap percobaan, yang mana nilai DBI paling kecil adalah 5 cluster dengan nilai DBI sebesar 0. maka data homogen jika dikelompokkan menjadi 5 kelompok. Pencarian Association Rules Data Penjualan yang Telah di Cluster dengan Algoritma FP-Growth Menggunakan Tools RapidMiner Setelah cluster terbentuk langkah selanjutnya adalah melakukan asosiasi menggunakan FP-Growth untuk menentukan pola pembelian atau belanja konsumen pada PT. Citra Mustika Pandawa. Hasil dari proses ini diukur menggunakan nilai Support dan Confidence. Pada proses ini dilakukan percobaan dengan nilai minimal support 30 dan 50% dan nilai minimum confidence 50%. Asosiasi Cluster 1 Dari hasil pencarian rules dengan tools RapidMiner pada cluster 1, dapat disimpulkan bahwa ditemukan rules sebanyak 3 rules pada nilai minimum support sebesar 30%, dan pada nilai minimum support sebesar 50% tidak ditemukan rules atau pola. Rules dapat dilihat pada tabel 1. Tabel 1. Hasil Association Rules Cluster 1 Min Sup Premises Meja Makan Elite Led 32Ay Rak Tv Asia Jaya Conclusion Rak Piring Asia Jaya Rak Tv Asia Jaya Led 32Ay Support Confidence Asosiasi Cluster 2 Dari hasil pencarian rules dengan tools RapidMiner pada cluster 2, dapat disimpulkan bahwa ditemukan rules sebanyak 1 rules pada nilai minimum support sebesar 30%, dan pada nilai minimum support sebesar 50% tidak ditemukan rules atau pola. Rules dapat dilihat pada tabel 2. Market Basket Analysis with K-Means and FP-Growth. (Stiorini et al, 2. ISSN(P): 2797-2313 ISSN(E): 2775-8575 Tabel 2. Hasil Association Rules Cluster 2 Min Sup Premises Rak Piring Asia Jaya Conclusion Meja Makan Elite Support Confidence Asosiasi Cluster 3 Dari hasil pencarian rules dengan tools RapidMiner pada cluster 3, dapat disimpulkan bahwa ditemukan rules sebanyak 1 rules pada nilai minimum support sebesar 30%, dan pada nilai minimum support sebesar 50% tidak ditemukan rules atau pola. Rules dapat dilihat pada tabel 3. Tabel 3. Hasil Association Rules Cluster 3 Min Sup Premises Led 32Ay Conclusion Rak Tv Asia Jaya Support Confidence Asosiasi Cluster 4 Dari hasil pencarian rules dengan tools RapidMiner pada cluster 4, dapat disimpulkan bahwa ditemukan rules sebanyak 5 rules pada nilai minimum support sebesar 30%, dan pada nilai minimum support sebesar 50% ditemukan rules atau pola sebanyak 3 rules. Rules dapat dilihat pada tabel 4. Tabel 4. Hasil Association Rules Cluster 4 Min Sup Premises Lemari Es 1p Lemari Pakaian 1p Rak Piring Asia Jaya Mesin Cuci 2t Led 32A. Lemari Pakaian 1p Rak Piring Asia Jaya Mesin Cuci 2t Conclusion Meja Makan Elite Mesin Cuci 2t Meja Makan Elite Lemari Pakaian 1p Rak Tv Asia Jaya Mesin Cuci 2t Meja Makan Elite Lemari Pakaian 1p Support Confidence Asosiasi Cluster 5 Dari hasil pencarian rules dengan tools RapidMiner pada cluster 5, dapat disimpulkan bahwa ditemukan rules sebanyak 6 rules pada nilai minimum support sebesar 30%, dan pada nilai minimum support sebesar 50% ditemukan rules atau pola sebanyak 1 rules. Rules dapat dilihat pada tabel 5. Tabel 5. Hasil Association Rules Cluster 5 Min Sup Premises Mesin Cuci 2t Kitchen Set Meja Makan Elite Lemari Es 1p Rak Piring Asia Jaya Led 32Ay Rak Piring Asia Jaya Conclusion Lemari Pakaian 1p Meja Makan Elite Rak Piring Asia Jaya Meja Makan Elite Meja Makan Elite Rak Tv Asia Jaya Meja Makan Elite Support Confidence Berdasarkan ketetapan nilai Support 30% dan 50% dengan Confidence 50%, masing-masing memiliki keunggulan dari setiap cluster yang terbentuk. KESIMPULAN Berdasarkan dari penelitian yang dilakukan dalam menentukan poa pembelian konsumen pada PT. Citra Mustika Pandawa, dapat ditarik kesimpulan dengan melakukan beberapa percobaan dengan menggunakan algoritmaK-Means clustering, diperoleh cluster optimal sebanyak 5 cluster berdasarkan nilai uji validitas Davies Bouldin Indeks (DBI) sebesar 0. Berdasarkan percobaan pencarian Association Rules yang terdiri dari 5 cluster dengan nilai minimum support 30% dan nilai minimum confidence 50%,diperoleh hasil bahwa Association Rules ditemukan pada cluster 1, 2, 3, 4, 5. Dan ditemukan 3 rules pada cluster 1, pada cluster 2 & 3 ditemukan 1 rules, cluster 4 ditemukan 5 rules dan cluster 5 ditemukan 6 rules. Sedangkan pada percobaan dengan menggunakan nilai minimum support 50% dan minimum confidence 50% diperoleh hasil bahwa Associaton Rules hanya ditemukan pada cluster 4 dengan 3 rules dan cluster 5 dengan 1 rules. Pada tiap clusterdiketahui bahwa terdapat 8 items/produk yang sering dibeli oleh pelangganpada PT. Citra MALCOM - Vol. 1 Iss. 1 April 2021, pp: 41-46 MALCOM-1. : 41-46 Mustika Pandawa yaitu produk Meja Makan Elite. RakPiring Asia Jaya. Tv Led 32". Lemari Es 1P. Kitchen Set. MesinCuci 2T, dan Lemari Pakaian 1P. REFERENSI