Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Penerapan Algoritma Apriori Untuk Menemukan Pola Asosiasi Pada Data Penjualan Retail Fashion Sinta Devi Rahmawati1. Adinda Bintang Oktavia2. Fadina Salwa Aulia Putri 3. Diana Laily Fithri 4 202253139@std. id, 2202253140@std. 202253152@std. id, 4diana. laily@umk. 1,2,3,4 Sistem Informasi. Fakultas Teknik. Universitas Muria Kudus Abstrak Penelitian ini menerapkan algoritma Apriori dalam analisis data transaksi penjualan di bidang retail fashion guna menemukan keterkaitan produk yang kerap dibeli dalam satu waktu. Dataset yang dianalisis berisi 3. 400 transaksi pelanggan dari platform Kaggle, dan diolah menggunakan RapidMiner dengan parameter minimum support 0,1 serta confidence 0,6. Metode yang digunakan meliputi preprocessing data, normalisasi, transformasi one-hot encoding, dan pengujian dengan operator W-Apriori. Hasilnya ditemukan pola signifikan, seperti pembelian backpack dan loafers berasosiasi kuat dengan raincoat . onfidence 74%). Algoritma Apriori terbukti efisien dalam mengenali pola kebiasaan pembelian konsumen, dan dapat digunakan untuk kegiatan promosi, penyusunan rekomendasi produk, dan penataan layout toko. Aturan asosiasi yang diperoleh mencerminkan pola perilaku konsumen saat berbelanja, salah satunya menunjukkan adanya hubungan erat antara beberapa produk. Informasi tersebut dapat dimanfaatkan sebagai dasar pengambilan keputusan strategis yang berorientasi data, termasuk dalam penataan produk yang lebih efisien, pengembangan fitur rekomendasi, serta perancangan promosi yang relevan dan tepat sasaran. Kata kunci: Algoritma Apriori. Data Mining. Pola Asosiasi. Retail Fashion. RapidMiner. Abstract This research explores the application of the Apriori algorithm in uncovering itemset associations within retail fashion sales data. Using transaction data consisting of 3,400 records collected from the Kaggle platform, this study employed the Apriori algorithm within the RapidMiner environment, applying a minimum support value of 0. 1 and a confidence threshold of 0. The evaluation uncovered repeated cooccurrences among various fashion products, providing insight into underlying consumer behavior and their preferences in item selection. The knowledge extracted from the analysis may serve as a valuable reference in shaping business initiatives, particularly in arranging product placements more effectively, refining suggestion mechanisms, and designing promotional efforts that reflect actual consumer buying The derived knowledge is expected to guide data-driven business strategies, particularly in optimizing in-store product positioning, refining recommendation models, and crafting more targeted marketing interventions. Keywords: Apriori Algorithm. Data Mining. Association Rules. Retail Analytics. RapidMiner Pendahuluan Industri retail fashion mengalami pertumbuhan yang pesat, mendorong perusahaan untuk lebih memahami perilaku konsumen guna mempertahankan daya saing dan meningkatkan efisiensi bisnis. Salah satu pendekatan strategis dalam memahami pola pembelian konsumen adalah melalui analisis data transaksi Selain berfungsi sebagai catatan operasional, memahami pola pembelian konsumen dapat dimanfaatkan sebagai sumber informasi untuk menggali keterkaitan antar produk yang dibeli dalam satu Fenomena ini mengindikasikan adanya hubungan atau keterkaitan di antara sejumlah produk yang dibeli secara bersamaan, meskipun keterkaitan tersebut tidak selalu tampak secara eksplisit. Untuk mengidentifikasi pola-pola keterkaitan tersebut, pendekatan association rule mining merupakan metode analisis yang tepat dan sesuai. Algoritma ini bekerja dengan mengukur frekuensi kemunculan bersamaan . dan tingkat kepercayaan antar item . dalam data transaksi. http://e-jurnal. id/simkom Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Beberapa studi sebelumnya telah membuktikan efektivitas algoritma Apriori dalam mengidentifikasi pola asosiasi produk di sektor retail secara umum . , . , serta dalam sistem rekomendasi produk berbasis web . Namun, kajian tersebut umumnya masih bersifat generik dan belum secara khusus diterapkan pada sektor retail fashion, yang memiliki karakteristik unik seperti ragam produk yang tinggi, pola musiman, dan dinamika preferensi konsumen yang cepat berubah. Melalui pendekatan algoritma Apriori, penelitian ini bertujuan untuk menganalisis data transaksi penjualan di sektor retail fashion dan menemukan keterhubungan antar produk yang lazim dibeli Data yang digunakan diperoleh dari platform Kaggle, yang berisi ribuan transaksi aktual dan relevan dengan konteks industri. Hasil dari pendekatan ini diharapkan memberikan landasan yang kuat bagi perumusan strategi operasional, mencakup penentuan kombinasi produk, pengembangan promosi yang lebih terarah, serta optimalisasi penataan produk di lingkungan toko retail fashion. Penelitian ini difokuskan pada sektor retail fashion dengan pendekatan analisis berbasis data transaksi aktual dalam jumlah besar, sehingga memberikan konteks yang lebih spesifik dan aplikatif terhadap dinamika industri tersebut. Penelitian ini juga mengusulkan pendekatan yang terintegrasi secara komprehensif, dimulai dari tahapan data preprocessing, transformasi one-hot encoding, hingga pembentukan aturan asosiasi menggunakan perangkat lunak RapidMiner. Dengan konfigurasi parameter support dan confidence yang disesuaikan, penelitian ini menyajikan state-of-the-art implementasi algoritma Apriori dalam konteks pengambilan keputusan berbasis data di lingkungan bisnis retail fashion. Metode Penelitian Penelitian ini menerapkan metode kuantitatif dengan menggunakan algoritma Apriori untuk menggali pola keterhubungan antar produk berdasarkan data transaksi penjualan pada bidang retail fashion. Apriori mengevaluasi kombinasi item . yang sering muncul bersamaan menggunakan parameter support dan confidence . Penerapan algoritma didahului dengan proses preprocessing data, termasuk seleksi atribut yang relevan, pembersihan data, penyeragaman format, serta pengubahan data ke bentuk biner melalui teknik one-hot encoding. Format ini mempermudah analisis frekuensi itemset dan pembentukan aturan asosiasi secara efisien. Alur proses kerja algoritma digambarkan pada Gambar 1. Gambar 1. Alur Proses Algoritma Apriori http://e-jurnal. id/simkom Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Gambar 1 menunjukkan alur kerja algoritma Apriori yang diawali dengan penetapan nilai minimum support dan confidence, lalu dilanjutkan dengan pemrosesan data transaksi yang sebelumnya telah melalui tahap preprocessing. Langkah berikutnya mencakup seleksi itemset berdasarkan minimum support, pembentukan frequent itemset, dan penyaringan item yang tidak layak melalui proses pruning. Setelah itu, dilakukan pembentukan aturan asosiasi dan evaluasi terhadap setiap aturan berdasarkan nilai confidence dan lift. Setiap tahapan dilakukan secara iteratif hingga tidak ada lagi kombinasi itemset baru yang memenuhi syarat, dan algoritma menghasilkan aturan asosiasi yang valid untuk dianalisis lebih lanjut. 1 Pengumpulan Data Data merupakan kumpulan fakta atau informasi yang dikumpulkan dengan tujuan untuk dianalisis dan mendukung suatu penelitian atau pendapat . Data bersumber dari dataset publik berjudul AuFashion Retail SalesAy yang diunduh melalui platform Kaggle . Dataset tersebut terdiri dari 3. 400 catatan transaksi penjualan produk fashion pada sebuah toko retail. Setiap entri transaksi memuat sejumlah atribut penting, antara lain: ID pelanggan, jenis item yang dibeli, tanggal transaksi, jumlah pembelian, metode pembayaran, serta ulasan atau penilaian pelanggan terhadap produk. 2 Preprocessing Data Preprocessing Data merupakan tahap awal yang melibatkan sejumlah proses untuk menyiapkan data sebelum dianalisis atau pembangunan model . Tahap preprocessing bertujuan untuk menyempurnakan kualitas data melalui proses pembersihan, normalisasi, dan penyesuaian sehingga data tersebut berada dalam kondisi optimal untuk dianalisis oleh algoritma data mining atau pemodelan berbasis machine learning . Berikut adalah tahapan dalam preprocessing data: Pemilihan Atribut Langkah awal dalam proses pra-pemrosesan data adalah memilih atribut yang relevan dengan tujuan Dalam konteks analisis asosiasi pola pembelian, atribut yang digunakan adalah Customer Reference ID sebagai identitas unik pelanggan dan Item Purchased sebagai informasi utama terkait produk yang dibeli. Pembersihan Data Proses pembersihan data bertujuan untuk mengatasi berbagai ketidaksesuaian ataupun kekurangan, seperti nilai yang hilang . issing valu. Data yang memiliki nilai kosong pada atribut kunci dapat menyebabkan kesalahan dalam analisis dan menghasilkan pola yang tidak akurat. Oleh karena itu, baris data yang memiliki nilai kosong pada kolom Customer Reference ID atau Item Purchased dihapus dari . Normalisasi Format Data Untuk menghindari inkonsistensi data akibat perbedaan penulisan, seperti kapitalisasi atau spasi ekstra, seluruh data pada kolom Item Purchased dinormalisasi ke huruf kecil dan dilakukan trimming terhadap spasi di awal dan akhir string. Langkah ini memastikan bahwa item yang sama tidak dikenali sebagai item yang berbeda oleh sistem. Penghapusan Duplikasi Data Biasanya, penghapusan data duplikat menjadi bagian penting dalam tahap pembersihan data untuk menjaga keakuratan informasi. Namun, berdasarkan hasil pengecekan terhadap dataset yang digunakan, tidak ditemukan adanya baris data yang sepenuhnya identik. Dengan demikian, proses penghapusan duplikasi tidak diperlukan karena data yang tersedia telah terbebas dari duplikasi. Transformasi Data Pembentukan Transaksi Pelanggan Langkah pertama dalam transformasi data adalah mengelompokkan setiap item yang dibeli oleh pelanggan berdasarkan identitas unik yaitu Customer Reference ID. Dalam konteks analisis asosiasi, setiap pelanggan dianggap sebagai satu unit transaksi yang berisi satu atau lebih item yang dibeli. Transformasi One-Hot Encoding Data transaksi kemudian ditransformasikan ke dalam format biner menggunakan one-hot encoding, yang mana setiap item diubah menjadi kolom dengan nilai 1 menandakan membeli dan 0 jika tidak. Representasi ini mempermudah perhitungan frekuensi item dan memungkinkan penerapan algoritma asosiasi seperti Apriori secara efisien melalui struktur data yang http://e-jurnal. id/simkom Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. 3 Alat Bantu RapidMiner Studio pada tahun 2024 berganti nama menjadi Altair AI Studio, merupakan platform data science berbasis visual yang mendukung pengembangan dan penerapan aplikasi analitik prediktif. Platform ini dikenal karena antarmuka yang ramah pengguna serta kemampuannya dalam memfasilitasi analisis data tanpa perlu pemrograman, sehingga cocok untuk pengguna dari berbagai tingkat keahlian. Dalam penelitian ini, analisis dilakukan menggunakan perangkat lunak RapidMiner Studio karena menyediakan antarmuka visual dan dukungan terhadap algoritma association rule mining. Operator WApriori, yang merupakan bagian dari ekstensi WEKA, digunakan untuk mengeksekusi algoritma Apriori dengan parameter yang telah ditentukan. Penggunaan alat bantu ini memudahkan proses analisis tanpa memerlukan pengkodean manual. 4 Metode Asosiasi Metode yang bertujuan untuk mengungkap keterkaitan atau hubungan tersembunyi antar pasangan item atau atribut dalam data . , sehingga pola keterkaitan tersebut dapat dimanfaatkan dalam pengambilan keputusan. Dalam analisis transaksi penjualan retail fashion ini, metode asosiasi digunakan untuk mengenali pola pemilihan produk dalam perilaku belanja pelanggan. Penentuan aturan asosiasi didasarkan pada dua parameter utama berupa nilai support dan tingkat confidence . 5 Algoritma Apriori Algoritma Apriori merupakan metode paling populer dalam association rule mining, guna mengidentifikasikan hubungan keterkaitan antar item berdasarkan data transaksi. Cara kerja algoritma ini adalah dengan mengidentifikasi kombinasi item . yang terjadi bersamaan, berdasarkan nilai ambang batas minimum support dan confidence . Pada dasarnya, algoritma Apriori menjalankan proses iteratif untuk menghasilkan frequent itemsets. Langkah pertama adalah menentukan semua 1-itemsets yang memenuhi nilai minimum support. Kemudian dilakukan proses ekspansi menjadi 2-itemsets, 3-itemsets, dan seterusnya, dengan prinsip bahwa jika suatu itemsets tidak memenuhi support, maka superset-nya juga tidak akan memenuhi. Nilai support digunakan untuk mengukur proporsi kejadian itemset dalam seluruh transaksi, sebagaimana dihitung menggunakan rumus . untuk satu item seperti berikut: Support (A) = Jumlah Transaksi yang Mengandung Item A Total Jumlah Transaksi Sedangkan rumus untuk menghitung support dua item, sebagaimana dihitung menggunakan rumus . sebagai berikut: Support (A O B ) = Jumlah Transaksi yang Mengandung Item A dan B Total Jumlah Transaksi Confidence digunakan untuk mengukur tingkat kepercayaan terhadap sebuah aturan asosiasi. Ini mengevaluasi seberapa sering item B muncul dalam transaksi yang juga mengandung item A . Perhitungan ini dilakukan menggunakan rumus: Confidence (A IeB)= Jumlah Transaksi yang mengandung item A dan B Jumlah Transaksi yang mengandung item A . Sebagai pelengkap evaluasi, digunakan pula metrik lift yang dihitung dengan persamaan . Lift digunakan untuk menilai apakah asosiasi antar item bersifat signifikan atau hanya terjadi secara kebetulan. yaycnyceyc ycIycaycycnycu = http://e-jurnal. id/simkom yaycuycuyceycnyccyceycuycayce . cU IeycU) ycIycycyycyycuycyc . cU) . Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Hasil dan Pembahasan 1 Hasil Model Dalam studi ini, data transaksi penjualan retail fashion dianalisis menggunakan algoritma Apriori guna mengungkap keterkaitan antar produk. Dataset yang dianalisis diambil dari platform Kaggle, 400 transaksi pelanggan selama periode November 2022 hingga Juli 2023. Data telah melalui proses preprocessing yang meliputi seleksi atribut, pembersihan data, normalisasi, serta transformasi ke dalam bentuk one-hot encoding. Selanjutnya, proses pembentukan model dilakukan menggunakan perangkat lunak RapidMiner dengan operator W-Apriori. Parameter minimum support ditetapkan sebesar 0,1, dan minimum confidence sebesar 0,6. Berdasarkan konfigurasi tersebut, algoritma menghasilkan kombinasi itemsets seperti ditunjukkan pada Tabel 1. Tabel 1. Jumlah Itemsets yang Dihasilkan oleh Algoritma Apriori Jenis Itemset Jumlah Kombinasi 1-itemsets 2-itemsets 3-itemsets Setelah tahap pembentukan frequent itemsets, sejumlah aturan asosiasi . ssociation rule. berhasil Enam pola nilai support dan confidence tertinggi disajikan pada Tabel 2. Tabel 2. Aturan Asosiasi dengan Nilai Tertinggi Antecedent backpack=true, loafers=true backpack=true, raincoat=true handbag=true, sneakers=true handbag=true, skirt=true loafers=true, raincoat=true skirt=true, trench coat=true Association Rules Support . umlah Consequent raincoat=true loafers=true skirt=true sneakers=true backpack=true belt=true Confidence 0,74 0,71 0,71 0,68 0,65 0,65 Aturan nomor 1 menunjukkan bahwa pelanggan yang membeli backpack dan loafers memiliki kemungkinan sebesar 74% juga membeli raincoat, yang menunjukkan korelasi yang kuat di antara ketiga produk tersebut. 2 Interpretasi Berdasarkan hasil aturan asosiasi yang diperoleh, berikut adalah interpretasi dari beberapa aturan dengan tingkat kepercayaan tertinggi: Backpack dan Loafers = Raincoat Pelanggan yang membeli backpack dan loafers secara bersamaan memiliki kemungkinan sebesar 74% juga membeli raincoat. Hal ini menunjukkan bahwa ketiga item tersebut sering dibeli dalam satu transaksi dan dapat dijadikan paket promosi yang relevan. Backpack dan Raincoat = Loafers Aturan ini mengindikasikan bahwa ketika pelanggan membeli backpack dan raincoat, terdapat peluang sebesar 71% bahwa mereka juga akan membeli loafers. Ini menunjukkan bahwa loafers cenderung menjadi pelengkap dari dua item sebelumnya. Handbag dan Sneakers = Skirt Dengan tingkat kepercayaan sebesar 71%, kombinasi pembelian handbag dan sneakers sering diikuti oleh pembelian skirt. Ini dapat menjadi dasar dalam penataan produk berbasis gaya berpakaian. http://e-jurnal. id/simkom Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Handbag dan Skirt = Sneakers Sebaliknya, ketika pelanggan membeli handbag dan skirt, peluang membeli sneakers mencapai 68%. Ini menegaskan bahwa ketiga produk tersebut saling terkait secara visual maupun fungsional dalam satu gaya berbusana. Loafers dan Raincoat = Backpack Aturan ini memperlihatkan bahwa kombinasi pembelian loafers dan raincoat mendorong kemungkinan sebesar 65% untuk juga membeli backpack. Produk-produk ini dapat dikemas dalam satu tema, misalnya "outdoor look". Skirt dan Trench Coat = Belt Pelanggan yang membeli skirt dan trench coat berpeluang 65% untuk juga membeli belt, yang berpotensi menjadi aksesori dalam gaya berpakaian formal. 3 Visualisasi Untuk membantu interpretasi aturan asosiasi, hasil model divisualisasikan dalam bentuk scatter plot yang menampilkan distribusi nilai support dan confidence dari setiap ketentuan yang terbentuk, seperti pada Gambar 2 berikut. Gambar 2. Scatter Plot Support vs Confidence Scatter plot tersebut menunjukkan bahwa sebagian besar aturan berada pada kisaran support antara 0,10Ae0,16 dan confidence antara 0,65Ae0,74. Titik-titik dengan nilai paling tinggi pada kedua metrik tersebut merepresentasikan aturan yang paling potensial untuk diterapkan dalam strategi bisnis retail fashion. Kesimpulan dan Saran 1 Kesimpulan Hasil penelitian mengindikasikan bahwa algoritma Apriori dapat dimanfaatkan secara efektif untuk mengeksplorasi pola keterkaitan pembelian produk pada data transaksi sektor retail fashion. Melalui tahapan preprocessing, normalisasi data, transformasi ke format one-hot encoding, dan analisis menggunakan RapidMiner dengan konfigurasi minimum support 0,1 dan confidence 0,6, diperoleh sejumlah pola asosiasi yang merepresentasikan perilaku konsumen dalam berbelanja. Ditemukan beberapa kombinasi produk yang konsisten dibeli secara bersamaan, seperti backpack, loafers, dan raincoat, yang menandakan adanya kecenderungan belanja tertentu di kalangan pelanggan. Temuan ini dapat dijadikan rujukan dalam menyusun strategi pemasaran berbasis data, seperti penawaran produk dalam bentuk paket, penempatan produk yang lebih strategis di toko, serta pengembangan sistem rekomendasi otomatis. http://e-jurnal. id/simkom Jurnal Sistem Informasi dan Sistem Komputer. Vol. No. Juli 2025 ISSN: 2715-906X (Onlin. 51717/simkom. Secara keseluruhan, penggunaan algoritma Apriori dalam penelitian ini mampu mengungkap wawasan tersembunyi dari data transaksi dan memberikan kontribusi dalam mendukung pengambilan keputusan bisnis yang lebih tepat sasaran. Untuk pengembangan di masa mendatang, disarankan mengeksplorasi algoritma alternatif seperti FP-Growth guna mengoptimalkan efisiensi analisis pada data berskala besar. 2 Saran Berdasarkan temuan penelitian ini, disarankan agar pihak pengelola usaha retail fashion dapat memanfaatkan hasil analisis menjadi referensi untuk menyusun rencana pemasaran, misalnya penyusunan penawaran bundling penjualan, pengelompokan produk yang saling berkaitan, maupun pengembangan fitur rekomendasi berbasis transaksi. Untuk penelitian selanjutnya, penggunaan data dengan cakupan yang lebih luas dan melibatkan berbagai kondisi atau klasifikasi konsumen diharapkan dapat memberikan hasil yang lebih representatif. Selain itu. FP-Growth dapat menjadi alternatif dalam mengoptimalkan proses analisis, khususnya ketika dihadapkan pada data dengan skala yang lebih besar. Daftar Pustaka