Volume 20 Nomor 1 . E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika MENINGKATKAN MODEL KLASIFIKASI MENGGUNAKAN ALGORITMA NAIVE BAYES PADA DATA PENJUALAN DI TOKO PELANGI JAYA MOTOR Nursyatika Berliana Susilowati. Cep Lukman Rohman. Fadhil M. Basysyar. Muhamad Sulaeman. Jurusan Teknik Informatika. STMIK IKMI CIREBON Jl. Perjuangan No. Karyamulya. Kec. Kesambi. Kota Cirebon. Jawa Barat 45135 E-mail : . nursyatikabeliana@gmail. com , . ikmi@gmail. Fadhil. basysyar@gamil. com, . ikmi@gmail. ABSTRAK Toko Pelangi Jaya Motor menghadapi kesulitan dalam mengelola stok sparepart akibat ketidaksesuaian antara jumlah persediaan dan permintaan pelanggan. Untuk mengatasi hal ini, penelitian ini menggunakan algoritma Nayve Bayes guna mengklasifikasikan barang "laris" dan "tidak laris" berdasarkan data penjualan. Dataset yang digunakan berjumlah 9. 081 transaksi dengan preprocessing mencakup pembersihan data, pelabelan kategori, serta seleksi fitur menggunakan Weight by Information Gain. Hasil analisis menunjukkan bahwa atribut jumlah penjualan (Qt. memiliki pengaruh terbesar dalam klasifikasi dengan akurasi model mencapai 97. Penelitian ini memberikan solusi berbasis data untuk meningkatkan efisiensi pengelolaan stok dan kepuasan Kata kunci : Klasifikasi. Nayve Bayes. Permintaan Pelanggan. Sparepart Motor ABSTRACT Pelangi Jaya Motor Store faces difficulties in managing spare part stock due to the mismatch between the amount of inventory and customer demand. To overcome this, this study uses the Nayve Bayes algorithm to classify "hot" and "non-hot" items based on sales data. The dataset used is 9,081 transactions with preprocessing including data cleaning, category labeling, and feature selection using Weight by Information Gain. The results of the analysis show that the sales quantity (Qt. attribute has the greatest influence on classification with a model accuracy reaching This study provides a data-based solution to improve stock management efficiency and customer satisfaction. Keywords: Classification. Nayve Bayes. Customer Demand. Motor Spareparts PENDAHULUAN Sparepart merupakan sebuah barang yang berisikan berbagai komponen dalam suatu kesatuan dan memiliki fungsi tertentu. Sparepart banyak digunakan di berbagai jenis kendaraan, sehingga jenis-jenisnya juga sangat beragam . Sebagai penyedia sparepart. Toko Pelangi Jaya Motor sering menghadapi tantangan dalam pengelolaan stok Ketidaktepatan dalam memprediksi barang "Laris" dan "Tidak Laris" dapat menyebabkan kelebihan atau kekurangan stok, yang berujung pada penurunan efisiensi operasional dan kepuasan Pengelolaan stok yang tidak optimal dapat meningkatnya biaya operasional akibat penumpukan barang yang tidak terjual atau hilangnya potensi penjualan karena stok habis. Untuk mengatasi masalah ini, diperlukan metode analisis data yang mampu memprediksi pola permintaan pelanggan secara akurat. Penelitian ini bertujuan untuk mengatasi permasalahan tersebut dengan mengidentifikasi pola permintaan barang "Laris" menggunakan algoritma Diterima Redaksi : 1 Januari 2025 | Selesai Revisi : 11 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 . 11-16 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Nayve Bayes. Algoritma ini dipilih karena kemampuannya dalam menganalisis data besar, memproses informasi dengan cepat, serta menghasilkan klasifikasi yang akurat meskipun dengan jumlah data yang besar dan atribut yang Dengan memahami pola permintaan pelanggan, toko dapat mengoptimalkan pengelolaan stok dan meminimalkan risiko kerugian. Berbagai penelitian sebelumnya telah menunjukkan keberhasilan penerapan algoritma Nayve Bayes dalam bidang klasifikasi. Misalnya, penelitian oleh . menunjukkan bahwa algoritma ini dapat meningkatkan efisiensi dalam pengelolaan data Penelitian lain oleh . membuktikan pengambilan keputusan strategis. Berdasarkan hasil literatur sebelumnya, dapat disimpulkan bahwa algoritma Nayve Bayes memiliki keunggulan dalam mengklasifikasikan data penjualan dan ulasan produk dengan akurasi tinggi. Contohnya, dalam penelitian Nawangsih & Setyaningsih . , algoritma Nayve Bayes berhasil mengklasifikasikan produk terlaris dalam penjualan voucher kuota dengan akurasi 97,50%. Sementara itu, penelitian yang dilakukan oleh Fahtu Rahman et al. menggunakan Nayve Bayes mengenai produk batik dengan akurasi 81,90%. Selain itu, penelitian oleh Teknika et al. menunjukkan bahwa algoritma Nayve Bayes mampu memberikan akurasi yang sebanding dengan KNearest Neighbor (KNN). Kelebihan utama dari Nayve Bayes adalah kemampuannya untuk mengklasifikasikan data ke dalam kategori tertentu dengan cepat serta kesederhanaannya dalam menangani dataset besar. Berdasarkan hasil tersebut, penelitian ini dirancang untuk fokus pada pengelolaan stok sparepart di Toko Pelangi Jaya Motor dengan menerapkan algoritma Nayve Bayes untuk klasifikasi barang "Laris". METODE PENELITIAN Bagian penelitian yang meliputi jenis data, metode pengumpulan data, serta tahapan dalam Knowledge Discovery in Databases (KDD). 1 Jenis Data 2 Metode Pengumpulan Data Teknik pengumpulan data dalam penelitian ini menggunakan teknik sekunder yang diperoleh melalui kesepakatan antara peneliti dan pihak Toko Pelangi Jaya Motor di Cirebon. Data transaksi penjualan dikumpulkan secara langsung dari aplikasi toko yang digunakan untuk mencatat transaksi harian. Hasil dari pengumpulan data ini disediakan oleh pihak toko dalam format Excel . berjumlah 081, yang kemudian diproses lebih lanjut dan diimpor ke dalam aplikasi AI Studio 2024. 0 untuk dianalisis sesuai dengan tujuan penelitian. 3 Metode Naive Bayes Penelitian ini menggunakan algoritma Nayve Bayes, salah satu algoritma klasifikasi yang umum digunakan dalam data mining. Nayve Bayes didasarkan pada Teorema Bayes, yang menghitung probabilitas setiap kelas berdasarkan atribut yang ada. Perhitungan probabilitas dilakukan menggunakan Persamaan . = ycE. O ycE. cU) Keterangan: : Probabilitas hipotesis berdasar kondisi . osteriori probabilit. : Probabilitas hipotesis . rior probabilit. : Probabilitas berdasarkan kondisi pada P. : Probabilitas c Sumber : . 4 Tahapan Perancangan KDD Data mining merupakan bagian dari tahap proses Knowledge Discovery in Database (KDD), yang bertujuan untuk mencari informasi baru dan berharga dalam suatu kumpulan data atau database . Metode data mining yang digunakan dalam penelitian ini menggunakan proses tahapan Knowledge Discovery in Database (KDD) preprocessing data, data transformation, data mining, dan evaluasi dapat dilihat pada Gambar 1 . Data yang digunakan pada penelitian ini bersifat sekunder . yaitu data diperoleh langsung dari transaksi penjualan di Toko Pelangi Jaya Motor. Diterima Redaksi : 1 Januari 2025 | Selesai Revisi : 11 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 . E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika 5 Penanganan Data Hilang DATA SELEC TION PREPR OCESS ING TRAN SFOR MATI DATA MININ EVAL UATIO RESUL Dalam tahap preprocessing, tidak ditemukan data duplikat karena setiap transaksi bersifat unik. Namun, terdapat nilai kosong pada atribut jumlah penjualan (Qt. Untuk mengatasi hal ini, nilai kosong digantikan . dengan 0 agar data dapat diproses dengan baik oleh algoritma Nayve Bayes tanpa kehilangan informasi yang relevan. Hal ini memastikan bahwa semua transaksi tetap terhitung dalam proses analisis. Gambar 1. Tahapan Perancangan KDD Data Selection Merupakan tahapan dari pemilihan data dari sekumpulan data operasional yang perlu dilakukan sebelum tahap penggalian informasi pada KDD . Preprocessing Pada tahap ini adalah menyiapkan data agar siap digunakan untuk ke tahap selanjutnya seperti memperbaiki kesalahan dalam data . Transformation Transformasi merupakan gabungan intruksi untuk mengubah input menjadi output yang diinginkan, menyesuaikan juga dengan algoritma yang akan dipakai . Data Mining Tahapan yang paling utama dari proses tahapan perancangan adalah proses data mining, yang merupakan proses mencari bentuk atau informasi yang menarik terpilih dengan menggunakan metode tertentu. Pada tahapan ini menggunakan algoritma Nayve Bayes untuk membangun model dan menguji model . Tujuan utama dari data mining mungkintidak terlihat secara langsung pada data, sehingga dapat memberikan informasi yang lebih dalam dan valid . Evaluation Hasil dari data mining, yakni alur informasi yang muncul dari proses, perlu disajikan dalam format yang dapat dipahami dengan mudah oleh para pemangku kepentingan . Result Pada tahapan ini merupakan tahapan terakhir dilakukannya identifikasi barang-barang sparepart yang masuk dalam label "LarisAy. 6 Pemilihan Split Data 70%-30% Tanpa Validasi Silang Split data adalah proses pemisahan data menjadi dua set berbeda, yaitu data latih . dan data uji . Pemilihan rasio 70%-30% didasarkan pada keseimbangan antara pelatihan model yang cukup dan pengujian yang representatif . Validasi silang tidak digunakan karena dataset yang dianalisis sudah memiliki distribusi yang cukup stabil dan representatif. Selain itu, pendekatan ini telah digunakan dalam penelitian sebelumnya dengan tingkat keberhasilan yang baik dalam kasus klasifikasi serupa. HASIL DAN DISKUSI Proses analisis data dilakukan menggunakan aplikasi AI Studio 2024. 0 dengan langkah-langkah berikut sesuai tahapan KDD: Data Selection Untuk mengelola sebuah data dengan cara menempatkan operator Read Excel untuk membaca dataset dalam format excel. Proses membaca dataset dalam format Excel dilakukan dengan menggunakan operator Read Excel, seperti yang ditunjukkan pada Gambar 2. Gambar 2. Operator Read Excel Preprocessing Pengelompokkan Data Data dikelompokkan berdasarkan attribute Tanggal. Kategori. Sat dan Nama Barang dengan menggunakan operator Diterima Redaksi : 1 Januari 2025 | Selesai Revisi : 11 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 . 11-16 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Aggregate. Gambar 3. Prosesnya Seleksi Fitur Transformation data menggunakan operator Split Data dengan parameter 0. untuk data training dan 0. 3 untuk data Prosesnya ditunjukkan pada Gambar Gambar 3. Operator Aggregate Pembuatan Label Pelabelan data dilakukan dengan operator Generate Attribute, dengan ketentuan: jika Qty (Kuantita. lebih dari 10, maka diberi label "Laris", dan jika Qty (Kuantita. Kurang dari atau sama dengan 10, maka diberi label "Tidak Laris". Penentuan label ini berdasarkan wawancara dengan pihak toko. Proses ditunjukkan pada Gambar 4. Gambar 7. Operator Split Data Data Mining Data mining menggunakan operator Naive Bayes untuk klasifikasi. Prosesnya sebagai Gambar 4. Operator Generate Attributes Gambar 8. Operator Nayve Bayes Pengaturan Attribute Setelah kemudian dilakukan pengaturan peran atribut menggunakan operator set role agar menjadi atribut label pada proses analisis di AI Studio 2024. Proses ditunjukkan pada Gambar 5. Evaluation Evaluation atau evaluasi model. Disini peneliti menggunakan operator perrformence. Prosesnya sebagai berikut: Gambar 9. Operator Perfomance Gambar 5. Operator Set Role Transformation Penilaian Atribute Menilai setiap atribut untuk memilih fitur yang paling berpengaruh menggunakan operator Weight by Information Gain. Hasil pengujian adalah nilai accuracy, precision, dan recall yang ditunjukkan pada Tabel 1. Tabel 1. Hasil Confusion Matrix true laris Gambar 6. Operator Weight by Information Gain Diterima Redaksi : 1 Januari 2025 | Selesai Revisi : 11 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 . 11-16 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Accuracy menunjukkan hasil yang benar Precision mengukur tingkat keakuratan prediksi positif terhadap semua data yang diprediksi laris, berikut rumusnya: Recall menunjukkan sejauh mana model dapat menangkap data positif yang sebenarnya, berikut rumusnya: Interpretasi hasil Confusion Matrix pada Tabel 1, diperoleh bahwa accuracy model 17%, dengan precision kelas "Laris" sebesar 74. 41% dan recall kelas "Laris" sebesar 95. Nilai recall yang tinggi menunjukkan bahwa model mampu mengenali sebagian besar barang yang benar-benar laris, tetapi precision yang lebih rendah mengindikasikan masih adanya mengklasifikasikan barang yang seharusnya tidak laris. Report Setelah tahap evaluation selesai, hasil menunjukkan untuk barang-barang sparepart yang menunjukkan label laris sebagai berikut: Gambar 10. Visualisasi Report Gambar di atas merupakan diagram batang yang menunjukkan jumlah total penjualan barang (Sum(Qt. ) berdasarkan nama barang di Toko Pelangi Jaya Motor. Sumbu horizontal (X) mewakili berbagai sparepart, seperti BD (Ban Dala. , oli, busi, dan sparepart motor lainnya, sementara sumbu vertikal (Y) menunjukkan total kuantitas penjualan barang dalam satuan tertentu. Dari diagram ini, dapat terlihat bahwa terdapat beberapa barang dengan penjualan yang sangat tinggi, seperti "OLI AHM MPX 2 0,8L", "BD ASPIRA 17-225/250". AuBD ASPIRA 14-250/275Ay . AuBD ASPIRA 17-250/275Ay dan AuBUSI 4T PDK AHM U22FSU DENSO. KESIMPULAN DAN SARAN Penelitian ini berhasil mengidentifikasi barang "Laris" menggunakan algoritma Nayve Bayes, yang membantu Toko Pelangi Jaya Motor dalam memahami pola permintaan pelanggan. Dengan penerapan model ini, toko dapat mengoptimalkan pengelolaan stok, mengurangi risiko kelebihan atau kekurangan barang, serta meningkatkan kepuasan Model yang digunakan memiliki beberapa kelebihan, seperti akurasi tinggi dalam klasifikasi barang, efisiensi dalam komputasi, serta kemampuan menangani dataset transaksi dalam jumlah besar. Namun, model ini juga memiliki mempertimbangkan hubungan kompleks antar fitur dan precision yang masih perlu ditingkatkan untuk kelas "Laris". Untuk pengembangan lebih lanjut, penelitian mendatang dapat mengeksplorasi metode Random Forest meningkatkan performa klasifikasi, menerapkan validasi silang untuk meningkatkan generalisasi model, serta mengintegrasikan sistem rekomendasi agar toko dapat mengoptimalkan stok secara otomatis berdasarkan pola permintaan pelanggan. DAFTAR PUSTAKA