JSI (Jurnal Sistem Informas. Universitas Dirgantara Marsekal Suryadarma p-ISSN: 2355-9675 e-ISSN: 2541-3228 Prediksi Pendapatan Penjualan di Indomaret Menggunakan Algoritma Random Forest Regression Moh Adi Kurniawan1*. Gutti Zaidan Syauqi2. Mia Safriyanti3. Fadila Ullul Azmie4. Arif Setiawan5 1,2,3,4,5Program Studi Sistem Informasi. Fakultas Teknik. Universitas Muria Kudus. Indonesia adikrniawnn@gmail. com, gutizidan@gmail. com, miasfrynti@gmail. com, fadilaazmie@gmail. com, arif. setiawan@umk. Article Info Article history: Received May 2, 2025 Accepted June 10, 2025 Published July 1, 2025 Kata Kunci: Prediksi Penjualan Random Forest Machine Learning Indomaret Evaluasi Model ABSTRAK Penelitian ini bertujuan untuk membangun sistem informasi prediksi pendapatan penjualan di Indomaret menggunakan algoritma Random Forest Regressor. Data yang digunakan merupakan data historis penjualan yang mencakup atribut seperti tanggal transaksi, produk, lokasi toko, metode pembayaran, dan total pendapatan. Model dikembangkan melalui proses pra-pemrosesan data, pelatihan model, dan evaluasi menggunakan metrik Mean Absolute Error (MAE) dan RA Score. Hasil menunjukkan bahwa model memiliki akurasi tinggi dengan MAE sebesar 9. 587,48 dan RA sebesar 0,9998, yang menunjukkan kemampuan prediksi yang sangat Visualisasi hasil prediksi juga menunjukkan kesesuaian antara data aktual dan prediksi. Kesimpulan dari penelitian ini adalah bahwa algoritma Random Forest efektif digunakan untuk memprediksi pendapatan penjualan dan dapat dijadikan alat bantu dalam pengambilan keputusan strategis di bidang ritel, khususnya untuk manajemen stok dan perencanaan promosi. Corresponding Author: Moh Adi Kurniawan. Program Studi Sistem Informasi. Universitas Muria Kudus. Email: *adikrniawnn@gmail. PENDAHULUAN Dalam sepuluh tahun terakhir, telah terjadi perkembangan pesat dalam teknologi Kecerdasan Buatan (AI) yang telah memasuki berbagai sektor seperti perbankan, manufaktur, jasa, dan pemerintahan (Pakpahan, 2. Machine learning sebagai cabang dari AI muncul sebagai teknologi yang menjanjikan untuk mengatasi masalah kompleks, termasuk dalam prediksi bisnis yang memungkinkan optimasi waktu dan peningkatan efisiensi operasional (Frira Sesilia. Viktor Handrianus Pranatawijaya, & Ressa Priskila, 2. Dalam sektor ritel, prediksi pendapatan penjualan yang akurat menjadi sangat penting untuk pengambilan keputusan strategis (Awaludin & Mantik, 2. Keputusan yang tepat waktu dan berbasis data dapat membantu toko ritel dalam mengidentifikasi peluang pasar, memahami tren konsumen, dan meningkatkan efisiensi operasional (Senjaya. Nurina Sari, & Purnamasari, 2. Tantangan ini menjadi semakin kompleks ketika berhadapan dengan volume transaksi yang besar, seperti yang dihadapi oleh jaringan ritel berskala nasional (Awaludin. Yasin, & Risyda, 2. Indomaret merupakan jaringan minimarket waralaba terbesar di Indonesia yang menyediakan berbagai kebutuhan sehari-hari dan sembako (Hadli. Ilhamsyah, & Saputra, 2. Dengan motto "mudah dan terjangkau". Indomaret menempatkan toko-tokonya secara strategis di kawasan perumahan, pusat kota, dan fasilitas umum untuk memudahkan akses masyarakat (Hasan. Wistiasari. Hasvia. De Utami, & Aulia, 2. Sebagai jaringan minimarket tersebar dengan volume transaksi harian yang sangat tinggi. Indomaret memiliki potensi data historis penjualan yang dapat ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) dimanfaatkan untuk membangun sistem prediksi pendapatan yang cerdas dan andal (Latif. Lakoro, & Sukrianto, 2. Dalam penelitian ini, algoritma Random Forest Regressor dipilih sebagai metode untuk memprediksi pendapatan penjualan, dengan mempertimbangkan sejumlah kelebihan yang dimilikinya dibandingkan algoritma lain (Awaludin. Nuryadi, & Pribadi, 2. Meskipun terdapat berbagai metode prediksi seperti Regresi Linier. Decision Tree. XGBoost. LightGBM. CatBoost. Support Vector Machine (SVM), maupun Neural Networks, pemilihan Random Forest dinilai paling sesuai dengan kebutuhan Berbeda dengan regresi linier yang kurang efektif dalam menangani hubungan non-linear antar variabel. Random Forest mampu memodelkan relasi yang kompleks (Sza et al. , 2. Selain itu, dibandingkan Decision Tree tunggal yang cenderung mengalami overfitting. Random Forest memberikan hasil prediksi yang lebih andal melalui pendekatan ensemble, yaitu penggabungan banyak pohon keputusan (Ernawati. Andi. Sitorus, 2. Jika dibandingkan dengan algoritma boosting seperti XGBoost dan LightGBM. Random Forest menawarkan kemudahan dalam penerapan serta tidak terlalu bergantung pada parameter yang kompleks (Akbar & Sanjaya, 2. Adapun algoritma lain seperti SVM dan Neural Networks memerlukan sumber daya komputasi yang lebih besar, penyesuaian parameter yang lebih rumit, serta jumlah data yang besar untuk memperoleh hasil yang optimal (Novianto. Hermawan, & Avianto, 2. Algoritma Random Forest Regressor menjadi solusi yang tepat untuk mengatasi tantangan prediksi ini. Algoritma ini terbukti efektif dalam menangani data nonlinear dengan banyak variabel melalui penggabungan sejumlah pohon keputusan untuk menghasilkan prediksi yang akurat (Efendi & Zyen, 2. Keunggulan Random Forest dalam mengelola data berdimensi tinggi dan kemampuannya menilai pentingnya fitur menjadikannya pilihan ideal untuk prediksi pendapatan penjualan skala besar (Enggar Novianto. Suhirman Suhirman, 2. Penelitian ini bertujuan mengembangkan sistem prediksi pendapatan penjualan Indomaret menggunakan algoritma Random Forest Regressor. Model akan dilatih dengan data historis penjualan dan dievaluasi menggunakan metrik Mean Absolute Error (MAE) dan RA Score. Analisis terhadap fiturfitur yang berpengaruh juga akan dilakukan untuk memberikan wawasan strategis bagi manajemen Indomaret dalam pengambilan keputusan bisnis. METODE Jenis Penelitian Penelitian ini tergolong dalam jenis penelitian kuantitatif dengan pendekatan eksperimental, yang bertujuan untuk membangun dan mengevaluasi model prediktif berbasis machine learning guna memperkirakan pendapatan penjualan pada jaringan ritel Indomaret. Model prediksi dikembangkan menggunakan algoritma Random Forest Regressor, yang dipilih berdasarkan pertimbangan performa dan kestabilannya dalam menangani data dengan karakteristik kompleks serta variabel yang saling berinteraksi. Pengembangan model dilakukan dengan memanfaatkan data historis penjualan sebagai sumber utama, yang telah melalui tahapan pra-pemrosesan data mencakup pembersihan, transformasi, dan validasi untuk memastikan kualitas serta kelayakan data dalam pelatihan Data yang digunakan tergolong sebagai data sekunder, yang diperoleh dari catatan transaksi ritel terdokumentasi, dengan atribut yang mencakup tanggal transaksi, nama dan kategori produk, lokasi toko, metode pembayaran, serta nominal pendapatan. Seluruh data tersebut kemudian diolah ke dalam format numerik dan kategorikal yang dapat diproses oleh algoritma machine learning, termasuk melalui teknik encoding, normalisasi, dan pembagian data menjadi data latih dan data uji. Proses ini bertujuan untuk memastikan bahwa model yang dikembangkan tidak hanya akurat, tetapi juga mampu melakukan generalisasi dengan baik terhadap data yang belum pernah dilihat sebelumnya. ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Metode Penelitian Gambar 1. Alur Metode Penelitian Pengumpulan Data Dataset diperoleh dari situs Kaggel yang berisi tentang histori transaksi penjualan Indomaret yang tersedia dalam format file CSV. Data tersebut memuat informasi seperti tanggal transaksi, kategori produk, lokasi toko, metode pembayaran, jumlah unit, harga satuan, dan total pendapatan. Data ini menjadi dasar dalam membangun model prediksi. Sumber Dataset bisa diakses melalui link berikut : ttps://w. com/datasets/firmanhermawan/data-sales-simulasi-indomare. Gambar 2. Dataset Penjualan Indomaret ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Pembersihan Data Gambar 3. Proses Pembersihan Data Langkah ini meliputi penghapusan nilai kosong dan data error, serta konversi kolom harga satuan (Unit_Pric. ke dalam tipe data numerik agar dapat diproses oleh algoritma machine learning. Ekstraksi Fitur Waktu Gambar 4. Proses menambahkan ekstraksi fitur waktu Dari kolom tanggal transaksi (Dat. , dilakukan ekstraksi fitur waktu berupa hari, bulan, dan tahun. Hal ini bertujuan agar model dapat mengenali pola penjualan berdasarkan dimensi waktu (Bengnga & Ishak, 2. Encoding Fitur Kategorikal Gambar 5. Proses encoding Fitur kategorikal seperti kategori produk, lokasi toko, dan metode pembayaran diubah menjadi bentuk numerik menggunakan teknik one-hot encoding (Kumarahadi & Sandradewi, 2. Proses ini bertujuan untuk menghindari bias dalam pemodelan terhadap nilai string. Pemisahan Data Gambar 6. Proses memisahkan data Setelah proses encoding, dataset dipisah menjadi data latih dan data uji dengan perbandingan 80:20 menggunakan fungsi train_test_split dari library scikit-learn. Data latih digunakan untuk membangun model, sedangkan data uji digunakan untuk mengukur kinerja model (Lestari. Nasution, & Rusydi, 2. Pembangunan Model Gambar 7. Proses pembangunan algoritma Random Forest Regressor ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Model dibangun menggunakan algoritma Random Forest Regressor dengan jumlah pohon . _estimator. Model ini dilatih menggunakan data latih yang telah diproses sebelumnya (Saadah & Salsabila, 2. Evaluasi Model Gambar 8. Proses evaluasi model Model dievaluasi menggunakan dua metrik: Mean Absolute Error (MAE) untuk mengukur rata-rata selisih nilai prediksi terhadap data aktual. RAO Score . oefisien determinas. untuk melihat seberapa baik model menjelaskan variasi dalam data target (Ihzaniah. Setiawan, & Wijaya, 2. HASIL DAN PEMBAHASAN Visualisasi Hasil visualisasi memperlihatkan perbandingan antara total penjualan sebenarnya dengan hasil prediksi menggunakan algoritma Random Forest pada 100 data sampel pertama. Gambar 9. Hasil Visualisasi Perbandingan Penjualan dengan Prediksi Pada Gambar 9, garis biru menggambarkan nilai aktual, sementara garis oranye bergaris putus-putus mewakili nilai prediksi yang dihasilkan oleh model. Kedua garis menunjukkan pola yang hampir serupa dan saling mengikuti, baik saat mengalami tren kenaikan maupun penurunan, termasuk pada titik-titik ekstrem dengan lonjakan nilai yang signifikan. Ini menunjukkan bahwa model memiliki kemampuan yang baik dalam mengenali pola hubungan antara variabel input dan target secara akurat (Akbar & Sanjaya, 2. Akurasi Di bawah ini disajikan hasil evaluasi akurasi dari model Random Forest Regressor: ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Gambar 10. Hasil evaluasi akurasi model Dari hasil evaluasi model prediksi yang dikembangkan dengan algoritma Random Forest, diperoleh nilai Mean Absolute Error (MAE) sebesar 9. 587,48, yang mengindikasikan bahwa rata-rata perbedaan antara nilai prediksi dan nilai aktual berada di kisaran 9. 587 Rupiah. Nilai ini relatif sangat kecil jika dibandingkan dengan skala total pendapatan yang diprediksi, yang umumnya mencapai jutaan rupiah. Selain itu, nilai RA Score sebesar 0,9998 menunjukkan bahwa model dapat menjelaskan 99,98% variasi dalam data target, yakni total pendapatan penjualan. Angka tersebut sangat mendekati nilai maksimum . , yang menunjukkan bahwa model memiliki akurasi dan keandalan yang sangat tinggi dalam melakukan prediksi. Secara umum, hasil ini menunjukkan bahwa model Random Forest yang digunakan dalam studi ini memiliki efektivitas tinggi dan layak untuk diimplementasikan sebagai sistem prediksi penjualan pada lingkungan ritel seperti Indomaret. Hasil Penelitian Pemodelan prediksi penjualan Indomaret menggunakan algoritma Random Forest memperlihatkan hasil yang sangat potensial. Evaluasi model dengan menggunakan Mean Absolute Error (MAE) dan R-squared (RA) menunjukkan tingkat akurasi serta kemampuan model dalam menjelaskan variasi data penjualan. Nilai MAE yang cukup rendah menandakan bahwa model mampu melakukan prediksi penjualan dengan kesalahan yang masih dalam batas wajar (Suci Amaliah. Nusrang, & Aswi, 2. Di sisi lain, nilai RA yang tinggi mengindikasikan bahwa model berhasil merepresentasikan sebagian besar faktor yang memengaruhi penjualan Indomaret. Visualisasi perbandingan antara penjualan aktual dan prediksi juga menunjukkan bahwa model sesuai dengan pola tren penjualan (Efendi & Zyen, 2. Hasil ini menegaskan potensi penggunaan model Random Forest sebagai alat bantu dalam pengambilan keputusan strategis di bisnis ritel, seperti pengelolaan stok dan perencanaan promosi. Namun demikian, upaya peningkatan model dengan menambah data dan mengatur parameter perlu dilakukan agar kinerja prediksi menjadi lebih optimal. KESIMPULAN Prediksi penjualan di Indomaret dengan menerapkan algoritma Random Forest telah berhasil dilakukan dan menunjukkan kinerja yang sangat memuaskan. Berdasarkan hasil evaluasi, model mampu memberikan prediksi dengan akurasi tinggi, ditunjukkan oleh nilai Mean Absolute Error (MAE) yang rendah sebesar 9. 587,48 dan nilai R-squared (RA) sebesar 0,9998 yang mencerminkan kemampuan model dalam menjelaskan hampir seluruh variasi data penjualan. Hasil visualisasi memperlihatkan keselarasan antara data aktual dan hasil prediksi, yang membuktikan bahwa model mampu menangkap pola penjualan secara konsisten. Oleh karena itu, sistem ini layak digunakan sebagai sarana pendukung keputusan dalam pengelolaan bisnis ritel, terutama dalam hal manajemen stok dan perencanaan promosi. Untuk meningkatkan efektivitasnya, pengembangan lanjutan dapat dilakukan melalui penambahan variabel baru, penyempurnaan parameter model, serta pengujian lebih lanjut menggunakan dataset yang lebih beragam. ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) DAFTAR PUSTAKA