e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. K- NEAREST NEIGHBOR REGRESSION UNTUK PREDIKSI PENJUALAN DONUT Ratna Salkiawati1. Nurfiyah2. Hendarman Lubis3. Ilham Nur El Ghozy4 Program Studi Informatika1. Program Studi Informatika 2. Program Studi Informatika 3 . Program Studi Informatika 4 Fakultas Ilmu Komputer1. Fakultas Ilmu Komputer 2. Fakultas Ilmu Komputer 34 Universitas Bhayangkara Jakarta Raya1 Universitas Bhayangkara Jakarta Raya 2 Universitas Bhayangkara Jakarta Raya 3 ratna_tind@dsn. id1,nurfiyah@dsn. lubis@dsn. nur17@mhs. Received: May 23, 2025. Revised: June 18, 2025. Accepted: June 19, 2025. Issue Period: Vol. 9 No. Pp. Abstrak: Toko Donut AuXAy merupakan sebuah toko yang memproduksi variasi roti dan kue dengan menggunakan bahan pilihan terbaik tanpa menggunakan pengawet. Permasalahan yang terjadi toko tersebut adalah kesulitan untuk memprediksi permintaan konsumen dan juga belum bisa memprediksi penjualan di masa yang akan datang. Agar mempermudah pihak pengusaha dalam merencanakan penjualan serta penjadwalan produksi. Maka dilakukan prediksi penjualan produk menggunakan teknik K-Nearest Neighbor Regression. Metode yang diterapkan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Metode yang diterapkan melewati 5 tahap yaitu. Data Selection. Preprocessing. Transformation. Data Mining. Interpretation/Evaluation. Hasil pada penelitian ini menunjukan prediksi penjualan terlaris pada produk Blackforest di bulan Juni dengan k = 12 RMSE = 0. Brownies di bulan Januari dengan k = 4 RMSE = 0. Coklat di bulan Februari dengan k = 9 RMSE = 0. Donat di bulan Juli dengan k = 14 RMSE = 0. Tart di bulan Juli dengan k = 12 RMSE = 0. Triple Disert Box di bulan November dengan k = 13 RMSE = 0. Sesuai dengan pedoman RMSE dapat disimpulkan bahwa seluruh model yang diuji memiliki tingkat kesalahan sedang dalam range 0,30 Ae 0,599. Kata kunci: K-Nearest Neighbor. Regression. Prediksi. RMSE. KDD Abstract: AuXAy Donut Shop is a shop that produces a variety of breads and cakes using the best selected ingredients without using preservatives. The problem that occurs is that the store still has difficulty predicting consumer demand and also cannot predict sales in the future. In order to facilitate the entrepreneur in planning sales and production scheduling. Then the prediction of product sales is made using the K-Nearest Neighbor Regression technique. The method applied in this research is DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Knowledge Discovery in Database (KDD). The method applied passes through 5 stages, namely. Data Selection. Preprocessing. Transformation. Data Mining. Interpretation/Evaluation. The results of this study indicate the bestselling predictions for Blackforest products in June with k = 12 RMSE = 0. Brownies in January with k = 4 RMSE = 0. Chocolate in February with k = 9 RMSE = 4827. Donuts in July with k = 14 RMSE = 0. Tart in July with k = 12 RMSE = 0. Triple Disert Box in November with k = 13 RMSE = 0. accordance with the RMSE guidelines, it can be concluded that all tested models have a moderate error rate in the range of 0. 30 Ae 0. Keywords: K-Nearest Neighbor. Regression. Prediction. RMSE. KDD PENDAHULUAN Tidak dipungkiri bahwa teknologi dan informasi dapat membawa perubahan dalam segala aspek, termasuk kepada perkembangan dunia bisnis. perkembangan teknologi yang pesat saat ini banyak menarik perhatian masyarakat luas. Demikian pula pada perkembangan komputer yang dinamis diiringi perkembangan zaman dapat menghasilkan informasi yang dibutuhkan, termasuk pada penjualan produk dimana kegiatan usahanya yang selalu membutuhkan perhitungan yang signifikan terhadap informasi untuk menjalankan sebuah penjualan yang dikelola setiap harinya. Penjualan merupakan suatu unsur penting dalam suatu perusahaan di bidang pemasaran, berharap mendapat keuntungan yang lebih supaya bisamelanjutkan usaha tersebut. perusahaan yang didirikan untuk tujuan menghasilkan produk untuk kebutuhan para konsumen. perusahaan yang baik tentu memiliki tujuan jangka panjang supaya pada masa yang akan datang dapat mengalami perubahan yang baik. Toko Donat AuXAy merupakan sebuah toko yang memproduksi variasi roti dan kue dengan menggunakan bahan pilihan terbaik dan tanpa menggunakan pengawet. Permasalahan yang terjadi adalah perusahaan masih mengalami kesulitan untuk memprediksi permintaan konsumen dan juga belum bisa memprediksi penjualan dimasa yang akan datang. Pembuatan produk yang tidak menggunakan pengawet membuat produk tidak bisa bertahan lama, sehingga ketika penjualan tidak habis maka produk harus dibuang, hal ini menyebabkan terjadinya pemborosan bahan baku. Permintaan yang tidak pasti juga mengakibatkan cara bekerja yang tidak sehingga dibutuhkan untuk memprediksi penjualan produk yang terdapat pada Toko Donat AuXAy dengan menerapkan metode Data Mining. Data mining merupakan proses menemukan pola menarik dan pengetahuan dari sejumlah besar data. Sumber data bisa berupa database, warehouse, web, repositori dan informasi lainnya. terdapat beberapa metode data mining yang dapat digunakan salah satunya adalah K-Nearest Neighbor (KNN). KNN merupakan metode klasifikasi yang menentukan kategori berdasarkan mayoritas kategori pada k-Nearest Neighbor. KNN dilakukan dengan mencari kelompok k objek dalam data training yang paling dekat . dengan objek pada data baru atau data testing. Data mining sering disebut juga Knowladge Discovery in Database, dengan kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set berukuran besar, keluaran dari data mining ini dapat dipakai untuk memperbaiki pengambilan keputusan dimasa depan . , . , . Prinsip kerja algoritma K-Nearest Neighbor (KNN) adalah mencari jarak terdekat dengan k tetangga . terdekat dalam data training dengan data yang akan diuji. Teknik mengelompokkan data baru k dengan cara menghitung jarak data baru ke beberapa data/tetangga . Algoritma K-Nearest Negihbor (KNN) merupakan instead-based learning, dimana data training disimpan sehingga klasifikasi untuk record baru yang belum diklasifikasi dapat ditemukan dengan membandingkan kemiripan yang paling banyak dalam data training . Sebelumnya terdapat penelitian yang dilakukan oleh . berupa perbandingan algoritma K-Nearest Neighbor dengan Decision Tree dalam memprediksi penjualan makanan hewan peliharaan di Petshop Dore Vet Clinic didapatkan hasil 6 data diklasifikasikan terlaris sesuai dengan prediksi yang dilakukan dengan metode K- DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Nearest Neighbor (KNN) dari 30 data yang digunakan, selanjutnya . berupa prediksi harga beras premium dengan metode algoritma K-Nearest Neighbor (KNN) didapatkan hasil dapat melakukan prediksi terhadap harga beras pada tahun 2014-2019 menggunakan metode K-Nearest Neighbor (KNN) dengan nilai RMSE 0,125 dan parameter k = 2 yang sudah dinormalisasi, selanjutnya . berupa komparasi metode data mining K-Nearest Neighbor (KNN) dengan Naive Bayes untuk klasifikasi kualitas air bersih . tudi kasus PDAM tirta kencanakabupaten jomban. didapatkan hasil rata-rata nilai akurasi metode KNN sebesar 82. 42%, selanjutnya . berupa penerapan metode K-Nearest Neighbor (KNN) dalam memprediksi masa studi mahasiswa (Studi Kasus : Mahasiswa STIKOM Dinamika Bangs. didapatkan hasil untuk dua semester yaitu nilai k yang terbaik untuk digunakan memprediksi mahasiswa adalah nilai k=10 dengan tingkat keberhasilan 69%, selanjutnya . berupa analisis performa metode K-Nearest Neighbor (KNN) untuk identifikasi jenis kaca didapatkan hasil nilai performa paling baik pada k=3, dimana tingkat akurasi mencapai 64%, presisi 63%, recall 71% dan F-Measure sebesar 67%. berupa implementasi metode K-Nearest Neighbor (KNN) untuk prediksi penjualan furniture pada CV. Octo Agung Jepara dengan hasil menunjukan metode yang diusulkan berhasil diimplementasikan untuk menyelesaikan kasus prediksi penjualan dengan tingkat error atau MSE sebesar 6% dan akurasi 94%. Berdasarkan penelitian sebelumnya maka akan dilakukan penelitian dengan menerapkan Data Mining menggunakan algoritma K-Nearest Neighbor (KNN) untuk memprediksi penjualan produk pada tahun 2018 sampai 2020, dengan metode pengujian yang digunakan adalah metode k-fold cross validation. sebuah metode untuk membagi data training, testing, serta validasi, sedangkan evaluasi menggunakan RMSE (Root Mean Square erro. untuk menguji akurasi model yang dibuat. sehingga perusahaan dapat melakukan estimasi berapa bahan baku yang dibutuhkan tanpa harus memakan waktu, tenaga, dan biaya tambahan lainnya dan juga untuk menambah pemasukan secara optimal. II. METODE DAN MATERI Tahapan penelitian ini seperti pada gambar dibawah ini: DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Gambar 1. Tahapan penelitian Penelitian ini dimulai dari: membangun dataset dari data penjualan mulai daribulan ke-1 tahun ke-1 sampai dengan bulan ke-12 tahun lalu dilakukan normalisasi data dengan cara membuat data yang sudah ada menjadi nilai yang lebih kecil hasil dari normalisasi dilakukan cross Validation, data yang digunakan untuk training adalah data penjualan tahun ke-1 sampai tahun ke-3 sedangkan data yang digunakan untuk testing adalah data penjualan tahun ke 3 dalam tahap ini model k-nearest neighbor regression dibangun sebagai Sampel pengujian model yang akan digunakan pada evaluasi menggunakan cross validation. pada tahap evaluasi ini dilakukan pengujian model menggunakan k-fold cross validation untuk setiap nilai k dari K-Nearest Neighbor dalam range 1-15 setelah didapati nilai error yang terkecil maka model yang dibentuk akan menggunakan nilai k dengan hasil error terkecil tersebut setelah didapati model dengan error terkecil maka model terbaik telah didapatkan, selanjutnya adalah menguji model tersebut dengan data testing yang telah disiapkan nilai prediksi merupakan ukuran skala dari normalisasi dengan nilai tertingginya adalah nilai penjualan yang paling laris. PEMBAHASAN DAN HASIL DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Data Penelitian Pada bab ini akan dibahas mengenai hasil penelitian dengan menggunakan dataset penjualan produk Toko Donut AuXAy dari tahun 1-3, dimana data tersebut akan digunakan training. Data training itu sendiri dikelompokan menjadi 2 bagian yaitu data input dan data target. Data input merupakan data penjualan dari bulan ke-1 sampai bulan ke-12, sedangkan data target menggunakan data bulan ke-13. Misal target penjualan bulan ke-1 tahun ke-2 maka data input yang digunakan adalah data penjualan dari bulan 1-12 tahun ke-1, dan seterusnya sampai data yang ada yaitu penjualan bulan ke-12 tahun ke-3. Data testing hanya berupa data input dimulai dari bulan ke-1 sampai bulan ke-12 tahun ke-3 yang akan menghasilkan prediksi penjualan tahun Tabel 1. Data Penjualan Produk Donut PRODUK BLACKFOREST BROWNIES COKLAT DONAT TART TRIPLE DISERT BOX JUMLAH Tahun Tahun Tahun Pada tabel 1. diatas, dapat dilihat pada data tersebut terlihat adanya peningkatan penjualan produk tertentu namun cenderung mengalami penurunan pada sebagian produk lainnya. Pembentukan Dataset Berikut ini merupakan contoh data training dan contoh data testing dari beberapa produk Toko Donut AoXAy: Tabel 2. Data Training Donut Data input DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Tabel 3. Data Testing Donut Data Input Normalisasi dataset Proses normalisasi data, dilakukan dengan cara membuat data yang sudah ada menjadi nilai yang lebih Data hasil penelitian yang sudah diolah dinormalisasi dengan menjadikan data menjadi jarak . , . , artinya nilai minimal dari data menjadi 0 dan nilai maksimal dari data menjadi 1 dan data di antara minimal dan maksimal menyesuaikan antara jarak yang digunakan. Berikut hasil implementasi normalisasi: DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Gambar 2. Hasil Normalisasi Data Training Setelah data dinormalisasi maka dilakukan pembagian data kembali. Pembentukan variabel untuk data input adalah huruf X dengan data dimulai dari index ke-0 sampai 11, sedangkan data target menggunakan huruf y dengan data yang merupakan index ke 12. Implementasi K-Fold Cross Validation Dalam tahap ini digunakan K-Fold Cross Validation untuk membagi serta melakukan validasi data. Gambar 3. Hasil Implementasi K-Fold Cross Validation DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Gambar 4. Hasil Split K-Fold Cross Validation Model K- Nearest Neighbor Regression Dalam tahap ini model k-nearest neighbor regression dibangun sebagai sampel pengujian model yang akan digunakan pada evaluasi menggunakan cross validation. Implementasi pada program sebagai berikut: Gambar 5. Implementasi K-NN dan Cross Validation Evaluasi DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Pada tahap evaluasi ini dilakukan pengujian model menggunakan k-fold cross validation untuk setiap nilai k dari k-nearest neighbor dalam range 1-15. Fungsi range . , . berfungsi menciptakan ukuran angka dari 1-14 yang dideklarasikan ke dalam variabel k_range dimana selanjutnya akan digunakan sebagai looping. Gambar 5. Nilai RMSE per k Nilai tersebut menunjukkan detail nilai pada setiap nilai k dalam range 1-15. Proses pengujian dilakukan setelah model dihasilkan dari proses training sebelumnya. Evaluasi ini dilakukan untuk mengetahui akurasi dari implementasi metode K-NN. Model Terbaik dan Prediksi Setelah didapati model dengan error terkecil maka model terbaik telah didapatkan, selanjutnya adalah menguji model tersebut dengan data testing yang telah disiapkan. Gambar 6. Hasil Prediksi Penjualan Nilai prediksi merupakan ukuran skala dari normalisasi dengan nilai tertingginya adalah nilai penjualan yang paling laris. Berikut merupakan tabel hasil prediksi bulan penjualan terlaris untuk setiap produk Toko Donut AuXAy. Tabel 4. Hasil Prediksi setiap produk DOI: 10. 52362/jisicom. Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4. 0 Internasional. e-ISSN : 2597-3673 (Onlin. , p-ISSN : 2579-5201 (Printe. Vol. 9 No. 1 (June 2. Journal of Information System. Informatics and Computing Website/URL: http://journal. id/index. php/jisicom Email: jisicom@stmikjayakarta. id , jisicom2017@gmail. Produk Prediksi Blackforest Bulan ke-6 Brownis Bulan ke-1 Coklat Bulan ke-2 Donat Bulan ke-7 Tart Bulan ke-6 Triple disert box Bulan ke-11 IV. KESIMPULAN Hasil penelitian dan pengujian model prediksi penjualan menggunakan metode K-Nearest Neighbor Regression, dapat ditarik kesimpulan bahwa nilai k yang paling optimal dari rentang 1 sampai 15 adalah nilai k = 12 menghasilkan nilai RMSE 0. 41876 untuk produk Blackforest, k = 4 menghasilkan nilai RMSE 0. 46398 untuk produk brownies, k = 9 menghasilkan nilai RMSE 0. 46827 untuk produk coklat, k = 14 menghasilkan nilai RMSE 0. 47980 untuk produk Donat, k = 12 menghasilkan nilai RMSE 0. 47381 untuk produk Tart, dan k = 13 menghasilkan nilai RMSE 0. untuk produk Triple Disert Box. Dengan demikian berdasarkan pedoman interpretasi RMSE dapat disimpulkan bahwa tingkat kesalahan seluruh model pengujian dalam penelitian prediksi penjualan produk dengan metode K-Nearest Neighbor Regression yang penulis uji memiliki kesalahan sedang dikarenakan nilai RMSE yang didapat berada dalam range 0,30 Ae 0,599. Kesalahan sedang berarti hasil prediksi sedikit mendekati nilai yang sebenarnya. Diperoleh hasil prediksi penjualan produk terlaris untuk Blackforest pada bulan ke-6. Brownies pada bulan ke-1. Coklat pada bulan ke2. Donat pada bulan ke-7. Tart pada bulan ke-6, dan Triple Disert Box pada bulan ke-11. Penelitian lebih lanjut dapat menerapkan dan melakukan optimasi terhadap metode k-Nearest Neighbor dengan menambah jumlah data yang lebih banyak sehingga dapat menghasilkan training yang bervariatif serta mendapat hasil error yang lebih kecil. REFERENSI