Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Analisis Penjualan Produk Paket Kuota Internet Dengan Metode K-Nearest Neighbor Dedi Handoko1. Heru Satria Tambunan2. Jaya Tata Hardinata3 1Mahasiswa STIKOM Tunas Bangsa. Pematangsiantar. Sumatera Utara. Indonesia 2,3STIKOM Tunas Bangsa. Pematangsiantar. Sumatera Utara. Indonesia Jln. Sudirman Blok A No. 1-3 Pematangsiantar. Sumatera Utara 1alndedihandoko@gmail. com, 2heru@amiktunasbangsa. Abstract PT. Akses Lintas Nusantara is a company engaged in the sale of Internet Quota Packages and package balances. This company has various data packages ranging from 6 GB, 11 GB, 21 GB and 32 GB with various price variations. Based on data on sales of internet quota package products for the past 1 . year, predictions for future sales are needed in order to facilitate the company in planning the provision of internet quota package stock. The K-Nearest Neighbor (KNN) algorithm is a method that is a supervised algorithm where the results of the new test sample are classified based on the majority of the categories on the KNN. To find out the sales of these products, the K-Nearest Neighbor algorithm is used. The expected result is to make it easier for companies to predict the future supply of internet quota packages in each region or region. The results of the research that have been carried out are prediction of Internet Quota Package Sales consisting of SP CL1. SPCL2. SPCL4 and SP CL8 with an Accuracy of 71. Keywords: Sales. Data Mining Quota Package. Prediction, k-nearest neighbor Abstrak PT. Akses Lintas Nusantara adalah Perusahaan yang bergerak di bidang Penjualan Paket Kuota Internet dan saldo paket. Perusahaan ini memiliki berbagai paket data mulai dari 6 GB, 11 GB, 21 GB dan 32 GB dengan berbagai variasi harga. Berdasarkan data penjualan produk paket kuota internet selama 1. tahun terakhir, maka dibutuhkan prediksi untuk penjualan kedepannya guna untuk mempermudah pihak perusahaan dalam perencanaan penyediaan stok paket kuota internet. Algoritma K-Nearest Neighbor (KNN) adalah suatu metode yang merupakan algoritma supervised dimana hasil dari Sampel uji yang baru diklasifikasikan berdasarkan mayoritas dari kategori pada KNN. Untuk mengetahui penjualan produk tersebut digunakan algoritma K-Nearest Neighbor. Hasil yang diharapkan adalah mempermudah perusahaan memprediksi penyediaan stok paket kuota internet ke depannya di setiap daerah atau wilayah. Hasil dari Penelitian yang telah di lakukan Prediksi Penjualan Paket Kuota Internet terdiri dari SP CL1. SPCL2. SPCL4 dan SP CL8 dengan Accuracy sebesar 71,43 %. Kata kunci: Penjualan. Paket Kuota Data Mining. Prediksi, k-nearest neighbor PENDAHULUAN Perkembangan yang sangat pesat dalam Perkembangan bidang teknologi sekarang ini membuat banyak peluang usaha, salah satunya dibidang penjualan paket kuota internet. Paket kuota internet sangat berkaitan erat dengan telepon selular yang merupakan suatu kebutuhan pokok manusia saat ini, sehingga bisnis yang berkaitan dengan penjualan kartu perdana internet merupakan bisnis yang memiliki prospek yang sangat baik. Paket kuota internet digunakan untuk mendukung penggunaan telepon selular dalam pencarian berbagai informasi dan lain-lain melalui media online. Salah satunya di sebuah perusahaan yang bernama PT. Akses Lintas Nusantara (Dealer Authorize. Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik PT. Akses Lintas Nusantara adalah Perusahaan yang bergerak di bidang Penjualan Paket Kuota Internet dan saldo paket. Perusahaan ini memiliki berbagai produk paket kuota internet mulai dari 4,5 GB, 8 GB, 15 GB dan 21 GB dengan berbagai variasi harga. Berdasarkan data penjualan produk paket kuota internet selama 1. tahun terakhir. PT. Akses Lintas Nusantara belum mampu memprediksi penjualan paket kuota internet sehingga terjual hanya beberapa saja maka dibutuhkan prediksi untuk penjualan kedepannya guna untuk mempermudah pihak perusahaan dalam perencanaan penyediaan stok dan mengetahui penjualan produk paket kuota internet yang terlaris. Untuk mengetahui prediksi penjualan paket kuota internet maka di butuhkan sebuah metode yang dapat memprediksi penjualan paket kuota internet pada PT. Akses Lintas Nusantara maka di butuhkan Metode K-Nearest Neighbor. K-Nearest Neighbor adalah sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah Terkumpul sebelumya. Termasuk dalam supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan jarak dari kategori. Dari permasalahan di atas dalam memprediksi penjualan paket kuota internet untuk penyediaan stok barang dan mengetahui penjualan produk terlaris. Penelitian ini diharapkan dapat membantu dalam prediksi penjualan Paket Kuota Internet untuk kedepannya dan dalam penyediaan stok barang dengan menggunakan metode K-Nearest Neighbor Pada PT. Akses Lintas Nusantara Pematangsiantar lebih cepat dan muda untuk di ketahui. METODOLOGI PENELITIAN Pengumpulan Data Dalam melakukan penelitian untuk mendapatkan data dan informasi, maka metode yang digunakan dalam proses pengumpulan data sebagai berikut: Metode Observasi, melihat serta mempelajari permasalahan yang ada di lapangan yang berkaitan dengan objek yang diteliti. Metode Kajian Literatur, mencari bahan yang mendukung dalam pendefinisian masalah melalui buku-buku, makalah, internet, yang erat kaitannya dengan objek permasalahan. Data penelitian yang digunakan diperoleh langsung dari pihak PT. Akses Lintas Nusantara dari hasil observasi dan dengan memintak kebagian Adminstrasi logistik. Data penelitian yang digunakan diambil dari 3 tahun yaitu 2017 dan 2019. Data yang digunakan adalah data penjualan paket kuota internet dengan 4 jenis paket inetrnet yaitu SP WL CL1 GB / 3,5 GB / 4,5 GB. SP WL CL2 GB / 6 GB / 8 GB. SP WL CL4 GB / 11 GB /15 GB. SP WL CL8 21 GB. Berikut adalah data penelitian yang digunakan. Data penelitian yang digunakan diperoleh langsung dari pihak PT. Akses Lintas Nusantara dari hasil observasi dan dengan memintak kebagian Adminstrasi logistik. Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Tabel 1. Data Penelitian Produk Bulan Januari Februari Maret April Mei SP WL CL1 Juni GB / 3,5 GB Juli / 4,5 GB Agustus September Oktober Nopember Desember Januari Februari Maret April Mei SP WL CL2 Juni GB / 6 GB / Juli 8 GB Agustus September Oktober Nopember Desember Penjualan Tahun Produk Bulan Januari 722 16700 15. Februari Maret April Mei SP WL CL4 Juni GB / 11 GB Juli /15 GB Agustus September Oktober Nopember Desember Januari Februari Maret April Mei 859 SP WL CL8 Juni 002 21 GB Juli Agustus September Oktober Nopember Desember Penjualan Tahun Tahapan Penelitian Pada tahapan ini, peneliti mengindetifikasi penelitian yang akan dilakukan dengan melakukan studi pustaka. Hal ini bertujuan untuk mengetahui metode apa yang akan digunakan untuk menyelesaikan permasalahan yang akan diteliti, serta mendapat dasar-dasar referensi yang kuat dalam menerapkan suatu metode yang akan digunakan didalam skripsi ini. Dapat dilihat pada gambar 2 dibawah ini: START Penelitihan Terdahulu Pengumulan Data Analisa Data Input Data Prediksi TIDAK Periksa Data Prediksi Analisa Data Hasil Prediksi END Gambar 1. Flowchart Tahapan Penelitian Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Keterangan dari gambar di atas adalah sebagai berikut : Menentukan penelitihan terdahulu dan yang terkait Proses pengumpulan data yang akan di uji. Proses analisa data yang akan di uji. Melakukan input Data Yang akan di Prediksi Periksa data yang akan di prediksi jika berhasil maka akan ke proses data Dengan Metode K-Nearest Neighbor jika Tidak Maka akan kembali ke Penginputan Data Prediksi Proses data yang akan di olah dengan metode K-Nearest Neighbor. Prediksi akan berhasil jika data tersebut akan falid. Metode Penelitian . Data Mining Menurut . Data mining adalah serangkai proses untuk menggali nilai tambahan berupa informasi yang selama ini tidak di ketahui secara manual dari suatu basis data. Informasi yang di hasilkan di peroleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik data yang terdapat pada basis data. Data mining terutama di gunakan untuk mencari pengetahuan yang terdapat pada basis data yang besar sehingga sering Knowledge Discovery Database (KDD). Metode K-Neraest Neighbor K-Nearest Neighbor (KNN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas dari label class pada K-NN. Tujuan dari algoritma ini adalah mengklasifikasikan objek baru berdasarkan atribut dan training data. Algoritma K-NN bekerja berdasarkan jarak terpendek dary query instance ke training data untuk menentukan K-NN-nya . Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Teknik ini sangat sederhana dan mudah diimplementasikan. Mirip dengan teknik clustering, yaitu mengelompokkan suatu data baru berdasarkan jarak data baru itu ke beberapa data/tetangga Pertama sebelum mencari jarak data ke tetangga adalah menentukan nilai K tetangga . Lalu, untuk mendefinisikan jarak antara dua titik yaitu titik pada data training dan titik pada data testing, maka digunakan rumus Euclidean dengan persamaan 1, sebagai berikut. Oc ( . Keterangan: jarak Eclidian : data 1 : data 2 : fitur ke Ae : jumlah Fitur Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik . Rapidminer merupakan salah satu software untuk pengolahan data mining. Pekerjaan yang dilakukan oleh rapidminer text mining adalah berkisar dengan analisis teks, mengekstrak pola-pola dari dataset yang besar mengkombinasikannya dengan metode statistika,kecerdasan buatan dan database . Aplikasi yang dibutuhkan oleh penulis untuk melakukan prediksi penjualan paket kuota internet adalah menggunakan aplikasi Rapidminer versi 5. berikut tampilan Rapidminer versi 5. terdapat pada gambar 2: Gambar 2. Tampilan RapidMiner versi 5. HASIL DAN PEMBAHASAN Perhitungan Menggunakan Metode K-means Data yang digunakan adalah data penjualan paket kuota internet dengan 4 jenis paket internet. Data yang digunakan adalah data tahun 2017-2019. Adapun atribut yang digunakan dalam penelitian ini yaitu Nama Produk. Kuant, dan Bulan. Lalu dilakukan tahap preprocessing untu mengelompokkan penjualan produk berdasarkan jumlah penjualan tiap bulan dan tahunnya. Kemudian data yang digunakan diseleksi dan akan digunakan untuk diolah dalam memprediksi penjualan paket kuota internet XL. Berikut adalah data penjualan yang sudah Tabel 2. Tabel Penilaian Alternatif Bulan Tahun 2017 Tahun 2018 Tahun 2019 Januari Februari Maret April Mei Juni Juli Agustus September Oktober Nopember Desember Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Selanjutnya dilakukan taham transformation. Tahap teransformation adalah tahap membentuk data menjadi data training dan data testing. Proses pembentukan data training berdasarkan data yang ada, data harus di seleksi terlebih dahulu untuk menentukan atribut mna yang dapat mempengaruhi penjualan terlaris yang disebut data target. Adapun data traning yang digunakan sebagai berikut: Tabel 3. Data Training Penjualan Kartu Paket SP1 No BL1 BL2 BL3 BL4 BL5 TARGET Berdasarkan tabel 3, data training yang digunakan diambil dari 2 tahun sebelumnya yaitu tahun 2017 dan 2018 dan dikelompokkan menjadi 2 yaitu data input dan data target. Data input adalah data penjualan dari bulan ke-1 sampai ke5, sehingga data target menggunakan data bulan ke-6 selanjutnya untuk bulan ke-2 hingga bulan ke-6 digunakan sebagai data input dengan target bulan ke 7 dan begitu seterusnya. Hal yang sama juga dilakukan untuk data training kartu paket yang lain. Selanjutnya masuk kedalam tahap perhitungan menggunakan algoritma k-nn. Berikut adalah Langkah-langkah untuk menyelesaikan metode K-Nearest Neighbor: Menentukan nilai k. Penentuan nilai k tidak memiliki aturan. Pada penelitian ini nilai k yang digunakan adalah 2. Menghitung jarak antara data training dan data testing yang ada pada tahap transformation menggunakan perhitungan Euclidean Distance sebagai Kartu Paket SP1 d1=Oo( ) =2 d2=Oo( ) = 2,2360 Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik d3=Oo( ) =2 d4=Oo( ) = 2,4494 d5=Oo( ) = 2,8284 d6=Oo( d7=Oo( ) = 2,6457 d8=Oo( ) = 2,2360 d9=Oo( ) =2,8284 d10=Oo( ) =3,3166 d11=Oo( ) =3,7416 d12=Oo( ) =3,7416 Cara yang sama digunakan untuk mencari nilai dari kartu paket SP2. SP4, dan SP8. Kemudian mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak euclid terkecil. D3=2, d19=2, d3=2,2360, d9=2,2360, d18=2,4494, d7=2,6457, d4=2,8284, d15=2,8284, d17=3, d6=3,3166, d5=3,7416, d10=3,7416 . Menentukan kelompok data hasil uji berdasarkan label mayoritas dari k tetangga terdekat, dengan nilai k = 3 maka diambil dua jarak terkecil yaitu d1, d2, dan d3. Dengan menggunakan kategori Nearest Neighbor yang paling mayoritas maka dapat diprediksikan peningkatan jumlah penjualan pada priode Untuk penjualan kartu paket SP1 yaitu d1, d2, dan d3 (Januari. Februari. Mare. SP2 yaitu d5,d6, dan d7 (Mei. Juni. Jul. SP4 yaitu d10,d11, dan d12 (Oktober,November. Desembe. , dan SP8 yaitu d1,d2 dan d12 (Januari. Februari. Desembe. Accuracy dari perhitungan manual Precision = = = 0,80 = 80% Recall = Accuracy = = 0,70 = 70% = 0,73428 = 71,43% Berdasarkan hasil akhir yang diperoleh, maka didapat alternatif = 1, alternatif dengan nilai = 0, alternatif dengan nilai = 3, alternatif dengan nilai = 3, alternatif dengan nilai = 0. Sehingga masker wajah terbaik adalah GR dengan kode Alternatif A4. Berikut adalah hasil penggujian data menggunakan system berbasis web. Berdasarkan dari penjelasan diatas mengenai tahap-tahap penggunaan serta hasil yang telah ditampilkan maka selanjutnya membahas mengenai validasi data yang digunakan dengan tools rapidminer. Adapun hasil dari accuracy dari performance vextor sebesar 71,34% dengan proses accuracy sebagai berikut: Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Gambar 3. Model Sub Proses Clasification K-Nearest Neighbor Berikut adalah hasil accuracy dapat dilihat pada gambar 4. Gambar 4. Hasil Accuracy Keterangan : Jumlah prediksi produk SP1 dan kenyataannya benar produk SP1 adalah 2 record. Jumlah prediksi produk SP1 dan kenyataannya benar produk SP2 adalah 2 record. Jumlah prediksi produk SP2 dan kenyataannya benar produk SP2 adalah 2 record. Jumlah prediksi produk SP2 dan kenyataannya benar produk SP4 adalah 1 record. Jumlah prediksi produk SP2 dan kenyataannya benar produk SP1 adalah 1 record. Jumlah prediksi produk SP4 dan kenyataannya benar produk SP4 adalah 3 record. Jumlah prediksi produk SP8 dan kenyataannya benar produk SP8 adalah 3 record. Berdasarkan gambar diatas, pemodelan yang telah di proses menggunakan tools rapidminer selain menghasilkan dalam bentu pola pemodelan ini juga dapat mengetahui keakuratan data. Berikut perbandingan dari perhitungan manual dan Tabel 4. Perbandingan Hasil Manual dan Rapidminer No Produk Manual Rapidminer Januari Januari SP 1 Februari Maret Analisis Penjualan Produk Paket Kuota Internet Dengan Metode KNN (Dedi Handok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 111-119 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik SP2 SP4 SP 8 Accuracy Maret Mei Juni Juli Oktober November Desember Januari Februari Desember 71,43% Mei Desember Oktober November Desember Januari Februari Maret 71,43% Accuracy data yang didapat sebesar 71,43% dengan menggunakan tools Secara manual accuracy yang diperoleh sebesar 71,43%. SIMPULAN Pada penelitian ini dilakukan pemodelan menggunakan algoritma k-nearest neighbor dengan menggunakan data yang diolah berdasarkan tahapan knowladge discovery in database (KDD). Berdasarkan hasil perhitungan data mining menggunakan teknik klasifikasi dan algoritma k-nearest neighbor, didapatkan hasil prediksi penjualan kartu paket kuota internet dengan 4 jenis paket internet dan data yang digunakan pada tahun 2017 Ae 2019 yang dimana atribut terdiri dari Nama Produk. Kuant, dan Bulan kemudian berdasarkan nilai akurasi terhadap prediksi penjualan produk untuk tahun 2020 yaitu sebesar 71,43% dan telah diuji menggunakan tools Rapid Miner . DAFTAR PUSTAKA