Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2020 . ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Performa Algoritma User K-Nearest Neighbors pada Sistem Rekomendasi di Tokopedia Rama Dian Syah Fakultas Teknologi Informasi. Universitas Gunadarma. Jl. Margonda Raya 100. Depok. Jawa Barat. Indonesia, 16424 e-mail: rama_ds@staff. Submitted Date: July 24th, 2020 Revised Date: September 22nd, 2020 Reviewed Date: September 22nd, 2020 Accepted Date: September 30th, 2020 Abstract The biggest marketplace in Indonesia such as Tokopedia has data on e-commerce activities that always increase with time. Large data growth in Marketplace can cause problems for users. Buyers who have difficulty in finding the best product that suits their needs and sellers who have difficulty in promoting products that are often visited by buyers can be overcome. The recommendation system can overcome these problems by providing specific product recommendations to be promoted and offered to buyers. This research implements the Recommendation System using the Item Rating Prediction Method by applying the User K-Nearest Neighbors Algorithm. The Recommendation System provides recommendations based on ratings on products given by the buyer. Algorithm performance in Recommendation System is measured by the parameters of Root Mean Square Error (RMSE). Mean Absolute Error (MAE) and Normalized Mean Absolute Error (NMAE). The performance values obtained are RMSE = 0. MAE = 0. 488 and NMAE = 0. Perfomance values below 1 proves that the User K-Nearest Neighbors Algorithm is suitable as a rating prediction model on recommendation system. Keywords: Recommendation System. User K-Nearest Neighbors. Tokopedia Abstrak Pasar online terbesar di Indonesia seperti Tokopedia memiliki data aktifitas perdagangan secara elektronik yang selalu bertambah seiring waktu. Pertumbuhan data yang besar pada pasar online dapat menimbulkan masalah bagi pengguna. Pembeli yang mengalami kesulitan pada pencarian produk terbaik yang sesuai dengan kebutuhannya dan penjual yang kesulitan pada promosi produk yang sering dikunjungi pembeli dapat diatasi. Sistem rekomendasi dapat mengatasi masalah tersebut dengan memberikan rekomendasi produk tertentu untuk dipromosikan dan ditawarkan kepada pembeli. Penelitian ini mengimplementasikan Sistem Rekomendasi menggunakan Metode Item Rating Prediction dengan menerapkan Algoritma User K-Nearest Neighbors. Sistem Rekomendasi memberikan rekomendasi berdasarkan penilaian pada produk yang diberikan oleh pembeli. Performa algoritma pada Sistem Rekomendasi diukur dengan parameter Root Mean Square Error (RMSE). Mean Absolute Error (MAE) dan Normalized Mean Absolute Error (NMAE). Nilai performa yang didapat yaitu RMSE = 0. MAE = 0. 488 dan NMAE = 0. Nilai performa dibawah 1 membuktikan bahwa algoritma User K-Nearest Neighbors cocok sebagai model prediksi rating pada sistem rekomendasi. Kata Kunci: Sistem Rekomendasi. User K-Nearest Neighbors. Tokopedia Pendahuluan Data merupakan elemen penting dalam perkembangan teknologi saat ini. Data dapat menghasilkan informasi yang dibutuhkan untuk perkembangan suatu sistem agar sesuai dengan kebutuhan pengguna. Pertambahan data yang http://openjournal. id/index. php/informatika sangat besar terjadi pada sistem online Marketplace. Kemudahan transaksi yang ditawarkan oleh Marketplace sangat membantu pengguna dalam melakukan aktifitas jual beli secara online. Marketplace terbesar di Indonesia seperti Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2020 . Tokopedia memiliki jumlah pengguna yang sangat banyak sehingga menimbulkan pertambahan data yang sangat cepat. Masalah yang dapat ditimbulkan seperti pembeli yang mengalami kesulitan pada pencarian produk yang sesuai dengan kebutuhannya atau penjual yang ingin mempromosikan produknya yang sering dikunjungi pembeli dapat diatasi. Sistem rekomendasi dapat mengatasi masalah pertumbuhan data dengan memberikan rekomendasi kepada pengguna Marketplace. Sistem rekomendasi merupakan sistem yang digunakan untuk mempelajari informasi dari data masa lalu dan memberikan saran (Choudhary & Tulasi, 2. Sistem Rekomendasi merupakan salah satu implementasi dari Machine Learning. Sistem Rekomendasi memiliki beberapa metode dan algoritma yang dapat diterapkan. Pengujian performa dari penerapan algoritma pada Sistem Rekomendasi dapat mengukur keberhasilan algoritma dalam memberikan rekomendasi kepada Beberapa penelitian telah dilakukan terhadap Sistem Rekomendasi pada E-Commerce. Kai Wang melakukan penelitian dengan mengusulkan Sistem Rekomendasi pada ECommerce menggunakan algoritma RNN (K. ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Wang et al. , 2. Hasil penelitiannya yaitu peforma dari algoritma diukur berdasarkan parameter Mean Absolute Error (MAE). Penelitian yang lainnya dilakukan oleh Arie Satia Dharma tentang Sistem Rekomendasi menggunakan algoritma KNN berdasarkan personalisasi pengguna (Dharma & Samosir. Hasil penelitiannya adalah performa dari algoritma KNN yang diukur berdasarkan parameter Root Mean Square Error (RMSE). Pada penelitian ini dilakukan pengujian performa Algoritma User K-Nearest Neighbors yang diterapkan pada Sistem Rekomendasi di Tokopedia. Data yang digunakan berjumlah 40608 pengguna Tokopedia yang memberikan rating pada Pengujian performa Algoritma diukur berdasarkan parameter Root Mean Square Error (RMSE). Mean Absolute Error (MAE) dan Normalized Mean Absolute Error (NMAE). Metode Penelitian Penelitian ini dilakukan dengan 5 tahapan penelitian yaitu: . Pengumpulan Data. Preprocessing Data. Perancangan Algoritma. Pelatihan. Pengujian. Diagram alur tahapan penelitian terlihat pada Gambar 1. Gambar 1. Tahapan Penelitian 1 Pengumpulan Data Pengumpulan data dilakukan dengan berbagai teknik untuk bahan penelitian (Roh et al. Data yang digunakan pada penelitian ini berasal dari Tokopedia Product Reviews. Data http://openjournal. id/index. php/informatika diambil dari website Kaggle. Data yang digunakan berjumlah 40608 reviews pengguna Tokopedia. Data berukuran 9. 98 MB. Sumber data yang digunakan terlihat pada Gambar 2. Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2020 . ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Gambar 2. Sumber Data 2 Preprocessing Data Preprocessing Data dilakukan untuk transformasi data mentah menjadi data yang berkualitas serta menghilangkan duplikasi data (Syah, 2. Preprocessing Data dilakukan dengan seleksi atribut dari beberapa atribut yang ada pada dataset. Atribut yang digunakan akan diberikan target role sebagai tugas dari atribut Berikut atribut yang akan digunakan terdapat pada Gambar 2 . Gambar 2. Atribut yang digunakan Keterangan Gambar 2: A Target Role Label merupakan atribut yang khusus digunakan untuk target pembelajaran operator. Atribut yang menjadi target pembelajaran yaitu atribut rating. A Target Role Item Identification digunakan untuk mengidentifikasi produk pada Tokopedia. A Target Role User Identification digunakan untuk mengidentifikasi pengguna yang memberikan penilaian pada produk di Tokopedia. 3 Perancangan Algoritma Algoritma yang digunakan dalam penelitian ini adalah User K-Nearest Neighbors. Algoritma ini termasuk salah satu dari metode http://openjournal. id/index. php/informatika Collaborative Rating Prediction. Algoritma ini membagi data menjadi 2 bagian yaitu data latih dan data uji. Data latih digunakan oleh algoritma sebagai dasar prediksi. Data uji digunakan oleh algoritma sebagai penilaian hasil prediksi (Prasetya, 2. Tahapan Algoritma KNN yaitu: Penetapan k . umlah tetangga Perhitungan jarak data latih dengan data uji. Pengurutan jarak tersebut berdasarkan nilai yang terkecil sejumlah k. Penetapan berdasarkan label mayoritas k. Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2020 . 4 Pelatihan Pelatihan pada dataset dilakukan untuk melatih algoritma (Shafique & Hato, 2. Pelatihan dataset Tokopedia Product Reviews yang sudah diolah pada saat preprocessing data dengan algoritma User K-Nearest Neighbors yang sudah dirancang. Dataset yang digunakan dibagi menjadi dua data dengan persentase 80% sebagai training dataset dan 20% sebagai testing 5 Pengujian Pengujian dilakukan untuk mengetahui performa algoritma terhadap dataset yang telah diproses (Belavagi & Muniyal, 2. Algoritma yang akan dilakukan pengujian dan evaluasi yaitu algoritma User K-Nearest Neighbors. Nilai performa yang didapat akan membuktikan keakurasian model yang telah dirancang. Terdapat 3 Parameter uji yang digunakan dalam pengujian yaitu (Wang & Lu, 2. Root Mean Square Error (RMSE) OcycA ycu=1. cCycu Oe ycycu ) ycIycAycIya = Oo ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Mean Absolute Error (MAE) OcycA ycu=1 . cCycu Oe ycycu | ycAyaya = ycA Normalized MAE (NMAE). OcycA ycu=1 . cCycu Oe ycycu | ycAycAyaya = OcycA ycu=1 ycycu Keterangan dari rumus parameter uji: A rCn = rating prediksi A rn = rating pengguna pada dataset A N = jumlah pasangan prediksi rating antara pengguna pada dataset dan hasil prediksi 3 Hasil dan Pembahasan Dataset yang digunakan pada model sistem rekomendasi di Tokopedia berjumlah 40607 data pengguna dengan 3 atribut. Tool RapidMiner versi 9 digunakan untuk mengelola data menggunakan model yang dirancang. 1 Model Algoritma User K-Nearest Neighbors Model yang dirancangan menggunakan beberapa operator yaitu Set Role. Split Data. User k-NN. Apply Model dan Performance. Model yang dirancang terdapat pada Gambar 3. Gambar 3. Model Algoritma User K-Nearest Neighbors Pada Gambar 3 tahapan yang dilakukan Dataset yang diinput merupakan dataset tokopedia yang ditampung pada Retrieve Data. Atribut dari dataset akan diberikan tugas atribut menggunakan operator Set Role. Partisi dataset dengan rasio 0. 8 dan 0. menggunakan operator Split Data. Pelatihan operator User k-NN. Penerapan operator Apply Model http://openjournal. id/index. php/informatika Pengujian Model operator Performance. 2 Performa Algoritma User K-Nearest Neighbors Nilai performa dari model yang dirancang dengan Algoritma User K-Nearest Neighbors diukur dengan parameter Root Mean Square Error (RMSE). Mean Absolute Error (MAE) dan Normalized Mean Absolute Error (NMAE). Performa dari model yang sudah dirancang terpada pada Tabel 1. Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2020 . ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Tabel 1. Nilai Performa Model dengan Algoritma User k-NN Performa Vector RMSE MAE NMAE Parameter MAE dan RMSE merupakan parameter yang digunakan untuk menghitung perbedaan antara nilai prediksi rating dengan nilai rating pengguna sesungguhnya (Wang & Lu, 2. Paramater NMAE merupakan normalisasi dari nilai MAE. Nilai MAE. RMSE dan nilai NMAE semakin kecil maka hasil prediksi rating dari sistem rekomendasi semakin akurat (Muliadi & Lestari, 2. Kesimpulan Pada penelitian ini disajikan Sistem Rekomendasi dengan Algoritma User K-Nearest Neighbors untuk prediksi peringkat penilaian produk oleh pengguna di Tokopedia. Performa dari model yang dirancang didapatkan nilai RMSE = 0. MAE = 0. 488 dan NMAE = Nilai performa yang didapatkan sangat kecil yaitu dibawah 1 yang membuktikan bahwa Algoritma User K-Nearest Neighbors cocok sebagai model untuk prediksi rating pada Sistem Rekomendasi. Daftar Pustaka