Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 SISTEM PEREKOMENDASI DENGAN SINGULAR VALUE DECOMPOSITION DAN TEKNIK SIMILARITAS PEARSON CORRELATION Rimbun Siringoringo1. Jamaluddin2. Gortap Lumbantoruan3 1,2,3 Manajemen Informatika. Universitas Methodist Indonesia ringo@gmail. com, 2jac. satuno@gmail. com, 3 lumbatoruan. gortap@gmail. ABSTRACT The growth of e-commerce has resulted in massive product information and huge volumes of data. This results in data overload problems. In the case of e-commerce, consumers or users spend a lot of time choosing the goods they need. The urgent question to be answered at this time is how to provide solutions related to intelligent information restrictions so that the existing information is truly information that is by preferences and needs. This research performs information filtering by applying the singular value decomposition method and the Pearson similarity technique to the book recommendation system. The data used is the Book-Crossing Dataset which is the reference dataset for many research recommendation systems. The resulting recommendations are then compared with ecommerce recommendations such as amazom. Based on the results of the study obtained data that the results of the recommendations in this study are very good and accurate. Keywords: Singular Value Decomposition. Teknik Similaritas. Pearson Correlation PENDAHULUAN Data lembaga riset pasar e-marketer, jumlah pengguna internet di Indonesia diproyeksikan mencapai 175 juta orang pada tahun 2019, atau sekitar 65,3% dari total penduduk 268 juta jiwa. Data dari Dimensional Research, pertumbuhan e-commerce ritel di Indonesia akan tumbuh 133,5% menjadi US$ 16,5 miliar atau sekitar Rp 219 triliun pada 2022 (Mansur et al. , 2. Masalah utama yang diakibatkan oleh pertumbuhan e-commerce adalah terjadinya lonjakan arus informasi yang masif serta volume data yang sangat besar (Al-Ghuribi & Mohd Noah, 2. sehingga kita diperhadapkan pada masalah overload data (Nilashi et al. , 2. Kondisi ini meningkatkan kompleksitas pengambilan keputusan, dimana keputusan yang diambil tidak akurat dan tidak efektif (Ocyn Palma et al. , 2. Pada kasus e-commerce, konsumen atau pengguna menghabiskan waktu yang tidak sedikit dalam memilih barang kebutuhannya. Pertanyaan yang urgen untuk dijawab saat ini adalah bagaimana memberi solusi terkait pembatasan informasi secara cerdas . supaya informasi yang ada benar-benar merupakan informasi yang sesuai dengan preferensi dan kebutuhan. Sistem perekomendasi atau recommender system merupakan solusi populer melakukan filterisasi informasi (Zhu et al. , 2. , (Liu et , 2. Ada dua kategori sistem rekomendasi, sistem klasik dan multi-kriteria. Sistem klasik seperti content based, collaboratif filtering, knowledge based dan hybrid (Chen et al. , 2. memiliki kelemahan utama yaitu keterbatasan rekomendasi hanya berdasarkan satu kriteria saja atau overall rating. Kelemahan kedua adalah sistem klasik memberi rekomendasi tergantung pada frekuensi interaksi pengguna. Hal ini menjadi buruk untuk produkproduk baru atau cold-start yang belum banyak dilirik (Batmaz et al. , 2. Sistem reokmendasi klasik memiliki keterbatasan dalam hal skalabilitas. Ketika bekerja pada data yang sangat besar seperti data MovieLens dan BookCrossing Dataset (Anwar et al. , 2. Sistem rekomenasi tradisional kurang menunjukkan akurasi yang baik. Salah satu solusi untuk mengatasi skalabilitas tersebut adalah faktorisasi matrik (Yuan et al. , 2. Faktorisasi matrik atau matrix factorization adalah penguraian suatu matriks menjadi beberapa buah matrik yang berukuran lebih kecil. Tujuan faktorisasi ini adalah untuk meningkatkan interpretasi data. Pada penelitian ini, faktorisasi matrik dengan metode Singular Value Decomposition atau yang lebih dikenal sebagai SVD diterapkan pada sistem II. ULASAN LITERATUR 1 Faktorisasi Matrik Proses faktorisasi matrik akan memfaktorkan sebuah matriks menjadi lebih dari satu matriks yang lebih kecil (Wang et al. , 2. Singular Value Decomposition atau yang lebih dikenal sebagai SVD, adalah salah satu teknik dekomposisi berkaitan dengan nilai singular . ingular valu. suatu matriks. Sebuah matrik A m x n . Sebuah Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 matrik A = U VT adalah sebuah Singular Value Decomposition untuk A dengan U merupakan matriks orthogonal m x m. V matriks orthogonal n x n dan matriks diagonal m x n bernilai riil tak negatif yang disebut nilai-nilai singular. Dengan kata lain = diag (E1. E2. A . terurut sehingga E1 Ou E2 Ou A Ou En. Jika U = . 1, u2. A, u. dan V = . 1, v2. A , v. Data Buku. Data Rating. Data User ya = Ocycuycn=1 yuaycn ycycn ycycnycN Eksplorasi dan Pemrosesan Awal (Missing valu. Teorema tersebut juga menyatakan bahwa matriks Amxn dapat dinyatakan sebagai dekomposisi matriks yaitu matriks U. Oc dan V . Matriks Oc merupakan matriks diagonal dengan elemen diagonalnya berupa nilai-nilai singular matriks A, sedangkan matriks U dan V merupakan matriks-matriks yang kolom-kolomnya berupa vektor singular kiri dan vektor singular kanan dari matriks A untuk nilai singular yang bersesuaian. Matrik M . ser-item matri. Matrik U . ser feature matri. Matrik Sigma (Weight diagon. Matrik VT (Item feature matri. 2 SVD pada sistem rekomendasi Penerapan faktorisasi matrik dapat diterapkan pada sistem Matrik M atau yang sering dikenal dengan user-item matrix (M) dapat di dekomposisi menjadi tiga buah matrik lain, yaitu matrik User-feature (U), matrik sigma (O. , dan matrik item-feature matrix (VT)(Falk. Similaritas Pearson (Pearson correlation coefficien. Rekomendasi Evaluasi . Gambar 1. Alur Penelitian 1 Data Gambar 1. Faktorisasi Matrik pada Sistem Rekomendasi i. METODOLOGI 1 Alur penelitian Alur penelitian ditampilkan pada gambar 1 berikut ini. Data yang digunakan pada penelitian ini adalah BookCrossing Dataset http://w2. uni-freiburg. de/cziegler/BX/. Terdapat tiga jenis data yang digunakan untuk membangun sistem perekomendasi yaitu buku, data rating, dan data user. Data rating adalah tabel yang berisi userID. ISBN, dan jumah rating buku. Data user berisi userID, lokas, dan usia pembeli. Data buku terdiri ISBN, bookTitle, bookAuthor, yearOfPublication, publisher, imageUrlS, imageUrlM, dan imageUrlL lihat Tabel 1 dan Tabel 2 Tabel 1. Data Rating ISBN Book wRating Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 Tabel 2. Data User Location nyc, new york, usa stockton, california, usa moscow, yukon territory, russia porto, v. gaia, portugal farnborough, hants, united kingdom Age nilai variance. Dengan Untuk k =12, masih diperoleh nilai variance yang kecil sebesar 0. IV. HASIL DAN PEMBAHASAN 1 Pemrosesan awal Pemrosesa awal bertujun untuk mempersiapkan dataset su paya dapat diproses dengan mudah serta membuang infor masi yang tidak dibutuhkan. Untuk mendapatkan data yan g representatif, maka perlu dilakukan penggabungan tabel rating dan dan tabel user dengan userID sebagai field kun Sebahagian hasil penggabungan ditampilkan pada Tab el 3 berikut. Tabel 3. Penggabungan tabel rating dan user ISBN Book bookTitle Rating Flesh Tones: A Novel Flesh Tones: A Novel Flesh Tones: A Novel Flesh Tones: A Novel Gambar 1. Plot Jumlah Komponen vs Variance Langkah 2. Pembentukan matrik utility (M) Matriks utility disebut juga matriks user-item, yaitu matri k dua dimensi dengan vipot baris userID dan kolom adal ah bookTitle. Tabel berisi nilai rating setiap item buku. atrik ini memiliki dimensi . 17, 2. Pada matrik in i, setiap nilai yang kosong atau missing value diganti den gan null Flesh Tones: A Novel Langkah 3. Matriks singular values Selanjutnya dilakukan filter data buku yang mengandung missing value serta pengelompokan berdasarkan judul bu Pada tabel 4, user Au2313Ay memberi rating Au5Ay pada bu ku Au034545104XAy. Total rating buku AuFlesh Tones: A No velAy adalah sebesar 60 seperti pada tabel 4. Untuk jumlah komponen =12, matrik singular values merupakan matriks dengan dimensi . olom, bari. = . , . seperti pada Tabel 5. Tabel 5. Matrik Singular Values Tabel 4. Penggabungan Tabel Rating dan User ISBN Book Rating bookTitle Flesh Tones: A Novel Flesh Tones: A Novel Flesh Tones: A Novel Flesh Tones: A Novel Flesh Tones: A Novel Total Rating Count Index Singular values 2 Single Value Decomposition (SVD) Langkah 3. Pembentukan Matrik U Langkah 1. Setting paremeter. Matrik U atau dikenal dengan User-feature matrix (U) adalah hasil faktorisasi matrik M dengan jumlah baris 2441 dan fitur adalah 12 seperti pada Tabel 6. Parameter SVD yang dibutuhkan adalah jumlah komponen . Penentuan jumlah komponen berpengaruh terhadap nilai variance yang dihasilkan. Pada gambar 2 ditampilkan grafik plot antara jumlah komponen dengan Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 Tabel 6. Tabel User-feature matrix (U) A A A A A A A Langah 4. Pembentukan matrik sigma (O. A A A A A A diagonal berisi angka-angka tak negatif sebagaimana ditampilkan pada Tabel 7 Matrik sigma adalah matrik diagonal dimana nilai Tabel 7. Matrik sigma Langah 4. Pembentukan matrik VT Matrik VT adalah item-feature matrix dengan jumlah baris k=12 dan fitur item sebesar 40017. Tabel 8. Matrik VT Langkah 5. Pengukuran similaritas Hasil matrik akhir adalah matrik similaritas antar itemitem buku. Similaritas ditentukan berdasarkan PearsonAos A A A A A A A A A A R correlation coefficient. Pada tabel 9 ditampilkan smililaritas antar item-item, dimana nilai similariats antar item yang sama adalah bernilai Au1Ay Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 Tabel 9 Simililaritas Antar Item Langkah 6. Penentuan rekomendasi Berdasarkan matrik similaritas diatas, maka rekomendasi untuk buku dengan judul AuThe Green Mile: Coffey's Hands (Green Mile Serie. Ay dengan batas korelasi . orr A A A A A A A A A A <1. && . orr>0. ditampilkan pada daftar berikut. Judul buku yang ditebalkan adalah buku dengan judul yang tepat dan sangat sesuai dengan judul AuThe Green Mile: Coffey's Hands (Green Mile Serie. Ay. Tabel 10. Hasil Rekomendasi Buku Judul Needful Things The Bachman Books: Rage, the Long Walk. Roadwork, the Running Man The Green Mile: Coffey on the Mile (Green Mile Serie. The Green Mile: Night Journey (Green Mile Serie. The Green Mile: The Bad Death of Eduard Delacroix (Green Mile Serie. The Green Mile: The Mouse on the Mile (Green Mile Serie. The Shining. The Two Dead Girls (Green Mile Serie. ] Hasil rekomendasi pada tabel di atas dapat dibadingkan dengan sistem rekomendasi yang diperoleh pada situs ecommerce amazon. Dengan memasukkan kata kunci pencarian buku AuThe Green Mile: Coffey's Hands (Green Mile Serie. Ay maka hasil yang diperoleh sangat mirip atau akurat seperti pada gambar 3 berikut. Gambar 3. Hasil rekomendasi pada amazon. Jurnal METHODIKA. Vol. 7 No. 1 MARET 2021 P-ISSN : 2442-7861 E-ISSN :2614-3143 KESIMPULAN Sistem perekomendasi dengan metode singular value decomposition atau SVD dapat mengatasi masalah sparse matrix yang sering menjadi kendala pada Sistem perekomendasi konvesional. Penelitian ini menerapkan Sistem perekomendasi dengan SVD dan teknik similaritas Pearson. Hasil penelitian menunjukkan bahwa penerapan teknik Pearson pada SVD dapat memberikan hasil rekomendasi yang baik. Hasil penelitian ini masih perlu diperbaiki dengan memperluas penerapan pada dataset yang lain supaya hasil yang diperoleh lebih teruji. Group Sparsity Regularized Nonnegative Matrix Factorization for Hyperspectral Unmixing. Ie Transactions on Geoscience and Remote Sensing, 55. , 6287Ae6304. https://doi. org/10. 1109/TGRS. Yuan. Han. Qian. Xu. , & Yan. Singular value decomposition based recommendation using imputed data. Knowledge-Based Systems, 163, 485Ae494. https://doi. org/https://doi. org/10. 1016/j. Zhu. Tian. Chen. , & Cai. Symmetrical and overloaded effect of diffusion in information filtering. Physica A: Statistical Mechanics and Its Applications, 483, 9Ae15. https://doi. org/https://doi. org/10. 1016/j. DAFTAR PUSTAKA