Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal. id/index. php/malcom Vol. 4 Iss. 1 April 2024, pp: 231-239 ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Comparison of Support Vector Machine and Nayve Bayes Algorithms for Sentiment Analysis of the Metaverse Komparasi Algoritma Support Vector Machine dan Nayve Bayes untuk Analisis Sentimen pada Metaverse Dea Nurmastin Novianti1*. Diqy Fakhrun Shiddieq2. Fikri Fahru Roji3. Wati Susilawati4 1,2,3 Program Studi Bisnis Digital. Universitas Garut. Indonesia Program Studi Manajemen. Universitas Garut. Indonesia Email: 124025120014@fekon. id, 2diqy@uniga. fikri@uniga. id, 4w. susilawati@uniga. Received Nov 07th 2023. Revised Dec 31th 2023. Accepted Jan 14th 2024 Corresponding Author: Dea Nurmastin Novianti Abstract The Metaverse has captured the world's attention due to its ability to merge the real and virtual worlds. Interest in the Metaverse has been on the rise, fueled due to the effects of the COVID-19, the development project the National Capital Integrated Coastal Development (IKN), and the growing usage of digital platforms. Discussions about the Metaverse escalated further after Facebook rebranded itself as Meta. The objective oh study is to evaluate and contrast the maximum level accuracy levels between the SVM and the Nayve Bayes in analyzing public responses to the Metaverse. This study utilizes sentiment analysis method. The use of these two algorithms adds novelty to this research. The study utilizes data collected from Twitter . and simulates sentiment analysis using SVM and Nayve Bayes algorithms. Derived from the study findings, is revealed that SVM algorithm achieves concerning prepecision 90. 32%, precision of 0. 90, and recall of 0. during the implementation the Nayve Bayes reaches concerning precision of 84. 23%, precision of 0. 87, and recall of 0. This research provides insights into Metaverse trends and compares the highest accuracy results between two algorithms. Keyword: Metaverse. Nayve Bayes. Sentiment Analysis. SVM Abstrak Metaverse telah mencuri perhatian dunia karena kemampuannya untuk menggabungkan dunia nyata dan dunia virtual. Minat terhadap metaverse semakin meningkat seiring dengan dampak pandemi COVID-19 dan proyek pembangunan Ibu Kota Nusantara (IKN), serta pertumbuhan penggunaan platform digital. Perbincangan isu metaverse semakin meroket naik setelah perusahaan Facebook merubah namanya menjadi Meta. Studi ini bertujuan untuk membandingkan akurasi tertinggi antara metode algoritma Nayve Bayes dengan SVM dalam menganalisis respons masyarakat terhadap metaverse. Studi ini menggunakan metode sentiment analisis. Penggunaan dua algoritma menjadi keterbaruan penelitian. Studi kali ini menggunakan data yang diambil dari Twitter . dan disimulasikan menggunakan sentiment analisis dari algoritma SVM dan algoritma Nayve Bayes. Berdasarkan penelitian, ditemukan bahwa akurasi algoritma SVM mencapai 90,32% presisi sebesar 0,90 dan recall sebesar 0,86, sedangkan algoritma Nayve Bayes mencapai 84,23% presisi sebesar 0,87 dan recall sebesar 084. Dengan adanya penelitian ini dapat memberikan wawasan terhadap tren metaverse, serta membandingkan hasil akurasi tertinggi antara dua algoritma. Kata Kunci: Metaverse. Nayve Bayes. Sentimen analisis. SVM PENDAHULUAN Pada era teknologi terus berkembang, konsep metaverse telah mencuri perhatian masyarakat Indonesia maupun dunia . Metaverse merupakan dunia maya yang menggabungkan unsur-unsur dari dunia nyata dengan teknologi digital. Menciptakan lingkungan bagi para pengguna dapat berinteraksi, berkolaborasi satu sama lain dan merasakan pengalaman baru . Ae. Metaverse mulai ramai di bicarakan setelah perusahaan Facebook mengganti nama induk perusahaan menjadi Meta Platform Inca atau Meta . Ae. Awalnya istilah metaverse pertamakali di perkenalkan oleh Neal Stephenson dalam sebuah novel . Metaverse semakin ramai DOI: https://doi. org/10. 57152/malcom. MALCOM-04. : 231-239 di perbincangkan setelah adanya isu pembuatan Ibu Kota Negara secara virtual . Isu metaverse semakin ramai setelah adanya dampak COVID-19 yang membuat dibatasinya interaksi sosial . Hal ini membuat metaverse menjadi trending topik yang di perbicangkan di berbagai media sosial . Media sosial memiliki peran yang signifikan dalam membentuk pandangan masyarakat mengenai tren teknologi dan bagaimana pengguna menanggapi serta merasakan fenomena . Biasanya Twitter (X) media sosial yang kerap kali dipakai untuk berbicara mengenai hal baru dan berbagi pandangan . , . Twitter (X) telah menjadi tempat di mana masyarakat dapat berdiskusi, berdebat, dan menggunakan pendapat mengenai berbagai topik termasuk metaverse . Ae. Penelitian ini mencoba untuk memahami fenomena polarisasi pandangan masyarakat Indonesia di Twitter (X) terkait metaverse. Menyoroti perbedaan sikap yang dapat mempengaruhi adopsi adanya teknologi. Analisis sentimen menjadi alat yang bermanfaat dalam menganalisis respons masyarakat terhadap isu-isu . , . Studi ini meneliti mengenai analisis sentimen terhadap isu adanya metaverse. Pengambilan data dari Twitter (X) berupa tweet . masyarakat yang dapat dijadikan sebagai data untuk studi kali ini . Data yang diambil dari Twitter (X) tersebut akan dapat diproses menggunakan text mining . , . Selantutnya data tersebut akan dilabeli ke dalam tiga kelas label dengan positif, negatif, dan netral . , . Analisis sentimen dilakukan menggunakan pendekatan komparatif antara dua algoritma yaitu Nayve Bayes dan SVM sebagai keterbaruan dalam studi ini. Keunggulan Naive Bayes terletak pada sederhananya, kecepatannya, dan tingkat akurasinya yang tinggi . Di sisi lain. Support Vector Machine (SVM) dapat mengenali hyperplane yang terpisah dengan maksimal antara dua kelas berbeda . Akurasi dari hasil mengkalsifikasikan digunakan sebagai indikator untuk menentukan model pengujian terbaik dalam konteks klasifikasi sentimen . Penggunaan dua algoritma bertujuan untuk menguji sejauh mana efektivitas antara algoritma Nayve Bayes dengan Support Vector Machine (SVM) dalam mengelompokan sentimen di Twitter (X) dan menjadi keterbaruan dalam penelitian ini. Maksud dari penelitian ini untuk menggali respons masyarakat indonesia ketika adanya tren metaverse melalui ekspresi digital di Twitter (X). Penelitian ini akan memberikan wawasan yang lebih menyeluruh mengenai bagaimana tren metaverse dipahami dan diterima di Indonesia. Menyediakan wawasan dan implikasi potensial terhadap adopsi teknologi bagi pengambil kebijakan, perusahaan, dan individu terkait adanya metaverse. Meskipun terdapat pro, kontra maupun netral terkait hadirnya tren metaverse bagi masyarakat Indonesia. Banyak penelitian terdahulu yang berkaitan dengan sentimen analisis menggunakan metode dari Support Vector Machine . , . Penelitian terdahulu dilakukan oleh Siti Sumayah menggunakan Support Vector Machine dengan hasil akurasi 81% dari 2504 data . Penelitian terdahulupun pernah dilakukan pada komparasi algoritma Support Vector Machine (SVM) dengan Naive Bayes untuk sentimen analisis. Seperti pada aplikasi BRImo yang di lakukan oleh Anggi Puji dengan hasil akurasi 97,56%, namun pada Naive Bayes dengan akurasi 96,52% dari 5000 ulasan yang di ambil . Artinya pada penelitian terdahulu, penggunan algoritma Support Vector Machine ditambah dengan Naive Bayes bertujuan untuk melakukan komparasi agar mengetahui nilai akurasi mana yang lebih baik . , . Beberapa penelitian terdahulu yaitu: Tabel 1. Research GAP Penelitian . Algoritma SVM Nayve Bayes Nayve Bayes . SVM Sekarang SVM K-Nearest Neighbor Nayve Bayes SVM & Nayve Bayes Objek Metaverse Telkomsel BMKG Kenaikan Harga BBM Komplain Mahasiswa Resesi Ekonomi Ojek Online Metaverse Akurasi 83,02% 69,675 Sumber Data Twitter Website Telkomsel Twitter 86,67% Twitter 69,75% Website Kampus Twitter Twitter Twitter Penelitian ini mengisi gap pada penelitian sebelumnya dengan melakukan komparasi dua algoritma. Algoritma yang akan dibandingkan antara algoritma Naive Bayes dengan Support Vector Machine (SVM) . Sehingga membuat keterbaruan pada penelitian terdahulu. Dengan penggunaan dua algoritma dapat dilihat perbandingan hasil akurasi dari algoritma Support Vector Machine (SVM) juga Naive Bayes yang membuat keterbaruan pada penelitian ini. Pada akhirnya studi ini akan menghasilkan pengetahuan baru mengenai pandangan masyarakat indonesia terkait isu metaverse. METODOLOGI PENELITIAN Metode yang diterapkan menggunakan algoritma Nayve Bayes dan Support Vector Machine (SVM), dengan tahapan pada gambar: Komparasi Algoritma Support Vector Machine dan. (Novianti et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Gambar 1. Alur Metode Crawling Data Pengumpulan data-data melalui Twitter (X) menggunakan Bahasa pemrograman Python. Awalnya, peneliti membuat koneksi ke API Twitter . dengan library seperti Tweepy. Dengan menentukan parameter pencarian seperti kata kunci dan rentang tanggal, skrip Python meminta data dari API Twitter (X) dan menyimpannya dalam format excel. Data yang diambil melibatkan tweet-tweet terkait dengan topik atau kata kunci yang ditetapkan . Proses ini merupakan pengambilan data primer, yang dikumpulkan untuk penelitian ini . Data Prepocessing Pra-pemrosesan pada penelitian analisis sentimen melibatkan serangkaian langkah untuk membersihkan dan mempersiapkan data teks sebelum dianalisis oleh model. Data disimpan pada Microsoft excel dan menggunakan Bahasa pemrograman Phyton. Tujuannya adalah meningkatkan kualitas data dan membantu model memahami konteks serta makna sebenarnya dari teks . Langkah-langkah pra-processing data untuk analisis sentimen melibatkan sejumlah langkah guna menyiapkan data sebelum dilakukan analisis sentimen. Langkah-langkah yang dilalui mencakup Case Folding, lalu Tokenizing. Normalization, selanjutnya Filtering, dan terakhir Stemming. Transformasi data dimulai dengan tahap Case Folding, di mana data diubah menjadi huruf kecil. Pembersihan data dilakukan melalui penyaringan, yaitu menghilangkan kata yang tidak terdapat Selama proses Tokenizing, selanjutnya data akan dipisahkan menjadi kata-kata individu. Normalization dilakukan untuk mengubah kata-kata sehari-hari dan perbaikan kesalahan ketik menggunakan bahasa Indonesia. Penghapusan Stopword dilakukan dengan menghilangkan kata yang mempunyai sedikit Selanjutnya Stemming untuk menemukan arti kata dasar. Selanjutnya data akan di cleaned atau dibersihkan dan disimpan dengan format excel. Tabel 2. Hasil Pengumpulan Data Sebelum di Bersihkan Komentar BERITA TERPOPULER LADY BOSS: Bank Penyedia Bunga Rendah untuk KPR hingga Cara Berinvestasi di Metaverse Hebohnya metaverse adalah hebohnya dunia bisnis, khususnya bisnis digital. Bagi bisnis masa depan, maka dunia digital menawarkan cuan melimpah ruah lewat metaverse ini. #Headline @lesyeuxdeniny Ini dari metaverse mana y "Budak korporat nih kalau ngga sambat emang rasanya kurang, ya MALCOM - Vol. 4 Iss. 1 January 2024, pp: 231-239 MALCOM-04. : 231-239 Komentar Kalau Sobat Maya biasanya ngapain habis lembur biar seger lagi? Kalau MinMaya biasanya hangout virtual, nih. Klasifikasi Sentimen Dengan Algoritma SVM dan Naive Bayes Klasifikasi sentimen melibatkan pemisahan teks menjadi tiga klasifikasi yaitu positif, negatif, atau Algoritma Support Vector Machine (SVM) bekerja dengan membangun pemisah linear antara kategori, sedangkan Naive Bayes menggunakan probabilitas untuk menentukan sentimen berdasarkan kemunculan katakata . SVM fokus pada pemisahan linier yang optimal, sementara Naive Bayes mengandalkan perhitungan probabilitas untuk memprediksi sentimen berdasarkan informasi statistik dari data . HASIL DAN PEMBAHASAN Data Selection Data yang diambil untuk penelitian ini menggunakan teknik scraping dan library pada Twitter (X). Pengambilan data menggunakan kata kunci metaverse. Menghasilkan 71. 233 data respon. Pengambilan data di ambil dari Januari 2022 sampai dengan Maret 2023. Setelah data terkumpul selanjutnya adalah menyesuaikan data sehingga menggunakan 62,677 data. Selanjutnya memberikan label positif, negative dan netral pada data. Klasifikasi data dilakukan dengan pembobotan pada tiap kalimat, 1 artinya positif, 0 artinya netral, dan -1 artinya negative. Prepocessing Data yang terkumpul dilakukan preprocessing. Diawali dengan tahapan cleaning yaitu mengubah data dengan mengubah formatnya menjadi kecil dan menghapus berbagai macam symbol-simbol. berikutnya tahap tokenizing, yaitu pemecahan kalimat menjadi penggalan kata. Dilanjutkan dengan filtering untuk membuang kata yang tidak diperlukan. Tahapan terakhir yaitu stemming, yaitu proses menghapuskan imbuhan pada kata. Pembersihan data pada studi ini sesuai dengan penelitian lalu dilakukan oleh Syafrizal . Tabel 3 menunjukan contoh dari hasil preprocessing. Tabel 3. Hasil Prepocessing Proses Data Collection Cleaning Data Tokenizing Filtering Stemming Pelabelan Hasil km warga metaverse ya kamu warga metaverse iya ['kamu', 'warga', 'metaverse', 'iya'] ['warga', 'metaverse', 'iya'] ['warga', 'metaverse'] 0 untuk netral Support Vector Machine Classification dan Nayve Bayes Classification Tahap selanjutnya adalah melakukan akurasi dengan algoritma Support Vector Machine (SVM) dan Nayve Bayes. Perhitungan keakuratan menggunakan bahasa pemrograman Phyton. Untuk melakukan pemodelan sentimen analisis, dataset dibuatkan data pelatihan dan pengujian memiliki perbandingan 0,1. Sehingga 90 persen data untuk tahap pelatihan 10% data untuk di uji. Data pelatihan dipakai untuk konstruksi model melalui algoritma Support Vector Machine (SVM) dan Nayve Bayes. Pada Support Vector Machine (SVM) menyertakan fungsi variabel dan yang bisa digunakan selama proses pengelompokkan. Pada algoritma Naive Bayes terletak pada kemudahan penggunaannya, kecepatan eksekusi, dan tingkat akurasi yang tinggi. Pemodelan pada algoritma Support Vector Machine (SVM) menghasilkan akurasi sebesar 90,32% sementara itu, dalam algoritma Nayve Bayes menghasilkan akurasi 84,23%. Hasil klasifikasi didapatkan 1906 ulasan negative, 54719 ulasan netral dan, 4019 ulasan positif. Hal ini sesuai dengan penelitian terdahulu untuk komparasi algoritma SVM dengan Nayve Bayes. Akurasi tertinggi pada algoritma Support Vector Machine (SVM) di bandingkan Nayve Bayes. Seperti pada penelitian serupa pada komparasi dari aplikasi BRImo yang di lakukan oleh Anggi Puji dengan akurasi 97,56% pada Support Vector Machine (SVM) , dan hasil akurasi 96,52% pada Nayve Bayes dari 5000 ulasan yang di ambil. Penelitian serupa pernah dilakukan oleh Siti Sumiyah namun menghasilkan akurasi 81% menggunakan perhitungan algoritma Support Vector Machine (SVM) dari 2504 data. Pada penelitian ini tingkat akurasinya lebih tinggi daripada pada penelitian Siti Sumiyah. Penggunaan Algoritma Naive Bayes dikenal karena kecepatan dan efisiensinya, terutama saat digunakan pada dataset besar . Sedangkan penggunaan algoritma Support Vector Machine (SVM), dinilai efektif dalam menangani dataset yang tidak seimbang, di mana jumlah sampel positif dan negatif tidak sama . Maka dari itu pada penelitian ini penggunaan dari algoritma Support Vector Machine (SVM) dinilai lebih baik karena menghasilkan akurasi lebih besar daripada dengan algoritma Nayve Bayes. Berikut hasil klasifikasi Komparasi Algoritma Support Vector Machine dan. (Novianti et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Tabel 4. Hasil Klasivikasi SVM dan Nayve Bayes Sentimen Positif Negatif Jumlah ulasan SVM Jumlah ulasan Nayve Bayes Persentase 6,24% 3,04% 87,39% Berikutnya mengenai Confussion Matrix yang digunakan untuk mengukur perhitungan akurasi pada data mining: Gambar 3. Confusion Matrix SVM Akurasi sebesar 0,9023 . ,23%), presisi sebesar 0,90 . %) dan recall sebesar 0,86 . %). Gambar 4. Confusion Matrix Nayve Bayes Hasil akurasi 0,84 atau 84%, dengan ketelitian sebesar 0,87 . %) dan pemanggilan sebesar 0,84 . %). Selanjutnya mengenai kata-kata atau corpus yang sering muncul: Gambar 5. Kata dari ulasan positif MALCOM - Vol. 4 Iss. 1 January 2024, pp: 231-239 MALCOM-04. : 231-239 Gambar 6. Kata Dari Ulasan Negative Gambar 7. Kata dari Ulasan Netral Selanjutnya WorldCloud yaitu representasi dari kumpulan kata yang intensitasnya besar pada teks . Dalam WorldCloud konteks kata kunci metaverse: Gambar 8. WorlCloud sentiment positif Dalam ulasan positif memiliki beberapa kata dengan intensitas tinggi yaitu AupartnershipAy. AuprivateAy. AupublicAy. Ini mengartikan jika isu metaverse mencerminkan focus utama pada kerjasama, sector swasta, dan sector publik dalam pengembangan metaverse. Artinya adanya metaverse dapat melibatkan berbagai sektor untuk ikut berperan aktif dan berkolaborasi satu sama lain. Komparasi Algoritma Support Vector Machine dan. (Novianti et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Gambar 9. WorlCloud sentiment negative Selanjutnya pada sentiment negatif terdapat beberapa kata yang frekuensinya tinggi yaitu: mikirAy. AurebutAy. AumarkAy. Ini mengindikasi adanya kritikan dan kehkawatiran terhadap metaverse. Seperti kekhawatiran mengenai etika penggunaan metaverse, adanya kontroversi terutama perihal keamanan data dan privasi atau dampak social lainnya. WordCloud ini menunjukan adanya sentimen negative dengan fokus pemikiran pada krikit, kontroversi dan pandangan negative karena terpengaruhi berbagai hal penerimaan metaverse. Gambar 10. WorlCloud sentiment netral Kemudian pada sentimen netral frekuensi kata yang besar terdapat pada kata AuduniaAo. AuberitaAy. AupopulerAy. Mengindikasikan adanya pandangan yang seimbang terhadap isu metaverse. Hal ini menunjukkan jika isu metaverse dianggap sebagai bagian dari dunia digital yang popular dan diikuti oleh berita yang objektif dan penilaian netral terhadap perkembangan metaverse. KESIMPULAN Data yang dikumpulkan menggunakan scrapping pada Twitter (X) menghasilkan total 71,233 data. Data yang digunakan sebanyak 62,677 setelah dilakukan proses penghapusan spam dan iklan. Data tersebut dilakukan pelabelan yang menghasilkan 1906 ulasan negative, 54719 ulasan netral dan, 4019 ulasan positif. Selanjutnya data yang sudah dilabeli akan dilakukan pemodelan dengan algoritma Support Vector Machine (SVM) dan Nayve Bayes. Hasilnya menunjukan hasil ketepatan tertinggi pada algoritma SVM menghasilkan akurasi atau ketepatan 90,32% dan 84,23% pada algoritma Nayve Bayes. Artinya pada penelitian ini penggunaan algoritma SVM lebih baik daripada penggunaan algoritma Nayve Bayes. Hal ini senada pada penelitian sebelumnya, dimana penggunaan algoritma Support Vector Machine (SVM) menghasilkan nilai akurasi tinggi daripada algoritma Nayve Bayes. Hal ini menjawab tujuan dari penelitian ini yaitu untuk mengetahui akurasi tertinggi pada dua algoritma yang digunakan. Hasilnya penggunaan pada algortima Support Vector Machine (SVM) lebih tinggi daripada Nayve Bayes. Selanjutnya menganalisis data menggunakan WordCloud untuk mengetahui apa saja yang mempengaruhi perspektif masyarakat terhadap Dengan demikian, algoritma Support Vector Machine (SVM) , menjadi pilihan yang lebih optimal dalam mengelompokkan respons masyarakat terhadap metaverse. Hal ini dapat memberikan wawasan dan pandangan yang lebih akurat bagi pengambil kebijakan, perusahaan ataupun individu terkait adanya adopsi metaverse di Indonesia. Berdasarkan penelitian ini, untuk saran pada penelitian selanjutnya dengan memperkaya penggunaan algoritma yang dapat mengkomparasikan lebih dari dua algoritma. Pengambilan data MALCOM - Vol. 4 Iss. 1 January 2024, pp: 231-239 MALCOM-04. : 231-239 yang lebih variatif seperti data dari Instagram. Facebook dan lainnya. Penggunaan data melalui media sosial memiliki kekurangan pada trend yang sering berubah. Untuk penelitian berikutnya dapat mempertimbangan pengambilan data selain dari media sosial. REFERENSI