Jurnal Infortech Volume 7 No. 2 Desember 2025 E-ISSN: 2715-8160 Penerapan Nayve Bayes Berbasis SMOTE Dan Decision Tree Untuk Analisis Sentimen Timnas Indonesia Ghudzamir 'Ammar Ibrahim Pasaribu 1. Ghofar Taufik2. Giatika Chrisnawati3. Indarti4. Dewi Laraswati5. Dinda Ayu Muthia6 1,2,3,4,5,6 Universitas Bina Sarana Informatika e-mail: ghudzamirammar. as@gmail. com, 2ghofar. gft@bsi. id, 3giatika. gcw@bsi. id, 4indarti. ini@bsi. dwl@bsi. id, 6dinda. dam@bsi. Diterima 14-10-2025 Direvisi 17-11-2025 Disetujui 22-12-2025 Abstrak - Penelitian ini bertujuan menganalisis persepsi publik terhadap kinerja Tim Nasional Indonesia pada masa kepelatihan Patrick Kluivert melalui analisis sentimen komentar penggemar di Instagram. Media sosial dipilih karena menjadi wadah utama bagi penggemar untuk menyampaikan opini dan dukungan secara langsung. Sebanyak 300 komentar dikumpulkan dari akun resmi Timnas Indonesia menggunakan teknik data scraping. Data tersebut kemudian melalui proses pembersihan dan pelabelan sebelum dianalisis. Untuk menyeimbangkan distribusi data, digunakan metode Synthetic Minority Over-sampling Technique (SMOTE). Klasifikasi sentimen dilakukan dengan membandingkan dua algoritma machine learning, yaitu Nayve Bayes dan Decision Tree, guna menilai kinerja masing-masing dalam mengenali sentimen positif maupun negatif. Hasil penelitian menunjukkan bahwa model Decision Tree memiliki performa lebih baik, khususnya dengan nilai recall tinggi pada kelas positif, yang menunjukkan kemampuannya dalam mendeteksi sentimen positif secara akurat. Meskipun demikian, model ini masih lemah dalam mengidentifikasi sentimen negatif. Secara keseluruhan, temuan ini menggambarkan antusiasme dan kecintaan besar penggemar terhadap Timnas Indonesia, terlepas dari hasil pertandingan yang Kata Kunci: Analisis Sentimen. Naive Bayes. Decision Tree. SMOTE Abstract - This study aims to analyze public perception of the Indonesian National Team's performance during Patrick Kluivert's coaching tenure through sentiment analysis of fan comments on Instagram. Social media was chosen because it is the primary platform for fans to express opinions and support directly. A total of 300 comments were collected from the official Indonesian National Team account using data scraping techniques. The data was then cleaned and labeled before analysis. To balance the data distribution, the Synthetic Minority Oversampling Technique (SMOTE) was used. Sentiment classification was performed by comparing two machine learning algorithms. Nayve Bayes and Decision Tree, to assess their respective performance in recognizing positive and negative sentiment. The results showed that the Decision Tree model performed better, particularly with a high recall value in the positive class, indicating its ability to accurately detect positive sentiment. However, this model was still weak in identifying negative sentiment. Overall, these findings illustrate the great enthusiasm and love fans have for the Indonesian National Team, regardless of match results. Keywords: Sentiment Analysis. Naive Bayes. Decision Tree. SMOTE PENDAHULUAN Media sosial telah berkembang menjadi salah satu medium komunikasi paling berpengaruh di era digital, menyediakan ruang bagi miliaran pengguna mengekspresikan opini terhadap berbagai isu, termasuk dunia olahraga. Keberadaannya melahirkan aliran data teks dalam jumlah besar yang mencerminkan opini dan emosi publik secara realtime. Instagram, sebagai salah satu platform dengan pengguna aktif terbanyak di Indonesia, menjadi ruang interaksi penting antara penggemar sepak bola dan Tim Nasional (Timna. Indonesia. Melalui kolom http://ejournal. id/ejurnal/index. php/infortech komentar, para penggemar menyalurkan dukungan, kritik, maupun kekecewaan mereka terhadap performa tim. Aktivitas ini menciptakan data berharga yang dapat dianalisis untuk memahami pola pikir dan sentimen masyarakat terhadap tim kesayangan mereka. Analisis sentimen terhadap komentar penggemar menjadi langkah strategis untuk memahami dinamika opini publik. Dalam konteks sepak bola Indonesia. Timnas memiliki posisi yang istimewa dan sering menjadi simbol kebanggaan Oleh karena itu, setiap kemenangan, kekalahan, atau pergantian pelatih selalu memicu gelombang emosi yang intens di media sosial. Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Komentar yang muncul pun beragam dari apresiasi hingga kritik tajam yang menunjukkan perlunya pendekatan analitik untuk menata dan menafsirkan data tersebut secara sistematis. Analisis semacam ini tidak hanya memberikan gambaran objektif tentang opini publik, tetapi juga dapat menjadi masukan berharga bagi pihak manajemen tim dalam merancang strategi komunikasi dan menjaga hubungan baik dengan pendukung. Kajian sebelumnya menunjukkan bahwa penerapan algoritma Machine Learning telah memberikan hasil yang signifikan dalam analisis sentiment (Hasibuan & Allistair, 2. Penelitian sebelumnya menunjukkan efektivitas algoritma Nayve Bayes dalam mengklasifikasikan sentimen dengan akurasi tinggi (Maulana. Fahmi. Imran, & Hidayati, 2. Ini adalah algoritma pembelajaran tanpa usaha yang memanfaatkan aturan Bayes bersama dengan premis atau asumsi tinggi yang karakteristiknya bergantung pada kemandirian yang disediakan oleh kelas (Anand et al. , 2. Namun, tergantung pada karakteristik data dan konteks media sosial yang digunakan. Karena itu, penelitian ini berupaya memperluas kajian tersebut dengan menerapkan analisis serupa pada platform Instagram, yang memiliki pola interaksi dan gaya bahasa berbeda dari Twitter. Salah satu tantangan utama dalam analisis . mbalanced datase. , di mana jumlah komentar positif dan negatif tidak seimbang. Bias ini sering terjadi, misalnya ketika kemenangan menghasilkan lebih banyak sentimen positif. Kondisi ini berpotensi membuat model pembelajaran mesin cenderung mengabaikan kelas minoritas . entimen negati. Untuk mengatasi hal tersebut, penelitian ini menggunakan metode SMOTE (Synthetic Minority Over-sampling Techniqu. , yaitu teknik yang secara sintetis menambah jumlah data minoritas agar distribusi kelas menjadi seimbang (Cahyaningtyas. Nataliani, & Widiasari, 2. Teknik ini bekerja dengan meningkatkan jumlah contoh data pada kelas minoritas melalui pembangkitan titik data sintetis dari tetangga terdekatnya menggunakan jarak Euclidean (Karamti et al. , 2. Dengan demikian, model dapat belajar lebih efektif dari kedua jenis sentimen. Penelitian ini juga membandingkan dua algoritma klasifikasi teks yang populer, yaitu Nayve Bayes dan Decision Tree. Nayve Bayes dikenal karena kesederhanaannya dan kemampuannya menangani data teks berdimensi tinggi, dengan prinsip dasar pada teorema Bayes yang mengasumsikan independensi antar fitur (Wahyuni, 2. Walaupun asumsi tersebut jarang sepenuhnya terpenuhi, model ini tetap menunjukkan performa baik pada berbagai studi sebelumnya. Sementara itu. Decision Tree bekerja dengan membangun struktur hierarkis berbasis keputusan, membagi data menurut fitur paling informatif, dan menghasilkan model yang mudah diinterpretasi (Fatkhudin. Artanto. Safli, & Wibowo, 2. Keunggulan Decision Tree terletak http://ejournal. id/ejurnal/index. php/infortech pada transparansinya, meskipun memiliki risiko overfitting jika tidak dikontrol dengan baik (Khasanah. Salim. Afni. Komarudin, & Maulana. Dengan membandingkan kedua algoritma tersebut, penelitian ini berupaya tidak hanya menentukan model dengan tingkat akurasi terbaik, tetapi juga memahami pola dan karakteristik data sentimen penggemar Timnas Indonesia di Instagram. Fokus penelitian pada era kepelatihan Patrick Kluivert . ebelum dipeca. memberikan konteks yang menarik, mengingat masa ini menandai fase transisi dan pembentukan gaya permainan baru. Setiap perubahan dalam strategi atau hasil pertandingan di bawah kepemimpinannya memicu reaksi beragam dari penggemar, yang terekam melalui komentarkomentar di media negati. Analisis terhadap periode ini dapat menggambarkan bagaimana persepsi penggemar terbentuk terhadap keputusan pelatih dan hasil pertandingan, sekaligus memberikan masukan empiris bagi federasi dan manajemen Timnas dalam evaluasi kebijakan. Rumusan masalah utama dari penelitian ini adalah bagaimana analisis sentimen terhadap komentar Instagram dapat digunakan untuk menilai persepsi publik terhadap performa Timnas Indonesia selama masa kepelatihan Patrick Kluivert, dengan menerapkan algoritma Nayve Bayes dan Decision Tree yang dioptimalkan menggunakan SMOTE. Pendekatan ini diharapkan mampu menghasilkan model klasifikasi yang tidak hanya akurat, tetapi juga mampu menangkap pola emosional publik secara Nilai kebaruan dari penelitian ini terletak pada kombinasi tiga aspek utama: . penggunaan data dari platform Instagram yang memiliki dinamika komunikasi visual dan teks berbeda dari media sosial . penerapan teknik SMOTE untuk mengatasi ketidakseimbangan data sentimen yang sering diabaikan dalam studi sebelumnya. perbandingan langsung antara dua algoritma klasik machine learning untuk menentukan pendekatan paling efektif dalam konteks analisis opini publik terhadap olahraga nasional. Secara teoretis, penelitian ini memperkaya literatur mengenai penerapan machine learning dalam bidang analisis sentimen olahraga, khususnya di Indonesia. Secara praktis, hasilnya diharapkan memberikan wawasan bagi pengelola Timnas dan pemangku kebijakan dalam memahami persepsi publik serta menyusun strategi komunikasi yang lebih Secara akademis, penelitian ini dapat menjadi referensi bagi studi-studi lanjutan yang berfokus pada hubungan antara performa olahraga dan emosi penggemar di media sosial. Dengan demikian, penelitian ini tidak hanya berfokus pada pemrosesan data tekstual, tetapi juga pada upaya memahami dimensi sosial dan emosional dari dukungan penggemar. Melalui pendekatan analisis sentimen berbasis machine learning, penelitian ini berupaya menangkap dinamika hubungan antara Timnas Indonesia dan para pendukungnya, sekaligus memperlihatkan bahwa Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 kecintaan terhadap tim nasional tidak semata bergantung pada kemenangan, melainkan juga pada rasa memiliki dan semangat kebersamaan yang terbangun di ranah digital. METODE PENELITIAN Penelitian ini menggunakan pendekatan kuantitatif dengan metode eksploratif dan eksperimen yang negat pada analisis sentimen pengguna Instagram terhadap performa Timnas Indonesia pada era kepelatihan Patrick Kluivert. Pendekatan ini dipilih karena mampu mengidentifikasi pola negatif dari data teks dalam jumlah besar serta mengukur tingkat akurasi dari model klasifikasi yang Untuk mencapai tujuan tersebut, penelitian ini dilakukan melalui serangkaian proses yang sistematis mulai dari pengumpulan data hingga evaluasi performa model klasifikasi. Adapun langkah-langkah penelitian yang dilaksanakan adalah sebagai berikut: Identifikasi Masalah dan Studi Literatur Tahap awal dimulai dengan mengidentifikasi permasalahan yang relevan, yaitu perlunya pemahaman terhadap persepsi negatif atas performa Timnas Indonesia. Selanjutnya dilakukan kajian pustaka terhadap penelitian terdahulu yang berkaitan dengan analisis sentimen, algoritma Nayve Bayes dan Decision Tree, serta teknik SMOTE, guna memperkuat landasan teori dan metodologi yang akan digunakan (Cahyono. Informatika, & Yogyakarta. Pengumpulan Data (Data Acquisitio. Data komentar diambil dari platform media negati Instagram yang relevan dengan Timnas Indonesia pada era kepelatihan Patrick Kluivert. Proses menggunakan tools web scraping seperti Python . engan library Selenium atau BeautifulSou. atau layanan seperti Phantombuster. Data dikumpulkan berdasarkan hashtag, mention, maupun akun resmi yang memuat konten pertandingan, wawancara, atau berita tim Pengumpulan dilakukan dengan memperhatikan aspek etika digital dan privasi Pra-pemrosesan Data (Preprocessin. Data mentah yang diperoleh selanjutnya melalui tahapan preprocessing untuk meningkatkan kualitas data teks agar layak untuk dianalisis (Ginantra. Yanti. Prasetya. Sarasvananda, & Wiguna, 2. Proses ini mencakup beberapa Cleaning: Menghapus karakter non-alfabet. URL, emoticon, negati, dan angka yang tidak relevan (Kurnia. Purnamasari, & Saputra. Case Folding: Mengubah semua huruf menjadi huruf kecil untuk standarisasi (Novitasari et al. , 2. Tokenizing: Memecah kalimat menjadi potongan kata . (Sriani. Lubis, & http://ejournal. id/ejurnal/index. php/infortech Harahap, 2. Stopword Removal: Menghilangkan kata-kata umum yang tidak memberikan makna penting dalam analisis . eperti AuyangAy. AudiAy. AukeAy. Stemming: Mengubah kata ke bentuk dasarnya, seperti AubermainAy menjadi AumainAy. AudilatihAy menjadi AulatihAy. Labelling Sentimen Setelah preprocessing, komentar diklasifikasikan secara manual atau semi-otomatis ke dalam dua kelas sentimen utama, yaitu positif dan negatif. Penentuan ini didasarkan pada kosakata yang mengandung muatan emosi, intensi kalimat, serta konteks penggunaannya. Labeling sangat penting sebagai dasar pembelajaran algoritma dalam tahap supervised learning (Ningsih. Alfianda. Rahmaddeni, & Wulandari, 2. Pembagian Data (Data Splittin. Data yang telah diberi label kemudian dibagi menjadi dua bagian, yaitu data training . %) dan data testing . %). Pembagian ini bertujuan agar model dapat belajar dari data latih dan diuji pada data uji untuk mengukur kemampuan generalisasi model terhadap data baru. Penyeimbangan Data dengan SMOTE Jika terjadi ketidakseimbangan kelas . umlah komentar positif jauh lebih banyak atau lebih sedikit dari negati. , maka digunakan negati SMOTE (Synthetic Minority Over-sampling Techniqu. SMOTE bekerja dengan cara menghasilkan data sintetis untuk kelas minoritas berdasarkan kemiripan data eksisting (Iskandar & Nataliani, 2. , sehingga distribusi kelas menjadi lebih seimbang. Hal ini bertujuan untuk menghindari bias model terhadap kelas mayoritas saat proses pelatihan. Klasifikasi Sentimen dengan Algoritma Machine Learning Pada tahap ini, data yang telah seimbang dan dibagi digunakan untuk pelatihan dua model Nayve Bayes : Algoritma probabilistik yang Bayes memprediksi kemungkinan suatu kelas berdasarkan fitur teks yang diamati (Fatkhudin et al. , 2. Decision Tree : Algoritma klasifikasi berbasis struktur pohon keputusan yang membagi data berdasarkan atribut dengan gain informasi tertinggi (Cahyaningtyas et al. , 2. Kedua model diuji untuk mengetahui performa dalam mengklasifikasikan komentar kedalam sentimen positif atau negatif. Evaluasi Model Setelah klasifikasi, dilakukan evaluasi performa masing-masing model menggunakan metrik pengujian sebagai berikut: Akurasi: Proporsi prediksi yang benar terhadap total prediksi. Presisi: Tingkat ketepatan model dalam memprediksi sentimen tertentu. Recall: Kemampuan Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 menemukan semua data yang relevan dari satu F1-Score: Rata-rata harmonis antara presisi dan recall. Evaluasi ini digunakan untuk mengetahui model mana yang lebih unggul dan seberapa baik model dapat mengklasifikasikan sentimen. Analisis Hasil dan Penarikan Kesimpulan Tahap akhir melibatkan analisis terhadap hasil evaluasi dan membandingkan performa kedua Penulis menarik kesimpulan terkait efektivitas model, implikasi hasil analisis terhadap persepsi negatif, serta memberikan saran pemanfaatan hasil penelitian baik secara teoritis maupun praktis. HASIL DAN PEMBAHASAN Hasil penelitian ini mencakup beberapa tahap, mulai dari proses scrapping data, pembersihan, pelabelan, hingga klasifikasi menggunakan algoritma Nayve Bayes dan Decision Tree. Tahap awal adalah mengumpulkan 300 data komentar dari Instagram yang kemudian diolah melalui serangkaian tahapan yang ketat untuk memastikan kualitas data. Proses data scraping dilakukan untuk mendapatkan data mentah berupa teks dari komentar-komentar pengguna Instagram terkait performa Timnas Indonesia di era kepelatihan Patrick Kluivert. Data mentah ini kemudian dilanjutkan ke tahap cleaning dan labeling untuk membersihkan data dari simbol khusus dan memberikan label sentimen positif atau negatif secara Setelah proses ini, data siap untuk diproses lebih lanjut menggunakan RapidMiner. WordList to Data WordList to Data menyajikan kata apa yang banyak muncul dikomentar instagram. Wordcloud pada menu Visualizations di operators Wordlist to Data. Sumber: Hasil Penelitian Tahun 2025 (RapidMine. Gambar 2. Hasil dari Wordcloud Scrapping Data Scrapping data adalah sebuah negati pengumpulan data dengan menggunakan ekstensi Google Chrome, yaitu InsC Ae Instagram Comment. InsC Ae Instagram Comment merupakan salah satu Web Scrapper yang berguna untuk melakukan proses pengambilan data secara efisien. Web Scrapping dilakukan dengan cara copy link dari postingan yang ingin diambil data komentarnya, dari hasil scrapping data didapatkan 230 data. Setelah itu melakukan export, format data yang telah diunduh berupa CSV. Sumber: Hasil Penelitian Tahun 2025 Gambar 3. Google Chrome InsC Ae Instagram Comment Hasil komentar Instagram yang sudah melalui scrapping dapat diunduh yang hasilnya dapat dilihat pada gambar berikut: Sumber: Hasil Penelitian Tahun 2025 (RapidMine. Gambar 1. Hasil WordList to Data Dari hasil WordList to Data pada gambar 3 di atas terdapat kata yang paling banyak muncul pada data, seperti AupemainAy. AutimnasAy. AuindonesiaAy, dan lain-lain. Untuk memvisualisasikan kata apa yang paling banyak muncul dari gambar 2 dapat menggunakan Plot Type http://ejournal. id/ejurnal/index. php/infortech Sumber : Hasil Penelitian Tahun 2025 Gambar 4. File Hasil Unduh (. dari Proses Scrapping Cleaning dan Labeling Untuk tahap selanjutnya dilakukan Cleaning dan Labeling, pada tahap Cleaning akan dilakukan penghapusan terhadap simbol, emoticon dan mention. Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Sumber: Hasil Penelitian Tahun 2025 Gambar 6. Proses Dokumen Pada RapidMiner Tabel 1. Hasil Proses Cleaning Sebelum Sesudah thanks coach Patrickkluivert9 thanks coach thx thx pak @erickthohir yaoaa Sumber : Hasil Penelitian Tahun 2025 Selanjutnya, dilakukan pelabelan secara manual, dimana setiap teks diberikan label sentimen positif dan Tabel 2. Hasil Proses Labeling Teks Sentimen thanks coach thx pak Positif Ganti Patrick Udah kebanyakan ngopi dianya Negatif Sumber : Hasil Penelitian Tahun 2025 Hasil dari proses labelling didapatkan 136 data positif dan 94 data negatif. Pra Pemrosesan Data Pra-pemrosesan dilakukan untuk menyiapkan data sebelum analisis sentimen. Pra-pemrosesan dilakukan menggunakan RapidMiner. Data yang sudah di Cleaning dan Labeling, dimasukkan pada software RapidMiner dengan Operators Read CSV. Sumber: Hasil Penelitian Tahun 2025 Gambar 5. Labeling pada Kolom Sentimen (RapidMine. Setelah memberikan label pada kolom sentiment, tahap selanjutnya adalah mengubah atribut polynominal menjadi atribut text menggunakan Operators Nominal to Text dan dilakukan pemrosesan dokumen menggunakan Operators Process Documents pada RapidMiner. Didalam process document terdiri dari berbagai subprocess, yaitu: Tokenize Proses memecah teks menjadi bagian kecil yang disebut token. Dengan memisahkan teks menjadi elemen-elemen yang lebih manageable, tokenize memungkinkan algoritma untuk menganalisis, mengklasifikasikan, dan mengolah informasi dengan lebih efisien, menjadikan pemahaman bahasa menjadi lebih terstruktur dan sistematis. Seperti contoh kalimat: AuGanti Patrick Udah kebanyakan ngopi dianyaAy. Menjadi: AuGantiAy. AuPatrickAy. AuUdahAy. AukebanyakanAy. AungopiAy. AudianyaAy. Transform Cases Proses mengubah format huruf dalam teks, seperti mengalihkannya menjadi huruf kapital semua, huruf kecil semua, atau hanya huruf pertama yang Seperti contoh kalimat : AuGantiAy. AuPatrickAy. AuUdahAy. AukebanyakanAy. AungopiAy. AudianyaAy. Menjadi : Auganti Patrick udah kebanyakan ngopi dianyaAy. Filter Stopwords (Dictionar. Berfungsi untuk menghapus kata-kata yang tidak relevan, proses ini menggunakan list bahasa Indonesia yang diambil dari web Kaggle. Seperti contoh kalimat : Auyoih udah dari 14jam yg lalu gw dzikirinAy. Menjadi : Auyoih udah jam yg gw dzikirinAy . Filter Tokens . y Lengt. Proses menyaring kata-kata, kita menghapus yang memiliki terlalu sedikit atau terlalu banyak karakter, dengan batasan default minimal 4 karakter dan maksimal 25 karakter. Seperti contoh kalimat : Auyoih udah jam yg gw dzikirinAy. Menjadi : Auyoih udah dzikirinAy Sumber: Hasil Penelitian Tahun 2025 Gambar 7. Process Documents From Data (RapidMine. Proses didalam Operators Process Documents yang berisi Operators Tokenize. Transform Cases. Filter Stopwords (Dictionar. dan Filter Tokens . y Lengt. Setelah menyusun model seperti yang dijelaskan di atas dalam RapidMiner, menghasilkan kalimat yang lebih sederhana. Setelah pra-pemrosesan data selesai, langkah selanjutnya adalah pembagian dataset. Pembagian Dataset (Data Spli. Dataset dibagi menjadi data pelatihan dan data pengujian dengan rasio 70:30, 80:20, 90:10. Data http://ejournal. id/ejurnal/index. php/infortech Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 pelatihan digunakan untuk membangun model, sedangkan data pengujian digunakan untuk evaluasi Pembagian dataset dilakukan dengan menggunakan operator Split Data. Sumber: Hasil Penelitian Tahun 2025 Gambar 8. Split Data (RapidMine. Operators Split Data untuk membagi data yang sudah melalui Proses Documents Data, pembagian data set dengan ratio 0. %) dan 0. %). Penanganan Ketidakseimbangan Kelas Untuk mengatasi ketidakseimbangan kelas, metode SMOTE diterapkan. Hasil penerapan SMOTE menunjukkan peningkatan jumlah data pada kelas minoritas, sehingga proporsi data menjadi lebih Sumber: Hasil Penelitian Tahun 2025 Gambar 11. Performance Naive Bayes ratio 70:30 Model memiliki akurasi sebesar 49. Ini menunjukkan bahwa model hanya benar dalam memprediksi sekitar setengah dari keseluruhan Terdapat 20 prediksi positif yang benar . rue Terdapat 14 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 82%, yang menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 58. adalah benar. Recall untuk kelas positif adalah 78%, berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 78% di antaranya. Dari 21 prediksi negatif, hanya 14 yang benar. Ini menghasilkan precision untuk kelas negatif sebesar 40. Secara keseluruhan, hasil ini menunjukkan bahwa model Nayve Bayes memiliki performa yang cukup Pengujian akurasi perbandingan 80:20 Sumber: Hasil Penelitian Tahun 2025 Gambar 9. SMOTE Upsampling (RapidMine. Dilakukan penyeimbangan kelas menggunakan Operators SMOTE Upsampling, agar terjadi keseimbangan kelas antara label positif dan negatif. Klasifikasi Nayve Bayes dan Decision Tree Dua model klasifikasi yang diandalkan adalah Nayve Bayes dan Decision Tree, masing-masing dengan pendekatan yang khas. Nayve Bayes Gunakan operators Nayve Bayes. Apply Model dan Performance RapidMiner mendapatkan hasil klasifikasi Nayve Bayes. Sumber: Hasil Penelitian Tahun 2025 Gambar 10. Operators Nayve Bayes. Apply Model dan Performance Kemudian dilakukan pengujian akurasi : Pengujian akurasi perbandingan 70:30 http://ejournal. id/ejurnal/index. php/infortech Sumber: Hasil Penelitian Tahun 2025 Gambar 12. Performance Naive Bayes ratio 80:20 Model memiliki akurasi sebesar 47. Ini menunjukkan bahwa model hanya benar dalam memprediksi sekitar setengah dari keseluruhan Terdapat 13 prediksi positif yang benar . rue Terdapat 10 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 52%, yang menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 56. adalah benar. Recall untuk kelas positif adalah 15%, berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 15% di antaranya. Dari 14 prediksi negatif, hanya 9 yang benar. Ini menghasilkan precision untuk kelas negatif sebesar 39. Secara keseluruhan, hasil ini menunjukkan bahwa model Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Nayve Bayes memiliki performa yang lebih rendah dari rasio sebelumnya. Pengujian akurasi perbandingan 90:10 Sumber: Hasil Penelitian Tahun 2025 Gambar 15. Performance Decision Tree ratio 70:30 Sumber: Hasil Penelitian Tahun 2025 Gambar 13. Performance Naive Bayes ratio 90:10 Model memiliki akurasi sebesar 39. Ini menunjukkan bahwa model hanya benar dalam memprediksi sekitar setengah dari keseluruhan Terdapat 5 prediksi positif yang benar . rue Terdapat 5 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 00%, yang menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 50. adalah benar. Recall untuk kelas positif adalah 71%, berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 71% di antaranya. Dari 9 prediksi negatif, hanya 4 yang benar. Ini menghasilkan precision untuk kelas negatif sebesar 30. Secara keseluruhan, hasil ini menunjukkan bahwa model Nayve Bayes memiliki performa yang lebih rendah dari 2 rasio PerformanceVector dari Operators Decision Tree memiliki akurasi sebesar 63. 77%, yang menunjukkan bahwa model ini benar dalam memprediksi sekitar 63. 77% dari keseluruhan data. Terdapat 37 prediksi positif yang benar . rue Terdapat 21 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 79%, menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 63. 79% adalah Recall untuk kelas positif adalah 90. berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 90. 24% di Dari 4 prediksi negatif, terdapat 7 yang benar . rue negative. , dengan precision untuk kelas negatif sebesar 63. Pengujian akurasi perbandingan rasio 80:20 . Decision Tree Begitupun dengan Decision Tree, menggunakan operators Decision Tree. Apply Model dan Performance. Sumber: Hasil Penelitian Tahun 2025 Gambar 16. Performance Decision Tree ratio 80:20 Sumber: Hasil Penelitian Tahun 2025 Gambar 14. Operators Decision Tree. Apply Model dan Performance Kemudian dilakukan pengujian akurasi yang sama dengan pengujian Nayve Bayes sebelumnya. Pengujian akurasi perbandingan rasio 70:30 http://ejournal. id/ejurnal/index. php/infortech Model memiliki akurasi sebesar 58. 70%, yang menunjukkan bahwa model ini benar dalam memprediksi sekitar 58. 70% dari keseluruhan data. Terdapat 24 prediksi positif yang benar . rue Terdapat 16 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 00%, menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 60. 00% adalah Recall untuk kelas positif adalah 88. berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 88. 89% di Dari 3 prediksi negatif, terdapat 3 yang benar . rue negative. , dengan precision untuk kelas negatif sebesar 50. Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Pengujian akurasi perbandingan rasio 90:10 accuracy: 63. true positif true negatif class precision Positif Negatif class recall Sumber: Hasil Penelitian Tahun 2025 (RapidMine. Gambar 18. Akurasi Decision Tree Sumber: Hasil Penelitian Tahun 2025 Gambar 17. Performance Decision Tree ratio 90:10 Memiliki akurasi sebesar 60. 87%, yang menunjukkan bahwa model ini benar dalam memprediksi sekitar 60. 87% dari keseluruhan data. Terdapat 12 prediksi positif yang benar . rue Terdapat 7 prediksi negatif yang benar . rue negative. Precision untuk kelas positif 16%, menunjukkan bahwa dari semua prediksi positif yang dibuat, sekitar 63. 16% adalah Recall untuk kelas positif adalah 85. berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 85. 71% di Dari 2 prediksi negatif, terdapat 2 yang benar . rue negative. , dengan precision untuk kelas negatif sebesar 50. Secara keseluruhan, hasil ini menunjukkan bahwa model Decision Tree memiliki performa yang lebih baik dibandingkan model Nayve Bayes sebelumnya, terutama dalam hal recall untuk kelas positif yang cukup tinggi. Namun, recall untuk kelas negatif hanya 25%, yang menunjukkan bahwa model ini mungkin kesulitan mengenali beberapa contoh negatif. Hasil Klasifikasi Setelah tahap analisis selesai, diperoleh nilainilai yang mencerminkan pola dan karakteristik dari Evaluasi yang dilakukan menghasilkan metrik performa seperti tingkat akurasi, presisi, dan recall yang membantu dalam memahami cara yang lebih efektif untuk mengklasifikasikan data. Berikut hasil klasifikasi akurasi sentimen dari model Nayve Bayes dapat dilihat berikut ini : accuracy: 49. true positif true negatif class precision Positif Negatif class recall Sumber: Hasil Penelitian Tahun 2025 (RapidMine. Gambar 18. Akurasi Nayve Bayes Sedangkan untuk hasil klasifikasi akurasi untuk model Decision Tree adalah : http://ejournal. id/ejurnal/index. php/infortech Model Decision Tree memberikan hasil yang lebih baik dalam hal akurasi, precision, dan recall untuk kelas positif dibandingkan dengan Nayve Bayes. KESIMPULAN Dari hasil analisa sentimen menggunakan metode Nayve Bayes berbabis SMOTE dan Decision Tree SMOTE menggunakan rasio 70:30, 80:20 dan 90:10 diatas, dapat disimpulkan bahwa penulis mengambil rasio 70:30 sebagai hasil penelitian kali ini ini dikarenakan memiliki nilai akurasi sebesar 23% untuk Naive Bayes dan Decision Tree memiliki nilai akurasi sebesar 63. Nayve Bayes, memiliki akurasi sebesar 28%, ini menunjukan bahwa model hanya benar dalam memprediksi sekitar setengah dari keseluruhan data. Terdapat 20 prediksi positif yang benar . rue positive. Terdapat 14 prediksi negatif yang benar . rue negative. Precision untuk kelas positif adalah 58. 82%, yang menunjukkan bahwa dari semua prediksi dipositif yang dibuat, sekitar 58. 82% adalah benar. Recall untuk kelas positif adalah 48. 78%, berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 48. 78% di antaranya. Dari 21 prediksi negatif, hanya 14 yang benar. Ini menghasilkan precision untuk kelas negatif secara keseluruhan, hasil ini menunjukan bahwa model Nayve Bayes memiliki performa yang cukup rendah. Decision Tree, memiliki akurasi sebesar 77%, yang menunjukkan bahwa model ini benar dalam memprediksi sekitar 63. 77% dari keseluruhan data. Terdapat 37 prediksi positif yang benar . rue positive. Terdapat 21 prediksi negatif yang benar . rue negative. Precision untuk kelas positif adalah 63. 79%, menunjukkan bahwa dari semua prediksi positif yang dibuat, 79% adalah benar. Recall untuk kelas positif adalah 90. 24%, berarti dari semua kasus positif yang sebenarnya, model ini dapat mengenali sekitar 90. 24% di antaranya. Dari 4 prediksi negatif, terdapat 7 yang benar . rue negative. , dengan precision untuk kelas negatif Secara keseluruhan, hasil ini menunjukkan bahwa model Decision Tree memiliki performa Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 yang lebih baik dibandingkan model Nayve Bayes sebelumnya, terutama dalam hal recall untuk kelas positif yang cukup tinggi. Namun, recall untuk kelas negatif hanya 25%, yang menunjukkan bahwa model ini mungkin kesulitan mengenali beberapa contoh negatif. REFERENSI