874 Progresif: Jurnal Ilmiah Komputer https://ojs. stmik-banjarbaru. id/index. php/progresif/index Jl. Ahmad Yani. 33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp. , e-mail: puslit. stmikbjb@gmail. e-ISSN: 2685-0877 Analisis Sentimen terhadap Dedy Mulyadi Berdasarkan Komentar Youtube Menggunakan Metode Nayve Bayes DOI: http://dx. org/10. 35889/progresif. Creative Commons License 4. 0 (CC BY Ae NC) Nhadya Vita Loca1*. Dedy Abdullah2 Teknik Informatika. Universitas Muhammadiyah Bengkulu. Bengkulu. Indonesia *e-mail Corresponding Author: nhadyavitaloca8@gmail. Abstract The increasing spread of public opinion on social media, particularly YouTube, highlights the need for automated sentiment analysis to understand public perception toward political figures. This study analyzes public sentiment toward Dedy Mulyadi, a prominent political figure in Indonesia, using the Nayve Bayes method on 600 YouTube comments collected via web Data were processed in RapidMiner through text cleaning, manual labeling of 100 comments as training data, and automatic classification. Results show a model accuracy of 67%, with perfect recall . %) for negative sentiment but 0% precision and recall for positive sentiment, indicating training data imbalance. Despite this limitation, the study demonstrates the applicability of Nayve Bayes for small-scale sentiment analysis in political communication contexts. Findings suggest the methodAos potential when data distribution is balanced, supporting data-driven political strategies. Keywords: Sentiment analysis. Nayve Bayes. YouTube. Public opinion Abstrak Permasalahan sentimen negatif dan positif terhadap figur publik di media sosial, khususnya YouTube, semakin kompleks seiring meningkatnya partisipasi masyarakat dalam menyampaikan opini. Analisis sentimen diperlukan untuk memahami dinamika opini publik secara otomatis dan mendukung strategi komunikasi politik berbasis data. Penelitian ini menganalisis sentimen terhadap Dedy Mulyadi menggunakan metode Nayve Bayes pada 600 komentar YouTube yang dikumpulkan melalui crawling. Data diproses dengan RapidMiner melalui tahapan pembersihan teks, pelabelan manual . , dan klasifikasi otomatis. Hasil menunjukkan akurasi model 66,67%, dengan recall 100% untuk sentimen negatif namun precision dan recall 0% untuk positif, mengindikasikan bias data latih akibat ketidakseimbangan Meskipun demikian, studi ini menegaskan potensi Nayve Bayes dalam analisis sentimen skala kecil, terutama untuk deteksi sentimen dominan, dengan rekomendasi perbaikan keseimbangan data dan validasi lebih lanjut. Kata kunci: Analisis sentimen. Nayve Bayes. YouTube. Opini publik Pendahuluan Pesatnya perkembangan teknologi informasi telah mendorong peningkatan akses internet secara global, menjadikan media sosial sebagai kanal utama dalam interaksi digital Platform seperti WhatsApp. Facebook. TikTok. Instagram, dan terutama YouTube, kini tidak hanya berperan sebagai sarana hiburan, melainkan juga sebagai ruang publik di mana individu bebas mengekspresikan pandangan serta opini terhadap berbagai isu sosial dan Fenomena ini menegaskan pentingnya kajian terhadap sentimen masyarakat yang muncul di ruang digital sebagai bentuk partisipasi publik yang semakin signifikan. Di Indonesia, media sosial telah menjadi elemen penting dalam keseharian masyarakat. Youtube, dengan keunggulan dalam menyebarkan konten audio-visual secara cepat dan luas, semakin sering digunakan oleh masyarakat umum maupun pejabat untuk menyampaikan Analisis Sentimen terhadap a. Nhadya Vita Loca Progresif e-ISSN: 2685-0877 pandangan serta menanggapi isu-isu yang sedang berkembang. Salah satu tokoh publik yang kerap menjadi bahan perbincangan adalah Gubernur Jawa Barat. Dedy Mulyadi, yang sering menjadi sorotan dalam diskusi di platform tersebut. Fenomena meningkatnya partisipasi publik di ruang digital telah membuka peluang luas untuk mengeksplorasi opini masyarakat terhadap isu sosial dan politik melalui pendekatan analisis sentimen. Analisis sentimen adalah cabang dari text mining yang tujuannya mengelompokkan opini secara otomatis ke dalam kategori positif, netral, atau negatif dengan memanfaatkan algoritma klasifikasi. Algoritma yang digunakan adalah Nayve Bayes, karena memiliki efisiensi tinggi dalam memproses data teks berskala besar serta tingkat akurasi yang kompetitif . Tujuan penelitian ini adalah mendapatkan sentimen masyarakat terhadap kinerja figur publik Dedy Mulyadi melalui komentar YouTube yang akan di analisis menggunakan algoritma Nayve Bayes. Komentar yang telah dikumpulkan akan di analisis menggunakan RapidMiner, yang melibatkan tahapan text preprocessing, pelabelan manual, dan klasifikasi otomatis ke dalam kategori sentimen positif dan negatif. Hasil analisis diharapkan bisa dijadikan dasar dalam merumuskan strategi komunikasi politik berbasis data, serta memberikan wawasan terhadap dinamika opini publik di platform digital. Kebaruan dari studi ini terletak pada pemanfaatan data media sosial berbasis YouTube dan penerapan algoritma klasifikasi Nayve Bayes dalam konteks kajian lokal mengenai pejabat publik Indonesia. Keunikan metodologis studi ini terdapat pada pemilihan objek kajian, teknik klasifikasi, serta relevansinya terhadap perkembangan komunikasi politik digital yang kian pesat. Tinjauan Pustaka Analisis sentimen merupakan cabang dari Natural Language Processing (NLP) . yang bertujuan mengidentifikasi opini, emosi, dan sikap masyarakat melalui teks digital. Dalam era keterhubungan tinggi, platform media sosial seperti YouTube menjadi sumber data yang potensial karena sifatnya yang terbuka, interaktif, dan banyak digunakan oleh masyarakat. Komentar pada konten video sering kali merepresentasikan opini publik yang autentik terhadap isu-isu sosial dan politik. Penelitian sebelumnya telah menunjukkan efektivitas algoritma Nayve Bayes dalam klasifikasi sentimen di media sosial. Didik Garbian Nugroho. Yulison Herry Christanto, dan Agung Wahana . menganalisis opini masyarakat terhadap layanan transportasi daring di Twitter menggunakan Nayve Bayes, menghasilkan akurasi klasifikasi sebesar 80%. Studi serupa oleh Alfandi Safira dan Firman Noor Hasan . mencapai akurasi 91% dalam menganalisis sentimen terhadap layanan paylater, mengungguli metode lexicon-based seperti TextBlob. Dalam konteks kebijakan publik. Dianati Duei Putri dkk. mencapai akurasi 80% dalam menganalisis sentimen terhadap kinerja lembaga legislatif melalui 1. 546 tweet. Sementara itu. Kevin. Margareta Enjeli, dan Andri Wijaya . berhasil mengklasifikasikan ulasan aplikasi Android ke dalam tiga kategori . ositif, negatif, netra. menggunakan Nayve Bayes pada data dari Google Play Store. Di platform YouTube. Joy Lawa Rizky dan Windu Gata . membandingkan beberapa algoritma untuk menganalisis sentimen terhadap proyek kereta cepat, menemukan bahwa Bidirectional-LSTM mencapai akurasi tertinggi . , diikuti Multinomial Nayve Bayes . Meskipun deep learning menunjukkan performa lebih tinggi, pendekatannya memerlukan infrastruktur komputasi besar dan data latih yang luas, sehingga kurang praktis untuk skala kecil atau sumber daya terbatas. Sebagian besar penelitian terdahulu berfokus pada isu layanan transportasi atau kebijakan pembangunan, dengan dominasi penggunaan data dari Twitter. Penelitian ini menghadirkan kebaruan dari tiga aspek utama: . kontekstual, yaitu fokus pada figur politik lokal (Dedy Mulyad. di platform YouTube, yang belum banyak dieksplorasi dibanding platform . metodologis, melalui penerapan Nayve Bayes dalam lingkungan RapidMiner dengan alur kerja terstruktur, meliputi crawling dengan Python, text preprocessing, pelabelan manual 100 komentar sebagai training set, dan integrasi data uji melalui operator Union dan Replace Missing Values untuk menangani ketidaksesuaian struktur data. teknis, dengan penggunaan stopwords bahasa Indonesia dari sumber eksternal (Kaggl. karena belum tersedia bawaan di RapidMiner, langkah yang jarang dijelaskan secara eksplisit dalam kajian serupa. Analisis Sentimen terhadap a. Nhadya Vita Loca e-ISSN: 2685-0877 Kebaruan ini tidak hanya memperluas domain aplikasi analisis sentimen ke ranah komunikasi politik digital, tetapi juga menunjukkan bahwa Nayve Bayes tetap relevan sebagai algoritma ringan dan transparan, terutama untuk klasifikasi teks pendek dan sumber daya Temuan ini mendukung studi oleh Ilmawan & Mude . yang menunjukkan bahwa Nayve Bayes kompetitif meski pada data berskala kecil, serta Batuallo dkk. yang menekankan ketergantungan kinerja pada kualitas data latih. Dengan demikian, penelitian ini memberikan kontribusi konkret dalam mengintegrasikan pendekatan klasik ke dalam konteks kontemporer, sekaligus memperkaya literatur tentang opini publik digital terhadap tokoh politik di Indonesia. Metodologi Bab ini menguraikan rangkaian tahapan yang dilakukan sepanjang proses penelitian. Untuk memudahkan pemahaman pembaca terhadap alur kegiatan yang ditempuh, setiap langkah dijelaskan secara sistematis dan didukung dengan representasi visual dalam bentuk diagram alur yang disajikan pada Gambar 1. Flowchart Gambar 1 memperlihatkan alur yang dimulai dari proses crawling data menggunakan python . Proses crawling dilakukan pada platform YouTube, dengan mengambil komentar dari salah satu video yang berkaitan dengan figur publik Dedy Mulyadi. Kata kunci AuDedy MulyadiAy digunakan dalam proses pencarian untuk mengekstrak komentar-komentar yang Progresif: Vol. No. Agustus 2025: 874-884 Progresif e-ISSN: 2685-0877 menyebutkan atau membahas tokoh tersebut. Hasil crawling berupa komentar-komentar relevan kemudian disimpan dalam file CSV untuk dianalisis lebih lanjut. Tahapan berikutnya adalah pembersihan teks komentar yang telah dikumpulkan. Komentar awal masih memuat berbagai simbol seperti [!@#$&*%(). :AoAy,. -], tautan web, serta karakter tidak penting lainnya yang dapat mengganggu analisis sentimen. Oleh karena itu, dilakukan proses normalisasi dan pembersihan agar teks menjadi lebih bersih dan siap untuk dianalisis secara akurat. Seluruh rangkaian proses data dilakukan menggunakan RapidMiner. Setelah melalui tahap pembersihan, data komentar yang telah diproses disimpan kembali dalam format CSV guna keperluan analisis lenih lanjut. Visualisasi dari tahapan ini disajikan dalam Gambar 2 untuk memperjelas alur kerja yang dilakukan. Gambar 2. Alur Proses Pembersihan Komentar YouTube di Rapid Miner Setelah tahap pembersihan komentar dari elemen-elemen seperti simbol non-alfabetik, kata-kata tidak relevan, dan tautan selesai dilakukan, tahap selanjutnya dalam proses penelitian adalah pelabelan manual. Pada fase ini, peneliti membagi kategori komentar yaitu, positif atau negatif . Tujuan utama pelabelan manual ini adalah membentuk training data yang akan menjadi dasar bagi algoritma Nayve Bayes dalam melakukan pelabelan otomatis terhadap data yang lebih luas. Dalam implementasinya, sebanyak 100 dari total 600 komentar yang disimpan dalam format CSV diberi label secara manual oleh peneliti. Sisanya, yaitu 500 komentar, diklasifikasikan menggunakan algoritma Nayve Bayes Classifier. Penting untuk dicatat bahwa akurasi model sangat dipengaruhi oleh jumlah data yang diberi label secara manualAisemakin besar jumlahnya, semakin tinggi potensi ketepatan klasifikasi. Hal ini merefleksikan karakteristik algoritma Nayve Bayes yang bergantung pada kualitas dan kuantitas data pelatihan dalam proses pembelajaran mesin . Tahapan berikutnya melibatkan pengimporan data terlabel ke dalam platform RapidMiner, bertujuan untuk melatih algoritma Nayve Bayes agar dapat mengenali pola-pola sentimen positif maupun negatif. Proses ini divisualisasikan pada Gambar 3, yang menunjukkan alur kerja pemodelan klasifikasi berbasis data hasil anotasi manual. Gambar 3. Alur Latihan dataset Pada tahapan ini, peneliti mengintegrasikan data komentar yang telah dianotasi secara manual ke dalam platform RapidMiner sebagai training data untuk algoritma Nayve Bayes. Analisis Sentimen terhadap a. Nhadya Vita Loca e-ISSN: 2685-0877 Algoritma tersebut kemudian dilatih untuk mengenali pola polaritas sentimen berdasarkan data terklasifikasi, sehingga dapat melakukan klasifikasi otomatis terhadap komentar yang belum diberi label. Performa model sangat bergantung pada kuantitas dan kualitas data latih semakin besar volume anotasi manual, tingkat akurasi meningkat . Setelah alur pelatihan, model klasifikasi disimpan menggunakan operator AuStoreAy, sebagaimana divisualisasikan pada Gambar 3 yang menampilkan dua komponen utama proses pelabelan lanjutan: operator data latih dan data model. Tahapan ini juga mencakup penggunaan operator AuProcess Documents from DataAy yang menerapkan parameter tokenize dan stopwords dalam proses pra-pemrosesan teks . Karena RapidMiner tidak menyediakan daftar stopwords bahasa Indonesia secara bawaan, peneliti mengakses sumber eksternal dari situs kaggle. com sebagai acuan dalam pembersihan teks pada tahap keempat. Tahap akhir dalam proses penelitian ini adalah label yang secara otomatis terisi dengan menggunakan algoritma Nayve Bayes, yang sebelumnya telah melalui pelatihan untuk mengenali pola klasifikasi . Model yang telah dikonstruksi dimanfaatkan untuk mengidentifikasi polaritas sentimen pada komentar-komentar baru yang belum dianotasi, dengan merujuk pada pola yang telah dipelajari dari data latih. Proses klasifikasi otomatis ini dilakukan menggunakan perangkat RapidMiner, sebagaimana ditunjukkan dalam Gambar 4. Pelabelan dilakukan dengan memanfaatkan model klasifikasi yang telah disimpan sebelumnya, serta melibatkan operator pemrosesan dokumen untuk mengelola data input. Integrasi komponen ini memungkinkan pelabelan seluruh dataset berjalan secara efisien, konsisten, dan Gambar 4. Alur Pelabelan Secara Otomatis Rangkaian proses yang dimulai dari pembacaan file CSV hingga penerapan operator AuProcess Document from DataAy merupakan bagian dari skema pemrosesan data uji yakni himpunan komentar yang belum diberi label dan akan diklasifikasikan secara otomatis menggunakan model hasil pelatihan sebelumnya. Dalam alur kerja yang ditampilkan pada Gambar 4, operator AuRetrieveAy digunakan untuk memanggil data latih, yaitu data yang telah melalui proses pelabelan manual. Mengingat adanya perbedaan struktur dan isi antara data latih dan data uji, diperlukan tahap penggabungan dengan memanfaatkan operator AuUnion. Ay Operator ini berperan dalam menyelaraskan kedua jenis data agar memiliki format kolom yang seragam, sehingga keduanya dapat digunakan secara bersamaan dalam proses klasifikasi Proses penggabungan ini bersifat krusial agar model yang telah dilatih mampu mengidentifikasi serta mengklasifikasikan data uji secara efektif dan akurat. Tabel 1 menyajikan ilustrasi alur kerja dari proses integrasi tersebut, menggambarkan penyelarasan antara data latih dan data uji dalam satu skema pemrosesan terpadu untuk menghasilkan klasifikasi sentimen yang konsisten. Progresif: Vol. No. Agustus 2025: 874-884 Progresif e-ISSN: 2685-0877 Tabel 1. Format Awal Data Latih dan Uji Data Latih Data Uji (Tanpa Tabe. Sentimen Positif Negatif Sentimen A. Negatif Tabel 1 mengindikasikan adanya perbedaan dalam jumlah kolom dan atribut antara data latih dan data uji, yang menyebabkan keduanya tidak dapat diproses dalam satu alur kerja secara langsung di RapidMiner. Peneliti mengidentifikasi bahwa kolom C dan D merupakan atribut serupa yang dapat dijadikan titik temu dalam proses penyelarasan. Untuk memastikan konsistensi struktur data dan mendukung efektivitas klasifikasi sentimen, dilakukan tiga tahap Pertama, dilakukan penggabungan data menggunakan operator Union seperti ditampilkan pada Gambar 4, sehingga kedua dataset dapat berjalan dalam jalur pemrosesan yang sama. Kedua, diterapkan operator Filter Examples untuk mengeliminasi entri dari data latih pasca penggabungan, sehingga tersisa hanya data uji yang siap dilabel secara otomatis. Ketiga, digunakan operator Replace Missing Values guna mengisi atribut kosong yang muncul akibat perbedaan struktur awal. Hasil akhir dari rangkaian proses ini ditunjukkan pada Tabel 2, yang memperlihatkan bahwa data uji telah siap untuk diklasifikasikan secara otomatis dan sistematis menggunakan model klasifikasi yang telah dilatih sebelumnya. Tabel 2. Output Penggabungan dan Koreksi Data Sentimen A. Negatif Tabel 2 menunjukkan bahwa peneliti berhasil menyelaraskan struktur kolom dan atribut antara data latih dan data uji melalui operator AuUnionAy dalam RapidMiner. Usai proses penggabungan, data latih yang sebelumnya digunakan dalam pelatihan model dieliminasi, sehingga hanya data uji yang belum diberi label tersisa untuk dianalisis. Kolom A dan B dalam hasil integrasi memuat sejumlah nilai kosong . issing value. atau simbol tanda tanya, akibat ketidaksesuaian atribut antara kedua dataset. Untuk mengatasi hal ini, peneliti menggunakan operator AuReplace Missing ValuesAy dengan menetapkan nilai default berupa angka 0. Langkah ini bertujuan memastikan keseragaman struktur data, sehingga sistem klasifikasi sentimen dapat memproses data secara optimal dan konsisten. Pada tahapan akhir, peneliti mempersiapkan pelaksanaan analisis sentimen secara Sebelum proses pelabelan dilakukan, peneliti terlebih dahulu memanggil model klasifikasi hasil pelatihan algoritma Nayve Bayes menggunakan operator Retrieve, sebagaimana telah dijelaskan pada tahap sebelumnya dan divisualisasikan dalam Gambar 4. Model tersebut kemudian diintegrasikan dengan operator Apply Model, sementara data uji yang telah melalui tahap pengisian nilai kosong . engan operator AuReplace Missing ValuesA. disambungkan ke bagian unlabeled . dalam skema kerja. Setelah seluruh proses dijalankan, sistem berhasil melakukan pelabelan sentimen secara otomatis terhadap data uji menggunakan algoritma machine learning Nayve Bayes Classifier, menghasilkan klasifikasi komentar ke dalam kategori sentimen yang sesuai berdasarkan pola yang telah dipelajari. Hasil dan Pembahasan 1 Sampel Data dan Tahapan Pemrosesan Sampel data dalam penelitian ini diperoleh dari komentar-komentar pada sebuah video YouTube yang menampilkan figur publik Dedy Mulyadi. Proses pengumpulan dilakukan menggunakan skrip web crawling berbasis Python dengan kata kunci "Dedy Mulyadi", dan hasilnya diekspor dalam format CSV untuk keperluan analisis lebih lanjut. Dari keseluruhan Analisis Sentimen terhadap a. Nhadya Vita Loca e-ISSN: 2685-0877 data yang dikumpulkan sebanyak 600 komentar, sebanyak 100 komentar dilabeli secara manual untuk digunakan sebagai training data dalam pelatihan algoritma Nayve Bayes. Tahapan pemrosesan data dilakukan secara bertahap menggunakan perangkat lunak RapidMiner, yang mencakup proses Read CSV. Filter Examples. Remove Duplicates, dan Process Document from Data. Komentar yang semula mengandung simbol, tautan, serta katakata yang tidak relevan dibersihkan guna meningkatkan akurasi dalam analisis sentimen. Hasil dari proses pembersihan ini disajikan pada Tabel 3 sebagai representasi data yang telah siap untuk dianalisis lebih lanjut. Tabel 3. Hasil Pembersihan Sebelum Dibersihkan Setelah Dibersihkan "Moga pak dedi sehat2,panjang umur,dan bs ditiru oleh pejabat2 lainnya,diseluruh indonesia,aamiino" Keren poll setuju banget dengan program pak Dedi Moga pak dedi sehat panjang umur dan bs ditiru oleh pejabat lainnya diseluruh indonesia Keren poll setuju banget dengan program pak 2 Pelabelan Sentimen Peneliti melakukan pelabelan manual terhadap 500 komentar sebagai data latih, yang kemudian digunakan untuk melatih algoritma Nayve Bayes melalui operator AuStoreAy pada platform RapidMiner. Proses pelatihan model memanfaatkan parameter tokenize dan stopwords, dengan acuan daftar stopwords Bahasa Indonesia yang diperoleh dari situs Kaggle. Hal ini dilakukan mengingat RapidMiner belum menyediakan dukungan bawaan untuk Bahasa Indonesia. Representasi visual dari tahapan pelatihan ditampilkan pada Gambar 3. Tahapan klasifikasi otomatis dilakukan dengan mengaktifkan operator AuRetrieve Data ModelAy dan AuApply ModelAy, serta menyatukan data latih dan data uji melalui operator AuUnionAy. Untuk menyelaraskan struktur atribut antara kedua jenis data, digunakan operator AuReplace Missing ValuesAy. Keseluruhan alur klasifikasi otomatis ini divisualisasikan pada Gambar 4. Tabel 1 memperlihatkan perbedaan atribut antara data latih dan data uji, yang menjadi dasar perlunya proses penyelarasan. Sementara itu. Tabel 2 menunjukkan hasil akhir dari proses penggabungan dan penyesuaian struktur, yang menghasilkan data uji siap untuk diklasifikasikan secara otomatis oleh model Nayve Bayes Gambar 5. Distribusi Klasifikasi Akhir Progresif: Vol. No. Agustus 2025: 874-884 Progresif e-ISSN: 2685-0877 Hasil dari pelabelan otomatis menunjukkan bahwa model berhasil mengklasifikasikan komentar dengan tingkat konsistensi yang cukup tinggi terhadap data latih. Mayoritas komentar dikategorikan sebagai sentimen positif, sedangkan sebagian lainnya teridentifikasi sebagai Distribusi klasifikasi akhir yang menggambarkan sebaran jumlah komentar positif dan negatif divisualisasikan pada Gambar 5, yang menunjukkan tren opini publik dominan terhadap topik yang dianalisis. Temuan ini mengindikasikan bahwa algoritma Nayve Bayes mampu menangani klasifikasi skala besar secara efisien serta mendukung interprestasi awal terhadap sentimen publik secara digital. 3 Evaluasi Kinerja dan Akurasi Mekanisme pengujian kinerja dilakukan dengan memanfaatkan operator Performance (Confusion Matri. dalam RapidMiner. Model klasifikasi Nayve Bayes yang telah dilatih menggunakan 100 komentar berlabel secara manual, kemudian diterapkan untuk mengklasifikasikan komentar yang belum diberi label. Sistem berhasil memberikan prediksi sentimen terhadap komentar-komentar tersebut, menghasilkan kategori positif dan negatif secara otomatis yang ditunjukkan pada Gambar 6. Gambar 6. Hasil Pelabelan Sentimen Otomatis terhadap Komentar YouTube menggunakan Nayve Bayes Gambar ini memperlihatkan komentar-komentar yang sebelumnya tidak memiliki label kini telah diklasifikasikan secara otomatis. Kolom prediction. menunjukkan sentimen hasil prediksi, sementara kolom confidence menggambarkan tingkat kepercayaan model terhadap masing-masing prediksi. Seluruh komentar pada tahap ini merupakan data uji yang diproses setelah pelatihan selesai dilakukan. Untuk menilai efektivitas klasifikasi, sistem menghasilkan confusion matrix yang mencakup kinerja prediksi untuk masing-masing kelas. Hasilnya ditampilkan pada Tabel 4. Tabel 4. Confusion Matrix Hasil Evaluasi Model Nayve Bayes terhadap Komentar YouTube Confusion matrix ini menunjukkan bahwa model mampu mengenali sentimen negatif dengan tingkat recall 100%, sedangkan performa terhadap sentimen positif masih sangat Analisis Sentimen terhadap a. Nhadya Vita Loca e-ISSN: 2685-0877 rendah dengan precision dan recall masing-masing 0%. Akurasi keseluruhan sistem tercatat 67%, yang mencerminkan ketimpangan distribusi data latih atau bias pada kelas tertentu selama pelatihan. Hasil ini mengindikasikan bahwa Nayve Bayes dapat bekerja baik untuk kasus dengan pola yang kuat pada satu kelas . alam hal ini negati. , namun akurasi keseluruhan masih dapat Peneliti menyarankan penambahan jumlah data latih secara proporsional, khususnya untuk komentar positif, agar model memiliki representasi yang lebih seimbang. 4 Pembahasan dan Relevansi Hasil Hasil klasifikasi sentimen terhadap komentar-komentar YouTube yang membahas figur publik Dedy Mulyadi menunjukkan bahwa algoritma Nayve Bayes mampu melakukan pelabelan otomatis berdasarkan pola polaritas sentimen yang telah dipelajari dari training data. Sistem klasifikasi berhasil mengelompokkan komentar ke dalam dua kategori utama, yaitu sentimen positif dan negatif, sebagaimana divisualisasikan pada Gambar 5. Temuan ini menguatkan bahwa pendekatan supervised learning efektif digunakan untuk menangkap dan menganalisis opini digital masyarakat terhadap tokoh publik secara efisien. Evaluasi performa model, yang ditampilkan melalui Gambar 6, mengungkap bahwa klasifikasi terhadap komentar negatif menunjukkan tingkat akurasi tinggi, dengan recall mencapai 100% dan precision sebesar 66. Namun, kemampuan model dalam mengenali komentar positif masih sangat terbatas, dengan precision dan recall masing-masing 0%, dan akurasi total sebesar 66. Ketimpangan ini mengindikasikan bahwa model cenderung bias terhadap satu kelas dominan, yang kemungkinan besar disebabkan oleh komposisi data latih yang belum seimbang. Dalam konteks penelitian ini, performa Nayve Bayes tetap menunjukkan efektivitas sebagai algoritma yang ringan dan mudah diimplementasikan, khususnya untuk klasifikasi teks Hasil ini memiliki relevansi langsung terhadap tujuan awal penelitian, yaitu memahami kecenderungan opini publik terhadap Dedy Mulyadi secara digital, dan dapat digunakan sebagai masukan bagi tim komunikasi publik untuk membaca suara masyarakat. Pembahasan lebih lanjut menunjukkan bahwa temuan penelitian ini memberikan kontribusi penting dalam memperkuat dan mengintegrasikan temuan penelitian terdahulu mengenai performa algoritma Nayve Bayes dalam klasifikasi ulasan teks pendek, seperti dalam . Secara khusus, hasil ini mendukung dan memperluas temuan Kevin. Margareta Enjeli, dan Andri Wijaya . , yang membuktikan bahwa Nayve Bayes efektif dalam mengklasifikasikan ulasan aplikasi Android dari Google Play Store ke dalam tiga kategori sentimen. Penelitian ini memperkuat argumen tersebut dengan menunjukkan bahwa Nayve Bayes tetap mampu melakukan klasifikasi yang relevan meskipun hanya dua kategori . ositif dan negati. dan pada data komentar YouTube bersifat informal, singkat, dan mengandung slang. Temuan ini juga konsisten dengan studi oleh Ilmawan & Mude . , yang dalam konteks ulasan Google Play Store, menemukan bahwa Nayve Bayes memiliki performa kompetitif dibanding SVM, terutama ketika data latih berkualitas dan represntatif. Dalam penelitian ini, meskipun akurasi keseluruhan terbatas oleh class imbalance, algoritma tetap mampu mendeteksi sentimen negatif dengan recall 100%, yang menujukkan bahwa Nayve Bayes efektif dalam mengenali pola yang kuat, meskipun pada data tidak seimbang temuan yang selaras dengan karakteristik algoritma ini dalam literatur NLP. Selain itu, hasil ini melengkapi temuan Joy Lawa Rizky dan Windu Gata . , yang menujukkan bahwa Bidirectional-LSTM mencapai akurasi lebih tinggi . dibanding Nayve Bayes . dalam analisis sentimen di YouTube. Penelitian ini tidak menyangkal superioritas deep learning, tetapi menegaskan bahwa Nayve Bayes tetap menjadi alternatif yang valid dan praktis, terutama untuk penelitian dengan sumber daya terbatas, waktu singkat, atau kebutuhan akan tranparansi model. Hal ini sejalan dengan prinsip OccamAos Razor dalam pemodelan: model yang lebih sederhana sering kali cukup memadai untuk konteks tertentu, selama diimbangi dengan proses pra-pemrosesan yang baik. Dengan demikian, penelitian ini berkontribusi pada pengembangan bidang analisis sentimen dengan menujukkan bahwa Nayve Bayes tetap relevan sebagai algoritma dasar, khususnya dalam konteks komunikasi politik digital di Indonesia, di mana kebutuhan akan analisis cepat dan interpretable sangat tinggi. Integrasi temuan ini ke dalam ranah ilmu NLP menunjukkan bahwa pendekatan klasik masih memiliki tempat, terutama sebagai baseline model atau solusi awal sebelum beralih ke pendekatan yang lebih kompleks. Progresif: Vol. No. Agustus 2025: 874-884 Progresif e-ISSN: 2685-0877 Sebagai tindak lanjut, disarankan: Menambah volume dan keragaman data pelatihan untuk pelatihan untuk memperbaiki keseimbangan kelas. Studi oleh . menujukkan bahwa peningkatan jumlah data latih secara proporsional dapat meningkatkan akurasi hingga 10-15%. Menerapkan k-fold cross-validation untuk meningkatkan reliabilitas model. Pendekatan ini telah terbukti efektif dalam mengurangi overfitting dan meningkatkan generalisasi, seperti dilaporkan oleh Aulia & Patriya . Mengkesplorasi pendekatan alternatif seperti Bidirectional-LSTM atua Word2Vec, khususnya untuk menangkap konteks semantik yang kompleks. Rizky & Gata . membuktikan bahwa model deep learning mampu mencapai akurasi >85% pada data YouTube, meskipun memerlukan sumber daya lebih besar. Dengan strategi-strategi tersebut, analisis sentimen dapat dioptimalkan sebagai dasar perumusan kebijakan komunikasi politik yang lebih responsif, akurat, dan berbasis data empiris. Simpulan Berdasarkan hasil penelitian, algoritma Nayve Bayes terbukti mampu melakukan klasifikasi sentimen terhadap komentar YouTube yang membahas figur publik Dedy Mulyadi, dengan tingkat akurasi sebesar 66,67%. Model menunjukkan performa optimal dalam mendeteksi sentimen negatif . ecall 100%), namun kurang efektif dalam mengidentifikasi sentimen positif . recision dan recall 0%), yang mengindikasikan adanya ketidakseimbangan pada data latih. Penelitian ini berkontribusi terhadap pemanfaatan teknik analisis sentimen berbasis machine learning dalam menelaah opini publik pada platform digital, terutama YouTube. Meskipun hasil klasifikasi menunjukkan efektivitas pendekatan algoritmik, penelitian ini masih menghadapi kendala berupa potensi bias klasifikasi yang disebabkan oleh distribusi data yang tidak seimbang. Daftar Referensi . Sari and G. Mahalisa. AuNaive Bayes Classifier Untuk Deteksi Email Spam,Ay Technol. Ilm. , vol. 15, no. 4, pp. 675-684, 2024, doi: 10. 31602/tji. Alita and A. Isnain. AuPendeteksian Sarkasme pada Proses Analisis Sentimen Menggunakan Random Forest Classifier,Ay J. Komputasi, vol. 8, no. 2, pp. 50Ae58, 2020, doi: 23960/komputasi. Prastyo. Irawan, and I. Mursyidin. AuKlasifikasi Sentimen Komentar YouTube dengan NLP pada Debat Pilkada Banten 2024,Ay bit-Tech, vol. 7, no. 2, pp. 413Ae421, 2024, doi: 10. 32877/bt. Nugroho and A. Yulison Herry Chrisnanto. AuAnalisis Sentimen pada Jasa Ojek Online,Ay Pros. Sains A, 156Ae161, [Onlin. Available: https://publikasiilmiah. id/PROSIDING_SNST_FT/article/view/1526https:// id/index. php/PROSIDING_SNST_FT/article/download/1526/16 . Alfandi Safira and F. Hasan. AuAnalisis Sentimen Masyarakat Terhadap Paylater Menggunakan Metode Naive Bayes Classifier,Ay Zo. Sist. Inf. , vol. 5, no. 1, pp. 59Ae70, 2023, doi: 10. 31849/zn. Duei Putri. Nama, and W. Sulistiono. AuAnalisis Sentimen Kinerja Dewan Perwakilan Rakyat (DPR) Pada Twitter Menggunakan Metode Naive Bayes Classifier,Ay J. Inform. dan Tek. Elektro Terap. , vol. 10, no. 1, pp. 34Ae40, 2022, doi: 23960/jitet. Kevin. Enjeli, and A. Wijaya. AuAnalisis Sentimen Pengunan Aplikasi Kinemaster Menggunakan Metode Naive Bayes,Ay J. Ilm. Comput. Sci. , vol. 2, no. 2, pp. 89Ae98, 2024, doi: 10. 58602/jics. Rizky and W. Gata. AuAnalisis Sentimen Media Sosial Youtube Kereta Cepat (Whoos. Menggunakan Algoritma Bidirectional-LSTM,Ay Progresif J. Ilm. Komput. , vol. 20, no. 2, p. 748, 2024, doi: 10. 35889/progresif. Ilmawan and M. Mude. AuPerbandingan Metode Klasifikasi Support Vector Machine dan Nayve Bayes untuk Analisis Sentimen pada Ulasan Tekstual di Google Play Store,Ay Ilk. Ilm. , vol. 12, no. 2, pp. 154Ae161, 2020, doi: 10. 33096/ilkom. Batuallo. Mewengkang, and D. Kaparang. AuKlasifikasi Pencapaian Nilai Analisis Sentimen terhadap a. Nhadya Vita Loca e-ISSN: 2685-0877 Mahasiswa Berdasarkan Jenis Mata Kuliah Menggunakan Algoritma Naive Bayesian Classifisier,Ay Edutik J. Pendidik. Teknol. Inf. dan Komun. , vol. 3, no. 4, pp. 499Ae511, 2023, doi: 10. 53682/edutik. Zufria. Lubis, and S. Febiyaula. AuAnalisis Sentimen Kepercayaan Masyarakat Terhadap Kepolisian Republik Indonesia Menggunakan Algoritma Svm,Ay J. Sci. Soc. Res. 4307, no. 3, pp. 1266Ae1272, 2024, [Onlin. Available: http://jurnal. php/JSSR . Andriansyah and P. Astuti. AuAnalisis Sentimen Komentar Konten Edukatif Di Instagram Dengan Metode Nayve Bayes Dan Support Vector Machine,Ay IMTechno J. Ind. Manag. Technol. , vol. 6, no. 1, pp. 27Ae31, 2025, [Onlin. Available: http://jurnal. php/imtechno . Ayuningtyas and W. Yustanti. AuSemi-Supervised Learning pada Pelabelan dalam Klasifikasi Multi-Label Data Teks,Ay J. Informatics Comput. Sci. , vol. 6, no. 01, pp. 240Ae248, 2024, doi: 10. 26740/jinacs. Alfiyanti. AuPerbandingan Penerapan Metode Association Rules Menggunakan Algoritma Apriori dan Fp-Growth Untuk Mengetahui Pola Pembicaraan Masyarakat Indonesia Terkait Radikalisme Twitter,Ay Repository. Uinjkt. Ac. Id, [Onlin. Available: https://repository. id/dspace/handle/123456789/73647 . Aulia and E. Patriya. AuImplementasi Lexicon Based Dan Naive Bayes Pada Analisis Sentimen Pengguna Twitter Topik Pemilihan Presiden 2019,Ay J. Ilm. Inform. Komput. , vol. 24, no. 2, pp. 140Ae153, 2019, doi: 10. 35760/ik. Triana. P Sari. Bahtiar, & E. Wahyudin, "Implementasi Algoritma Nayve Bayes Untuk Klasifikasi Sentimen Ulasan Pengguna KAI Access". Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi, vol. 14, no. 1, pp. 12-21, 2025. Progresif: Vol. No. Agustus 2025: 874-884