Jurnal Sistem dan Teknologi Informasi Indonesia p-ISSN 2502-5724 e-ISSN 2541-5735 JUSTINDO Vol.
11 No.
Februari 2026, hal.
http://ejurnal.
id/index.
php/JUSTINDO/index https://doi.
org/10.
32528/justindo.
Analisis Sentimen Kendaraan Listrik Menggunakan Perbandingan Nayve Bayes dan Support Vector Machine Electric Vehicle Sentiment Analysis Using a Comparison of Nayve Bayes and Support Vector Machine Faizah Dian Herawati*1.
Frederik Samuel Papilaya2 Sistem Informasi.
Fakultas Teknologi Informasi.
Universitas Kristen Satya Wacana Sistem Informasi.
Fakultas Teknologi Informasi.
Universitas Kristen Satya Wacana Email: 1682022605@student.
edu, 2 samuel.
papilaya@uksw.
*Penulis Koresponden Received: 17 Januari 2026 Accepted: 28 Januari 2026 Published: 02 Februari 2026 This work is licensed under a Creative Commons Attribution 4.
International License.
Copyright .
2026 JUSTINDO
ABSTRAK
Perkembangan kendaraan listrik di Indonesia memicu berbagai opini dari masyarakat yang sering dibagikan melalui media sosial, terutama X.
Opini tersebut perlu dianalisis untuk bisa memahami bagaimana masyarakat memandang kebijakan serta pelaksanaan kendaraan yang ramah lingkungan.
Penelitian ini bertujuan untuk membandingkan dua jenis algoritma pengklasifikasian teks, yaitu Nayve Bayes dan Support Vector Machine (SVM) dalam melihat opini masyarakat terhadap kendaraan listrik.
dengan menggunakan pendekatan Term FrequencyAeInverse Document Frequency (TF-IDF).
Data yang digunakan adalah tweet dalam bahasa Indonesia yang dikumpulkan melalui proses crawling, lalu melewati beberapa tahap pra-proses seperti cleaning, case folding, normalisasi, tokenizing, stopword removal, dan stemming.
Setelah itu, data diberi label sentimen menjadi tiga kategori, yaitu positif, negatif, dan netral, sebelum diolah menggunakan algoritma Untuk mengevaluasi kemampuan model, digunakan confusion matrix yang menunjukkan performa algoritma berdasarkan nilai akurasi, precision, recall, dan F1-score.
Hasil penelitian menunjukkan bahwa algoritma Nayve Bayes memiliki hasil yang lebih baik dengan akurasi sebesar 92%, sedangkan SVM mencapai akurasi sebesar 76%.
Karena itu, algoritma Nayve Bayes dianggap lebih cocok untuk menganalisis sentimen dari tweet terkait kendaraan listrik di Indonesia.
Kata kunci: Analisis Sentimen.
Kendaraan Listrik.
Nayve Bayes.
Support Vector Machine.
TF-IDF
ABSTRACT
The development of electric vehicles in Indonesia has sparked various opinions from the public, which are often shared on social media, especially X.
These opinions need to be analyzed to understand how the public views the policies and implementation of environmentally friendly vehicles.
This study aims to examine public sentiment toward electric vehicles by comparing two types of text classification algorithms, namely Nayve Bayes and Support Vector Machine (SVM), using the Term FrequencyAeInverse Document Frequency (TFIDF) approach.
The data used is Indonesian-language tweets collected through a crawling process, which then undergoes several pre-processing stages such as cleaning, case folding, normalization, tokenizing, stopword removal, and stemming.
After that, the data was labeled for sentiment into three categories: positive, negative, and neutral, before being processed using a classification algorithm.
To evaluate the model's performance, a confusion matrix was used, which shows the algorithm's performance based on accuracy, precision, recall, and F1-score values.
The research results show that the Nayve Bayes algorithm has better results with an accuracy of 92%, while SVM achieves an accuracy of 76%.
Therefore, the Nayve Bayes algorithm is considered more suitable for analyzing the sentiment of tweets related to electric vehicles in Indonesia.
Keywords: Sentiment Analyst.
Electric Vehicles.
Nayve Bayes.
Support Vector Machine.
TF-IDF JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 Pendahuluan Di Indonesia, sebagai negara dengan jumlah penduduk yang tinggi, membuat kebutuhan masyarakat kian meningkat.
Termasuk dalam bidang teknologi otomotif sehingga mendorong kehadiran kendaraan listrik yang dianggap sebagai solusi terhadap permasalahan harga bahan bakar yang terus meningkat.
Kendaraan listrik dianggap sebagai solusi yang lebih efisien dan lebih baik untuk lingkungan.
Dengan munculnya tren kendaraan listrik, yang muncul sebagai alternatif bagi kendaraan konvensional berbahan bakar fosil.
Karena kendaraan listrik cenderung lebih hemat energi, ramah lingkungan, dan memiliki biaya operasional yang lebih rendah.
Tren ini tidak hanya terjadi karena kebijakan pemerintah dan industri otomotif, tapi juga muncul dalam pembicaraan opini di media sosial dan platform digital, di mana pengguna berbagi pendapat serta pengalaman mereka mengenai kendaraan listrik (Tarigan and Yusupa, 2.
(Kusuma et al.
, 2.
Opini masyarakat terhadap kehadiran teknologi otomotif berupa kendaraan listrik masih terus menjadi perbincangan hingga saat ini.
Opini pengguna media sosial yang terdapat pada aplikasi X menjadi objek analisis untuk melihat berbagai opini mengenai kesan terhadap keberadaan kendaraan listrik, apakah positif atau negatif.
Sebagian besar opini masyarakat pengguna X menghasilkan data teks dengan jumlah besar dan tidak terstruktur.
Data data opini tersebut sulit untuk dianalisis dengan metode manual, sehingga memerlukan suatu pendekatan berbasis machine learning untuk klasifikasi sentimen secara efektif (Hendrawan and Kusmiyati, 2.
Analisis sentimen adalah bagian dari text mining yang bisa digunakan untuk mengklasifikasikan opini seseorang menjadi tiga kategori, yaitu positif, negatif, atau netral, berdasarkan bahasa dan situasi dalam teks (Lende et al.
, 2.
Sebelum melakukan analisis sentimen masyarakat pengguna X terhadap kendaraan listrik, diperlukan pengambilan data pada X.
Data diperoleh dengan crawling data menggunakan auth_token dengan memanfaatkan google collaboratory untuk pengelolaan data dan implementasi algoritma klasifikasi.
Kemudian dilakukan teks praproses dengan menggunakan metode text mining untuk mengolah data tidak terstruktur pada hasil crawling atau scraping agar data menjadi teks struktur dan siap untuk dianalisis menggunakan algoritma text classification.
Melalui data tersebut maka akan disimpulkan tentang opini masyarakat pengguna X terhadap kendaraan listrik.
Beberapa penelitian terdahulu telah mencoba menganalisis sentimen masyarakat terhadap kendaraan listrik di X.
Misalnya, penelitian oleh Agustian et al.
, .
menerapkan algoritma Naive Bayes dan preprocessing sederhana seperti pembersihan teks dan penerjemahan ke bahasa Inggris.
Hasilnya menunjukkan akurasi 80%, dengan presisi 82% dan recal 80% namun penelitian ini belum membandingkan dengan algoritma lain, serta jumlah information yang digunakan relatif sedikit, yaitu hanya 1.
589 tweet.
Di sisi lain.
Prawinata Dian Agus et al.
mengusung pendekatan deep learning dengan menggunakan LSTM dan fitur Word2Vec (CBOW & Skip-Gra.
Dataset-nya lebih besar, yakni 30.
000 tweet, dan hasilnya cukup baik dengan akurasi tertinggi mencapai 85,9%.
Meskipun hasil pendekatan lebih akurat, penelitian hanya menggunakan satu algoritma tanpa membandingkan performa.
Sementara itu, (Merdiansyah et al.
, 2.
memanfaatkan model berbasis transformer, yaitu IndoBERT, yang dilatih khusus untuk Bahasa Indonesia, dengan akurasi mencapai 98Ae99%.
Namun dengan kebutuhan komputasi yang cukup tinggi, pendekatan ini cukup berat dari sisi komputasi, dan belum ada pembanding dengan metode yang lebih ringan seperti TF-IDF Naive Bayes dan SVM, yang lebih realistis untuk implementasi di skala kecil atau pemula.
Berdasarkan dari tiga penelitian terdahulu yang sudah disebutkan, maka penelitian ini menghadirkan pembaruan dengan membandingkan dua algoritma text classification, yaitu Naive Bayes dan SVM, serta menggunakan TF-IDF sebagai pendekatan pada data X terbaru yang berkaitan dengan tweets kendaraan listrik di Indonesia.
Penelitian ini bertujuan untuk mengelompokkan komentar masyarakat menjadi tiga kelas yakni positif, negatif dan netral.
Penggunaan data kontekstual terkini memungkinkan analisis yang lebih akurat terhadap opini publik, khususnya dalam merespons kebijakan pemerintah terkait kendaraan ramah lingkungan.
Selain klasifikasi, penelitian ini juga menganalisis kecenderungan opini berdasarkan tema atau waktu tertentu, yang bertujuan memberikan pemahaman mendalam bagi pengambil kebijakan dan pelaku industri otomotif https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 Metode Penelitian Dalam penelitian ini, algoritma Nayve Bayes dan Support Vector Machine (SVM) digunakan sebagai metode klasifikasi sentimen.
Algoritma Nayve Bayes dipilih karena kemampuannya dalam mengolah data teks berdimensi tinggi.
SVM digunakan sebagai pembanding karena kemampuannya dalam memisahkan kelas data secara optimal.
Tahapan metode penelitian dapat dilihat pada Gambar 1.
Gambar 1.
Tahapan Penelitian Perumusan data Perumusan data penelitian merupakan tahap awal yang bertujuan untuk menentukan karakteristik data yang digunakan dalam penelitian ini.
Data penelitian dirumuskan sebagai tweet berbahasa Indonesia yang memuat opini masyarakat terkait kendaraan listrik di Indonesia.
Setiap tweet ditetapkan sebagai satu unit analisis dan akan diklasifikasikan ke dalam tiga kategori sentimen, yaitu positif, negatif, dan netral.
Selain itu, ditetapkan kriteria data yang digunakan, meliputi relevansi isi tweet terhadap topik penelitian.
Perumusan data ini menjadi dasar dalam analisis sentimen.
Pengambilan data Berdasarkan perumusan data yang telah ditetapkan, pengumpulan data dilakukan untuk memperoleh data mentah yang sesuai dengan kriteria penelitian dengan scraping dari media social X yang menyediakan data tweets opini pengguna terkait kendaraan listrik.
Data yang dikumpulkan berupa teks yang berisi keluhan, pendapat, pengalaman, maupun penilaian terhadap kehadiran kendaraan listrik.
Pengambilan data menggunakan kata kunci yang berkaitan dengan kendaraan listrik, seperti.
Au mobil listrikAy,Aykendaraan ramah lingkunganAy.
Aukendaraan listrikAy, dan Aymotor listrikAy.
Data dibatasi pada tweets berbahasa Indonesia dengan rentang waktu tertentu agar sesuai dengan tujuan penelitian.
Data yang didapatkan masih berupa data mentah dan harus diproses tahap Preprocessing Setelah selesai dalam tahap pengumpulan data dari X data tersebut akan diproses sebelum Tahapan sebelum dilakukan klasifikasi model adalah preprocessing.
Preprocessing data adalah tahap yang wajib dilakukan setelah melakukan scraping data teks dari X.
Tahapan preprocessing yang dilakukan meliputi, cleaning, case folding, normalisasi kata, tokenize, stopword removal, dan stemming.
Pada tahap cleaning, semua bagian teks yang tidak penting akan dibuang, seperti URL, tanda baca, angka, emoji, tagar (#), mention (@), atau karakter lain yang tidak Tujuan dilakukan proses cleaning adalah agar data yang di ambil fokus pada kata yang memiliki makna, dan kata yang tidak relevan dengan topik bisa di kurangi sejak awal sehingga hasil analisis bisa maksimal.
Proses cleaning perlu dilakukan karena dataset hasil dari scraping banyak mengandung kata-kata yang tidak relevan untuk analisis sentimen (Ritonga and Sriani, 2.
Tahapan selanjutnya adalah tahapan case folding, setelah dataset dilakukan tahap cleaning data, semua teks dilakukan tahap case folding, untuk mengubah seluruh data teks menjadi huruf kecil atau lowercase agar kata AuMobil ListrikAy, mobil listrikAy, dan AuMOBIL LISTRIKAy terbaca sebagai kata yang memiliki arti yang sama oleh komputer (Ritonga and Sriani, 2.
Tahapan selanjutnya adalah tahapan normalisasi kata, normalisasi kata adalah proses memperbaiki kata yang tidak sesuai standar, seperti kesalahan menulis, kata kasual, atau singkatan, menjadi bentuk bahasa yang benar dan terstandar dengan bantuan kamus slang.
Karena dataset berasal dari pengguna media sosial, pasti terdapat kalimat yang menggunakan kata tidak baku, slang, atau singkatan seperti "gokil" atau https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 "gw".
Tahap normalisasi ini sangat penting terutama untuk data dari media sosial, karena banyak ditemukan penggunaan bahasa yang tidak formal dan istilah slang yang bisa mengganggu hasil analisis (Rifaldi et al.
, 2.
Tahapan selanjutnya adalah tahapan tokenisasi, yaitu memisahkan kalimat panjang menjadi beberapa kata yang disebut dengan token (Ridwansyah, 2.
Misalnya pada kalimat Aumobil listrik hemat bensinAy menjadi [AumobilAy.
AulistrikAy.
AuhematAy.
AubensinA.
Tahap tokenisasi merupakan tahap penting dalam preprocessing karena komputer tidak bisa menganalisis kalimat secara utuh, token lebih mudah untuk dianalisis dan dimasukan kedalam model klasifikasi machine learning.
Tahapan selanjutnya adalah tahapan stopword removal yaitu tahap penghapusan stopword merupakan proses menghilangkan kata atau token yang tidak berpengaruh terhadap analisis sentimen, seperti konjungsi.
Tujuan dari penghapusan stopword adalah meningkatkan akurasi model dalam memprediksi sentimen dengan menghilangkan kata yang tidak penting dari teks, sehingga model hanya fokus pada kata-kata yang memiliki makna dan berpengaruh.
Dengan mengurangi jumlah kata yang diproses, jumlah fitur berkurang dan proses komputasi menjadi lebih cepat dan efisien (Handaya and Wahyu, 2.
Tahapan selanjutnya adalah tahapan Steaming, setelah teks sudah melalui tahapan cleaning, normalisasi, dan dipecah menjadi token, setiap token biasanya masih dalam bentuk turunan kata.
Stemming menghapus kata imbuhan seperti kata AumenyukaiAy kedalam bentuk dasarnya yaitu AusukaAy.
Tahapan ini membantu mengurangi variasi kata yang memiliki arti sama(Setiawan and Nastiti, 2.
Seluruh tahapan preprocessing dilakukan untuk menghasilkan data teks terstruktur sehingga proses klasifikasi sentimen menjadi maksimal.
Labeling data Setelah melakukan tahap preprocessing, proses selanjutnya adalah proses labeling sentimen, di mana tweet yang telah dikumpulkan akan diberi label.
Setiap tweet diklasifikasikan ke dalam salah satu dari tiga kategori sentimen, yaitu positif, negatif, atau netral.
Proses pelabelan sentimen menggunakan sebuah metode, yaitu lexicon based.
Lexicon based adalah metode pelabelan dataset sentimen dengan bahasa indonesia menggunakan kamus lexicon.
Dalam kamus lexicon terdapat daftar kata negatif dan positif yang digunakan untuk acuan perhitungan bobot dari sebuah Kamus labeling lexicon tersebut bernama lexicon InSet (Asri et al.
, 2.
(Musfiroh, 2.
Ekstraksi fitur TF-IDF Setelah data sentimen sudah melalui tahap labeling, langkah berikutnya adalah ekstraksi fitur, yaitu mengubah teks menjadi bentuk numerik.
Dalam penelitian ini, pendekatan yang digunakan adalah TF-IDF (Term Frequency - Inverse Document Frequenc.
TF-IDF digunakan untuk mengukur seberapa penting suatu kata dalam dokumen dengan mempertimbangkan frekuensi kata dan TF-IDF membantu membuat representasi numerik yang lebih baik dari teks untuk model klasifikasi sehingga hasil prediksi bisa lebih akurat (Lestari and Hutagalung, 2.
Klasifikasi Model Penelitian ini menggunakan dua jenis algoritma klasifikasi model yaitu Nayve bayes dan support vector machine (SVM) dengan python sebagai bahasa pemrograman.
Library sklearn juga digunakan untuk membuat model klasifikasi.
Kedua algoritma klasifikasi tersebut dijelaskan sebagai 1 Klasifikasi Nayve Bayes Nayve bayes merupakan salah satu algoritma klasifikasi sederhana berbasis probabilitas yang sering digunakan dalam melakukan analisis sentimen, terutama pada data teks.
Dalam proses perhitungannya.
Nayve bayes mengasumsikan bahwa setiap fitur bersifat independent setelah diketahui kelasnya, sehingga perhitungannya lebih sederhana dan efisien.
Dengan asumsi tersebut.
Nayve Bayes mampu menangani dataset dalam skala besar terutama ketika dikombinasikan dengan teknik ekstraksi fitur seperti TF-IDF pada data berbasis teks(Permataning Tyas et al.
, 2.
2 Klasifikasi Support Vector Machine SVM Dalam proses klasifikasi.
SVM memiliki kemampuan dalam menangani data yang berdimensi tinggi seperti hasil dari pembobotan dengan TF-IDF.
SVM bekerja dengan mencari hyperplane antara kelas positif, negative, dan netral, sehingga setiap contoh dapat sentiment dan mengukur akurasinya, sehingga menghasilkan klasifikasi yang efektif (Azzahra and Mailoa, 2.
Tahapan klasifikasi dengan Nayve Bayes dan SVM terdapat pada Gambar 2.
https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 Gambar 2.
Tahapan klasifikasi Nayve Bayes dan SVM Evaluasi model Evaluasi model dilakukan untuk mengetahui bagaimana algoritma Nayve Bayes dan Support Vector Machine dalam mengklasifikasikan sentimen dari data uji.
Pada tahap evaluasi model menggunakan confusion matrix untuk membandingkan hasil prediksi model dengan label sentimen sebenarnya, sehingga dapat menghitung beberapa nilai seperti akurasi, precision, recall, dan F1score.
Akurasi menunjukkan seberapa tepat model dalam memberikan prediksi secara keseluruhan, sedangkan precision menggambarkan kemampuan model dalam memprediksi sentimen secara benar, dan recall menggambarkan seberapa baik model dalam menangkap semua kelas sentimen.
F1-score merupakan kombinasi dari precision dan recall yang digunakan untuk menilai keseimbangan antara keduanya.
Hasil dari semua matriks evaluasi tersebut kemudian dibandingkan untuk mengetahui algoritma mana yang lebih baik dalam analisis sentimen terkait kendaraan listrik berdasarkan data yang digunakan.
Hasil dan Pembahasan Perumusan data Penelitian ini berdasarkan pada data yang telah ditetapkan, dengan fokus pada tweet berbahasa Indonesia yang mengandung opini masyarakat terkait kendaraan listrik.
Data yang digunakan mencakup topik seperti kendaraan listrik, mobil listrik, motor listrik, serta kendaraan ramah Dari data mentah hasil pengumpulan, dilakukan proses seleksi dan preprocessing untuk memastikan kesesuaian data dengan tujuan penelitian.
Proses ini menghasilkan data yang digunakan sebagai dasar dalam memprediksi perilaku ekonomi.
Setiap tweet yang telah diproses akan diklasifikasikan ke dalam tiga kategori sentimen, yaitu positif, negatif, dan netral.
Data hasil perumusan ini kemudian digunakan pada tahap analisis sentimen dengan metode TF-IDF serta algoritma Nayve Bayes dan Support Vector Machine (SVM).
Pengambilan data Proses pengambilan data menggunakan informasi dari data tweets dengan crawling data menggunakan auth_token dari X, dan memanfaatkan platform google colaboratory.
Kata kunci yang digunakan untuk pengambilan data adalah menggunakan kata kunci Au kendaraan listrik, mobil listrik, motor listrik, dan kendaraan ramah lingkunganAy dengan jumlah data yang berhasil dikumpulkan berjumlah 3466 tweet terbaru tahun 2023-2025 dengan tweet berbahasa indonesia.
Hasil scraping disimpan dalam file dengan format csv dan masih berupa data mentah, sehingga harus memerlukan tahap preprocessing sebelum dilakukan analisis.
Contoh hasil crawling dapat dilihat pada Tabel 1:
Tabel 1.
Hasil Scraping Hasil Scarping @unpad Jadi kendaraan listrik tetap punya potensi besar.
Tapi harus jalan bareng energi bersih dan reformasi sistem transportasi.
Kalau enggak ya cuma solusi semu.
#NetZero #EnergiBersih #RisetUnpad Apakah Kawan KABAR salah satu pengguna kendaraan listrik (EV)? Bagikan pengalamanmu yang paling berkesan saat mengendarai EV dengan reply post ini! #BicaraSebenTAR #KoalisiIndonesiaBebasTAR #KABAR Seiring dengan melonjaknya permintaan kendaraan listrik Indonesia telah menjadi pemimpin dalam produksi nikel menempatkan Halmahera Morowali dan Konawe Utara di jantung rantai pasokan.
FYI Petrokimia Gresik juga sudah operasikan 201 kendaraan listrik di lingkungan pabrik.
Aksinya bukan main-main! #UjiEmisiGratisPG #HariLingkunganHidup #PetrokimiaGresik #SolusiAgroindustri https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 Hasil Scarping Kendaraan listrik ini punya kapasitas luas tanpa emisi dan biaya operasional yang jauh lebih hemat dibanding mobil niaga konvensional.
Cocok banget buat kamu yang pengen bisnis berkelanjutan.
Preprocessing Setelah dataset hasil scraping digabungkan, dataset akan melakukan tahap preprocessing, karena data hasil scraping merupakan data yang tidak terstruktur.
Dalam preprocessing juga terdapat proses penghapusan data duplikat dan penghapusan data yang kosong.
Hasil preprocessing dapat dilihat pada Tabel 2:
Tahapan Data Tweet Cleaning Case Folding Normalisasi kata Tokenize Stopword Removal Stemming Tabel 2.
Hasil Preprocessing Hasil @unpad Jadi kendaraan listrik tetap punya potensi besar.
Tapi harus jalan bareng energi bersih dan reformasi sistem transportasi.
Kalau enggak ya cuma solusi semu.
#NetZero #EnergiBersih #RisetUnpad Jadi kendaraan listrik tetap punya potensi besar.
Tapi harus jalan bareng energi bersih dan reformasi sistem Kalau enggak ya cuma solusi semu.
jadi kendaraan listrik tetap punya potensi besar.
tetapi harus berjalan bareng energi bersih dan reformasi sistem transportasi.
kalau enggak ya cuma solusi semu.
jadi kendaraan listrik tetap punya potensi besar.
tapi harus jalan bareng energi bersih dan reformasi sistem kalau tidak hanya solusi semu.
adi, kendaraan, listrik, tetap, punya, potensi, besar, tapi, harus, jalan, bareng, energi, bersih, dan, reformasi, sistem, transportasi, kalau, tidak, hanya, solusi, sem.
[ kendaraan, listrik, potensi, besar, jalan, bareng, energi, bersih, reformasi, sistem, transportasi, tidak, hanya, solusi, sem.
kendaraan listrik potensi besar jalan bareng energi bersih reformasi sistem transportasi tidak hanya solusi Labeling data Setelah dilakukan preprocessing, kemudian dilakukan pelabelan dataset dengan menggunakan lexicon based.
Hasil pelabelan dapat dilihat pada Gambar 3:
Gambar 3.
Labeling data Berdasarkan Gambar 3.
Hasil labeling data sentiment menggunakan lexicon based bahwa dari 2743 tweet yang dianalisis, mayoritas data termasuk dalam sentimen positif dengan jumlah 1466 tweet atau sekitar 53,45%.
Hal ini menunjukan bahwa sebagian besar pengguna cenderung memberikan opini yang bersifat positif terhadap kendaraan listrik.
Selanjutnya, sentiment netral berjumlah 651 tweet atau 23,73%, yang menunjukan terdapat opini yang tidak menunjukan kecenderungan sentiment atau emosi tertentu.
Sementara itu, sentimen negatif memiliki jumlah 626 tweet atau sekitar 22,82%, yang menunjukan bahwa adanya kritik atau opini kurang positif terhadap kendaraan Secara keseluruhan, distribusi sentimen ini menunjukkan bahwa persepsi publik terhadap kendaraan listrik cenderung positif, meskipun masih terdapat proporsi sentimen netral dan negatif yang cukup signifikan dan perlu diperhatikan dalam analisis lanjutan.
https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 Pembobotan TF-IDF Tahap selanjutnya adalah tahap pembobotan kata menggunakan pendekatan TF-IDF.
Pendekatan ini dilakukan dengan menggunakan Count-Vectorizer.
Pendekatan Count-Vectorizer digunakan untuk menentukan intensitas kata yang muncul dalam setiap tweet.
Data dibagi menjadi 80% data pelatihan dan 20% data uji sebelum pembobotan kata.
Pemodelan dilakukan menggunakan data pelatihan berdasarkan komentar positif dan negatif.
Pembobotan kata dilakukan dengan menghitung frekuensi kemunculan kata dari setiap teks yang dipresentasikan dalam bentuk vector.
Hasil ekstraksi fitur terdiri dari 4502 data sebagai data latih dan 1125 data sebagai data uji.
Klasifikasi model 1 Klasifikasi model Nayve bayes Hasil klasifikasi sentimen dengan model Naive Bayes menunjukan persentase fi-score.
elas tertinggi, 94%)dengan presentasi recall tertinggi pada kelas positif yaitu 98%.
Persentase presisi tertinggi diperoleh dari kelas negatif dengan nilai 95%.
Secara keseluruhan klasifikasi dengan model Naive Bayes memiliki akurasi keseluruhan sebesar 72%.
Gambar 4.
Menunjukan hasil klasifikasi model menggunakan Nayve Bayes.
Gambar 4.
Hasil klasifikasi naive bayes 2 Klasifikasi Support Vector Machine Hasil klasifikasi sentimen dengan model SVM menunjukan persentase fi-score .
elas tertinggi, 87%) dengan presentasi recall tertinggi pada kelas positif yaitu 88%.
Presentasi presisi tertinggi diperoleh dari kelas positif dengan 85%.
Secara keseluruhan klasifikasi dengan model SVM memiliki akurasi keseluruhan sebesar 76%.
Gambar 5.
Menunjukan hasil klasifikasi model menggunakan Nayve Gambar 5.
Hasil klasifikasi SVM Evaluasi dan visualisasi model Hasil visualisasi perbandingan akurasi algoritma naive bayes dan SVM.
Algoritma naive bayes mendapatkan akurasi sebesar 92%.
Sedangkan SVM mendapatkan akurasi sebesar 76%.
Dari hasil akurasi tersebut dapat dilihat bahwa algoritma Naive Bayes memiliki akurasi lebih tinggi dari algoritma SVM dalam mengklasifikasikan sentiment pada data teks X terkait kendaraan listrik.
Sehingga algoritma Naive Bayes lebih efektif dalam menangani karakterikstik data sentimen yang https://doi.
org/10.
32528/justindo.
JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesi.
Vol.
No.
Februari 2026 memiliki sifat pendek, tidak terstruktur, serta memiliki distribusi kata yang tidak merata.
Gambar 6.
Menunjukan hasil visualisasi perbandingan algoritma:
Gambar 6.
Hasil visualisasi perbandingan algoritma Selain itu, hasil pelabelan sentimen menunjukkan bahwa sentimen positif mendominasi dengan proporsi lebih dari 50%, sementara sentimen netral dan negatif relatif seimbang.
Kondisi ini mendukung kinerja baik algoritma Nayve Bayes yang dikenal stabil pada data dengan distribusi kelas yang tidak sepenuhnya seimbang, serta berbasis probabilistik sederhana menggunakan representasi fitur TF-IDF.
Temuan ini sejalan dengan penelitian Agustian et al.
yang menyatakan bahwa algoritma Nayve Bayes mampu memberikan performa yang baik dalam analisis sentimen X, meskipun pendekatan yang digunakan tidak sepenuhnya sederhana.
Oleh karena itu, hasil penelitian ini menegaskan bahwa metode Nayve Bayes merupakan pendekatan yang efektif dan realistis dalam analisis sentimen pada data media sosial X.
Dengan demikian, pendekatan ini sangat layak untuk dipakai dalam penelitian berskala kecil hingga menengah.
Kesimpulan Berdasarkan hasil penelitian yang telah dilakukan, dapat disimpulkan bahwa penelitian ini berhasil menyajikan pembaruan dengan membandingkan dua algoritma.
Naive bayes dan Support Vector Machine (SVM), dalam mengklasifikasikan sentimen masyarakat terhadap kendaraan listrik di Indonesia menggunakan pendekatan TF-IDF pada data X terbaru.
Dari hasil evaluasi, terlihat bahwa algoritma Nayve Bayes menunjukkan performa yang lebih baik dibandingkan SVM, dengan akurasi sebesar 92%.
Nilai precision, recall, dan F1-score pada Nayve Bayes relatif seimbang di ketiga kelas Pada kelas negatif.
Nayve Bayes mendapatkan precision 0,95, recall 0,91, dan F1-score 0,93.
pada kelas netral, precision 0,94, recall 0,82, dan F1-score 0,87.
sedangkan pada kelas positif, precision 0,91, recall 0,98, dan F1-score 0,94.
Sementara itu, algoritma SVM hanya mencapai akurasi 76% dan menunjukkan performa yang lebih rendah, terutama pada kelas netral.
Temuan ini menunjukkan bahwa Nayve Bayes lebih efektif dalam menangani data teks X pada penelitian ini, serta mampu memberikan gambaran yang lebih akurat mengenai opini publik terhadap kendaraan listrik, yang dapat menjadi pertimbangan bagi pengambil kebijakan serta pelaku industri otomotif di Indonesia.
Daftar Pustaka