[E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
ANALISIS SENTIMEN PUBLIK INDONESIA TERHADAP KONFLIK ISRAEL-IRAN DI MEDIA SOSIAL
MENGGUNAKAN INDOBERT DAN EXPLAINABLE AI
(LIME)
Agus Sehatman Saragih a,1,*.
Deddy Ronaldo b,2.
Ade Chandra Saputra c,3 a,b,c Universitas Palangka Raya.
Kampus UPR Tanjung Nyaho.
Jl.
Yos Sudarso Palangka Raya.
Kalimantan Tengah 1 assaragih@it.
2 deddy.
ronaldo@it.
3 adechandra@it.
* corresponding author
ARTICLE INFO
ABSTRACT .
PT)
Keywords Israel-Iran.
IndoBERT, explainable AI.
LIME This study analyzes Indonesian public sentiment toward the IsraelAeIran conflict on social media using a fine-tuned IndoBERT model and Explainable AI (XAI) techniques based on LIME.
Data were collected from YouTube and X (Twitte.
between April 2024 and June 2025, yielding 7,922 unique entries that were preprocessed and automatically The IndoBERT model achieved an accuracy of 74.
90% and an F1-score of 0.
7521 on the test set .
= 1,.
LIME-based interpretations reveal trigger words such as AuzionistAy .
and Auallahu akbarAy .
, indicating opinion polarization driven by antiZionist narratives and religious solidarity.
This approach enhances the transparency of black-box models and provides insights for public opinion monitoring.
The findings contribute to Indonesian NLP and geopolitical analysis, with limitations related to the quality of automatic The results are consistent with studies on the IsraelAe Palestine conflict showing dominant negative sentiment on social Similar analyses using BERT for Reddit discussions highlight the importance of hybrid approaches for stance.
The integration of XAI techniques such as LIME has been shown to be effective in explaining sentiment predictions.
Therefore, this methodology enriches the understanding of opinion dynamics in sensitive geopolitical contexts.
Pendahuluan Konflik IsraelAeIran telah berlangsung sejak Revolusi Iran tahun 1979 dan melibatkan ketegangan geopolitik yang kompleks, khususnya terkait isu nuklir, militer, dan ideologis di kawasan Timur Tengah .
Eskalasi terkini, termasuk serangan Iran pada April 2024 dan respons Israel pada Oktober 2024, memicu diskusi global di media sosial yang mencerminkan dinamika opini publik internasional .
Media sosial berperan penting sebagai ruang diskursif, di mana masyarakat mengekspresikan pandangan politik, ideologis, dan emosional terhadap konflik bersenjata modern.
Platform seperti YouTube dan X .
ebelumnya Twitte.
menjadi kanal utama bagi masyarakat untuk menyampaikan reaksi spontan terhadap konflik IsraelAeIran.
Diskursus tersebut kerap dipengaruhi oleh faktor religius dan politik domestik, yang memperkuat narasi solidaritas terhadap Palestina dan Iran .
Konflik ini telah menyebabkan ratusan korban sipil di kedua belah pihak serta kerusakan infrastruktur strategis, termasuk fasilitas nuklir Iran.
Hingga Desember 2025, ketegangan dilaporkan tetap tinggi, dengan indikasi bahwa Iran mempersiapkan kemungkinan perluasan konflik regional apabila Israel kembali melakukan serangan terhadap Hezbollah.
Dalam konteks Indonesia, sentimen publik yang berkembang di media sosial menunjukkan kecenderungan kuat anti-Israel, sering kali dikaitkan dengan isu kemanusiaan dan pengalaman konflik lokal.
Analisis sentimen berbasis pemrosesan bahasa alami (Natural Language Processing/NLP) merupakan pendekatan efektif untuk mengukur opini publik dalam skala besar.
Namun, model deep learning seperti Bidirectional Encoder Representations from Transformers (BERT) bersifat black-box, sehingga sulit untuk diinterpretasikan secara transparan .
Penelitian sebelumnya menunjukkan bahwa BERT unggul dalam menangkap konteks dua arah dan nuansa semantik dalam teks, tetapi https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
kekurangan aspek keterjelasan dalam proses pengambilan keputusan model .
Pendekatan Explainable Artificial Intelligence (XAI), seperti Local Interpretable Model-agnostic Explanations (LIME) .
dan SHapley Additive exPlanations (SHAP) .
, dikembangkan untuk mengatasi keterbatasan tersebut dengan memberikan penjelasan lokal terhadap prediksi model.
Meski demikian, integrasi antara IndoBERTAiadaptasi BERT untuk bahasa IndonesiaAidan metode XAI, khususnya LIME, masih jarang diterapkan dalam konteks konflik geopolitik internasional.
Hal ini menjadi celah penelitian, terutama pada analisis opini publik Indonesia yang bersifat polar antara kelompok pro-Palestina/Iran dan pro-Israel .
Penelitian ini bertujuan untuk: .
mengklasifikasikan sentimen masyarakat Indonesia terhadap konflik IsraelAeIran berdasarkan data media sosial, .
mengevaluasi kinerja model IndoBERT dalam tugas klasifikasi sentimen, dan .
menginterpretasikan hasil prediksi menggunakan LIME guna memperoleh wawasan yang transparan dan dapat dipertanggungjawabkan.
Hipotesis penelitian ini adalah bahwa sentimen publik Indonesia didominasi oleh sentimen negatif terhadap Israel, dengan faktor religius berperan signifikan dalam membentuk polarisasi opini.
Penelitian ini berkontribusi pada pengembangan metodologi NLP yang transparan untuk analisis opini geopolitik serta memberikan landasan empiris bagi pembuat kebijakan dalam merespons dinamika opini publik berbasis media sosial .
Studi sebelumnya terkait konflik IsraelAePalestina menunjukkan dominasi sentimen negatif menggunakan pendekatan CNN pada data Twitter .
Selain itu, pendekatan hybrid BERTAeVADER terbukti efektif dalam mendeteksi polarisasi opini pada platform Reddit .
Dalam konteks Indonesia.
IndoBERT telah berhasil digunakan untuk analisis sentimen Pemilu 2024 dengan kemampuan menangkap nuansa bahasa lokal .
Integrasi XAI seperti LIME menjadi aspek krusial untuk meningkatkan transparansi dan kepercayaan terhadap hasil analisis sentimen .
Temuan penelitian ini juga selaras dengan survei yang menunjukkan dukungan kuat masyarakat Indonesia terhadap Palestina.
Metodologi Penelitian Penelitian ini mengadopsi pendekatan kuantitatif dengan menggunakan analisis sentimen berbasis kecerdasan buatan untuk mengukur dan mengklasifikasikan sentimen publik terhadap konflik IsraelIran yang tercermin di media sosial.
Pendekatan kuantitatif dipilih karena memungkinkan pengolahan data besar dan memberikan hasil yang dapat diukur dan dianalisis secara statistik.
Dalam penelitian ini, data yang dikumpulkan berupa teks dari platform media sosial seperti Twitter yang akan dianalisis untuk mengetahui perasaan dan opini masyarakat terhadap berbagai peristiwa besar dalam konflik Israel-Iran.
Tahapan metode penelitian ditunjukkan pada Gambar 1.
https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Gambar 1.
Metode penelitian Penelitian ini dimulai dengan proses pengumpulan data melalui teknik scraping pada dua platform media sosial, yaitu X (Twitte.
dan YouTube.
Data yang dikumpulkan berupa komentar dan teks relevan yang mencerminkan opini atau respon pengguna terhadap topik tertentu.
Seluruh data yang berhasil diperoleh kemudian dihimpun dalam satu dataset sebagai fondasi utama untuk proses analisis Setelah dataset terkumpul, dilakukan tahap preprocessing yang bertujuan meningkatkan kualitas dan konsistensi data.
Proses ini mencakup pembersihan teks dari elemen yang tidak relevan seperti URL, emoji, tag HTML, serta karakter khusus lain yang dapat mengganggu proses pemodelan.
Selain itu, dilakukan case folding untuk menyeragamkan seluruh huruf menjadi lowercase, filtering untuk menghilangkan kata-kata umum yang tidak memberikan kontribusi informasi, normalisasi ejaan untuk menyempurnakan penulisan kata tidak baku, dan tokenisasi agar teks dapat dipecah menjadi unitunit yang siap diproses oleh model bahasa.
Setelah data siap, tahap berikutnya adalah pelabelan sentimen menggunakan model RoBERTa (Robustly Optimized BERT Pretraining Approac.
RoBERTa dipilih karena memiliki sejumlah keunggulan signifikan dibandingkan model sejenis.
Model ini dilatih dengan jumlah data yang lebih besar, tanpa penggunaan masking statis seperti pada BERT, serta menggunakan dinamika hyperparameter yang telah dioptimalkan secara lebih agresif.
Keunggulan tersebut membuat RoBERTa lebih stabil, lebih akurat, dan lebih sensitif terhadap konteks pada berbagai jenis teks.
Pada penelitian ini.
RoBERTa berperan melakukan pelabelan awal secara otomatis terhadap data mentah.
Jika diperlukan, anotasi manual juga dilakukan untuk menjamin konsistensi dan akurasi label, terutama pada kasus-kasus ambigu.
Hasil pelabelan kemudian dianalisis melalui visualisasi distribusi sentimen guna melihat proporsi data positif, negatif, dan netral serta mendeteksi adanya ketidakseimbangan kelas.
Tahap berikutnya adalah fine-tuning terhadap model IndoBERT-base-uncased, yaitu model BERT yang dirancang khusus untuk bahasa Indonesia.
Pemilihan IndoBERT didasari oleh keunggulannya dalam memahami struktur morfologi, gaya bahasa, dan konteks khas bahasa Indonesia yang sulit ditangani oleh model multibahasa.
Selain itu.
IndoBERT dilatih dengan dataset yang sangat luas untuk bahasa Indonesia sehingga mampu menghasilkan representasi semantik yang lebih tajam dan akurat.
Proses fine-tuning dilakukan setelah dataset dibagi menjadi data latih dan data uji.
Mengingat distribusi data sering kali tidak seimbang, penelitian ini menerapkan metode class-weighted cross-entropy untuk memberi bobot tambahan pada kelas minoritas.
Langkah ini penting untuk menghindari bias model terhadap kelas yang jumlah datanya dominan.
Setelah fine-tuning selesai, model dievaluasi menggunakan metrik seperti akurasi, precision, recall, dan F1-score untuk menilai performa prediksi secara menyeluruh.
Tahap selanjutnya adalah penerapan Explainable AI (XAI) menggunakan metode Local Interpretable Model-agnostic Explanations (LIME).
LIME digunakan untuk menjelaskan alasan di balik prediksi model dengan mengidentifikasi kata atau fitur yang memiliki kontribusi terbesar.
Penggunaan LIME memberikan nilai tambah berupa transparansi model, sehingga prediksi tidak hanya akurat tetapi juga dapat dipertanggungjawabkan dan mudah dipahami.
Hasil interpretasi ini kemudian dianalisis kembali untuk memastikan bahwa keputusan model selaras dengan konteks yang sebenarnya.
Rangkaian proses ini diakhiri dengan penarikan kesimpulan serta rekomendasi untuk penelitian Dengan penggunaan kombinasi RoBERTa untuk pelabelan awal dan IndoBERT untuk finetuning, penelitian ini memanfaatkan dua model berbasis transformer yang terbukti unggul dalam pemahaman konteks, generalisasi, serta performa analisis sentimen pada teks berbahasa Indonesia.
https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Hasil dan Pembahasan Scrapping Data Pengumpulan data primer dalam penelitian ini dilakukan melalui teknik scraping pada dua platform media sosial utama yang banyak digunakan oleh publik Indonesia, yaitu YouTube dan X .
ulunya Twitte.
Pemilihan kedua platform ini didasarkan pada karakteristik interaksi penggunanya yang berbeda namun saling melengkapi: YouTube menyediakan komentar panjang, naratif, dan bersifat reflektif dengan konteks video berita, sedangkan X menawarkan opini singkat, spontan, dan sering kali viral melalui hashtag dan retweet.
Kombinasi keduanya memungkinkan representasi yang lebih holistik terhadap dinamika sentimen publik Indonesia terhadap isu konflik Israel-Iran.
Semua data dari kedua platform digabungkan ke dalam satu dataframe dengan kolom terstandar:
Penulis .
Komentar .
eks asl.
Jumlah_Suka.
Tanggal, dan File_Sumber .
ntuk membedakan YouTube vs X).
Total 7.
922 entri unik berhasil dikumpulkan setelah proses deduplikasi berdasarkan kemiripan teks menggunakan Levenshtein distance (< 90%) dan penghapusan komentar bot .
anjang < 10 karakter atau berisi URL promos.
Platform YouTube X (Twitte.
Total Tabel 1.
Ringkasan Hasil Pengumpulan Data Sumber Akun/Media Video/Tweet Awal CNN Indonesia.
Kompas TV, dll Pencarian kata kunci 12 video .
512 komenta.
000 tweet 512 entri Data Unik 512 komentar 410 tweet 922 entri 2 Preprocessing Data Tahapan utama preprocessing yang diterapkan dalam penelitian ini meliputi:
Case Folding Seluruh teks diubah menjadi huruf kecil .
untuk menghilangkan sensitivitas terhadap Contoh: AuISRAEL ZIONISAy Ie Auisrael zionisAy.
Pembersihan Elemen Non-Teks Tahap ini bertujuan untuk menghilangkan elemen yang tidak berkontribusi terhadap makna sentimen, dengan rincian sebagai berikut:
URL dihapus menggunakan pola regular expression r'https?://\S .
\S '.
Contoh: AuLihat di sini: https://t.
co/abc123Ay AuLihat di siniAy.
Mention (@usernam.
dihapus menggunakan pola r'@\w '.
Hashtag diproses dengan menghapus simbol # namun mempertahankan kata kunci di belakangnya untuk menjaga konteks analisis.
Contoh: #IsraelIran Ie israeliran.
Emoji dikonversi menjadi representasi teks menggunakan pustaka emoji.
demojize() untuk mempertahankan muatan emosional dalam bentuk token.
Contoh: AuKasian Palestina oaAy Ie Aukasian palestina wajah berdoaAy.
Normalisasi Slang dan Singkatan Normalisasi dilakukan menggunakan kamus slang bahasa Indonesia khusus yang berisi sekitar Contoh normalisasi meliputi:
AugakAy Ie AutidakAy .
AubgtAy Ie AubangetAy .
AuzionisAy Ie dipertahankan sebagai kata kunci domain Proses normalisasi diterapkan melalui fungsi replacement berbasis token untuk meminimalkan kesalahan substitusi .
alse positiv.
Pembersihan Simbol Berlebih dan Spasi .
Tanda baca berulang .
isalnya Au!!!!Ay atau Au.
direduksi menjadi satu karakter.
Spasi berlebih dihapus dan dinormalisasi menjadi satu spasi.
Karakter non-alfanumerik dihapus, kecuali tanda hubung yang merupakan bagian dari istilah majemuk .
isalnya Israel-Ira.
Penghapusan Teks Tidak Informatif https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Komentar dengan panjang kurang dari 10 karakter atau yang hanya berisi angka dan simbol dihapus karena dianggap tidak mengandung informasi sentimen yang bermakna.
Hasil akhir preprocessing disimpan dalam berkas komentar_clean_final.
csv dengan penambahan kolom Komentar_Clean, yang berisi teks bersih siap digunakan pada tahap anotasi sentimen.
Setelah seluruh tahapan preprocessing dan penyaringan diterapkan, diperoleh 7.
562 komentar bersih.
Sebagai bentuk kontrol kualitas, dilakukan evaluasi sebelum dan sesudah preprocessing melalui perbandingan sampel acak serta visualisasi word cloud untuk memastikan bahwa kata-kata bermakna tetap dipertahankan sementara noise berhasil diminimalkan.
Tabel 2 Hasil transformasi preprocesing Teks Mentah Teks Bersih @Budi123 Israel ZIONIS banget!!!! Lihat: https://t.
co/xyz #PerangDunia3 Ya Allah semoga damai oa israel zionis banget lihat perangdunia ya allah semoga damai wajah berdoa Gambar 2 Perbandingan Word Cloud Sebelum dan Sesudah Preprocessing Gambar 2 menunjukkan perbandingan visualisasi word cloud sebelum dan sesudah tahap Pada teks mentah, kata-kata yang tidak bermakna secara semantik seperti URL, mention, hashtag mentah, serta variasi slang masih mendominasi.
Setelah preprocessing, kata-kata dominan menjadi lebih relevan secara kontekstual terhadap isu konflik IsraelAeIran, yang menunjukkan bahwa proses pembersihan teks berhasil menghilangkan noise tanpa menghilangkan informasi penting.
3 Anotasi Data Sentimen Proses anotasi data dalam penelitian ini dilakukan secara otomatis menggunakan model pre-trained berbasis transformer yang telah di fine-tune khusus untuk tugas klasifikasi sentimen bahasa Indonesia, yaitu w11wo/indonesian-roberta-base-sentiment-classifier.
Model berbasis RoBERTa ini digunakan sebagai anotator otomatis awal .
eak supervisio.
untuk menghasilkan label sentimen pada dataset yang belum memiliki anotasi manual.
Seluruh probabilitas keluaran untuk ketiga kelas sentimen (P_NEG.
P_NET, dan P_POS) disimpan sebagai fitur tambahan guna mendukung analisis tingkat kepastian prediksi.
Proses anotasi dilakukan secara batch dengan ukuran batch sebesar 64 dan memanfaatkan akselerasi GPU untuk efisiensi Penerapan preprocessing lanjutan, khususnya normalisasi slang menggunakan kamus slang, turut membantu meningkatkan konsistensi anotasi dengan mengurangi variasi ejaan non-baku pada teks media sosial.
Tabel 3.
Distribusi data sentimen publik konflik israel dan iran
Sentimen
Jumlah Persentase (%) NEGATIF
NETRAL
POSITIF
Total 4 Pemodelan Sentimen dengan Finetuning IndoBERT Data yang digunakan pada tahap pemodelan berasal dari 7.
562 komentar bersih hasil preprocessing dan anotasi otomatis.
Setelah dilakukan pembersihan lanjutan .
enghapusan nilai kosong, label tidak valid, dan duplikasi tek.
, seluruh data dinyatakan valid dan digunakan dalam proses https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Pembagian data dilakukan menggunakan strategi stratified split dengan rasio 80:20 untuk memastikan proporsi kelas sentimen tetap terjaga pada data latih dan data uji.
Pendekatan ini penting untuk meminimalkan bias akibat ketidakseimbangan kelas, khususnya pada kelas POSITIF yang memiliki frekuensi relatif lebih rendah.
Pembagian data dilakukan dengan strategi stratified split .
asio 80:.
untuk memastikan proporsi kelas tetap terjaga pada kedua subset.
Hal ini penting untuk mencegah bias akibat distribusi kelas yang tidak seimbang, terutama pada kelas POSITIF yang memiliki frekuensi terendah.
Distribusi data latih ditunjukkan pada tabel 4.
Tabel 4.
Distribusi pembagian data latih dan data ujirsitekturr dan konfigurasi model Dataset Negatif Netral Positif Total Latih .
%) Uji .
%) Total Model dasar yang digunakan adalah IndoBERT-base-uncased, sebuah model transformer dengan 12 lapisan encoder yang dilatih pada korpus IndoLEM (Wikipedia, berita, dan teks web berbahasa Indonesi.
Spesifikasi model ditunjukkan pada Tabel 5.
Tabel 5.
Arsitektur Model IndoBERT Komponen Spesifikasi Arsitektur Dimensi Tersembunyi Jumlah Parameter Korpus Pelatihan 12-layer Transformer 110 juta IndoLEM (Wikipedia.
Berita.
We.
Pada tahap finetuning, lapis klasifikasi teratas .
lassification hea.
diganti dengan lapisan baru yang terdiri dari 3 neuron output sesuai jumlah kelas sentimen (NEGATIF.
NETRAL.
POSITIF).
Proses pelatihan dilakukan dengan konfigurasi hiperparameter pada table 6.
Tabel 6.
Distribusi data sentimen publik konflik israel dan iran Parameter Nilai Max sequence length Batch size Learning rate Optimizer Epoch maksimum Weight decay Warmup steps Learning rate scheduler Mixed precision (FP.
Early stopping Class-weighted loss
256 token
5 y 10a
AdamW
0,01
Cosine with restarts Aktif Aktif Aktif 1 Penanganan Ketidakseimbangan Kelas Untuk mengatasi ketidakseimbangan kelas, diterapkan class-weighted cross-entropy loss dengan bobot yang dihitung menggunakan metode balanced:
Tabel 7.
Bobot kelas Sentimen
Bobot
NEGATIF
NETRAL
POSITIF
Bobot ini memberikan penalti lebih besar pada kesalahan prediksi kelas minoritas (POSITIF), sehingga mendorong model untuk lebih memperhatikan pola-pola langka.
2 Pelatihan Proses pelatihan model dilakukan menggunakan framework Hugging Face Transformers (Trainer API) pada lingkungan Google Colab Pro dengan dukungan akselerasi GPU NVIDIA T4.
Model IndoBERT dilatih menggunakan data latih hasil anotasi otomatis.
https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Epoch Tabel 8.
Performa model pada validatio set epoch Training Loss Validation Loss Akurasi F1-Score Tertimbang 0,7131 0,6457 0,4552 0,3277 0,7076 0,5778 0,6829 0,8076 0,7074 0,7537 0,7603 0,7471 0,7083 0,7522 0,7578 0,7495 Hasil pelatihan menunjukkan bahwa validation loss mencapai nilai minimum pada epoch ke-2, kemudian meningkat pada epoch ke-3 dan ke-4.
Pola ini mengindikasikan bahwa model mulai mengalami kecenderungan overfitting setelah epoch ke-2, meskipun training loss terus menurun.
Oleh karena itu, mekanisme early stopping diaktifkan, dan model terbaik dipilih berdasarkan nilai validation loss terendah, yaitu pada checkpoint epoch ke-2.
3 Validasi Model dievaluasi menggunakan metrik akurasi.
F1-score .
eighted F.
, serta nilai loss pada data Penggunaan F1-score tertimbang dipilih untuk memberikan gambaran performa yang lebih representatif mengingat distribusi kelas sentimen yang tidak sepenuhnya seimbang.
Model Tabel 9.
Performa model indobert pada data uji Akurasi F1-Score IndoBERT Finetuned (GPU ClassWeighted Los.
Evaluasi lebih lanjut terhadap performa model IndoBERT hasil finetuning dilakukan menggunakan confusion matrix pada data uji independen yang tidak pernah digunakan selama proses pelatihan maupun validasi .
= 1.
Gambar 3 Heatmap Confusion Matrix Model IndoBERT Hasil Finetuning pada Data Uji .
= 1.
Untuk melengkapi visualisasi heatmap pada gambar 3.
Gambar 4 menyajikan confusion matrix dalam bentuk numerik beserta ringkasan metrik klasifikasi berupa precision, recall, dan F1-score pada masing-masing kelas sentimen.
Gambar 4 Confusion Matrix Numerik dan Classification Report Model IndoBERT pada Data Uji https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
5 Interpretasi Model Sentimen dengan LIME Interpretasi dilakukan pada beberapa komentar representatif dari data uji, dengan parameter num_features antara 10 hingga 20 untuk menampilkan token yang paling berpengaruh.
Berdasarkan Tabel X, dapat diamati bahwa pada kelas NEGATIF, token-token yang dominan berkaitan dengan isu politik, konflik, dan ideologi, seperti freedom, democracy, usa, kills, israhell, dan Meskipun secara leksikal kata seperti freedom dan democracy memiliki konotasi positif atau netral, dalam konteks diskursus konflik IsraelAeIran kata-kata tersebut sering digunakan secara sarkastik atau ironis untuk menyampaikan kritik.
Hal ini menyebabkan token-token tersebut berkontribusi kuat terhadap prediksi sentimen negatif.
Pada kelas NETRAL, token seperti israel, law, rights, dan civilians mendominasi.
Token-token ini umumnya muncul dalam komentar yang bersifat informatif, faktual, atau deskriptif, misalnya penyampaian berita, rujukan hukum internasional, atau penjelasan kondisi sipil, tanpa disertai evaluasi emosional yang eksplisit.
Temuan ini menunjukkan bahwa model cenderung mengasosiasikan terminologi institusional dan faktual dengan sentimen netral.
Sementara itu, pada kelas POSITIF, token seperti thank, support, rights, dan freedom menjadi pemicu utama prediksi positif.
Token-token tersebut umumnya muncul dalam konteks ekspresi dukungan politik, solidaritas, atau harapan terhadap pihak tertentu.
Meskipun frekuensi token positif relatif lebih rendah dibandingkan kelas negatif, pola kontribusinya tetap konsisten dan menunjukkan kemampuan model dalam mengenali ekspresi afirmatif.
Secara keseluruhan, agregasi hasil LIME menunjukkan bahwa model IndoBERT tidak hanya mempelajari polaritas kata secara leksikal, tetapi juga mampu menangkap konteks penggunaan kata dalam diskursus konflik geopolitik.
Token yang sama dapat berkontribusi pada kelas sentimen yang berbeda bergantung pada konteks kalimatnya, yang menegaskan kompleksitas analisis sentimen pada topik sensitif berbasis opini publik.
Setiap hasil penjelasan LIME disimpan dalam bentuk file HTML interaktif, sehingga memungkinkan eksplorasi visual terhadap kontribusi kata secara langsung.
Komentar bernuansa religious Pada komentar yang memuat ekspresi religius, model cenderung mengasosiasikannya sebagai sinyal afirmasi/dukungan emosional sehingga meningkatkan probabilitas prediksi ke kelas POSITIF Gambar 5 Hasil Penjelasan LIME untuk Komentar Bernuansa Religius (Aualhamdulillah semoga iran menangA.
Komentar sarkastik atau ejekan Komentar yang mengandung istilah seperti israhell atau frasa ironi terkait freedom dan democracy cenderung didorong kuat ke kelas NEGATIF.
LIME memperlihatkan bahwa token-token tersebut memiliki bobot besar dalam mempengaruhi prediksi Gambar 6 Hasil Penjelasan LIME untuk Komentar Sarkastik (Auzionis penjajah kok masih dibelaA.
Koment Pada komentar yang hanya berisi Beberapa token umum.
LIME menunjukkan bahwa prediksi sering kali didorong oleh kata-kata yang relatif netral seperti possible atau according.
sangat pendek atau generik Pada komentar yang hanya berisi beberapa token umum.
LIME menunjukkan bahwa prediksi sering kali didorong oleh kata-kata yang relatif netral seperti possible atau according.
https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
Kesimpulan Penelitian ini berhasil mengimplementasi dan mengevaluasi sistem analisis sentimen untuk memetakan opini publik Indonesia terhadap konflik IsraelAeIran dengan memanfaatkan model IndoBERT yang difinetune serta pendekatan Explainable AI menggunakan LIME.
Rangkaian proses penelitian meliputi pengumpulan data dari dua platform (YouTube dan X), preprocessing lanjutan .
ermasuk normalisasi slan.
, anotasi otomatis berbasis weak supervision menggunakan RoBERTa, fine-tuning IndoBERT, evaluasi kuantitatif, serta interpretasi keputusan model.
Temuan utama penelitian dapat dirangkum sebagai berikut.
Data dikumpulkan melalui web scraping dari YouTube dan X sehingga diperoleh 7.
922 entri unik.
Setelah pipeline preprocessing diterapkan secara konsisten .
ase folding, pembersihan URL/mention/hashtag, konversi emoji, normalisasi slang dengan kamus A1.
250 entri, reduksi simbol, serta penyaringan teks tidak informati.
, dataset menghasilkan 7.
562 komentar bersih yang siap dianalisis.
Distribusi hasil anotasi otomatis menunjukkan dominasi sentimen NEGATIF .
,3%), diikuti NETRAL .
,0%) dan POSITIF .
,7%), yang menggambarkan kuatnya respons kritik/emosi negatif publik sekaligus tingginya komentar faktual/ambigu yang ditangani melalui kebijakan anotasi konservatif.
Pendekatan weak supervision dapat digunakan untuk membangun data latih sentimen pada domain Anotasi sentimen dilakukan menggunakan w11wo/indonesian-roberta-base-sentimentclassifier sebagai anotator otomatis, dengan kebijakan konservatif berbasis ambang probabilitas (Pmax > 0,60 dan |P_POS Oe P_NEG| > 0,.
sehingga komentar yang ambigu dipetakan ke kelas NETRAL.
Dalam rancangan penelitian ini.
RoBERTa berperan sebagai anotator otomatis, sedangkan IndoBERT adalah model utama yang dilatih menggunakan label hasil anotasi tersebut.
Ketiga, fine-tuning IndoBERT menghasilkan performa yang stabil dan dapat dipertanggungjawabkan pada data uji independen.
IndoBERT-base-uncased difinetune 562 data dengan pembagian stratified split 80:20, menghasilkan data latih 6.
dan data uji 1.
Proses pelatihan dilakukan dengan konfigurasi utama: max length 256 token, batch size 16, learning rate 5y10a, optimizer AdamW, weight decay 0,01, warmup 150, cosine with restarts, mixed precision (FP.
, serta early stopping.
Untuk mengatasi ketidakseimbangan kelas, diterapkan class-weighted cross-entropy loss dengan bobot [NEGATIF=0,83.
NETRAL=0,98.
POSITIF=1,.
Model terbaik dipilih berdasarkan validation loss minimum pada epoch ke-2.
Evaluasi pada data uji menghasilkan akurasi 75,41% dan F1-score tertimbang 0,7521, yang menunjukkan kemampuan generalisasi yang memadai pada data yang tidak pernah dilihat saat Analisis kesalahan memperlihatkan tantangan utama berada pada pembedaan kelas NETRAL dengan kelas lain.
Confusion matrix menunjukkan prediksi benar pada diagonal utama (NEGATIF=523.
NETRAL=336.
POSITIF=.
, namun terdapat pola kesalahan dominan NETRALIeNEGATIF .
yang menandakan kecenderungan model mengasosiasikan kosakata konflik deskriptif sebagai sinyal negatif.
Selain itu, kesalahan POSITIFIeNETRAL .
menunjukkan bahwa dukungan yang implisit .
isalnya doa/harapan tanpa kata evaluatif kua.
sering kali belum cukup kuat dikenali sebagai positif.
Performa kelas menunjukkan recall tertinggi pada NEGATIF .
dan terendah pada NETRAL .
, sehingga aspek ambiguitas dan konteks ganda tetap menjadi batas utama performa model pada domain konflik geopolitik.
Kelima, penerapan LIME berhasil meningkatkan transparansi dan akuntabilitas model.
LIME
menunjukkan bahwa prediksi IndoBERT dipengaruhi token yang relevan secara linguistik dan Secara global, agregasi kata pemicu mengindikasikan bahwa kelas NEGATIF banyak dipengaruhi token bertema konflik/ideologi .
isalnya kills, israhell, iran serta kata bernuansa sarkastik seperti freedom/democrac.
, kelas NETRAL didominasi istilah faktual .
srael, law, rights, civilian.
, sedangkan kelas POSITIF dipicu token dukungan/afirmasi .
hank, support.
Secara lokal, studi kasus menunjukkan: .
komentar bernuansa religius dapat mendorong prediksi POSITIF secara kuat, .
komentar bernada kritik/ejekan dengan istilah https://doi.
org/10.
47111/JTI
Available online at https://e-journal.
id/index.
php/JTI [E-ISSN 2656-0.
[Vol 20 No .
[Januari 2.
ideologis mendorong NEGATIF, dan .
komentar sangat pendek seperti Aumenurut sayaAy cenderung menghasilkan prediksi dengan keyakinan lebih rendah karena minim konteks.
Dengan demikian.
LIME tidak hanya menjadi alat interpretasi teknis, tetapi juga mendukung analisis sosiallinguistik atas dinamika opini publik.
Daftar Pustaka