PROCESSOR AeVOL. No. Oktober 2025 Laman web jurnal: https://ejournal. id/index. php/processor Jurnal Processor P-ISSN: 1907-6738 | E-ISSN: 2528-0082 Analisis Sentimen Persepsi Publik terhadap Tagar #KaburAjaDulu di Twitter Menggunakan Metode Lexicon-Based dengan Kamus InSet M Zaidan Ali Difyah1*. Eko Arip Winanto 2*. Pareza Alam Jusia 3. Sharipuddin 4 1,2,3 Fakultas Ilmu Komputer. Program Studi Teknik Informatika. Universitas Dinamika Bangsa. Jl. Jend. Sudirman. The Hok. Kec. Jambi Sel. Kota Jambi. Jambi 36138. Indonesia. * Penulis Korespondensi. Email: winanto@unama. AbstrakOe Media sosial kerap menjadi cerminan respons publik terhadap isu sosial dan politik. Twitter, sebagai salah satu platform paling aktif, memfasilitasi percakapan singkat melalui penggunaan hashtag yang mencerminkan sentimen kolektif Penelitian ini bertujuan menganalisis persepsi publik terhadap tagar #KaburAjaDulu di Twitter menggunakan pendekatan lexicon-based dengan kamus InSet (Indonesia Sentiment Lexico. Sebanyak 581 tweet berbahasa Indonesia yang memuat tagar tersebut dikumpulkan pada periode 1 Januari 2025 hingga 8 Mei 2025, kemudian diproses melalui tahapan prapemrosesan teks, yang mencakup case folding, pembersihan karakter khusus, tokenisasi, stopword removal . ermasuk penghapusan kata AukaburajaduluA. , serta lemmatisasi. Setiap tweet dianalisis melalui pencocokan token terhadap entri dalam kamus InSet untuk menghitung skor polaritas, yang kemudian diklasifikasikan ke dalam tiga kategori sentimen: positif, negatif, dan netral. Hasil klasifikasi menunjukkan distribusi sentimen dengan 41,72% negatif, 33,73% netral, dan 24,55% positif. Analisis terhadap kata-kata dominan mengindikasikan bahwa tagar tersebut banyak digunakan untuk mengekspresikan kritik, sarkasme, serta ketidakpuasan publik terhadap isu sosial dan politik nasional. Pendekatan lexicon-based terbukti efisien dalam menganalisis opini publik berbahasa Indonesia karena tidak memerlukan proses pelatihan model . dan mampu memberikan gambaran kuantitatif yang jelas terhadap kecenderungan sentimen masyarakat. Namun demikian, metode ini masih memiliki keterbatasan dalam mengenali konteks sarkasme dan negasi pada bahasa informal yang digunakan di Twitter. Secara keseluruhan, penelitian ini memberikan kontribusi empiris berupa pemetaan persepsi publik terhadap fenomena digital #KaburAjaDulu, sekaligus menjadi pijakan bagi pengembangan metode analisis sentimen yang lebih adaptif dan kontekstual pada studi komunikasi digital di masa mendatang. Kata Kunci: Analisis Sentimen. Twitter. lexicon-Based. Kamus Inset. Google Colaboratory. AbstractOe Social media often reflects public responses to social and political issues. Twitter, as one of the most active platforms, facilitates short conversations through the use of hashtags that reflect the collective sentiment of society. This study aims to analyze public perceptions of the hashtag #KaburAjaDulu on Twitter using a lexicon-based approach with the InSet (Indonesia Sentiment Lexico. A total of 581 Indonesian-language tweets containing the hashtag were collected between January 1, 2025, and May 8, 2025, and then processed through text pre-processing stages, which included case folding, special character cleaning, tokenization, stopword removal . ncluding removal of the word AukaburajaduluA. , and lemmatization. Each tweet was analyzed by matching tokens to entries in the InSet dictionary to calculate a polarity score, which was then classified into three sentiment categories: positive, negative, and neutral. The classification results showed a sentiment distribution of 41. 72% negative, 33. 73% neutral, and 24. 55% positive. Analysis of the dominant words indicates that the hashtag is widely used to express criticism, sarcasm, and public dissatisfaction with national social and political issues. The lexicon-based approach has proven to be efficient in analyzing Indonesian-language public opinion because it does not require model training and is able to provide a clear quantitative picture of public sentiment trends. However, this method still has limitations in recognizing the context of sarcasm and negation in the informal language used on Twitter. Overall, this study provides empirical contributions in the form of mapping public perceptions of the #KaburAjaDulu digital phenomenon, as well as a foundation for the development of more adaptive and contextual sentiment analysis methods in future digital communication studies. Keywords: Sentimen Analysis. Twitter. Lexicon-Based. Inset Lexicon. Google Colaboratory. PENDAHULUAN Media sosial telah berkembang menjadi ruang publik digital yang tidak hanya berfungsi sebagai sarana komunikasi, tetapi juga sebagai wadah penyampaian opini masyarakat terhadap isu sosial, politik, dan ekonomi. Twitter, sebagai salah satu platform dengan pengguna aktif terbanyak di Indonesia, memungkinkan warganet untuk mengekspresikan pandangan mereka secara langsung melalui format teks singkat yang sering kali memuat kritik, sarkasme, maupun dukungan terhadap suatu isu . Fenomena ini menjadi semakin menarik ketika muncul tagar tertentu yang kemudian viral, seperti tagar #KaburAjaDulu, yang mencerminkan respons publik terhadap kondisi sosial-politik nasional . Analisis sentimen muncul sebagai salah satu metode yang relevan untuk https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 mengkaji opini publik di media sosial. Analisis ini berfungsi untuk mengelompokkan opini ke dalam kategori positif, negatif, atau netral, sehingga dapat memberikan gambaran umum tentang sikap kolektif masyarakat terhadap suatu fenomena . Pendekatan ini sangat penting karena opini publik yang diekspresikan di media sosial sering kali berimplikasi terhadap dinamika sosial dan kebijakan publik . Beberapa penelitian terdahulu telah menerapkan metode analisis sentimen di media sosial dengan berbagai Misalnya, penelitian yang dilakukan oleh Kusumaningsih dkk. menganalisis sentimen komentar di Twitter terkait pemilu dengan bantuan tool MonkeyLearn, dan hasilnya menunjukkan kemampuan analisis sentimen untuk memetakan kecenderungan opini politik masyarakat . Penelitian lain oleh Larasati dkk. ulasan aplikasi Dana menggunakan metode Random Forest, yang meskipun akurat namun memerlukan data latih dalam jumlah besar . Penelitian berbasis lexicon-based juga banyak dilakukan. Bagas dkk. menerapkan metode ini untuk menganalisis sentimen pengguna Twitter terhadap kinerja ISP di Indonesia, dan hasilnya menunjukkan bahwa metode lexicon-based dapat digunakan secara praktis tanpa memerlukan proses pelatihan . Hal serupa dilakukan oleh Ratnaswari dkk. , yang mengombinasikan metode lexicon-based dengan Support Vector Machine untuk menganalisis opini publik terkait Presiden dan Wakil Presiden periode 2024Ae2029 . Lebih lanjut. Hendrawati dkk. menggunakan metode lexicon-based untuk menelaah sentimen publik terkait larangan impor pakaian bekas, yang menunjukkan bahwa isu sosial-ekonomi juga dapat dipetakan menggunakan pendekatan ini . Sementara itu. Aulia dkk. meneliti tagar #IndonesiaTerserah pada masa pandemi COVID-19 dengan metode SentiStrength, yang mengungkap pola dominasi sentimen negatif masyarakat . Penelitian lain yang relevan adalah karya Syakur, yang menggunakan metode lexicon-based untuk menganalisis respons publik terhadap kebijakan pemerintah dalam pencegahan penyebaran COVID-19 . Zahria dkk. melakukan studi tentang Twitter sebagai platform komunikasi politik di Indonesia, menegaskan bahwa media sosial berperan penting dalam pembentukan opini publik terhadap isu kebangsaan . Selain itu. Hernikawati meneliti respons masyarakat terhadap vaksin Sinovac melalui lexicon-based sentiment analysis, yang menekankan bagaimana opini publik terhadap kebijakan kesehatan dapat dipetakan secara sistematis . Amaliah dkk. membandingkan akurasi metode lexicon-based dan Nayve Bayes Classifier pada analisis opini publik terhadap aplikasi investasi di Twitter, dan menemukan bahwa lexicon-based lebih sederhana dalam implementasi . Relevansi kamus sentimen untuk Bahasa Indonesia juga dibuktikan oleh Koto dan Rahmaningtyas melalui pengembangan InSet Lexicon, yang secara khusus dirancang untuk menangani analisis sentimen pada teks berbahasa Indonesia . Evaluasi ini menegaskan bahwa InSet dapat menjadi solusi praktis dalam penelitian yang tidak membutuhkan data latih yang besar, namun tetap mampu menangkap polaritas teks di media sosial. Penelitian Yuliastuti dkk. turut menekankan penerapan InSet Lexicon pada analisis kenaikan harga BBM, yang memperlihatkan efektivitas pendekatan ini dalam menelaah isu ekonomi di ruang digital . Firdaus dkk. juga menegaskan manfaat pendekatan lexicon-based dalam evaluasi opini mahasiswa, yang memperlihatkan bahwa metode ini dapat digunakan pada berbagai konteks . Selain itu. Fauziah dkk. dalam systematic literature review menegaskan bahwa lexicon-based sentiment analysis tetap relevan digunakan dalam konteks Bahasa Indonesia meskipun memiliki keterbatasan dalam mendeteksi sarkasme . Hal ini sejalan dengan penelitian Prasetya dkk. yang menyoroti penerapan lexicon-based untuk isu COVID-19 di Twitter, yang memperlihatkan bahwa meskipun efisien, metode ini membutuhkan interpretasi lebih lanjut untuk menangkap nuansa komunikasi digital masyarakat . Dari berbagai penelitian terdahulu tersebut dapat dilihat bahwa pendekatan lexicon-based telah banyak digunakan pada isu politik, ekonomi, hingga kesehatan, namun penelitian yang secara khusus menelaah fenomena tagar #KaburAjaDulu masih terbatas. Padahal, tagar ini memiliki nilai penting karena mencerminkan ekspresi publik yang khas dengan nuansa kritik dan sarkasme. Celah inilah yang menjadi gap analysis penelitian ini, sehingga diperlukan kajian yang lebih fokus menggunakan InSet Lexicon untuk memahami bagaimana masyarakat digital Indonesia menanggapi isu sosial-politik melalui tagar tersebut. Penelitian ini tidak hanya menerapkan metode lexicon-based pada isu baru, tetapi juga meninjau karakteristik ekspresi publik khas Indonesia seperti sarkasme dan ironi dalam teks media sosial, yang belum banyak dikaji sebelumnya. Berdasarkan latar belakang dan tinjauan penelitian terdahulu, tujuan dari penelitian ini adalah untuk mengklasifikasikan sentimen publik terhadap tagar #KaburAjaDulu menggunakan pendekatan lexicon-based berbasis kamus InSet. terlihat bahwa metode lexicon-based dan kamus InSet terbukti efektif untuk teks berbahasa Indonesia, terutama dalam konteks ulasan produk dan opini politik. Penelitian-penelitian tersebut menjadi landasan pemilihan metode pada studi ini, sekaligus membuka ruang untuk eksplorasi lanjutan dalam isu sosial digital seperti fenomena tagar #KaburAjaDulu. Kontribusi keilmuan dari penelitian ini terletak pada penerapan metode lexicon-based berbasis kamus InSet untuk menganalisis wacana sosial-politik yang berkembang di media sosial Indonesia. Selain memperluas cakupan penggunaan InSet dari ranah evaluasi produk menuju kajian sosial-politik, penelitian ini juga menambahkan dimensi analisis terhadap pola sarkasme dan kritik implisit dalam bahasa informal masyarakat Indonesia di Twitter. Dengan demikian, penelitian ini tidak hanya menerapkan metode yang sudah ada, tetapi juga memperluas pendekatan lexicon-based untuk konteks kebahasaan dan sosial yang lebih https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 METODOLOGI PENELITIAN Penelitian ini merujuk pada rangkaian langkah terstruktur yang dirancang untuk mengevaluasi sentimen publik terhadap tagar #KaburAjaDulu di Twitter dengan pendekatan lexicon-based. Proses diawali dengan pengumpulan data berupa tweet yang mengandung tagar tersebut, kemudian dilanjutkan ke tahap pra-pemrosesan yang berfungsi untuk menyaring, membersihkan, dan menyiapkan data agar dapat dianalisis secara optimal. Setelah data siap, setiap kata dalam tweet akan dicocokkan dengan entri dalam kamus InSet (Indonesia Sentiment Lexico. guna memperoleh nilai polaritas. Hasil pencocokan ini akan digunakan untuk menghitung total skor sentimen pada setiap tweet. Berdasarkan skor tersebut, tweet kemudian diklasifikasikan ke dalam kategori sentimen tertentu, seperti positif, negatif, atau netral. Seluruh hasil klasifikasi ini selanjutnya divisualisasikan dalam bentuk grafik atau tabel, yang akan menjadi dasar interpretasi dalam analisis akhir. Penjabaran teknis mengenai setiap tahapan dalam alur ini, termasuk representasi visual berupa flowchart serta pseudocode, akan dibahas lebih lanjut pada bagian-bagian berikutnya dalam dokumen penelitian ini. Adapun alur eksperimen yang digunakan dalam penelitian ini dapat dilihat pada Gambar 1: Gambar 1. Tahapan Metode Peneitian 1 Pengumpulan Dataset Proses pengumpulan data dalam penelitian ini dilakukan dengan memanfaatkan teknik web scraping melalui bantuan pustaka Python, salah satunya tweet harvest, yang memungkinkan penelusuran dan ekstraksi data dari platform media sosial Twitter. Fokus utama pengambilan data diarahkan pada tweet-tweet yang menyertakan tagar #KaburAjaDulu, karena dianggap mencerminkan berbagai bentuk pandangan masyarakat terhadap isu-isu sosial, politik, maupun ekonomi yang sedang berkembang. Pengambilan data dilakukan pada rentang waktu 1 Januari 2025, dengan hasil sebanyak 581 tweet berbahasa Indonesia yang berhasil dihimpun. 2 Preprocessing Pra-pemrosesan data merupakan langkah awal yang sangat krusial dalam proses analisis sentimen, khususnya ketika menggunakan pendekatan berbasis leksikon. Tahapan ini bertujuan untuk menyiapkan teks agar dapat diproses lebih lanjut oleh sistem, terutama dalam hal pencocokan kata dengan kamus sentimen seperti InSet. Setiap tweet yang berhasil dikumpulkan akan dibersihkan dari unsur-unsur yang tidak diperlukan dan disesuaikan bentuknya agar lebih sederhana dan mudah dianalisis. Hal serupa juga disampaikan oleh Abdillah et al. dalam studi mereka mengenai persepsi publik terhadap kebijakan penanganan COVID-19 di Indonesia. Penelitian tersebut menggunakan pendekatan lexicon-based dan menemukan bahwa keberhasilan analisis sangat ditentukan oleh kualitas tahapan pra-pemrosesan, khususnya dalam menangani bentuk-bentuk kata yang tidak baku. Berikut penjelasan tahapan yang di lakukan dalam preprocessing : Case Folding https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 b. Semua karakter huruf pada teks tweet diubah menjadi huruf kecil . Tujuannya adalah untuk menyeragamkan kata-kata, sehingga tidak ada perbedaan makna antara kata yang ditulis dengan huruf kapital maupun huruf kecil, seperti pada kata AuNegaraAy dan AunegaraAy yang akan dianggap sama. Pembersihan Teks (Cleanin. Pada tahap ini, elemen-elemen yang bukan bagian dari isi utama teks, seperti tautan (URL), username (@), tagar (#), angka, tanda baca, dan simbol-simbol lainnya dihapus. Hal ini dilakukan agar teks menjadi lebih bersih dan hanya menyisakan kata-kata inti yang mungkin mengandung muatan sentimen. Tokenisasi (Tokenizin. Kalimat dalam tweet kemudian dipecah menjadi satuan kata-kata terpisah. Proses ini penting untuk memungkinkan setiap kata dianalisis secara individual, sehingga bisa dicocokkan dengan entri yang ada dalam kamus InSet. Stopword Removal Kata-kata umum dalam bahasa Indonesia yang tidak memiliki kontribusi terhadap nilai sentimen seperti AuyangAy. AudiAy. AudenganAy. AuituAy, dan sejenisnya akan dihapus dari teks. Penghilangan stopword bertujuan untuk menyaring informasi yang tidak memiliki nilai emosional, agar proses analisis menjadi lebih fokus dan Lemmatization/stemming Kata-kata diubah ke dalam bentuk dasarnya . kar kat. Misalnya. AuberlariAy. AupelariAy, dan AuberlarianAy akan disederhanakan menjadi AulariAy. Proses ini penting untuk menyelaraskan bentuk kata dalam teks dengan entri yang tersedia di dalam kamus InSet. Tabel 1 menyajikan hasil preprocessing. Tabel 1. Contoh Hasil Preprocessing DATA SEBELUM PREPROCESSING DATA SETELAH PREPROCESSING i wish 2 tahun kemudian bisa ikut trend #kaburajadulu kpn bisa join trend #kaburajadulu i wish tahun kemudian ikut trend @RWWReborn @Blackburger_28 Peserta #kaburajadulu dari kalangan ijo kah? bayi memilih #KaburAjaDulu daripada terlahir jadi WNI peserta kalangan ijo kah kpn join trend bayi memilih daripada terlahir jadi wni 3 Model lexicon-based Pendekatan lexicon-based dalam analisis sentimen merupakan metode yang bergantung pada daftar kata atau kamus yang telah diberi label polaritas, baik berupa sentimen positif, negatif, maupun netral. Pada penelitian ini, alat bantu yang digunakan berupa kamus InSet (Indonesia Sentiment Lexico. , yaitu sebuah sumber leksikal berbahasa Indonesia yang bersifat terbuka dan telah dikembangkan secara publik. InSet disusun oleh Fajri Koto dan Gemala Y. Rahmaningtyas pada tahun 2017, kemudian dipublikasikan melalui 21st International Conference on Asian Language Processing (IALP). Kamus ini memuat lebih dari 3. 600 kata positif dan sekitar 6. 600 kata negatif, masing-masing memiliki bobot skor polaritas dalam rentang Ae5 hingga 5. Repositori lengkap InSet tersedia secara terbuka melalui GitHub . ajri91/InSe. , sehingga dapat diakses dan dimanfaatkan secara luas oleh peneliti maupun praktisi Kamus ini memuat ratusan entri kosakata yang masing-masing dilengkapi dengan nilai sentimen yang mencerminkan muatan emosional dari setiap kata tersebut. Sejumlah kajian terdahulu . menyebutkan bahwa InSet merupakan salah satu leksikon sentimen yang paling banyak digunakan dalam analisis berbahasa Indonesia karena menawarkan akurasi tinggi serta kemudahan Adapun hasil riset lain . menunjukkan bahwa penerapan InSet dalam analisis sentimen terhadap pembelajaran daring mampu menghasilkan klasifikasi sentimen yang akurat, bahkan dalam konteks bahasa yang sangat informal. Hal serupa disampaikan pula pada temuan penelitian . , yang menyimpulkan bahwa InSet memberikan hasil lebih unggul dibandingkan leksikon lain seperti SentiWordNet versi terjemahan, khususnya dalam analisis umpan balik mahasiswa terhadap pengajaran dosen. Sementara itu, studi lain . yang mengembangkan aplikasi web berbasis lexicon untuk analisis sentimen dalam Bahasa Indonesia juga memilih InSet sebagai leksikon utama karena kelengkapan kosakata dan kesesuaiannya dengan bahasa sehari-hari yang digunakan di media sosial. 4 Evaluasi Hasil Analisis Sentimen https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 Tahap ini tidak melibatkan proses pelatihan model . , melainkan evaluasi terhadap hasil klasifikasi sentimen yang diperoleh melalui pendekatan lexicon-based. Evaluasi dilakukan dengan meninjau distribusi sentimen . ositif, negatif, dan netra. , serta menginterpretasikan makna di balik kata-kata dominan yang muncul. Analisis ini bertujuan untuk melihat kecenderungan opini publik terhadap isu sosial yang direpresentasikan melalui tagar #KaburAjaDulu. HASIL DAN PEMBAHASAN Penelitian ini menghasilkan analisis sentimen publik terhadap tagar #KaburAjaDulu di Twitter dengan memanfaatkan pendekatan lexicon-based menggunakan kamus InSet (Indonesia Sentiment Lexico. Proses analisis dilakukan melalui serangkaian tahapan, meliputi pengumpulan data tweet dengan Tweet Harvest, prapemrosesan teks . embersihan, normalisasi, stopword removal, dan lemmatisas. , hingga klasifikasi sentimen ke dalam kategori positif, negatif, dan netral. Implementasi metode ini dilakukan menggunakan Google Colaboratory serta pustaka Python untuk mendukung proses otomatisasi analisis dan visualisasi hasil. 1 Deskripsi Dataset Pengumpulan data dilakukan dalam rentang waktu mulai dari 1 Januari 2025, dan dari proses tersebut berhasil dihimpun sebanyak 581 tweet yang ditulis dalam Bahasa Indonesia. Setiap entri dalam dataset tersebut memuat informasi berupa teks asli dari cuitan atau full_text , yang menjadi objek Sebagai gambaran awal, pada tabel 2, disajikan cuplikan data sebagaimana bentuk aslinya sebelum melalui proses preprocessing. Tabel 2. Contoh Dataset Sebelum Marinir pun bisa #kaburAjaDulu gaji lebih tinggi tunjangan lebih baik peralatan lebih canggih Minus nya apa? Tim yang menggaungkan #kaburajadulu mana nih suaranya? Diem diem bae apa malah fokus ke teori konspirasi? Ini kan kalian yang berisik pengen #kaburajadulu FYI aja kalo kalian pernah kena tbc kalian gakan diterima di negara manapun mau sekolah/kerja dll Ini pemrentah mau penelitian biar ada vaksinnya kalian protes juga klean emang pantes hidup susah karena kegoblogan klean yang mau kuliah ke china S1/S2 bisa dm aku ya. Open pendaftaran sampe akhir bulan may nanti dibantu cari beasiswa . api tergantung sama nilai #kaburajadulu #beasiswachina #sekolahkechina #beasiswachina2025 #utbk2025! Jadi pengen ngikut tren #kaburajadulu wkwkwkwk Selain ga betah sama birokrasi yg awut-awutan aku juga ga betah sama budaya yg kayak gini 2 Preprocessing Dataset yang sebelum nya berjumlah 581 mengalami penyusutan karna telah melalui tahap preprocessing (Case Folding. Data Cleaning. Tokenisasi,Stopword Removal. Lemmatization/Stemmin. Pada tahap stopword removal merupakan impact yang sangat besar terhadap preprocessing. Pada tabel 3 disajikan beberapa kata yang ada di stopwrod removal : Tabel 3. Kata-kata Stopword Removal Kelompok Kata Kata ganti informal Contoh Kata Tambahan gw, gua, lu, kalian, saya, kamu, kami, kita, dia, mereka Pertikel informasi kan, deh, dong, tuh, lah, aja, nih, sih, loh Keterangan Bentuk kata ganti nonbaku atau umum dalam percakapan Twitter yang tidak memiliki makna sentimen. Partikel penegas dalam bahasa informal yang tidak berkontribusi pada polaritas emosi. https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 Kata hubung umum Kata Ekpresi non leksikal Variasi jadi, buat, tapi, agar, maka, dan, atau, untuk, karena, juga, hanya, lebih, lagi apa, siapa, kenapa, gimana, yg, ada, di, ke, dari, dalam, pada, akan, bisa, sudah, tidak, ya, itu, ini, mau wkwk, haha, hehe, yah, oh, eh, oke, ajaa, yahh, kaburajadulu Kata sambung atau penghubung yang berfungsi gramatikal tanpa membawa makna emosional. Kata interogatif, preposisi, atau kata bantu yang berfungsi struktural dan tidak mengandung opini. Ekspresi atau interjeksi spontan yang tidak mencerminkan emosi positif atau negatif dalam konteks analisis. Bentuk ejaan tidak baku atau kata tagar yang harus dihapus agar hasil sentimen tidak bias terhadap topik utama. jumlah tweet berkurang menjadi 501 tweet, penyusutan ini terjadi karena adanya data yang duplikat, tweet kosong, maupun teks yang kehilangan makna. Seluruh tweet disimpan dalam format Comma Separated Values (CSV), yang memungkinkan pengolahan data lebih mudah pada tahap selanjutnya. Tabel 4 menyajikan hasil perubahan dataset yang telah melalui proses preprocessing. Tabel 4. Hasil Preprocessing Sebelum Marinir pun bisa #kaburAjaDulu gaji lebih tinggi tunjangan lebih baik peralatan lebih canggih Minus nya apa? Tim yang menggaungkan #kaburajadulu mana nih suaranya? Diem diem bae apa malah fokus ke teori Ini kan kalian yang berisik pengen #kaburajadulu FYI aja kalo kalian pernah kena tbc kalian gakan diterima di negara manapun mau sekolah/kerja dll Ini pemrentah mau penelitian biar ada vaksinnya kalian protes juga klean emang pantes hidup susah karena kegoblogan klean sendiri Sesudah marinir pun gaji tinggi tunjangan baik peralatan canggih minus nya apa yang mau kuliah ke china S1/S2 bisa dm aku ya. Open pendaftaran sampe akhir bulan may nanti dibantu cari beasiswa . api tergantung sama nilai #kaburajadulu #beasiswachina #sekolahkechina #beasiswachina2025 #utbk2025! Jadi pengen ngikut tren #kaburajadulu wkwkwkwk Selain ga betah sama birokrasi yg awut-awutan aku juga ga betah sama budaya yg kayak mau kuliah china ss dm aku ya open pendaftaran sampe akhir bulan may nanti dibantu cari beasiswa tapi tergantung sama nilai sekolahkechina utbk tim menggaungkan mana nih suaranya diem bae apa malah fokus teori konspirasi kan kalian berisik pengen fyi kalo pernah kena tbc gakan diterima negara manapun mau sekolahkerja dll pemrentah penelitian biar ada vaksinnya protes klean emang pantes hidup susah kegoblogan sendiri jadi pengen ngikut tren wkwkwkwk selain ga betah sama birokrasi yg awutawutan aku budaya kayak gini Tokens ['marinir', 'pun', 'gaji', 'tinggi', 'tunjangan', 'baik', 'peralatan', 'canggih', 'minus', 'nya', 'apa'] ['tim', 'menggaungkan', 'mana', 'nih', 'suaranya', 'diem', 'bae', 'apa', 'malah', 'fokus', 'teori', 'konspirasi'] ['kan', 'kalian', 'berisik', 'pengen', 'fyi', 'kalo', 'pernah', 'kena', 'tbc', 'gakan', 'diterima', 'negara', 'manapun', 'mau', 'sekolahkerja', 'dll', 'pemrentah', 'penelitian', 'biar', 'ada', 'vaksinnya', 'protes', 'klean', 'emang', 'pantes', 'hidup', 'susah', 'kegoblogan', 'sendiri'] ['mau', 'kuliah', 'china', 'ss', 'dm', 'aku', 'ya', 'open', 'pendaftaran', 'sampe', 'akhir', 'bulan', 'may', 'nanti', 'dibantu', 'cari', 'beasiswa', 'tapi', 'tergantung', 'sama', 'nilai', 'beasiswachina', 'sekolahkechina', 'utbk'] ['jadi', 'pengen', 'ngikut', 'tren', 'wkwkwkwk', 'selain', 'ga', 'betah', 'sama', 'birokrasi', 'yg', 'awutawutan', 'aku', 'budaya', 'kayak', 'gini'] https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 3 Hasil Metode Lexicon-Based Berikut hasil yang diperoleh dari metode lexicon-based, dan beberapa hasil nya yaitu sebagai berikut : 1 Pencocokan kata dengan kamus inset Setelah dataset yang telah melewati tahapan preprocessing akan di proses lagi menjadi kata kata tersendiri. Setiap kata yang akn di cocokkan dengan dataset yang terdapat di dalam kamus inset. Bila kata yang di cocokkan ada dalam kamus, maka akan di beri nilai sesuai bobot nya, seperti pada tabel 5. Tabel 5. Contoh Kamus Sentimen KATA KATA NEGATIF Tersentuh . Putus tali gantung Larat hati Linu Remuk redam BOBOT KATA KATA POSITIF Paripurna Merekam Hai Welas BOBOT 2 Perhitungan Skor Sentimen Setelah setiap kata di berikan bobot berdasarkan kata kata yang terdapat di dalam kamus inset, maka tahap selanjut nya hasil kata kata pembobotan yang teradapat di dalam kalimat akan melewati tahapan perhitungan, dengan rumus sederhananya pada persamaan . SKOR SENTIMEN = (JUMLAH KATA POSITF) Ae (JUMLAH KATA NEGATIF) . Berikut contoh hasil perhitungan dari hasil preprocessing, dan setelah melakukan penerapan rumus yang terdapat dalam tahapan perhitungan skor sentimen : Gambar 2. Hasil Perhitungan Sentimen Dalam penelitian ini, perhitungan skor sentimen dilakukan dengan menghitung selisih jumlah kata positif dan negatif berdasarkan pencocokan dengan kamus InSet. Namun, pendekatan ini memiliki keterbatasan dalam menangani konteks negasi seperti kata AotidakAo atau AobukanAo. Misalnya, kalimat Aotidak senangAo tetap terhitung positif karena kata AosenangAo terdapat dalam daftar leksikon positif. Kelemahan ini menjadi salah satu faktor yang dapat memengaruhi akurasi hasil klasifikasi, dan diakui sebagai ruang pengembangan untuk penelitian lanjutan agar dapat menangkap konteks negasi dan sarkasme secara lebih akurat. 3 Klasifikasi Sentimen Skor sentimen yang di peroleh dari masing masing tweet kemudian di pakai untuk menentukan sentimen. Aturan klasifikasinya disajikan pada tabel 6. Tabel 6. Klasifikasi Sentimen SKOR SENTIMEN KATEGORI SENTIMEN 1 hingga 5 Positif https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 -1 hingga -5 Netral Negatif Dan berikut hasil penerapan dari klasifikasi sentimen yang telah di lakukan pada hasil preprocessing : Tabel 7. Hasil Klasifikasi negative Cleaned_text yaa penting laahh ngga kerja luar negeri tanpa uang peser pun tim menggaungkan mana nih suaranya diem bae apa malah fokus teori konspirasi konoha gelap also lbp ngapain kabur ln kalian jdi nd citizen disana mending disinilah kau kesimpulannya mrintah pindah giliran mau eh dilarang rezim aneh ada resign dgn gagahnya balik kandang lgi marinir pun gaji tinggi tunjangan baik peralatan canggih minus nya apa org baratny jg gamau cari pasangan pny anak bnyk yg lbh milih hewan nuclear family turun tingkat penduduk menurun hasilny lg terguncang awkowkowkowkow hal u sbt bener sih wong nz jangan lupa pake masker polusi udara jakarta baik saja zona kuning terkena penyakit asma amarah gw k pemerintah dgn brbagai macam brita brusaha gak ungkapin mncoba jaga ketikan takut hujat diaspora tau diri ikut nimbrung buat bantu info tmen trmasuk puncak kemarahan sbnerny minimal ada manfaatny cringe karakternya gegabah ingin menjatuhkan rezim menjadi martir sebagai korban penghilangan paksa padahal dua decade kemudian reformasinya dikorupsi generasi mudanya memilih daripada harus repot melawan yolo Score Sentiment Score Sentiment Tabel 8. Hasil Klasifikasi Positif Cleaned_text ursa baby clear namanya tapi outputnya dewasa design transparan biar lo ngeliat isi eh podnya simple clean and lowkey stylish buat suka vibe slow burn tetap on point ursababyclear podkit vapestyle peringatandarurat terima kasih ganya kak aisyle amp day doa terbaik kalian berdua semoga akak ais segera mendapat pekerjaan proper aku menyusul aminn hi aku ada update kabar baik jadi kerjasama agensi pencarian kerja perawat khusus menyalurkan tenaga kesehatan untk feenya jt sdh dapat les bahasa online ab biaya proses penyetaraan translate dokumen tiket pesawat tindakan benar hasil penelitian negara indonesia kaya namun warganya miskin bahagia kaburajadulu studi harvard ri jadi warga paling makmur beruntung banget anda bu dok tuhan permudahkanlah amin https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 kok indonesia makin ngga jelas gin yak yok yokk 4 Evaluasi Hasil Analisis Sentimen Pada bagian ini disajikan Evaluasi hasil analisis sentimen #KaburAjaDulu di Twitter . Evaluasi dilakukan untuk melihat kemampuan model dalam mengelompokkan sentimen sebagai negatif, netral dan positif. 1 Visualisasi Sentimen Gambar 3. Visualisasi klasifikasi sentimen (Diagram Batan. Berdasarkan gambar 3 hasil klasifikasi sentimen terhadap 581 tweet yang mengandung tagar #KaburAjaDulu, diperoleh bahwa kategori negatif mendominasi sebesar 41,72%, disusul oleh sentimen netral sebesar 33,73%, dan positif sebesar 24,55%. Persentase ini menunjukkan bahwa tagar tersebut lebih banyak digunakan untuk mengekspresikan kritik, kekecewaan, atau sindiran terhadap situasi sosial dan politik. Sementara itu, meskipun sebagian tweet dikategorikan netral secara tekstual, banyak di antaranya mengandung makna sarkastik atau kritik terselubung yang tidak sepenuhnya terbaca oleh pendekatan leksikal. Hal ini mempertegas bahwa metode berbasis leksikon mampu memberikan klasifikasi kategorikal yang jelas, namun interpretasi hasil tetap perlu mempertimbangkan konteks sosial serta gaya bahasa informal yang umum digunakan masyarakat Indonesia di media sosial. 2 Analisis Kata Dominan Agar mengetahui seperti apa saja kata kata yang teradapat di dalam sentimen negatif, netral, dan positif, maka disajikan bentuk visualisasi wordcloud, dari hasil sentimen yang di dapatkan setalah melewati berbagai tahapan yang telah di jalankan. Pada pada gambar 4 disajikan visualisasi sentimen negatif, pada gambar 5 untuk sentimen netral dan gambar 6 visualisasi sentimen positif. Gambar 4. Visualisasi Wordcloud Negatif https://doi. org/10. 33998/processor. Submitted: 06 September 2025. Reviewed: 17 September 2025. Accepted: 23 Oktober 2025. Published: 31 Oktober 2025 Gambar 5. Visualisasi Wordcloud Netral Gambar 6. Visualisasi Wordcloud Positif Berdasarkan hasil wordcloud pada setiap kategori sentimen, ditemukan bahwa tagar #KaburAjaDulu memiliki kecenderungan kuat sebagai sarana ekspresi opini publik yang bersifat kritis. Pada kategori negatif, kata seperti Aunegara,Ay Aukabur,Ay Aumending,Ay dan AugakAy sering muncul bersamaan, mencerminkan bentuk kekecewaan, ketidakpuasan, dan sarkasme terhadap isu sosial serta politik nasional. Sementara itu, kategori positif menampilkan kata seperti Aukerja,Ay Aubismillah,Ay dan AunikmatAy yang cenderung menggambarkan optimisme personal atau semangat individu. Adapun kategori netral menampilkan kata seperti Auaku,Ay Auindonesia,Ay dan Auorang,Ay yang cenderung deskriptif tanpa emosi yang kuat. Temuan ini memperkuat interpretasi bahwa persepsi publik terhadap tagar #KaburAjaDulu lebih dominan digunakan untuk menyuarakan kritik sosial dan refleksi terhadap situasi nasional secara tidak langsung melalui gaya bahasa informal di Twitter. KESIMPULAN Berdasarkan hasil analisis terhadap 581 tweet dengan tagar #KaburAjaDulu, diperoleh distribusi sentimen sebesar 41,72% negatif, 33,73% netral, dan 24,55% positif. yang ditandai dengan kemunculan kata seperti Aunegara,Ay Aukabur,Ay dan Aumending. Ay Pola tersebut menggambarkan penggunaan tagar ini sebagai bentuk ekspresi kritik dan ketidakpuasan publik terhadap dinamika sosial dan politik di Indonesia. Sementara itu, sentimen positif dan netral lebih merepresentasikan respons personal dan ekspresi deskriptif tanpa muatan emosi yang kuat. Secara keseluruhan, hasil ini menegaskan bahwa metode lexicon-based efektif dalam mengungkap persepsi publik terhadap fenomena digital berbahasa Indonesia, meskipun masih memiliki keterbatasan dalam mengenali konteks sarkasme dan negasi. REFERENCES