Jurnal informasi dan Komputer Vol: 13 No:2 2025 P-ISSN: 2337-8344 E-ISSN: 2623-1247 DETEKSI BANJIR BERBASIS LLM (LARGE LANGUAGE MODELS) MENGGUNAKAN DATA TWITTER/X VIA CHATBOT WHATSAPP Rey Muhamad Rifqi1. Muhammad Rizky Hajar2. Widodo Tri Haryanto3. Djupriadi4 . Kusrini5. I Made Artha Agastya6 Universitas Amikom Yogyakarta123456 Jl. Ring Road Utara. Ngringin. Condongcatur. Kec. Depok. Kabupaten Sleman. Daerah Istimewa Yogyakarta E-mail : reymuh72@gmail. com1, riskihajar@students. id2, widodo. tri@students. petrajupriadi66@gmail. com4 , kusrini@amikom. id5, artha. agastya@amikom. ABSTRAK Penelitian ini berfokus pada pengembangan sistem inovatif untuk deteksi banjir berbasis kecerdasan buatan, memanfaatkan kekuatan Large Language Model (LLM) dan data real-time dari platform media sosial Twitter/X. Dilatarbelakangi oleh kebutuhan akan sistem peringatan dini yang lebih cepat dan efektif dibanding metode konvensional, penelitian ini bertujuan mengintegrasikan analisis data Twitter/X dimana tempat masyarakat sering melaporkan kejadian banjir secara langsung dengan kemampuan canggih LLM dalam memahami bahasa alami. Melalui tahapan seperti pengumpulan dan pra-pemrosesan data Twitter/X, ekstraksi fitur menggunakan algoritma TF-IDF, pengembangan model LLM untuk klasifikasi tweet banjir, hingga pembangunan chatbot WhatsApp, sistem ini dirancang untuk mendeteksi informasi banjir secara Keluaran yang ditargetkan adalah prototipe sistem deteksi banjir via chatbot WhatsApp yang mampu memberikan notifikasi akurat dan cepat kepada pengguna. Kontribusi utama dari penelitian ini meliputi inovasi teknologi dengan penggabungan LLM dan TF-IDF, peningkatan kecepatan respon informasi banjir, serta peningkatan aksesibilitas informasi melalui platform WhatsApp yang populer, yang secara keseluruhan berpotensi besar dalam mendukung upaya mitigasi bencana dan pengurangan risiko kerugian akibat banjir di Indonesia. Didapatkan akurasi secara keseluruhan sebesar 96% dimana ini sangat baik dalam melakukan klasifikasi tweet banjir. Kata Kunci: Deteksi Banjir. TF-IDF. Chatbot. LLM ABSTRACTS This research focuses on developing an innovative artificial intelligence-based flood detection system, leveraging the power of Large Language Models (LLM. and real-time data from the Twitter/X social media Motivated by the need for faster and more effective early warning systems compared to conventional methods, this study aims to integrate Twitter/X data analysisAiwhere communities often report flood incidents directlyAiwith the advanced natural language understanding capabilities of LLMs. Through stages such as Twitter/X data collection and pre-processing, feature extraction using the TF-IDF algorithm, development of an LLM model for flood tweet classification, and the construction of a WhatsApp chatbot, this system is designed for automatic flood information detection. The targeted output is a prototype flood detection system via a WhatsApp chatbot capable of providing accurate and rapid notifications to users. Key contributions of this research include technological innovation by combining LLMs and TF-IDF, enhancing the speed of flood information response, and improving information accessibility through the popular WhatsApp platform. Collectively, these advancements hold significant potential in supporting disaster mitigation efforts and reducing flood-related losses in Indonesia. The overall accuracy obtained was 96%, which is very good in classifying flood tweets. Keywords: Flood Detection. TF-IDF. Chatbot. LLM PENDAHULUAN Sistem deteksi banjir konvensional kerap lambat, dengan informasi detail dari lapangan yang minim dan sulit diolah secara real-time . , . Sementara itu, laporan warga di Twitter/X melimpah namun tidak terstruktur, menghambat analisis manual yang cepat. Keterbatasan ini menunda peringatan dini dan respons efektif. 61 | L P P M I T B A D i a n C i p t a C e n d i k i a Jurnal informasi dan Komputer Vol: 13 No:2 2025 P-ISSN: 2337-8344 E-ISSN: 2623-1247 Sistem deteksi banjir berbasis LLM dan chatbot diperlukan untuk secara otomatis menganalisis laporan warga secara cepat, memberikan Informasi akurat, dan memperluas jangkauan kesiapsiagaan dan respons terhadap bencana banjir . Banjir merupakan salah satu bencana alam yang sering terjadi di berbagai wilayah, termasuk Indonesia, dan memiliki dampak signifikan terhadap masyarakat dan infrastruktur. Informasi real-time tentang kejadian banjir sangat penting untuk respons cepat oleh pihak berwenang . , . , . Media sosial seperti Twitter/X menjadi sumber data yang kaya untuk memantau laporan bencana secara langsung, tetapi tantangannya adalah membedakan antara laporan banjir yang merujuk pada bencana fisik dan penggunaan kata "banjir" dalam konteks metaforis . isalnya, "banjir orderan" atau "banjir air mata"). METODE PENELITIAN Penelitian ini menggunakan pendekatan rekayasa sistem berbasis data sains, dengan metode pengembangan sistem yang berorientasi pada pemrosesan data teks secara real-time dan integrasi chatbot . Tujuan dari metode ini adalah merancang dan mengimplementasikan sistem deteksi banjir otomatis berdasarkan informasi yang diperoleh dari media sosial (Twitter/X) serta menyampaikan hasilnya kepada masyarakat melalui WhatsApp chatbot. Berikut merupakan alur penelitian yang disajikan dalam bentuk flowchart pada gambar Studi literatur merupakan proses mencari dan memahami penelitian terdahulu dengan topik serupa. Merumuskan masalah dan tujuan penelitian. Setelah melakukan studi literatur akan ditemukan beberapa kekurangan atau hal yang dapat dikembangkan dari penelitian sebelumnya, temuan ini dijadikan sebagai rumusan masalah dan tujuan penelitian. Pemodelan Sistem Ada pemodelan sistem, merupakan tahap pembuatan desain model klasifikasi dan alur Pembuatan Model. Pembuatan LLM menggunakan algoritma Term FrequencyInverse Document Frequency (TF-IDF). Terdapat kondisi bila hasil pembuatan atau pelatihan model belum memuaskan maka akan dilakukan pelatihan kembali. Integrasi model dengan Chatbot Whatsapp Bila hasil pelatihan memuaskan selanjutnya langkah integrasi dengan chatbot Whatsapp. Tes integrasi chatbot dengan model Bagian ini merupakan tes integrasi antara chatbot dan model klasifikasi dengan melakukan tes chat secara langsung. Pembuatan laporan penelitian Bagian ini merupakan pembuatan laporan dan jurnal penelitian. HASIL DAN PEMBAHASAN 1 Pemodelan Sistem Pembuatan Model Klasifikasi Sebelum mendapatkan hasil penelitian, lebih baik merancang model klasifikasinya terlebih dahulu yang disajikan pada gambar 2. Gambar 1. Flowchart Berikut merupakan penjelasan penelitian pada gambar 1. Studi Literatur 62 | L P P M I T B A D i a n C i p t a C e n d i k i a Jurnal informasi dan Komputer Vol: 13 No:2 2025 P-ISSN: 2337-8344 E-ISSN: 2623-1247 penelitian ini yang disajikan menggunakan flowchart pada gambar 3. Gambar 2. Flowchart Berikut merupakan penjelasan dari alur pemodelan klasifikasi: Scrapping Mengambil data tweet mentah yang akan dijadikan dataset. Preprocessing Dataset yang sudah diambil dilakukan preprocessing data. Clean Text dilakukan untuk membersihkan dataset dari karakter spesial, hashtag, dll. Stemming merupakan langkah transformasi kata kerja ke kata dasar . isalnya AubekerjaAy menjadi AukerjaA. menggunakan library Sastrawi. Labelling dilakukan labelling secara otomatis untuk mengindikasikan apakah suatu tweet merupakan banjir atau metafora. Pembagian Dataset Dataset dibagi dengan rasio 80% untuk data training dan 20% untuk tes. Training Model Data training yang telah dibagi sebelumnya akan diolah dengan algoritma TF-IDF agar menjadi model klasifikasi. Dicek apakah memuaskan hasil training, bila tidak maka latih kembali model, bila iya maka evaluasi Evaluasi Model dengan hasil yang baik dievaluasi mengetahui seberapa akurat model tersebut. Hasil Kesimpulan Setelah itu hasil dan kesimpulan dibuat untuk laporan. Alur Sistem Dalam pembuatan sistem penting untuk merumuskan bagaimana suatu sistem dapat Berikut merupakan alur sistem Gambar 3. Flowchart Alur Sistem Berikut merupakan penjelasan dari alur sistem dalam penelitian ini Input Text atau URL Twitter, pengguna dapat memasukan konten teks atau link tweet secara langsung kedalam chatbot. Proses model, chatbot dengan model klasifikasi berbasis algoritma TF-IDF akan menentukan apakah input yang diberikan termasuk kedalam banjir atau metafora. Bila termasuk banjir maka output banjir akan menjadi respon dari bot, bila tidak maka responnya adalah metafora. 2 Hasil Penelitian Penelitian ini menggunakan algoritma Term Frequency-Inverse Document Frequency (TFIDF) merupakan salah satu teknik pengolahan teks . ext minin. dan Natural Language Processing (NLP). Algoritma ini bertujuan untuk melakukan evaluasi terhadap suatu kata . dalam suatu dokumen. Terdapat dua faktor utama dalam algoritma TF-IDF antara lain. Term Frequency (TF), digunakan untuk mengukur seberapa sering suatu kata muncul dalam sebuah dokumen. Secara umum TF diukur dengan melakukan perhitungan antara jumlah kemunculan kata yang dibagi dengan total kata. TF ini dapat disesuaikan dengan beberapa kasus yang lebih kompleks agar pencarian kata lebih Inverse Document Frequency (IDF), digunakan untuk mengukur seberapa penting suatu kata dalam sebuah dokumen. Kata yang jarang muncul lebih sering 63 | L P P M I T B A D i a n C i p t a C e n d i k i a Jurnal informasi dan Komputer Vol: 13 No:2 2025 memiliki nilai IDF yang lebih tinggi. IDF diukur dengan cara melakukan perhitungan dengan membagi jumlah total dokumen dalam library dengan jumlah dokumen yang mengandung kata yang dipilih. Dua menghasilkan bobot kata . erm weigh. pada setiap kata dalam dokumen . Bobot ini mencerminkan pentingnya sebuah kata dalam TF-IDF memiliki rumus sebagai P-ISSN: 2337-8344 E-ISSN: 2623-1247 Hasil penelitian pada gambar 6 menunjukkan performa model evaluasi yang digunakan yaitu berupa precision, recall, dan F1-score yaitu dengan data sebagai berikut: Bencana . enunjukkan precision 0. F1-score 0. 94 dengan 121 Metafora . enunjukkan precision 0. F1-score 0. 97 dengan 191 Dari data diatas diperoleh akurasi secara keseluruhan adalah 0. 96 atau 96%. Untuk lebih jelasnya ditunjukan pada tabel 1 dibawah ini. Tabel 1 Evaluasi Model Gambar 4. Rumus TF-IDF Keterangan: - D : dokumen ke-d - t : kata . ke-t dari dokumen - tfidf : bobot kata ke-d terhadap kata . - tf : jumlah kemunculan kata . i dalam dokumen - idf : Inversed Document Frequency - df : banyak dokumen yang mengandung kata . Pada implementasi klasifikasi TF-IDF ini juga dibantu dengan Logistic Regression dalam kode python dilakukan dengan parameter pada gambar 5 berikut: Aungram_range = . , . Ay parameter ini menentukan algoritma TF-IDF akan mempertimbangkan unigram . ata tungga. dan bigram . asangan kata beruruta. Misalnya terdapat teks Aubanjir bandangAy, maka akan dihasilkan fitur untuk AubanjirAy. AubandangAy, dan Aubanjir bandangAy. Ini berguna agar model dapat menangkap konteks serta makna yang lebih baik dari teks yang diolah. Logistic Regression digunakan untuk mengandung kata AuregresiAy. Parameter yang digunakan adalah Aurandom_state=42Ay, ini bertujuan untuk melakukan pengacakan internal yang digunakan oleh algoritma. AuC=1. 0Ay parameter regularisasi inverse untuk mencegah overfitting. Ausolver=liblinearAy parameter untuk optimasi komputasi dimana cocok untuk dataset kecil dan menengah. Klasifikasi Bencana Metafora Precision Recall F1-Score Macro dan weighted average juga menunjukkan 96 atau 96% untuk semua metrik. Hasil ini menunjukkan bahwa model sangat akurat dalam membedakan konteks banjir, dengan performa yang lebih baik pada kategori metafora yaitu recall 0. 99 atau 99%. Precision tinggi pada kelas bencana . menunjukkan bahwa model jarang salah mengklasifikasikan tweet non bencana sebagai bencana, sedangkan recall tinggi pada kelas metafora . mengidentifikasi hampir semua tweet metafora dengan benar. Gambar 5 Confusion Matrix klasifikasi tweet Pada gambar 5 merupakan confusion matrix yang bertujuan untuk memetakan hasil antara prediksi dengan aktual yang terjadi. Terdapat 110 prediksi bencana yang ternyata memang bencana, kemudian terdapat 2 prediksi bencana namun aktualnya adalah metafora, kemudian terdapat 11 64 | L P P M I T B A D i a n C i p t a C e n d i k i a Jurnal informasi dan Komputer Vol: 13 No:2 2025 prediksi metafora namun nyatanya termasuk ke dalam bencana, dan terdapat 109 prediksi metafora dan memang nyatanya metafora. Pada saat pengujian prediksi tweet baru, mengklasifikasikan tweet dengan probabilitas yang konsisten pada konteks tweet yang ditulis. Contohnya pada gambar 6 berikut: Gambar 6. Hasil Tes Pada Tampilan Sederhana P-ISSN: 2337-8344 E-ISSN: 2623-1247 untuk meningkatkan aksesibilitas informasi. Sistem ini menggunakan pendekatan Term Frequency-Inverse Document Frequency (TFIDF) untuk ekstraksi fitur dan model klasifikasi teks untuk membedakan laporan banjir dalam konteks bencana . dan metafora . Berikut adalah poin-poin utama dari temuan Penelitian ini berhasil mengembangkan sistem deteksi banjir berbasis model bahasa besar yang memanfaatkan data dari platform Twitter/X, dengan integrasi antarmuka chatbot WhatsApp untuk meningkatkan aksesibilitas informasi. Sistem ini menggunakan pendekatan TF-IDF untuk ekstraksi fitur dan model klasifikasi teks untuk membedakan laporan banjir dalam konteks bencana . dan metafora . Berikut adalah poin-poin utama dari temuan penelitian: Gambar 7. Tampilan Chatboot Pada gambar 7 pemodelan menunjukkan bahwa model mampu membedakan konteks banjir dengan baik, terutama pada kasus tertentu seperti tweet dengan kata Auair mataAy . atau AubandangAy dan AurobAy . Probabilitas tinggi pada sebagian besar prediksi menunjukkan kepercayaan model yang kuat terhadap klasifikasi yang telah dihasilkan. KESIMPULAN DAN SARAN 1 Kesimpulan Penelitian ni berhasil mengembangkan sistem deteksi banjir berbasis model bahasa besar yang memanfaatkan data dari platform Twitter/X, dengan integrasi antarmuka chatbot WhatsApp Model klasifikasi teks mencapai akurasi keseluruhan sebesar 96%, dengan precision 98 untuk kelas bencana dan 0. 94 untuk kelas metafora, serta F1-score masingmasing 0. 94 dan 0. Hasil ini menunjukkan bahwa model efektif dalam mengidentifikasi konteks banjir dengan tingkat keandalan yang tinggi, sebagaimana dibuktikan oleh evaluasi metrik standar . Pengujian pada tweet baru menunjukkan bahwa model mampu membedakan konteks dengan akurat, seperti mengklasifikasikan "Banjir rob merendam ratusan rumah" sebagai bencana . 88%) dan "Aku nangis sampe banjir air mata" sebagai metafora . 02%). Hal ini menegaskan kemampuan model untuk menangani ambiguitas bahasa dalam konteks bahasa Indonesia . Integrasi model ke dalam chatbot WhatsApp memungkinkan analisis teks secara real-time non-teknis, masyarakat umum atau petugas lapangan. Simulasi chatbot menunjukkan hasil yang meningkatkan potensi penerapan sistem di lapangan . Sistem ini relevan dalam konteks Indonesia, yang sering dilanda banjir, dengan menyediakan alat untuk pemantauan realtime yang dapat mendukung respons cepat oleh badan penanggulangan bencana. Pendekatan ini sejalan dengan kebutuhan akan sistem peringatan dini yang efektif. Penelitian ini memperkaya literatur tentang penerapan NLP dalam bahasa Indonesia, khususnya untuk deteksi bencana, yang masih terbatas dibandingkan dengan bahasa Inggris. Dengan fokus pada ambiguitas 65 | L P P M I T B A D i a n C i p t a C e n d i k i a Jurnal informasi dan Komputer Vol: 13 No:2 2025 bahasa lokal, penelitian ini memberikan wawasan baru tentang pengembangan teknologi NLP yang kontekstual . 2 Saran Setiap penelitian perlu memiliki saran agar penelitian ini dapat dikembangkan oleh peneliti Berikut saran dari penelitian ini Mengintegrasikan sistem tersebut dengan infrastruktur peringatan dini yang sudah ada, seperti sistem pemantauan cuaca atau sensor banjir, untuk menciptakan solusi yang lebih Mengembangkan model yang mendukung analisis multibahasa untuk menangani tweet dalam bahasa Inggris atau bahasa daerah lainnya yang sering muncul di Twitter/X. Melakukan edukasi dan sosialisasi kepada pemangku kepentingan dengan melakukan pelatihan dan sosialisasi kepada petugas bencana, relawan, dan masyarakat umum tentang cara menggunakan chatbot ini untuk memaksimalkan manfaatnya. DAFTAR PUSTAKA