Jurnal Teknik Komputer AMIK BSI Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
Akreditasi Ristekdikti.
No: 36/E/KPT/2019 (Sinta .
DOI: 10.
31294/jtk.
Hal.
Penanganan Overfitting pada Klasifikasi Berita Hoax berbasis Neural Networks dengan Dropout dan Regularization Ridwan Ilyas1*.
Fatan Kasyidi2.
Maulidina Norick Eriyadi3 Program Studi Informatika.
Fakultas Sains dan Inromatika Universitas Jenderal Achmad Yani.
Cimahi.
Indonesia e-mail: 1*ilyas@lecture.
id, 2 fatan.
kasyidi@lecture.
maulidinanoricke20@if.
Diterima 06-08-2024.
Direvisi 09-08-2024.
Disetujui 14-08-2024 Abstrak: Penelitian ini mengevaluasi efektivitas berbagai teknik deteksi hoaks di Indonesia menggunakan model klasifikasi teks dengan dua ukuran dataset berbeda, yaitu 250 dan 650 sampel.
Hoaks di media sosial memiliki dampak signifikan pada masyarakat, sehingga deteksi yang akurat sangat penting.
Penelitian ini menguji tiga algoritma machine learningAiID CNN.
Bi-LSTM, dan LSTMAidengan teknik regulasi seperti original, regularization, dan dropout.
Hasil penelitian menunjukkan bahwa teknik regularisasi pada ID CNN memberikan akurasi tertinggi pada dataset 250 sampel, sementara Bi-LSTM dengan teknik original mencapai akurasi tertinggi pada dataset yang sama.
Dataset yang lebih besar .
menunjukkan bahwa teknik regularisasi pada ID CNN tetap stabil, sedangkan teknik dropout memberikan hasil yang bervariasi.
Analisis menggunakan confusion matrix dan grafik learning menunjukkan adanya overfitting pada model, terutama pada dataset yang lebih kecil.
Temuan ini menegaskan pentingnya penerapan teknik regulasi untuk mengurangi overfitting dan meningkatkan generalisasi model dalam deteksi hoaks.
Penelitian ini memberikan kontribusi pada pengembangan sistem deteksi hoaks yang lebih efektif di Indonesia.
Kata Kunci: Deteksi hoaks, klasifikasi teks.
ID CNN.
Bi-LSTM.
LSTM, regularisasi, dropout, overfitting.
Abstract: This study evaluates the effectiveness of various fake news detection techniques in Indonesia using text classification models with two different dataset sizes: 250 and 650 samples.
Fake news on social media has significant impacts on society, making accurate detection crucial.
The study examines three machine learning algorithmsAiID CNN.
Bi-LSTM, and LSTMAiusing regulation techniques such as original, regularization, and Results indicate that regularization on ID CNN provides the highest accuracy for the 250-sample dataset, while Bi-LSTM with the original technique achieves the highest accuracy for the same dataset.
The larger dataset .
reveals that regularization on ID CNN remains stable, while dropout technique yields varied results.
Analysis through confusion matrix and learning graphs shows signs of overfitting, especially in the smaller dataset.
These findings underscore the importance of applying regulation techniques to reduce overfitting and enhance model generalization in fake news detection.
This research contributes to the development of more effective fake news detection systems in Indonesia.
Keywords: Fake news detection, text classification.
ID CNN.
Bi-LSTM.
LSTM, regularization, dropout, overfitting.
PENDAHULUAN
Hoaks telah menjadi masalah signifikan di Indonesia, sehingga upaya deteksi menjadi sangat Penyebaran hoaks di platform media sosial dapat menimbulkan konsekuensi negatif seperti keraguan publik, ketakutan, dan kemarahan, yang dapat mengganggu keharmonisan masyarakat dan persatuan (Ummah & Al Fajri, 2.
Kontroversi dan disinformasi terkait keputusan pemerintah untuk memindahkan ibu kota negara semakin menegaskan perlunya langkah-langkah deteksi hoaks yang kuat.
(Darmawan et al.
, 2.
Prevalensi berita palsu dan http://ejournal.
id/ejurnal/index.
php/jtk hoaks telah memperburuk perpecahan budaya dan konflik di dalam komunitas.
(Kaplan et al.
, 2.
Dengan adanya peristiwa politik penting seperti pemilihan umum 2024, ancaman hoaks semakin menonjol, sehingga diperlukan langkah-langkah kuat untuk melawan disinformasi.
(Putri Aisyiyah Rachma Dewi, 2.
Tersedianya dataset khusus untuk mendeteksi hoaks di Indonesia telah secara signifikan memajukan penelitian di bidang ini.
Para peneliti telah memanfaatkan dataset tersebut untuk mengembangkan sistem yang mengidentifikasi hoaks di platform media This work is licensed under a Creative Commons Attribution-ShareAlike 4.
0 International License Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
sosial menggunakan berbagai teknik klasifikasi teks, seperti algoritma SVM dan SGD.
(Prasetijo et al.
Klasifikasi berita hoaks dalam bahasa Indonesia menggunakan Nayve Bayes menyoroti pentingnya kualitas dataset untuk deteksi yang akurat.
(Sudrajat et , 2.
Selain itu, transformer pra-latih telah digunakan untuk deteksi hoaks COVID-19 dalam bahasa Indonesia, yang menunjukkan relevansi dan pentingnya dataset khusus bahasa.
(Suadaa et al.
Para peneliti telah mengeksplorasi berbagai metode untuk menangani deteksi hoaks di Indonesia.
Klasifikasi ansambel telah digunakan untuk mengidentifikasi hoaks di antara pengguna Twitter Indonesia, meningkatkan akurasi deteksi.
(Syaifuddiin et al.
, 2.
Metode berbasis aturan.
LSTM, dan IndoBERT juga telah diteliti untuk mengidentifikasi hoaks di media sosial, menunjukkan beragam pendekatan dalam bidang penelitian ini (Kaer Sinapoy.
Analisis sentimen telah digunakan untuk memahami aspek emosional dari hoaks politik di Indonesia, menunjukkan potensi untuk analisis sentimen yang lebih mendalam.
(Salsabila & Suhardijanto, 2.
Peluang penelitian dalam mendeteksi hoaks di Indonesia sangat luas dan menjanjikan.
Memahami kecenderungan perilaku hoaks di kalangan mahasiswa, terutama selama pandemi COVID-19, sangatlah (Afdal et al.
, 2.
Analisis sentimen menggunakan metode Support Vector Machine (SVM) menawarkan jalur berharga untuk eksplorasi lebih (Shafira, 2.
Selain itu, menganalisis hoaks terkait pemilihan umum dari perspektif nilai-nilai Pancasila menyoroti potensi untuk penelitian interdisipliner yang menggabungkan dimensi politik, sosial, dan etika (Ediyono, 2.
Teknik deep learning seperti LSTM dan BiLSTM menawarkan peluang yang menjanjikan untuk mendeteksi hoaks dalam bahasa Indonesia.
Studi yang membandingkan metode LSTM dan IndoBERT di Twitter telah menunjukkan efektivitas model deep learning dalam tugas klasifikasi teks, khususnya dalam deteksi hoaks.
(Kaer Sinapoy, 2.
Transfer learning dari transformer pra-latih untuk deteksi hoaks COVID19 telah menyoroti keunggulan model deep learning dibandingkan dengan klasifikator klasik.
(Suadaa et al.
Model-model ini meningkatkan akurasi dan efisiensi deteksi hoaks, menyediakan solusi yang kuat terhadap tantangan disinformasi di media sosial.
Integrasi teknik dropout dan regularisasi dalam pengembangan model LSTM dan Bi-LSTM dapat secara signifikan meningkatkan kinerja dan generalisasi model.
Dropout, yang melibatkan pengaturan sebagian unit input menjadi nol selama pelatihan, mencegah overfitting dan meningkatkan (Cruz-Victoria, 2.
Mengintegrasikan lapisan dropout dalam arsitektur LSTM dan Bi-LSTM memastikan bahwa model mempelajari representasi yang kuat dari data input.
(May Marma et al.
, 2.
Ridwan Ilyas.
Fatan Kasyidi.
Maulidina Norick Eriyadi Regularisasi L2, yang menambahkan istilah penalti ke fungsi kerugian, mencegah bobot yang besar, menghindari overfitting, dan mempromosikan batas keputusan yang lebih halus.
(Fan et al.
, 2.
Strategi regularisasi ganda ini mengoptimalkan model LSTM dan Bi-LSTM untuk klasifikasi teks, menyeimbangkan kompleksitas model dan kinerja secara efektif.
Teknik regularisasi membantu model dalam melakukan generalisasi yang lebih baik dan membuat prediksi yang andal pada berbagai input teks, menghasilkan proses optimasi yang lebih stabil dan efisien.
(Karim et , 2.
Penelitian ini akan menggunakan 250 dataset yang dikumpulkan dari penelitian sebalumnya (Pratiwi et al.
, 2.
Ditambah dengan 650 dataset tambahan dari penelitian yang sama.
Pada penelitian tersebut telah memberi dasar studi tentang deteksi hoak bahasa indonesia dengan menyediakan data dan mencoba menggunakan metode naive bayes.
Pada penelitian ini akan digunakan model deep leraning LSTM dan BiLSTM.
Selain metode tersebut, akan digunakan teknik Dropout untuk mengatasi masalah overfiting pada model machine learning yang dibukat.
METODE PENELITIAN
Pada penelitian ini digunakan dua dataset berbeda ukuran, yaitu dataset 250 dan dataset 600 (Pratiwi et al.
, 2.
Pemilihan dua dataset ini untuk menganalisis bagaimana jumlah data mempengaruhi kecenderungan model untuk overfitting.
Dataset yang lebih kecil .
mungkin lebih rentan terhadap overfitting, sementara dataset yang lebih besar .
dapat memberikan gambaran tentang bagaimana peningkatan jumlah data mempengaruhi generalisasi model.
Tahap preprocessing data merupakan langkah dalam mempersiapkan teks berita untuk analisis menggunakan neural networks.
Proses ini dimulai dengan pembagian data .
plit dat.
menjadi set pelatihan dan pengujian, yang penting untuk evaluasi yang tidak bias.
Selanjutnya, tokenisasi memecah teks menjadi unit-unit yang dapat diproses .
, yang kemudian dikonversi menjadi sekuens numerik.
Langkah terakhir, pad sequence, memastikan semua input memiliki panjang yang sama, yang penting untuk pemrosesan batch dalam neural networks.
Pemodelan klasifikasi merupakan inti dari penelitian ini.
Tahap ini dimulai dengan embedding, yang mengubah token menjadi vektor dense, memungkinkan model untuk memahami konteks dan hubungan antar kata.
Modeling deep learning kemudian membangun arsitektur neural network, kemungkinan menggunakan LSTM atau CNN yang cocok untuk tugas pemrosesan teks.
Di sinilah teknik Dropout dan Regularization diterapkan untuk mengatasi overfitting.
Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
HASIL DAN PEMBAHASAN
Dataset 250 Pada penelitian ini mengevaluasi kinerja tiga algoritma Machine Learning: ID CNN.
Bi-LSTM, dan LSTM pada dataset yang terdiri dari 250 data.
Setiap algoritma diuji dengan tiga teknik regulasi: Original .
anpa regulasi tambaha.
Regularization .
engan penambahan regulas.
, dan Dropout .
engan penerapan Kinerja algoritma diukur menggunakan metrik akurasi.
Hasil Evluasi precision, recall, dan F1 score terdapat pada lampiran Tabel 1.
Hasil Evaluasi Accuracy Dataset 250
Metode Teknik
Split Data
ID CNN
Original ID CNN
Regularization ID CNN
Dropout
Bi-LSTM
Original Bi-LSTM
Regularization Bi-LSTM
Dropout
LSTM
Original LSTM Regularization LSTM Dropout Gambar 1.
Alur Penelitian Dropout bekerja dengan secara acak "mematikan" sejumlah neuron selama proses training.
Teknik ini memaksa model untuk belajar dengan berbagai subset fitur, mengurangi ketergantungan pada fitur spesifik dan meningkatkan kemampuan Regularization, di sisi lain, menambahkan penalti ke fungsi loss untuk bobot yang terlalu besar, mendorong model untuk belajar fitur yang lebih sederhana dan umum.
Tahap evaluasi model merupakan langkah krusial untuk mengukur efektivitas teknik-teknik yang Model yang telah dilatih digunakan untuk klasifikasi pada set data pengujian, dan performanya dievaluasi menggunakan berbagai metrik seperti akurasi, presisi, recall, dan F1-score.
Analisis mendalam terhadap hasil ini akan membantu peneliti memahami sejauh mana Dropout dan Regularization berhasil mengurangi overfitting dan meningkatkan kemampuan generalisasi model.
Tabel 1 menunjukkan akurasi berbagai metode dan teknik pada model klasifikasi teks dengan pembagian data yang berbeda.
Untuk metode ID CNN, teknik regularisasi menunjukkan performa terbaik dengan 80 pada pembagian data 20%, diikuti oleh teknik dropout dengan akurasi 0.
78 pada pembagian data 20%.
Teknik original pada ID CNN memiliki akurasi terendah di setiap pembagian data.
Sementara itu, pada metode Bi-LSTM, teknik original mencapai akurasi tertinggi dengan nilai 0.
pada pembagian data 20%, sedangkan teknik regularisasi dan dropout menunjukkan akurasi yang lebih rendah pada pembagian data yang sama.
Teknik regularisasi dan dropout pada Bi-LSTM memiliki akurasi yang relatif seragam pada pembagian data yang berbeda, meskipun nilai akurasinya lebih rendah dibandingkan dengan teknik original.
Untuk metode LSTM, teknik regularisasi menunjukkan hasil yang lebih baik dibandingkan dengan teknik lainnya pada pembagian data 20%, dengan akurasi 0.
Sebaliknya, teknik dropout pada LSTM menunjukkan akurasi terendah pada pembagian data 20%, yaitu 0.
Akurasi LSTM dengan teknik original dan dropout cenderung lebih rendah secara keseluruhan dibandingkan dengan metode lain pada berbagai pembagian data.
Penanganan Overfitting pada Klasifikasi Berita Hoax berbasis Neural Networks dengan Dropout dan Regularization Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
mempelajari data training namun kurang baik dalam melakukan generalisasi pada data baru.
Grafik loss menunjukkan pola yang konsisten dengan grafik akurasi.
Loss training menurun tajam sekitar epoch ke-6 dan terus turun hingga mendekati 0.
Sementara itu, loss validasi menurun lebih lambat dan berfluktuasi, akhirnya stabil di sekitar 0.
Perbedaan yang besar antara loss training dan validasi ini juga mengkonfirmasi adanya overfitting dalam model.
Gambar 2.
Confusion Matriks Bi-LSTM Original 250 Dataset Pada Gambar 2 Confusion Matrix untuk dataset 250 yang menggunakan metode terbaik, kita dapat melihat evaluasi kinerja model dalam bentuk matriks yang menunjukkan dua kelas, yaitu kelas 0 dan kelas 1.
Matriks ini menggambarkan jumlah prediksi yang benar dan salah untuk masing-masing kelas, memberikan informasi mendalam mengenai kinerja True Positives (TP) adalah jumlah kasus di mana model memprediksi kelas 1 dengan benar, yang dalam hal ini True Negatives (TN) adalah jumlah kasus di mana model memprediksi kelas 0 dengan benar, sebanyak 12.
Sebaliknya.
False Positives (FP) adalah kasus di mana model salah memprediksi kelas 0 sebagai kelas 1, yang terjadi sebanyak 6 kali.
False Negatives (FN) adalah kasus di mana model salah memprediksi kelas 1 sebagai kelas 0, sebanyak 3.
Angka-angka ini memberikan informasi dasar mengenai kesalahan dan keberhasilan model dalam memprediksi kelas-kelas Gambar 3.
Grafik Leaning Bi-LSTM Original 250 Dataset Gambar 3 menunjukan grafik learning pada metode terbaik dengan 250 dataset.
Akurasi training meningkat tajam sekitar epoch ke-6 dan terus naik hingga mencapai sekitar 97%.
Di sisi lain, akurasi validasi meningkat lebih lambat dan akhirnya stabil di sekitar 82%.
Perbedaan yang signifikan antara akurasi training dan validasi ini mengindikasikan adanya overfitting, di mana model terlalu baik dalam Ridwan Ilyas.
Fatan Kasyidi.
Maulidina Norick Eriyadi Dataset 650 Penelitian pada dataset yang lebih besar, terdiri dari 600 data, juga mengevaluasi tiga algoritma Machine Learning yang sama dengan teknik regulasi yang sama.
Hasilnya menunjukkan bahwa ukuran dataset yang lebih besar memberikan variasi hasil yang sedikit berbeda dibandingkan dengan dataset 250.
Tabel 2.
Hasil Evaluasi Accuracy Dataset 650
Metode Teknik
Split Data
ID CNN
Original ID CNN
Regularization ID CNN
Dropout
Bi-LSTM
Original Bi-LSTM
Regularization Bi-LSTM
Dropout
LSTM
Original LSTM Regularization LSTM Dropout Tabel 2 menampilkan akurasi berbagai metode dan teknik pada model klasifikasi teks dengan pembagian data yang berbeda.
Untuk metode ID CNN, teknik regularisasi menunjukkan akurasi yang stabil di semua pembagian data, dengan nilai 0.
78 pada pembagian data 20% dan 0.
69 pada pembagian data 40%.
Teknik original pada ID CNN juga menunjukkan akurasi yang relatif baik, dengan nilai 0.
76 pada pembagian data 20% dan sedikit menurun menjadi 0.
69 pada pembagian data 40%.
Teknik dropout pada ID CNN memiliki akurasi yang sedikit lebih rendah, yaitu 0.
pada pembagian data 20% dan meningkat menjadi 0.
pada pembagian data 40%.
Pada metode Bi-LSTM, teknik original memiliki akurasi tertinggi di pembagian data 20% dengan nilai 77, tetapi menurun pada pembagian data 30% dan 40% menjadi 0.
68 dan 0.
67, masing-masing.
Teknik dropout pada Bi-LSTM memiliki akurasi yang lebih konsisten dengan nilai 0.
75 pada pembagian data 20% dan tetap stabil pada 0.
67 pada pembagian data 30% dan 40%.
Teknik regularisasi pada Bi-LSTM menunjukkan akurasi yang lebih rendah secara keseluruhan, dengan nilai tertinggi 0.
71 pada pembagian data 20% dan menurun pada pembagian data 30% dan 40%.
Untuk metode LSTM, teknik regularisasi memberikan akurasi terbaik dengan nilai 0.
74 pada pembagian data 20% dan sedikit menurun pada pembagian data 30% dan 40%, menjadi 0.
66 dan 0.
Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
Teknik original pada LSTM memiliki akurasi yang konsisten di berbagai pembagian data dengan nilai 69 pada pembagian data 20% dan 40%.
Teknik dropout pada LSTM menunjukkan akurasi terendah di pembagian data 20% dengan nilai 0.
tetapi sedikit meningkat menjadi 0.
67 pada pembagian data 30% dan 40%.
Gambar 4.
Confusion Matriks 1D-CNN Regularizaion 600 Dataset Pada Gambar 4 Confusion Matrix untuk dataset 650 yang menggunakan metode terbaik, kita dapat melihat evaluasi kinerja model dalam bentuk matriks yang menunjukkan dua kelas, yaitu kelas 0 dan kelas 1.
Matriks ini menggambarkan jumlah prediksi yang benar dan salah untuk masing-masing kelas, memberikan informasi mendalam mengenai kinerja True Positives (TP) adalah jumlah kasus di mana model memprediksi kelas 1 dengan benar, yang dalam hal ini berjumlah 73.
True Negatives (TN) adalah jumlah kasus di mana model memprediksi kelas 0 dengan benar, sebanyak 21.
Sebaliknya.
False Positives (FP) adalah kasus di mana model salah memprediksi kelas 0 sebagai kelas 1, yang terjadi sebanyak 19 kali.
False Negatives (FN) adalah kasus di mana model salah memprediksi kelas 1 sebagai kelas 0, sebanyak 7.
Angka-angka ini memberikan informasi dasar mengenai kesalahan dan keberhasilan model dalam kelas-kelas Gambar 5.
Grafik Leaning 1D-CNN Regularizaion 600 Dataset Gambar 5 menunjukan grafik learning pada metode terbaik dengan 650 dataset.
Akurasi training meningkat tajam sekitar epoch ke-6 dan terus naik hingga mencapai sekitar 97%.
Di sisi lain, akurasi validasi meningkat lebih lambat dan akhirnya stabil di sekitar 78%.
Perbedaan yang signifikan antara akurasi training dan validasi ini adalah indikasi kuat adanya overfitting, di mana model terlalu baik dalam mempelajari data training namun kurang baik dalam melakukan generalisasi pada data baru.
Grafik loss menunjukkan pola yang konsisten dengan grafik akurasi dan memperkuat indikasi Loss training menurun tajam dan terus turun hingga mendekati 0, sementara loss validasi menurun lebih lambat dan akhirnya stabil di sekitar 0.
Perbedaan yang besar antara loss training dan validasi ini mengkonfirmasi bahwa model mengalami overfitting, meskipun telah diterapkan teknik Penlitian ini menekankan eksprimen pada deteksi hoaks di Indonesia menggunakan berbagai metode dan teknik klasifikasi teks dengan dua ukuran dataset berbeda: 250 dan 650 sampel.
Hoaks merupakan masalah signifikan di Indonesia, dengan dampak negatif yang luas seperti keraguan publik, ketakutan, dan kemarahan.
Oleh karena itu, penting untuk mengembangkan teknik deteksi yang efektif.
Dataset khusus untuk mendeteksi hoaks dalam bahasa Indonesia telah memberikan dasar yang kuat untuk penelitian ini, dengan berbagai metode seperti algoritma SVM.
SGD.
Nayve Bayes, serta model deep learning seperti LSTM dan Bi-LSTM yang telah Penelitian ini mengevaluasi performa berbagai algoritma machine learningAiID CNN.
BiLSTM, dan LSTMAidengan menggunakan teknik regulasi seperti original, regularization, dan dropout pada dua ukuran dataset.
Hasil evaluasi menunjukkan perbedaan kinerja yang signifikan berdasarkan teknik dan ukuran dataset yang digunakan.
Pada dataset 250 sampel, teknik regularisasi untuk ID CNN menunjukkan akurasi tertinggi dengan 80 pada pembagian data 20%, sedangkan teknik dropout menunjukkan akurasi yang relatif baik pada pembagian data 20% dengan nilai 0.
Teknik original pada ID CNN memiliki akurasi terendah di semua pembagian data.
Untuk Bi-LSTM, teknik original memiliki akurasi tertinggi dengan nilai 0.
82 pada pembagian data 20%, sedangkan teknik regularisasi dan dropout menunjukkan akurasi yang lebih rendah.
LSTM dengan teknik regularisasi memberikan hasil yang lebih baik dengan akurasi 0.
78 pada pembagian data 20%, sedangkan teknik dropout menunjukkan akurasi terendah pada pembagian data 20%.
Hasil dari dataset yang lebih besar .
menunjukkan bahwa teknik regularisasi pada ID CNN tetap stabil dengan akurasi 0.
78 pada pembagian data 20%, dan teknik dropout memiliki akurasi yang sedikit lebih rendah di semua pembagian Pada Bi-LSTM, teknik original tetap menunjukkan akurasi tertinggi pada pembagian data 20%, dengan teknik dropout memberikan akurasi yang lebih konsisten.
Teknik regularisasi pada Bi-LSTM Penanganan Overfitting pada Klasifikasi Berita Hoax berbasis Neural Networks dengan Dropout dan Regularization Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
menunjukkan akurasi yang lebih rendah secara Untuk LSTM, teknik regularisasi memberikan hasil terbaik pada pembagian data 20%, dengan akurasi 0.
74, sementara teknik dropout menunjukkan akurasi terendah pada pembagian data Analisis hasil menggunakan confusion matrix dan grafik learning menunjukkan bahwa metode terbaik untuk dataset 250 adalah Bi-LSTM dengan teknik original, meskipun terdapat indikasi overfitting yang signifikan.
Pada dataset 650.
ID CNN dengan teknik regularisasi menunjukkan performa yang stabil, namun juga menunjukkan tanda-tanda overfitting dengan perbedaan besar antara akurasi training dan KESIMPULAN Secara keseluruhan, hasil penelitian ini menegaskan pentingnya teknik regulasi dalam meningkatkan kinerja model deteksi hoaks.
Teknik dropout dan regularisasi seperti L2 dapat secara signifikan mengurangi overfitting dan meningkatkan kemampuan generalisasi model.
Penelitian ini juga menunjukkan bahwa ukuran dataset mempengaruhi kinerja model, dengan dataset yang lebih besar memberikan hasil yang sedikit berbeda namun tetap menunjukkan kebutuhan untuk teknik regulasi yang Penggunaan model deep learning seperti LSTM dan Bi-LSTM, serta teknik regulasi yang tepat, merupakan langkah penting dalam pengembangan sistem deteksi hoaks yang lebih akurat dan efisien di Indonesia.
REFERENSI