SMATIKA : STIKI Informatika Jurnal Vol.
No.
Desember 2024, pp.
ISSN: 2087-0256, e-ISSN: 2580-6939 Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Nanda Mujahidah Andini1* Yulian Findawati2 Ika Ratna Indra Astutik3 Ade Eviyanti4 1,2,3,4 Informatika.
Universitas Muhammadiyah Sidoarjo.
Jl.
Mojopahit No.
666 B.
Sidowayah.
Celep.
Kec.
Sidoarjo.
Kabupaten Sidoarjo.
Jawa Timur 61215.
Indonesia 1201080200029@umsida.
id, 2yulianfindawati@umsida.
id, 3ikaratna@umsida.
4adeeviyanti@umsida.
*Penulis Korespondensi:
Nanda Mujahidah Andini 201080200029@umsida.
Abstrak Penelitian ini bertujuan untuk mengembangkan model deteksi ujaran kebencian yang akurat dan efisien pada platform media sosial Twitter dengan memanfaatkan kekuatan Convolutional Neural Network (CNN).
Fokus penelitian ini terarah pada identifikasi ujaran kebencian yang bermuatan sentimen negatif, khususnya yang terkait dengan isu ras, agama, dan orientasi seksual dalam konteks bahasa Indonesia.
Proses penelitian melibatkan pengumpulan dataset Twitter yang relevan, pra-pemrosesan teks untuk membersihkan dan menyusun data, serta representasi kata menggunakan Word2Vec untuk menangkap makna kontekstual.
Model CNN yang dirancang secara khusus kemudian dilatih pada dataset tersebut.
Keunggulan CNN dalam mengekstraksi fitur-fitur semantik dari teks secara otomatis, ditambah dengan penggunaan Word2Vec, memungkinkan model mencapai akurasi yang tinggi, yaitu 87% untuk penilaian emosi dan 99% untuk penilaian ujaran kebencian.
Hal ini menjadikan model ini sangat efektif dalam mendeteksi pola halus dalam bahasa yang mengindikasikan adanya ujaran kebencian.
Penelitian ini memberikan kontribusi signifikan dalam pengembangan sistem moderasi konten yang lebih baik di media sosial.
Dengan kemampuannya mendeteksi ujaran kebencian secara real-time, model ini dapat membantu menciptakan lingkungan online yang lebih aman dan inklusif.
Namun, penelitian ini masih memiliki beberapa keterbatasan, seperti ukuran dataset yang terbatas dan variasi ujaran kebencian yang belum sepenuhnya terwakili.
Oleh karena itu, penelitian lebih lanjut diperlukan untuk mengatasi keterbatasan tersebut dan meningkatkan kinerja model.
Kata Kunci: jaringan saraf tiruan.
ujaran kebencian Abstract The research aims to develop an accurate and efficient hate speech detection model on Twitter's social media platform by leveraging the power of the Convolutional Neural Network.
(CNN).
The focus of this research is on identifying hate speeches that are loaded with negative sentiment, especially those related to racial, religious, and sexual orientation issues in the context of the Indonesian language.
The research process involved collecting relevant Twitter datasets, preprocessing text to clear and compile data, and word representation using Word2Vec to capture contextual meanings.
Specifically designed CNN models are then trained on that dataset.
CNN's advantages in automatically extracting semantic features from text, coupled with the use of Word2Vec, allow the model to have high accuracy, which is 87%-99% for emotional assessment and 99% for hate speech assessment.
This makes the model very effective in detecting subtle patterns in language that indicate the presence of hate speech.
This research has made a significant contribution to the development of a better content moderation system on social media.
With its ability to detect hate speech in real time, the model can help create a safer and more inclusive online environment.
However, this research still has some limitations, such as limited data set size and variations of hate speech that are not fully represented.
Therefore, further research is needed to overcome these limitations and improve the performance of the model.
Keywords: convolutional neural network.
hate speech Cite: Andini.
dkk, .
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter.
SMATIKA : STIKI Informatika Jurnal, 14.
doi: https://doi.
org/10.
32664/smatika.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Pendahuluan Perkembangan pesat media sosial telah mengubah cara kita berinteraksi dan berkomunikasi.
Salah satu platform yang paling populer.
Twitter, memungkinkan pengguna untuk berbagi pendapat dan informasi secara real-time.
Namun, kebebasan berekspresi yang ditawarkan oleh platform ini seringkali disalahgunakan untuk menyebarkan ujaran kebencian .
ate speec.
Ujaran kebencian, yang didefinisikan sebagai bentuk komunikasi yang menyerang individu atau kelompok berdasarkan identitas tertentu seperti ras, agama, atau orientasi seksual, telah menjadi masalah global yang serius .
Penelitian terdahulu pertama yang dilakukan oleh .
dengan judul AuKlasifikasi Multilabel Komentar Toxic Pada Sosial Media Twitter Menggunakan Convolutional Neural Network (CNN)Ay menggunakan dataset Twitter yang terdiri dari ribuan tweet yang telah dilabeli secara manual sebagai toxic atau non-toxic.
Proses preprocessing data meliputi pembersihan teks dari noise, tokenisasi, dan representasi kata menggunakan teknik Word Embedding.
Model CNN yang digunakan terdiri dari beberapa lapisan convolutional, pooling, dan fully connected.
Lapisan convolutional berfungsi untuk mengekstrak fitur-fitur penting dari teks, sedangkan lapisan fully connected digunakan untuk melakukan klasifikasi.
Penelitian terdahulu kedua yang dilakukan oleh .
dengan judul AuBERT and fastText Embeddings for Automatic Detection of Toxic SpeechAy ialah mengembangkan dan mengevaluasi sebuah metode otomatis untuk mengenali emosi seseorang berdasarkan sinyal EEG .
Metode ini menggunakan jaringan saraf konvolusional (CNN) yang khusus dirancang untuk menganalisis ritme-ritme tertentu dalam sinyal EEG Mengingat urgensi masalah ini, berbagai upaya telah dilakukan untuk mengatasi penyebaran ujaran kebencian di media sosial.
Salah satu pendekatan yang menjanjikan adalah pemanfaatan teknologi kecerdasan buatan, khususnya teknik pembelajaran mendalam .
eep learnin.
Pembelajaran mendalam telah menunjukkan keunggulan dalam berbagai tugas pemrosesan bahasa alami, termasuk klasifikasi teks .
CNN salah satu arsitektur deep learning yang populer, telah berhasil diterapkan dalam berbagai bidang, termasuk pengenalan citra dan pemrosesan bahasa alami.
Kemampuan CNN dalam mengekstrak fitur-fitur penting dari data input membuatnya menjadi pilihan yang menarik untuk tugas klasifikasi teks seperti deteksi ujaran kebencian .
, .
Penelitian ini bertujuan untuk mengembangkan model deteksi ujaran kebencian berbasis CNN yang efektif dalam mengidentifikasi ujaran kebencian pada platform Twitter.
Model yang diusulkan diharapkan dapat membantu mengurangi penyebaran hate speech dan menciptakan lingkungan daring yang lebih sehat .
, .
Metode Penelitian Pendekatan mutakhir dalam penelitian ini menggunakan model pembelajaran mesin berbasis CNN untuk mendeteksi teks ujaran kebencian platform media sosial Twitter.
Langkah-langkah sebelum proses pengembangan model CNN adalah mengumpulkan data ujaran kebencian dan non-ucapan kebencian ke dalam kumpulan data kata pengklasifikasi saraf konvolusional.
Penelitian desain Klasifikasi Multi label Hierarkis (HMC) diuji coba dengan beberapa skenario yang memiliki sifat yang sama.
Pengujian ini menunjukkan bahwa HMC mencapai akurasi terbaik dalam beberapa skenario pelabelan .
Gambar 1.
Desain Alur Penelitian A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Gambar 1 adalah desain alur proses penelitian yang pertama dataset, yaitu kumpulan tweet yang telah dilabeli sebagai ujaran kebencian atau non-ujaran kebencian.
Kedua text preprocessing.
Sebelum dilakukan pemodelan, data teks yang diperoleh perlu dilakukan praproses, tahap praproses meliputi tokenisasi, normalisasi, stemming, dan vectorisasi.
Ketiga pembobotan kata, merujuk pada proses pemberian nilai atau bobot numerik pada setiap kata dalam sebuah dokumen teks.
Nilai bobot ini menunjukkan seberapa penting atau relevan sebuah kata terhadap keseluruhan dokumen atau terhadap topik tertentu.
Keempat klasifikasi CNN, penyaringan teks untuk membedakan antara tweet yang mengandung ujaran kebencian dengan yang tidak.
Kelima evaluasi, dengan ini menghasilkan kinerja model yang dievaluasi menggunakan berbagai metrik, antara lain akurasi, precision, recall, dan F1-Score.
Peneliti menggunakan kombinasi teknik Term Frequency-Inverse Document Frequency (TF-IDF) dan Word2Vec.
TF-IDF memberikan bobot pada kata-kata yang sering muncul dalam dokumen tetapi jarang muncul di seluruh dokumen, sedangkan Word2Vec menangkap hubungan semantik antara kata-kata.
Hasil Dalam penelitian ini, peneliti mengumpulkan 5 data secara acak dari berbagai sumber yang tidak memiliki keterkaitan tematik.
Data-data tersebut kemudian dianalisis untuk mengidentifikasi jenis-jenis ujaran kebencian yang ditujukan kepada negara Indonesia.
Hasil analisis menunjukkan bahwa ujaran kebencian yang ditemukan dalam data tersebut dinilai tidak sesuai dengan regulasi yang berlaku.
Penelitian ini memanfaatkan data ujaran kebencian yang bersumber dari platform Twitter yang bersifat terbuka.
Tabel 1.
Dataset didapat Melalui Platform Sosial Media Twitter
B C
Tweets H Non Anticipat Truts Joy Anger Disgust Fear Sadnes Surprise 1 Sama banget Komentar ini dgn 0 1 para pendukung setia Bpk Joko Widodo Presiden RI ke 7, yg sangat dicintai Rakyatnya krn Kerja Keras MERDEKA.
2 Ha ha ha sigundul penguasa 1 0 ancol karena selama ini taunya hanya jilat2 gabenar mulai dibuka jeroannya.
KPK Kejaksaan Agung Mabes Polri tolong segera turun/selidiki MERDEKA.
3 Kasihan Ibu ini jadi korban 1 0 akibat dicuci otaknya sama kadrun yg tdk bertanggung jawab.
Terima kasih Polisi dan Paspampres Waspada MERDEKA.
A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Tweets 4 Ha beberapa Pemimpin di Negara Inggeris dari Keturunan, perlu diketahui mereka tdk pernah Identitas SARA Ujaran kebencian Fitnah dan Teror yg melahirkan gabenar DKI Kura2 dalam Perahu eh Pura2 tdk Tau MERDEKA 5 Kok sewot dgn Pidato Sambutan Bpk Joko Widodo Presiden RI ke 7 di Acara HUT Partai Golkar ?, barisan sakit hati &amp.
kadrun pada kebakaran jenggot dgn ucapan s e m b r o n o sabar saja duduk diboncengan &amp.
Kerja kerja kerja dulu utk Rakyat INDONESIA tercinta MERDEKA.
B C
H Non Anticipat Truts Joy Anger Disgust Fear Sadnes Surprise Pada penelitian .
menunjukkan bahwa emosi tertentu seperti kemarahan dan kebencian lebih berkorelasi dengan ujaran kebencian di Twitter.
Klasifikasi emosi terdiri dari antisipasi .
, kepercayaan .
, gembira .
, marah .
, rasa jijik .
, ketakutan .
, sedih .
, kejutan .
Pembagian dataset pada tahap berikut membagi dua bagian data, yaitu dataset latih dan dataset uji.
Data pelatihan digunakan untuk melatih model klasifikasi, dan data penguji digunakan untuk menguji model klasifikasi.
Proporsi data latih 90%, sedangkan data proporsi data uji sebesar 10%.
Kolom tweet dalam kumpulan data mengandung frasa yang terdiri dari beberapa kata.
Sifat data yang tidak terstruktur dapat menimbulkan gangguan dan menurunkan volume data, sehingga diperlukan langkah prapemrosesan untuk meningkatkan kegunaannya .
Gambaran langkahlangkah prapemrosesan disajikan pada Gambar 1 sebagai berikut:
Gambar 2.
Pre-processing Tujuan dari pemurnian karakter adalah untuk menghilangkan karakter non-abjad seperti simbol, angka dan tanda baca dari dokumen teks.
Gambar 3.
Contoh Hasil dari Pemurnian Karakter A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Tujuan dari Case Folding adalah untuk merubah huruf, meratakan font dokumen dengan mengubah bentuk teks menjadi huruf besar pada langkah ini diubah menjadi huruf kecil .
Gambar 4.
Contoh Hasil Menghapus Angka Tokenisasi merupakan sebuah sistem memecah teks menjadi unit-unit kecil yang bermakna, yang disebut token.
Token dapat menghasilkan kata, kalimat, simbol, atau elemen lain yang memiliki arti dalam konteks teks.
Proses ini melibatkan pemecahan teks menjadi kalimatkalimat dan kemudian memecah kalimat menjadi unit-unit yang lebih kecil seperti kata, tanda baca, dan spasi.
Gambar 5.
Contoh Hasil Menghapus Angka dan B.
Contoh Hasil Menghapus Tanda Baca Removing number .
enghapus angk.
menghilangkan karakter numerik dari teks atau string.
Misalnya, jika Anda memiliki string "Hello123", menghapus angka akan menghasilkan string "Hello" seperti pada Gambar 5.
Removing punctuation .
enghapus tanda bac.
penghapusan semua tanda baca dari teks atau string.
Tanda baca seperti titik, koma, tanda seru, dan lainnya.
Misalnya string AuHello, world!Ay, menghapus tanda baca menghasilkan string AuHello worldAy yang seperti pada Gambar 5.
Removing whitespace .
enghapus spas.
penghapusan semua spasi dari teks atau string.
Tanda baca seperti titik, koma, tanda seru, dan lainnya.
Misalnya string AuHello WorldAy, menghapus tanda baca menghasilkan string AuHelloWorldAy seperti pada Gambar 6.
Gambar 6.
Contoh Hasil Menghapus Spasi dan B.
Contoh Hasil Penghapusan Karakter Dalam tahap pra-proses, teks dalam dokumen diubah menjadi bentuk yang dapat diolah oleh model Word2Vec.
Pertama, kata-kata diubah menjadi kata dasar dan kemudian dihapus dari kumpulan data.
Selanjutnya, data diringkas dan diubah menjadi urutan angka.
Proses ini menggunakan properti tokenizer.
texts_to_sequences dan sequence.
pad_sequences untuk mengubah teks menjadi urutan dan menyamakan panjang setiap data string seperti pada Gambar A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Pembobotan kata berperan krusial sebagai langkah lanjutan pasca proses preprocessing.
Tujuannya adalah untuk mentransformasi data tak terstruktur menjadi data terstruktur .
Salah satu templat Word2Vec yang digunakan untuk memasukkan kata-kata vektor.
Kumpulan kalimat yang menghitung kata dengan memisahkan arti dari kata tersebut.
Model Word2Vector digunakan untuk mengkonversi kata kata menjadi vector numerik seperti Gambar 7.
Mengkonversi kalimat menjadi vektor kemudian menggabungkan vektor menjadi representasi vektor dari kalimat seperti Gambar 8.
Model CNN ini akan menerima input berupa representasi vector dari kalimat seperti Gambar 8.
Gambar 7.
Contoh Data Word2Vec Gambar 8.
Hasil dari Contoh Kalimat dan B.
Hasil Model CNN Pembahasan Pada tahap ini pengujian dilakukan dengan metode klasifikasi menggunakan algoritma CNN.
Metode CNN adalah mengklasifikasikan teks dengan lebih dari 1 output model diharapkan mampu mengklasifikasikan data mengidentifikasikan dataset.
Untuk mencapai performa model optimal, berbagai parameter diuji, meliputi laju pembelajaran, jumlah lapisan konvolusi, ukuran kernel konvolusi, jumlah keseluruhan lapisan, dan jumlah node pada setiap lapisan.
Uji coba ini dilakukan dengan tujuan menemukan kombinasi parameter yang menghasilkan model dengan performa terbaik.
Jaringan saraf tiruan bernama CNN bekerja dengan cara menggeserkan filter kecil .
pada gambar dan mengalikan nilai pikselnya.
CNN tersusun dari dua komponen utama: lapisan konvolusi untuk mengekstrak fitur dan lapisan pooling untuk mengurangi dimensi Lapisan konvolusi berperan penting dalam mengidentifikasi ciri-ciri penting dari gambar .
, .
, .
A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Gambar 9.
Struktur CNN Gambar 9 memaparkan dua elemen utama model CNN: arsitektur konvolusi dan arsitektur Arsitektur konvolusi berperan dalam mengekstrak ciri penting dari gambar, sedangkan arsitektur subsampling menyeleksi ciri yang paling optimal untuk klasifikasi.
Model CNN ini tersusun atas beberapa lapisan yang tersusun secara berurutan.
Pertama, terdapat fungsi sekuensial yang menerima satu tensor masukan dan menghasilkan satu tensor keluaran.
Tensor masukan mewakili matriks data masukan, yang dapat digabungkan dengan hasil bobot word2vec Tensor keluaran merepresentasikan hasil klasifikasi penelitian.
Lapisan pencetakan ditambahkan untuk mencegah luapan data setelah pelepasan.
Jaringan kemudian memproses input melalui lapisan konvolusi untuk mengekstrak fitur-fitur Model CNN ini menggunakan 64 filter dan 2 unit filter.
Lapisan konvolusi menghasilkan vektor peta fitur, yang jumlahnya sama dengan jumlah filter yang digunakan.
Setiap filter digulirkan di seluruh jendela input untuk menangkap pola yang relevan .
Tahap selanjutnya adalah lapisan pooling, yang bertujuan untuk mengurangi dimensi input.
Operasi pooling maksimum diterapkan untuk memilih nilai terbesar dari peta fitur, menghasilkan representasi yang lebih ringkas.
Kemudian, lapisan rata-rata digunakan untuk mereduksi dimensi lebih lanjut menjadi vektor satu dimensi.
Terakhir, lapisan fully connected menghasilkan vektor dengan dimensi yang sesuai dengan jumlah kelas yang diklasifikasikan, dan menggunakan fungsi aktivasi softmax untuk menghasilkan probabilitas kelas .
Matriks kebingungan (Confusion Matri.
adalah alat yang membantu kita mengevaluasi performa model klasifikasi machine learning.
Alat ini menyajikan tabel yang membandingkan prediksi model dengan label data yang sebenarnya.
Melalui matriks ini, kita dapat mengetahui berapa banyak data yang diklasifikasikan dengan benar dan salah, baik untuk kategori positif maupun Tabel 2.
2 Menjelaskan Tentang Confusion Matriks yang Dimana aAkurasinya Dihitung .
dalam Persen.
Kelas Positif Negatif Klasifikasi Positif TP (True Positi.
= 1 FN (False Negati.
= 1 Klasifikasi Negatif FP (False Positi.
= 0 TN (True Negati.
= 3 Keakuratan, atau yang dikenal sebagai precision, mencerminkan kesesuaian antara tanggapan sistem dan ekspektasi pengguna.
Penilaian precision dapat dilakukan dengan rumus berikut dan diterapkan pada hasil ke 5 dataset:
ycNycE Precision : ycNycE yaycE = 1 0 = 1.
A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Efektivitas sebuah sistem dalam menemukan informasi yang dikehendaki dikenal dengan istilah Rumus untuk menghitung recall dapat diuraikan sebagai berikut dan diterapkan pada hasil ke 5 dataset:
Recall :
ycNycE = 0.
ycNycE yaycA F1-Score merupakan metrik penting dalam evaluasi model klasifikasi.
Metrik ini mengukur performa model dengan mempertimbangkan keseimbangan antara precision dan recall, dan memberikan nilai yang lebih rendah jika salah satu metrik tersebut menunjukkan kelemahan .
Perhitungan F1-Score dapat diimplementasikan pada persamaan dibawah ini:
ycEycyceycaycnycycnycuycuyycIyceycaycaycoyco 0y0.
F1-Score :2y ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco = 2 y 1.
5 = 0.
Salah satu tolok ukur untuk menilai performa klasifikasi adalah akurasi.
Metrik ini melakukan validasi tolok ukur proporsi prediksi yang benar dari total prediksi yang dibuat model.
Berikut adalah rumus untuk menghitung akurasi dan diterapkan pada hasil ke 5 dataset:
ycNycE ycNycA Accuracy : ycNycE ycNycA yaycE yaycA = 1 3 0 1 = 0.
Evaluasi merupakan tahap untuk menentukan hasil klasifikasi.
Matriks konfusi digunakan untuk menilai akurasi, presisi, dan perolehan dalam penelitian ini.
Skor matriks adalah banyaknya data tes yang diklasifikasikan dengan benar dibagi dengan jumlah seluruh data.
Banyak data yang tergolong positif benar (TP dan TN) tetapi tidak ditemukan (FP) .
Gambar 10.
Hasil Perhitungan Dataset antara Presisi.
Recall.
F1-Score, dan Akurasi Penelitian ini menguji kinerja algoritma CNN dalam mengklasifikasikan deteksi ujaran kebencian dan emosi menggunakan metode word2vec .
, .
Hasil deteksi model ujaran kebencian dan data pelatihannya disajikan.
Setelah menampilkan hasil deteksi ujaran kebencian, dilakukan pengujian epoch untuk mendeteksi model ujaran kebencian dan emosi.
Akurasi antara hasil deteksi ujaran kebencian dan emosi kemudian dievaluasi .
Terakhir, kata-kata baru dimasukkan untuk menghasilkan prediksi non-ujaran kebencian dan emosi.
A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Gambar 11.
Hasil Deteksi Ujaran Kebencian Gambar 12.
Hasil Epoch Deteksi Ujaran Kebencian Gambar 12 menampilkan hasil epoch deteksi ujaran kebencian yaitu 1/50, yang dihitung antara loss, akurasi, val_loss, dan val akurasi.
Selanjutnya, menghitung hasil klasifikasi emosi dan epoch dimana nantinya akan memunculkan emotional labelnya .
Gambar 13.
Hasil Klasifikasi Emosi A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Gambar 14.
Hasil Epoch Klasifikasi Emosi Untuk Gambar 15.
yaitu Hasil dari Akurasi Hate Speech dan Hasil Akurasi Emotion Gambar 15.
Hasil Akurasi Hate Speech dan Hasil Akurasi Emotion Setelah semua sudah muncul hasilnya, yang terakhir kita akan mencoba memasukkan kalimat kemudian akan muncul Hate Speech atau non-Hate Speech beserta emotion-nya.
Gambar 16.
Hasil Hate Speech dan Hasil Emotion Penutup Penelitian ini berhasil mengembangkan model deteksi ujaran kebencian berbasis Convolutional Neural Network (CNN) yang efektif dalam mengidentifikasi ujaran kebencian pada platform Twitter.
Dengan menggabungkan teknik TF-IDF dan Word2Vec, model mampu mencapai akurasi 87% dalam mengklasifikasikan tweet sebagai ujaran kebencian atau bukan.
Selain itu, model juga berhasil mengasosiasikan emosi dengan ujaran kebencian, memberikan pemahaman yang lebih mendalam tentang konteks emosional di balik ujaran kebencian.
Meskipun demikian, penelitian ini masih memiliki beberapa keterbatasan, seperti ukuran dataset yang relatif terbatas dan jenis ujaran kebencian yang belum tercakup secara komprehensif.
Untuk pengembangan selanjutnya, disarankan untuk menggunakan dataset yang lebih besar dan beragam, serta mengeksplorasi arsitektur CNN yang lebih kompleks.
Model yang dikembangkan dalam penelitian ini memiliki potensi besar untuk diaplikasikan dalam moderasi konten di media sosial, sehingga dapat membantu mengurangi penyebaran ujaran kebencian dan menciptakan lingkungan online yang lebih aman dan inklusif A 2024 SMATIKA Jurnal.
Published by LPPM STIKI Malang This is an open access article under the CC BY SA license.
ttps://creativecommons.
org/licenses/by-sa/4.
Implementasi Convolutional Neural Network (CNN) Untuk Mendeteksi Ujaran Kebencian Dan Emosi Di Twitter Penelitian di masa depan dapat diarahkan pada beberapa pengembangan.
Pertama, model deteksi ujaran kebencian dapat ditingkatkan dengan menggabungkan teknik augmentasi data untuk mengatasi masalah ketidakseimbangan kelas dalam dataset.
Hal ini akan membuat model lebih robust dan mampu mendeteksi berbagai variasi ujaran kebencian.
Kedua, penting untuk mengeksplorasi penerapan model pada berbagai bahasa untuk mengatasi tantangan global dalam memerangi ujaran kebencian.
Dengan demikian, model dapat digunakan di berbagai negara dan Ketiga, pengembangan alat yang mampu mendeteksi ujaran kebencian dalam berbagai format media, seperti gambar dan video, akan membuka cakupan yang lebih luas dalam pemantauan dan pencegahan penyebaran ujaran kebencian di dunia digital.
Referensi