Jurnal Teknik Komputer AMIK BSI Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
Akreditasi Ristekdikti.
No: 36/E/KPT/2019 (Sinta .
DOI: 10.
31294/jtk.
Hal.
Perbandingan SVM dan LSTM Untuk Memprediksi Gangguan Kecemasan (Anxiety Disorde.
Berdasarkan Cuitan di Platform Aplikasi X (Twitte.
Nurochman1.
Luthfia Ashiilah2* UIN Sunan Kalijaga Yogyakarta nurochman@uin-suka.
*19106050021@student.
uin-suka.
Diterima 05-08-2024 Direvisi 08-08-2024 Disetujui 14-08-2024.
Abstrak - Anxiety Disorder adalah gangguan kecemasan yang menyerang kesehatan mental seseorang sehingga bisa mengganggu aktivitas.
Pengaruh media sosial menjadi salah satu adanya pemicu gangguan kecemasan, dimana media sosial dijadikan objek untuk meluapkan perasaan yang dialami pengguna, contohnya Twitter atau aplikasi X.
Penelitian ini dilakukan untuk memprediksi adanya anxiety disorder pada pengguna Twitter dilihat berdasarkan cuitan yang ada dengan menggunakan dua model, yaitu Support Vector Machine (SVM) dan Long Short-Term Memory (LSTM) sehingga bisa dibandingkan mana yang lebih baik diantara dua metode tersebut.
Data yang digunakan merupakan data hasil dari crawling yang kemudian dilakukan beberapa pemrosesan sehingga bisa diolah sesuai dengan medel yang ada.
Hasil dari penelitian ini menunjukkan bahwa untuk memprediksi anxiety disorder menggunakan Long Short-Term Memory (LSTM) lebih unggul daripada Support Vector Machine (SVM) dari 3 matriks perhitungan yang ada, yaitu precision, recall, dan f1-score dengan nilai 75%.
Sedangkan, untuk metode Support Vector Machine (SVM) hanya unggul dalam perhitungan nilai akurasi, yaitu 81%.
Kata Kunci: Anxiety Disorder.
Support Vector Machine.
Long Short-Term Memory Abstract - Anxiety disorder is a disorder that attacks a person's mental health so that it can interfere with activities.
The influence of social media is one of the triggers for anxiety disorders, where social media is used as an object to express the feelings experienced by users, for example Twitter or the X application.
This research was conducted to predict the presence of anxiety disorder in Twitter users seen based on existing tweets using two models, namely Support Vector Machine (SVM) and Long Short-Term Memory (LSTM) so that it can be compared which is better between the two methods.
The data used is the result of crawling data which is then subjected to some processing so that it can be processed in accordance with existing models.
The results of this study show that to predict anxiety disorder using Long Short-Term Memory (LSTM) is superior to Support Vector Machine (SVM) from 3 existing calculation matrices, namely precision, recall, and f1-score with a value of 75%.
Meanwhile, the Support Vector Machine (SVM) method is only superior in calculating the accuracy value, which is 81%.
Keywords: Anxiety Disorder.
Support Vector Machine.
Long Short-Term Memory PENDAHULUAN Kecemasan merupakan bagian dari kesehatan mental yang mempengaruhi perasaan seseorang sehingga membuat orang tersebut selalu merasa waswas dan khawatir seolah-olah akan terjadi sesuatu hal buruk dan merasa tidak nyaman seakan ada sebuah ancaman yang disertai dengan beberapa gejala fisik, seperti jantung berdebar-debar, mengeluarkan keringat dingin, dan tangan gemetar (Keliat dkk, 2.
Kaplan .
mengungkapkan bahwa kecemasan atau anxiety disorder merupakan kelompok gangguan psikiatri yang paling sering ditemukan.
National study melaporkan bahwa satu di antara empat orang memenuhi kriteria untuk bisa dikatakan mengidap anxiety disorder.
Menurut hasil Riset Kesehatan Dasar (Riskesda.
pada tahun 2018, jumlah prevalensi terkait anxiety di Indonesia, yaitu sebesar 6 untuk usia 15 tahun keatas atau sekitar 14 juta penduduk Indonesia mengalami gangguan Kesehatan mental yang ditunjukkan dari gejala anxiety dan depresi.
Selain itu, hasil penelitian yang dilakukan oleh Fakultas Kesehatan Universitas Indonesia pada tahun 2021 menemukan bahwa mayoritas remaja dan dewasa muda berusia 16-24 tahun memasuki periode kritis kesehatan mental, dengan persentase bahwa hampir 96% remaja dan dewasa muda 17 mengalami gejala kecemasan .
dan 88% diantaranya mengalami gejala Menurut Elavarasan et al.
, pada penelitiannya http://ejournal.
id/ejurnal/index.
php/jtk This work is licensed under a Creative Commons Attribution-ShareAlike 4.
0 International License Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
menyebutkan bahwa kecanduan media sosial memiliki resiko tiga kali lebih tinggi untuk mengalami anxiety dibanding orang-orang yang tidak kecanduan sosial Di era globalisasi saat ini teknologi berkembang dengan sangat pesat dalam segala bidang.
Adanya internet membuat kemajuan teknologi lebih mendominasi lagi di dunia.
Secara global ada sekitar 4,66 miliyar atau sekitar 59,5% dari total seluruh populasi manusia di seluruh dunia yang telah menggunakan internet.
Dan di Indonesia jumlah pengguna internet menurut Hootsuite (We Are Socia.
telah mencapai 202,6 juta jiwa atau sekitar 73,7% dari total populasi yang ada (We Are Social, & HootSuite.
Media sosial merupakan saluran komunikasi digital yang bisa memberikan ruang bagi penggunanya untuk menciptakan tempat berbagi opini dan informasi dalam segala aspek pembahasan yang ada.
Salah satu contoh media sosial yang bisa dikategorikan sebagai media komunikasi, yaitu aplikasi Twitter atau yang sekarang dikenal sebagai aplikasi X.
Twitter merupakan media sosial daring dan layanan jejaring sosial yang diciptakan oleh Jack Dorsey.
Noah Glass.
Biz Stone, dan Evan Williams pada bulan maret 2006 dan sekarang dioperasikan oleh X Corp yang merupakan sebuah perusahaan yang ada di Amerika Serikat.
Menurut laporan We Are Social yang diunggah oleh databoks.
id ada sekitar 666,2 juta pengguna Twitter di dunia dan ada sekitar 27,5 juta pengguna Twitter yang ada di Indonesia per bulan Oktober 2023 serta Indonesia menduduki peringkat keempat global untuk jumlah pengguna Twitter.
Besarnya pasar Twitter di Indonesia membuat banyak orang menjadikannya sebagai media untuk menyalurkan isi hati mereka bahkan mereka juga menuliskan cuitan mengenai gejala anxiety disorder yang dialaminya.
Hal tersebut bisa dijadikan sebagai bahan penelitian dengan menggunakan beberapa teknik dari machine learning, yaitu Support Vector Machine (SVM) dan Long Short-Term Memory (LSTM).
Oleh karena itu, hipotesis disini bertujuan untuk membandingkan kedua metode tersebut untuk memprediksi adanya gangguan kecemasan atau anxiety disorder para pengguna Twitter berdasarkan cuitan yang diunggah.
Machine learning merupakan sebuah metode komputasi berdasarkan informasi yang telah tersedia sebelumnya untuk meningkatkan performa atau membuat prediksi yang akurat (Mohri et.
al, 2.
Pengembangan machine learning untuk melakukan prediksi terhadap kasus tentang kesehatan mental pernah dilakukan oleh Sofianita et al.
Penelitian ini dilakukan untuk mendapatkan hasil akurasi terbaik dari beberapa algoritma yang ada pada machine learning yang digunakan dalam pendeteksian faktor-faktor yang mempengaruhi kesehatan mental pada suatu Lembaga Pendidikan di Malaysia yang setara dengan Sekolah Menengah Atas di Indonesia.
Output yang dihasilkan, yaitu berupa algoritma yang memiliki nilai akurasi prediksi yang terbaik untuk mendeteksi stress adalah Decision Tree.
Selanjutnya, metode terbaik yang digunakan untuk mendeteksi depresi yaitu Support Vector Machine.
Dan yang terakhir, yaitu metode terbaik yang digunakan untuk mendeteksi kecemasan menurut penelitian tersebut adalah algoritma Linear Regression dan Neural Network yang menghasilkan akurasi sekitar 68%-88%.
Dalam penelitian AuImplementasi Algoritma Nayve Bayes Untuk Analisis Klasifikasi Survei Kesehatan Mental (Studi Kasus: Open Sourcing Mental Illnes.
Ay yang dilakukan oleh Reza et al.
merupakan sebuah penelitian yang dilakukan untuk klasifikasi dan prediksi dari sebuah data survei mengenai pengaruh kesehatan mental dengan objek peneliti para pekerja yang ada di dalam perusahaan industri teknologi.
Penelitian tersebut menggunakan algoritma Nayve Bayes karena tingkat akurasi yang cukup tinggi dan mudah diaplikasikan pada studi kasus yang akan diteliti.
Data yang digunakan diambil dari sebuah website official Open Source Mental Illness yang berkaitan dengan topik yang akan digunakan.
Output yang didapatkan dari penelitian tersebut adalah 72% pada ukuran data uji 30% dan data latih 70% yang hal tersebut merupakan hasil akurasi tertinggi yang bisa didapatkan oleh peneliti menggunakan algoritma Nayve Bayes.
Penelitian yang dilakukan oleh Satrio Yudho et al.
merupakan penelitian yang dilakukan untuk memprediksi hasil akurasi dari sebuah data tentang sikap politik masyarakat terhadap partai politik yang ada di Indonesia.
Data diambil dari animo demokrasi yang ada di aplikasi Twitter pada saat momen pemilu tahun 2019 dengan menggunakan algoritma Support Vector Machine.
Data yang diambil oleh peneliti dipilah menjadi 2 kategori, yaitu positif dan negatif yang kemudian akan dilakukan preprocessing, pembobotan kata dengan TF-IDF, dan yang terakhir baru dilakukan pembuatan model klasifikasi dengan pendekatan Support Vector Machine dan K-Fold Cross Validation untuk menguji tingkat akurasi dari datanya.
Output yang didapatkan dengan total data 900 yaitu diperoleh rata Ae rata akurasi sebesar 71%, error rate sebesar 29%, precision sebesar 73%, recall sebesar 70%, dan f-score sebesar 71%.
Penelitian selanjutnya, yaitu AuAnalisis dan Implementasi Long Short-Term Memory Neural Network untuk Prediksi Harga BitcoinAy yang dilakukan oleh Muhammad Wildan et al.
untuk memprediksi pergerakan kurs nilai tukar pada Bitcoin sehingga bisa mengantisipasi resiko yang mungkin saja bisa terjadi saat berinvestasi menggunakan Bitcoin dengan bantuan algoritma Long Short-Term Memory Neural Network.
Data yang diambil berdasarkan info yang merupakan data jual beli indeks harga Bitcoin terhadap US Dollar.
Output yang didapatkan adalah hasil prediksi harga Bitcoin dengan komposisi data latih 70% dan data uji 30%, parameter 1 pola time series, jumlah 25 neuron hidden, dan max Perbandingan SVM dan LSTM Untuk Memprediksi Gangguan Kecemasan (Anxiety Disorde.
Berdasarkan Cuitan di Platform Aplikasi X (Twitte.
Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
epoch adalah 100 dengan akurasi rata-rata pada data 36% dan data testing 93.
Berdasarkan dari penelitian di atas, dapat disimpulkan bahwa banyak penelitian sebelumnya yang telah membahas mengenai perbandingan beberapa metode untuk melakukan sebuah prediksi terhadap suatu kasus.
Maka, penelitian ini sangat memungkinkan untuk dilakukan oleh karena itu, dalam penelitian ini penulis memutuskan untuk menggunakan algoritma Support Vector Machine (SVM) dan Long Short-Term Memory (LSTM) untuk memprediksi adanya gangguan kecemasan pada pengguna Twitter berdasarkan cuitan yang diunggah sehingga bisa menghasilkan output yang nantinya sesuai dengan apa yang diinginkan penulis.
Dengan dibuatnya penelitian ini, diharapkan nantinya penelitian ini bisa bermanfaat bagi penelitian-penelitian lain dan dapat dikembangkan menjadi sebuah sistem yang kompleks sehingga bisa dimanfaatkan lagi secara lebih luas.
METODE PENELITIAN
Pengambilan Data Pengambilan data atau crawling data dilakukan dengan bantuan script Chromium Browser yang dieksekusi menggunakan Google Colab menggunakan bantuan dari auth token yang dimiliki di Twitter peneliti.
Pengambilan data dilakukan berdasarkan rentang waktu dari tangal 1 Januari 2023 sampai 13 Desember 2023.
Data diambil berdasarkan kata kunci atau keyword yang sesuai dengan topik dari anxiety disorder.
Keyword yang digunakan dalam penelitian ini adalah kata-kata yang mengarah pada adanya indikasi anxiety disorder, misalnya gelisah, takut, cemas, khawatir, panik, resah, stress, dan anxiety.
Data yang diambil di dalam penelitian ini, yaitu 5.
162 data yang disimpan dalam csv dan dapat dibuka secara manual menggunakan Microsoft Excel.
Pra-Pemrosesan Data 1 Cleansing Hal pertama yang dilakukan di dalam tahap preprocessing data yaitu melakukan cleansing dimana kalimat yang ada di dalam data tersebut akan dihilangkan URL, hashtag, karakter HTML, tanda baca, dan emoticon sticker.
Hasil dari proses ini bisa dilihat pada Tabel 1.
Dan kemudian hasil pada proses ini akan dilanjutkan untuk proses preprocessing data Tabel 1.
Hasil Proses Cleansing Tweet Hasil Lagi berusaha mengurangi cemas, dan meredam gejala panik dengan melakukan apapun biar bisa berkurang.
Esok sore kalau dah Lagi berusaha mengurangi cemas dan meredam gejala panik dengan melakukan apapun biar bisa berkurang Esok sore Nurochman.
Luthfia Ashiilah sampai jkt, reda nii yuAyuA kalau dah sampai jkt reda nii @imanlagi Bisa yuk dikit lagi, udah mulai emosi nih wkwk Bisa yuk dikit lagi udah mulai emosi nih wkwk Hari ini gw cemburu bangett liat cewek gw Deket cowok wajarkan gw cemburu meskipun dia cuma sekedar ngobrol dan Krna cemburu itu gw ngalamin kejadian gelisah gemetar pikiran kosong rasa takut, sampai" GK ke kontrol alhasil gw susah nafas GK bisa nafas kayak mau mati Hari ini gw cemburu bangett liat cewek gw Deket cowok wajarkan gw cemburu meskipun dia cuma sekedar ngobrol dan Krna cemburu itu gw ngalamin kejadian gelisah gemetar pikiran kosong rasa takut sampai GK ke kontrol alhasil gw susah nafas GK bisa nafas kayak mau mati jadinya Social culture masyarakat yg bikin hidup jadi ga woles.
Padahal ga ada kewajiban buat kita ngikutin standar hidup kebanyakan Kita ngerasa gelisah krn tanpa sadar masih pay attention ke omongan org yg nyuruh kita begini, begitu.
Pdhal ga didengerin jg gpp Social culture masyarakat yg bikin hidup jadi ga woles Padahal ga ada kewajiban buat kita ngikutin standar hidup kebanyakan orang Kita ngerasa gelisah krn tanpa sadar masih pay attention ke omongan org yg nyuruh kita begini begitu Pdhal ga didengerin jg gpp Sumber: Cuitan aplikasi X (Twitte.
2 Case Folding Setelah proses cleansing dilakukan, data akan lanjut pada proses case folding.
Proses ini dilakukan dengan tujuan untuk mengubah seluruh huruf pada teks menjadi huruf kecil .
ower cas.
sehingga hasil dari kalimat yang ada pada data sama rata dilihat dari komposisi hurufnya.
Hasil dari proses ini bisa dilihat pada Tabel 2.
Dan kemudian hasil pada proses ini akan dilanjutkan untuk proses preprocessing data Tabel 2.
Hasil Proses Case Folding Data Hasil Cleansing Hasil Lagi berusaha mengurangi cemas dan meredam gejala panik dengan melakukan apapun lagi berusaha mengurangi cemas dan meredam gejala panik dengan melakukan apapun biar bisa berkurang esok sore Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
biar bisa berkurang Esok sore kalau dah sampai jkt reda nii kalau dah sampai jkt reda Bisa yuk dikit lagi udah mulai emosi nih wkwk bisa yuk dikit lagi udah mulai emosi nih wkwk Hari ini gw cemburu bangett liat cewek gw Deket cowok wajarkan gw cemburu meskipun dia cuma sekedar ngobrol dan Krna cemburu itu gw ngalamin kejadian gelisah gemetar pikiran kosong rasa takut sampai GK ke kontrol alhasil gw susah nafas GK bisa nafas kayak mau mati jadinya hari ini gw cemburu bangett liat cewek gw deket cowok wajarkan gw cemburu meskipun dia cuma sekedar ngobrol dan krna cemburu itu gw ngalamin kejadian gelisah gemetar pikiran kosong rasa takut sampai gk ke kontrol alhasil gw susah nafas gk bisa nafas kayak mau mati jadinya Social culture masyarakat yg bikin hidup jadi ga woles Padahal ga ada kewajiban buat kita ngikutin standar hidup kebanyakan orang Kita ngerasa gelisah krn tanpa sadar masih pay attention ke omongan org yg nyuruh kita begini begitu Pdhal ga didengerin jg gpp social culture masyarakat yg bikin hidup jadi ga woles padahal ga ada kewajiban buat kita ngikutin standar hidup kebanyakan orang kita ngerasa gelisah krn tanpa sadar masih pay attention ke omongan org yg nyuruh kita begini begitu pdhal ga didengerin jg Sumber: Cuitan aplikasi X (Twitte.
3 Tokenization Jika proses case folding telah dilakukan, maka data akan lanjut pada proses tokenization.
Proses ini dilakukan dengan tujuan untuk memecah kalimat yang ada pada data menjadi bagian yang lebih kecil berupa kata-kata penyusunnya sehingga mempermudah pendeteksian kata yang nantinya akan dihilangkan pada proses filtering/stopword removal.
Hasil dari proses ini bisa dilihat pada Tabel 3.
Dan kemudian hasil pada proses ini akan dilanjutkan untuk proses preprocessing data selanjutnya.
Tabel 3.
Hasil Proses Tokenization Data Hasil Case Folding Hasil lagi berusaha cemas dan meredam gejala panik dengan apapun biar bisa berkurang esok sore kalau dah sampai jkt reda "['lagi', 'berusaha', 'mengurangi', 'cemas', 'dan', 'meredam', 'gejala', 'panik', 'dengan', 'melakukan', 'apapun', 'biar', 'bisa', 'berkurang', 'esok', 'sore', 'kalau', 'dah', 'sampai', 'jkt', 'reda', 'nii']" bisa yuk dikit lagi udah mulai emosi nih wkwk "['bisa', 'yuk', 'dikit', 'lagi', 'udah', 'mulai', 'emosi', 'nih', 'wkwk']" hari ini gw cemburu bangett liat cewek gw deket cowok wajarkan gw meskipun dia cuma sekedar ngobrol dan krna cemburu itu gw ngalamin kejadian gelisah gemetar pikiran kosong rasa takut sampai gk ke kontrol alhasil gw susah nafas gk bisa nafas kayak mau mati jadinya "['hari', 'ini', 'gw', 'cemburu', 'bangett', 'liat', 'cewek', 'gw', 'deket', 'cowok', 'wajarkan', 'gw', 'cemburu', 'meskipun', 'dia', 'cuma', 'sekedar', 'ngobrol', 'dan', 'krna', 'cemburu', 'itu', 'gw', 'ngalamin', 'kejadian', 'gelisah', 'gemetar', 'pikiran', 'kosong', 'rasa', 'takut', 'sampai', 'gk', 'ke', 'kontrol', 'alhasil', 'gw', 'susah', 'nafas', 'gk', 'bisa', 'nafas', 'kayak', 'mau', 'mati', 'jadinya']" social culture masyarakat yg bikin hidup jadi ga woles padahal ga ada kewajiban buat kita ngikutin standar hidup kebanyakan orang kita ngerasa gelisah krn tanpa sadar masih pay attention ke omongan org yg nyuruh kita begini begitu pdhal ga didengerin jg gpp "['social', 'culture', 'masyarakat', 'yg', 'bikin', 'hidup', 'jadi', 'ga', 'woles', 'padahal', 'ga', 'ada', 'kewajiban', 'buat', 'kita', 'ngikutin', 'standar', 'hidup', 'kebanyakan', 'orang', 'kita', 'ngerasa', 'gelisah', 'krn', 'tanpa', 'sadar', 'masih', 'pay', 'attention', 'ke', 'omongan', 'org', 'yg', 'nyuruh', 'kita', 'begini', 'begitu', 'pdhal', 'ga', 'didengerin', 'jg', 'gpp']" Sumber: Cuitan aplikasi X (Twitte.
Perbandingan SVM dan LSTM Untuk Memprediksi Gangguan Kecemasan (Anxiety Disorde.
Berdasarkan Cuitan di Platform Aplikasi X (Twitte.
Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
4 Filtering/Stopword Removal Proses selanjutnya yang akan dilakukan yaitu proses filtering/stopword removal.
Proses ini dilakukan dengan tujuan untuk menghapus kata-kata yang tidak memiliki makna dan tidak berpengaruh pada proses Selain itu, pada proses ini digunakan juga untuk menghapus kata stopword yang juga biasa disebut dengan kata penghubung dari suatu kalimat.
Contoh kata penghubung yang biasa digunakan, yaitu yang, dan, tetapi, atau, dan sebagainya.
Hasil dari proses ini bisa dilihat pada Tabel 4.
Dan kemudian hasil pada proses ini akan dilanjutkan untuk proses preprocessing data selanjutnya.
'gw', 'susah', 'nafas', 'gk', 'bisa', 'nafas', 'kayak', 'mau', 'mati', 'jadinya']" Tabel 4.
Hasil Proses Filtering/Stopwords Removal Data Hasil Tokenization Hasil "['lagi', 'berusaha', 'mengurangi', 'cemas', 'dan', 'meredam', 'gejala', 'panik', 'dengan', 'melakukan', 'apapun', 'biar', 'bisa', 'berkurang', 'esok', 'sore', 'kalau', 'dah', 'sampai', 'jkt', 'reda', 'nii']" "['berusaha', 'mengurangi', 'cemas', 'meredam', 'gejala', 'panik', 'apapun', 'biar', 'berkurang', 'esok', 'sore', 'dah', 'jkt', 'reda', 'nii']" "['bisa', 'yuk', 'dikit', 'lagi', 'udah', 'mulai', 'emosi', 'nih', 'wkwk']" "['yuk', 'dikit', 'udah', 'emosi', 'nih', 'wkwk']" "['hari', 'ini', 'gw', 'cemburu', 'bangett', 'liat', 'cewek', 'gw', 'deket', 'cowok', 'wajarkan', 'gw', 'cemburu', 'meskipun', 'dia', 'cuma', 'sekedar', 'ngobrol', 'dan', 'krna', 'cemburu', 'itu', 'gw', 'ngalamin', 'kejadian', 'gelisah', 'gemetar', 'pikiran', 'kosong', 'rasa', 'takut', 'sampai', 'gk', 'ke', 'kontrol', 'alhasil', "['gw', 'cemburu', 'bangett', 'liat', 'cewek', 'gw', 'deket', 'cowok', 'wajarkan', 'gw', 'cemburu', 'sekedar', 'ngobrol', 'krna', 'cemburu', 'gw', 'ngalamin', 'kejadian', 'gelisah', 'gemetar', 'pikiran', 'kosong', 'takut', 'gk', 'kontrol', 'alhasil', 'gw', 'susah', 'nafas', 'gk', 'nafas', 'kayak', 'mati']" "['social', 'culture', 'masyarakat', 'yg', 'bikin', 'hidup', 'jadi', 'ga', 'woles', 'padahal', 'ga', 'ada', 'kewajiban', 'buat', 'kita', 'ngikutin', 'standar', 'hidup', 'kebanyakan', 'orang', 'kita', 'ngerasa', 'gelisah', 'krn', 'tanpa', 'sadar', 'masih', 'pay', 'attention', 'ke', 'omongan', 'org', 'yg', 'nyuruh', 'kita', 'begini', 'begitu', 'pdhal', 'ga', 'didengerin', 'jg', 'gpp']" "['social', 'culture', 'masyarakat', 'yg', 'bikin', 'hidup', 'ga', 'woles', 'ga', 'kewajiban', 'ngikutin', 'standar', 'hidup', 'kebanyakan', 'orang', 'ngerasa', 'gelisah', 'krn', 'sadar', 'pay', 'attention', 'omongan', 'org', 'yg', 'nyuruh', 'pdhal', 'ga', 'didengerin', 'jg', 'gpp']" Sumber: Cuitan aplikasi X (Twitte.
Nurochman.
Luthfia Ashiilah 5 Stemming Proses terakhir yang dilakukan pada tahap preprocessing data, yaitu proses stemming.
Proses ini dilakukan dengan tujuan untuk menghilangkan imbuhan pada kata yang ada sehingga mengurangi ambiguitas yang bisa mengganggu proses identifikasi dan juga bisa membantu meningkatkan akurasi dalam proses penelitian ini karena stemming juga mengurangi keberagaman kata dalam suatu kalimat.
Hasil dari proses ini bisa dilihat pada Tabel 5.
Dan kemudian hasil pada proses ini akan dilanjutkan untuk tahap selanjutnya, yaitu tahap labeling data.
Tabel 5.
Hasil Proses Stemming Data Hasil Filtering/Stopword Removal "['berusaha', 'mengurangi', 'cemas', 'meredam', 'gejala', 'panik', 'apapun', 'biar', 'berkurang', 'esok', 'sore', 'dah', 'jkt', 'reda', 'nii']" Hasil usaha kurang cemas redam gejala panik apa biar kurang esok sore dah jkt reda nii Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
"['yuk', 'dikit', 'udah', 'emosi', 'nih', 'wkwk']" yuk dikit udah emosi nih "['gw', 'cemburu', 'bangett', 'liat', 'cewek', 'gw', 'deket', 'cowok', 'wajarkan', 'gw', 'cemburu', 'sekedar', 'ngobrol', 'krna', 'cemburu', 'gw', 'ngalamin', 'kejadian', 'gelisah', 'gemetar', 'pikiran', 'kosong', 'takut', 'gk', 'kontrol', 'alhasil', 'gw', 'susah', 'nafas', 'gk', 'nafas', 'kayak', 'mati']" gw cemburu bangett liat cewek gw deket cowok wajar gw cemburu dar ngobrol krna cemburu gw ngalamin jadi gelisah gemetar pikir kosong takut gk kontrol alhasil gw susah nafas gk nafas kayak mati "['social', 'culture', 'masyarakat', 'yg', 'bikin', 'hidup', 'ga', 'woles', 'ga', 'kewajiban', 'ngikutin', 'standar', 'hidup', 'kebanyakan', 'orang', 'ngerasa', 'gelisah', 'krn', 'sadar', 'pay', 'attention', 'omongan', 'org', 'yg', 'nyuruh', 'pdhal', 'ga', 'didengerin', 'jg', 'gpp']" social culture masyarakat yg bikin hidup ga woles ga wajib ngikutin standar hidup banyak orang ngerasa gelisah krn sadar pay attention omong org yg nyuruh pdhal ga didengerin jg gpp Sumber: Cuitan aplikasi X (Twitte.
3 Labeling Data Tahap preprocessing data, yaitu tahap labeling data.
Pada tahap ini akan dilakukan pelebelan terhadap data yang tersedia sehingga nantinya data bisa digunakan pada tahap selanjutnya.
Pelabelan dari setiap data akan menggunakan algoritma Transformers dimana algoritma ini memiliki mekanisme otomatis dalam melakukan suatu pelabelan data dan juga merupakan salah satu model dari Natural Language Processing yang menyediakan arsitektur lengkap untuk dilakukan proses representasi data yang kemudian akan diolah lagi sehingga menghasilkan data yang telah mendapatkan label, baik itu positif atau negatif.
Pada tahap labeling data ini ada sekitar 5.
data yang dilakukan pelabelan dan jumlah tersebut berkurang jika dilihat dari data hasil crawling.
Pengurangan data itu terjadi pada saat tahap Pada tahap itu data yang sama akan di take out dari dataset sehingga semua data yang ada di dalamnya merupakan data tunggal.
Hasil dari labeling ini, yaitu ada sekitar 3886 data berlabel negatif dan 1147 data berlabel positif.
Hasil dari tahap ini bisa dilihat pada Tabel 6.
Tabel 6.
Hasil Labeling Data Hasil Preprocessing Data Label usaha kurang cemas redam gejala panik apa biar kurang esok sore dah jkt reda nii Negatif yuk dikit udah emosi nih Positif gw cemburu bangett liat cewek gw deket cowok wajar gw cemburu dar ngobrol krna cemburu gw ngalamin jadi gelisah gemetar pikir kosong takut gk kontrol alhasil gw susah nafas gk nafas kayak Negatif social culture masyarakat yg bikin hidup ga woles ga wajib ngikutin standar hidup banyak orang ngerasa gelisah krn sadar pay attention omong org yg nyuruh pdhal ga didengerin jg gpp Positive Sumber: Cuitan aplikasi X (Twitte.
4 Modeling Support Vector Machine (SVM) Pada tahap pemodelan topik untuk metode Support Vector Machine (SVM) dilakukan menggunakan bantuan library Scikit-Learn yang merupakan package yang dimiliki oleh bahasa pemrograman Python mengimplementasikan kode.
Pada metode ini data akan dibagi menjadi dua bagian, yaitu data training dan data testing dengan melakukan empat jenis percobaan yang berbeda dilihat berdasarkan perbedaan perbandingan jumlah data training dan data testing.
Setelah itu, metode Support Vector Machine (SVM) akan mengimplementasi TF-IDF (Term Frequency-Inverse Document Frequenc.
untuk melengkapi kode yang akan digunakan sehingga saat dilakukan tahap uji coba mendapatkan hasil yang sesuai denga napa yang diinginkan oleh penulis.
Berikut merupakan parameter yang digunakan di dalam metode Support Vector Machine (SVM) yang bisa dilihat pada Gambar 1.
Perbandingan SVM dan LSTM Untuk Memprediksi Gangguan Kecemasan (Anxiety Disorde.
Berdasarkan Cuitan di Platform Aplikasi X (Twitte.
Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
Gambar 2.
Parameter LSTM Gambar 1.
Parameter SVM 5 Modeling Long Short-Term Memory (LSTM) Pada tahap pemodelan topik untuk metode Long Short-Term Memory (LSTM) dilakukan menggunakan bantuan dari library TensorFlow yang merupakan package yang dimiliki oleh bahasa pemrograman Python sehingga memudahkan peneliti saat mengimplementasikan kode.
Pada metode ini dibutuhkan tokenizer untuk memecah kalimat yang ada pada dataset menjadi bagian yang lebih kecil dimana setiap kata dari sebuah kalimat akan mendapatkan penomorannya masing-masing dengan ketentuan kata yang memiliki frekuensi paling banyak akan menjadi kata awal yang mendapatkan penomoran dan seterusnya sampai semua kata tersebut habis teridentifikasi sehingga memudahkan proses yang akan dilalui selanjutnya.
Setelah tokenizer selesai, akan dilakukan proses sequences, dimana sequences tersebut akan diterapkan pada dataset untuk mengubah kalimat dari satu dataset menjadi bagian-bagian bernomor sesuai dengan nomor yang sudah dijabarkan oleh tokenizer sebelumnya.
Selanjutnya akan dilakukan pelapisan kalimat supaya setiap dataset yang ada memiliki panjang kalimat yang sama, yaitu maksimal 250 kata yang telah diimplementasikan ke dalam setiap nomor dari setiap kata yang ada.
Sebelum dilakukan penentuan pada parameter metode ini, dibuatlah terlebih dahulu variable yang akan merepresentasikan data training dan data testing yang nantinya akan diujikan.
Dan proses terakhir sebelum melakukan pengujian data, yaitu melakukan klasifikasi terhadap Long Short-Term Memory (LSTM) itu sendiri dengan menentukan atribut parameter yang akan digunakan di dalam penelitian ini.
Atribut yang digunakan dapat dilihat pada Gambar 2.
9 Pengujian Data Pada tahap ini akan dilakukan pengujian data terhadap dataset yang sebelumnya telah dilakukan Nurochman.
Luthfia Ashiilah preprocessing dan labeling data.
Dimana di dalam masing-masing metode sudah diimplementasikan parameter-parameter yang dibutuhkan dan beberapa atribut lainnya sehingga tahap pengujian data bisa Untuk metode Support Vector Machine (SVM), data siap uji akan dilakukan penghitungan menggunakan confusion matrix dimana hasil yang didapatkan nanti bisa digunakan untuk melakukan evaluasi terhadap performa dari metode Support Vector Machine (SVM).
Dan untuk metode Long Short-Term Memory (LSTM) akan memanfaatkan atribut parameter yang telah ditentukan sebelumnya untuk mengeksekusi dataset berdasarkan beberapa jumlah Masing-masing jumlah epoch yang dilakukan tahap pengujian data ini akan menghasilkan nilai accuracy dan nilai loss yang berbeda-beda sehingga bisa dilakukan pengamatan sehingga mendapatkan hasil yang digunakan untuk melakukan evaluasi terhadap performa dari metode Long Short-Term Memory (LSTM).
HASIL DAN PEMBAHASAN
1 Support Vector Machine (SVM) Hasil pengujian data pada metode Support Vector Machine (SVM) untuk mendeteksi adanya gejala anxiety disorder berdasarkan kicauan di Twitter dilakukan menggunakan empat kali percobaan dilihat dari perbandingan rasio data training dan data testing.
Empat percobaan tersebut dilakukan dengan perbandingan data training dan data testing, yaitu 50:50, 60:40, 70:30, dan 80:20.
Pada Tabel 7 berikut merupakan hasil performa dari masing-masing percobaan dilihat berdasarkan confusion matrix yang telah diujikan terhadap dataset.
Tabel 7.
Perbandingan Hasil Confusion Matrix Metode SVM Data Data Latih Uji Accuracy Pre Recall f1-Score Jurnal Teknik Komputer AMIK BSI.
Volume 10.
No.
Juli 2024 P-ISSN 2442-2436.
E-ISSN: 2550-0120
0,80
0,71
0,56
0,63
0,79
0,70
0,56
0,62
0,80
0,74
0,58
0,65 Rasio Data Latih-Uji 0,65 0,81 0,74 0,57 Tabel 8.
b Perbandingan Hasil Confusion Matrix Metode LSTM
Val_ Val_ Val_ Acc
Prec
Recall Val_f1Score 0,75 0,75 0,75 0,75 Epoch
Sumber: Hasil eksperimentasi SVM
0,7252
0,7252
0,7252
0,7252
Berdasarkan Tabel 7 di atas yang memiliki hasil pengujian paling optimal untuk akurasi, precision, dan f1-score diantara empat kali percobaan, yaitu pada percobaan ke 4.
Nilai accuracy yang dihasilkan terhadap percobaan tersebut, yaitu 81% dengan nilai precision 74%, nilai recall 57%, dan nilai dari F1-Score Dan untuk percobaan ke-3 memiliki hasil pengujian paling optimal untuk precision, recall, dan f1-score.
Nilai accuracy yang dihasilkan terhadap percobaan tersebut, yaitu 80% dengan nilai precision 74%, nilai recall 58%, dan nilai dari F1-Score 65%.
0,7144
0,7144
0,7144
0,7144
0,7343
0,7343
0,7343
0,7343
0,7477
0,7477
0,7477
0,7477
0,7457
0,7457
0,7457
0,7457
2 Long Short-Term Memory (LSTM) Hasil pengujian ini dilakukan untuk menentukan nilai akurasi terbaik dari Long Short-Term Memory (LSTM) untuk mendeteksi adanya gejala anxiety disorder berdasarkan kicauan di Twitter dengan cara menggunkan rasio dari data training dan data testing yang didapatkan dari dataset yang ada.
Rasio data training dan data testing yang akan dilakukan empat kali percobaan pada sistem yang telah dibuat akan ditentukan berdasarkan dengan perbandingan 50:50, 60:40, 70:30 dan 80:20.
Dilihat dari Tabel 4.
dapat disimpulkan bahwa untuk pengujian data paling optimal pada metode Long Short-Term Memory (LSTM), yaitu terjadi pada perbandingan data 80:20 dengan epoch 60 yang menghasilkan validation accuracy, validation precision, validation recall, dan validation f1-score berjumlah sama, yaitu 0,75 atau Tabel 8.
a Perbandingan Hasil Confusion Matrix Metode LSTM
Rasio
Data
Latih-Uji Epoch
0,9994
0,9994
0,9994
0,9994
0,998
0,998
0,998
0,998
Acc
Prec
Sumber: Hasil eksperimentasi LSTM
Recall f1Score
Sumber: Hasil eksperimentasi LSTM
KESIMPULAN
Berdasarkan penelitian yang telah dilakukan untuk menyelesaikan tugas akhir ini, dapat disimpulkan bahwa model Support Vector Machine (SVM) dan Long Short-Term Memory (LSTM) yang dibangun untuk melakukan pengujian terhadap data kicauan dari Twitter untuk memprediksi gangguan kecemasan .
nxiety disorde.
berhasil dilakukan.
Hasil yang di dapat dari penelitian ini, yaitu bahwa untuk anxiety disorder penggunaan metode Long Short-Term Memory (LSTM) lebih unggul daripada Support Vector Machine (SVM) dari 3 matriks perhitungan yang ada, yaitu precision, recall, dan f1-score dengan nilai 75%.
Sedangkan, untuk metode Support Vector Machine (SVM) hanya unggul dalam perhitungan nilai akurasi, yaitu 81%.
Saran untuk penelitian selanjutnya, yaitu penelitian bisa dilakukan lebih mendetail berdasrkan aspek lain, penelitian selanjutnya juga bisa menggunakan dataset dengan jumlah yang lebih banyak lagi sehingga kualitas penelitian meningkat, dan parameter yang digunakan juga bisa lebih bervariasi sehingga mendapatkan hasil yang lebih baik.
REFERENSI