Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: 75-81 E-ISSN 2460-9552 P-ISSN 2620-3227 Article history Received July 22, 2024 Accepted Nov 30, 2024 Published Nov 30, 2024 ANALISIS SENTIMEN MASYARAKAT TERHADAP KESEHATAN MENTAL PADA MEDIA SOSIAL TWITTER DENGAN MENGGUNAKAN MACHINE LEARNING Hudatul Aulia. Muhammad Zulfadhilah. Septyan Eka Prastya. Muhammad Syahid Pebriadi. Program Studi Sarjana Teknologi Informasi. Fakultas Sains dan Teknologi. Universitas Sari Mulia Program Studi Komputerisasi Akuntansi. Jurusan Akuntansi. Politeknik Negri Banjarmasin email: auliahuda96@gmail. Abstract Mental health affects lives globally, with around 300 million people experiencing depression in 2019, 6 million in Indonesia. The Covid-19 pandemic increased cases of anxiety and depression, and by 2022. WHO reported 23 million people suffering from psychiatric disorders. In Indonesia, adolescent mental health issues are also high, with excessive social media use linked to an increase in emotional disorders. Twitter, with its real-time data, is becoming an important tool for analyzing public sentiment and understanding opinions through analytics and machine learning techniques. This study aims to determine public sentiment towards mental health in Indonesia through Twitter social media and test the effectiveness of using machine learning in sentiment analysis. The results show that the Naive Bayes and Decision Tree methods are effective in analyzing sentiment, with an accuracy of 91% and 89% respectively. The average result of cross validation shows a value of 73. 21% for Naive Bayes 02% for Decision Tree. In this study, positive sentiment is more dominant with a percentage value of 78. 7%, while negative sentiment is only 21. The findings indicate that Indonesians' awareness of the importance of mental health is increasing, and they increasingly understand the importance of maintaining mental health. Keywords: decision tree, mental health, machine learning, naive bayes. Abstrak Kesehatan mental sangat mempengaruhi kehidupan global, dengan sekitar 300 juta orang mengalami depresi pada 2019, termasuk 15,6 juta di Indonesia. Pandemi Covid-19 meningkatkan kasus kecemasan dan depresi, dan pada 2022. WHO melaporkan 23 juta orang menderita gangguan kejiwaan. Indonesia, masalah kesehatan mental remaja juga tinggi, dengan penggunaan media sosial berlebihan terkait peningkatan gangguan emosional. Twitter, dengan data real-time, menjadi alat penting untuk menganalisis sentimen publik dan memahami opini melalui teknik analisis dan machine learning. Penelitian ini bertujuan untuk mengetahui sentimen masyarakat terhadap kesehatan mental di Indonesia melalui media sosial Twitter serta menguji keefektifan penggunaan machine learning dalam analisis Hasil penelitian menunjukkan bahwa metode Naive Bayes dan Decision Tree efektif dalam menganalisis sentimen, dengan akurasi sebesar 91% dan 89% masing-masing. Rerata hasil dari cross validation menunjukkan nilai 73,21% untuk Naive Bayes dan 67,02% untuk Decision Tree. Pada penelitian ini sentimen positif lebih dominan dengan persentase nilai 78,7%, sementara sentimen negatif hanya 21,3%. Temuan ini mengindikasikan bahwa kesadaran masyarakat Indonesia tentang pentingnya kesehatan mental semakin meningkat, dan mereka semakin memahami pentingnya menjaga kesehatan Kata Kunci: decision tree, kesehatan mental, machine learning, naive bayes. INTRODUCTION Keadaan mental yang sehat sangat penting dan berpengaruh besar pada kehidupan setiap individu . Menurut data Organisasi Kesehatan Dunia (WHO) pada tahun 2019, sekitar 300 juta orang di seluruh dunia mengalami depresi, termasuk 15,6 juta penduduk Indonesia . Pada tahun 2020, gangguan kecemasan meningkat sebesar 26% dan depresi sebesar 28% akibat pandemi Covid-19 . Pada tahun 2022. WHO menyatakan ada sekitar 23 juta orang yang menderita gangguan kejiwaan seperti skizofrenia atau psikosis. Dari jumlah tersebut, hanya 31,3% yang menerima layanan dari spesialis jiwa . Di Indonesia, masalah kesehatan mental juga tinggi di kalangan remaja. Berdasarkan data Survei Kesehatan Jiwa Remaja Nasional Indonesia tahun 2022, terdapat 15,5 juta . ,9%) remaja yang mengalami masalah kejiwaan, dengan 2,45 juta . ,5%) di antaranya menderita gangguan jiwa. Dari jumlah tersebut, hanya 2,6% yang menggunakan layanan konseling untuk masalah emosional dan perilaku . Penelitian yang dilakukan merujuk pada penelitian sebelumnya yang mengaitkan media sosial dengan kesehatan mental . Ae. Data tersebut tentu menjadi perbincangan di kalangan pengguna media sosial. Survei Kesehatan Jiwa Remaja Nasional Indonesia tahun 2022 memperkirakan bahwa setidaknya sepertiga anak usia 10 hingga 13 tahun mengalami masalah kesehatan jiwa. Angka serupa juga ditemukan pada remaja berusia 14 hingga 17 tahun. Jika dianalisis berdasarkan jenisnya, setidaknya 10,6% generasi milenial memiliki masalah terkait Attention Deficit Hyperactivity Disorder (ADHD). Semakin lama remaja menggunakan media sosial, semakin berdampak pada kesehatan mental mereka, karena mereka cenderung fokus pada diri sendiri atau dunianya sendiri dan menjadi kecanduan menggunakan media sosial . , . Twitter adalah platform media sosial yang banyak digunakan di seluruh dunia untuk Twitter menyediakan data dalam jumlah besar yang dapat diakses oleh masyarakat umum secara real-time, sehingga dapat melacak tren dan peristiwa yang sedang ramai diperbincangkan . Berdasarkan demografi pengguna Twitter di Indonesia, 53% pengguna adalah laki-laki dan 47% perempuan, mayoritas berusia 16-22 tahun. Pengguna Twitter di Indonesia aktif sebesar 42% setiap hari . Hal ini membuka peluang untuk melakukan analisis sentimen menggunakan data dari media sosial Twitter. Analisis sentimen adalah proses menganalisis teks digital untuk menentukan apakah teks tersebut bernilai positif atau negatif. Biasanya dilakukan dengan mengidentifikasi kata dan frasa positif atau negatif untuk menemukan pola penggunaan kata tersebut . Tujuannya adalah mengetahui pendapat, perilaku, atau perasaan seseorang yang diungkapkan dalam tulisan seperti postingan media sosial, komentar, survei, atau bentuk tulisan lainnya . Informasi di jejaring sosial Twitter umumnya tidak terstruktur sehingga data harus diproses ulang menggunakan pre-processing dan pelabelan untuk mengklasifikasikan tingkat emosi dalam teks. Untuk melakukan analisis sentimen diperlukan algoritma yang mendukung seperti machine Contoh penggunaan algoritma machine learning terdapat pada penelitian yang dilakukan oleh Harahap, mengenai Analisis Sentimen Review Penjualan Produk UMKM di Kabupaten Nias yang menggunakan metode Naive Bayes (NB). Support Vector Machine (SVM). K-Nearest Neighbor (KNN), dan Artificial Neural Network (ANN) dengan akurasi mencapai 96% . Penelitian yang dilakukan oleh Yuniar, mengenai Implementasi Scraping Data untuk Sentimen Analisis Pengguna Dompet Digital menunjukkan sentimen positif dari akun Twitter Gopay sebesar 79,6% dan LinkAja sebesar 62,1%. Sentimen negatif dari Gopay adalah 20,4% dan dari LinkAja adalah 37,9%. Hasil pengujian juga mencatat recall 87% untuk Gopay dan 89% untuk LinkAja . Dan penelitian yang dilakukan oleh Putra & Santika, mengenai Implementasi Machine Learning Penentuan Rekomendasi Musik dengan Metode ContentBased Filtering menghasilkan nilai recall antara 0,150 hingga 0,200 dan presisi antara 0,015 hingga 0,125, memastikan rekomendasi musik sesuai dengan preferensi pengguna . Penelitian ini bertujuan untuk mengetahui sentimen masyarakat terhadap kesehatan mental di Indonesia melalui media sosial Twitter, serta menguji apakah machine learning dapat digunakan untuk menganalisis sentimen tersebut. Hasil analisis sentimen masyarakat terhadap kesehatan mental di Indonesia melalui Twitter akan dievaluasi menggunakan teknik machine Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: 75-81 LITERATURE REVIEW Penelitian tentang kesehatan mental di Indonesia menunjukkan bahwa kesehatan mental yang sehat sangat penting dan berpengaruh pada kehidupan individu . Terdapat sekitar 300 juta orang di dunia mengidap depresi, termasuk 15,6 juta di Indonesia . Gangguan kecemasan dan depresi meningkat signifikan akibat pandemi Covid-19 . , sementara hanya 31,3% penderita gangguan kejiwaan yang menerima layanan spesialis jiwa . Kesehatan mental remaja di Indonesia juga menjadi perhatian utama. Data Survei Kesehatan Jiwa Remaja Nasional Indonesia tahun 2022 menunjukkan 15,5 juta . ,9%) remaja menderita masalah kejiwaan, dengan 2,45 juta . ,5%) di antaranya mengalami gangguan jiwa. Namun, hanya 2,6% dari mereka yang menggunakan layanan konseling untuk masalah emosional dan perilaku . Persentase masalah mental tertinggi dalam rentang 2020-2022 ditemukan di Nusa Tenggara Barat . 3%). Yogyakarta . 7%), Jawa Tengah . 6%). Gorontalo . 1%), dan Kalimantan Selatan . %) . Penelitian ini didasarkan pada penelitian sebelumnya yang meneliti hubungan antara media sosial dan kesehatan mental . Ae. Survei Kesehatan Jiwa Remaja Nasional Indonesia tahun 2022 memperkirakan bahwa sepertiga anak usia 10-13 tahun mengalami masalah kesehatan jiwa, dengan angka serupa pada remaja berusia 14-17 Sekitar 10,6% generasi milenial memiliki masalah terkait Attention Deficit Hyperactivity Disorder (ADHD). Penggunaan media sosial yang berlebihan dapat berdampak negatif pada kecanduan dan isolasi . , . Twitter adalah platform media sosial yang populer dan menyediakan data dalam jumlah besar yang dapat diakses secara real-time . Berdasarkan demografi pengguna Twitter di Indonesia, 53% pengguna adalah laki-laki dan 47% perempuan, mayoritas berusia 16-22 tahun, dengan 42% pengguna aktif setiap hari . Hal ini membuka peluang untuk melakukan analisis sentimen menggunakan data dari Twitter. Analisis menganalisis teks digital untuk menentukan apakah teks tersebut bernilai positif atau negatif, biasanya dengan mengidentifikasi kata dan frasa yang bersifat positif atau negatif . Data Twitter yang tidak terstruktur memerlukan E-ISSN 2460-9552 P-ISSN 2620-3227 mengklasifikasikan tingkat emosi dalam teks. Algoritma machine learning mendukung analisis sentimen ini. Ada beberapa contoh penerapan algoritma machine learning, seperti dalam penelitian yang dilakukan oleh Harahap . menggunakan algoritma machine learning seperti Naive Bayes (NB). Support Vector Machine (SVM). K-Nearest Neighbor (KNN), dan Artificial Neural Network (ANN) untuk analisis sentimen review penjualan produk UMKM, menghasilkan akurasi 96%. Penelitian yang dilakukan oleh Yuniar . melakukan analisis sentimen pengguna Dompet Digital menggunakan algoritma machine learning, menemukan sentimen positif pada akun Twitter Gopay sebesar 79,6% dan LinkAja 62,1%. Dan penelitian yang dilakukan oleh Putra & Santika . menggunakan machine learning menghasilkan recall antara 0,150-0,200 dan presisi antara 0,015-0,125, menunjukkan rekomendasi sesuai preferensi pengguna. Literature review ini menyoroti pentingnya memahami kondisi kesehatan mental global dan lokal, terutama di kalangan remaja Indonesia. Penggunaan media sosial, khususnya Twitter, memberikan data berharga untuk analisis Implementasi algoritma machine learning dalam analisis sentimen menunjukkan potensi besar dalam mengungkap pola dan tren dalam data media sosial, yang dapat digunakan untuk intervensi yang lebih baik dalam kesehatan Penelitian lebih lanjut diperlukan untuk terus mengevaluasi dan memperbaiki metode yang ada guna mendukung kesehatan mental yang lebih baik melalui teknologi dan data digital. HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan pada penelitian ini adalah tweet masyarakat dari media sosial twitter. Data dikumpulkan menggunakan metode crawling dengan memanfaatkan Google Colab dan fungsi tool tweet-harvest, diperlukan auth_token sebagai akses masuk pada halaman pencarian Twitter. Data yang berhubungan dengan kata kunci Aukesehatan mentalAy dalam rentang waktu 1 januari 2021 sampai 29 februari 2024 di crawling dan disimpan dalam bentuk file Secara rinci pembagian rentang waktu crawling data dan hasil dari crawling data dapat dilihat pada tabel 1. Tabel 1. Rentang waktu dan hasil crawling data Rentang Waktu 01 Januari 2021 Ae 31 Desember 2021 01 Januari 2022 Ae 31 Desember 2022 01 Januari 2023 Ae 31 Desember 2023 01 Januari 2024 Ae 29 Februari 2024 Data yang Didapat Preprocessing Pada penelitian ini, tahap preprocessing dilakukan menggunakan Google Colab, dengan langkah-langkah seperti cleaning data, case folding, normalisasi, stopword, tokenisasi, dan Contoh data hasil preprocessing dapat dilihat pada Tabel 2. Tabel 2. Preprocessing Tahapan Data Tweet Asli Cleaning data Case Folding Normalisasi Stopword Tokenisasi Stemming Hasil GILa NGEBAYANGINNYA BIKIN GUE TERPUKAU ABIS PEN IKUT yuAyuA research tentang permasalahan kesehatan mental gitu, terus nge-influence banyak orang tentang mental health, astaga keren banget yuAyuA kek. woi sumpah yuAyuAyuAyuAyuAyAAyAuAyAuhttps://t. o/6KVyuhGbS9https://t. co/UvM9UZF2N #kesehatanmental #mentalhealth #Psikologi GILa NGEBAYANGINNYA BIKIN GUE TERPUKAU ABIS PEN IKUT research tentang permasalahan kesehatan mental gitu terus nge-influence banyak orang tentang mental health astaga keren banget kek woi sumpah bingung maju gak ya gila ngebayanginnya bikin gue terpukau abis pen ikut research tentang permasalahan kesehatan mental gitu terus nge-influence banyak orang tentang mental health astaga keren banget kek woi sumpah bingung maju gak ya gila ngebayangin bikin saya terpukau abis pengen ikut research tentang permasalahan kesehatan mental gitu terus nge-influence banyak orang tentang mental health astaga keren banget kek woi sumpah bingung maju gak ya gila ngebayangin bikin saya terpukau abis pengen ikut research permasalahan kesehatan mental gitu nge-influence orang mental health astaga keren woi sumpah bingung maju gak ya ['gila', 'ngebayangin', 'bikin', 'saya', 'terpukau', 'abis', 'pengen', 'ikut', 'research', 'permasalahan', 'kesehatan', 'mental', 'gitu', 'nge-influence', 'orang', 'mental', 'health', 'astaga', 'keren', 'woi', 'sumpah', 'bingung', 'maju', 'gak', 'ya'] gila bayang bikin saya pukau abis pengen ikut research masalah sehat mental gitu influence orang mental health astaga keren woi sumpah bingung maju gak ya Labeling Data di labeling secara otomatis menggunakan library translate dengan fungsi convert_eng untuk menerjemahkan tweet dari Bahasa Indonesia ke Bahasa Inggris . Setiap tweet diterjemahkan dan disimpan dalam kolom tweet_english. Hasil dari proses labeling dapat dilihat pada tabel 3. Tabel 3. Hasil labeling dengan Python mental health issues isu sehat mental rupa salah satu isu masyarakat utama stigma masyarakat derita makanya perlu ada edukasi masyarakat kena mental health buah utas mungkin milik pandang beda apa sehat mental anggap mental health bukan masalah arti jadi sulit bicara orang masalah alami gak salah sehat mental gw nyalahin nasibkeadaan tuhan yme aja deh mental health gw tetep jadi prioritas tweet_ english mental health issues mental health issues in the form of one of the issues can be stigmatized negatively the main stigma of the community is suffering so there needs to be education for people affected by mental health example some people may have different views what is mental health think mental health is not a matter of meaning so it is difficult for people to talk about natural its not wrong to be mentally healthy i blame the fate of gods existence just like mental health im still a priority Dari 1051 tweet, setelah proses labeling, terdapat 748 sentimen positif dan 303 sentimen negatif. Sentimen netral tidak dianalisis karena sering kali tidak jelas dan sulit diinterpretasikan . Hasil penelitian pada gambar 1 menunjukkan 75% sentimen positif dan 25% sentimen negatif dari total 1051 data. Gambar 1. Persentase labeling dengan Python Visualisasi Pada tahap visualisasi, semua data digabungkan menjadi satu string menggunakan list comprehension, dan kamus stopword digunakan untuk menghilangkan kata yang tidak bermakna. Visualisasi bertujuan menampilkan kata-kata yang sering muncul. Wordcloud, sebagai representasi visual dari frekuensi kata, menampilkan kata-kata yang lebih sering muncul dengan ukuran lebih besar. Hasil visualisasi dapat dilihat pada gambar 2. Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: 75-81 E-ISSN 2460-9552 P-ISSN 2620-3227 Evaluasi Pada penelitian ini, evaluasi model menggunakan metrik seperti Precision. F-1 Score, dan Recall . untuk mengevaluasi kinerja model Naive Bayes dan Decision Tree dalam mengidentifikasi analisis sentimen. Hasil evaluasi dapat dilihat pada tabel 5 dan tabel 6. Tabel 5. Evaluasi Model Naive Bayes Positif Negatif Gambar 2. Visualisasi Wordcloud Analisis Sentimen Pada tahap ini akan melakukan perbandingan metode Naive Bayes dan Decision Tree dengan k=5. Data dibagi dengan rasio 80:20, yaitu 80% untuk data latih dan 20% untuk data uji, karena rasio ini dianggap optimal dan memberikan nilai akurasi tertinggi . Setelah data dibagi dengan rasio 80:20, data diuji menggunakan metode Naive Bayes untuk melihat nilai akurasi, dan didapatkan akurasi sebesar 0. 91%, kemudian dilakukan validasi silang menggunakan teknik Kkfold yang menghasilkan rerata akurasi 73. menunjukkan kinerja stabil dan konsisten. Kemudian data di labeling dengan metode Naive Bayes, didapatkan 827 data sentimen positif atau sama dengan 78. 7% dan 224 data sentimen negatif atau sama dengan 21. 3% dari total 1051 Sementara itu, data juga diuji menggunakan metode Decision Tree yang menghasilkan nilai akurasi sebesar 0. 89%, dengan validasi silang menggunakan teknik K-kfold yang menunjukkan rerata akurasi 67. 02%, menunjukkan kinerja stabil dan konsisten. Kemudian data di labeling dengan metode Decision Tree, didapatkan 787 data sentimen positif atau sama dengan 74. 9% dan 264 data sentimen negatif atau sama dengan 1% dari total 1051 data. Perbandingan keseluruhan analisis sentimen pada dataset dapat dilihat pada Tabel 4. Tabel 4. Hasil perbandingan analisis sentimen Metode Rasio data train Akurasi Rerata cross validation Jumlah sentimen Positif Persentase Jumlah sentimen negatif Persentase Total data Naive Bayes 80:20 Decision Tree 80:20 Precision F-1 Score Recall Tabel 6. Evaluasi Model Decision Tree Positif Negatif Precision F-1 Score Recall PENUTUP Kesimpulan Dari hasil penelitian, sentimen terhadap kesehatan mental di Indonesia cenderung positif dengan hasil sebanyak 748 tweet positif dan 303 tweet negatif setelah proses labeling menggunakan library Python. Metode Naive Bayes memperoleh 827 tweet positif dan 224 tweet negatif, sedangkan metode Decision Tree menghasilkan 787 tweet positif dan 264 tweet negatif. Evaluasi menunjukkan metode Naive Bayes memiliki akurasi 91% dengan rerata 73. 21% dari cross validation, serta nilai evaluasi yang tinggi seperti precision 89%, f1-score 94%, dan recall 99% untuk sentimen positif. Metode Decision Tree mencapai akurasi 89% dengan rerata cross 02%, dan evaluasi precision 91%, f1-score 94%, dan recall 96% untuk sentimen Hasil ini menunjukkan bahwa machine learning efektif digunakan dalam analisis sentimen masyarakat terhadap kesehatan mental di Indonesia, dengan di dominasi sentimen positif 7% dan sentimen negatif 21. Ini masyarakat terhadap pentingnya menjaga kesehatan mental. Saran Setelah hasil penelitian didapatkan, penulis menyarankan untuk penelitian selanjutnya melakukan penggunaan dataset yang lebih besar guna meningkatkan generalisabilitas dan mengungkap batasan serta pola yang mungkin tidak terdeteksi sebelumnya. Analisis mendalam pada berbagai kondisi data yang berbeda diharapkan dapat memberikan pemahaman yang lebih baik tentang perilaku model atau algoritma yang digunakan, memacu kemajuan dalam studi kesehatan mental. Disarankan pula untuk menguji dengan menggunakan metode lain serta memperluas penelitian dengan data dari platform media sosial lain. Pendekatan yang beragam ini diharapkan dapat memperdalam pemahaman tentang keandalan dan validitas hasil, serta mendapatkan wawasan yang lebih komprehensif mengenai perilaku, preferensi, dan tren terkait kesehatan mental. REFERENSI