472 Progresif: Jurnal Ilmiah Komputer https://ojs. stmik-banjarbaru. id/index. php/progresif/index Jl. Ahmad Yani. 33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp. , e-mail: puslit. stmikbjb@gmail. e-ISSN: 2685-0877 Model Klasifikasi Mental Siswa Menggunakan Algoritma Support Vector Machine DOI: http://dx. org/10. 35889/progresif. Creative Commons License 4. 0 (CC BY Ae NC) Charitas Fibriani1*. Dian Novita Kristiyani2 1Sistem Informasi. Universitas Kristen Satya Wacana. Salatiga. Indonesia 2Hubungan Masyarakat. Universitas Kristen Satya Wacana. Salatiga. Indonesia *e-mail Corresponding Author: charitas. fibriani@uksw. Abstract Student mental health plays a vital role in academic performance and social well-being. This study aims to build a classification model using the Support Vector Machine (SVM) algorithm, based on 15 features covering demographic, academic, and behavioral aspects. The dataset, obtained from Kaggle, contains 426 records of junior and senior high school students. Key preprocessing steps include one-hot encoding, feature standardization, train-test splitting . , and handling class imbalance with SMOTE. The model was trained using the Radial Basis Function (RBF) kernel and optimized using Grid Search CV to find the best parameters. Evaluation results show 65% accuracy, with better performance in predicting students without mental health issues (Absenc. However, low recall for the Presence class indicates a need for improved strategies to handle data imbalance. This study highlights the potential of machine learning, particularly SVM, as a tool for early mental health detection in students, provided that effective data preprocessing is applied. Keywords: Student mental health. Support Vector Machine. SMOTE. Abstrak Kesehatan mental siswa berpengaruh besar terhadap prestasi akademik dan kesejahteraan Penelitian ini bertujuan membangun model klasifikasi kondisi mental siswa menggunakan algoritma Support Vector Machine (SVM) berbasis 15 fitur demografis, akademik, dan perilaku. Dataset yang digunakan berasal dari Kaggle, terdiri atas 426 data siswa SMP dan SMA. Tahapan penelitian meliputi preprocessing dengan one-hot encoding, standarisasi numerik, pembagian data . , serta penanganan ketidakseimbangan data menggunakan SMOTE. Model dilatih menggunakan kernel Radial Basis Function (RBF) dan dioptimasi dengan Grid Search CV. Hasil evaluasi menunjukkan akurasi sebesar 65%, dengan kinerja lebih baik dalam mengenali siswa tanpa gangguan mental . dibandingkan siswa dengan gangguan mental . Rendahnya recall pada kelas Presence mengindikasikan perlunya strategi lanjutan terhadap ketidakseimbangan data. Penelitian ini menunjukkan bahwa machine learning, khususnya SVM, berpotensi sebagai alat bantu dalam deteksi awal kesehatan mental siswa jika disertai pengolahan data yang tepat. Kata kunci: Kesehatan mental siswa. Klasifikasi. Support Vector Machine. SMOTE. Machine Pendahuluan Kesehatan mental siswa merupakan aspek penting yang berdampak langsung terhadap prestasi akademik, perkembangan sosial, dan kesejahteraan jangka panjang mereka. Gangguan mental yang tidak terdeteksi dan tidak ditangani sejak dini dapat menghambat potensi siswa, mempengaruhi hubungan sosial, serta meningkatkan risiko masalah psikologis jangka panjang. Pendekatan sistematis dan berbasis data untuk memantau kondisi mental siswa secara lebih obyektif dan akurat merupakan salah satu usaha untuk meningkatkan kesadaran akan pentingnya kesehatan mental dalam konteks Pendidikan . Model Klasifikasi Mental Siswa Menggunakan a Charitas Fibriani Progresif e-ISSN: 2685-0877 Saat ini, gangguan mental pada generasi muda terjadi hampir di seluruh dunia, bahkan 30% gangguan mental ini terjadi pada siswa . Jenis gangguan mental yang terjadi pada para siswa adalah depresi dengan gejala-gejala yang dapat mengganggu aktifitas siswa sehari-hari. Siswa menjadi kehilangan minat untuk melakukan aktifitasnya baik di lingkungan sekolah maupun di lingkungan keluarganya . Peningkatan tekanan akademik, perubahan lingkungan sosial, serta dinamika keluarga turut memperparah kondisi ini. Namun, belum banyak institusi pendidikan yang memiliki sistem deteksi dini berbasis data untuk mengenali potensi gangguan mental siswa secara sistematis dan terukur. Sebagai solusi, metode yang dapat digunakan dalam mendeteksi kondisi kesehatan mental adalah dengan memanfaatkan teknik klasifikasi dalam pembelajaran mesin . achine Teknik klasifikasi termasuk dalam jenis supervised learning, teknik ini hanya dapat dilakukan pada dataset yang memiliki label item . Metode klasifikasi memiliki banyak algoritma, salah satunya adalah Support Vector Machine (SVM), metode ini dikenal unggul dalam mengklasifikasikan data berdimensi tinggi dan menangani masalah klasifikasi biner maupun multi-kelas dengan akurasi yang baik . Pada penelitian Raahmatulloh et al. dan Ruliah 2015 . SVM mampu melakukan prediksi terhadap data dimensi tinggi dengan mengoptimalisasi kernel SVM. Penelitian Shaik et al. dan Alruwais et al. menggunakan SVM untuk analisis kesehatan mental pada pengguna sosial media, performa klasifikasi yang dihasilkan cukup baik meskipun data yang digunakan tidak linier. Berdasarkan pertimbangan penelitianpenelitian tersebut. SVM terbukti mampu melakukan prediksi terhadap data dengan dimensi tinggi dan tidak linier, oleh karena itu penelitian ini mengusulkan pembangunan model klasifikasi berbasis algoritma Support Vector Machine (SVM) untuk mendeteksi kondisi kesehatan mental Model dikembangkan dengan memanfaatkan 15 fitur yang mencakup aspek demografis, akademik, dan perilaku siswa, seperti performa akademik, absensi, usia, jenis kelamin, kebiasaan tidur, aktivitas fisik, dan partisipasi dalam kegiatan ekstrakurikuler. Berdasarkan latar belakang yang telah dijelaskan, maka rumusan masalah dalam penelitian ini adalah bagaimana membangun model klasifikasi yang dapat memprediksi kondisi kesehatan mental siswa berdasarkan data demografis, akademik, dan perilaku. Penelitian ini bertujuan untuk mengembangkan model klasifikasi kesehatan mental siswa menggunakan algoritma SVM dan mengevaluasi kinerja model SVM dalam mengklasifikasikan kondisi kesehatan mental berdasarkan fitur-fitur seperti data demografis, akademik, dan perilaku. Manfaat dari penelitian ini adalah menyediakan alat bantu prediktif yang dapat digunakan oleh lembaga pendidikan untuk melakukan intervensi dini secara lebih tepat sasaran. Kebaruan dari penelitian ini terletak pada pengembangan model klasifikasi kesehatan mental bagi siswa usia remaja dengan pendekatan algoritma SVM yang memadukan dimensi akademik, demografis, dan perilaku secara komprehensif. Kebaharuan pada penelitian ini adalah model klasifikasi kesehatan mental pada siswa usia remaja menggunakan metode SVM. Tinjauan Pustaka Penelitian mengenai klasifikasi kesehatan mental berbasis machine learning telah banyak dilakukan dalam berbagai pendekatan data dan algoritma. Penelitian Hairani et al. menggunakan sistem pakar berbasis metode Dempster-Shafer untuk melakukan klasifikasi terhadap pasien dengan gangguan skizofrenia. Penelitian ini memanfaatkan 43 parameter gejala berdasarkan panduan psikologi klinis dan menghasilkan sistem klasifikasi berbasis aturan, namun belum memanfaatkan pendekatan pembelajaran mesin modern. Penelitian Rahmatulloh et al. melakukan klasifikasi kesehatan mental pada karyawan perusahaan teknologi menggunakan algoritma Support Vector Machine (SVM). Penelitian ini menitikberatkan pada optimasi parameter kernel SVM, yaitu nilai C dan gamma, untuk memperoleh model klasifikasi yang optimal. Parameter input dalam penelitian ini meliputi data karyawan yang diperoleh melalui survei psikologis. Penelitian Shaikh et al. menerapkan algoritma SVM yang dioptimasi dengan Levy Flight Gannet Optimization untuk memprediksi krisis kesehatan mental berdasarkan data teks dari media sosial. Sementara itu. Alruwais et al. menggunakan pendekatan deep learning dan Natural Language Processing (NLP) untuk mendeteksi tingkat depresi juga dari data media sosial. Keduanya menggunakan data tidak terstruktur berupa teks, dan metode klasifikasi diarahkan untuk menganalisis emosi dan status psikologis berdasarkan pola bahasa pengguna. Model Klasifikasi Mental Siswa Menggunakan a Charitas Fibriani e-ISSN: 2685-0877 Penelitian Ruliah 2015 . mengaplikasikan metode SVM pada data citra medis untuk klasifikasi stadium parasit malaria. Penelitian ini menunjukkan kekuatan SVM dalam menangani data berdimensi tinggi dan non-linier, meskipun konteksnya bukan kesehatan mental secara langsung namun penelitian ini membuktikan bahwa SVM mampu melakukan prediksi untuk data non linier. Beberapa penelitian lain menggunakan SVM dalam ranah analisis sentimen sebagai studi pendukung efektivitas algoritma ini. Nugroho et al. mengklasifikasikan sentimen pengguna Twitter terhadap COVID-19, sementara Nurkarifin et al. serta Husnah et al. menerapkan pendekatan serupa untuk menganalisis aplikasi pencari kerja dan isu kekerasan dalam rumah tangga. Sedangkan Pamungkas et al. Meskipun konteksnya berbeda, penelitian-penelitian ini membuktikan bahwa SVM efektif untuk data teks dengan dimensi tinggi dan data dengan distribusi kelas yang tidak seimbang. Berdasarkan penelitian-penelitian sebelumnya, penelitian ini memiliki beberapa state of the art yang menjadi nilai kebaruannya. Pertama, objek penelitian difokuskan pada siswa sekolah menengah (SMP dan SMA), berbeda dari sebagian besar penelitian terdahulu yang menggunakan data mahasiswa, karyawan, atau data pengguna media sosial. Hal ini menuntut pemilihan fitur yang lebih relevan dengan karakteristik remaja. Kedua, data yang digunakan terdiri dari 15 parameter yang mencakup aspek demografis . sia, jenis kelamin, status tempat tingga. , akademik . ilai, absens. , dan perilaku . ktivitas fisik, kebiasaan tidur, keikutsertaan dalam organisasi/ekstrakurikule. , sehingga lebih komprehensif daripada penelitian sebelumnya yang cenderung fokus pada satu jenis data seperti teks atau citra. Ketiga, metode klasifikasi yang digunakan tetap berbasis SVM, namun pendekatan optimasi dilakukan secara sistematis menggunakan GridSearchCV untuk menemukan kombinasi parameter terbaik, serta mengatasi ketidakseimbangan data dengan teknik SMOTE. Hal ini menjadikan model tidak hanya akurat, tetapi juga lebih adaptif terhadap kompleksitas data kelas minoritas, yaitu siswa dengan gangguan mental. Penelitian ini menawarkan kontribusi baru dalam pengembangan sistem deteksi dini kesehatan mental siswa sekolah menengah dengan pendekatan klasifikasi berbasis machine learning yang menyatukan fitur multidimensional dan teknik optimasi serta penanganan data yang tidak berimbang kelasnya. Metodologi Gambar 1. Tahapan Penelitian Penelitian ini menggunakan pendekatan kuantitatif dengan metode eksperimen untuk membangun dan mengevaluasi model klasifikasi kesehatan mental siswa. Teknik supervised learning dengan algoritma Support Vector Machine (SVM) digunakan untuk membentuk model prediktif berdasarkan data fitur yang telah dikumpulkan. Tahapan peneltian dapat dilihat pada Gambar 1. Tahap pertama dari penelitian ini adalah pengumpulan data. Pada pengumpulan data, data yang digunakan adalah data sekunder yang diambil dari situs Kaggle. Data ini diunggah oleh Muhammad Habli Nasution dengan nama file AuStudent Mental Health Dataset. csvAy. Data ini berisi total 426 data dengan rincian 214 data kondisi mental siswa sekolah menengah dan 212 data kondisi mental siswa sekolah menengah atas. Data ini diambil dari sebuah sekolah swasta di Indonesia. Data yang diambil ini akan digunakan sebagai data training untuk membagun model klasifikasi dan data pengujian untuk evaluasi model klasifikasi yang dibangun. Data yang diambil ini berisi informasi terkait kondisi siswa beserta status mentalnya. Status mental pada data ini akan menjadi kelas label untuk model, sedangkan kondisi siswa akan menjadi fitur yang digunakan sebagai parameter pada model klasifikasi yang akan dibangun. Kelas label dari dari data ini dibagi menjadi 2 kelas yaitu Absence (Seha. dan Presence (Tergangg. Kelas data ini Progresif: Vol. No. Agustus 2025: 472-482 Progresif e-ISSN: 2685-0877 dapat dilihat pada kolom fitur AuMental Health StatusAy. Parameter pada data dapat dilihat pada Tabel 1. Tabel 1. Parameter Kesehatan Mental Siswa Fitur Keterangan Nilai Tipe Data Academic Performance Nilai akademik siswa String Absences Kehadiran siswa di kelas Rasio Numerik Age Usia siswa Rasio Numerik Gender Jenis kelamin siswa Female Student String Male Student Residence Status Siswa tinggal bersama siapa With mother and father String With mother only With father only Other Father Education Level Jenjang pendidikan ayah Associate Degree String Senior High School Bachelor Master Father Job Category Jenis pekerjaan ayah Private employee String Self employed Government employes Lecturer/ teacher SOC Employed Other Father Work Location Lokasi pekerjaan ayah Working out of City String Working within the city Other Mother Education Level Jenjang pendidikan ibu Associate Degree String Senior High School Bachelor Master Mother Job Category Jenis pekerjaan ibu Private employee String Self employed Government employes Lecturer/ teacher SOC Employed Other Mother Work Location Lokasi pekerjaan ibu Working out of City String Working within the city Other Sleeping Habit Kebiasaan tidur siswa < 8 hours String Above 8 hours Physical Activity Kegiatan fisik Yes. No String Organization Keterlibatan organisasi Yes. No String Involvement Extracurricular Keterlibatan pada Yes. No String Involvement Tahap kedua dalah pemrosesan data. Sebelum dilakukan pemodelan data akan melalui beberapa tahap preprocessing. Ada beberapa preprocessing, yaitu encoding, normalisasi dan Proses pertama adalah encoding, proses ini melakukan encoding data dari parameter yang nilainya masih berbentuk non numerik seperti pada fitur seperti gender, job category, dan residence status. Proses encoding data kategorikal untuk kasus data non numerik menggunakan fungsi one-hot encoding. Proses preprocessing selanjutnya adalah normalisasi. Proses ini dilakukan pada fitur dengan nilai numerik seperti absences dan age. Proses normalisasi dilakukan untuk meningkatkan performa SVM. Proses preprocessing selanjutnya pada penelitian ini adalah splitting. Proses ini membagi data yang telah dikumpulkan pada tahap sebelumnya. Data akan dibagi menjadi 2, data untuk training model klasifikasi dan data untuk evaluasi model Model Klasifikasi Mental Siswa Menggunakan a Charitas Fibriani e-ISSN: 2685-0877 Komposisi pembagian adalah 80% untuk data training untuk model klasifikasi dan 20% untuk data evaluasi model klasifikasi. Proses preprocessing terakhir yang dilakukan adalah proses penanganan data yang tidak seimbang menggunakan SMOTE (Synthetic Minority Oversampling Techniqu. Tahap ketiga adalah pelatihan model SVM klasifikasi menggunakan algoritma SVM. Data yang digunakan untuk melatih model adalah sejumlah 80% dari data yang ada. Fungsi optimasi model SVM dapat dilihat pada rumus . , fungsi optimasi ini dapat diselesaikan menggunakan fungsi library Scikit-learn. Penyelesaian fungsi optimasi ini menggunakan trick kernelling radial basis function (RBF) untuk mengubah data menjadi dimensi yang lebih tinggi supaya dapat dipisahkan, dimana data dapat dipisahkan secara non-linier. Rumus kernelling RBF dapat dilihat pada rumus . Optimalisi parameter c, gamma dan kernel dilakukan menggunakan fungsi Grid Search untuk mendapatkan kombinasi parameter terbaik. max Ocycuycn=1 yuycn Oe Ocycuycn=1 Ocycuyc=1 yuycn yuyc ycycn ycycn ya. cuycn,ycuyc ) yu ya. cuycn,ycuyc ) = expA(OeycAnycuycn Oe ycuyc An ) . Keterangan: yuycn : bobot yang akan ditentukan oleh proses training ycycn : label kelas dari data training Tahap terakhir dari penelitian adalah evaluasi model. Model dievaluasi menggunakan confusion matrix untuk menguji performa klasifikasi. Matrik evaluasi klasifikasi yang dipakai pada penelitian ini adalah accuracy, precision, recall dan F1-Score. Metrik ini digunakan untuk menilai kemampuan model dalam membedakan kategori kesehatan mental siswa dengan benar. Accuracy adalah pengukuran seberapa sering model membuat prediksi benar, rumus akurasi dapat dilihat pada rumus . Precision adalah pengukuran seberapa banyak prediksi positif benar-benar positif, rumus presisi dapat dilihat pada rumus . Recall adalah pengukuran seberapa baik model menangkat semua data positif, rumus recall dapat dilihat pada rumus . Sedangkan F-Score adalah rata-rata harmonis dari precision dan recall, rumusnya dapat dilihat pada rumus . yaycaycaycycycaycayc = A ycEycyceycaycnycycnycuycu = A ycIyceycaycaycoyco = A ycNycE ycNycA ycNycE ycNycA yaycE yaycA ycNycE ycNycE yaycE ycNycE ycNycE yaycA ya Oe ycIycaycuycyce = . yu 2 )A . ycEycI ycI yu 2 ycE Keterangan: : True Positive : False Negative : False Positive : True Negative : Precision : Recall : parameter penimbang Hasil dan Pembahasan Data Penelitian Tahap pertama pada penelitian ini adalah mengumpulkan data terkait kesehatan mental pada Pada Gambar 2 dapat dilihat contoh tampilan dataset student mental health yang diambil dari situs Kaggle. Pada dataset ini terdapat 18 kolom yaitu: Date ID. Date Set. Academic Progresif: Vol. No. Agustus 2025: 472-482 Progresif e-ISSN: 2685-0877 Perfomence. Absence. Age. Gender. Residence Status. Father Education Level. Father Job Category. Father Work Location. Mother Education Level. Mother Job Category. Mother Work Location. Sleeping Habit. Physical Activity. Organization Involvement. Extracurricular Involvement sebagai kolom fitur klasifikasi kesehatan mental siswa, sedangkan kolom Mental Status sebagai fitur target pada kesehatan mental siswa. Gambar 2. Dataset Student Mental Health Setelah data diperoleh akan dilakukan preprocessing. Pada penelitian ini terdapat beberapa proses pada tahapan preprocessing. Pada Gambar 3 dapat dilihat kode program untuk melakukan teknik encoding menggunakan teknik one-hot encoding untuk data kategorikal seperti fitur-fitur non-numerik seperti gender, job category, dan residence status. Fungsi yang digunakan untuk proses ini adalah fungsi dummies. Pada Gambar 4 dapat dilihat kode program untuk melakukan normalisasi data fitur numerik seperti absences dan age untuk meningkatkan performa SVM menggunakan fungsi standard scale. Pada Gambar 5 dapat dilihat kode program untuk membagi dataset menjadi data training dan data pengujian. Pembagian data pengujian sebesar 0,2 atau sebesar 20% dari total dataset, artinya data yang digunakan sebagai data training sejumlah 80% dari dataset tersedia. Pada Gambar 6 dapat dilihat kode program untuk penanganan data yang tidak seimbang. Data yang tidak seimbang dapat mengakibatkan prediksi tidak muncul. Teknik oversampling yang digunakan untuk menangani ketidak seimbangan data adalah menggunakan fungsi SMOTE (Synthetic Minority Over-sampling Techniqu. Fungsi ini digunakan untuk membuat sampel sintetis dari kelas minoritas. Gambar 3. Kode Program Proses Encoding Gambar 4. Kode Program Proses Normalisasi Gambar 5. Kode Program Proses Splitting Gambar 6. Kode Program Proses SMOTE Model Klasifikasi Mental Siswa Menggunakan a Charitas Fibriani e-ISSN: 2685-0877 Pelatihan Model Klasifikasi Kesehatan Mental Siswa Setelah melalui proses preprocessing dan data siap digunakan, maka selanjutnya membangun model training klasifikasi kesehatan mental siswa menggunakan SVM. Model klasifikasi yang dibangun dan dilatih pada penelitian ini mempertimbangkan beberapa hal. Pertama, dataset pada penelitian tidak bisa dipisahkan secara linier, oleh karena itu data harus diubah menjadi dimensi yang lebih tinggi supaya dapat dipisahkan secara linier di ruang tersebut . ernel tric. Fungsi kernel trick yang digunakan pada penelitian ini adalah Radial Basis Function (RBF). Pemilihan RBF ini selain fungsi ini cocok untuk data non liner namun karena parameter yang digunakan pada fungsi ini lebih sederhana yaitu c dan gamma. Kedua, model klasifikasi pada penelitian ini membutuhkan kombinasi parameter terbaik dan tidak perlu lagi teknik acak. Fungsi yang digunakan untuk teknik optimasi hyperparameter via pencarian grid untuk mendapatkan kombinasi parameter c, gamma dan kernel terbaik pada penelitian ini adalah fungsi Grid Search. Kode program untuk model training data dapat dilihat pada Gambar 7. Pada Gambar 7 fungsi optimasi tujuan berdasarkan rumus . dapat dilihat pada baris grid_search. Pada baris ini dilakukan penyelesaian fungsi optimasi secara otomatis, dimana fungsi GridSearchCV mencari kombinasi terbaik dari C dan gamma yang mempengaruhi bentuk hyperplane. Sedangkan fungsi kemiripan non-linier kernel RBF berdasarkan rumus . didefinisikan menggunakan fungsi GridSearchCV dengan mendefinisikan nilai gamma untuk menentukan seberapa sempit atau lebarnya kurva kemiripan antara dua data. Gambar 7. Kode Program Model Training Klasifikasi Kesehatan Mental Siswa Berdasarkan konsep yang telah dijabarkan maka untuk menggambarkan prinsip kerja model klasifikasi kesehatan mental siswa dapat dilihat pada Gambar 8. Data mental siswa yang dikumpulan akan melalui proses preprocessing termasuk di dalamnya terdapat encoding data, normalisasi. SMOT dan splitting data. Setelah data siap digunakan, data akan dibagi komposisi jumlahnya, 80% akan digunakan sebagai data training untuk membangun model sedangkan 20% akan digunakan sebagai data pengujian untuk evaluasi model yang akan dibangun. Fungsi optimasi SVM akan diterapkan pada data training, menggunakan kernell RBF untuk mengatasi dimensi data yang tinggi. Hasil dari optimasi adalah model klasifikasi kesehatan mental siswa, model ini dapat digunakan untuk memrediksi status kesehatan mental dari siswa sebagai data Gambar 8. Model Training Klasifikasi Kesehatan Mental Siswa Progresif: Vol. No. Agustus 2025: 472-482 Progresif e-ISSN: 2685-0877 Contoh Kasus Prediksi menggunakan Model Klasifikasi Mental Siswa Pada pembagian dataset, terdapat pembagian sebesar 20% dari dataset untuk digunakan sebagai pengujian. Data pengujian ini digunakan untuk mengevaluasi model klasifikasi kesehatan mental. Konsep evaluasi adalah membandingkan prediksi label item kelas menggunakan model dengan data label item pada data aslinya. Pada bagian ini akan ditampilkan satu contoh prediksi kasus menggunakan model klasifikasi kesehatan mental menggunakan SVM, akan diujikan dengan memasukkan data baru untuk didapatkan label item kelas, apakah AuPresenceAy ataukah AuAbsenceAy. Contoh data baru ini diambil dari 20% dari dataset yang digunakan untuk pengujian. Contoh data inputan nilai dari masing-masing fitur dapat dilihat pada Tabel 2. Kode program inputan data baru yang akan diprediksi dan hasil label item kelasnya dapat dilihat pada Gambar 9. Berdasarkan inputan nilai, label item untuk data baru tersebut adalah AuAbsenceAy, artinya berdasarkan nilai fitur yang dimiliki oleh siswa tersebut maka kondisi mentalnya masuk ke kelas sehat yang artinya tidak mengalami gangguan mental. Tabel 2. Nilai Inputan Siswa Baru Fitur Nilai Academic Performance Absences Age Gender Male Students Residence Status With Mother Only Father Education Level Bachelor Father Job Category Private Employed Father Work Location Working Out of City Mother Education Level Bachelor Mother Job Category Self Employed Mother Work Location Working Out of City Sleeping Habit < 8 Hours' Physical Activity Organization Involvement Extracurricular Involvement Yes Gambar 9. Kode Program Prediksi Data Baru dan Hasil Prediksi Evaluasi Model Klasifikasi Mental Siswa Tahap terakhir pada penelitian ini adalah pengujian model klasifikasi kesehatan mental siswa menggunakan confusion matrix. Evaluasi dilakukan pada 20% dari dataset. Pada tahap ini akan dilakukan pengujian antara hasil prediksi menggunakan model klasifikasi kesehatan mental menggunakan SVM yang dibangun dengan hasil label pada data asli di dataset. Contoh prediksi kasus dapat dilihat pada pembahasan sebelumnya. Matrik pengukuran yang akan dilikat adalah Model Klasifikasi Mental Siswa Menggunakan a Charitas Fibriani e-ISSN: 2685-0877 accuracy, precision, recall dan F1-Score. Berdasarkan rumus . untuk mendapatkan accuracy, rumus . untuk precision, rumus . untuk recall, dan rumus . untuk F-score maka dapat dilihat pada Gambar 10 kode program untuk melakukan evaluasi model klasifikasi yang dibangun. Hasil evaluasi model klasifikasi dapat dilihat pada Gambar 11. Parameter terbaik menggunakan fungsi Grid Search adalah nilai c=10 yang menjadikan model lebih tegas dan memberi pinalti lebih besar terhadap kesalahan, nilai gamma=AoscaleAo yang artinya gamma otomatis disesuaikan dengan data bukan nilai tetap, nilai kernel=AorbfAo yang artinya menggunakan kernel rbf yang cocok untuk data non-linier. Pada Gambar 10 dapat dilihat dari kelas AuAbsenceAy dan AuPresenceAy. Pada kelas AuAbsenceAy dapat dilihat nilai Precision dari absence sebesar 0,68 yang artinya 68% dari semua prediksi AuAbsenceAo benar. Nilai Recall dari absence sebesar 0. 87 yang artinya 87% dari seluruh kasus "Absence" nyata berhasil terdeteksi. Nilai F1-Score dari absence sebesar 0. 76 artinya model cukup seimbang dalam mengenali kelas ini. Sedangkan pada kelas AuPresenceAy dapat dilihat nilai Precision dari presence sebesar 0,53 yang artinya 53% dari semua prediksi AuPresenceAo benar. Nilai Recall dari presence hanya sebesar 0,26 yang artinya hanya 26% dari seluruh kasus "Presence" yang berhasil dikenali. Nilai F1-Score dari presence sebesar 0,35 artinya model cukup buruk dalam mengenali kelas ini. Nilai akurasi sebesar untuk model ini sebesar 65%. Gambar 10. Kode Program Evaluasi Model Gambar 11. Hasil Evaluasi Model Pembahasan Penelitian ini bertujuan membangun model klasifikasi kesehatan mental siswa menggunakan algoritma Support Vector Machine (SVM). Hasil evaluasi model menunjukkan tingkat akurasi 65%, nilai yang cukup bagus untuk sebuah model. Namun saat diamati nilai accuracy, precision, recall dan F-score dari masing-masing kelas ada sedikit tidak keseimbangan. Nilai masingmasing matrik evaluasi untuk kelas AuAbsenceAy secara normatif sangat bagus, artinya model mengenali kelas tersebut dengan baik. Sedangkan nilai masing-masing matrik evaluasi untuk kelas AuPresenceAy kurang memuaskan, bahkan nilai matrik F-score dibawah 50%, artinya model yang dibangun sangat buruk dalam mengenali kelas AuPresenceAy tersebut. Model klasifikasi untuk prediksi status kesehatan mental yang dibangun pada penelitian ini menggunakan obyek siswa pada sekolah menengah umum dan sekolah menengah atas. Hal ini berbeda dengan penelitian Chen 2024 . dan Li et al. yang memilih mahasiswa sebagai obyek Perbedaan pemilihan obyek akan mempengaruhi variabel yang digunakan karena secara normatif, variabel yang mempengaruhi mental remaja dan dewasa sedikit berbeda. Sebagai contoh pada usia remaja gaya hidup konsumsi alcohol maupun merokok tidak dianggap sebagai variabel yang mempengaruhi mental siswa. Asumsi ini diambil karena pada alkohol dan rokok belum legal dikonsumsi oleh siswa, walaupun terkadang terdapat kasus yang di luar Hasil penelitian ini memperkuat penelitian Rahmatulloh et al. yang menekankan pentingnya pemilihan parameter kernel c dan gamma dalam penggunaan SVM. Hasil penelitian ini membuktikan relevansi terkait pengaturan parameter tersebut, karena dalam penelitian ini Progresif: Vol. No. Agustus 2025: 472-482 Progresif e-ISSN: 2685-0877 fungsi GridSearchCV terbukti efektif dalam mengoptimasi SVM agar mampu menangani data berdimensi tinggi Penelitian Shaikh et al. dan Alruwais et al. menggunakan data teks dari media sosial untuk klasifikasi tingkat depresi menggunakan SVM. Meskipun jenis datanya berbeda, penelitian ini menguatkan bahwa SVM tetap relevan sebagai pendekatan andal di berbagai jenis data dalam konteks kesehatan mental, termasuk data kategorikal dan numerik yang digunakan dalam penelitian ini. Sementara itu, penelitian Ruliah 2015 . membuktikan efektivitas SVM dalam klasifikasi gambar medis . arasit malari. , menunjukkan keunggulan SVM dalam menangani data kompleks dan tidak terpisah secara linier, seperti halnya dalam penelitian ini yang menggunakan kernel Radial Basis Function (RBF) untuk mengatasi kompleksitas dimensi data mental siswa. Namun, temuan penelitian ini juga menunjukkan kelemahan serupa dengan beberapa penelitian terdahulu: rendahnya recall pada kelas minoritas (Presenc. Ini memperkuat temuan bahwa SVM cenderung bias terhadap kelas mayoritas dalam kasus ketidakseimbangan data Hairani et al. Pendekatan SMOTE yang diterapkan dalam penelitian ini menjadi kontribusi penting untuk meningkatkan kesetaraan deteksi antar kelas untuk mengatasi ketidakseimbangan data, meskipun hasilnya belum sepenuhnya optimal. Secara keseluruhan, penelitian ini memperkuat literatur bahwa SVM efektif dalam klasifikasi kasus kesehatan mental, khususnya dengan kombinasi preprocessing yang tepat, optimasi parameter, dan penanganan ketidakseimbangan data. Pengintegrasian 15 fitur demografis, akademik, dan perilaku siswa, penelitian ini juga memperluas cakupan fitur dibandingkan studi sebelumnya, yang mayoritas hanya fokus pada satu jenis data seperti teks atau citra. Simpulan Model klasifikasi kesehatan mental siswa pada penelitian ini menggunakan 15 fitur yaitu: performa akademik siswa, jumlah ketidakhadiran di kelas, usia siswa, jenis kelamin siswa, status tempat tinggal siswa, tingkat pendidikan dan pekerjaan orang tua, lokasi kerja orang tua, kebiasaan tidur siswa, aktivitas fisik siswa, serta keterlibatan siswa dalam organisasi dan kegiatan Label target dari dari dataset ini adalah Mental Health Status yang dikategorikan menjadi Absence (Seha. dan Presence (Tergangg. Model yang dibangun melewati preprocessing dengan teknik one-hot encoding, fungsi Standar Scale, teknik Splitting, dan fungsi SMOTE. Sedangkan untuk pelatihan model klasifikasi menggunakan fungsi Grid Seach dan kernel RBF. Berdasarkan hasil evaluasi kalsifikasi, model yang dibangun cukup baik mengenali kelas Absence namun sangat buruk dalam mengenali kelas Presence padahal justru kelas tersebut yang penting dalam konteks deteksi kesehatan mental. Hal tersebut disebabkan ketidakseimbangan data jumlah kelas Presence dan kelas Absence pada dataset. Meskipun nilai akurasi sebesar 65%, namun model hanya bagus pada satu kelas saja. Saran untuk pengembangan penelitian ini dengan mencoba menyesuaikan threshold prediksi, hal ini sebagai alat bantu untuk dataset yang terlalu konservatif ke satu sisi. Saran