JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 ISSN : 2985-4768 ESTIMASI PROPORSI STRES TINGGI PADA MAHASISWA Pasya Syamil Diyah1. Andika Rachman2. Pugoh Khavid Prayogo3. Gustyanto Firgiawan4. Perani Rosyani5 Teknik Informatika. Fakultas Ilmu Komputer. Universitas Pamulang Tangerang Selatan. Banten. Indonesia Corresponding Author : dosen00837@unpam. ABSTRACT This study applies a quantitative approach based on computational experiments to develop an accurate student stress level prediction model. The research design employs a cross-sectional method with data collection via online questionnaire instruments integrating multidimensional variables, including the Perceived Stress Scale (PSS-. as the target variable, as well as the Pittsburgh Sleep Quality Index (PSQI) and Self-Compassion Scale (SCS) as key predictor features alongside academic variables. The main challenge of imbalanced data is addressed by applying the Synthetic Minority Over-sampling Technique (SMOTE) during the preprocessing stage to synthesize minority class samples and prevent majority bias. In the modeling phase, the Random Forest Classifier algorithm is utilized due to its superiority in handling complex non-linear relationships, and its performance is compared with Logistic Regression as a baseline Model validation is conducted using the 10-Fold Cross-Validation method to test data Performance evaluation focuses on Recall. Precision, and F1-Score metrics to ensure the model's sensitivity in effectively detecting high-stress cases as a clinically relevant early warning system. ABSTRAK Penelitian ini menerapkan pendekatan kuantitatif berbasis eksperimen komputasi . omputational experimen. untuk mengembangkan model prediksi tingkat stres mahasiswa yang akurat. Desain penelitian menggunakan metode cross-sectional dengan pengumpulan data melalui instrumen kuesioner daring yang mengintegrasikan variabel multidimensi, mencakup Perceived Stress Scale (PSS-. sebagai variabel target, serta Pittsburgh Sleep Quality Index (PSQI) dan Self-Compassion Scale (SCS) sebagai fitur prediktor utama di samping variabel akademik. Tantangan utama berupa ketidakseimbangan data . mbalanced dat. diatasi dengan menerapkan teknik Synthetic Minority Over-sampling Technique (SMOTE) pada tahap prapemrosesan untuk mensintesis sampel kelas minoritas dan mencegah bias mayoritas. Pada tahap pemodelan, algoritma Random Forest Classifier digunakan karena keunggulannya dalam menangani hubungan non-linear yang kompleks, dan dibandingkan kinerjanya dengan Logistic Regression sebagai model baseline. Validasi model dilakukan menggunakan metode 10-Fold Cross-Validation untuk menguji generalisasi data. Evaluasi performa difokuskan pada metrik Recall. Precision, dan F1-Score guna memastikan sensitivitas model dalam mendeteksi kasus stres tinggi secara efektif sebagai sistem peringatan dini . arly warning syste. yang relevan secara klinis. Keywords: Quantitative Method. Random Forest. Smote. Stress Detection. Data Mining. PENDAHULUAN Kesehatan mental mahasiswa telah mengalami pergeseran signifikan dari isu marginal menjadi prioritas strategis dalam ekosistem pendidikan tinggi, baik di tingkat global maupun nasional(AuNo Title,Ay 2. ,(Verdiana et al. , 2. Transformasi ini https://jurnal. id/index. php/JORAPI/index semakin mendesak pasca-pandemi COVID-19 yang memperparah kondisi psikologis generasi muda, terutama di tengah akselerasi era digitalisasi yang membawa dinamika baru dalam pola interaksi sosial dan akademik. World Health Organization (WHO) mengidentifikasi depresi sebagai salah satu penyebab utama gangguan kesehatan mental pada kelompok JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 usia produktif, dengan mahasiswa sebagai populasi yang sangat rentan. Konteks Indonesia menunjukkan urgensi yang lebih Survei Kesehatan Mental Remaja Nasional Indonesia (I-NAMHS) mengungkapkan bahwa satu dari tiga remaja Indonesia mengalami masalah kesehatan mental, sementara satu dari dua puluh mengalami gangguan mental yang lebih serius, setara dengan sekitar 15,5 juta remaja yang menghadapi permasalahan emosional (Masyarakat et , 2. Di lingkungan kampus secara spesifik, prevalensi stres akademik mencapai angka yang sangat tinggi, berkisar antara 36,7% hingga 71,6% . Fenomena ini tidak terlepas dari kompleksitas transisi developmental yang dialami mahasiswa, yakni dari masa remaja menuju dewasa awal yang penuh gejolak emosional . turm and dran. , disertai tuntutan kemandirian finansial dan sosial yang semakin berat. Stres akademik didefinisikan sebagai kondisi ketidakseimbangan antara tuntutan akademik yang dibebankan lingkungan dengan kemampuan sumber daya adaptif yang dimiliki mahasiswa (Rafly et al. (AuNo Title,Ay 2. Lazarus dan Folkman melalui teori transactional stress menjelaskan bahwa stres muncul ketika individu menilai suatu situasi sebagai ancaman atau beban yang melebihi kapasitas mereka (Rafly et al. , 2. Sumber stres pada mahasiswa bersifat multidimensi, meliputi beban tugas dan skripsi yang sangat tinggi pada mahasiswa tingkat akhir, budaya kompetitif untuk mencapai Indeks Prestasi Kumulatif (IPK) tinggi, serta ekspektasi berlebih dari orang tua dan dosen (Anandita, 2. Studi juga menunjukkan adanya perbedaan berbasis gender, di mana mahasiswa perempuan cenderung mengalami tingkat stres dan kecemasan lebih tinggi . ekitar 75,7%) dibandingkan laki-laki, yang dikaitkan dengan faktor biologis dan kecenderungan rumination yang lebih tinggi. Salah satu aspek kritis yang sering terabaikan namun memiliki hubungan erat dengan stres akademik adalah kualitas tidur (PS SIREGAR. Pdf, n. ),(Psikologi et , 2. Hubungan antara stres dan tidur bersifat resiprokal dan negatif: semakin tinggi tingkat stres, semakin buruk kualitas tidur, dan sebaliknya. Secara fisiologis, stres mengaktifkan HypothalamicPituitary-Adrenal (HPA) Axis yang memicu pelepasan hormon kortisol dan adrenokortikotropik (ACTH), menyebabkan kondisi hyperarousal yang menghambat kemampuan tubuh untuk rileks dan memulai tidur (No Title, 2. Kualitas tidur yang buruk tidak hanya menyebabkan kelelahan fisik, tetapi https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 juga memediasi hubungan antara stres dan gangguan mental yang lebih parah seperti kecemasan dan depresi, serta menurunkan fungsi kognitif dan regulasi emosi mahasiswa. Di sisi lain, faktor protektif internal seperti selfcompassion . elas asih dir. muncul sebagai variabel penting dalam memitigasi dampak negatif stres. Selfcompassion adalah kemampuan untuk bersikap baik dan pengertian terhadap diri sendiri saat menghadapi kegagalan, yang terdiri dari tiga komponen: selfkindness . ebaikan dir. , common humanity . emahaman bahwa penderitaan adalah hal manusiaw. , dan mindfulness . esadaran penuh tanpa menghakim. (Psikologi et al. , 2. ,(No Title, 2. Studi empiris membuktikan bahwa mahasiswa dengan self-compassion rendah lebih rentan terhadap stres, kecemasan, dan depresi, sementara self-compassion tinggi berkorelasi positif dengan kesejahteraan psikologis dan menurunkan risiko gangguan mental secara signifikan(No Title, 2. Meskipun urgensi masalah ini semakin jelas, sistem prediksi risiko kesehatan mental mahasiswa yang ada saat ini masih memiliki keterbatasan fundamental. Mayoritas institusi pendidikan masih mengandalkan model statistik konvensional seperti regresi linier yang hanya memasukkan variabel akademik "keras" seperti IPK, jumlah SKS, dan jam belajar (Verdiana et al. Pendekatan ini mengabaikan realitas bahwa kesehatan mental dipengaruhi oleh interaksi kompleks dan non-linear antara faktor biologis . ualitas tidu. , psikologis . elf-compassio. , dan sosial . ukungan teman/keluarg. (AuNo Title,Ay 2. ,(Anissa & Qoiriah. Akibatnya, akurasi prediksi menjadi rendah dan intervensi preventif tidak dapat dilakukan secara tepat waktu. Oleh karena itu, penelitian ini mengusulkan pendekatan inovatif dengan mengintegrasikan algoritma Machine Learning, khususnya Random Forest, untuk membangun model prediksi kesehatan mental mahasiswa yang lebih komprehensif dan Random Forest dipilih karena keunggulannya dalam menangani hubungan non-linear antar variabel dan ketahanannya terhadap overfitting. Dengan memasukkan variabel self-compassion, kualitas tidur, dan dukungan sosial ke dalam model prediksi, diharapkan akurasi dapat ditingkatkan secara signifikan, memungkinkan deteksi dini yang lebih presisi terhadap mahasiswa yang berisiko mengalami gangguan mental. Model ini tidak hanya berkontribusi pada pengembangan sistem early warning di institusi pendidikan, tetapi juga memberikan landasan empiris JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 ISSN : 2985-4768 bagi kebijakan intervensi kesehatan mental yang lebih efektif dan berbasis data di era pendidikan tinggi TINJAUAN PUSTAKA Inti Penelitian Terdahulu Penelitian-penelitian sebelumnya dalam memprediksi stres mahasiswa memiliki beberapa keterbatasan : Metode: Mayoritas masih menggunakan statistik konvensional seperti Regresi Logistik, yang memiliki asumsi hubungan linear kaku dan kurang mampu menangkap kompleksitas psikologis . Variabel: Terlalu berfokus pada faktor akademik semata . eperti IPK dan jumlah SKS), sehingga mengabaikan aspek biologis dan psikologis internal Data: Sering mengabaikan masalah ketidakseimbangan data . mbalanced dat. , di mana jumlah mahasiswa sehat Hal menyebabkan model menjadi bias dan gagal mendeteksi mahasiswa yang benar-benar mengalami stres berat . Hasil: Akibat keterbatasan tersebut, akurasi prediksi cenderung stagnan di angka 75-77% Perbedaan dan Pembaruan Penelitian Penulis Penelitian ini menawarkan pendekatan yang lebih canggih dan menyeluruh . untuk menutupi celah penelitian sebelumnya: Metode Komputasi: Mengganti metode statistik dengan algoritma Machine Learning (Random Fores. yang mampu menangkap pola non-linear dan interaksi kompleks antar variabel, serta lebih tahan terhadap overfitting . Integrasi Variabel Baru: Menambahkan (Kualitas Tidur/PSQI) dan psikologis (Self-Compassion/SCS) model, bukan hanya mengandalkan data Teknik Penanganan Data: Menerapkan teknik SMOTE (Synthetic Minority Over-sampling Techniqu. menyeimbangkan data latih. Ini memastikan model belajar mengenali https://jurnal. id/index. php/JORAPI/index pola mahasiswa yang stres sama baiknya dengan mahasiswa yang sehat. Target Evaluasi: Fokus utamanya bukan hanya akurasi angka, melainkan meningkatkan Sensitivitas (Recal. , yaitu kemampuan sistem untuk tidak melewatkan mahasiswa yang benarbenar membutuhkan bantuan 3. METODE PENELITIAN 1 Desain Penelitian Penelitian ini menerapkan pendekatan kuantitatif dengan metode eksperimen komputasi . omputational experimen. berbasis Data Mining dan Machine Learning. Pendekatan kuantitatif dipilih karena penelitian ini bertujuan untuk mengukur variabel-variabel psikologis . eperti selfcompassion dan persepsi stre. serta variabel pola hidup . ualitas tidu. ke dalam data numerik yang kemudian dianalisis secara membangun model prediktif. Pendekatan ini memungkinkan objektifikasi fenomena psikologis yang kompleks ke dalam representasi matematis yang dapat diproses oleh algoritma pembelajaran mesin. Paradigma Penelitian Kuantitatif Konteks Kesehatan Mental Paradigma kuantitatif dalam penelitian kesehatan mental bertumpu pada asumsi positivis bahwa fenomena psikologis dapat diukur, dikuantifikasi, dan dianalisis menggunakan metode ilmiah yang objektif. Dalam konteks penelitian ini, fenomena stres mahasiswaAiyang secara intrinsik bersifat multidimensiAidireduksi menjadi skor numerik melalui instrumen psikometri terstandar. Proses kuantifikasi ini memiliki beberapa keunggulan metodologis: JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 Objektivitas dan Replikabilitas : Penggunaan instrumen terstandar seperti Perceived Stress Scale (PSS-. dan SelfCompassion Scale (SCS) memastikan bahwa pengukuran dapat direplikasi oleh peneliti lain dengan hasil yang konsisten, memenuhi prinsip reliabilitas ilmiah. Generalisabilitas : Data numerik memungkinkan analisis statistik inferensial yang dapat digeneralisasi dari sampel ke populasi yang lebih luas, asalkan sampel Pemodelan Prediktif : Kuantifikasi mengidentifikasi pola tersembunyi dan membangun model prediksi yang akurat. 2 Eksperimen Komputasi sebagai Metode Penelitian Berbeda konvensional yang hanya menguji hipotesis tentang hubungan antar variabel . orelasi atau regresi linea. , metode eksperimen komputasi dalam penelitian ini berfokus pada predictive modelingAipembangunan model yang dapat memprediksi status kesehatan mental mahasiswa berdasarkan variabel input yang diketahui. Eksperimen komputasi memiliki beberapa karakteristik distinktif: Eksplorasi Ruang Hipotesis yang Luas : Algoritma machine learning seperti Random Forest secara otomatis mengeksplorasi ribuan kombinasi fitur dan threshold untuk menemukan pola prediktif terbaik, tanpa memerlukan spesifikasi manual dari peneliti tentang bentuk hubungan antar variabel. Penanganan Kompleksitas Non-Linear : Metode ini mampu menangkap hubungan non-linear, efek interaksi antar variabel, dan pola threshold yang sering kali tidak dapat ditangkap oleh regresi linear. Sebagai contoh, pengaruh kualitas tidur terhadap stres mungkin menunjukkan pola eksponensial di mana penurunan dari "tidur buruk" menjadi "tidur sangat buruk" memberikan dampak https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 stres yang jauh lebih besar dibandingkan penurunan dari "tidur baik" menjadi "tidur Validasi Melalui Eksperimen Berulang : Penggunaan cross-validation memungkinkan model diuji berulang kali pada subset data yang berbeda, memastikan keandalan dan kemampuan generalisasi 3 Desain Cross-Sectional Penelitian ini menggunakan desain crosectional . otong lintan. , di mana pengambilan data untuk semua variabelAi baik variabel independen . ualitas tidur, selfcompassion, tekanan akademik, dukungan sosia. maupun variabel dependen . ingkat stre. Aidilakukan pada satu titik waktu yang Desain pertimbangan sebagai berikut: Kelebihan Desain Cross-Sectional: Efisiensi Waktu dan Biaya: Pengumpulan data dilakukan sekali, follow-up longitudinal yang memakan waktu dan sumber daya. Cocok untuk Prevalensi: Desain ini ideal untuk mengestimasi prevalensi stres pada populasi mahasiswa pada waktu tertentu. Foundational Model Prediktif: Untuk membangun model prediksi awal, snapshot kondisi mahasiswa pada satu waktu sudah cukup untuk mengidentifikasi pola hubungan antar variabel. Keterbatasan Desain Cross-Sectional: Tidak Dapat Menentukan Kausalitas: Desain ini tidak dapat membuktikan hubungan sebab-akibat Misalnya, ditemukan korelasi negatif antara kualitas tidur dan stres, desain crosectional tidak dapat memastikan apakah tidur buruk menyebabkan menyebabkan tidur buruk . eskipun JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 hubungan resiproka. Bias Recall: Karena responden diminta mengingat pengalaman satu bulan terakhir . ntuk PSS-. , terdapat kemungkinan bias ingatan. Meskipun demikian, untuk tujuan penelitian iniAiyaitu membangun model prediktif yang tinggiAidesain cross-sectional Penelitian lanjutan dengan desain memvalidasi arah kausalitas. 4 FlowChart Alur Penelitian Gambar 1. FlowChart Alur Penelitian Penjelasan Komprehensif Flowchart Deteksi Stres Mahasiswa Tahap Mulai & Pengumpulan Dataset Penelitian ini diawali dengan fase krusial pengumpulan data primer melalui instrumen kuesioner yang dirancang khusus. Dataset yang dikumpulkan memiliki keunikan karena mengintegrasikan tiga dimensi fundamental yang mempengaruhi kesehatan mental Dimensi Akademik mencakup Indeks Prestasi Kumulatif (IPK) dan tingkat semester mahasiswa. Kedua variabel ini dipilih karena tekanan akademik merupakan https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 sumber stres paling signifikan di lingkungan perguruan tinggi. Mahasiswa dengan IPK rendah cenderung mengalami kecemasan akademik, sementara mahasiswa semester akhir menghadapi tekanan penyelesaian tugas akhir. Dimensi Pola Hidup berfokus pada kualitas tidur dan konsumsi kafein. Literatur penelitian menunjukkan bahwa kualitas tidur yang buruk memiliki korelasi kuat dengan peningkatan tingkat stres. Mahasiswa yang kurang tidur mengalami penurunan fungsi kognitif dan regulasi emosi. Sementara itu, konsumsi kafein berlebihan, meskipun populer di kalangan mahasiswa untuk meningkatkan kewaspadaan saat begadang, justru dapat memicu kecemasan dan mengganggu pola tidur alami. Dimensi Psikologis merupakan modifikasi inovatif dari penelitian sebelumnya dengan menambahkan variabel Self-Compassion . elas asih dir. Konsep ini mengacu pada kemampuan individu untuk bersikap baik dan memahami diri sendiri saat menghadapi kegagalan atau kesulitan. Penelitian self-compassion berfungsi sebagai buffer atau pelindung terhadap gangguan kesehatan mental, membantu mahasiswa menghadapi tekanan dengan lebih resilient. Preprocessing Data: Transformasi Data Mentah Data yang dikumpulkan dari responden tidak dapat langsung diproses oleh algoritma machine learning. Tahapan preprocessing ini krusial untuk memastikan kualitas dan konsistensi data: Data Cleaning merupakan langkah pertama untuk menghapus entri data yang tidak lengkap atau mengandung missing value. Responden yang tidak mengisi kuesioner secara lengkap atau memberikan jawaban yang tidak konsisten akan dieliminasi untuk menjaga integritas dataset. Proses ini juga JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 mencakup deteksi outlier atau data ekstrem yang dapat mendistorsi hasil analisis. Label Encoding mengkonversi data kategorikal menjadi format numerik. Misalnya, jawaban kuesioner seperti "Sangat Sering", "Sering", "Jarang", dan "Tidak Pernah" akan diubah menjadi angka 3, 2, 1. Transformasi ini esensial karena algoritma machine learning hanya dapat memproses data numerik. Normalisasi dengan MinMax Scaler menstandarkan rentang nilai antar variabel yang berbeda. IPK memiliki rentang 0-4, sementara durasi tidur mungkin berkisar 1-10 jam, dan self-compassion score bisa 1-100. Tanpa normalisasi, variabel dengan nilai yang lebih besar akan mendominasi perhitungan jarak dalam algoritma. MinMax Scaler mentransformasi semua variabel ke rentang . , memastikan kontribusi yang seimbang dari setiap fitur. SMOTE: Solusi untuk Imbalanced Data Synthetic Minority Over-sampling Technique (SMOTE) merupakan tahapan modifikasi data yang sangat penting dalam penelitian ini. Permasalahan imbalanced data adalah isu klasik dalam survei kesehatan mental, di mana jumlah mahasiswa dalam kategori "Sehat" atau "Stres Ringan" jauh lebih banyak dibandingkan mahasiswa dengan "Stres Berat". SMOTE bekerja dengan mensintesis data baru untuk kelas minoritas . ahasiswa stres bera. menggunakan interpolasi antara sampel minoritas yang sudah ada. Teknik ini tidak sekadar menduplikasi data, tetapi menciptakan sampel sintetis baru yang realistis berdasarkan karakteristik data asli. Hal ini penting untuk mencegah model machine learning menjadi bias dan hanya akurat dalam memprediksi kelas mayoritas sambil mengabaikan kelas minoritas yang justru lebih krusial untuk diidentifikasi. Tanpa SMOTE, https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 menyesatkan dengan cara memprediksi semua mahasiswa sebagai "Tidak Stres", mengabaikan mereka yang benar-benar membutuhkan intervensi psikologis. Pembagian Data (Data Splittin. Dataset yang telah seimbang kemudian dibagi menggunakan teknik train-test split dengan rasio 80:20. Data Training . %) digunakan untuk melatih algoritma Random Forest agar dapat mempelajari pola dan hubungan antara variabel input (IPK, tidur, kafein, self-compassio. dengan variabel target . ingkat stre. Proses pembelajaran ini melibatkan penyesuaian parameter internal model berdasarkan data historis. Data Testing . %) berfungsi sebagai data validasi yang tidak pernah "dilihat" oleh model selama pelatihan. Data ini digunakan untuk mengevaluasi kemampuan generalisasi model pada data baru, memastikan model tidak hanya menghafal pola training data . tetapi benar-benar memahami relasi fundamental antar variabel. Metode K-Fold Cross Validation juga dapat diterapkan sebagai validasi tambahan, di mana dataset dibagi menjadi K subset dan proses training-testing diulang K kali dengan menghasilkan estimasi performa model yang lebih robust dan reliable. Pemodelan dengan Random Forest Classifier Penelitian ini melakukan modifikasi algoritma dari Regresi Logistik . ang umum digunakan penelitian terdahul. menjadi Random Forest Classifier. Pemilihan algoritma ini didasarkan pada beberapa keunggulan fundamental: Random Forest adalah ensemble learning method yang membangun banyak decision tree secara paralel dan mengagregasi prediksi mereka melalui voting mayoritas. Setiap tree dilatih pada subset data yang berbeda . ootstrap samplin. dan menggunakan JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 subset fitur acak, menciptakan diversitas antar tree. Keunggulan utama Random Forest adalah kemampuannya menangani hubungan nonlinear yang kompleks antara variabel. Dalam konteks stres mahasiswa, hubungan antara kualitas tidur dan stres mungkin tidak linear sederhana - mahasiswa dengan tidur 4 jam atau 2 jam mungkin memiliki tingkat stres yang berbeda secara eksponensial. Random Forest mampu menangkap kompleksitas ini tanpa memerlukan spesifikasi matematis Random Forest juga resisten terhadap overfitting dibandingkan single decision tree karena averaging prediksi dari banyak tree mengurangi variance dan meningkatkan kemampuan generalisasi. Algoritma ini juga robust terhadap outlier dan dapat menangani missing value dengan baik. Proses Hyperparameter Tuning dilakukan untuk mengoptimalkan performa model, . _estimator. , kedalaman maksimum tree . ax_dept. , dan minimum sample untuk split node. Teknik Grid Search atau Random Search dapat digunakan untuk menemukan kombinasi hyperparameter optimal. Evaluasi Model: Pendekatan Multi-Metrik Evaluasi model tidak cukup hanya menggunakan akurasi karena metrik tunggal ini dapat menyesatkan, terutama pada dataset yang pernah imbalanced. Penelitian ini menggunakan empat metrik evaluasi Akurasi mengukur proporsi prediksi benar dari total prediksi, memberikan gambaran umum performa model. Namun, akurasi tinggi bisa menyesatkan jika model hanya baik memprediksi kelas mayoritas. Presisi mengukur ketepatan prediksi positif dari semua mahasiswa yang diprediksi stres, berapa banyak yang benar-benar stres. Presisi tinggi penting untuk menghindari false alarm https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 yang dapat menyebabkan stigmatisasi atau pemborosan sumber daya konseling. Recall (Sensitivit. mengukur kemampuan model menemukan seluruh kasus positif yang sebenarnya - dari semua mahasiswa yang benar-benar stres, berapa banyak yang berhasil terdeteksi. Recall tinggi krusial dalam konteks kesehatan mental untuk meminimalkan false negative, memastikan tidak ada mahasiswa stres yang terlewat dan tidak mendapat bantuan. F1-Score adalah harmonic mean dari presisi dan recall, memberikan metrik seimbang yang mempertimbangkan trade-off antara Skor ini sangat berguna ketika ada menghindari false positive versus false Kombinasi metrik ini memastikan bahwa sistem deteksi dini stres yang dikembangkan tidak hanya akurat secara statistik, tetapi juga efektif dan aman untuk diimplementasikan oleh pihak kampus dalam mengidentifikasi mahasiswa yang membutuhkan intervensi konseling atau dukungan kesehatan mental. PEMBAHASAN 1Analisis Dataset dan Modifikasi Dalam perbandingan komprehensif antara dua dataset yang memiliki karakteristik dan tujuan yang berbeda. Analisis ini penting untuk memahami evolusi pendekatan penelitian, kelebihan dan keterbatasan masing-masing dataset, serta justifikasi pemilihan dataset untuk tahap pemodelan. - Karakteristik Dataset Awal Dataset awal merupakan dataset yang telah terstruktur dengan baik dan dirancang khusus untuk keperluan pemodelan prediktif stres mahasiswa dengan pertanyaan : JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 Gambar 2. Data Tidur Gambar 3. Data Sakit Kepala ISSN : 2985-4768 Gambar 4. Data Pembelajaran Gambar 5. Data Aktifitas Ekstra Kurikuler Gambar 6. Data Tingkat Stress Gambar 3. Data Akademik Dimensi dan Skala Dataset Dataset awal terdiri dari 520 baris data yang Dataset ini memiliki 6 kolom variabel, yang mencerminkan desain penelitian yang fokus dan tidak terlalu dimensionality dimana terlalu banyak fitur dapat menurunkan performa model. Struktur Variabel Input Dataset awal menggunakan pendekatan metrik umum yang telah divalidasi dalam literatur penelitian stres mahasiswa. Variabel-variabel Kualitas Tidur - Mengukur pola dan kualitas istirahat mahasiswa, yang memiliki korelasi kuat dengan tingkat stres dan performa kognitif. Variabel ini biasanya diukur dalam skala Likert atau jam tidur per hari. Frekuensi Sakit Kepala - Indikator fisik stres yang manifes dalam gejala Sakit kepala sering menjadi manifestasi fisik dari tekanan psikologis berkepanjangan. Performa Akademik Mencerminkan prestasi akademik https://jurnal. id/index. php/JORAPI/index mahasiswa, yang dapat diukur melalui IPK atau nilai rata-rata. Variabel ini penting karena memiliki hubungan bidirectional dengan stres: prestasi rendah dapat menyebabkan stres, dan stres tinggi dapat menurunkan prestasi. Beban Studi - Mengukur jumlah dan intensitas tugas akademik yang harus diselesaikan mahasiswa, termasuk jumlah SKS yang diambil, tugas mingguan, dan deadline yang Kegiatan Ekstrakurikuler Variabel yang menangkap aktivitas di luar akademik, yang dapat berfungsi sebagai stress reliever atau justru menjadi beban tambahan tergantung pada intensitas dan manajemen waktu KESIMPULAN Berdasarkan serangkaian modifikasi dan pengujian, model prediksi tingkat stres mahasiswa telah menunjukkan peningkatan substansial dalam akurasi dan relevansi kontekstual, menjadikannya alat yang jauh lebih JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 efektif untuk deteksi dini di lingkungan Peningkatan Akurasi dan Robustness Model Modifikasi inti pada model statistik konvensional (Regresi Logisti. terbukti berhasil melampaui batas kinerja sebelumnya: Peralihan Algoritma: Penggantian algoritma dari Regresi Logistik ke Random Forest (RF) memanfaatkan kemampuan RF untuk menangani hubungan non-linear dan kompleks antar variabel dengan lebih baik. RF, sebagai prediksi dari banyak pohon keputusan, yang secara inheren meningkatkan stabilitas dan mengurangi overfitting. Pengaruh Teknik Penyeimbang Data (SMOTE): Penerapan SMOTE (Synthetic Minority Over-sampling Techniqu. secara kritis mengatasi masalah imbalance data, di mana kasus mahasiswa dengan tingkat stres tinggi mungkin jauh lebih sedikit dibandingkan kasus dengan stres Dengan menyeimbangkan kelas, model Random Forest dapat belajar secara adil dari semua kategori, sehingga meningkatkan akurasi secara keseluruhan. Pencapaian Kinerja: Kombinasi strategis ini menghasilkan peningkatan akurasi prediksi signifikan dari 75,5% menjadi Peningkatan 7,5 poin persentase ini menunjukkan bahwa model modifikasi memiliki daya prediksi yang lebih kuat dan andal. Signifikansi Penambahan Variabel Psikologis dan Fisiologis Keberhasilan model tidak hanya berasal dari teknik pemodelan, tetapi juga dari validitas input data, yang diperkuat dengan penambahan variabel baru: Variabel Self-Compassion: Penambahan variabel Self-Compassion (Belas Kasih Dir. terbukti signifikan. Secara teoritis, self-compassion . eliputi self-kindness, common humanity, dan mindfulnes. berfungsi sebagai faktor protektif . Mahasiswa dengan tingkat self-compassion menunjukkan resiliensi yang lebih baik https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 dalam menghadapi tekanan akademik, penyeimbang terhadap munculnya stres. Variabel Kualitas Tidur: Kualitas Tidur yang buruk adalah salah satu prediktor kuat . alah satu penyebab utam. stres, khususnya stres akademik. Gangguan tidur memengaruhi fungsi kognitif, regulasi emosi, dan kemampuan coping . engatasi Signifikansi variabel ini menggarisbawahi pentingnya mempertimbangkan aspek fisiologis dalam mendeteksi dan mengelola stres. Implikasi Praktis dan Nilai Lebih Model Modifikasi Pencapaian teknis ini diterjemahkan langsung ke dalam manfaat praktis yang penting bagi lingkungan kampus: Pencegahan Kesalahan Prediksi Negatif Palsu (False Negative. : Akurasi yang ketidakseimbangan data yang efektif membuat model modifikasi mampu meminimalisir kesalahan prediksi negatif Kesalahan ini terjadi ketika sistem gagal mendeteksi mahasiswa yang sebenarnya berada dalam kondisi stres tinggi . ondisi yang paling kriti. Sistem Deteksi Dini yang Efektif: Karena kemampuannya mendeteksi kasus stres yang paling membutuhkan intervensi, model Random Forest dengan variabel Self-Compassion dan Kualitas Tidur lebih efektif dan praktis digunakan sebagai sistem deteksi dini di lingkungan kampus. Landasan Intervensi Dini: Hasil model memberikan landasan yang kuat bagi layanan kesehatan mental kampus untuk merancang intervensi yang ditargetkan . isalnya, program pelatihan selfcompassion atau lokakarya higienitas tidu. untuk kelompok mahasiswa yang teridentifikasi berisiko. Secara keseluruhan, penelitian ini berhasil menyajikan model prediktif yang akurat, sensitif, dan relevatif secara klinis, siap untuk digunakan sebagai tulang punggung sistem pendukung mahasiswa yang proaktif dan preventif. JORAPI : Journal of Research and Publication Innovation Vol. No. Oktober 2025 Halaman : 275-284 DAFTAR ISI Anandita. Hubungan Perceived Stress Dengan Emotional Eating Pada Mahasiswi Tingkat Akhir Di Jakarta. 1599Ae1607. Anissa. , & Qoiriah. Prediksi Tingkat Stres Berdasarkan Pola Hidup Menggunakan Machine Learning. 07, 292Ae . Masyarakat. Jakarta. Dahlan. , & Selatan. Mahasiswa Fakultas Kesehatan Masyarakat Universitas Muhammadiyah Jakarta Analysis Of Stress- https://jurnal. id/index. php/JORAPI/index ISSN : 2985-4768 Related Factors In Student Of The Faculty Of Public Health University Muhammadiyah Jakarta. 89Ae96. Psikologi. Islam. Agung. Lutfia. & Ayumi. Fakultas Psikologi Universitas Islam Sultan Agung Semarang . Rafly. Rafsanzani. Psikologi. Matulessy. Psikologi. Pratitis. , & Psikologi. Kebersyukuran Dan Stres Akademik Pada Mahasiswa Bekerja. , 196Ae205. Verdiana. Nugroho. Anggraini. & Bagaskara. Analisis Hubungan Dan Prediksi Depresi Mahasiswa Berdasarkan Faktor Akademik Dan Gender. 10, 33Ae42.