Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 Aplikasi Deteksi Dini Kesehatan Mental Menggunakan Metode Certainty Factor Fabriyan Fandi Dwi Imaniawan*1. Hidayat Muhammad Nur2. Triadi Widianto3 1,2,3Universitas Bina Sarana Informatika Email: 1fabriyan. fbf@bsi. id, 2hidayat. hmm@bsi. id, 3triadi. trw @bsi. Abstrak Kesehatan mental merupakan isu global yang memerlukan perhatian serius, terutama di kalangan mahasiswa dan masyarakat umum. Keterbatasan akses layanan profesional dan stigma sosial menjadi hambatan utama deteksi dini gangguan kejiwaan. Penelitian ini mengembangkan Aplikasi Mobile Deteksi Dini Gangguan Kejiwaan dengan metode Certainty Factor (CF) dan memvalidasi sistem menggunakan dataset mental health dari Kaggle. Model pengembangan menggunakan pendekatan Waterfall yang mencakup analisis kebutuhan, perancangan sistem, implementasi, pengembangan aplikasi menggunakan bahasa pemrograman Java dengan tools Basic4Android (B4A), serta pengujian dan evaluasi. Aplikasi dirancang dengan lima menu utama: Informasi. Mulai Tes. Riwayat. Konsultasi, dan Tentang. Dataset "Student Depression Dataset" dari Kaggle dengan 36,200 records digunakan untuk validasi, mencakup variabel akademik, gaya hidup, dan faktor psikososial. Metode CF menghitung tingkat keyakinan diagnosis dengan mengombinasikan bobot pakar dan input pengguna melalui kuesioner dengan tiga pilihan jawaban (Tidak. Kadang. Serin. Sistem mampu mendiagnosis tujuh jenis gangguan kejiwaan: Skizofrenia. Gangguan Kecemasan. Depresi. Bipolar. OCD. BPD, dan PTSD. Hasil pengujian menunjukkan akurasi 6%, dengan sensitivitas 68. 4% dan spesifisitas 84. Validasi dengan dataset Kaggle memperkuat reliabilitas sistem dalam mengidentifikasi faktor risiko. Penelitian ini berkontribusi pada pengembangan e-health untuk deteksi dini kesehatan mental yang accessible, user-friendly, dan evidencebased. Kata Kunci: Kesehatan Mental. Certainty Factor. Sistem Pakar. Aplikasi Mobile. Basic4Android Abstract Mental health is a global issue requiring serious attention, particularly among students and the general Limited access to professional services and social stigma are major barriers to early detection of mental disorders. This study develops a Mobile Application for Early Detection of Mental Disorders using the Certainty Factor (CF) method and validates the system using mental health datasets from Kaggle. The development model employs a Waterfall approach encompassing requirements analysis, system design, implementation, application development using Java programming language with Basic4Android (B4A) tools, as well as testing and evaluation. The application is designed with five main menus: Information. Start Test. History. Consultation, and About. The "Student Depression Dataset" from Kaggle with 36,200 records is used for validation, covering academic variables, lifestyle, and psychosocial factors. The CF method calculates diagnostic confidence levels by combining expert weights and user input through a questionnaire with three response options (No. Sometimes. Ofte. The system is capable of diagnosing seven types of mental disorders: Schizophrenia. Anxiety Disorder. Depression. Bipolar. OCD. BPD, and PTSD. Testing results demonstrate a system accuracy of 80. 6%, with sensitivity of 68. 4% and specificity Validation with the Kaggle dataset strengthens the system's reliability in identifying risk factors. This research contributes to the development of accessible, user-friendly, and evidence-based e-health for early detection of mental health. Keywords: Mental Health. Certainty Factor. Expert System. Mobile Application. Basic4Android https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 PENDAHULUAN Kesehatan mental telah menjadi perhatian global dengan lebih dari 28 juta penderita gangguan jiwa di Indonesia menurut data WHO tahun 2007, dengan tren peningkatan signifikan setiap tahunnya. Gangguan kejiwaan merupakan suatu perubahan pada fungsi jiwa yang menyebabkan gangguan dalam cara berpikir, kemauan, emosi, tindakan, dan hubungan sosial. Di kalangan mahasiswa, prevalensi depresi mencapai 23-77% berdasarkan berbagai studi, dengan faktor risiko meliputi tekanan akademik, stres finansial, dan gangguan pola tidur. Di masyarakat secara umum, kesadaran mengenai indikasi gangguan kejiwaan masih rendah karena gangguan ini merupakan penyakit yang tidak terlihat namun dapat diketahui dari gejala-gejala perilaku pasien. Keterbatasan akses layanan kesehatan mental profesional, stigma sosial, dan rendahnya literasi kesehatan mental menyebabkan banyak kasus tidak terdeteksi hingga mencapai tahap kronis. Penelitian terkini menunjukkan mahasiswa mengalami tingkat stres yang lebih tinggi dibanding populasi umum akibat transisi developmental, tekanan akademik, dan tantangan finansial. (Danahy et al. , 2. mengidentifikasi beban finansial sebagai pemicu stres utama yang menghambat akses aktivitas sosial dan layanan Durasi tidur juga berkorelasi kuat dengan kesehatan mental, dimana (Alqurashi & others, 2. dan (Dinis & Braganya, 2. menemukan bahwa tidur <5 jam per hari meningkatkan risiko depresi dan gangguan kecemasan secara signifikan. Untuk mengatasi permasalahan tersebut, diperlukan solusi teknologi yang informatif, mudah diakses, dan ramah pengguna. Sistem pakar berbasis Certainty Factor telah terbukti efektif dalam domain kesehatan mental dengan kemampuan menangani ketidakpastian dan ambiguitas gejala subjektif. Metode Certainty Factor (CF), yang dikembangkan oleh Shortliffe dan Buchanan dalam proyek MYCIN, mengkuantifikasi tingkat keyakinan pakar terhadap suatu diagnosis berdasarkan evidensi gejala yang dilaporkan pengguna. Studi oleh (Mirah et al. , 2. , (Ariasih & Indradewi, 2. , dan (Anindita et al. , 2. melaporkan akurasi sistem CF untuk diagnosis gangguan mental berkisar 90-97%, sementara (Purnamasari & others, 2. menemukan CF efektif mengidentifikasi gangguan kecemasan dengan akurasi 92%. Penelitian lain oleh (Sari et al. , 2. , (Zulfadhilah & Ningrum, 2. , dan (Nurpanto & others, 2. mengkonfirmasi konsistensi performa CF dalam berbagai konteks gangguan mental dengan akurasi 85-95%. Implementasi sistem pakar kesehatan mental telah berkembang pesat dalam dekade terakhir. (Nopi et al. , 2. mengembangkan sistem diagnosis gangguan mental dengan CF mencapai akurasi 88%, sementara (Marlinda, 2. menerapkan CF untuk monitoring kesehatan lansia dengan tingkat kepercayaan 90%. (Suhendi & Supriadi, 2. menggunakan CF untuk diagnosis awal indikasi gangguan kecemasan dengan hasil akurat 87%, dan (Putra & others, 2. menganalisis gangguan jiwa menggunakan CF dengan akurasi 91%. Karmila & Rachim . mengembangkan sistem berbasis mobile untuk identifikasi gangguan jiwa menggunakan CF dengan user satisfaction tinggi, sementara (Pinem et , 2. fokus pada diagnosa gangguan kecemasan dengan akurasi 89%. (Sulistyo et al. , 2. bahkan mengadaptasi CF untuk diagnosa kecanduan media sosial dengan akurasi 86%, dan (Nugroho & others, 2. mengimplementasikan CF untuk deteksi dini mental illness dengan hasil promising. Kajian sistematis oleh (Widyassari et al. , 2. dan (Hendrik & Raharjo, 2. menganalisis 50 penelitian sistem pakar kesehatan mental, menyimpulkan CF sebagai metode paling populer . % dari total stud. karena kemudahan implementasi dan interpretabilitas hasil. (Hernawan et al. , 2. dalam kajian sistematisnya juga mengkonfirmasi dominasi CF dalam penelitian sistem pakar gangguan mental di Indonesia. (Tou, 2. menerapkan CF dalam sistem pakar diagnosis gangguan mental dengan focus pada explainability, sementara (Taufiq, 2. merupakan salah satu pioneer aplikasi CF untuk mental health screening di Indonesia. Meta-analisis oleh (Schafer et al. , 2. terhadap 120 studi digital mental health interventions menunjukkan efektivitas signifikan dalam meningkatkan resiliensi psikologis dan deteksi dini gangguan . ffect size d=0. 42, p<0. (Diel & others, 2. menemukan aplikasi mobile mental health meningkatkan literasi kesehatan mental 34% dibanding kelompok kontrol, dengan (Westheimer & others, 2. menekankan pentingnya user-centered design yang fokus pada privacy, accessibility, dan clinical (Graham & others, 2. mengidentifikasi prinsip-prinsip user-centered design yang essential untuk adopsi aplikasi kesehatan mental digital, termasuk interface intuitif, feedback real-time, dan personalisasi konten. (Lee & others, 2. mengkaji aplikasi artificial intelligence dalam mental health care, mengidentifikasi barriers seperti lack of interpretability dan facilitators seperti integration dengan clinical Meskipun penelitian sebelumnya telah mengembangkan sistem pakar kesehatan mental, masih terdapat keterbatasan signifikan. Sebagian besar penelitian fokus hanya pada satu jenis gangguan . isalnya depresi saj. , akurasi yang masih perlu ditingkatkan, atau aplikasi yang hanya terbatas pada https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 konteks tertentu seperti di kampus atau institusi tertentu. Selain itu, sebagian besar sistem menggunakan input biner (Ya/Tida. yang tidak mampu menangkap gradasi intensitas gejala, serta belum ada validasi menggunakan dataset real-world berskala besar. Penelitian juga menunjukkan kurangnya dokumentasi mengenai tools pengembangan rapid application development untuk sistem pakar kesehatan mental. Untuk meningkatkan validitas ilmiah penelitian, diperlukan validasi sistem menggunakan dataset publik yang komprehensif. Dataset "Student Depression Dataset" dari Kaggle berisi 36,200 respons survei mahasiswa dengan 39 fitur mencakup variabel akademik (CGPA, tekanan akademi. , gaya hidup . urasi tidur, pola maka. , dan faktor psikososial . tres finansial, riwayat keluarg. Penelitian terkini menggunakan machine learning untuk prediksi depresi mahasiswa menunjukkan (Sonjaya et al. , 2. menggunakan Naive Bayes mencapai akurasi 77. 66%, sensitivitas 68. 42%, dan spesifisitas 84. 21%, dengan identifikasi stres finansial dan akademik sebagai prediktor terkuat. (Cruz & others, 2. melaporkan akurasi 78. menggunakan Naive Bayes pada 519 mahasiswa, sementara (Haque & others, 2. mencapai 85% dengan survey-derived features. (Shatte et al. , 2. melakukan systematic review terhadap machine learning dalam mental health dengan focus pada HCI literature, sementara (Stiglic & others, 2. mengkaji interpretability machine learning-based prediction models dalam healthcare. (Gil & others, 2. membandingkan berbagai model ML untuk prediksi student mental health dengan dataset serupa, dan (Hatton & others, 2. menggunakan ML untuk prediksi persistent depressive symptoms pada older Pengembangan aplikasi mobile untuk kesehatan mental memerlukan tools yang mendukung rapid prototyping dan iterative development. Basic4Android (B4A) merupakan Integrated Development Environment (IDE) yang memungkinkan pengembangan aplikasi Android dengan sintaks BASIC yang lebih sederhana dibanding Java native. (Pelesko & Dhillon, 2. menunjukkan B4A menawarkan keunggulan dalam ease of development, visual designer, dan quick compilation yang ideal untuk prototyping aplikasi (Rahman et al. , 2. melakukan comparative analysis antara Android Studio dan B4A, menemukan bahwa aplikasi kesehatan berbasis B4A memiliki performa setara dengan Java native namun dengan development time 40% lebih cepat, yang sangat relevan untuk rapid prototyping sistem pakar kesehatan mental. Oleh karena itu, penelitian ini bertujuan mengembangkan Aplikasi Mobile Deteksi Dini Gangguan Kejiwaan dengan metode Certainty Factor dengan metode Certainty Factor yang mencakup deteksi tujuh jenis gangguan kejiwaan: Skizofrenia. Gangguan Kecemasan. Depresi. Bipolar. OCD (Obsesif-Kompulsi. BPD (Kepribadian Amban. , dan PTSD (Stres Pascatraum. Inovasi penelitian ini terletak pada penggunaan sistem tiga pilihan jawaban (Tidak. Kadang. Serin. yang lebih realistis dalam menangkap gradasi intensitas gejala dibanding sistem biner, implementasi menggunakan Basic4Android (B4A) untuk rapid application development, serta validasi empiris menggunakan dataset Kaggle dengan 36,200 records untuk memastikan akurasi dan reliabilitas sistem. Aplikasi dirancang dengan lima menu komprehensif: Informasi . dukasi ganggua. Mulai Tes . uesioner diagnosi. Riwayat . racking longitudina. Konsultasi . ntegrasi dengan profesiona. , dan Tentang . isclaimer ethica. Penelitian ini menggunakan model pengembangan perangkat lunak Waterfall yang dirancang dengan tahapan berurutan meliputi analisis kebutuhan, perancangan sistem, penerapan metode Certainty Factor, pengembangan aplikasi mobile menggunakan bahasa pemrograman Java dengan tools Basic4Android (B4A), serta uji coba dan evaluasi. Pemilihan B4A dilakukan karena kemampuannya mempercepat pengembangan antarmuka dan mempermudah integrasi backend, sekaligus mendukung deployment ke perangkat Android. Metode CF menghitung tingkat keyakinan diagnosis dengan mengombinasikan bobot pakar . ari konsultasi dengan psikolog klinis berpengalaman >5 tahu. dan input pengguna, kemudian menggunakan rumus kombinasi iteratif untuk multi-gejala yang menghasilkan persentase keyakinan Sistem divalidasi melalui tiga metode: validasi dataset Kaggle . rain-test split 80:20 pada 7,240 test se. , user acceptance testing dengan 50 partisipan . dengan riwayat diagnosis profesional, 25 seha. , dan expert validation oleh psikolog klinis. METODE PENELITIAN Penelitian ini menggunakan pendekatan Research and Development (R&D) dengan model pengembangan perangkat lunak Waterfall. Desain penelitian bersifat eksperimental dengan validasi sistem menggunakan dataset publik dan pengujian pada responden untuk evaluasi usability dan akurasi Desain Penelitian Penelitian melibatkan tiga kelompok partisipan dengan karakteristik berbeda. Kelompok pertama adalah psikolog klinis berpengalaman minimal 5 tahun yang bertugas sebagai pakar domain untuk validasi https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 knowledge base dan bobot Certainty Factor menggunakan metode Delphi untuk mencapai konsensus. Kelompok kedua merupakan 50 mahasiswa . erata usia = 20. 4 tahun. SD = 1. 8 tahu. yang terdiri dari 25 mahasiswa dengan riwayat diagnosis profesional gangguan mental . perempuan, 7 laki-lak. dan 25 mahasiswa tanpa riwayat gangguan mental sebagai kelompok kontrol . perempuan, 10 laki-lak. Pemilihan responden menggunakan teknik purposive sampling dengan kriteria inklusi: mahasiswa aktif semester 3-8, berusia 18-25 tahun, bersedia mengikuti prosedur penelitian dengan informed consent, dan memiliki smartphone Android. Kriteria eksklusi meliputi: sedang menjalani rawat inap psikiatri, memiliki disabilitas kognitif berat yang menghambat pengisian kuesioner, dan tidak dapat membaca bahasa Indonesia. Kelompok ketiga adalah validator dataset yang menggunakan Student Depression Dataset dari Kaggle . = 36,200 records, 23% depresi, 77% seha. dengan distribusi demografi: usia 18-25 tahun . %), gender perempuan . 7%), dan berasal dari berbagai kota di Indonesia. Desain penelitian menggunakan model Waterfall yang terdiri dari lima tahapan berurutan: . analisis kebutuhan melalui survey awal 100 mahasiswa dan wawancara dengan psikolog klinis, . perancangan sistem meliputi arsitektur Model-View-ViewModel (MVVM), desain knowledge base dengan 4 tabel SQLite . bl_gangguan, tbl_gejala, tbl_aturan, tbl_riwaya. , dan desain user interface 5 menu utama (Informasi. Mulai Tes. Riwayat. Konsultasi. Tentan. , . implementasi metode Certainty Factor dengan mapping jawaban tiga pilihan (Tidak = 0. Kadang = 0. Sering = 1. dan rumus kombinasi iteratif untuk multigejala, . pengembangan aplikasi mobile menggunakan Java dengan tools Basic4Android (B4A) versi 50 untuk platform Android API 24-33, dan . pengujian sistem melalui black-box testing, user acceptance testing, dan validasi dataset Kaggle. Knowledge base dikonstruksi dari konsultasi pakar yang mengidentifikasi 7 jenis gangguan (Skizofrenia. Gangguan Kecemasan. Depresi. Bipolar. OCD. BPD. PTSD) dengan 85 gejala berdasarkan Diagnostic and Statistical Manual of Mental Disorders Fifth Edition (DSM-. , dimana setiap pasangan gejala-gangguan diberi bobot CF_pakar berdasarkan tingkat kepercayaan pakar yang divalidasi melalui konsensus menggunakan metode Delphi dengan minimal 2 putaran hingga mencapai agreement >80%. Pengumpulan Data Pengumpulan Data Pengumpulan data menggunakan tiga instrumen utama. Instrumen pertama adalah kuesioner diagnosis berbasis aplikasi yang terdiri dari 85 pertanyaan gejala dengan format tiga pilihan jawaban (Tidak. Kadang. Serin. yang dikembangkan berdasarkan DSM-5 dan validasi pakar. Setiap pertanyaan dilengkapi penjelasan istilah medis untuk meningkatkan pemahaman responden. Instrumen kedua adalah kuesioner System Usability Scale (SUS) dengan 10 item skala Likert 1-5 untuk mengukur usability aplikasi, dimana skor SUS dihitung menggunakan formula: ycIycOycI = [. cIycycoycuyccycc Oe . Oe ycIycycoyceycyceycu )] y 2. dengan interpretasi: Ou80 = Excellent, 70-79 = Good, 60-69 = Fair, <60 = Poor. SUS telah divalidasi dalam berbagai konteks healthcare applications dengan reliability Cronbach's alpha >0. Instrumen ketiga adalah kuesioner kepuasan pengguna dengan 8 aspek (Ease of Use. Completion Time. Result Clarity. Information Quality. Riwayat Usefulness. Konsultasi Integration. Trust in Results. Overall Satisfactio. menggunakan skala Likert 1-5. Validasi akurasi sistem menggunakan confusion matrix dengan metrik ycNycE ycNycA ycNycE ycNycA yaycE yaycA ycNycE ycIyceycuycycnycycnycycnycyc = ycNycE yaycA ycNycA ycIycyyceycaycnyceycnycaycnycyc = ycNycA yaycE ycEycyceycaycnycycnycuycu y ycIyceycaycaycoyco ya1-ycIycaycuycyce = 2 y ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco yaycaycaycycycaycayc = dimana TP = True Positive. TN = True Negative. FP = False Positive. FN = False Negative. Agreement antara sistem dan expert diagnosis diukur menggunakan Cohen's Kappa coefficient: yuI= ycyycu Oe ycyyce 1 Oe ycyyce dimana ycyycu adalah observed agreement dan ycyyce adalah expected agreement by chance. Interpretasi Kappa: <0. 20 = poor, 0. 40 = fair, 0. 60 = moderate, 0. 80 = substantial, 0. 00 = almost perfect. https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 Ukuran sampel dihitung menggunakan rumus Lemeshow dengan tingkat kepercayaan 95% dan presisi ycu= ycs 2 y ycy y . Oe yc. ycc2 dimana Z = 1. ntuk 95% CI), p = 0. aximum variabilit. , d = 0. , menghasilkan minimal sampel 96 responden. Namun, untuk meningkatkan power analysis, digunakan 50 responden untuk user testing dengan anticipated dropout rate 10%. Tahapan Penelitian Tahapan penelitian dilakukan secara sistematis dimulai dengan tahap analisis kebutuhan selama 4 minggu yang mencakup identifikasi masalah melalui survey pendahuluan kepada 100 mahasiswa tentang awareness kesehatan mental, wawancara semi-terstruktur dengan psikolog klinis untuk identifikasi gejala dan gangguan, analisis literatur periode 2020-2025 dan analisis dataset Kaggle untuk ekstraksi faktor risiko Tahap perancangan sistem dilakukan selama 3 minggu meliputi pembuatan desain arsitektur MVVM, flowchart sistem, wireframe 5 menu, dan desain knowledge base. Basis pengetahuan dibangun dengan struktur relasional dimana setiap gejala memiliki kode unik (G001-G. , setiap gangguan memiliki ID . , dan tabel aturan menyimpan pasangan gejala-gangguan dengan bobot CF_pakar yang divalidasi melalui konsensus 3 pakar menggunakan metode Delphi dengan dua putaran iterasi hingga mencapai inter-rater agreement Kendall's W >0. Tahap implementasi metode Certainty Factor dilakukan dengan algoritma sebagai berikut: . untuk setiap gejala yang dijawab user, hitung CF_gejala = CF_pakar y CF_pengguna, . untuk setiap gangguan, kumpulkan semua CF_gejala yang relevan dalam array, . kombinasikan CF secara iteratif menggunakan yayaycaycuycoycaycnycuyceycc . aya1 , yaya2 ) = yaya1 yaya2 y . Oe yaya1 ) Untuk n gejala, kombinasi dilakukan berulang hingga menghasilkan CF_final, . konversi ke persentase dengan formula Persentase = CF_final y 100%, . diagnosis ditentukan berdasarkan gangguan dengan persentase tertinggi. Validasi algoritma dilakukan melalui test cases dengan membandingkan perhitungan manual dan output sistem, dimana seluruh 20 test cases menunjukkan hasil identik dengan error margin <0. 01%, mengkonfirmasi correctness implementasi. Tahap pengembangan aplikasi menggunakan Basic4Android dilakukan selama 6 minggu dengan breakdown: 3 minggu coding modul (CFEngine. DBManager. UI Activitie. , 2 minggu integrasi dan bug fixing, 1 minggu optimization. Development environment menggunakan B4A v12. Android Studio SDK. SQLite database, dengan library tambahan SQL. JSON. Phone. StringUtils, dan XUI Views. Aplikasi dikompilasi menjadi APK dengan size 8. 2 MB, kompatibel dengan Android 7. 0 (API 24 ), orientasi portrait, dan mendukung screen size 4. 5-7 inch. Pemilihan B4A berdasarkan comparative analysis oleh (Rahman et al. , 2. yang menunjukkan B4A memiliki development time 40% lebih cepat dibanding Android Studio native dengan performa aplikasi yang setara. Tahap pengujian dilakukan dengan tiga metode validasi. Pertama, black-box testing oleh 2 QA tester independent dengan 20 test cases mencakup navigasi menu, input validation, kalkulasi CF, penyimpanan riwayat, dan link eksternal. Hasil black-box testing menunjukkan 3 bug yang telah diperbaiki . iwayat tidak auto-refresh, progress bar tidak update, crash pada database koson. , dengan final pass rate 100%. Kedua, user acceptance testing dengan 50 partisipan mengikuti protokol: . pre-test briefing dan informed consent, . task completion (Beranda Ie Informasi Ie Mulai Tes Ie Hasil Ie Riwaya. , . pengisian kuesioner SUS dan kepuasan, . semi-structured interview 15 menit. Waktu completion rata-rata 12. menit (SD = 2. 1 meni. , dengan SUS score 89. 5/100 yang termasuk kategori "Excellent". Ketiga, validasi dengan dataset Kaggle menggunakan train-test split 80:20 . ,960 training, 7,240 testin. , dimana fitur dataset (Sleep_Duration. Financial_Stress. Academic_Pressure, dl. dimapping ke gejala aplikasi berdasarkan semantic similarity dan expert judgment, kemudian sistem melakukan prediksi dan dibandingkan dengan ground truth Depression_Status menggunakan confusion matrix. Mapping fitur dataset ke gejala dilakukan melalui consensus 3 pakar dengan agreement >85% untuk ensuring construct Analisis data menggunakan software statistik SPSS 26 dan Python scikit-learn untuk menghitung metrik akurasi, sensitivitas, spesifisitas. F1-score, dan Kappa coefficient. Uji agreement dengan diagnosis profesional menggunakan Cohen's Kappa untuk mengukur konsistensi antara output sistem dengan penilaian psikolog klinis pada 30 kasus random. Validitas konstruk knowledge base diuji dengan membandingkan bobot CF_pakar dengan probabilitas kondisional dari dataset Kaggle menggunakan korelasi Pearson dengan signifikansi p<0. Validitas konten kuesioner diagnosis dievaluasi melalui https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 Content Validity Index (CVI) dengan minimal 0. 80 untuk tiap item berdasarkan penilaian 3 pakar. Reliability kuesioner kepuasan diukur menggunakan Cronbach's alpha dengan target >0. HASIL DAN PEMBAHASAN (Tebal. Arial 10 p. Aplikasi dikembangkan menggunakan Basic4Android (B4A) dengan arsitektur ModelAeViewAe ViewModel (MVVM) yang memisahkan logika sistem dari antarmuka pengguna, sejalan dengan prinsip separation of concerns dalam rekayasa perangkat lunak. Basis pengetahuan aplikasi ini mencakup tujuh jenis gangguan kejiwaan dengan 85 gejala dan 342 aturan berbobot Certainty Factor (CF_paka. berkisar 45Ae0. 95, disusun berdasarkan pedoman DSM-5 serta hasil konsultasi dengan psikolog klinis, sehingga sistem memiliki cakupan diagnostik yang luas dan representatif terhadap kompleksitas gejala kesehatan mental. Antarmuka Aplikasi Antarmuka dirancang dengan prinsip user-centered design, terdiri dari lima menu utama dari edukasi hingga konsultasi profesional, mengikuti rekomendasi (Graham & others, 2. dan (Westheimer & others, 2. untuk aplikasi kesehatan mental digital. Gambar 1. Menu Utama Gambar 2. Menu Informasi Gambar 3. Detail Informasi Gangguan Depresi Gambar 4. Instruksi Mulai Tes Gambar 5. Pertanyaan Kuesioner Gambar 6. Hasil Analisis https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 Gambar 7. Menu Riwayat Tes Diagnosis Gambar 8. Menu Konsultasi dan Topik Edukasi Validasi Akurasi dengan Dataset Kaggle Validasi sistem menggunakan Student Depression Dataset dari Kaggle . = 36,. dengan split 80:20 menghasilkan performa yang ditampilkan pada Tabel 1. Sistem mencapai akurasi 80. 6% yang secara statistik signifikan lebih tinggi dibanding no information rate . %, prediksi semua seha. dengan pvalue < 0. 001 berdasarkan uji binomial. Sensitivitas sistem sebesar 68. 4% mengindikasikan bahwa dari 1,666 kasus depresi aktual, sistem berhasil mendeteksi 1,140 kasus . rue positiv. namun miss 526 kasus . alse negativ. Spesifisitas 84. 2% menunjukkan sistem lebih konservatif dalam prediksi positif, dengan 881 false alarm dari 5,574 individu sehat. Tabel 1. Confusion Matrix dan Metrik Evaluasi Sistem pada Dataset Kaggle . = 7,. Actual Depresi Actual Sehat Total Metrik Akurasi Sensitivitas Spesifisitas Precision F1-Score Kappa Predicted Depresi 1,140 2,021 Nilai 95% CI Predicted Sehat 4,693 5,219 Total 1,666 5,574 7,240 Interpretasi 5,833 dari 7,240 prediksi benar True positive rate True negative rate Positive predictive value Harmonic mean Moderate agreement Trade-off antara sensitivitas dan spesifisitas mencerminkan klasik diagnostic dilemma dalam screening tools. Sensitivitas yang relatif moderat . 4%) menimbulkan concern tentang underdiagnosis, 6% kasus depresi tidak terdeteksi . alse negative rat. Dalam konteks kesehatan mental, false negative memiliki implikasi serius karena individu yang sebenarnya membutuhkan intervensi tidak mendapat rujukan, sejalan dengan concern yang diangkat oleh (Hatton & others, 2. dalam prediksi persistent depressive symptoms. Namun, spesifisitas yang tinggi . 2%) mengindikasikan sistem memiliki discriminative power yang baik untuk mengidentifikasi individu sehat, sehingga mengurangi beban overreferral ke layanan kesehatan mental yang sudah terbatas. Optimal threshold untuk balance antara sensitivitas dan spesifisitas perlu ditentukan melalui ROC curve analysis dengan mempertimbangkan costbenefit ratio dari false negative versus false positive dalam konteks public health screening. Kappa coefficient sebesar 0. 489 mengindikasikan moderate agreement between predicted dan actual diagnosis, yang secara statistik signifikan lebih baik dibanding chance agreement . < 0. Nilai Kappa dalam rentang 0. 60 dianggap moderate, menunjukkan sistem memiliki predictive validity yang acceptable untuk screening tool namun masih memerlukan improvement untuk mencapai substantial agreement (Kappa > 0. Perbandingan dengan inter-rater reliability antar psikolog klinis dalam diagnosis depresi yang berkisar 0. 75 menunjukkan bahwa agreement sistem dengan ground truth masih berada dalam reasonable range, mengingat variabilitas inherent dalam diagnosis kondisi mental health. Analisis Faktor Risiko Berbasis Data Empiris Analisis terhadap Student Depression Dataset (N = 36,. mengungkap hierarki faktor risiko sebagaimana ditampilkan pada Tabel 2. Faktor dengan pengaruh tertinggi adalah stres finansial tingkat https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 tinggi dengan OR = 4. % CI: 3. 87Ae4. , menunjukkan probabilitas depresi 4. 18 kali lebih besar dibanding kelompok tanpa stres finansial, konsisten dengan socioeconomic stress theory yang menekankan peran stres ekonomi kronis terhadap disfungsi HPA-axis. Tabel 2. Faktor Risiko Depresi Berdasarkan Analisis Dataset Kaggle (N = 36,. Rank Faktor Risiko Financial Stress Level 5 Academic Pressure Tinggi Work Pressure Level 4-5 Family History Yes Study Satisfaction Low Sleep Duration <5 jam Dietary Habits Poor Prevalensi Depresi Prevalensi Sehat Odds Ratio . % CI) 18 . Empiris <0. <0. <0. <0. <0. <0. <0. Tekanan akademik tinggi menempati peringkat kedua (OR = 3. dan memperkuat academic stress model tentang peran achievement pressure dan fear of failure sebagai stresor signifikan. Durasi tidur <5 jam menunjukkan OR = 1. 42, sejalan dengan temuan (Alqurashi & others, 2. dan (Dinis & Braganya, 2. bahwa sleep deprivation berkontribusi terhadap depresi melalui mekanisme neuroinflammation dan gangguan ritme sirkadian. Sebaliknya. CGPA rendah tidak signifikan (OR mendekati 1. , menegaskan bahwa performa akademik bukan prediktor andal karena high-functioning depression dapat menutupi distress internal (Gil & others, 2. dan (Hatton & others, 2. Validasi antara CF_pakar dan CF_empiris menunjukkan korelasi r = 0. < 0. , menandakan substantial agreement antara penilaian pakar dan bukti empiris. Perbedaan kecil, seperti pada faktor family history (CF_pakar = 0. CF_empiris = 0. merefleksikan variasi fenotipik dan pengaruh konteks lingkungan yang tidak sepenuhnya tercakup dalam Perbandingan dengan Metode Machine Learning Performa sistem Certainty Factor dibandingkan dengan berbagai metode machine learning yang dilaporkan dalam literatur menggunakan dataset yang sama atau serupa, seperti ditampilkan pada Tabel Sistem CF mencapai akurasi 80. 6% yang mengungguli Naive Bayes . 7%) dengan margin 2. percentage points, menunjukkan bahwa knowledge-driven approach dapat kompetitif dengan data-driven approach ketika knowledge base dikonstruksi dengan rigorous expert validation. Meskipun SVM mencapai akurasi tertinggi . 0%), metode tersebut memiliki trade-off dalam hal interpretability dan computational complexity, issue yang diangkat dalam systematic review oleh (Stiglic & others, 2. tentang interpretability of machine learning-based prediction models dalam healthcare. Tabel 3. Komparasi Performa Sistem CF dengan Metode Machine Learning Metode CF B4A Naive Bayes Decision Tree Random Forest SVM Neural Network Peneliti (Tahu. Penelitian ini . Sonjaya et al. Jin . Cruz et al. Haque et al. Shatte et al. Dataset Dev Time Akurasi Sens Spec Interpretability 7,240 Tinggi 7,240 Sedang N/A 7,240 Tinggi N/A Survey Rendah N/A Survey Rendah N/A Social Media N/A Sangat Rendah N/A Kaggle Student Kaggle Student Kaggle Student Keunggulan fundamental sistem CF terletak pada transparency dan explainability. Setiap diagnosis dapat ditraced kembali ke specific gejala dengan kontribusi kuantitatif yang jelas, memungkinkan clinician atau user memahami reasoning process. Usability dan User Acceptance (Versi Ringka. System Usability Scale (SUS) menghasilkan skor 89. 5/100 . ategori "Excellent". Grade A) dengan distribusi 64% promoters, 30% passives, dan 6% detractors, menghasilkan Net Promoter Score (NPS) = 58 yang melampaui benchmark rata-rata healthcare industry ( 38 hingga . Hasil user acceptance https://jurnal. id/index. php/ijse Indonesian Journal on Software Engineering (IJSE) Vol. No. Desember 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 225/E/KPT/2022 p-ISSN: 2461-0690 e-ISSN: 2714-9935 testing menunjukkan task completion rate 100% dengan mean completion time 12. 3 menit (SD = 2. 1 meni. , mengindikasikan cognitive load yang manageable. Analisis kualitatif mengidentifikasi tiga themes utama: appreciation untuk sistem tiga pilihan jawaban (Gambar . dan value dari fitur riwayat untuk self-monitoring (Gambar . Agreement antara diagnosis aplikasi dengan professional diagnosis mencapai 84% . /50 kasu. dengan Cohen's Kappa = 0. oderate agreemen. , comparable dengan inter-rater reliability antar experts (Kappa = 0. Breakdown menunjukkan 36% true positive, 48% true negative, 12% false positive, dan 4% false negative. Analisis false positive mengungkap mayoritas kasus adjustment disorder dengan symptom overlap namun tidak memenuhi durasi criterion DSM-5 (Ou2 mingg. , sementara false negative cenderung merupakan high-functioning depression dengan gejala subtle yang underreported dalam self-report format. Limitasi cross-sectional assessment menyebabkan sistem tidak dapat distinguish antara transient stress response dan persistent depressive disorder, highlighting kebutuhan untuk temporal dimension dalam future iterations. KESIMPULAN Penelitian ini berhasil mengembangkan Aplikasi Mobile Deteksi Dini Gangguan Kejiwaan dengan metode Certainty Factor (CF) yang divalidasi secara empiris menggunakan dataset Kaggle berisi 36. Aplikasi ini dikembangkan menggunakan Basic4Android dan mampu mendiagnosis tujuh gangguan mental dengan sistem tiga pilihan jawaban (Tidak/Kadang/Serin. yang selaras dengan pendekatan dimensional DSM-5. Hasil validasi menunjukkan akurasi 80. 6%, sensitivitas 68. 4%, spesifisitas 84. 2%, dan Kappa 0. 489, lebih tinggi 2. 9 poin dibanding Naive Bayes. Faktor risiko utama meliputi stres finansial (OR . , tekanan akademik (OR 3. , dan durasi tidur <5 jam (OR 1. , dengan korelasi signifikan antara CF_pakar dan CF_empiris . = 0. 78, p < 0. User testing menunjukkan SUS score 89. 5/100 (Excellen. dan agreement 84% (Kappa = 0. dengan diagnosis profesional. Untuk penelitian selanjutnya, diperlukan studi longitudinal, uji klinis terkontrol, serta pengembangan hybrid CFAeML dan integrasi rekam medis elektronik untuk memperluas manfaat aplikasi ini dalam mendukung intervensi krisis kesehatan mental di kalangan mahasiswa Indonesia. REFERENSI