Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. No. Februari 2026, hlm. p-ISSN: 2355-7699 e-ISSN: 2528-6579 OPTIMALISASI PREDIKSI LAMA STUDI MAHASISWA MENGGUNAKAN ROUGH SET DAN CASE-BASED REASONING Muh. Nurtanzis Sutoyo*1. Rabiah Adawiyah2 Universitas Sembilanbelas November Kolaka. Kolaka Email: 1mns. usn21@gmail. com, 2bia. fti@usn. Penulis Korespondensi (Naskah masuk: 11 April 2025, diterima untuk diterbitkan: 18 September 2. Abstrak Prediksi lama studi mahasiswa menjadi aspek penting dalam perencanaan akademik, evaluasi kinerja, serta identifikasi potensi keterlambatan kelulusan. Penelitian ini mengusulkan pendekatan hibrida dengan mengintegrasikan metode Rough Set dan Case-Based Reasoning untuk meningkatkan akurasi prediksi kelas lama studi mahasiswa. Metode Rough Set digunakan untuk mengekstraksi aturan klasifikasi berbasis kombinasi atribut IPK, status bekerja, dan status beasiswa, serta menghitung probabilitas kelas pada boundary region. Di sisi lain, metode CBR dimanfaatkan untuk menghitung similarity antar kasus berdasarkan kemiripan atribut, termasuk jumlah SKS yang dinormalisasi. Hasil prediksi dilakukan melalui integrasi probabilitas dari Rough Set dan similarity CBR menggunakan bobot kombinasi sebesar 0. 6 dan 0. Pada pengujian kasus baru, diperoleh lima kasus historis paling mirip dengan similarity 0. 97, empat di antaranya tergolong AuSangat TerlambatAy dan satu AuTerlambatAy. Sementara itu, probabilitas dari Rough Set menunjukkan distribusi 0. 667 untuk AuSangat TerlambatAy 333 untuk AuTerlambatAy. Hasil integrasi memberikan skor akhir sebesar 0. 720 untuk AuSangat TerlambatAy dan 280 untuk AuTerlambatAy, yang menunjukkan sistem prediksi cenderung kuat terhadap kategori AuSangat TerlambatAy. Pendekatan gabungan ini terbukti efektif dalam menggabungkan kekuatan generalisasi dari Rough Set dan fleksibilitas adaptif dari CBR, sehingga dapat digunakan sebagai sistem pendukung keputusan dalam evaluasi akademik berbasis data historis. Kata kunci: Prediksi Lama Studi. Rough Set. Case-Based Reasoning. Boundary Region. Similarity OPTIMIZATION OF STUDENT STUDY DURATION PREDICTION USING ROUGH SET AND CASE-BASED REASONING Abstract The forecast of student study length is essential for academic planning, performance assessment, and recognizing possible graduation delays. This study presents a hybrid methodology that combines Rough Set theory and CaseBased Reasoning techniques to enhance the precision of predicting student study length classifications. The Rough Set approach is employed to derive classification rules from combinations of attributes, including GPA, job status, and scholarship status, as well as to compute class probabilities inside the boundary region. Simultaneously, the CBR approach is utilized to assess similarity between cases based on attribute similarity, including normalized credit hours (SKS). The prediction results are produced by integrating Rough Set probability and CBR similarity, utilizing weighted values of 0. 6 and 0. 4, respectively. In the test case, five historical cases with similarity scores 97 were identified, four classified as AuVery LateAy and one as AuLateAy. Rough Set probability were 0. 667 for AuVery LateAy and 0. 333 for AuLateAy. The conclusive integrated scores were 0. 720 for AuVery LateAy and 0. 280 for AuLateAy, signifying that the algorithm predominantly forecasts the AuVery LateAy category. This hybrid methodology adeptly integrates the generalization capabilities of Rough Set theory with the adaptive versatility of Case-Based Reasoning, rendering it appropriate as a decision support system for academic assessment grounded in historical Keywords: Prediction of Study Duration. Rough Set Theory. Case-Based Reasoning. Boundary Region. Similarity PENDAHULUAN Semakin lama waktu yang dibutuhkan siswa untuk menyelesaikan kelas, semakin besar efeknya terhadap efisiensi akademik, perencanaan sumber daya kampus, dan biaya pendidikan. Dalam evaluasi Lama studi mahasiswa adalah salah satu faktor penting dalam mengukur seberapa efektif pendidikan 114 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. Februari 2026, hlm. akreditasi program studi dan laporan kinerja perguruan tinggi, isu-isu lama juga sering menjadi Indeks prestasi kumulatif (IPK), jumlah SKS yang ditempuh setiap semester, status kerja mahasiswa, dan kondisi sosial ekonomi adalah beberapa faktor yang memengaruhi lama studi Namun, tidak banyak sistem yang dapat memprediksi lama studi berdasarkan riwayat akademik dan kondisi individu siswa. Meskipun memperkirakan prospek masa depan pendidikan sejak awal dapat membantu kampus mengambil mengoptimalkan layanan akademik. Dalam penelitian ini, masalah yang ingin diselesaikan adalah bagaimana membuat model prediksi lama studi mahasiswa yang akurat dan dapat menghasilkan aturan klasifikasi yang dapat dipahami oleh pengguna . Selain itu, diharapkan dapat memberikan prediksi yang didasarkan pada kemiripan dengan kasus-kasus sebelumnya, yang didasarkan pada pengalaman siswa sebelumnya. Penelitian ini bertujuan untuk mengembangkan model hybrid yang menggabungkan metode Rough Set Theory (RST) dan Case-Based Reasoning (CBR) untuk memprediksi lama studi mahasiswa. Metode Rough Set digunakan untuk mengekstraksi aturan dan mereduksi atribut yang tidak relevan, sementara CBR digunakan untuk menemukan prediksi berdasarkan kasus yang memiliki kemiripan tinggi. Kontribusi utama dari penelitian ini adalah menghadirkan pendekatan prediksi yang tidak hanya akurat, tetapi juga efisien dan mudah diinterpretasikan oleh pengguna . kademisi atau dosen wal. Beberapa membahas tentang RST. CBR, maupun lama studi. Diantaranya RST untuk menganalisis karakter tertanggung dalam sistem klaim asuransi swasta di Indonesia (Ekaputrie and Fauzan, 2. Dalam penelitian lain. RST digunakan untuk mengurangi data sensor melalui pendekatan granularitas informasi lokal yang adil . ustifiable granularit. , yang memungkinkan klasifikasi dan reduksi atribut secara lebih akurat pada data sensor yang tidak teratur (Fan et al. , 2. Selain itu. RST juga diterapkan untuk mengatasi masalah data tidak lengkap dalam analisis pelanggan (Gholami et al. , 2. RST digunakan untuk mengklasifikasikan dokumen teks berbasis fitur morfologis dan frekuensi kata (Yang et , 2. RST untuk pengambilan keputusan dalam lingkungan sistem informasi geografis (Yang et al. Selanjutnya RST digunakan sebagai alat analisis untuk identifikasi atribut yang signifikan dalam diagnosis medis (Alkhazaleh and Marei. RST dipperluas dengan menggabungkan teori soft set dan neutrosophic set menjadi neutrosophic soft rough set, yang mampu menangani data yang tidak pasti, tidak lengkap, dan ambigu tanpa menggunakan full soft set, serta digunakan untuk menyusun pendekatan klasifikasi dan generalisasi data (Alkhazaleh and Marei, 2. Serta dikembangkan metode RST baru melalui pendekatan increasing dan decreasing approximation yang lebih akurat dibandingkan model klasik, dan diterapkan pada konteks pengambilan keputusan dalam situasi tidak pasti dengan konversi relasi parsial menjadi relasi total (El-Sheikh et al. , 2. Penggunaan RST dalam studi-studi tersebut menunjukkan fleksibilitas dan kekuatannya dalam menangani ketidakpastian dan ketidaktepatan data, menjadikannya metode yang efektif untuk mendukung pengambilan keputusan di berbagai Sedangkan untuk CBR digunakan dalam berbagai penelitian untuk menyelesaikan masalah baru dengan mengandalkan pengalaman masa lalu yang tersimpan dalam basis kasus. Diantaranya pendekatan CBR digunakan untuk mendukung keputusan pada sistem diagnosis penyakit dengan mempertimbangkan kemiripan antar kasus (Ye. CBR dioptimalkan untuk pengambilan keputusan pada sistem rekomendasi yang bersifat personal dan relevan (Chun and Ko, 2. CBR diterapkan dalam domain manajemen energi (Chun and Jang, 2. CBR dimanfaatkan untuk menjelaskan hasil prediksi model pembelajaran mesin yang kompleks (Zeng et al. , 2. Selanjutnya integrasi CBR dengan pembelajaran serupa dalam konteks pemeliharaan sistem (Caro-Martinez et al. CBR yang berfokus pada peningkatan kinerja klasifikasi dengan merawat basis kasus secara selektif berdasarkan reputasi tiap kasus (Nakhjiri et al. , 2. Selanjutnya CBR digunakan untuk merancang sistem rekomendasi diagnosis keperawatan berbasis data sebelumnya dengan mengintegrasikan teknik klasifikasi dan metode adaptasi untuk menangani variasi kasus yang luas (Gigih et al. , 2. Mengembangkan sistem penjadwalan tugas dinamis untuk pegawai dalam konteks industri (Jones and Hardiyanti, 2. Kemudian CBR diterapkan dalam sebelumnya (Nurfalinda and Uperati, 2. Pendekatan CBR dimanfaatkan dalam evaluasi kelayakan kredit mikro untuk pelaku UMKM (Safitri et al. , 2. Di bidang kesehatan CBR digunakan untuk mengembangkan sistem diagnosis penyakit mata berbasis citra retina (Minarni et al. , 2. CBR digunakan untuk membantu dokter dalam pengambilan keputusan medis dengan memanfaatkan data prosedur medis (Paruchuri and Granville, 2. Terakhir, penerapan CBR dalam konteks hukum dengan menggabungkan logika klasifikasi biner untuk menjelaskan alasan di balik putusan berbasis preseden, sehingga memperkuat transparansi sistem pengambilan keputusan otomatis dalam ranah legal (Liu et al. , 2. Berbagai pendekatan telah digunakan dalam penelitian untuk memprediksi dan menganalisis lama Sutoyo dan Adawiyah, dkk. Optimalisasi Prediksi Lama StudiA 115 Lama studi dianalisis menggunakan pendekatan Cox Proportional Hazard Model dan Kaplan-Meier Curve untuk mempelajari faktor-faktor yang mempengaruhi lama studi mahasiswa di tingkat universitas, dengan mempertimbangkan variabelvariabel seperti gender, nilai akademik, dan status ekonomi (Feely et al. , 2. Menerapkan metode Random Forest untuk klasifikasi dan prediksi ketepatan waktu kelulusan mahasiswa (Morris et al. Lama studi menggunakan multinomial logistic regression untuk menilai pengaruh berbagai faktor seperti IPK, status kerja, dan beasiswa (Edde et , 2. Berbeda dari sebelumnya, prediksi lama studi pada konteks internasional dengan pendekatan survival analysis, yang mempertimbangkan variabelvariabel sosial-ekonomi dan akademik sebagai penentu utama (Zulfan et al. , 2. Terakhir, prediksi lama studi pada uji klinis berbasis time-toevent analysis dengan pendekatan probabilistik (Machida et al. , 2. Namun, hingga saat ini, belum banyak penelitian yang mengintegrasikan RST dan CBR secara bersamaan dalam konteks prediksi lama studi Integrasi RST dan CBR dipilih karena RST mampu menyederhanakan data serta menghasilkan aturan klasifikasi yang interpretable, sementara CBR memberikan prediksi berbasis pengalaman kasus serupa, sehingga kombinasi keduanya menghasilkan model prediksi yang lebih akurat, adaptif, dan transparan. Oleh karena itu, penelitian ini mencoba mengisi celah tersebut dengan membangun sistem prediktif berbasis rule dan pengalaman kasus. Pemilihan metode Rough Set dan Case-Based Reasoning dalam penelitian ini didasarkan pada kekuatan masing-masing pendekatan. Rough Set unggul dalam menyederhanakan data serta mengekstrak aturan keputusan tanpa memerlukan parameter eksternal seperti derajat keanggotaan, sementara CBR mampu memberikan hasil prediksi berbasis pengalaman nyata dari kasus-kasus terdahulu yang serupa. Dengan menggabungkan kedua metode ini, diharapkan sistem yang dihasilkan dapat lebih adaptif, efisien, dan dapat memberikan prediksi yang lebih tepat. Sedangkan tujuan penelitian ini adalah mengembangkan model prediksi lama studi mahasiswa berbasis pendekatan hibrida dengan mengintegrasikan metode Rough Set dan Case-Based Reasoning untuk menghasilkan sistem prediksi yang akurat, efisien, adaptif, serta mudah diinterpretasikan bagi kebutuhan evaluasi dan perencanaan akademik. METODE PENELITIAN Tahapan penelitian ini dirancang secara sistematis untuk menggambarkan alur proses mulai dari pengumpulan data hingga menghasilkan prediksi Secara lebih jelas, tahapan penelitian dapat dilihat pada Gambar 1. Gambar 1. Tahapan Penelitian Untuk memperjelas alur integrasi metode Rough Set dan Case-Based Reasoning dalam penelitian ini, disajikan flowchart pada Gambar 2 yang menggambarkan hubungan antar tahapan utama hingga menghasilkan prediksi lama studi mahasiswa. Mulai Data Mahasiswa (IPK. SKS, Kerja. Beasisw. Rough Set enghasilkan aturan, reduksi. Preprocessing . iscretization & CBR enghitung similarity, retrieve. Integrasi RST CBR 6 & 0. Hasil Prediksi Lama Studi (Tepat Waktu / Terlamba. Selesai Gambar 2. Flowchart Integrasi Rough Set dan CBR Pendekatan hybrid yang menggabungkan metode RST dan CBR digunakan dalam penelitian ini untuk melakukan prediksi lama studi siswa berdasarkan data akademik historis. Prediksi dilakukan dalam dua tahap utama: pembentukan aturan dengan RST dan prediksi berbasis kasus serupa dengan CBR. Metode ini digunakan untuk mengoptimalkan akurasi prediksi dan mempercepat proses klasifikasi dengan mengurangi atribut yang tidak penting. Sumber Data Data yang digunakan dalam penelitian ini diperoleh dari sistem informasi akademik salah satu perguruan tinggi di Indonesia yaitu USN Kolaka pada tahun akademik 2024/2025 gasal. Dataset terdiri dari data riwayat akademik mahasiswa yang telah menyelesaikan studi, dengan jumlah 126 data mahasiswa Program Studi Sistem Informasi. Setiap data mencakup atribut seperti Indeks Prestasi Kumulatif (IPK), jumlah SKS per semester, status bekerja, status beasiswa, durasi studi . alam semeste. , dan label kelas berupa kategori AuTepat WaktuAy atau AuTerlambatAy. 116 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. Februari 2026, hlm. Alasan penggunaan atribut Indeks Prestasi Kumulatif (IPK), jumlah SKS per semester, status bekerja, status beasiswa, dan durasi studi adalah karena kelima faktor tersebut secara langsung mencerminkan capaian akademik, beban studi, serta kondisi sosial-ekonomi mahasiswa yang berpengaruh signifikan terhadap ketepatan waktu penyelesaian studi, sehingga relevan dijadikan variabel prediktor dalam membangun model klasifikasi lama studi. Adapun contoh data yang digunakan dalam penelitian ini meliputi atribut Indeks Prestasi Kumulatif (IPK), jumlah SKS per semester, status bekerja, status beasiswa, serta durasi studi mahasiswa sebagaimana ditunjukkan pada Tabel 1. MHS001 Tabel 1. Contoh Data Penelitian Status SKS IPK Bekerja MHS002 Tidak MHS003 Tidak MHS004 Tidak MHS005 Tidak MHS006 MHS007 Tidak MHS008 Tidak MHS009 MHS010 Tidak Tidak Mahasiswa Status Beasiswa Tidak A A A A A MHS125 Tidak Tidak MHS126 Tidak Tidak Data yang digunakan adalah kombinasi data numerik dan kategorik. Oleh karena itu, proses disretisasi dilakukan pada data numerik sehingga metode Rough Set dapat digunakan untuk Selain dinormalisasi untuk memastikan kesetaraan skala selama perhitungan similarity pada tahap CBR. Tahapan Rough Set Metode Rough Set digunakan sebagai pendekatan awal dalam proses prediksi untuk menyederhanakan atribut . eature selectio. dan menghasilkan aturan keputusan berdasarkan data historis mahasiswa. Tahapan pertama dalam metode ini adalah direpresentasikan sebagai pasangan S = (U. A), di mana U adalah himpunan objek . alam hal ini, mahasisw. , dan A adalah himpunan atribut yang mencakup data seperti IPK, jumlah SKS, status beasiswa, dan lain sebagainya. Setiap atribut a OO A berfungsi sebagai pemetaan dari objek ke domain nilainya, yaitu a : UIeVa. Karena Rough Set bekerja optimal pada data diskrit atau kategorikal, maka dilakukan disretisasi terhadap atribut numerik menggunakan metode equal-width binning, agar nilai-nilai numerik seperti IPK dapat dikelompokkan ke dalam interval tertentu . ontoh: "rendah", "sedang", "tinggi"). Langkah selanjutnya adalah pembentukan relasi tak terbedakan . ndiscernibility relatio. Relasi ini dibangun berdasarkan subset atribut B OI A, dan dua objek dikatakan tak terbedakan jika memiliki nilai atribut yang sama pada seluruh atribut dalam B. Relasi ini dinyatakan dengan rumus (El-Sheikh et al. yaycAya. aA) = {. cu, y. OO O x O |OAyca OO yaA, yca. = yca. } . Setelah relasi terbentuk, dilakukan proses aproksimasi kasar terhadap kelas keputusan dengan . ower approximatio. dan aproksimasi atas . pper Untuk setiap himpunan objek X OI U, aproksimasi bawah adalah himpunan objek yang pasti termasuk dalam X, sedangkan aproksimasi atas adalah himpunan objek yang mungkin termasuk dalam X. Keduanya dirumuskan sebagai berikut: cU) = . cu OO ycO | . yaA OI ycU} . cU) = . cu OO ycO | . yaA UC ycU O . Kelas ekivalensi . B menunjukkan sekumpulan objek yang tak terbedakan terhadap objek x berdasarkan atribut B. Dari hasil aproksimasi tersebut, dibentuklah positive region yaitu objek-objek yang dapat diklasifikasikan secara pasti ke dalam kelas keputusan D. Positive region dihitung dengan: ycEycCycIyaA . = UEycUOOycO/ya yaA . cU) . Nilai derajat dependency atau ketergantungan antara atribut kondisi B terhadap keputusan D dihitung menggunakan rasio jumlah objek pada positive region terhadap total objek dalam U, dengan yuyaA . = . cEycCycIyaA . | . cO| . Apabila nilai B(D) = 1, berarti seluruh objek dalam data dapat diklasifikasikan secara pasti menggunakan atribut B, dan tidak ada ambiguitas. Langkah berikutnya adalah melakukan reduksi atribut (Reduc. , yaitu mencari subset minimal dari atribut A yang tetap mempertahankan nilai dependency yang sama seperti atribut lengkap. Reduct diperoleh melalui proses eliminasi iteratif terhadap atribut yang tidak berpengaruh signifikan terhadap positive region. Terakhir, dilakukan ekstraksi aturan keputusan . ecision rule generatio. berdasarkan positive region yang terbentuk. Aturan-aturan ini dihasilkan dalam bentuk logika if-then yang dapat diinterpretasikan secara langsung. Contoh aturan Sutoyo dan Adawiyah, dkk. Optimalisasi Prediksi Lama StudiA 117 yang mungkin terbentuk adalah IF IPK = Tinggi AND ocycu ycn=1. cNycn Oe ycIycn ) SKS = Banyak THEN Lama Studi = Tepat Waktu. ycIycnycoycnycoycaycycnycyc. cN, ycI) = Tahapan Case-Based Reasoning (CBR) di mana dmax adalah jarak maksimum antar dua kasus dalam dataset, yang digunakan untuk menjaga nilai similarity tetap dalam rentang 0 hingga 1. Tahap kedua adalah Reuse, yaitu pemanfaatan solusi dari kasus yang paling mirip. Jika hanya satu kasus yang diambil, maka kelas dari kasus tersebut akan langsung digunakan. Namun, jika digunakan lebih dari satu kasus, maka dilakukan proses voting terhadap k kasus dengan similarity tertinggi untuk menentukan kelas prediksi. Proses ini dapat dinyatakan dengan rumus: Metode CBR digunakan sebagai pendekatan prediksi berbasis pengalaman, dengan prinsip bahwa masalah baru dapat diselesaikan dengan merujuk pada solusi dari kasus-kasus terdahulu yang serupa. Dalam penelitian ini. CBR digunakan untuk memprediksi lama studi mahasiswa berdasarkan kemiripan atribut dengan mahasiswa sebelumnya yang telah menyelesaikan studi. Proses CBR terdiri dari empat tahap utama yang dikenal dengan istilah 4R, yaitu Retrieve. Reuse. Revise, dan Retain. yccycoycaycu yaycoycaycyc. cN) = ycoycuyccyce(. cI1 ), . , yaycoycaycyc. cIyco )}) . Tahap ketiga adalah Revise, yaitu pengecekan ulang terhadap solusi yang dihasilkan. Jika prediksi tidak sesuai dengan kondisi nyata atau validasi pakar, maka solusi dapat disesuaikan. Dalam penelitian ini, tahap revisi tidak dilakukan secara eksplisit karena fokus berada pada evaluasi akurasi sistem. Tahap Retain, penyimpanan kasus baru beserta prediksi hasil klasifikasi ke dalam basis kasus. Hal ini bertujuan agar sistem dapat belajar dari pengalaman baru, dan basis kasus terus berkembang seiring waktu sehingga mampu memberikan prediksi yang lebih akurat dan relevan di masa depan. Integrasi RST dan CBR Gambar 1. Siklus CBR Tahap pertama Retrieve, adalah proses pengambilan kasus lama yang paling mirip dengan kasus baru. Untuk menjaga relevansi perbandingan, pengambilan kasus dibatasi hanya pada mahasiswa yang berasal dari program studi yang sama. Hal ini dilakukan dengan menambahkan kondisi filter pada basis kasus saat pencarian, sehingga hanya kasus dengan prodi yang identik yang dipertimbangkan dalam proses similarity. Rumus perhitungan similarity yang digunakan adalah sebagai berikut (Nurfalinda and Uperati, 2. ycIycnycoycnycoycaycycnycyc. cN, ycI) = Ocycu ycn=1 yce. cN,ycI). Ocycu ycn=1 ycycn Dalam rumus tersebut. T adalah kasus baru. S adalah kasus lama dalam basis kasus. Ti dan Si adalah nilai atribut ke-i dari masing-masing kasus, dan wi adalah bobot atribut ke-i yang diperoleh dari hasil Rough Set. Fungsi kecocokan f(Ti. didefinisikan sebagai: 1, yaycnycoycaycNycn = ycIycn cNycn, ycIyc. = { 0, yaycnycoycaycNycn O ycIycn Jika data bersifat numerik dan tidak dilakukan disretisasi, maka rumus similarity dapat diganti menggunakan pendekatan jarak Euclidean yang dinormalisasi sebagai berikut: Proses memanfaatkan pendekatan gabungan antara RST dan CBR. RST digunakan untuk menghasilkan aturanaturan klasifikasi berdasarkan kombinasi atribut yang terdapat dalam data pelatihan. Pada kombinasi atribut yang tidak memiliki kejelasan kelas . oundary regio. , dilakukan perhitungan nilai probabilitas kemunculan setiap kelas berdasarkan frekuensi kemunculannya dalam data. Aturan-aturan inilah yang kemudian dihitung nilai probabilitasnya melalui pendekatan Rough Set, dan selanjutnya dikombinasikan dengan hasil perhitungan similarity pada proses CBR. CBR digunakan untuk mengukur tingkat kemiripan kasus baru terhadap kasus-kasus lama yang relevan dalam basis kasus. Proses ini memberikan fleksibilitas tambahan dalam menghadapi variasi data mahasiswa yang tidak selalu identik secara atribut. Untuk memperoleh skor akhir prediksi, dilakukan integrasi antara nilai probabilitas RST dan similarity CBR menggunakan formula: ycIycaycuycyce = . ycEycIycIycN ) (. Oe y. ycIycnycoycnycoycaycycnycycyayaAycI ) . dengan nilai bobot = 0. 6, yang berarti probabilitas dari Rough Set diberikan bobot lebih besar dibandingkan nilai similarity dari CBR. Hal ini didasarkan pada pertimbangan bahwa probabilitas RST merepresentasikan distribusi kelas berdasarkan 118 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. Februari 2026, hlm. keseluruhan data historis, sehingga lebih stabil dan Di sisi lain, similarity CBR bersifat lokal karena hanya bergantung pada kedekatan dengan kasus-kasus individu, sehingga cenderung sensitif terhadap outlier. HASIL DAN PEMBAHASAN Bagian ini menjelaskan hasil dari implementasi dan pengujian sistem prediksi lama studi mahasiswa menggunakan metode gabungan Rough Set dan CaseBased Reasoning. Tahapan pembahasan disesuaikan dengan tahapan dalam metode penelitian, yaitu mulai dari preprocessing data, pembentukan aturan dengan Rough Set, perhitungan similarity dengan CBR, hingga evaluasi akurasi sistem. Hasil Preprocessing dan Disretisasi Data Tahap preprocessing data, termasuk pembersihan nilai kosong dan disretisasi pada atribut numerik seperti IPK dan jumlah SKS. Disretisasi dilakukan menggunakan metode equal-width binning, dan hasilnya dikategorikan menjadi tiga level: Rendah. Sedang, dan Tinggi. Data yang digunakan dalam penelitian ini berasal dari Program Studi Sistem Informasi dengan jumlah total 126 data mahasiswa yang telah lulus. Hasil dari proses ini dapat dilihat pada Tabel 2, yang menunjukkan konversi data numerik menjadi kategori diskrit. Tabel 2. Data Hasil Perprocessing IPK Bekerja Beasiswa MHS001 Sedang Tidak MHS002 Sedang Tidak MHS003 Sedang Tidak MHS004 Sedang Tidak MHS005 Sedang Tidak MHS006 Sedang Tidak A A A A Lama Studi Sangat Terlambat Sangat Terlambat Sangat Terlambat Sangat Terlambat Sangat Terlambat Sangat Terlambat A MHS118 Tinggi Tidak Tidak Terlambat MHS119 Tinggi Tidak Tidak Terlambat MHS120 Tinggi Tidak Tidak Terlambat MHS121 Tinggi Tidak Tidak Terlambat MHS122 Tinggi Tidak Tidak Terlambat MHS123 Tinggi Tidak Terlambat MHS124 Tinggi Tidak Terlambat MHS125 Tinggi Tidak Terlambat MHS126 Tinggi Tidak Tidak Tepat Waktu Konversi data numerik IPK menjadi kategori didasarkan pada Peraturan Rektor Universitas Sembilanbelas November Kolaka Nomor 02 Tahun 2024 tentang Pedoman Akademik Universitas Sembilanbelas November Kolaka. Hasil Ekstraksi Rough Set Setelah data berhasil didisretisasi, dilakukan pembentukan relasi tak terbedakan, aproksimasi kasar, serta penghitungan positive region dan reduct menggunakan metode Rough Set. Aturan-aturan klasifikasi yang terbentuk dari positive region dirangkum dalam Tabel 3. Aturan ini diperoleh berdasarkan kombinasi atribut yang secara konsisten mengarah pada satu kelas keputusan tertentu . , sehingga dapat dimasukkan ke dalam lower approximation. Dari total 126 data yang dianalisis, diperoleh sebanyak 18 aturan klasifikasi ecision rule. yang merepresentasikan pola-pola tetap dalam data mahasiswa terhadap kelas lama Rule R10 R11 R12 R13 R14 R15 R16 R17 R18 Tabel 3. Rule Klasifikasi Berdasarkan Rough Set IPK Bekerja Beasiswa Lama Studi Sedang Tidak Sangat Terlambat Sedang Tidak Terlambat Sedang Sangat Terlambat Sedang Terlambat Sedang Tidak Tidak Sangat Terlambat Sedang Tidak Tidak Terlambat Sedang Tidak Sangat Terlambat Sedang Tidak Terlambat Rendah Sangat Terlambat Rendah Tidak Sangat Terlambat Rendah Tidak Tidak Sangat Terlambat Rendah Tidak Tidak Terlambat Tinggi Tidak Terlambat Tinggi Tidak Tepat Waktu Tinggi Tidak Tidak Sangat Terlambat Tinggi Tidak Tidak Terlambat Tinggi Tidak Terlambat Tinggi Tidak Tidak Tepat Waktu Kemudian kasus baru yang disajikan memiliki kombinasi atribut berupa IPK Sedang, berstatus Bekerja, dan Tidak menerima beasiswa, dengan label Kelas Lama Studi yang belum diketahui. Kombinasi ini kemudian diproses menggunakan pendekatan Rough Set untuk menghitung probabilitas kelas keputusan sebelum dilanjutkan ke tahap similarity pada Case-Based Reasoning (CBR). Dalam metode Rough Set, kombinasi tersebut tidak ditemukan secara eksak dalam positive region, sehingga dianggap berada pada boundary region. Oleh karena itu, dilakukan perhitungan probabilitas kemunculan masing-masing kelas berdasarkan frekuensi kombinasi serupa dalam data latih. Berdasarkan hasil analisis, diketahui bahwa dari seluruh data yang memiliki kombinasi atribut yang sama, sebesar 66. 7% . mengarah pada kelas AuSangat TerlambatAy, sementara sisanya mengarah 3% . pada kelas AuTerlambatAy. Sutoyo dan Adawiyah, dkk. Optimalisasi Prediksi Lama StudiA 119 Hasil Perhitungan dan Prediksi CBR Langkah selanjutnya adalah proses prediksi menggunakan CBR, yang didasarkan pada pencocokan kemiripan antar kasus. Tabel 4 menampilkan nilai similarity antara kasus uji dengan beberapa kasus dalam basis kasus, beserta hasil prediksi sistem. Dalam proses ini, seluruh atribut termasuk jumlah SKS diikutsertakan sebagai bagian dari perhitungan similarity. Karena SKS merupakan atribut numerik, maka dilakukan proses normalisasi menggunakan metode Min-Max untuk mengubah nilai asli ke dalam rentang . , . , sehingga dapat dihitung kemiripannya secara proporsional dengan atribut lain yang bersifat kategorik. Setelah dinormalisasi, setiap atribut diberi bobot berdasarkan tingkat kontribusinya terhadap hasil prediksi, di antaranya IPK . , status bekerja . , status beasiswa . , dan SKS . MHS001 MHS002 MHS003 MHS004 MHS005 MHS006 MHS007 MHS008 MHS009 MHS010 MHS118 MHS119 MHS120 MHS121 MHS122 MHS123 MHS124 MHS125 MHS126 Tabel 4. Nilai Similarity Antara Kasus SKS IPK Bekerja Beasiswa Similarity A Nilai similarity akhir dihitung berdasarkan kombinasi nilai kemiripan dari masing-masing atribut, dan lima kasus dengan similarity tertinggi kemudian dipilih untuk mendukung proses prediksi dirangkum pada Tabel 5. Tabel 5. Nilai Similarity Tertinggi Similarity Kelas Lama Studi MHS002 Sangat Terlambat MHS004 Sangat Terlambat MHS005 Sangat Terlambat MHS008 Sangat Terlambat MHS015 Terlambat Berdasarkan hasil perhitungan similarity antara kasus uji dan basis kasus menggunakan metode CBR, diperoleh lima kasus dengan tingkat kemiripan tertinggi sebesar 0. Dari lima kasus tersebut, empat kasus termasuk dalam kelas AuSangat TerlambatAy dan satu kasus termasuk dalam kelas AuTerlambatAy. Oleh karena itu, dapat dihitung probabilitas untuk masing-masing kelas berdasarkan proporsi kemunculannya dalam lima kasus tersebut, yaitu sebesar 0. %) untuk kelas AuSangat TerlambatAy dan 0. %) untuk kelas AuTerlambatAy. Nilai probabilitas ini mencerminkan kecenderungan keputusan berdasarkan kedekatan lokal terhadap kasus-kasus historis yang paling mirip dengan kasus Integrasi RST dan CBR Setelah diperoleh nilai probabilitas dari metode Rough Set dan metode Case-Based Reasoning (CBR), langkah selanjutnya adalah melakukan integrasi kedua pendekatan tersebut untuk menghasilkan skor akhir prediksi. Nilai probabilitas yang dihasilkan dari Rough Set adalah 0. 667 untuk kelas AuSangat TerlambatAy dan 0. 333 untuk kelas AuTerlambatAy, berdasarkan distribusi frekuensi kombinasi atribut dalam boundary region. Sementara itu, hasil probabilitas dari CBR, yang dihitung dari lima kasus dengan tingkat similarity tertinggi sebesar 97, menunjukkan bahwa empat kasus tergolong AuSangat TerlambatAy dan satu kasus AuTerlambatAy, sehingga diperoleh probabilitas 0. 80 untuk AuSangat TerlambatAy dan 0. 20 untuk AuTerlambatAy. Kedua probabilitas tersebut kemudian diintegrasikan menggunakan bobot gabungan, yaitu 0. 6 untuk RST 4 untuk CBR. ycIycaycuycyceycIycN = . 6 ycu 0. 4 ycu 0. = 0. ycIycaycuycyceycN = . 6 ycu 0. 4 ycu 0. = 0. Dari hasil integrasi kedua pendekatan, dapat disimpulkan bahwa sistem prediksi menunjukkan kecenderungan kuat terhadap kelas AuSangat TerlambatAy, dengan skor akhir sebesar 0. %), yang berasal dari kombinasi probabilitas Rough Set dan similarity CBR. Skor ini secara signifikan lebih tinggi dibandingkan dengan kelas AuTerlambatAy, yang hanya memperoleh skor sebesar 0. %). Hasil ini mengindikasikan bahwa berdasarkan distribusi data historis dan kemiripan kasus, mahasiswa dengan atribut berupa IPK Sedang, berstatus Bekerja, dan Tidak menerima beasiswa termasuk dalam kategori "Sangat Terlambat". Hasil akhir dari integrasi antara pendekatan Rough Set dan Case-Based Reasoning (CBR) dapat dilihat pada Gambar 1. Gambar tersebut menunjukkan proses penggabungan nilai probabilitas yang diperoleh dari aturan klasifikasi Rough Set dengan nilai similarity dari hasil perhitungan CBR. Kombinasi ini tidak hanya memperkuat hasil prediksi, tetapi juga memberikan justifikasi berbasis aturan dan kedekatan kasus yang transparan dan dapat 120 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. Februari 2026, hlm. Gambar 1. Hasil Integrasi RST dan CBR Analisis dan Pembahasan Hasil implementasi menunjukkan bahwa integrasi metode Rough Set dan Case-Based Reasoning (CBR) mampu memberikan prediksi lama studi mahasiswa yang tidak hanya akurat tetapi juga dapat diinterpretasikan. Pendekatan Rough Set berhasil menghasilkan aturan-aturan klasifikasi berdasarkan kombinasi atribut IPK, status bekerja, dan status beasiswa, yang menyederhanakan data dan mengurangi dimensi tanpa mengorbankan informasi Pada kasus baru yang diuji, kombinasi atribut tersebut tidak ditemukan dalam positive region, sehingga dimasukkan ke boundary region dan dihitung probabilitasnya. Hasilnya menunjukkan bahwa 66,7% dari kombinasi serupa mengarah pada kelas AuSangat TerlambatAy. Di sisi lain, pendekatan CBR berhasil menyesuaikan prediksi berdasarkan kemiripan lokal terhadap kasus-kasus historis. Lima kasus dengan similarity tertinggi . ditemukan, empat di antaranya berasal dari kelas AuSangat TerlambatAy dan satu dari AuTerlambatAy. Dengan demikian, probabilitas prediksi berbasis CBR adalah 80% untuk AuSangat TerlambatAy dan 20% untuk AuTerlambatAy. Hal ini menunjukkan bahwa prediksi berdasarkan kedekatan kasus memiliki kecenderungan yang kuat terhadap kelas dominan, meskipun jumlah data terbatas dan kasus serupa tidak selalu identik secara keseluruhan. Integrasi kedua pendekatan dilakukan dengan formula gabungan, yaitu 60% bobot diberikan untuk probabilitas hasil Rough Set dan 40% untuk similarity CBR. Hasil penggabungan menunjukkan skor tertinggi sebesar 0. 720 pada kelas AuSangat TerlambatAy, sedangkan skor pada kelas AuTerlambatAy hanya sebesar 0. Ini mengindikasikan bahwa sistem prediksi memiliki keyakinan kuat terhadap klasifikasi AuSangat TerlambatAy. Keputusan ini mencerminkan keunggulan pendekatan hybrid dalam menggabungkan kekuatan generalisasi dari RST dan kekuatan adaptif dari CBR, sehingga menghasilkan sistem prediksi yang lebih tangguh terhadap variasi data dan tetap mempertahankan interpretabilitasnya. Untuk menilai kinerja model prediksi yang dibangun, dilakukan evaluasi menggunakan confusion matrix dengan menghitung metrik akurasi, precision, recall, dan F1-score pada setiap kelas hasil Berdasarkan perhitungan, kelas Sangat Terlambat memperoleh precision sebesar 0. 911, dan F1-score 0. 642, yang menunjukkan model mampu mengenali sebagian besar mahasiswa dengan kategori tersebut. Sementara itu, kelas Terlambat memiliki precision 0. 700, recall 0. 215, dan F1-score 0. 329, sehingga meskipun prediksi yang dihasilkan cukup tepat ketika model memilih kelas ini, namun masih banyak kasus Terlambat yang salah diklasifikasikan ke kelas lain. Adapun kelas Tepat Waktu tidak terprediksi sama sekali sehingga precision, recall, dan F1-score bernilai 0. Secara keseluruhan, nilai macro average diperoleh sebesar 398, recall 0. 375, dan F1-score 0. yang menunjukkan bahwa model cenderung lebih baik dalam mengenali kelas dominan (Sangat Terlamba. dibandingkan kelas minoritas (Tepat Wakt. KESIMPULAN Penelitian ini menunjukkan bahwa integrasi metode Rough Set dan Case-Based Reasoning (CBR) dapat digunakan secara efektif untuk memprediksi lama studi mahasiswa berdasarkan atribut IPK, status bekerja, status beasiswa, dan jumlah SKS. Pendekatan Rough Set digunakan untuk membentuk aturan klasifikasi dan menghitung probabilitas pada boundary region, sedangkan CBR digunakan untuk mengukur tingkat kemiripan kasus baru dengan kasus-kasus historis. Hasil integrasi menunjukkan bahwa skor tertinggi diperoleh pada kelas AuSangat TerlambatAy dengan nilai 0. 720, mengindikasikan bahwa mahasiswa dengan atribut yang sama memiliki kecenderungan kuat terhadap kategori tersebut. Penggabungan dua pendekatan ini memungkinkan sistem prediksi tidak hanya mempertimbangkan distribusi global dari data historis, tetapi juga memperhatikan kedekatan lokal antar kasus. Dengan demikian, sistem menjadi lebih adaptif, akurat, dan tetap dapat dijelaskan secara logis, menjadikannya solusi yang menjanjikan dalam mendukung evaluasi dan perencanaan akademik. Penelitian selanjutnya dapat memperluas jumlah dataset dengan melibatkan lebih banyak program studi atau universitas berbeda agar model lebih general. Penelitian lanjutan juga dapat mengintegrasikan metode optimasi, seperti genetic algorithm atau particle swarm optimization, untuk menentukan bobot kombinasi terbaik antara Rough Set dan Case-Based Reasoning. Disamping itu, eksplorasi metode discretization dan similarity measure lain dapat dilakukan guna meningkatkan performa model. Terakhir, sistem prediksi ini dapat dikembangkan menjadi aplikasi berbasis web agar lebih mudah digunakan oleh dosen wali maupun pihak akademik dalam melakukan monitoring dan bimbingan studi mahasiswa. Sutoyo dan Adawiyah, dkk. Optimalisasi Prediksi Lama StudiA 121 DAFTAR PUSTAKA