Volume 20 Nomor 02 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
PEMODELAN PREDIKSI KELULUSAN TEPAT WAKTU MAHASISWA D3
TEKNOLOGI INFORMASI MENGGUNAKAN ALGORITMA K-NEAREST
NEIGHBORS (KNN)
Salnan Ratih Asriningtias.
Dwi Utari Surya.
Eka Ratri Noor Wulandari.
Mochamad Dimas Putra Hermawan.
Rifqi Alfiansyah Kamil.
David Kurniawan.
1,2,.
Program Studi D-i Teknologi Informasi.
Fakultas Vokasi.
Universitas Brawijaya JL.
Veteran No 12 Ae 14.
Malang.
Jawa Timur E-mail : .
salnan@ub.
id, .
utarisurya@ub.
id, .
ekaratri@ub.
id, .
dimasputra21@student.
id, .
rifqialfiansyah@student.
id, .
kurniawan@student.
ABSTRAK
Peningkatan jumlah mahasiswa pada Program Studi D3 Teknologi Informasi menyebabkan pengelolaan kelulusan tepat waktu menjadi semakin menantang.
Dalam konteks ini, metode machine learning digunakan untuk menganalisis pola secara komprehensif dan memprediksi tingkat kelulusan tepat waktu.
Dataset yang digunakan berjumlah 608 mahasiswa yang terdiri dari angkatan 2018 hingga 2020, dengan atribut seperti IPK Semester 1Ae6, jenis kelamin, serta jalur masuk, yang keseluruhannya berkontribusi pada pemahaman faktor-faktor yang memengaruhi kelulusan tepat Penelitian ini menerapkan dan mengevaluasi algoritma machine learning, khususnya KNearest Neighbors (KNN).
Proses pemodelan dilakukan melalui pembagian data menggunakan metode train-test split dengan rasio 70:30 dan divalidasi lebih lanjut menggunakan 10-fold crossvalidation untuk memastikan kemampuan generalisasi model.
Evaluasi kinerja model dilakukan menggunakan metrik accuracy, precision, recall, dan F1-score.
Hasil pengujian menunjukkan bahwa model KNN menghasilkan performa terbaik dengan nilai accuracy sebesar 84%, precision 79%, recall 98%, dan F1-score 87%, melampaui performa Decision Tree dan Random Forest.
Tingginya nilai recall menunjukkan kemampuan KNN yang sangat baik dalam mendeteksi mahasiswa yang berpotensi lulus tepat waktu.
Kebaruan penelitian ini terletak pada penerapan dan evaluasi komprehensif model KNN dengan validasi berlapis .
rain-test split dan cross-validatio.
pada konteks Program Studi D3 Teknologi Informasi di Indonesia, yang masih jarang dikaji dalam penelitian sebelumnya.
Temuan ini diharapkan dapat menjadi dasar pengambilan keputusan akademik dalam perencanaan intervensi dini guna meningkatkan capaian kelulusan tepat waktu Kata kunci : K-Nearest Neighbors, kelulusan tepat waktu.
D3 Teknologi Informasi, prediksi
ABSTRACT
The increasing number of students in the Diploma 3 (D.
Information Technology Study Program has made the management of on-time graduation increasingly challenging.
In this context, machine learning methods are employed to comprehensively analyze patterns and predict on-time graduation rates.
The dataset used in this study consists of 608 students from the 2018Ae2020 cohorts, with attributes including Grade Point Average (GPA) from semesters 1 to 6, gender, and admission Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika pathways, all of which contribute to understanding the factors influencing on-time graduation.
This study applies and evaluates machine learning algorithms, with a particular focus on the K-Nearest Neighbors (KNN) algorithm.
The modeling process is conducted using a trainAetest split with a 70:30 ratio and further validated through 10-fold cross-validation to ensure the modelAos generalization Model performance is evaluated using accuracy, precision, recall, and F1-score metrics.
The experimental results indicate that the KNN model achieves the best performance, with an accuracy of 84%, precision of 79%, recall of 98%, and an F1-score of 87%, outperforming Decision Tree and Random Forest models.
The high recall value demonstrates KNNAos strong capability in identifying students with a high potential to graduate on time.
The novelty of this study lies in the comprehensive application and evaluation of the KNN model with layered validation .
rainAetest split and cross-validatio.
in the context of the Diploma in Information Technology Study Program in Indonesia, which remains relatively underexplored in previous studies.
These findings are expected to serve as a basis for academic decision-making in planning early interventions to improve studentsAo on-time graduation outcomes.
Keywords: K-Nearest Neighbors, on-time graduation.
Diploma in Information Technology, graduation prediction penggunaan K-Nearest Neighbors (KNN) .
Random Forest .
Regresi Logistik .
, dan Kelulusan tepat waktu merupakan salah Support Vector Machine .
Hasil penelitiansatu indikator utama keberhasilan pengelolaan penelitian tersebut menunjukkan bahwa performa akademik dan menjadi komponen penting dalam akademik awal dan pola nilai semester menjadi penilaian akreditasi program studi di perguruan prediktor penting dalam menentukan kelulusan.
tinggi Indonesia.
Tingginya tingkat kelulusan Namun, sebagian besar penelitian tersebut tepat waktu berkontribusi langsung terhadap dilakukan pada jenjang pendidikan sarjana (S.
reputasi institusi serta kesiapan lulusan dalam atau menggunakan dataset lintas program studi memasuki dunia kerja atau melanjutkan dengan karakteristik yang heterogen.
pendidikan ke jenjang yang lebih tinggi.
Oleh Research gap dari penelitian ini terletak karena itu, perguruan tinggi dituntut untuk pada masih terbatasnya studi yang secara khusus memiliki sistem yang mampu memantau dan membahas prediksi kelulusan tepat waktu pada meningkatkan capaian akademik mahasiswa jenjang Diploma i (D.
, khususnya Program secara berkelanjutan.
Studi D3 Teknologi Informasi di Indonesia.
Namun demikian, banyak institusi Karakteristik pendidikan vokasi yang lebih pendidikan masih menghadapi kendala dalam menekankan pada praktik dan durasi studi yang mengidentifikasi mahasiswa yang berpotensi lebih singkat menyebabkan pola kelulusan tidak lulus tepat waktu sejak dini .
Pendekatan mahasiswa D3 berpotensi berbeda dengan konvensional yang bersifat reaktif menyebabkan mahasiswa S1 .
, sehingga hasil penelitian intervensi akademik sering dilakukan setelah terdahulu belum tentu dapat digeneralisasikan masalah akademik mahasiswa berkembang lebih secara langsung.
jauh, sehingga kurang efektif .
Kondisi ini Selain penelitian-penelitian menunjukkan perlunya pendekatan berbasis data sebelumnya umumnya hanya melaporkan nilai yang mampu memberikan prediksi kelulusan akurasi sebagai indikator utama, tanpa secara lebih akurat dan proaktif.
memberikan analisis komprehensif terhadap Berbagai penelitian sebelumnya telah metrik evaluasi lain seperti recall.
F1-score, dan memanfaatkan teknik machine learning untuk kurva ROC yang penting dalam konteks memprediksi kelulusan mahasiswa, seperti identifikasi mahasiswa berisiko .
PENDAHULUAN
Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Penelitian ini menegaskan perbedaannya dengan mengevaluasi performa model secara lebih menyeluruh serta membandingkan tiga algoritma machine learning populer, yaitu KNN.
Decision Tree, dan Random Forest, pada dataset mahasiswa D3 Teknologi Informasi yang Kontribusi diantaranya sebagai berikut :
Menyediakan studi empiris prediksi kelulusan tepat waktu khusus pada mahasiswa D3 Teknologi Informasi berbasis data akademik multi-semester.
Menunjukkan bahwa algoritma KNN memiliki performa terbaik dibandingkan Decision Tree dan Random Forest, terutama dalam aspek recall yang sangat penting untuk deteksi dini mahasiswa Menyajikan evaluasi model yang komprehensif menggunakan accuracy, precision, recall.
F1-score.
ROC-AUC, dan learning curve untuk memastikan kemampuan generalisasi model.
kehadiran dan nilai ujian merupakan prediktor yang signifikan.
Selain itu.
Desfiandi and Soewito .
menerapkan model Regresi Logistik untuk menganalisis data akademik mahasiswa dan berhasil memprediksi kelulusan dengan tingkat akurasi tinggi berdasarkan performa awal semester.
Junaidi dkk.
menggunakan model Support Vector Machine (SVM) untuk membedakan mahasiswa yang akan lulus tepat waktu dan yang tidak, menekankan pentingnya variabel non-akademik seperti partisipasi kegiatan organisasi.
Di Indonesia, khususnya pada Program Studi D3 Teknologi Informasi, pemanfaatan machine learning dalam memprediksi kelulusan tepat waktu belum banyak dieksplorasi.
Penelitian ini mengisi kesenjangan tersebut dengan menerapkan teknik machine learning pada data mahasiswa D3 Teknologi Informasi, sehingga dapat mendukung peningkatan akreditasi dan mempersiapkan mahasiswa menghadapi dunia kerja atau pendidikan lanjut .
Penelitian ini mengeksplorasi penerapan tiga model machine learning: K-Nearest Berdasarkan uraian tersebut, tujuan penelitian ini Neighbors (KNN).
Random Forest, dan Decision adalah mengembangkan dan mengevaluasi model Tree untuk memprediksi kelulusan tepat waktu prediksi kelulusan tepat waktu mahasiswa D3 mahasiswa D3 Teknologi Informasi.
Dengan Teknologi Informasi menggunakan algoritma mengintegrasikan berbagai atribut mahasiswa, machine learning, serta mengidentifikasi model penelitian ini bertujuan mengembangkan model dengan kinerja terbaik yang dapat dijadikan dasar prediktif komprehensif yang dapat memberikan dalam pengambilan keputusan dan intervensi pemahaman mendalam tentang faktor-faktor akademik oleh pengelola program studi.
yang memengaruhi kelulusan tepat waktu, sekaligus mendukung strategi akademik yang lebih efektif bagi institusi pendidikan tinggi di METODE PENELITIAN Indonesia .
Penelitian terkini menggunakan teknik Tahapan penelitian ini terdiri dari proses pengumpulan data, penentuan variabel penelitian, membuktikan efektivitasnya dalam memprediksi tahapan pra-pemrosesan data, serta penerapan kelulusan mahasiswa.
Sebagai contoh.
Salim dkk.
memanfaatkan algoritma KNN untuk ditunjukkan pada Gambar 1.
Setiap tahapan memprediksi kelulusan dengan membagi data disusun secara sistematis untuk memastikan data akademik selama beberapa tahun.
Menggunakan yang digunakan memiliki kualitas yang baik dan K-Fold Cross-Validation, penelitian tersebut siap dianalisis secara komputasional.
menunjukkan bahwa akurasi prediksi meningkat Tujuan utama dari tahapan penelitian ini setiap tahun.
Altabrawee dkk.
menggunakan algoritma Random Forest untuk memprediksi komprehensif mengenai proses persiapan dan kelulusan mahasiswa di sebuah universitas besar analisis data dalam memprediksi kelulusan tepat dan menemukan bahwa variabel seperti waktu mahasiswa Program Studi D3 Teknologi Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Informasi.
Melalui pendekatan ini, diharapkan model machine learning yang dibangun mampu menghasilkan prediksi yang akurat dan dapat dijadikan dasar dalam pengambilan keputusan variabel yang mencakup informasi akademik seperti yang ditunjukan pada Tabel 1.
Fitur akademik berupa Indeks Prestasi Semester (IPS) dari semester 1 hingga semester 6 digunakan sebagai representasi perkembangan performa akademik mahasiswa selama masa studi.
Nilai IPS dipilih sebagai fitur utama karena menjadi indikator paling langsung dan kuantitatif terhadap pencapaian akademik mahasiswa setiap Variabel target dari penelitian ini adalah AuLulus Tepat Waktu,Ay yang dikonversi menjadi variabel biner untuk memudahkan proses klasifikasi oleh model machine learning.
Selain itu, dilakukan analisis proporsi kelas pada variabel target Kelulusan Tepat Waktu untuk mengidentifikasi potensi ketidakseimbangan kelas .
lass imbalanc.
dalam dataset.
Hasil analisis menunjukkan bahwa distribusi kelas AuYaAy .
ulus tepat wakt.
dan AuTidakAy .
idak lulus tepat wakt.
berada pada proporsi 72% : 28%.
Meskipun terdapat perbedaan proporsi antar kelas, ketimpangan tersebut masih berada dalam batas yang dapat ditangani oleh model oversampling atau undersampling.
Oleh karena itu, dataset digunakan dalam kondisi asli untuk menjaga karakteristik distribusi data yang merepresentasikan kondisi riil mahasiswa.
Tabel 1.
Definisi dan Deskripsi Fitur Dataset.
Variabel IPS Semester 1 Gambar 1.
Tahapan Penelitian.
IPS Semester 2 1 Data Data penelitian berasal dari rekam akademik mahasiswa Program Studi D3 Teknologi Informasi, meliputi angkatan 2018 Seluruh data telah dikumpulkan dan dianonimkan sesuai standar perlindungan data 2 Fitur Dataset Dataset yang digunakan dalam penelitian ini terdiri dari 608 data mahasiswa dengan 12 IPS Semester 3 IPS Semester 4 IPS Semester 5 IPS Semester 6 Lulus Tepat Waktu Definisi Indeks Prestasi Semester pada semester pertama.
Indeks Prestasi Semester pada semester kedua Indeks Prestasi Semester pada semester ketiga Indeks Prestasi Semester pada semester keempat Indeks Prestasi Semester pada semester kelima Indeks Prestasi Semester pada semester keenam Indikator kelulusan tepat waktu mahasiswa (Ya/Tida.
Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Analisis korelasi pada gambar 2 menunjukkan bahwa seluruh nilai IPS memiliki korelasi positif satu sama lain, terutama pada IPS3 dan IPS4, yang mengindikasikan adanya konsistensi performa akademik dari semester ke semester.
Sebelum proses pemodelan, dilakukan tahap normalisasi fitur numerik untuk memastikan setiap atribut berada pada skala yang Hal ini sangat penting terutama untuk algoritma K-Nearest Neighbors (KNN), yang menghitung kedekatan antar data berdasarkan jarak Euclidean.
Pada penelitian ini, fitur numerik berupa IPS Semester 1 hingga Semester 6 dinormalisasi menggunakan metode MinMaxScaler, yang mengubah data sehingga memiliki nilai rata-rata nol dan standar deviasi satu.
Proses normalisasi ini bertujuan untuk mencegah fitur dengan rentang nilai yang lebih besar mendominasi perhitungan jarak dan memengaruhi hasil 4 Pemodelan Gambar 2.
Peta Korelasi Antar Fitur Dataset :
Hasil pengolahan data penelitian 3 Label Encoding Dataset penelitian ini memiliki banyak atribut yang menggambarkan kualitas akademik IPK semester 1 sampai 6 menggunakan nilai numerik.
Variabel target, 'Kelulusan Tepat Waktu', merupakan indikator biner yang menunjukkan apakah seorang mahasiswa lulus tepat waktu, dengan 0 mewakili 'Tidak' dan 1 mewakili 'Ya'.
Proses pengkodean yang ditunjukkan pada tabel 2 memungkinkan data kategorikal diproses secara efektif oleh algoritma pembelajaran mesin yang digunakan dalam penelitian ini.
Tabel 2.
Definisi Variabel dan Tipe Nilai pada Dataset Penelitian.
Variabel
IPK
Semester Kelulusan Tepat Waktu Definisi Indeks Prestasi Kumulatif (IPK) pada semester Indikator kelulusan tepat waktu Nilai Nilai 0 (Tida.
, 1 (Y.
Dalam penelitian ini, proses pemodelan dilakukan setelah tahap prapemrosesan data.
Algoritma machine learning dilatih untuk memprediksi kelulusan tepat waktu mahasiswa program D3 Teknologi Informasi berdasarkan karakteristik akademik seperti IPK Semester 1-6.
Jalur Penerimaan, dan Jenis Kelamin.
Algoritma yang digunakan meliputi K-Nearest Neighbors (KNN).
Decision Tree (DT), dan Random Forest (RF).
KNN
berdasarkan kedekatannya dengan sejumlah tetangga terdekat.
Pendekatan ini efisien untuk dataset berukuran kecil hingga sedang dan mudah .
Persamaan .
merupakan rumus Jarak Euclidean untuk dua titik p = .
cy1 , ycy2 .
A , ycyycu ) and q = .
c1 , yc2 .
A , ycycu ) ycc.
cy, y.
= Oo.
cy1 Oe yc1 )2 .
cy2 Oe yc2 )2 .
cyycu Oe ycycu 2 ) .
dimana ycc.
cy, y.
adalah jarak Euclidean antara titik ycy dan titik yc.
Nilai ycyycn dalah nilai atribut ke-i dari titik ycy.
Nilai ycycn adalah nilai atribut ke-i dari titik yc .
Nilai ycu menyatakan jumlah atribut atau dimensi yang digunakan dalam perhitungan jarak.
Dalam KNN, algoritma menemukan k titik terdekat berdasarkan jarak ini, lalu menetapkan kelas berdasarkan suara mayoritas tetangga Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Decision Tree adalah struktur berbasis pohon yang membagi data menjadi subset berdasarkan aturan keputusan sederhana yang dinyatakan dalam persamaan .
Struktur ini dikenal karena interpretabilitasnya dan kesesuaiannya untuk data dengan banyak fitur .
Gini = 1 - Ocycuycn=1 ycyycn 2 .
menggunakan matriks ini, dapat dihitung metrik lainnya yaitu Precision.
Recall, dan F1-score.
Rumus untuk metrik ini adalah sebagai berikut .
Accuracy adalah rasio prediksi yang benar terhadap total data sesuai dengan persamaan .
ycNycE ycNycA Accuracy = ycNycE ycNycA yaycE yaycA a.
dimana ycyycn adalah proporsi sampel kelas i pada suatu simpul tertentu.
Nilai Gini menunjukkan dimana TP adalah True Positives .
rediksi positif seberapa beragam kelas pada suatu simpul dengan bena.
FP merepresentasikan False Positives .
rediksi positif yang sala.
FN tertentu .
emakin rendah semakin bai.
merepresentasikan False Negatives .
ejadian Random Forest membangun beberapa pohon positif yang terlewatka.
dan TN adalah True keputusan selama pelatihan, dan keluarannya Negatives (Prediksi negatif yang bena.
ditentukan melalui pemungutan suara di antara Precision mengukur kemampuan model untuk pohon-pohon tersebut yang ditunjukkan dalam persamaan .
Algoritma ini dikenal karena mengidentifikasi hanya contoh yang relevan stabilitas dan ketahanannya terhadap overfitting dengan tepat.
Nilai ini dihitung menggunakan persamaan .
sebagai berikut :
RF .
= ycN OcycNyc=1 ycNycyceyceyc .
ycNycE Precision = ycNycE yaycE .
Recall (Sensitivit.
mengukur kemampuan dimana T adalah jumlah total pohon, ycNycyceyceyc .
adalah prediksi yang dibuat oleh pohon model untuk mendeteksi semua kejadian yang keputusan ke-t untuk input x.
Prediksi akhir untuk relevan.
Hal ini dihitung menggunakan klasifikasi ditentukan oleh suara mayoritas di persamaan .
semua pohon.
ycNycE Recall = ycNycE yaycA .
Model-model F1-score adalah rata-rata harmonis antara menggunakan 70% dataset sebagai set pelatihan, dengan 30% sisanya digunakan untuk pengujian.
presisi dan perolehan, yang menyeimbangkan Metode uji terpisah ini bertujuan untuk trade-off di antara keduanya.
Nilai ini dihitung mengevaluasi performa dan efektivitas model menggunakan persamaan .
ycEycyceycaycnycycnycuycu ycu ycIyceycaycaycoyco dalam memprediksi kelulusan tepat waktu .
F1-Score = 2 x ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco .
Hasil dari model-model ini akan dibandingkan untuk mengidentifikasi model yang memberikan Metrik ini memberikan pemahaman yang lebih prediksi paling akurat.
detail tentang kinerja model dibandingkan dengan akurasi semata.
Dengan menghitung 5 Indikator Kinerja indikator ini, berbagai model dapat dibandingkan Dalam studi ini, kinerja berbagai model untuk mengidentifikasi model yang paling efektif pembelajaran mesin dievaluasi menggunakan dalam memprediksi kelulusan tepat waktu indikator kinerja yang diakui secara luas .
Salah satu indikator utama yang digunakan 6 Training dan Validation Confusion Matrix, memvisualisasikan hasil klasifikasi .
Matriks Studi ini membagi dataset menjadi dua ini membandingkan hasil prediksi dengan nilai subset: 70% untuk pelatihan dan 30% untuk aktual, menghasilkan empat kategori: True validasi .
Pembagian ini mengikuti praktik Positive (TP).
True Negative (TN).
False Positive standar machine learning untuk memastikan (FP), and False Negative (FN).
Dengan Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika model dapat digeneralisasi dengan baik ke data yang belum pernah dilihat sebelumnya.
Evaluasi dilakukan untuk memprediksi kelulusan tepat waktu mahasiswa program D3 Teknologi Informasi.
HASIL DAN DISKUSI
Setiap model dilatih menggunakan metode train-test split dengan rasio 70:30, dan kinerjanya dievaluasi menggunakan metrik Accuracy.
Precision.
Recall, dan F1-Score seperti yang ditunjukkan dalam tabel 4.
Model yang digunakan Adalah K-Nearest Neighbors.
Decision Tree, dan Random Forest.
Seluruh model dikembangkan dan dilatih Tabel 4.
Perbandingan Kinerja Model Machine menggunakan pustaka scikit-learn pada bahasa Learning.
pemrograman Python.
Parameter model F1dioptimalkan menggunakan GridSearchCV Model Accuracy Precision Recall untuk menemukan kombinasi terbaik guna KNN meningkatkan akurasi dan kinerja .
Parameter yang digunakan dalam penelitian Decision Tree ditunjukkan dalam Tabel 3.
Random Tabel 3.
Parameter Model yang Digunakan Forest dalam Penelitian.
Hasil penelitian menunjukkan bahwa Model Definisi K-Nearest Neighbors (KNN) K-Nearest n_neighbors .
, metric sebesar 84%, precision 79%, dan recall yang Neighbors .
, weights sangat tinggi yaitu 98%.
Hal ini menunjukkan (KNN) .
bahwa KNN mampu mendeteksi mahasiswa yang Criterion .
, max_depth akan lulus tepat waktu dengan sangat baik.
Decision Tree (Non.
, random_state .
meskipun precision sedikit lebih rendah, n_estimators .
, criterion kemungkinan akibat adanya beberapa prediksi Random Forest .
, random_state .
positif palsu.
Dengan F1-Score sebesar 87%, param_grid (C = .
1, 1, 10, model ini menunjukkan keseimbangan yang baik GridSearchCV .
gamma = .
cale, auto, antara kemampuan mendeteksi kasus dan 001, 0.
01, 0.
1, .
meminimalkan kesalahan.
Kinerja model dievaluasi menggunakan metrik Accuracy.
Precision.
Recall, dan F1-score.
Pengukuran ini memberikan gambaran tentang sejauh mana model mampu mengklasifikasikan data dengan tepat.
Model dengan hasil terbaik ditentukan berdasarkan performanya pada data Penelitian ini menggunakan 10-fold cross-validation pada tahap pelatihan, dengan membagi dataset pelatihan menjadi 10 subset .
Model dilatih dan divalidasi sebanyak 10 kali, kemudian hasil akhirnya dihitung sebagai rata-rata dari performa pada 10 proses pelatihan Pendekatan ini membantu mengurangi risiko terjadinya overfitting.
Model Decision Tree menunjukkan akurasi terendah 70% dan recall 0.
72%, yang mengindikasikan bahwa model ini kurang efektif dalam mendeteksi kelulusan mahasiswa.
Meskipun precision sebesar 78% masih cukup baik, nilai F1-Score sebesar 75% menunjukkan adanya ketidakseimbangan dalam mendeteksi kasus dan mengurangi kesalahan prediksi.
Model Random Forest memiliki kinerja yang lebih baik dibandingkan Decision Tree, dengan akurasi 73% dan F1-Score sebesar 76%.
Precision sebesar 79% dan recall 74% menunjukkan bahwa model ini lebih stabil dan akurat dalam mengklasifikasikan kelulusan mahasiswa, meskipun masih berada di bawah performa KNN.
Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Kurva ROC yang berada jauh di atas garis diagonal .
aseline classifie.
menunjukkan bahwa model KNN tidak hanya unggul dalam mendeteksi mahasiswa yang lulus tepat waktu .
esuai nilai recall tingg.
, tetapi juga memiliki kemampuan generalisasi yang baik terhadap data Learning Curve pada Gambar 4 menunjukkan perubahan akurasi model KNN pada data pelatihan dan data pengujian terhadap .
Seiring bertambahnya nilai k, akurasi pelatihan Gambar 3.
Kurva ROC Model K-Nearest cenderung menurun dan menjadi lebih stabil.
Neighbors (KNN) : Hasil pengolahan data sementara akurasi pengujian meningkat dan mendekati akurasi pelatihan.
Pola ini Selain menggunakan metrik akurasi, menunjukkan bahwa model mulai mencapai precision, recall, dan F1-Score, performa model keseimbangan yang lebih baik antara bias dan KNN juga dianalisis menggunakan kurva varians.
Pada rentang k sekitar 20 hingga 45.
Receiver Operating Characteristic (ROC) seperti akurasi pengujian berada pada titik yang paling ditunjukkan pada Gambar 3.
Kurva ROC stabil .
81 hingga 0.
, yang memperlihatkan hubungan antara True Positive mengindikasikan bahwa model memiliki Rate (TPR) dan False Positive Rate (FPR) pada generalisasi terbaik pada rentang tersebut.
berbagai ambang keputusan.
Hasil menunjukkan bahwa model KNN memiliki Area Under the Curve (AUC) membedakan dengan baik antara mahasiswa yang lulus tepat waktu dan yang tidak.
Nilai AUC di atas 0.
80 termasuk dalam kategori sangat baik, sehingga memperkuat hasil penelitian bahwa KNN merupakan model paling akurat untuk memprediksi kelulusan tepat waktu.
Gambar 5.
Akurasi Model KNN pada Berbagai Nilai Jumlah Tetangga .
: Hasil pengolahan data penelitian Gambar 4.
Kurva Pembelajaran Model KNN terhadap Variasi Jumlah Tetangga : Hasil pengolahan data penelitian Fenomena ini selaras dengan hasil tuning hyperparameter yang mendeteksi bahwa nilai k optimal berada pada angka 48, di mana akurasi pengujian mencapai nilai tertinggi dibandingkan nilai k lainnya.
Dengan demikian, learning curve mengonfirmasi bahwa KNN tidak hanya memiliki performa yang baik berdasarkan metrik evaluasi .
ccuracy, precision, recall.
F1-scor.
, generalization yang kuat ketika jumlah tetangga dipilih secara optimal.
Diterima Redaksi :03 Desember 2.
Selesai Revisi :12 Desember 2.
Diterbitkan Online : 24 Desember 2025 Volume 20 Nomor 02 .
63-73 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika sebesar 98%.
Model Random Forest memberikan keseimbangan yang lebih baik dibandingkan Decision Tree, dengan akurasi yang lebih tinggi dan stabilitas prediksi yang lebih baik.
Secara keseluruhan.
KNN merupakan pilihan terbaik untuk mendeteksi kelulusan tepat waktu, sedangkan Random Forest lebih andal dalam menangani data yang lebih kompleks.
Gambar 6.
Radar Chart Perbandingan Metrik Evaluasi antar Model Radar Gambar membandingkan empat metrik evaluasi utamaAi Accuracy.
Precision.
Recall, dan F1-ScoreAi antara tiga model yang diuji, yaitu KNN.
Decision Tree, dan Random Forest.
Visualisasi ini menunjukkan bahwa KNN memiliki performa paling unggul secara konsisten, ditandai dengan nilai Accuracy tertinggi dan Recall yang sangat mahasiswa yang lulus tepat waktu dengan lebih Random Forest menampilkan performa menengah dengan nilai Precision dan F1-Score yang stabil, namun masih berada di bawah KNN, sedangkan Decision Tree menunjukkan kinerja terendah, terutama pada metrik Recall, yang mencerminkan kurangnya kemampuan dalam Secara keseluruhan, bentuk poligon yang paling luas pada model KNN menunjukkan bahwa model ini memiliki kinerja paling seimbang dan unggul di antara ketiga model dalam memprediksi kelulusan tepat waktu.
KESIMPULAN DAN SARAN
Penelitian ini menerapkan berbagai model machine learning untuk memprediksi kelulusan tepat waktu mahasiswa.
Di antara seluruh model yang diuji.
K-Nearest Neighbors (KNN) menunjukkan performa terbaik dalam mendeteksi kelulusan mahasiswa, dengan akurasi tinggi sebesar 84% dan nilai recall yang sangat baik Penelitian ini memberikan kontribusi praktis dan akademik.
Secara praktis, hasil penelitian dapat dimanfaatkan oleh Program Studi D3 Teknologi Informasi, sebagai dasar pengembangan sistem peringatan dini untuk mendeteksi mahasiswa yang berisiko tidak lulus tepat waktu.
Secara akademik, penelitian ini memperkaya kajian educational data mining pada konteks pendidikan vokasi di Indonesia serta menunjukkan keunggulan algoritma K-Nearest Neighbors dalam memprediksi kelulusan tepat waktu berbasis data akademik multi-semester.
Penelitian ini memiliki beberapa keterbatasan, antara lain penggunaan dataset yang terbatas pada mahasiswa Program Studi D3 Teknologi Informasi Universitas Brawijaya dengan rentang angkatan 2018Ae2020, sehingga generalisasi hasil masih terbatas.
Selain itu, variabel yang digunakan didominasi oleh faktor akademik, sementara faktor non-akademik belum diakomodasi dalam model.
Untuk penelitian mendatang, disarankan untuk menambahkan proses seleksi fitur serta mengeksplorasi teknik machine learning lainnya guna meningkatkan akurasi prediksi.
Integrasi machine learning dalam bidang pendidikan terbukti efektif dalam memprediksi capaian belajar mahasiswa.
Dengan model prediksi yang kuat, institusi pendidikan dapat memberikan dukungan yang lebih terarah kepada mahasiswa, sehingga membantu mereka meraih keberhasilan akademik dan lulus tepat waktu.
DAFTAR PUSTAKA