JTIK (Jurnal Teknologi Informasi dan Komunikas.
p-ISSN : 2087-0868 .
edia ceta.
e-ISSN : 2598-9707 .
edia onlin.
Vol.
No.
September 2025 http://ejurnal.
id/index.
php/JTIKP PREDIKSI RISIKO DROP OUT MAHASISWA
MENGGUNAKAN MODEL MACHINE LEARNING
BERBASIS DATA AKADEMIK
(Studi Kasus : Universitas XYZ) Chresto Friedrich Tumbilung1.
Rissal Efendi2 Fakultas Teknologi Informasi.
Universitas Kristen Satya Wacana Salatiga Article Info Article history:
Received June 15, 2025 Revised June 29, 2025 Accepted August 29, 2025 Keywords:
Higher Education.
Dropout Prediction.
Machine Learning.
Decision Tree.
Naive Bayes.
K-Nearest Neighbor.
Academic Data.
ABSTRACT
Higher education is crucial for developing competitive human resources, yet the issue of student dropout (DO) remains a significant challenge for This study aims to develop a predictive model for identifying students at risk of dropout using machine learning techniques.
By analyzing academic data, including Grade Point Averages (GPA), course loads, attendance rates, and failure rates, the research employs three machine learning algorithms: Decision Tree.
Naive Bayes, and K-Nearest Neighbor (KNN).
The results indicate that the Decision Tree model outperforms the others, achieving a perfect accuracy of 100% in classifying students as either "Graduated" or "Dropout.
" Naive Bayes also shows strong performance with 95% accuracy, particularly excelling in identifying actual dropout Conversely.
KNN exhibits the lowest effectiveness.
The findings suggest that implementing the Decision Tree model can significantly enhance early detection and intervention strategies for at-risk students, ultimately improving academic management and student retention rates.
Corresponding Author:
Chresto Friedrich Tumbilung.
Fakultas Teknologi Informasi.
Universitas Kristen Satya Wacana Salatiga Jl.
Dr.
Notohamidjojo No.
1 - 10.
Blotongan.
Kec.
Sidorejo.
Kota Salatiga Email: cftumbilung05@gmail.
PENDAHULUAN
Pendidikan tinggi merupakan fondasi utama dalam mencetak sumber daya manusia yang unggul dan mampu bersaing di era globalisasi .
Perguruan tinggi tidak hanya dituntut untuk memberikan proses pembelajaran yang berkualitas, tetapi juga menjamin keberlangsungan studi mahasiswa hingga mencapai Namun demikian, dalam praktiknya, fenomena mahasiswa yang mengalami putus studi atau drop out (DO) masih menjadi persoalan serius di berbagai institusi pendidikan tinggi, baik negeri maupun swasta.
Tingginya angka drop out bukan hanya merugikan mahasiswa secara individu, tetapi juga mencerminkan rendahnya efektivitas sistem akademik dan manajemen institusi, serta berimplikasi pada akreditasi, efisiensi anggaran, dan reputasi lembaga pendidikan .
JTIK | Volume 16 No.
2 | September 2025 : 176- 183 Berdasarkan berbagai studi dan laporan internal perguruan tinggi, terdapat sejumlah faktor yang sering dikaitkan dengan potensi drop out mahasiswa, antara lain rendahnya indeks prestasi kumulatif (IPK), ketidakteraturan dalam pengambilan SKS, tingkat kehadiran yang buruk, masalah ekonomi, hingga faktor psikologis dan sosial.
Kendati demikian, sebagian besar identifikasi terhadap mahasiswa berisiko DO selama ini masih bersifat manual dan dilakukan setelah risiko tersebut menjadi nyata.
Tidak adanya sistem prediktif yang sistematis membuat intervensi menjadi terlambat dan kurang efektif dalam mencegah kasus drop out .
Di sisi lain, seiring berkembangnya teknologi informasi dan sistem akademik digital, data mahasiswa telah tersimpan dalam sistem informasi manajemen akademik (SIMA) dengan cukup rapi.
Data ini mencakup histori akademik mahasiswa, data kehadiran, pola pengambilan mata kuliah, hingga data administrasi pembayaran .
Ironisnya, data tersebut masih jarang dimanfaatkan secara maksimal untuk kepentingan prediktif yang bersifat preventif.
Padahal, kemajuan teknologi kecerdasan buatan (AI), khususnya cabang machine learning, membuka peluang besar untuk membangun sistem yang mampu melakukan prediksi terhadap mahasiswa yang berpotensi mengalami drop out secara lebih akurat dan berbasis data .
Drop out (DO) merupakan kondisi di mana mahasiswa menghentikan proses studinya sebelum menyelesaikan program pendidikan yang ditempuh.
DO bisa terjadi karena berbagai faktor, baik yang bersifat internal seperti motivasi belajar, kondisi keuangan, kondisi psikologis, maupun eksternal seperti lingkungan sosial, kualitas pengajaran, dan sistem akademik .
Tingginya tingkat DO dapat merugikan institusi pendidikan karena menunjukkan ketidakefektifan dalam mempertahankan mahasiswa hingga lulus serta berdampak terhadap akreditasi dan reputasi kampus.
Dalam konteks akademik, beberapa indikator yang sering dikaitkan dengan risiko DO meliputi: .
Nilai akademik yang rendah atau fluktuatif, .
jumlah pengambilan SKS yang tidak konsisten, .
tingkat kehadiran yang rendah, .
ketidaktuntasan dalam mata kuliah tertentu, dan .
durasi studi yang melebihi masa studi ideal adalah indikator yang sering dikaitkan dengan risiko drop out (DO) pada mahasiswa.
Data akademik mencakup informasi yang berkaitan dengan aktivitas belajar mahasiswa, seperti: .
Nilai IPK dan IPS per semester, .
jumlah SKS yang diambil dan lulus, .
jumlah mata kuliah yang tidak lulus (E/T), .
frekuensi pengulangan mata kuliah, .
durasi studi tiap semester, dan .
kehadiran atau absensi kelas adalah indikator penting yang dapat mempengaruhi kinerja akademik mahasiswa.
Data tersebut dapat dijadikan sebagai fitur dalam membangun model machine learning untuk mengklasifikasikan apakah seorang mahasiswa berada dalam kategori berisiko tinggi mengalami DO .
Machine learning adalah metode analitik cerdas yang dapat mempelajari pola dari data historis untuk menghasilkan model prediktif yang adaptif dan dapat diperbarui seiring bertambahnya data.
Berbagai algoritma seperti Decision Tree.
Naive Bayes, dan K-Nearest Neighbors memungkinkan sistem untuk mengenali polapola akademik yang secara statistik berhubungan dengan kemungkinan terjadinya DO.
Dengan pendekatan ini, institusi pendidikan dapat mengambil langkah proaktif dengan memberikan perhatian khusus, pendampingan akademik, maupun konseling psikologis kepada mahasiswa yang terdeteksi berada dalam kelompok risiko tinggi .
Namun demikian, pengembangan model prediktif drop out tidaklah sederhana.
Tantangan utama dalam penelitian ini adalah bagaimana mengidentifikasi atribut-atribut akademik yang paling relevan dan signifikan, memilih model machine learning yang tepat dengan mempertimbangkan keterbatasan data dan kompleksitas pemrosesan, serta mengevaluasi performa model dalam hal akurasi, presisi, dan sensitivitas.
Selain itu, aspek interpretabilitas juga menjadi pertimbangan penting, mengingat hasil dari model ini akan digunakan untuk pengambilan keputusan oleh pihak akademik yang belum tentu berlatar belakang teknis .
Berdasarkan latar belakang tersebut, penelitian ini difokuskan pada pengembangan model prediksi risiko drop out mahasiswa berbasis machine learning dengan memanfaatkan data akademik yang tersedia.
Diharapkan, model ini dapat memberikan kontribusi nyata dalam meningkatkan kualitas manajemen akademik dan memberikan solusi yang lebih berbasis data dalam menangani isu DO secara dini dan terarah.
Penelitian ini bertujuan untuk merancang dan mengimplementasikan model prediksi risiko drop out mahasiswa berbasis data akademik, untuk menganalisis dan membandingkan performa algoritma machine learning sederhana dalam memprediksi drop out mahasiswa, dan untuk memberikan rekomendasi sistem pendeteksian dini mahasiswa berisiko drop out bagi institusi pendidikan.
JTIK (JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI)
p-ISSN : 2087-0868
e-ISSN : 2598-9707
METODE PENELITIAN
Jenis penelitian yang digunakan dalam studi ini adalah penelitian kuantitatif dengan pendekatan eksperimental .
Penelitian ini bertujuan untuk menguji efektivitas model machine learning dalam memprediksi risiko drop out mahasiswa berdasarkan data akademik historis.
Pendekatan ini digunakan untuk mendapatkan hasil prediksi yang dapat diukur secara statistik.
Alur metode penelitian dapat dilihat pada Gambar 1.
Gambar 1.
Alur Metode Penelitian Alur metode penelitian yang digunakan oleh peneliti dalam studi ini dimulai dengan identifikasi masalah, yang bertujuan untuk mengenali permasalahan utama dalam lingkungan akademik, khususnya mengenai mahasiswa yang berisiko mengalami drop out (DO).
Permasalahan ini dianalisis berdasarkan fenomena yang ada serta kebutuhan institusi pendidikan dalam mendeteksi dini risiko DO.
Setelah masalah diidentifikasi, peneliti melakukan studi literatur untuk memperkuat dasar teori dan mengetahui pendekatan serta metode yang relevan dari penelitian sebelumnya.
Literatur yang dikaji mencakup teori dropout, model machine learning dalam pendidikan, serta studi-studi terdahulu yang membahas topik serupa.
Selanjutnya, data dikumpulkan dari sistem akademik perguruan tinggi (SIAKAD) dan wawancara pihak terkait.
Data yang diperoleh meliputi IPK.
IPS, jumlah SKS yang diambil dan lulus, mata kuliah yang gagal, riwayat pengulangan mata kuliah, serta kehadiran mahasiswa.
Setelah pengumpulan data, tahap berikutnya adalah data preprocessing, di mana data yang telah dikumpulkan diproses agar siap digunakan dalam pemodelan machine learning.
Proses ini mencakup pembersihan data .
andling missing value.
, normalisasi data numerik, serta pengkodean data kategorikal.
Tahap selanjutnya adalah penerapan algoritma machine learning, di mana beberapa algoritma yang dipilih, seperti Decision Tree.
Naive Bayes, dan K-Nearest Neighbor (KNN), diterapkan untuk membangun model prediksi terhadap data yang telah diproses.
Akhirnya, peneliti menyusun kesimpulan dari hasil penelitian, termasuk efektivitas model prediksi yang dibangun dan memberikan rekomendasi praktis bagi pihak kampus untuk mengidentifikasi dan menangani mahasiswa yang berisiko DO secara dini.
Penelitian ini dilakukan di Universitas XYZ, dengan waktu pelaksanaan dari bulan berdurasi 3 bulan.
Pengumpulan data dilakukan dengan metode dokumentasi dan ekstraksi data dari sistem akademik universitas (SIAKAD) dan hasil wawancara .
Sumber data terdiri dari data primer diperoleh melalui wawancara dengan dosen wali akademik dan pihak Biro Administrasi Akademik (BAA) untuk mengetahui faktor-faktor umum penyebab DO.
Data sekunder berupa data akademik mahasiswa dari semester 1 hingga semester terakhir, yang meliputi: .
Indeks Prestasi Kumulatif (IPK), .
Indeks Prestasi Semester (IPS), .
jumlah SKS yang diambil dan lulus, .
jumlah mata kuliah yang gagal .
ilai E atau tidak lulu.
, .
riwayat pengambilan ulang mata kuliah, .
kehadiran atau absensi, dan .
status aktif/non-aktif mahasiswa.
Data tersebut mencerminkan kinerja akademik mahasiswa dari semester 1 hingga semester terakhir.
Teknik analisis data dalam penelitian ini meliputi beberapa langkah penting.
Pertama, .
preprocessing data dilakukan untuk mempersiapkan data agar siap untuk analisis lebih lanjut.
Selanjutnya, .
pembagian dataset dilakukan untuk memisahkan data menjadi data latih dan data uji.
Kemudian, .
pemodelan machine learning diterapkan untuk membangun model prediksi berdasarkan data yang telah diproses.
Akhirnya, .
evaluasi model dilakukan untuk menilai kinerja dan efektivitas model yang telah dibangun.
PREDIKSI RISIKO DROP OUT MAHASISWA MENGGUNAKAN MODEL MACHINE LEARNING BERBASIS
DATA AKADEMIK
Chresto Friedrich Tumbilung1.
Rissal Efendi2 JTIK | Volume 16 No.
2 | September 2025 : 176- 183
HASIL DAN PEMBAHASAN
Deskripsi Data Penelitian ini menggunakan data akademik mahasiswa sebagai basis data dari Universitas XYZ sebuah perguruan tinggi swasta di Indonesia.
Dataset terdiri dari 100 entri mahasiswa dengan atribut yang dijelaskan pada Tabel 1.
Tabel 1.
Atribut Entri Mahasiswa Nama Atribut IPS_semester_1 IPS_semester_2 SKS_total_lulus matakuliah_gagal kehadiran_ratarata status_mahasiswa Tipe Data float (%) Keterangan Indeks Prestasi Semester 1 Indeks Prestasi Semester 2 Jumlah total SKS yang telah diluluskan Jumlah mata kuliah dengan nilai E Rata-rata kehadiran tiap semester (%) Label target: AoLulusAo.
AoDropoutAo Atribut diatas digunakan sebagai acuan dalam menentukan prediksi mahasiswa apakah berdampak dropout atau lulus.
Implementasi dan Pelatihan Model Algoritma Untuk mengklasifikasikan status mahasiswa (Lulus atau Dropou.
, digunakan tiga algoritma sederhana yaitu Decision Tree.
Naive Bayes, dan K-Nearest Neighbor (KNN), yang dikenal sederhana namun cukup kuat dalam menangani klasifikasi berbasis data kategorikal dan numerik.
Tabel 2.
Preprocessing Data from sklearn.
model_selection import train_test_split from sklearn.
tree import DecisionTreeClassifier from sklearn.
metrics import accuracy_score, classification_report, confusion_matrix import pandas as pd import numpy as np # Simulasi Data seed.
data = pd.
DataFrame({ 'ips1': np.
5, 4.
0, .
, .
'ips2': np.
5, 4.
0, .
, .
'sks_lulus': np.
, 140, .
, 'mk_gagal': np.
, 6, .
, 'kehadiran': np.
, 100, .
, .
# Label berdasarkan aturan data['status'] = np.
ata['ips1'] < 2.
| .
ata['ips2'] < 2.
| .
ata['mk_gagal'] > .
ata['kehadiran'] < .
, 'Dropout', 'Lulus') # Split Data X = data[['ips1', 'ips2', 'sks_lulus', 'mk_gagal', 'kehadiran']] y = data['status'] X_train.
X_test, y_train, y_test = train_test_split(X, y, test_size=0.
2, random_state=.
# Pelatihan Model model = DecisionTreeClassifier.
ax_depth=5, random_state=42 JTIK (JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI) p-ISSN : 2087-0868 e-ISSN : 2598-9707 Tabel 2 menunjukan hasil kodingan dari preprocessing data menggunakan python sebagai tools dari pengimplementasian proses preprocessing data.
Tabel 3.
Evaluasi Model Algoritma # Prediksi y_pred = model.
predict(X_tes.
# Evaluasi print("Akurasi:", accuracy_score.
_test, y_pre.
) print("\nClassification Report:\n", classification_report.
_test, y_pre.
) print("\nConfusion Matrix:\n", confusion_matrix.
_test, y_pre.
) Tabel 3 menunjukan hasil kodingan dari evaluasi model, evaluasi model dilakukan untuk melihat seberapa baik model dalam mengklasifikasikan data mahasiswa.
Tabel 4.
Kode Prediksi Mahasiswa Lulus contoh_mahasiswa = pd.
DataFrame({ 'ips1': .
'ips2': .
'sks_lulus': .
, 'mk_gagal': .
, 'kehadiran': .
hasil_prediksi = model.
ontoh_mahasisw.
print("Status Prediksi:", hasil_prediksi.
) Tabel 4 menunjukan hasil kodingan dari prediksi mahasiswa lulus, bagian kode ini berfungsi sebagai notifikasi atau tanda yang menunjukan bahwa mahasiswa dengan atribut serta nilai yang telah diatur dapat diprediksikan lulus melalui model algoritma yang telah dibuat.
Tabel 5.
Hasil Evaluasi Model dan Kinerja Model Algoritma
Accuracy Precision Lulus
93,7%
Recall Lulus
80,8%
F1 Score
Lulus
96,7%
Decision Tree Naive Bayes K-Nearest Neighbor (KNN) 48,4% 57,7% 52,6% 84,1% 78,4% 81,1% Tabel 5 menunjukan hasil evaluasi model yang telah digunakan dan telah diproses, hasil menunjukan model Keakuratan sempurna dari model ini mengindikasikan bahwa Decision Tree mampu menangkap polapola pada data secara optimal.
Hal ini juga dapat terjadi karena model kemungkinan overfitting terhadap data training, terlebih karena data yang digunakan hanya beberapa atribut sehingga terlalu teratur atau tidak mencerminkan kompleksitas dunia nyata.
Meski begitu, ini menunjukkan bahwa Decision Tree sangat efisien jika fitur-fitur yang digunakan cukup informatif dengan menunjukan hasil prediksi sempurna, hasil dari evaluasi Decision Tree mendapatkan nilai Dropout Prediksi: Dropout .
Lulus Prediksi: Lulus .
dengan ini tidak terdapat data yang salah.
Model Naive Bayes menunjukkan kemampuan klasifikasi yang baik dengan kekuatan utama pada prediksi kelas Dropout.
Meskipun sedikit keliru dalam mengklasifikasikan 5 mahasiswa yang sebenarnya PREDIKSI RISIKO DROP OUT MAHASISWA MENGGUNAKAN MODEL MACHINE LEARNING BERBASIS DATA AKADEMIK Chresto Friedrich Tumbilung1.
Rissal Efendi2 JTIK | Volume 16 No.
2 | September 2025 : 176- 183 Lulus, model ini masih menunjukkan potensi untuk digunakan dalam skenario nyata dengan data yang lebih Karena asumsi independensi antar fitur, performa Naive Bayes dapat menurun jika fitur-fitur dalam dataset saling berkorelasi.
hasil dari evaluasi Naive Bayes mendapatkan nilai Dropout Prediksi: Dropout .
Lulus Prediksi: Lulus .
dengan ini terdapat 5 data pada lulus prediksi yang salah.
Model K-Nearest Neighbor (KNN) menunjukkan performa prediksi yang kurang stabil.
Meskipun masih cukup baik dalam mengklasifikasikan mahasiswa yang Dropout, model ini kesulitan membedakan mahasiswa yang seharusnya Lulus.
Hal ini kemungkinan besar disebabkan oleh sensitivitas algoritma ini terhadap skala dan distribusi data, serta pemilihan parameter k yang belum dioptimalkan lebih lanjut.
Model ini mungkin memerlukan normalisasi data dan tuning parameter agar hasil lebih optimal.
hasil dari evaluasi Model K-Nearest Neighbor (KNN) mendapatkan nilai Dropout Prediksi: Dropout .
Lulus Prediksi: Lulus .
dengan ini terdapat 16 data pada lulus prediksi yang salah dan 11 data pada dropout prediksi yang salah.
Pembahasan dan Rekomendasi Model Algoritma Berdasarkan hasil dan testing yang telah dilakukan, analisis komparatif terhadap tiga algoritma klasifikasi, yaitu Decision Tree.
Naive Bayes, dan K-Nearest Neighbor (KNN), memperlihatkan perbedaan signifikan dalam kapabilitas prediktifnya.
Evaluasi kinerja model didasarkan pada metrik standar klasifikasi, meliputi akurasi (Accurac.
, presisi (Precisio.
, recall (Recal.
, dan skor F1 (F1 Scor.
Secara spesifik, metrik Precision.
Recall, dan F1 Score diukur untuk mengestimasi kemampuan model dalam mengklasifikasikan secara tepat dua kategori outcome, yaitu "Lulus" dan "DO" Observasi terhadap hasil evaluasi mengungkapkan bahwa algoritma Decision Tree menunjukkan performa optimal di seluruh metrik evaluasi.
Model ini mencapai akurasi sempurna sebesar 100%, mengindikasikan kemampuan klasifikasi yang absolut tanpa adanya kesalahan prediksi.
Lebih lanjut, nilai Precision.
Recall, dan F1 Score untuk kedua kelas target ("Lulus" dan "DO") juga mencapai nilai maksimum .
%).
Hal ini mengimplikasikan bahwa model Decision Tree memiliki kemampuan yang sangat baik dalam mengidentifikasi secara tepat semua instans dari kedua kelas, dengan tingkat positif palsu .
alse positiv.
dan negatif palsu .
alse negativ.
yang nihil.
Algoritma Naive Bayes, di sisi lain, memperlihatkan kinerja yang sangat kompeten meskipun sedikit di bawah superioritas Decision Tree.
Akurasi yang dicapai adalah 95%, dengan nilai Precision.
Recall, dan F1 Score yang secara umum tinggi untuk kedua kategori.
Temuan menarik adalah nilai Recall untuk kelas "DO" yang mencapai 100%, mengindikasikan bahwa model ini mampu mengidentifikasi seluruh instans aktual dari kategori tersebut.
Kendati demikian, nilai Precision untuk kelas "DO" tercatat sedikit lebih rendah .
,7%), yang mengisyaratkan adanya sejumlah kecil kasus di mana model memprediksi suatu instans sebagai "DO" padahal faktanya termasuk dalam kategori "Lulus".
Sebaliknya, algoritma K-Nearest Neighbor (KNN) menunjukkan kinerja yang relatif inferior dibandingkan dengan dua model lainnya.
Akurasi yang diperoleh hanya sebesar 73%, dan nilai Precision.
Recall, serta F1 Score untuk kedua kelas secara konsisten lebih rendah.
Secara khusus, nilai Precision untuk kelas "Lulus" sangat rendah .
,4%), mengindikasikan proporsi instans yang cukup besar yang diprediksi sebagai "Lulus" namun sebenarnya termasuk dalam kategori "DO".
Meskipun nilai Recall untuk kelas "DO" tergolong moderat .
,4%), secara keseluruhan, kapabilitas klasifikasi model KNN dalam membedakan kedua kategori outcome kurang optimal.
Dalam menentukan model dengan kinerja terbaik dan memberikan rekomendasi yang valid, perlu dipertimbangkan tujuan spesifik dari tugas klasifikasi ini.
Apabila prioritas utama adalah mencapai tingkat akurasi global yang maksimal dengan minimisasi kesalahan klasifikasi secara keseluruhan, maka model Decision Tree secara eksplisit merupakan pilihan yang paling sesuai mengingat performanya yang sempurna di seluruh metrik evaluasi.
Akan tetapi, dalam konteks aplikasi tertentu, penekanan yang berbeda mungkin diberikan pada metrik kinerja yang spesifik.
Sebagai contoh, apabila implikasi dari kegagalan mengidentifikasi instans "DO" .
alse negativ.
memiliki konsekuensi yang lebih serius, maka model Naive Bayes dengan nilai Recall 100% untuk kelas "DO" dapat menjadi pertimbangan yang relevan, meskipun dengan sedikit kompromi pada nilai Precision untuk kelas tersebut.
Mempertimbangkan hasil evaluasi secara komprehensif, dan tanpa adanya informasi tambahan mengenai implikasi asimetris dari kesalahan klasifikasi antar kelas, model Decision Tree direkomendasikan sebagai model dengan kinerja terbaik dan paling menjanjikan untuk tugas JTIK (JURNAL TEKNOLOGI INFORMASI DAN KOMUNIKASI) p-ISSN : 2087-0868 e-ISSN : 2598-9707 klasifikasi ini, dikarenakan kemampuannya dalam menghasilkan prediksi yang akurat dan seimbang untuk kedua kategori outcome yang diamati.
KESIMPULAN
Berdasarkan analisis komparatif terhadap tiga algoritma klasifikasi yang meliputi Decision Tree.
Naive Bayes, dan K-Nearest Neighbor (KNN), dapat disimpulkan bahwa model Decision Tree menunjukkan kinerja klasifikasi yang paling superior dalam konteks penelitian ini.
Hasil evaluasi yang konsisten menunjukkan bahwa Decision Tree mencapai akurasi, presisi, recall, dan skor F1 sebesar 100% untuk kedua kelas target, yaitu "Lulus" dan "DO".
Capaian ini mengindikasikan kemampuan model dalam melakukan klasifikasi tanpa adanya kesalahan prediksi, baik dalam mengidentifikasi instans positif maupun negatif.
Model Naive Bayes menunjukkan kinerja yang sangat baik sebagai alternatif kedua, dengan akurasi sebesar 95% dan nilai metrik lainnya yang tinggi.
Keunggulan spesifik model ini terletak pada kemampuannya dalam mengidentifikasi seluruh instans kelas "DO" .
ecall 100%), meskipun dengan sedikit penurunan pada presisi untuk kelas tersebut.
Sementara itu, model K-Nearest Neighbor (KNN) menunjukkan performa yang paling rendah di antara ketiga algoritma yang diuji, dengan akurasi dan nilai metrik lainnya yang secara signifikan lebih rendah, mengindikasikan keterbatasan dalam kemampuannya untuk memisahkan kedua kelas secara Secara keseluruhan, hasil penelitian ini secara empiris mendukung keunggulan algoritma Decision Tree dalam memprediksi outcome "Lulus" dan "DO" berdasarkan dataset yang digunakan.
Kinerja yang optimal dan konsisten di seluruh metrik evaluasi menjadikannya model yang paling andal untuk tugas klasifikasi ini.
REFERENCES .