768
Progresif: Jurnal Ilmiah Komputer https://ojs.
stmik-banjarbaru.
id/index.
php/progresif/index Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 Penerapan Metode Support Vector Machine Untuk Memprediksi Kelulusan Tepat Waktu DOI: http://dx.
org/10.
35889/progresif.
Creative Commons License 4.
0 (CC BY AeNC) Avif Setyawan1*.
Rahmat Haryadi Kiswanto2.
Heru Sutejo3 Teknik Informatika.
Universitas Sepuluh Nopember Papua.
Jayapura.
Indonesia *e-mail Corresponding Author: avifsetyawan3@gmail.
Abstract Timely graduation is a key indicator of student academic success in higher education.
This study develops a predictive model for on-time student graduation at Universitas Sepuluh Nopember Papua using the Support Vector Machine (SVM) method with a linear kernel.
The model examines the influence of academic performance and student status as Indigenous Papuans (OAP) or non-OAP in predicting graduation probability.
Model evaluation was conducted using Confusion Matrix.
ROC Curve, and Cross-Validation, demonstrating that the model achieved high accuracy of 92% in the initial testing phase, increasing to 97% after crossvalidation.
The evaluation also showed a Precision of 90%.
Recall of 100%, and F1-Score of 95%, confirming the modelAos effectiveness in distinguishing students at risk of delayed With its high predictive accuracy, this model can serve as a data-driven academic decision-making tool to identify at-risk students and implement more targeted academic interventions to improve timely graduation rates.
Keywords: graduation prediction.
model evaluation.
machine learning.
Support Vector Machine.
Abstrak Kelulusan tepat waktu menjadi indikator utama keberhasilan akademik mahasiswa di perguruan Penelitian ini mengembangkan model prediksi kelulusan tepat waktu mahasiswa Universitas Sepuluh Nopember Papua menggunakan metode Support Vector Machine (SVM) dengan kernel linier.
Model ini menganalisis pengaruh kinerja akademik dan status mahasiswa sebagai Orang Asli Papua (OAP) atau non-OAP dalam menentukan probabilitas kelulusan tepat Evaluasi model dilakukan menggunakan Confusion Matrix.
ROC Curve, dan CrossValidation, yang menunjukkan bahwa model memiliki akurasi tinggi sebesar 92% pada tahap pengujian awal dan meningkat menjadi 97% setelah validasi silang.
Hasil pengujian juga menunjukkan nilai Precision 90%.
Recall 100%, dan F1-Score 95%, yang menegaskan efektivitas model dalam membedakan mahasiswa yang berisiko mengalami keterlambatan Dengan tingkat akurasi yang tinggi, model ini dapat digunakan sebagai alat bantu akademik berbasis data untuk mengidentifikasi mahasiswa berisiko dan menerapkan intervensi akademik yang lebih tepat sasaran guna meningkatkan tingkat kelulusan tepat waktu.
Kata kunci: Prediksi kelulusan.
Evaluasi model.
Machine learning.
Support Vector Machine.
Pendahuluan Kelulusan tepat waktu merupakan salah satu indikator keberhasilan pendidikan tinggi yang sangat penting.
dan menjadi perhatian utama di Universitas Sepuluh Nopember.
Perguruan tinggi harus mengantisipasi efek negatif yang akan terjadi pada kelulusan mahasiswa.
Penggunaan teknologi sistem informasi yang canggih sangat penting untuk mendukung upaya ini.
Perkembangan ini memungkinkan perguruan tinggi untuk menganalisis data secara lebih efisien dan akurat, yang memungkinkan untuk mendapatkan pemahaman yang lebih mendalam tentang faktor-faktor yang mempengaruhi kelulusan mahasiswa.
Jika terjadi penurunan tingkat kelulusan maka akan menjadi suatu permasalahan yang akan mempengaruhi akreditasi di sebuah perguruan tinggi.
Oleh karena itu, institusi dapat menerapkan pendekatan yang Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan Progresif e-ISSN: 2685-0877 lebih tepat sasaran untuk meningkatkan tingkat kelulusan dan mempertahankan standar akreditasi yang tinggi.
Permasalahan kelulusan tepat waktu dan tidak tepat waktu di Universitas Sepuluh Nopember (USN) menunjukkan kompleksitas interaksi antara berbagai faktor dalam konteks pendidikan yang lebih luas.
Data empiris menunjukkan bahwa persentase kelulusan tepat waktu dari tahun 2018 hingga 2020 berada jauh di bawah standar yang ditetapkan oleh Badan Akreditasi Nasional Perguruan Tinggi (BAN-PT).
Pada tahun 2018, hanya 9% dari 90 mahasiswa yang berhasil lulus tepat waktu, sedangkan 91% lainnya mengalami keterlambatan.
Kondisi ini berlanjut pada tahun 2019, di mana dari 91 mahasiswa, hanya 13% yang lulus tepat waktu, dan meningkat menjadi 19% dari 78 mahasiswa pada tahun 2020.
Rendahnya tingkat kelulusan tepat waktu ini dapat berdampak negatif terhadap berbagai aspek, seperti efisiensi sumber daya universitas, peringkat akreditasi, reputasi akademik, serta prospek karir Untuk mengatasi permasalahan ini, diperlukan pendekatan yang lebih sistematis dalam mengidentifikasi faktor-faktor penyebab keterlambatan serta solusi yang dapat diterapkan untuk meningkatkan tingkat kelulusan tepat waktu.
Salah satu faktor utama yang berkontribusi terhadap kelulusan tepat waktu adalah Indeks Prestasi Semester (IPS), yang mencerminkan kinerja akademik mahasiswa.
Selain itu, status sebagai putra daerah atau nonputra daerah juga dapat mempengaruhi kelulusan, karena perbedaan dalam tingkat adaptasi dan dukungan akademik yang diterima mahasiswa.
Oleh karena itu, memahami pengaruh variabel IPS dan status keaslian daerah terhadap kelulusan tepat waktu sangat penting bagi lembaga pendidikan tinggi dalam upaya mereka untuk memberikan dukungan terbaik kepada mahasiswa dan meningkatkan kinerja program akademik mereka.
Untuk menjalankan penelitian ini, dibutuhkan beberapa kriteria sebagai penentu data kelulusan mahasiswa, termasuk data detail mahasiswa seperti NPM.
IPS dari semester 1 hingga 4 .
Analisis terhadap faktorfaktor ini diharapkan dapat membantu universitas dalam mengambil langkah intervensi yang lebih tepat sasaran guna meningkatkan tingkat kelulusan tepat waktu.
Dalam penelitian ini, algoritma SVM dengan kernel linier akan digunakan secara khusus untuk memprediksi kemungkinan mahasiswa lulus tepat waktu atau tidak, berdasarkan variabel IPS dan status sebagai putra daerah atau non-putra daerah, serta faktor-faktor lain yang Penggunaan metode SVM dipilih karena efektivitasnya dalam menangani dataset dengan jumlah variabel yang relatif kecil, memungkinkan analisis yang lebih fokus dan mengurangi kompleksitas komputasi tanpa mengorbankan akurasi.
Alasan utama pemilihan algoritma Support Vector Machine (SVM) dalam penelitian ini adalah karena kemampuannya yang tinggi dalam menangani data berdimensi kecil dengan pemisahan kelas yang linier secara SVM terbukti unggul dalam klasifikasi biner dan dapat memberikan akurasi prediksi yang tinggi, sebagaimana dibuktikan dalam penelitian oleh Haryatmi et al.
yang mencatat akurasi sebesar 94,4% dalam prediksi kelulusan tepat waktu menggunakan SVM.
Selain itu, penelitian oleh Junaidi et al.
menunjukkan bahwa SVM memberikan hasil terbaik dibandingkan metode lain seperti Nayve Bayes.
Random Forest, dan ANN, dengan nilai akurasi mencapai Kinerja SVM yang konsisten juga ditunjukkan oleh Qisthiano .
, dengan akurasi 85% dalam klasifikasi kelulusan mahasiswa.
Penelitian ini bertujuan untuk mengembangkan model prediksi kelulusan tepat waktu mahasiswa di Universitas Sepuluh Nopember menggunakan metode Support Vector Machine (SVM) dengan kernel linier.
Fokus utama penelitian ini adalah untuk menganalisis keterkaitan antara Indeks Prestasi Semester (IPS) dan status mahasiswa sebagai putra daerah atau nonputra daerah terhadap kelulusan tepat waktu.
Selain itu, penelitian ini bertujuan untuk mengukur tingkat keakuratan metode SVM dalam memprediksi kelulusan serta mengevaluasi efektivitasnya dibandingkan dengan metode konvensional yang selama ini digunakan.
Dengan adanya model prediksi ini, diharapkan universitas dapat lebih proaktif dalam mengidentifikasi mahasiswa yang berisiko mengalami keterlambatan kelulusan, sehingga strategi intervensi akademik dapat diterapkan lebih tepat sasaran.
Model ini juga diharapkan dapat membantu universitas dalam menyusun kebijakan berbasis data untuk meningkatkan efisiensi akademik dan mempertahankan standar akreditasi.
Untuk menjaga fokus penelitian, studi ini tidak mencakup mahasiswa yang drop out, serta akan membatasi variabel hanya pada faktor yang relevan, guna menghasilkan model prediksi yang lebih akurat dan dapat diandalkan.
Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan 770 e-ISSN: 2685-0877 Tinjauan Pustaka Penelitian terdahulu yang sudah dubuat untuk prediksi kelulusan tepat waktu telah banyak dilakukan dengan berbagai metode data maining.
Dari salah satu metode yang dipakai adalah metode Support Vector Machine, merupakan metode pengelompokan yang memiliki keakuratan tinggi dalam proses peramalan dan pengelompokan karakteristik.
Penelitian yang dibuat Emy Haryatmi dan teman-teman membahas penerapan algoritma Support Vector Machine (SVM) untuk model prediksi kelulusan mahasiswa tepat waktu di Fakultas Teknik Universitas Swasta di Indonesia.
Penelitian menggunakan metode CRISPDM (Cross Industry Standard Process for Data Minin.
yang mencakup pemahaman bisnis, pemahaman data, pengolahan data, pemodelan, dan evaluasi.
Data penelitian melibatkan atribut seperti usia, jenis kelamin.
IPS.
IPS.
SKS, dan lama masa studi, dengan total data 192 mahasiswa dari tahun 2009 hingga 2016.
Setelah melalui proses pembersihan dan transformasi, 2.
181 data digunakan untuk analisis.
Data dibagi menjadi tiga kelompok berdasarkan proporsi data pelatihan .
%, 80%, dan 90%) dan data pengujian.
Hasil pengujian menunjukkan bahwa algoritma SVM dengan 90% data pelatihan dan 10% data pengujian memberikan akurasi tertinggi sebesar 94,4%, diikuti oleh 80% .
,5%) dan 70% .
,4%).
SVM
terbukti memiliki keunggulan dibandingkan algoritma lain seperti Nayve Bayes.
Decision Tree, dan Neural Network, terutama dalam hal akurasi dan kemampuan menangani data kompleks.
Penelitian ini menyimpulkan bahwa model SVM efektif untuk memprediksi kelulusan mahasiswa tepat waktu dan dapat digunakan sebagai alat bantu dalam pengambilan keputusan di institusi pendidikan tinggi.
Berikut penelitian yang telah dibuat oleh Wijiyanto dan teman-teman membahas kontribusi data keluarga dalam memprediksi kelulusan mahasiswa tepat waktu menggunakan algoritma Support Vector Machine (SVM) dengan kernel linear.
Data penelitian berasal dari 365 mahasiswa lulusan tahun 2023 di Fakultas Ilmu Komputer Universitas Duta Bangsa Surakarta, dengan pembagian 50% untuk data pelatihan dan 50% untuk data pengujian.
Atribut yang digunakan mencakup asal kota, pendidikan dan pekerjaan orang tua, penghasilan orang tua.
IPS, serta usia mahasiswa.
Setelah melalui proses preprocessing, data dimasukkan ke dalam model SVM untuk pelatihan dan pengujian.
Hasil evaluasi menggunakan Confusion Matrix menunjukkan nilai akurasi 0,86.
Precision 0,86.
Recall 0,99, dan F1-Score 0,92.
Temuan menunjukkan bahwa fitur keluarga, seperti pekerjaan dan pendidikan orang tua, memiliki kontribusi signifikan terhadap kelulusan mahasiswa tepat waktu.
Penelitian ini menyarankan implementasi model SVM untuk membantu pihak universitas mengantisipasi risiko ketidaktepatan waktu kelulusan mahasiswa, serta merekomendasikan penelitian lanjutan dengan penanganan data yang tidak seimbang untuk meningkatkan hasil prediksi.
Penelitian yang dilakukan oleh M Riski Qisthiano dengan judul "Klasifikasi Terhadap Prediksi Kelulusan Mahasiswa dengan Menggunakan Metode Support Vector Machine (SVM)" .
dilakukan dengan menggunakan data dari beberapa perguruan tinggi di Kota Palembang.
Data yang digunakan mencakup jurusan, perguruan tinggi setiap mahasiswa, jenis kelas, nilai semester, tahun lulus, dan angkatan.
Metode SVM digunakan untuk melakukan klasifikasi apakah mahasiswa tersebut lulus tepat waktu atau tidak.
Alat bantu yang digunakan dalam penelitian ini adalah Rapidminer, dan penelitian ini menggunakan teknik 5 kali K-Fold Validation untuk membagi data menjadi data training dan testing.
Hasil dari penelitian ini menunjukkan bahwa model SVM yang digunakan memiliki akurasi sebesar 85.
06%, yang menunjukkan efektivitas SVM dalam klasifikasi data kelulusan mahasiswa.
Penelitian ini memberikan wawasan yang berguna bagi universitas untuk meningkatkan tingkat kelulusan tepat waktu mahasiswa dengan mengimplementasikan intervensi yang tepat berdasarkan prediksi yang dihasilkan oleh model SVM.
Penelitian yang dilakukan oleh Satrio Junaidi dan juga kawan-kawan yang berjudul AuKlasifikasi Metode Data Mining untuk Prediksi Kelulusan Tepat Waktu Mahasiswa dengan Algoritma Nayve Bayes.
Random Forest.
Support Vector Machine (SVM) dan Artificial Neural Nerwork (ANN)Ay membahas tentang klasifikasi metode data mining untuk prediksi kelulusan tepat waktu mahasiswa menggunakan empat algoritma utama: Nayve Bayes.
Random Forest.
Support Vector Machine (SVM), dan Artificial Neural Network (ANN).
Penelitian ini menggunakan atribut seperti jenis kelamin, penghasilan orang tua, lama bimbingan, status mahasiswa bekerja atau tidak, nilai dari semester 1 sampai semester 8, dan IPS.
Data diolah menggunakan Python 3 di Jupyter Notebook pada Anaconda, dengan dataset dibagi menjadi 70% untuk data latihan dan 30% untuk data pengujian.
Hasil menunjukkan bahwa algoritma Progresif: Vol.
No.
Agustus 2025: 768-779 Progresif e-ISSN: 2685-0877 SVM memberikan akurasi terbaik dengan nilai 0.
94, yang menunjukkan efektivitasnya dalam memprediksi kelulusan tepat waktu mahasiswa.
Penelitian ini memberikan wawasan baru dan berguna bagi perguruan tinggi untuk mengantisipasi dan mengelola kelulusan mahasiswa yang tidak tepat waktu, sehingga dapat meningkatkan kualitas pendidikan dan akreditasi institusi.
Penelitian yang dibuat oleh Andi Iwan Nurhidayat dan kawan-kawan ini membahas prediksi kinerja akademik mahasiswa menggunakan metode machine learning, khususnya Support Vector Machine (SVM) dengan algoritma Sequential Minimal Optimization (SMO), di Jurusan Teknik Informatika Universitas Negeri Surabaya.
Penelitian bertujuan untuk membuat model prediksi kinerja akademik mahasiswa yang mencakup kelulusan tepat waktu dan IPS sebagai parameter utama.
SMO digunakan untuk meningkatkan efisiensi pemrosesan data dan mengatasi keterbatasan SVM pada optimasi kuadratik, dengan hasil penelitian menunjukkan akurasi sebesar 93,94%, presisi 94,7%, dan Recall 94,7%.
Penelitian ini menggunakan dataset dari mahasiswa lulusan tahun 2015 hingga 2017 sebanyak 330 data, yang dibagi menjadi data pelatihan dan pengujian dengan teknik percentage split 80%-20%.
Proses analisis melibatkan preprocessing data, transformasi data kategori ke numerik, dan seleksi atribut untuk memastikan validitas model.
Penggunaan kernel pada SVM seperti Polynomial Kernel.
Radial Basis Function, dan Linear Kernel mempermudah pemisahan data non-linear secara optimal.
Selain itu, penelitian ini membandingkan metode SMO dengan algoritma regresi logistik untuk evaluasi performa.
Evaluasi dilakukan menggunakan Confusion Matrix dengan menghitung akurasi, presisi.
Recall, dan F-measure.
Meskipun hasil penelitian menunjukkan akurasi yang tinggi, peneliti merekomendasikan penggunaan dataset yang lebih besar dan penambahan variabel baru seperti asal sekolah atau lokasi geografis untuk meningkatkan detail hasil.
Penelitian ini mendukung pengembangan sistem evaluasi akademik berbasis data mining yang dapat membantu pengelolaan program studi di perguruan tinggi.
Berdasarkan tinjauan pustaka, terdapat beberapa gap yang menjadi dasar penelitian ini.
Pertama, penelitian sebelumnya cenderung memisahkan faktor akademik dan sosial dalam prediksi kelulusan.
Misalnya.
Wijiyanto et al meneliti faktor keluarga.
, sedangkan Haryatmi et fokus pada IPS dan SKS.
Penelitian ini menggabungkan keduanya, dengan menyoroti IPS dan status putra daerah/non-putra daerah, yang belum banyak dikaji.
Kedua, penelitian terdahulu menggunakan dataset dari berbagai universitas dengan rentang waktu yang berbeda, seperti M Riski Qisthiano et al.
di Kota Palembang dan Haryatmi et al.
pada data 2009Ae 2016, yang dapat mempengaruhi akurasi model.
Penelitian ini menggunakan dataset terbaru .
1Ae2.
dari Universitas Sepuluh Nopember Papua, agar hasilnya lebih relevan dengan kondisi akademik saat ini.
Ketiga, meskipun SVM sering dibandingkan dengan metode lain seperti Nayve Bayes dan Decision Tree, penelitian yang secara spesifik menyoroti SVM dengan kernel linier masih terbatas.
Junaidi et al.
membahas SVM, tetapi tidak menyoroti keunggulan kernel linier dalam klasifikasi akademik.
Oleh karena itu, penelitian ini berfokus pada kernel linier, karena hubungan antara IPS dan status mahasiswa diperkirakan bersifat linier.
Keempat, banyak penelitian membuktikan efektivitas SVM, tetapi belum banyak yang membahas penerapan hasil prediksi dalam kebijakan akademik universitas.
Oleh karena itu, penelitian ini tidak hanya meningkatkan akurasi prediksi, tetapi juga memberikan rekomendasi berbasis data agar hasil model dapat digunakan untuk intervensi dini bagi mahasiswa yang berisiko terlambat lulus.
Dengan mengatasi gap ini, penelitian ini bertujuan untuk mengembangkan model prediksi kelulusan tepat waktu menggunakan SVM dengan kernel linier, yang lebih terintegrasi, relevan, dan dapat diterapkan dalam kebijakan akademik Metodologi Menggunakan metode kuantitatif dalam penelitian prediksi kelulusan mahasiswa di Universitas Sepuluh Nopember sangat efektif karena pendekatan ini memungkinkan analisis data yang objektif dan sistematis, menawarkan presisi dan konsistensi yang tinggi.
Dengan teknik statistik dan model pembelajaran Support Vector Machine (SVM), dapat mengidentifikasi faktor-faktor kunci yang mempengaruhi kelulusan tepat waktu dan mengembangkan model prediktif yang akurat.
Pendekatan ini juga memfasilitasi penanganan data dalam jumlah besar, yang ideal untuk institusi pendidikan dengan banyak data mahasiswa, memungkinkan evaluasi yang efisien dan implementasi strategi intervensi yang berbasis data untuk meningkatkan tingkat kelulusan.
Adapun gambar tahapan dan langkah langkah nya dapat di lihat pada Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan 772 e-ISSN: 2685-0877 Gambar 1.
Tahapan penelitian .
Pengumpulan Data Data dikumpulkan secara sistematis, mencakup nama mahasiswa.
Indeks Prestasi Semester (IPS) dari semester 1 hingga 4, serta status sebagai OAP (Orang Asli Papu.
atau non-OAP.
Sumber data utama berasal dari sistem informasi akademik universitas guna memastikan keakuratan dan kelengkapan data.
Pengelolaan data Setelah data diperoleh, langkah berikutnya adalah mengelola data sesuai kebutuhan Proses ini mencakup pembersihan data untuk menghilangkan anomali, pengorganisasian data berdasarkan kategori yang relevan, serta transformasi data sesuai format yang dibutuhkan untuk analisis lebih lanjut.
Pengelolaan data ini bertujuan untuk menyediakan dataset yang terstruktur dan siap untuk tahap analisis serta pemodelan .
Analisis Eksploratif Dilakukan analisis statistik deskriptif untuk memahami distribusi data, tren akademik mahasiswa, serta mendeteksi pola atau outlier yang dapat mempengaruhi hasil prediksi.
Visualisasi data digunakan untuk memperoleh wawasan lebih lanjut mengenai hubungan antar variabel.
Pemodelan Statistik dan Machine learning Pada tahap ini, diterapkan model statistik atau algoritma machine learning, seperti Support Vector Machine (SVM), untuk mengembangkan prediksi kelulusan mahasiswa.
Proses ini mencakup pemilihan fitur yang relevan, pelatihan model, serta validasi model guna memastikan performa yang optimal dalam prediksi kelulusan.
Evaluasi Model Kinerja model diukur menggunakan metrik evaluasi, seperti akurasi.
Area Under Curve Receiver Operating Characteristic (AUC-ROC), serta Confusion Matrix.
Dari Confusion Matrix, dihasilkan metrik tambahan seperti Accuracy (Akuras.
Precision (Presis.
Recall (Sensitivity/True Positive Rat.
, dan F1-Score, yang digunakan untuk menilai tingkat keakuratan serta keandalan model prediktif.
Evaluasi ini sangat penting untuk memastikan bahwa model mampu memprediksi kelulusan mahasiswa dengan tingkat akurasi yang Support Vector Machine Support Vector Machine (SVM) dapat dijelaskan sebagai metode untuk mencari hyperplane terbaik yang berfungsi sebagai pemisah antara dua kelas pada ruang input.
Dalam klasifikasi.
SVM berusaha menemukan hyperplane yang dapat memisahkan kedua kelompok pattern, di mana pattern yang tergabung pada kelas negatif disimbolkan dengan kotak, dan kelas positif disimbolkan dengan lingkaran.
Hyperplane pemisah terbaik dapat ditemukan dengan mengukur margin, yaitu jarak antara hyperplane dengan data terdekat dari masingmasing kelas, dan mencari titik maksimal dari margin tersebut.
Data yang paling dekat dengan hyperplane tersebut disebut sebagai support vector.
SVM merupakan metode klasifikasi supervised yang melibatkan dua versi:
Linear: Menggunakan hyperplane garis lurus untuk memisahkan kelas.
Non-linear: Menggunakan fungsi kernel untuk memetakan data ke dimensi lebih tinggi, memungkinkan pemisahan non-linear.
Kernel seperti RBF, polinomial, dan MLP sering digunakan untuk mengatasi kompleksitas data dunia nyata yang umumnya non-linear.
Hampir semua dataset pada kehidupan nyata bersifat non-linear, sehingga untuk mengklasifikasikan data tersebut.
SVM menggunakan pendekatan kernel.
Kernel adalah fungsi yang memetakan fitur data dari dimensi awal ke dimensi yang lebih tinggi, berbeda dengan metode klasifikasi umum yang mengurangi dimensi untuk menyederhanakan komputasi dan meningkatkan akurasi prediksi.
Metode SVM juga banyak digunakan dalam klasifikasi untuk Progresif: Vol.
No.
Agustus 2025: 768-779 Progresif e-ISSN: 2685-0877 analisis sentimen dan dapat mempelajari pengklasifikasi seperti radial basis functional (RBF), polinomial, dan multi-layer perceptron (MLP).
Adapun berikut rumus SVM.
ycA yc = ycycnyciycu( yuycn ycycn ya ycuycn , ycu yc.
ycn=1 Keterangan:
: Koefisien Lagrange yang dioptimalkan selama pelatihan.
: Label kelas ( 1 atau Oe.
: Data pelatihan.
: Fungsi kernel yang menghitung kesamaan antara data pelatihan : Bias, ditentukan dari solusi optimasi.
dan data baru Kernel SVM Rumus Dasar Kernel pada SVM digunakan untuk menangani data non-linear dengan memetakan data dari ruang asli ke ruang berdimensi lebih tinggi.
Ide utamanya adalah menggunakan fungsi kernel untuk menghitung produk dalam ruang dimensi tinggi tanpa secara eksplisit melakukan transformasi data, sehingga menghemat komputasi.
Fungsi kernel didefinisikan sebagai:
ya ycuycn , ycuyc = OI.
cuycn )ycN OI.
cuyc ) .
Confusion Matrix Confusion Matrix adalah alat evaluasi dalam pembelajaran mesin yang menampilkan jumlah prediksi benar dan salah dalam empat kategori: True Positive (TP).
False Positive (FP).
True Negative (TN), dan False Negative (FN).
Matriks ini digunakan untuk menghitung metrik evaluasi seperti akurasi, presisi, recall, dan F1-Score, yang penting dalam menilai performa model klasifikasi.
Dalam analisis klasifikasi.
TP menunjukkan data positif yang diklasifikasikan benar.
TN adalah data negatif yang diklasifikasikan benar, sementara FP .
alat Tipe I) terjadi saat data negatif diprediksi sebagai positif, dan FN .
alat Tipe II) terjadi saat data positif diprediksi sebagai negatif.
Dengan Confusion Matrix, distribusi kesalahan model dapat dianalisis guna mengoptimalkan strategi klasifikasi dan meningkatkan akurasi prediksi.
Pentingnya Confusion Matrix dalam berbagai bidang analisis data, terutama dalam klasifikasi berbasis machine learning.
Misalnya, dalam kategorisasi akademis untuk memprediksi keberhasilan siswa.
Confusion Matrix digunakan untuk menilai keakuratan prediksi sistem, apakah siswa akan lulus tepat waktu berdasarkan kriteria yang telah ditentukan sebelumnya.
Dengan memahami distribusi kesalahan yang terkait dengan Confusion Matrix, pengoptimalan dapat dilakukan pada model klasifikasi yang digunakan, ini akan menghasilkan hasil yang lebih akurat dan praktis daripada prediksi yang dibuat oleh Confusion Matrix.
Dalam evaluasi model klasifikasi.
Confusion Matrix menghasilkan metrik utama seperti Accuracy.
Precision.
Recall, dan F1-Score, yang mengukur keberhasilan prediksi model.
Accuracy menunjukkan persentase prediksi yang benar dari keseluruhan data yang diuji dan dirumuskan sebagai:
ycaycaycaycycycaycayc = ycNycE ycNycA ycNycE ycNycA yaycE yaycA Di samping itu.
Precision digunakan untuk mengukur ketepatan model dalam mengklasifikasikan sampel positif, yaitu seberapa banyak dari prediksi positif yang benar-benar Precision dirumuskan sebagai:
ycyycyceycaycnycycnycuycu = ycNycE ycNycE yaycE Sementara itu.
Recall .
uga dikenal sebagai Sensitivity atau True Positive Rat.
mengukur sejauh mana model mampu mendeteksi kelas positif dari seluruh data yang sebenarnya positif.
Rumusnya adalah:
ycyceycaycaycoyco = ycNycE ycNycE yaycA Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan e-ISSN: 2685-0877 Terakhir.
F1-Score merupakan ukuran keseimbangan antara Precision dan Recall, yang dirumuskan sebagai rata-rata harmonis dari kedua metrik tersebut:
F1 ycycaycuycyce = 2 y ycyceycaycaycoyco y ycyycyceycaycnycycnycuycu ycyceycaycaycoyco y ycyycyceycaycnycycnycuycu Area Under the Curve (AUC) AUC adalah metrik evaluasi yang mengukur kemampuan model klasifikasi dalam membedakan antara kelas positif dan negatif.
Secara grafis.
AUC merepresentasikan luas area di bawah kurva ROC (Receiver Operating Characteristi.
, yang memplot hubungan antara True Positive Rate (TPR) dan False Positive Rate (FPR) pada berbagai threshold.
Semakin besar nilai AUC, semakin baik model dalam membedakan kedua kelas tersebut.
Nilai AUC berkisar antara 0 hingga 1, di mana nilai mendekati 1 menunjukkan kinerja model yang sangat baik, sedangkan nilai mendekati 0,5 mengindikasikan kinerja yang setara dengan tebakan acak.
Cross-Validation (Evaluasi Stabilitas Mode.
Cross-Validation adalah teknik yang digunakan untuk mengevaluasi kinerja model dengan membagi dataset menjadi beberapa subset atau "fold".
Salah satu metode yang umum digunakan adalah K-Fold Cross-Validation, di mana data dibagi menjadi k subset.
Model dilatih menggunakan k-1 subset dan diuji pada subset yang tersisa.
Proses ini diulang sebanyak k kali, dengan setiap subset digunakan sekali sebagai data uji.
Teknik ini membantu dalam mengurangi bias evaluasi dan memastikan bahwa model memiliki kinerja yang konsisten di berbagai subset data.
Selain itu.
Cross-Validation membantu dalam mendeteksi masalah overfitting dan memastikan bahwa model dapat digeneralisasi dengan baik ke data yang tidak terlihat sebelumnya.
Data yang di kelola Adapun berikut data yang akan digunakan sebagai dataset dapat di lihat pada tabel 1
NPM
Angkatan A A Tabel 1.
Data 2018-2022
IPS 1 IPS 2 IPS 3 IPS 4
3,41
3,09
3,78
3,19
3,09
3,13
3,35
0,95
3,32
3,35
3,85
2,98
3,27
3,70
3,65
2,90
3,45
3,57
3,93
2,88
1,55
0,52
0,00
0,00
0,35
0,92
2,68
0,00
0,52
0,16
1,28
0,00
2,40
1,60
0,00
0,00
1,96
1,60
0,42
0,29
OAP/Non-OAP Non-OAP
OAP
Non-OAP
Non-OAP
Non-OAP
Non-OAP
OAP
Non-OAP
Non-OAP
OAP
Keterangan:
NPM
= Nomor Pokok Mahasiswa
IPS
= Indeks Prestasi Semester IPK = Indeks Prestasi Kumulatif OAP/Non-OAP = Status mahasiswa sebagai Orang Asli Papua (OAP) atau Non-OAP.
Hasil dan Pembahasan Pada penelitian ini, model Support Vector Machine (SVM) dengan kernel linear digunakan untuk memprediksi kelulusan mahasiswa berdasarkan data Indeks Prestasi Semester (IPS) dari angkatan 2018 hingga 2022.
Proses evaluasi dilakukan dalam dua tahap utama: Tahap 1 (Pengujian Model pada Angkatan 2018-2.
dan Tahap 2 (Prediksi Kelulusan pada Angkatan 2021-2.
Progresif: Vol.
No.
Agustus 2025: 768-779 Progresif e-ISSN: 2685-0877 Tahap 1 (Pengujian Model pada Angkatan 2018-2.
Adapun tahapan 1 yang menggunakan data dari 2018-2020 untuk pengujian model dapat dilihat pada gambar 2.
Dataset dibagi menjadi 80% data latih dan 20% data uji menggunakan metode train-test split.
Gambar 2.
Pengujian Model pada Angkatan 2018-2020 Setelah model dilatih menggunakan data latih, dilakukan evaluasi menggunakan data uji.
Berikut hasil evaluasi model pada tahap ini:
Evaluasi model Evaluasi dilakukan menggunakan Accuracy.
Precision.
Recall, dan F1-Score untuk melihat seberapa baik model dalam memprediksi kelulusan mahasiswa.
Hasil evaluasi ditunjukkan pada Tabel berikut:
Tabel 2.
Evaluasi model tahapan 1 Metrik Nilai Accuracy Precision Recall F1-Score Mean CV Accuracy 0.
Dari hasil di atas, dapat dilihat bahwa model memiliki akurasi yang cukup tinggi sebesar 92%, menunjukkan bahwa model dapat mengklasifikasikan mayoritas mahasiswa dengan Recall yang mencapai 100% menunjukkan bahwa model tidak melewatkan mahasiswa yang benar-benar lulus (False Negative = .
Namun, nilai Precision = 86% menunjukkan bahwa masih terdapat False Positive, yaitu mahasiswa yang diprediksi lulus tetapi sebenarnya tidak lulus.
Evaluasi Menggunakan Confusion Matrix Adapun berikut evaluasi model menggunakan Confusion Matrix dapat di lihat pada Gambar 3.
Confusion Matrix tahapan 1 Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan e-ISSN: 2685-0877 Berdasarkan tabel di atas:
True Positive (TP) = 19, menunjukkan bahwa sebanyak 19 mahasiswa lulus terprediksi dengan benar sebagai lulus.
False Positive (FP) = 3, menunjukkan bahwa terdapat 3 mahasiswa yang diprediksi lulus padahal sebenarnya tidak lulus.
True Negative (TN) = 14, menunjukkan bahwa 14 mahasiswa tidak lulus terprediksi dengan benar sebagai tidak lulus.
False Negative (FN) = 0, menunjukkan bahwa tidak ada mahasiswa yang seharusnya lulus tetapi diprediksi tidak lulus, yang berarti Recall mencapai 100%.
Evaluasi Menggunakan ROC Curve dan AUC Score Selain evaluasi metrik dasar, model diuji menggunakan ROC Curve dan AUC (Area Under the Curv.
untuk melihat kemampuannya dalam membedakan mahasiswa yang lulus dan tidak ROC Curve merupakan kurva yang menunjukkan hubungan antara True Positive Rate (TPR) dan False Positive Rate (FPR).
Semakin tinggi AUC, semakin baik model dalam membedakan antara mahasiswa yang lulus dan tidak lulus.
Pada tahap ini, nilai AUC yang diperoleh sangat tinggi, yang menunjukkan bahwa model memiliki kemampuan klasifikasi yang sangat baik.
Ini berarti bahwa model dapat secara efektif memprediksi mahasiswa yang akan lulus dan yang tidak lulus dengan tingkat kesalahan yang Adapun berikut visualisasi dapat di lihat pada gambar 4 Gambar 4.
ROC Curve .
Tahap 2 Prediksi Model pada Angkatan 2021-2022 Setelah model diuji pada tahap pertama dan menunjukkan performa yang baik, model yang telah dilatih kemudian digunakan untuk memprediksi kelulusan mahasiswa angkatan Pada tahap ini, data mahasiswa tahun 2021-2022 digunakan sebagai data prediksi, tanpa mengetahui hasil kelulusan aktualnya.
Hasil Prediksi Kelulusan Mahasiswa Angkatan 2021-2022 Berdasarkan hasil prediksi, mahasiswa dikelompokkan ke dalam dua kategori, yaitu Lulus dan Tidak Lulus, berdasarkan hasil klasifikasi dari model.
Distribusi hasil prediksi dapat divisualisasikan dalam bentuk grafik, yang menunjukkan proporsi mahasiswa yang diprediksi lulus dan tidak lulus.
Selain itu, model diuji kembali menggunakan Cross-Validation, untuk memastikan bahwa model tetap stabil dan dapat digeneralisasi terhadap data mahasiswa Hasil evaluasi tetap menunjukkan Mean CV Accuracy yang tinggi, yang mengindikasikan bahwa model tetap dapat memprediksi dengan baik meskipun diterapkan pada data mahasiswa angkatan baru.
Adapun berikut hasil evaluasi model.
Tabel 3.
Evaluasi model tahapan 2 Metrik Nilai Accuracy Precision Recall F1-Score Mean CV Accuracy 0.
Progresif: Vol.
No.
Agustus 2025: 768-779 Progresif e-ISSN: 2685-0877 Hasil Cross-Validation pada Tahap 2 menunjukkan bahwa model memiliki akurasi yang stabil di berbagai subset data, dengan skor .
00, 0.
9722, 0.
9167, 0.
9722, 0.
dan Mean CV Accuracy sebesar 0.
%).
Nilai ini menegaskan bahwa model tidak mengalami overfitting dan tetap akurat serta andal dalam memprediksi kelulusan mahasiswa angkatan .
Evaluasi Menggunakan Confusion Matrix Adapun hasil evaluasi yang divisualisaikan menggunakan Confusion Matrix dapat di lihat pada gambar 5.
Gambar 5.
Confusion Matrix tahapan 2 .
Evaluasi Menggunakan ROC Curve dan AUC Score Evaluasi lebih lanjut dilakukan menggunakan ROC Curve dan AUC Score.
Hasil menunjukkan bahwa model masih memiliki AUC yang tinggi, yang berarti model tetap memiliki kemampuan diskriminatif yang baik terhadap mahasiswa angkatan 2021-2022.
Gambar 6.
ROC Curve .
Visualisasi OAP dan Non OAP Grafik menunjukkan prediksi kelulusan tepat waktu berdasarkan kategori OAP dan NonOAP.
Sebagian besar mahasiswa, baik OAP maupun Non-OAP, diprediksi tidak lulus tepat waktu, dengan proporsi ketidaklulusan lebih tinggi pada Non-OAP.
Pembahasan Hasil penelitian ini menunjukkan bahwa algoritma Support Vector Machine (SVM) dengan kernel linier mampu memprediksi kelulusan tepat waktu dengan akurasi tinggi, sejalan dengan penelitian Haryatmi et al.
Junaidi et al.
, dan Qisthiano .
yang juga mencatat performa unggul SVM dalam klasifikasi akademik.
Keunggulan studi ini terletak pada integrasi dua variabel pentingAiIPS dan status OAP/non-OAPAiyang belum banyak dikombinasikan dalam penelitian terdahulu, seperti pada Wijiyanto et al.
yang hanya menyoroti aspek keluarga, atau Haryatmi et al.
yang fokus pada data akademik.
Selain itu, penekanan pada Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan 778 e-ISSN: 2685-0877 penggunaan kernel linier memberikan kejelasan bahwa pendekatan ini efektif untuk data dengan relasi linier antar variabel .
Temuan ini memperkaya literatur dengan model yang lebih komprehensif dan relevan untuk kebijakan akademik berbasis data.
Simpulan Penelitian ini menunjukkan bahwa Support Vector Machine (SVM) dengan kernel linear dapat memprediksi kelulusan tepat waktu mahasiswa dengan akurasi tinggi dan stabilitas yang Pada Tahap 1, model memiliki akurasi 92% dengan Recall sempurna .
, meskipun masih terdapat False Positive.
Pada Tahap 2, model tetap stabil dengan Mean Cross-Validation Accuracy 97%, membuktikan bahwa model tidak mengalami overfitting dan dapat melakukan prediksi pada data baru dengan baik.
Evaluasi menggunakan Confusion Matrix dan ROC Curve juga menegaskan bahwa model memiliki kemampuan klasifikasi yang sangat baik.
Hasil penelitian ini dapat digunakan sebagai alat bantu akademik untuk mengidentifikasi mahasiswa yang berisiko tidak lulus tepat waktu, sehingga intervensi akademik dapat dilakukan lebih awal.
Namun, penelitian ini masih terbatas pada variabel IPS, sehingga penelitian selanjutnya disarankan untuk menambahkan variabel baru dan membandingkan model dengan algoritma lain untuk meningkatkan akurasi prediksi.
Daftar Referensi .
Marcelina.
Aziz, and Y.
Manoppo.
AuSistem Pendukung Keputusan Memprediksi Kelulusan Mahasiswa Informatika Menggunakan Metode Simple Additive Weighting,Ay J.
Inf.
dan Teknol.
, vol.
5, no.
4, pp.
73Ae77, 2023, doi: 10.
60083/jidt.
Irhamna Rachman.
Mujadilah.
Wahyuni, and L.
Anas.
AuPrediksi Tingkat Kelulusan Menggunakan K-Means Pada Program Studi Informatika Unismuh Makassar,Ay J.
Fasilkom, 13, no.
3, pp.
504Ae510, 2023, doi: 10.
37859/jf.
Andriani.
Nazir.
Candra.
Syafria, and I.
Afrianty.
AuImplementasi Algoritma KNearest Neighbor Untuk Menentukan Klasifikasi Kelulusan Mahasiswa Teknik Informatika,Ay Comput.
Syst.
Informatics, vol.
4, no.
4, pp.
922Ae930, 2023, doi:
47065/josyc.
Fatkhudin.
Febrianto.
Artanto.
Hadinata, and R.
Fahlevi.
AuAlgoritma Decision Tree C.
45 Dalam Analisa Kelulusan Mahasiswa Program Studi Manajemen Informatika Umpp,Ay J.
Ilm.
Ilmu Komput.
, vol.
8, no.
2, pp.
83Ae86, 2022, doi:
35329/jiik.
Rahmayanti.
Rusdiana, and S.
Suratno.
AuPerbandingan Metode Algoritma C4.
5 Dan Nayve Bayes Untuk Memprediksi Kelulusan Mahasiswa,Ay Walisongo J.
Inf.
Technol.
, vol.
1, pp.
11Ae22, 2022, doi: 10.
21580/wjit.
Khaerunnisa.
AuAnalisis Tingkat Kelulusan Mahasiswa di Unisba dengan menggunakan Algoritma K-Means Clustering,Ay J.
Ris.
Mat.
, pp.
67Ae76, 2022, doi: 10.
29313/jrm.
Rudianto.
Kania, and T.
Solihati.
AuPrediksi Kelulusan Mahasiswa Teknik Informatika Universitas Banten Jaya Menggunakan Algoritma Neural Network,Ay J.
Sist.
Inf.
dan Inform.
, vol.
5, no.
2, pp.
193Ae200, 2022, doi: 10.
47080/simika.
Suhada.
Elanda, and A.
Aziz.
AuKlasifikasi Predikat Tingkat Kelulusan Mahasiswa Program Studi Teknik Informatika dengan Menggunakan Algoritma C4.
5 (Studi Kasus:
STMIK Rosma Karawan.
,Ay Dirgamaya J.
Manaj.
dan Sist.
Inf.
, vol.
1, no.
2, pp.
14Ae27, 2021, doi: 10.
35969/dirgamaya.
Gadi Ana Amas.
Kopong Pati.
Ema Ose Sanga.
Informatika, and S.
Stella Maris Sumba.
AuJESCE (Journal of Electrical and System Control Engineerin.
Penerapan KOptimal Pada Algoritma KNN Untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Teknik Informatika Application of K-Optimal in the KNN Algorithm to Predict Timely Graduation ,Ay Jesce, vol.
7, no.
2, pp.
92Ae97, 2024, doi: 10.
31289/jesce.
Mahar.
Vihi Atina, and Nugroho Arif Sudibyo.
AuPemodelan Prediksi Kelulusan Mahasiswa Dengan Metode Nayve Bayes Di Uniba,Ay J.
Manaj.
Inform.
dan Sist.
Inf.
, vol.
2, pp.
148Ae158, 2023, doi: 10.
36595/misi.
Haryatmi and S.
Pramita Hervianti.
AuPenerapan Algoritma Support Vector Machine Untuk Model Prediksi Kelulusan Mahasiswa Tepat Waktu,Ay J.
RESTI (Rekayasa Sist.
Teknol.
Informas.
, vol.
5, no.
2, pp.
386Ae392, 2021, doi: 10.
29207/resti.
Satrio Junaidi.
Valicia Anggela, and D.
Kariman.
AuKlasifikasi Metode Data Mining untuk Prediksi Kelulusan Tepat Waktu Mahasiswa dengan Algoritma Nayve Bayes.
Random Progresif: Vol.
No.
Agustus 2025: 768-779 Progresif e-ISSN: 2685-0877 Forest.
Support Vector Machine (SVM) dan Artificial Neural Nerwork (ANN),Ay J.
Appl.
Comput.
Sci.
Technol.
, vol.
5, no.
1, pp.
109Ae119, 2024, doi: 10.
52158/jacost.
M Riski Qisthiano.
AuKlasifikasi Terhadap Prediksi Kelulusan Mahasiswa Dengan Menggunakan Metode Support Vector Machine (Sv.
,Ay Semin.
Nas.
Teknol.
Multidisiplin Ilmu, vol.
2, no.
2, pp.
203Ae207, 2022, doi: 10.
51903/semnastekmu.
Wijiyanto and S.
Sopingi.
AuKontribusi Keluarga Dalam Prediksi Mahasiswa Lulus Tepat Waktu Menggunakan Model Support Vector Machine,Ay DutaCom, vol.
17, no.
1, pp.
25Ae36, 2023, doi: 10.
47701/dutacom.
Nurhidayat.
Asmunin, and D.
Suyatno.
AuPrediksi Kinerja Akademik Mahasiswa Menggunakan Machine Learning dengan Sequential Minimal Optimization untuk Pengelola Program Studi,Ay J.
Inf.
Eng.
Educ.
Technol.
, vol.
5, no.
2, pp.
84Ae91, 2021, doi:
26740/jieet.
Putri et al.
AuKomparasi Algoritma K-NN.
Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir,Ay MALCOM Indones.
Mach.
Learn.
Comput.
Sci.
3, no.
1, pp.
20Ae26, 2023, doi: 10.
57152/malcom.
Nugroho.
Santoso, and A.
Murtopo.
AuPrediksi Kemampuan Akademik Mahasiswa dengan Metode Support Vector Machine,Ay Remik, vol.
7, no.
1, pp.
177Ae188, 2023, doi: 10.
33395/remik.
Nasrullah.
Saedudin, and F.
Hamami.
AuPerbandingan Akurasi Algoritma C4.
Dan K-Nearest Neighbors Untuk Klasifikasi Curah Hujan Berdasarkan Iklim Indonesia,Ay JIPI (Jurnal Ilm.
Penelit.
dan Pembelajaran Inform.
, vol.
9, no.
2, pp.
628Ae638.
May 2024, doi: 10.
29100/JIPI.
V9I2.
Naseer.
Sarwido, and B.
Wahono.
AuGradient Boosting Optimization With Pruning Technique For Prediction Of Bmt Al-Hikmah Permata Customer Data,Ay J.
Inform.
Teknol.
dan Sains, vol.
6, no.
3, pp.
719Ae727.
Aug.
2024, doi:
51401/JINTEKS.
V6I3.
Indransyah.
Chrisnanto.
Sabrina, and S.
Kom.
AuKlasifikasi Sentimen Pergelaran Motogp Di Indonesia Menggunakan Algoritma Correlated Nayve Bayes Clasifier,Ay INFOTECH J.
, vol.
8, no.
2, pp.
60Ae66.
Oct.
2022, doi:
31949/INFOTECH.
V8I2.
Singgalen.
AuAnalisis Performa Algoritma NBC.
DT.
SVM dalam Klasifikasi Data Ulasan Pengunjung Candi Borobudur Berbasis CRISP-DM,Ay Build.
Informatics.
Technol.
Sci.
, vol.
4, no.
3, pp.
1634Oe1646-1634Oe1646.
Dec.
2022, doi: 10.
47065/BITS.
V4I3.
Wijiyanto.
Pradana.
Sopingi, and V.
Atina.
AuTeknik K-Fold Cross Validation untuk Mengevaluasi Kinerja Mahasiswa,Ay J.
Algoritm.
, vol.
21, no.
May 2024, doi:
33364/algoritma/v.
Penerapan Metode Support Vector Machine Untuk Memprediksi a.
Avif Setyawan