Terakreditasi SINTA Peringkat 2 Surat Keputusan Dirjen Penguatan Riset dan Pengembangan Ristek Dikti No. 10/E/KPT/2019 masa berlaku mulai Vol. 1 No. 1 tahun 2017 s. d Vol. 5 No. 3 tahun 2021 Terbit online pada laman web jurnal: http://jurnal. JURNAL RESTI (Rekayasa Sistem dan Teknologi Informas. Vol. 4 No. 95 - 101 ISSN Media Elektronik: 2580-0760 Educational Data Mining untuk Prediksi Kelulusan Mahasiswa Menggunakan Algoritme Nayve Bayes Classifier Edi Sutoyo1. Ahmad Almaarif2 Program Studi Sistem Informasi. Fakultas Rekayasa Industri. Universitas Telkom edisutoyo@telkomuniversity. id, 2ahmadalmaarif@telkomuniversity. Abstract Students are one of the main components in the world of education and are expected to develop academic and non-academic quality as long as they are still students. The quality can be seen from the academic achievements, which are evidence of the efforts made by students. Student academic achievement is evaluated at the end of each semester to determine the learning outcomes that have been achieved. If a student cannot meet certain academic criteria that are stated by fulfilling the requirements to continue his studies, the student may have the potential to not graduate on time or even Drop Out (DO). The high number of students who do not graduate on time or DO in higher education institutions can be minimized by detecting students who are at risk in the early stages of education and is supported by making policies that can direct students to complete their education. Also, if the time for completion of student studies can be predicted then the handling of students will be more effective. One technique for making predictions that can be used is data mining techniques. Therefore, in this study, the Naive Bayes Classifier (NBC) algorithm will be used to predict student graduation at Telkom University. The dataset was obtained from the Information Systems Directorate (SISFO). Telkom University which contained 4000 instance The results of this study prove that NBC was successfully implemented to predict student graduation. Prediction of the graduation of these students is able to produce an accuracy of 73,725%, precision 0. 742, recall 0. 736 and F-measure of Keywords: Data Mining. Classification. Naive Bayes Classifier. Student Graduation Abstrak Mahasiswa merupakan salah satu komponen utama pada dunia pendidikan dan diharapkan dapat mengembangkan kualitas akademik maupun non-akademik selama masih berstatus menjadi mahasiswa. Kualitas tersebut dapat dilihat dari prestasi akademik yang diraih, yang merupakan bukti dari usaha yang dilakukan oleh mahasiswa. Prestasi akademik mahasiswa dievaluasi pada akhir setiap semester untuk menentukan hasil belajar yang telah dicapai. Jika mahasiswa tidak dapat memenuhi kriteria akademik tertentu yang dinyatakan dengan memenuhi syarat untuk melanjutkan studi, mahasiswa tersebut dapat berpotensi untuk tidak lulus tepat waktu atau bahkan Drop Out (DO). Tingginya jumlah mahasiswa yang tidak lulus tepat waktu atau DO di institusi pendidikan tinggi dapat diminimalkan dengan melakukan deteksi mahasiswa yang berisiko pada tahap awal pendidikan dan ditunjang dengan membuat kebijakan yang dapat mengarahkan mahasiswa agar dapat menyelesaikan pendidikannya. Selain itu, jika waktu penyelesaian studi mahasiswa dapat diprediksikan maka penanganan mahasiswa akan lebih efektif. Salah satu teknik melakukan prediksi yang dapat digunakan adalah dengan teknik data mining. Oleh karena itu, pada penelitian ini Algoritme Naive Bayes Classifier (NBC) akan digunakan untuk melakukan prediksi kelulusan mahasiswa di Universitas Telkom. Dataset diperoleh dari Direktorat Sistem Informasi (SISFO). Universitas Telkom yang berisi 4000 data instance. Hasil penelitian ini membuktikan bahwa NBC berhasil diimplementasikan untuk memprediksi kelulusan mahasiswa. Prediksi kelulusan mahasiswa tersebut mampu menghasilkan accuracy sebesar 73. 742, recall 0. 736 dan F-measure sebesar 0. Kata kunci: Data Mining. Klasifikasi. Naive Bayes Classifier. Kelulusan Mahasiswa A 2020 Jurnal RESTI mereka dapat menghasilkan sumber daya manusia yang berpengetahuan, cakap, kreatif, dan kompetitif. Setiap Lembaga pendidikan tinggi dituntut untuk memberikan tahun akademik baru, universitas menyelenggarakan pendidikan yang berkualitas bagi mahasiswa sehingga Pendahuluan Diterima Redaksi : 16-12-2019 | Selesai Revisi : 06-02-2020 | Diterbitkan Online : 08-02-2020 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 proses penerimaan mahasiswa baru. Dilihat dari jumlah kelulusan tepat waktu dapat ditingkatkan dengan peminat dari setiap tahun akademik pendidikan tinggi meningkatkan kualitas pembelajaran dan layanan yang akademik bagi mahasiswa. Selain itu, jika waktu mempengaruhi manajemen kapasitas mahasiswa, salah penyelesaian studi mahasiswa dapat diprediksi, maka satunya adalah keakuratan masa studi mahasiswa penanganan mahasiswa akan lebih efektif. Salah satu mengikuti waktu yang ditentukan. Dalam sistem teknik untuk membuat prediksi yang dapat digunakan pendidikan tinggi, mahasiswa adalah aset penting untuk adalah teknik data mining. Penambangan data lembaga pendidikan, sehingga perlu dipertimbangkan berdasarkan data pendidikan di perguruan tinggi dapat tingkat kelulusan mahasiswa agar tepat waktu. meningkatkan kualitas pembelajaran mahasiswa . Persentase naik turunnya kemampuan mahasiswa untuk Data mining atau penambangan data adalah menyelesaikan studi tepat waktu adalah salah satu serangkaian proses untuk mendapatkan pengetahuan elemen penilaian akreditasi universitas. Untuk alasan atau pola dari kumpulan data . Penambangan data ini, ada kebutuhan untuk dilakukan pemantauan dan akan memecahkan masalah dengan menganalisis data evaluasi kecenderungan bagi mahasiswa untuk lulus yang sudah ada dalam database. Penambangan data tepat waktu atau tidak. sering juga disebut Knowledge Discovery in Databases Secara umum di Indonesia, evaluasi kegiatan akademik (KDD) yaitu suatu aktivitas yang meliputi mahasiswa dinyatakan dalam satuan kredit semester pengumpulan, penggunaan data historis untuk (SKS). SKS adalah sistem penyediaan pendidikan menemukan pola reguler, pola hubungan dalam menggunakan satuan kredit semester dan menggunakan kumpulan data yang besar . Hasil dari penambangan satuan waktu semester yang terdiri dari 2 semester data dapat digunakan untuk meningkatkan pengambilan dalam satu tahun akademik. Mahasiswa dapat keputusan di masa depan. Sejauh ini, terdapat banyak dinyatakan lulus setelah menyelesaikan sejumlah sks penelitian yang berkaitan dengan penambangan data Misalnya, mahasiswa Strata 1 (S. harus dalam tahap pengembangan teori maupun yang telah menyelesaikan 144-160 kredit, dan program Diploma 3 diimplementasikan pada permasalahan dunia nyata, (D. membutuhkan 110-120 SKS. Indeks Prestasi seperti pada area clustering, association rules. Mahasiswa (IPK) adalah angka yang menunjukkan classification, dan conflict analysis . Ae. Penerapan pencapaian kumulatif atau kemajuan belajar unsupervised learning juga telah dilakukan untuk mahasiswa, mulai dari semester pertama hingga clustering data history dari log transaksi pengguna semester terakhir yang telah diambil. Indeks Prestasi internet di website microsoft dan MSNBC dengan Semester (IPS) dan IPK digunakan sebagai kriteria menggunakan kaidah pada soft set theory dan untuk memberikan evaluasi akademik dan evaluasi parameter reduction . , . , . , . Sedangkan studi di akhir program . Mahasiswa diperbolehkan penerapan supervised learning juga telah dilakukan untuk mengambil beban studi kurang dari jumlah untuk klasifikasi batuan berjenis igneous . , minimum beban per semester, tetapi tidak diizinkan klasifikasi dan predikti kualitas air sungai . , untuk mengambil beban studi lebih besar dari jumlah klasifikasi data citra pada bidang medis . , seleksi maksimum yang telah ditentukan. atribut pada dataset yang berpengaruh secara signifikan pada proses pengambilan keputusan . , prediksi Perguruan tinggi perlu mendeteksi perilaku mahasiswa penggunaan minyak dalam kurun waktu tertentu . , sehingga faktor-faktor yang dapat menyebabkan dan peramalan kejadian penyakit demam berdarah . kegagalan mahasiswa dapat diidentifikasi sehingga dapat ditentukan tingkat kelulusan sesuai dengan masa Lebih jauh lagi, data mining yang berfokus pada data studi, termasuk kemampuan akademik yang rendah, dari pendidikan disebut Education Data Mining (EDM) usia masuk perguruan tinggi, indeks prestasi atau . EDM adalah disiplin ilmu yang muncul terkait faktor-faktor lainnya . , . Di setiap tahun ajaran dengan pengembangan metode untuk memperoleh baru, sering terjadi tidak seimbangnya mahasiswa baru informasi tersembunyi dari kumpulan data yang berasal yang masuk dengan mahasiswa yang lulus. Selain itu, dari data pendidikan. Informasi tersembunyi ini jumlah besar penerimaan mahasiswa kadang tidak kemudian dievaluasi sehingga dapat digunakan untuk seimbang dengan jumlah mahasiswa yang lulus tepat mengatasi masalah di dunia pendidikan seperti ewaktu mengikuti ketentuan 4 tahun atau 8 semester. learning, mengukur kinerja mahasiswa, penambangan Akibatnya, ada akumulasi mahasiswa yang signifikan jaringan sosial, memprediksi kegagalan studi, sistem di setiap periode kelulusan sehingga proses pendidikan bimbingan cerdas, penambangan teks, dan sebagainya tidak berjalan optimal. Karena pada kenyataannya, berbagai data di universitas terus bertambah karena meningkatnya Sebagai pendidikan tinggi, mengetahui tingkat jumlah kegiatan akademik dan non-akademik di dunia kelulusan tepat waktu mahasiswa sangat penting. Tujuannya adalah untuk mengetahui kinerja mahasiswa lebih awal, dapat merencanakan program dan langkah Salah satu algoritme klasifikasi yang dapat digunakan strategis sehingga di masa depan dapat meningkatkan untuk melakukan proses klasifikasi dan prediksi dalam tingkat kelulusan mahasiswa tepat waktu . Tingkat EDM adalah Nayve Bayes Classifier (NBC) . NBC Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 telah banyak digunakan untuk berbagai permasalahan 2. Metodologi Penelitian klasifikasi dan prediksi, serta telah terbukti bahwa NBC Gambar 1 menjelaskan metodologi penelitian yang dapat menggapai akurasi lebih tinggi dibandingkan digunakan. Terdapat 5 tahap utama, yaitu algoritme klasifikasi lainnya . Ae. Mccue . preprocessing, splitting dataset, model learning, model melakukan penelitian membandingkan Support Vector testing dan model validation. Pada tahap preprocessing. Machine (SVM) dengan Nayve Bayes dalam hal akurasi terdapat 4 tahap yaitu data collection, feature selection, untuk klasifikasi spam. Hasil yang didapatkan. Nayve preprocess data, dan data normalization. Pada model Bayes mendapatkan hasil yang lebih baik yaitu dengan learning. Nayve Bayes Classifier akan digunakan untuk capaian akurasi 97. 8% dibandingkan dengan SVM proses learning. Sedangkan untuk model testing, kyang mencapai akurasi 96%. Selanjutnya penelitian Fold Cross-Validation akan digunakan untuk proses dari Huang. Hsu dan Lin . yang melakukan membagi antara data training set yang digunakan untuk perbandingan Nayve Bayes. SVM dan C4. 5 Decision model learning dan testing set yang digunakan untuk Tree untuk memprediksi Chronic Fatigue Syndrome model testing. Pada tahap model validation akan (CFS). Hasil dengan digunakan Mean Absolute Error (MAE). Root Mean menggunakan 10-fold cross-validation. Nayve Bayes Squared Error (RMSE) dan Confusion Matrix. Preprocessing mampu mengungguli algoritme SVM dan C4. 5 dalam hal Area Under Curve (AUC). Sensitivity dan Data Feature Preprocess Data Specificity. Penelitian yang dilakukan oleh Aninditya. Collection Selection Data Normalization Hasibuan, dan Sutoyo . menunjukkan bahwa Nayve Bayes yang mampu menghasilkan akurasi sebesar 83% Splitting untuk klasifikasi text mining soal ujian yang disesuaikan dengan level kognitif pada taxonomy Cross Begitu juga Shah dan Jivani . menggunakan Validation Decision Tree. Nayve Bayes, dan K-Nearest Neighbor untuk memprediksi kanker payudara. Penelitian ini juga menunjukkan bahwa Nayve Bayes lebih unggul Model Learning dibandingkan dengan algoritme lainnya dalam hal Naive Bayes akurasi dan waktu yang digunakan untuk eksekusi Classifier Hymylyinen dan Vinni . juga melakukan penelitian untuk memprediksi dan mengklasifikasi keberhasilan siswa dalam belajar dengan menggunakan Model Validation Model Testing data yang terbatas, yaitu 100 baris data. Perbandingan Feature akurasi untuk algoritme Linear Regression (LR). SVM Validation Data Testing Processing dan Naive Bayes dilakukan, hasil menunjukkan bahwa Naive Bayes mampu unggul dengan akurasi 80% Gambar 1. Metodologi Penelitian dibandingkan algoritme lainnya. Oleh karena itu pada penelitian ini, algoritme Nayve Bayes Classifier akan 2. Nayve Bayes Classifier (NBC) digunakan untuk klasifikasi kelulusan mahasiswa Nayve bayes merupakan pengklasifikasian sederhana yang menghitung probabilitas dengan menjumlahkan Universitas Telkom. frekuensi dan nilai dari data yang ada. Nayve Bayes Kelanjutan dari makalah ini disusun sebagai berikut. berdasar kepada teorema bayes yang digunakan untuk Pada Bagian 2 menjelaskan tentang metode penelitian, menghitung probabilitas dari tiap kelas dengan asumsi teori Naive Bayes Classifier, dan metriks pengukuran kelas satu dengan yang lain independen . idak saling performa algoritme, dan penjelasan mengenai dataset tergantun. Definisi lain yaitu Nayve Bayes merupakan yang digunakan beserta metadata-nya. Selanjutnya, metode untuk memprediksi peluang dimasa depan hasil dan pembahasan penelitian akan diuraikan pada berdasarkan dengan pengalaman sebelumnya. Nayve Bagian 3, yang berisi performansi Nayve Bayes Bayes memiliki tingkat akurasi dan kecepatan yang Classifier dan detail pembahasannya. Akhirnya, lebih tinggi saat di aplikasikan kedalam suatu database kesimpulan dari penelitian ini disajikan pada Bagian 4. dengan nilai yang besar . Bentuk Umum dari teorema Bayes adalah . , . Metode Penelitian . Penelitian ini merupakan penelitian berbasis Pada bagian ini menjelaskan tentang Keterangan. : Data dengan class yang belum diketahui metode penelitian, teori Nayve Bayes Classifier, dan : Hipotesis data merupakan suatu class metriks pengukuran performa algoritme seperti Mean Absolute Error (MAE). Root Mean Squared Error : Probabilitas hipotesis berdasarkan kondisi (RMSE), dan confusion matrix. osteriori probabilita. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 menghasilkan nilai yang diprediksi salah memprediksi positif sebenarnya. misal, nilai-nilai negatif diprediksi sebagai positif. Sedangkan FN menghasilkan nilai positif tetapi diprediksi negatif dan TN menghasilkan nilai yang diprediksi dengan tepat diprediksi sebagai Nayve Bayes merupakan penyerdehanaan dari metode negatif aktual. Pada Gambar 2 berikut menjelaskan 4 Teorema Bayes disederhanakan menjadi: hasil dari klasifikasi confusion matrix. : Probabilitas hipotesis . rior probabilita. : Probabilitas berdasarkan kondisi pada : Probabilitas Bayes Rules digunakan untuk menghitung posterior dan probabilitas dari data sebelumnya. Hasil akhirnya akan memberi informasi prior dan posterior untuk menghasilkan probabilitas menggunakan Bayes. Mean Absolute Error (MAE) Mean Absolute Error (MAE) mengukur besarnya nilai Gambar 2. Empat pembagian class pada Confusion Matrix rata-rata kesalahan dalam serangkaian prediksi, tanpa mempertimbangkan arahnya. MAE adalah rata-rata di Dari confusion matrix tersebut dapat dibuat metriks atas sampel uji perbedaan absolut antara prediksi dan pengukuran untuk mendapatkan nilai Accuracy, pengamatan aktual di mana semua perbedaan individu Precision. Recall, dan F-Measure . memiliki bobot yang sama. C| . Root Mean Squared Error (RMSE) . Root Mean Squared Error (RMSE) adalah aturan penilaian kuadrat yang juga mengukur besarnya ratarata kesalahan. RMSE adalah akar kuadrat dari rata-rata perbedaan kuadrat antara prediksi dan observasi aktual. Dataset Dataset diperoleh dari Direktorat Sistem Informasi (SISFO). Universitas Telkom dari mahasiswa dengan . C) Oo Oc( Program Studi Sistem Informasi pada tahun wisuda 2017/2018. Dataset ini berisi 4000 data instances disertai enam . atribut numerik dan satu . label Confusion Matrix Atribut yang digunakan adalah Nilai Indeks Confusion matrix adalah tabel yang digunakan untuk Prestasi Semester (IPS) pada semester pertama. Nilai menggambarkan kinerja model klasifikasi . tau IPS semester kedua. Nilai IPS semester ketiga. Nilai "classifier") pada set data uji yang nilai sebenarnya IPS semester keempat. Nilai IPS semester keenam dan Ini memungkinkan identifikasi yang mudah ditambah dengan class label kelulusan (Tepat Waktu dari kebingungan antar class, misal satu kelas (TW) / Tidak Tepat Waktu (TTW) sebagai label output. umumnya salah diberi label sebagai yang lain. Jumlah Pada class label TW dan TTW, masing-masing terdapat prediksi yang benar dan salah dirangkum dengan nilai- 2000 data instances. Pada proses feature selection, nilai hitung dan dipecah oleh masing-masing class. atribut yang tidak digunakan seperti nama mahasiswa. Confusion matrix menunjukkan cara-cara ketika nomor telepon, alamat email, nama orang tua, klasifikasi bingung menentukan class-nya dalam pekerjaan orang tua, alamat lengkap telah dihapus. membuat prediksi. Ini memberi informasi detail tidak Pada penelitian ini, agar dataset cocok dengan model hanya tentang kesalahan yang dibuat oleh classifier algoritma yang digunakan, proses pengolahan dari raw tetapi lebih penting lagi jenis kesalahan yang dibuat. data menjadi dataset mengikuti langkah-langkah di Confusion matrix memvisualisasikan akurasi classifier Knowledge Discovery in Databases (KDD). Proses dengan membandingkan kelas aktual dan prediksi. KDD ini adalah proses yang interaktif dan berulang. Biner classifier memprediksi semua instance data dari melibatkan banyak langkah, termasuk preprocessing dataset uji sebagai positif atau negatif. Klasifikasi ini data . embersihan dat. dan postprocessing . valuasi menghasilkan empat hasil yaitu True Positive (TP), hasi. Proses KDD tersebut dapat ditunjukkan pada False Positive (FP). True Negative (TN). False Gambar 3. Negative (FN). TP menghasilkan nilai yang diprediksi dengan benar diprediksi sebagai positif actual. FP Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Hasil dan Pembahasan Eksperimen telah dilakukan menggunakan bahasa pemrograman Python yang dijalankan pada komputer dengan spesifikasi Prosesor Intel Core i5 7th Generation, memori RAM sebesar 8GB, kapasitas hard disk 128GB (SSD) 1TB dan Windows 10 sebagai sistem operasi. Dataset dilakukan partisi menjadi dua bagian menggunakan k-Fold Cross-Validation untuk menentukan jumlah data training set dan testing set. Gambar 3. Proses Knowledge Discovery in Databases (KDD) . yang dipakai adalah rentang antara 2 Hasil eksperimen tersebut Data yang telah dikumpulkan kemudian direkapitulasi MAE dan RMSE yang beragam, dan diperoleh analisis deskriptif dari masing-masing pada Gambar 4. Hasil analisis dapat ditunjukkan pada Tabel I. Tabel 1. Sampel Dataset yang Digunakan IPS1 IPS2 IPS3 IPS4 IPS5 IPS6 Label TTW TTW TTW TTW Pada proses analisis, dataset tersebut diubah menjadi bentuk kategorisasi data agar dapat diimplementasikan Gambar 4. Hasil Pengukuran MAE dan RMSE Menggunakan CrossValidation dengan Rentang nilai =2-20 pada algoritme NBC. Pada proses ini, peneliti akan mengklasifikasikan dan mengategorikan masingmasing nilai pada masing-masing atribut. Dalam Berdasarkan pada Gambar 4, dapat diketahui bahwa mengategorikan nilai, digunakan penghitungan dengan nilai MAE dan RMSE terkecil adalah ketika nilai =4. Norma Absolut Skala 5. Adapun rumus penghitungan Sehingga hasil eksperimennya didapatkan nilai MAE dan RMSE adalah 0. 2773 dan 0. 4569, seperti yang tersebut ditampilkan pada Tabel 2. ditampilkan pada Gambar 5. Tabel 2. Konversi Dataset Menjadi Bentuk Kategorisasi Rentang Output Nilai Kategori Kategori Konversi output target aktual ke dalam bentuk representasi huruf dan nilai kategori didasarkan pada distribusi output target. Hasil dari sampel dataset yang Gambar 5. Hasil Pengukuran MAE dan RMSE Menggunakan CrossValidation dengan Nilai =4 digunakan setelah dikonversi menjadi bentuk kategorisasi dapat ditampilkan pada Tabel 3. Tabel 3. Hasil Kategorisasi dari Sampel Dataset IPS1 IPS2 IPS3 IPS4 IPS5 IPS6 Label TTW TTW TTW TTW Gambar 6. Hasil Klasifikasi Confusion Matrix Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Agar hasil dapat diklasifikasikan lebih spesifik, maka menambahkan atribut lain yang berkaitan dengan latar pada penelitian ini juga digunakan confusion matrix. belakang mahasiswa seperti jalur masuk, nilai rapor. Hasil klasifikasi confusion matrix digambarkan pada nilai ujian nasional (UN), nilai ujian sekolah (US) dan Gambar 6. Dari total 2000 data yang mempunyai class atribut lainnya yang dapat meningkatkan akurasi hasil TTW. Nayve Bayes Classifier (NBC) berhasil prediksinya. memprediksi 1319 data, yaitu yang masuk pada hasil True Positive (TP), dan pada class TW. NBC telah Daftar Rujukan berhasil memprediksi sejumlah 1626 data yaitu yang . dan P. Tinggi. Peraturan Menteri Ristek Dan Dikti masuk pada True Negative (TN). Sedangkan pada Type No 44 Tahun 2015 Standar Nasional Pendidikan Tinggi. 1 Error atau FP terdapat 681 data dan pada Type 2 . Murtaugh. Burns, and J. Schuster. AuPredicting the retention of university students,Ay Res. High. Educ. , vol. 40, no. Error atau FN terdapat 374 data. Tabel 4. Hasil Eksperimen Menggunakan Nayve Bayes Classifier Metriks Ukur Hasil Accuracy Precision Recall F-Measure . Seperti yang ditampilkan pada Tabel 4, dari hasil confusion matrix tersebut dapat didapatkan hasil untuk . accuracy, precision, recall dan F-measure. Pada eksperimen ini NBC mampu menghasilkan accuracy . 725% dengan precision 0. 742, recall 0. dan F-measure sebesar 0. Hasil tersebut menunjukkan bahwa NBC dapat digunakan sebagai model untuk prediksi kelulusan mahasiswa, walaupun . akurasi yang didapatkan masih belum memuaskan. Oleh karena itu, penelitian lebih lanjut dimasa depan perlu dilakukan guna memperbaiki tingkat akurasinya. Kesimpulan Pada penelitian ini pengimplementasian Nayve Bayes . Classifier (NBC) untuk prediksi kelulusan mahasiswa telah dilakukan. Penelitian ini menggunakan dataset yang diperoleh dari Direktorat Sistem Informasi (SISFO). Universitas Telkom yang berisi 4000 data instances dengan enam . atribut, seperti Nilai Indeks . Prestasi Semester (IPS) pada semester pertama. Nilai IPS semester kedua. Nilai IPS semester ketiga. Nilai IPS semester keempat. Nilai IPS semester keenam dan . ditambah dengan class label kelulusan Tepat Waktu (TW) / Tidak Tepat Waktu (TTW) sebagai label output. Hasil penelitian menunjukkan bahwa NBC berhasil digunakan untuk mengklasifikasikan kelulusan . mahasiswa dengan accuracy sebesar 73. 725% dengan 742, recall 0. 736 dan F-measure sebesar . Untuk alasan ini, pendidikan tinggi diharapkan dapat merancang program strategis dan memberikan perlakuan khusus kepada siswa yang berisiko pada tahap awal pendidikan untuk meningkatkan prestasi akademik sehingga mahasiswa yang tidak lulus tepat . waktu atau putus sekolah dapat diminimalkan. Rencana kerja masa depan akan berfokus pada evaluasi teknik yang ada dengan tujuan mengembangkan teknik alternatif untuk meningkatkan akurasi, serta 3, pp. 355Ae371, 1999. Myrquez-Vera. Romero Morales, and S. Ventura Soto. AuPredicting school failure and dropout by using data mining techniques,Ay Rev. Iberoam. Tecnol. del Aprendiz. , vol. 8, no. 7Ae14, 2013. Ibrahim and D. Rusli. AuPredicting studentsAo academic performance: comparing artificial neural network, decision tree and linear regression,Ay in 21st Annual SAS Malaysia Forum, 5th September, 2007. Myrquez-Vera. Cano. Romero, and S. Ventura. AuPredicting student failure at school using genetic programming and different data mining approaches with high dimensional and imbalanced data,Ay Appl. Intell. , vol. 38, no. 315Ae330, 2013. Han. Pei, and M. Kamber. Data mining: concepts and Elsevier, 2011. Han. Kamber, and J. Pei. Data Mining: Concepts and Techniques. Sutoyo. Yanto. Saedudin, and T. Herawan. AuA soft set-based co-occurrence for clustering web user transactions,Ay Telkomnika (Telecommunication Comput. Electron. Control. , vol. 15, no. 3, 2017. Sutoyo. Yanto. Saadi. Chiroma. Hamid, and T. Herawan. AuA Framework for Clustering of Web Users Transaction Based on Soft Set Theory,Ay in Springer, 2019, pp. 307Ae314. Yanto. Sutoyo. Apriani, and O. Verdiansyah. AuFuzzy Soft Set for Rock Igneous Clasification,Ay in 2018 International Symposium on Advanced Intelligent Informatics (SAIN), 2018, pp. 199Ae203. Sutoyo. Saedudin. Yanto, and A. Apriani. AuApplication of adaptive neuro-fuzzy inference system and chicken swarm optimization for classifying river water quality,Ay in Electrical. Electronics and Information Engineering (ICEEIE), 2017 5th International Conference on, 2017, pp. 118Ae122. -L. Antonie. Zaiane, and A. Coman. AuApplication of data mining techniques for medical image classification,Ay in Proceedings of the Second International Conference on Multimedia Data Mining, 2001, pp. 94Ae101. Saedudin. Sutoyo. Kasim. Mahdin, and I. Yanto. AuAttribute selection on student performance dataset using maximum dependency attribute,Ay in Electrical. Electronics and Information Engineering (ICEEIE), 2017 5th International Conference on, 2017, pp. 176Ae179. Chiroma et al. AuAn intelligent modeling of oil consumption,Ay Adv. Intell. Syst. Comput. , vol. 320, 2015. Muhajir. Sutoyo, and I. Darmawan. AuForecasting Model Penyakit Demam Berdarah Dengue Di Provinsi DKI Jakarta Menggunakan Algoritma Regresi Linier Untuk Mengetahui Kecenderungan Nilai Variabel Prediktor Terhadap Peningkatan Kasus,Ay Fountain Informatics J. , vol. 4, no. 2, pp. 33Ae40. Nov. Mohammed. Mohd. Arshah. Mungad. Sutoyo, and H. Chiroma. AuAnalysis of Parameterization Value Reduction of Soft Sets and Its Algorithm,Ay Int. Softw. Eng. Comput. Syst. , vol. 2, no. 1, pp. 51Ae57, 2016. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 Edi Sutoyo. Ahmad Almaarif Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101 . Mohammed. Mohd. Arshah. Mungad. Sutoyo, and H. Chiroma. AuHybrid Framework Parameterization Reduction Combination in Soft Set,Ay in The Second International Conference on Advanced Data and Information Engineering (DaEng-2. , 2019, vol. 520, pp. 233Ae243. Romero and S. Ventura. AuEducational data mining: A survey from 1995 to 2005,Ay Expert Syst. Appl. , vol. 33, no. 135Ae146, 2007. Domingos and M. Pazzani. AuOn the Optimality of the . Simple Bayesian Classifier under Zero-One Loss,Ay Mach. Learn. , vol. 29, no. 2Ae3, pp. 103Ae130, 1997. Mccue. AuA Comparison of the Accuracy of Support Vector Machine and Nave Bayes Algorithms In Spam Classification,Ay . 17, 2009. Huang. Hsu, and E. Lin. AuA comparison of classification methods for predicting chronic fatigue syndrome . based on genetic data,Ay J. Transl. Med. , vol. 7, p. 81, 2009. Aninditya. Hasibuan, and E. Sutoyo. AuText Mining Approach Using TF-IDF and Naive Bayes for Classification of Exam Questions Based on Cognitive Level of BloomAos Taxonomy,Ay in 2019 Ie International Conference on Internet of Things and Intelligence System (IoTAIS), 2019. Shah and A. Jivani. AuComparison of data mining classification algorithms for breast cancer prediction,Ay in 2013 4th International Conference on Computing. Communications and Networking Technologies. IcNT 2013, 2013, pp. 4Ae7. Hymylyinen and M. Vinni. AuComparison of machine learning methods for intelligent tutoring systems,Ay Lect. Notes Comput. Sci. ncluding Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatic. , vol. 4053 LNCS, pp. 525Ae534, 2006. Rish. AuAn empirical study of the naive Bayes classifier,Ay in IJCAI 2001 workshop on empirical methods in artificial intelligence, 2001, vol. 3, no. 22, pp. 41Ae46. Olson and D. Delen. Advanced data mining techniques. Springer Berlin Heidelberg, 2008. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas. Vol . 4 No. 95 Ae 101