Jurnal Infortech Volume 7 No. 1 Juni 2025 E-ISSN: 2715-8160 Penerapan Algoritma Naive Bayes Pada Penerimaan Santri Baru Pendidikan Pondok Pesantren Yopi Handrianto1*. Muadz Zidan AlWafi2 Universitas Bina Sarana Informatika e-mail: yopi. yph@bsi. id, 2muadzzidan123@gmail. Diterima 11-03-2025 Direvisi 05-05-2025 Disetujui 12-06-2025 Abstrak - Penerimaan santri baru merupakan tahapan penting dalam sistem pendidikan di sekolah formal maupun di pondok pesantren. Di beberapa pondok pesantren proses penerimaan santri baru sering kali dilakukan secara manual, sehingga rentan terhadap kesalahan data dan penilaian subjektif, yang menyebabkan hasil dari tes seleksi tidak akurat. Seperti yang terjadi di pesantren Shalahuddin Al-Ayyubi Kabupaten Bekasi. Penelitian ini bertujuan untuk membantu pengelola pesantren menetapkan kelulusan tes seleksi santri baru dengan menerapkan algoritma nayve bayes dalam proses penerimaan santri baru, supaya hasil dari tes seleksi bisa lebih akurat dan Penelitian menggunakan pendakatan kuantitatif dengan memanfaatkan data awal sebanyak 47 record, yang dibagi menjadi data testing, 80% untuk data pelatihan dan 20% untuk data pengujian. Hasil penelitian menunjukkan bahwa algoritma nayve bayes mampu memberikan akurasi sebesar 88. 89%, dengan precision sebesar 66,67%, recall sebesar 100% dan nilai AUC sebesar 1,000. Dari hasil prediksi, 7 santri dinyatakan diterima dan 2 santri tidak diterima. Terbukti bahwa algoritma Nayve Bayes memiliki tingkat akurasi yang tinggi serta mampu memberikan hasil prediksi yang valid dan terukur. Kata Kunci: Penerimaan Santri Baru. Pesantren. Algoritma Nayve Bayes Abstract - The admission of new students is an important stage in the education system in formal schools and in Islamic boarding schools. In some Islamic boarding schools, the process of accepting new students is often carried out manually, so it is prone to data errors and subjective assessments, which causes the results of the selection test to be inaccurate. As happened at the Shalahuddin Al-Ayyubi Islamic boarding school. Bekasi Regency. This research aims to help pesantren managers determine the passing of the new student selection test by applying the nayve bayes algorithm in the process of accepting new students, so that the results of the selection test can be more accurate and computerized. The study used quantitative training by utilizing 47 initial data, which was divided into testing data, 80% for training data and 20% for testing data. The results show that the nayve bayes algorithm is able to provide an accuracy of 88. 89%, with a precision of 66. 67%, a recall of 100% and an AUC value of 1,000. From the prediction results, 7 students were declared accepted and 2 students were not accepted. It is proven that the Nayve Bayes algorithm has a high level of accuracy and is able to provide valid and measurable prediction results Keywords: Admission of New Students. Islamic Boarding School. Nayve Bayes. PENDAHULUAN Pesantren Shalahuddin Al-Ayyubi Bekasi menghadapi tantangan dalam proses seleksi santri baru karena masih menggunakan metode manual. Hal ini menyebabkan subjektivitas dalam penilaian dan berpotensi terjadi kesalahan data. Oleh karena itu, penerapan teknologi dalam proses seleksi santri menjadi solusi yang dapat meningkatkan efisiensi dan Sistem yang dapat mengotomatisasi proses penerimaan siswa baru menjadi semakin penting seiring dengan kemajuan teknologi informasi http://ejournal. id/ejurnal/index. php/infortech (Sunarto & Rosyani, 2. Penggunaan metode analisis berbasis algoritma dapat menjadi solusi untuk meningkatkan efisiensi dan akurasi dalam proses penerimaan santri. Naive Bayes adalah metode klasifikasi yang mengacu pada teorema Bayes dan menganggap setiap atribut bersifat independen, memungkinkan setiap atribut memberikan kontribusi terhadapa nilai pada variabel kelas secara terpisah (Rachman & Handayani, 2. Kelebihan dari Algoritma Nayve Bayes diimplementasikan, memerlukan jumlah data sedikit yang dibutuhkan untuk klasifikasi dan lebih cepat Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 dalam perhitungan (Arfanda et al. , 2. Algoritma ini dapat digunakan untuk menganalisis berbagai kriteria penerimaan, seperti nilai tes, prestasi akademik, kehadiran dalam tes wawancara, hingga latar belakang keluarga. Dengan menerapkan Algoritma Nayve Bayes, pondok pesantren dapat menyaring calon santri dengan lebih akurat dan meminimalisir subjektivitas dalam proses seleksi. Data mining merupakan salah satu konsentrasi ilmu di bidang statistika dan komputer dengan tujuan akhir melakukan ekstraksi data dari sebuah set data menggunakan metode yang cerdas, dan merubah data tersebut dalam struktur yang komprehensif untuk penggunaan lebih lanjut (Wahyuddin et al. , 2. Terdapat berbagai teknik dalam data mining yang dimanfaatkan untuk menggali pola serta pengetahuan dari sekumpulan data, diantaranya : (Rahayu et al. , 2. Klasifikasi (Classificatio. Melalui metode ini, data diklasifikasikan ke dalam kelompok atau kategori tertentu berdasarkan atribut atau karakteristik yang dimilikinya. Contoh teknik yang digunakan antara lain Decision Tree. Artificial Neural Network, dan algoritma klasifikasi Regresi (Regressio. Regresi dimanfaatkan untuk membentuk model hubungan antara variabel independen dan dependen. Teknik ini berfungsi untuk memperkirakan nilai kontinu berdasarkan pola hubungan linier maupun non-linier di antara variabel-variabel tersebut. Klastering (Clusterin. Klastering merupakan proses pengelompokan data ke dalam klaster berdasarkan kemiripan atribut atau fitur tertentu. Contoh metode yang termasuk dalam teknik ini adalah algoritma K-Means dan Hierarchical Clustering. Asosiasi (Associatio. Teknik ini dimanfaatkan untuk mengidentifikasi keterkaitan atau asosiasi antar item atau variabel dalam suatu himpunan data. Algoritma populer seperti Apriori dan Eclat digunakan untuk mengekstraksi aturan asosiasi dari data transaksional. Nayve Bayes adalah metode prediktif yang memanfaatkan prinsip probabilitas sederhana berdasarkan teorema Bayes, dengan asumsi adanya independensi kuat antar variabel. Menurut Bayes . erutama Nayve Baye. , independensi yang kuat pada fitur berarti bahwa ada atau tidaknya fitur lain dalam data yang sama tidak mempengaruhi fitur pada data (Muttaqin et al. , 2. http://ejournal. id/ejurnal/index. php/infortech RapidMiner, yang kini dikenal sebagai Altair Ai Studio, adalah perangkat lunak opensource yang digunakan sebagai solusi untuk melakukan analisis prediktif, data mining dan text mining. Untuk membatu pengguna membuat pilihan terbaik. RapidMiner menggunakan berbagai teknik prediksi dan deskripsi. RapidMiner menyediakan lebih dari 500 operator untuk keperluan data mining, yang mencakup fungsi input, output, pra-pemrosesan data, serta visualisasi (Dennis, 2. METODOLOGI PENELITIAN Tahapan pada penelitian ini sebagai berikut: Identifikasi Masalah Mengidentifikasi Permasalahan yang ditangani dalam penelitian ini berhubungan dengan proses penerimaan santri baru yang masih dilakukan secara manual, sehingga memerlukan sistem yang lebih efektif untuk membantu pengambilan keputusan. Studi Literatur Tahap ini melibatkan kajian terhadap literatur atau penelitian-penelitian sebelumnya yang relevan dengan topik penerimaan santri baru dan teknik yang akan digunakan, yaitu algoritma Nayve Bayes. Pengumpulan Data Pengumpulan data dilakukan dengan mengumpulkan informasi serta data yang diperlukan untuk membangun model penerimaan santri menggunakan algoritma Nayve Bayes. Pengolahan Data Setelah data terkumpul, proses pengolahan dilakukan untuk membersihkan data, mentransformasi data, membagi data menjadi data pelatihan dan data pengujian agar sesuai dengan kebutuhan analisis menggunakan algoritma Nayve Bayes. Menentukan Hasil Akurasi Data Mengukur performa model Nayve Bayes yang telah dibuat dalam memprediksi calon santri yang layak Akurasi model dihitung untuk menilai seberapa baik model dapat bekerja dalam proses seleksi santri baru berdasarkan data yang ada. Kesimpulan Tahap terakhir adalah menyimpulkan hasil penelitian berdasarkan hasil analisis dan evaluasi yang telah Kesimpulan ini mencakup penjelasan tentang efektivitas model Nayve Bayes dalam membantu proses penerimaan santri serta saran untuk pengembangan sistem yang lebih baik dimasa depan. Populasi dalam penelitian ini adalah seluruh calon santri yang mendaftar di pesantren Shalahuddin AlAyyubi selama periode 2023-2025. Data populasi ini mencakup data-data pendaftar seperti: Nilai tes tulis . es psikologi, akademi. Nilai tes Al-Quran . afalan, bacaan dan Hasil wawancara. Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 HASIL DAN PEMBAHASAN Hasil dari penelitian mencangkup penerapan algoritma naive bayes untuk menentukan penerimaasn santri baru di pondok pesantren Shalahuddin Al-Ayyubi, pengolahan data dilakukan dengan menggunakan software Altair Ai Studio 0, berikut data yang akan digunakan pada penelitian yang dilakukan . ihat Gambar . Data yang sudah terkumpul dilakukan preprocessing data melalui beberapa tahapan, yaitu: Data Cleaning Pada tahap data cleaning, terdapat beberapa faktor yang dapat memengaruhi kualitas data, seperti nilai yang hilang . issing valu. , data duplikat, dan Namun, berdasarkan hasil pemeriksaan dataset ini, tidak ditemukan adanya nilai yang hilang, data duplikat, maupun outliers. Transformation Data Tahap ini bertujuan untuk mengubah jenis format file atau tipe data dari masing-masing atribut pada dataset ini. Split Data Pembagian data menjadi dua bagian yaitu data pelatihan dan data pengujian. Pada dataset ini menggunakan rasio 80% data pelatihan dan 20% data Data yang sudah melewati tahap pengolahan data/pre-processing data selanjutnya diterapkan ke dalam proses model Nayve Bayes dengan menggunakan beberapa operator seperti terlihat pada Gambar 2. Evaluasi model menggunakan confusion matrix akan menghasilkan matrix yang terdiri dari True Positive. True Negative. False Positive Dan False Negative. Matrix tersebut dapat dilihat pada Gambar Berdasarkan Gambar 3 menunjukkan bahwa jumlah True Positive (TP) sebanyak 2. False Negative (FN) sebanyak 0. False Positive (FP) sebanyak 1 dan True Negative (TN) sebanyak 6. Dari data tersebut nilai Accuracy. Precision dan Recall dapat dihitung secara manual sebagai berikut: Accuracy = (TP TN)/(TP TN FP FN) . 6 1 . = . 6 1 . = 8/9 = 0,8889 = 88. Precision = TP/(TP FP) . )/. = 2/3 = 0,6667 = 66. Recall = TP/(TP FN) . )/. = 2/2 = 1 = Untuk menilai kinerja algoritma Naive Bayes, digunakan grafik Receiver Operating Characteristic (ROC) dan nilai Area Under Curve (AUC). ROC adalah grafik yang menunjukan hubungan antara Rate Positif Benar (TPR) dan Rate Negatif Positif (FPR) pada berbagai nilai ambang (Lihat Gambar . http://ejournal. id/ejurnal/index. php/infortech Terlihat pada Gambar 4 bahwa kurva hampir sempurna mendekati sudut kiri atas grafik. Hal ini menunjukkan bahwa model memiliki tingkat akurasi yang sangat tinggi dalam membedakan antara data calon santri yang LULUS dan TIDAK LULUS. Nilai AUC (Area Under Curv. yang diperoleh 000, yang berarti bahwa model memiliki kemampuan prediksi yang sempurna. Dengan kata Model mampu mengidentifikasi seluruh calon santri yang benar-benar LULUS (True Positiv. tanpa memberikan prediksi salah terhadap calon yang TIDAK LULUS (False Positiv. Nilai AUC = 1. 000 menunjukkan bahwa algoritma Nayve Bayes bekerja dengan optimal pada dataset yang digunakan. Dengan data awal sebanyak 47 record yang kemudian dilakukan pembagian untuk data testing sebanyak 9 record terbukti algoritma Nayve Bayes dapat menghasilkan akurasi yang sangat baik sebesar Yaitu 7 santri diterima dan 2 santri tidak KESIMPULAN Berdasarkan dilakukan, algoritma Nayve Bayes terbukti mampu memberikan hasil yang sangat baik dalam menentukan penerimaan santri baru. Dengan data awal sebanyak 47 record, dilakukan pembagian untuk data testing sebanyak 9 record. Algoritma Nayve Bayes menghasilkan akurasi sebesar 88. Precision sebesar 66. Recall sebesar 100. dan nilai AUC sebesar 1. Dari hasil prediksi, 7 santri diterima dan 2 santri tidak diterima. Algoritma Nayve Bayes memiliki tingkat akurasi yang tinggi serta mampu memberikan hasil prediksi yang valid dan terukur sehingga dapat dijadikan rekomendasi untuk pengambilan keputusan dalam proses peneriman santri baru dilingkungan pondok pesantren. Implementasi sistem prediksi berbasis Nayve Bayes diintegrasikan kedalam sistem informasi pesantren agar pengambilan keputusan dapat dilakukan secara real-time dan terdokumentasi dengan baik. Selain itu, penelitian ini dapat dijadikan sebagai dasar untuk pengembangan sistem rekomendasi santri baru berbasis kecerdasan buatan dimasa mendatang. REFERENSI