Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Perbandingan Algoritma Naive Dan Bayes Logistic Regression Untuk Penerimaan Siswa Baru (Studi Kasus Calon Siswa SMA Negri 1 Brebe.
Ria Indah Fitria .
,Rizki Prasetyo Tulodo .
Nur Tulus Ujianto .
,Ali Sofian .
Jurusan Informatika.
Universitas Pancasakti Tegal ria_indah@upstegal.
Abstrak Di SMA (Sekolah Menengah Ata.
, siswa biasanya belajar dalam selama tiga tahun, meliputi kelas 10, 11, dan 12.
Siswa biasanya berusia antara 15 hingga 18 tahun selama masa ini.
SMA merupakan tahap penting dalam pendidikan di Indonesia karena siswa diharapkan memperoleh pengetahuan dan keterampilan yang lebih.
SMA juga mempersiapkan siswa untuk ujian nasional yang biasanya diambil pada akhir tahun Hasil ujian nasional ini penting untuk menentukan kelayakan siswa untuk melanjutkan ke pendidikan tinggi, baik di universitas maupun institusi pendidikan Pendaftaran di SMA memiliki beberapa kriteria.
Misalnya .
Apakah tempat tinggal calon siswa dengan sekolah jaraknya lebih dekat .
, .
nilai ratarata dalam 3-5 semester pada raport , dan .
Calon siswa memiliki prestasi baik itu non akademik atau akademik.
Calon siswa yang memenuhi 3 kriteria diatas maka akan diterima di SMA.
Dalam penelitian penulis membandingkan kedua algoritma dan metode adalah Algoritma Naive Bayes dan logistic regresi.
Kata Kunci Sekolah Menengah Atas (SMA).
Pendaftaran, katagori.
Naive Bayes dan logistic Pendahuluan Sekolah Menengah Atas (SMA) merupakan Pendidikan yang khususnya mempersiapkan siswa lulusanya siap berkerja atau ingin melanjutkan kuliah.
Kebanyakan siswa SMA akan siap berkerja saat lulus nanti atau melanjutkan ke jenjang kuliah.
SMA dirancang oleh pemerintah untuk mengembangkan keterampilan siswa,kemampuan dalam berkomunikasi siswa, sikap yang di tanamkan siswa agar saat berkerja memiliki sopan santun, disiplin siswa juga di latih agar berkerja lebih disiplin, dan apresiasi yang diperlukan dalam dunia kerja agar siswa mendapatkan pekerjaan yang layak sesuai dengan bidang mereka masing Ae Dalam dunia Pendidikan peran siswa disekolah sangatlah penting dalam memajukan Jika kualitas muridnya menurun maka kualitas siswa yang diperoleh sekolah akan sangat menurun, oleh karena itu dalam penerimaan sekolah harus ada kriteria yang membantu dalam Kriteria yang ada dibuat oleh sekolah ada 3 kreteria, misalnya .
Tempat jarak tinggal calon siswa dekat dengan sekolah, .
nilai rata- rata raport dan .
Prestasi non akademik atau Ketiga kriteria tersebut mambantu sekolah dalam menentukan siswa yang berkualitas.
Di sekolah bukan hanya nilai yang baik tetapi keterampilan juga sangan penting untuk terbentuknya siswa yang berkualitas.
Maka dari itu sekolah memberikan fasilitas yang baik untuk menunjang system pembelajaran.
Contohnya untuk jurusan IPA (Ilmu Pengetahuan Ala.
sekolah memberikan laboratorium kimia yang berisi bahan atau praktek kimia untuk membantu siswa dalam pembuatan cairan atau larutan dalam pembelajaran.
Selain kualitas siswa yang baik.
Sekolah juga meninggkatkan mutu tenaga pendidik lebih baik.
Banyak lulusan dari universitas terbaik yang berkerja di sekolah.
Misalnya saja guru Bahasa Indonesia kebanyakan adalah lulusan dari sekolah negri di Indonesia atau guru matematika yang memiliki banyak sekali piagam dalam mengajar sesuai dengan bidangnya dan masih banyak guru yang memiliki kualitas terbaik di sekolah SMA tersebut.
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Untuk meningkatkan kualitas guru, sekolah mencari tenaga pengajar yang lulus Pendidikan S1 sampai dengan S3 untuk tenaga mengajar.
Sekolah menginginkan siswa yang ada di sekolah memiliki kualitas yang baik agar nama sekolah akan menjadi baik dalam masyarakat.
Selain siswa yang berkualitas tentu saja tenaga pengajar juga merupakan tenaga pengajar yang professional sesuai dengan bidangnya.
Landasan Teori Pada Tahun 2016 Kurniawan.
, melakukan penelitian pada salah satu universitas di Indonesia salah satunya adalah di Fakultas Ilmu Komputer (FILKOM).
Penelitian yang digunakan adalah hadoop dengan menerapkan nayve bayes yang dianggap mampu menghasilkan klasifikasi yang akurat, sehingga dapat mempermudah seorang dosen dalam pemilihan asisten pratikum dengan kualitas yang baik.
Pada Tahun 2016 Triowali Rosandy.
Melakukan Penelitian salah satu algoritma klasifikasi yang digunakan adalah menggunakan metode Algoritma Nayve Bayes dan decision tree .
Tetapi kelemahan yang dihadapi pada kedua algoritma tersebut adalalah lamanya waktu dan tingkat akurasi prediksi yang digunakan untuk melakukan prediksi.
AeHasil penelitian yang dihasilkan dari kedua algoritma adalah menganalisis prediksi pembiayaan yang di gunakan pada Bank di Indonesia.
Pada Tahun 2016 Ibnu.
melakukan menelitian menggunakana metode regresi logistic untuk menghasilkan taksiran probabilitas munculnya peristiwa skor 1 paada variable kriteria.
Regresi logistik memiliki model serupa dengan model regresi linier, yakni p(Y=.
tetapi dengan konsep dan pemaknaan yang berbeda, yakni logit.
= 0 .
Untukmengevaluasi apakah model regresi logistik cocok dengan data dapat dilakukan denganUji Wald, yang pada dasarnya merupakan N2 yang menguji apakah pengaruh masingmasingprediktor signifikan dalam memprediksi probabilitas terjadinya peristiwa padavariabel output.
Pada Tahun 2018 Wahyuni dkk .
Melakukan Penelitian Peningkatan Akademik (PPA) merupakan salah satu beasiswa dengan jumlah peminat yang cukup banyak.
Data dari bagian Akademik FMIPA UNNES menunjukan bahwa jumlah peminat atau penyusul beasiswa PPA tahun 2015 di FMIPA UNNES sebesar 670 mahasiswa.
Analisis data dalam penelitian ini menggunakan metode regrresi logistic.
Metode Penelitian Dalam Penelitian menggunkan jenis Perbandingan Kedua algoritma yang kemudian melakukan pengujian tingkat akurasi perbandingan algoritma untuk seleksi penerimaan calon siswa di SMA.
Data tersebut diambil dari data calon siswa di SMA Negri 1 Brebes Brebes.
Penelitian ini menggunakan data dari SMA Negri 1 Brebes.
Data yang dibutuhkan adalah : jumlah data 36 siswa dan atribut yang dibutuhkan seperti nomer nis.
L/P, jumlah un, rata-rata un, asal sekolah, alamat rumah, prestasi akademik.
Atribut atribut tersebut diambil pada data calon penerimaan siswa di SMA.
Data Kemudian dikelola unruk mendapatkan atribut mana saja yang relefan dan sesuai dengan format algoritma soft computing perbandingan sesuai dengan menggunakan tools rapid miner.
Sampel data untuk pengolahan pada rapid miner adalah data calon penerimaan siswa baru di SMA.
SMA Negri 1 Brebes pada tahun ajaran 2021/2022.
Sampel data berjumlah 36 siswa terdiri dari 16 perempuan dan 20 laki Ae laki.
Metode yang di usulkan Metode yang di usulkan adalah pembanding antara logistic regression dan nayve bayes untuk mendeteksi permasalahan menyeleksi penerimaan siswa baru pada SMA Negeri 1 Brebes.
Adapun kriteria adalah .
Apakah tempat tinggal calon siswa dengan sekolah jaraknya lebih dekat .
, .
nilai rata- rata dalam 3-5 semester pada raport , dan .
Calon siswa memiliki prestasi Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
baik itu non akademik atau akademik Dari kedua algoritma tersebut yang memiliki akurasi yang lebih tinggi, maka akurasi yang lebih tinggi itu menunjukan bahwa metodenya lebih baik.
Gambar 1.
1 Metode yang diusulkan Dari gambar diatas menunjukan bahwa metode yang diusulkan menunjukan alur proses yang terjadi pada rapit miner.
Dataset calon siswa SMA di prose pada rapid miner yang kemudian rapit miner memasukan algoritma yang akan di hitung.
Disini menggunakan algoritma nayve bayes dan logistic regresi.
Kedua algoritma tersebut divalidasi, validasi ada dua yang pertama training data gunanya untuk mengecek apakah data ada yang kosong atau terdapat missing dalam data dan kedua akan dilakukan testing data.
Pada testing data disini dataset akan dihitung berdasarkan algoritma yang tadi di bandingkan.
Setelah di hitung maka akan muncul hasil evaluasi atau hasil akhir dari perhitungan.
Evaluasi terdiri dari 4 yang antara lain: acsurasi, recall, precission, dan AUC.
Metode yang digunakan adalah untuk desain komparasi dua algoritma, dimana objek penelitian yang diambil dari calon siswa SMA Negri 1 Brebes pada tahun 2021 dan tahun 2022 yang berupa data dari excel selanjutnya ditransportasikan ke aplikasi rapid miner.
Sampel terdapat 36 siswa diantaranya perempuan 16 dan laki Ae laki 20 dengan menggunakan aplikasi rapidminer data diolah mengunakan dua metode algoritma.
Dalam pengujian metode komparasi algoritma dari hasil ekspresi.
Mengunakan aplikasi rapitminer untuk dapat yang lebih baik.
Dari hasil pengujian kedua algoritma akan diketahui algoritma manakah yang memiliki tingkat akurasi yang tinggi.
Evaluasi melakukan pengamatan dan sekalias menganalisi hasil perbandingan algoritma.
Validasi mengukur hasil deteksi klasifikasi permasalahan seleksi calon siswa menggunakan precision dan recall menakah hasilnya yang memiliki keakuratan atau presentasi yang tinggi.
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 1.
2 use case Nayve Bayes dan logistic regression Gambar 1.
2 adalah alur yang terjadi dalam applikasi rapid miner untuk menjelaskan bagaimana algoritma nayve bayes dan logistic regression diproses kemudian database di validasi dan hasil dari validasi adalah nilai keakuratan dari metode tersebut.
Rapid miner menganalisis hasil secara otomatis dan menghitung berapa presentasi yang di peroleh.
Hasil Penelitian Dan Pembahasan Kesimpulan Dari penerapan menggunakan komparasi algoritma untuk klasifikasi seleksi penerimaan siswa di SMA dengan menggunakan rapit miner maka akan dapat dilihat bahwa algoritma Nayve Bayes menunjukan hasil akurasi yang lebih baik dibandingkan dengan algoritma logistic regression Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 3.
1 Tabel dataset calon siswa SMA Gambar di samping merupakan database calon siswa di SMA, data calon siswa ini nantinya akan dikelola dalam perhitungan algoritma Naive Bayes.
Perhitungan yang nantinya hasil akurasi dari algoritma Naive Bayes akan dibandingkan dengan algoritma Regresi Logistik.
Diantara dua algoritma tersebut manakah yang memiliki akuratsi yang lebih besar.
Algoritma Nayve Bayes Algoritma Naive Bayes adalah salah satu metode klasifikasi yang populer dalam ilmu data dan pembelajaran mesin.
Algoritma ini didasarkan pada teorema Bayes dengan asumsi bahwa fiturfitur yang digunakan dalam klasifikasi adalah independen satu sama lain.
Meskipun asumsi ini sering kali tidak terpenuhi di dunia nyata.
Naive Bayes masih sering digunakan karena sederhana dan cepat serta memberikan hasil yang cukup baik dalam banyak kasus.
Berikut adalah langkah-langkah umum untuk mengimplementasikan algoritma Naive Bayes:
Pemilihan Model Pemilihan Fitur Pelatihan Model Prediksi Evaluasi Model .
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 3.
2 Tabel Accurassi Nayve Bayes Gambar disamping adalah gambar akurasi dari algoritma nayve bayes.
Pada gambar jelas tertera bahwa acurassi nayve bayes memiliki presentasi sebesar 97.
Dalam pengukuran hasil penelitian menggunakan metode precision, recall, dan akurasi sedangkan untuk klasifikasi yang digunakan untuk melakukan pengukuran didapatkan dari hasil data calon siswa dari SMA sebanyak 36 siswa Analisis Receiver Operating Characteristic (ROC) adalah metode yang umum digunakan untuk mengevaluasi performa model klasifikasi.
ROC biasanya digunakan untuk mengukur seberapa baik model dapat membedakan antara kelas positif dan negatif dengan memvariasikan ambang batas .
Tabel 3.
1 Klasifikasi Pengujian Diagnostik Nilai AUC Klasifikasi 9 Ae 1.
Excellent Classification 8 Ae 0.
Good Classification 7 Ae 0,8 Fair Classification 6 Ae 0.
Poor Classification 5 Ae 0.
Failure Classification Tabel 3.
1 menunjukkan klasifikasi hasil perhitungan nilai AUC.
Area Under the Curve (AUC) adalah metrik evaluasi yang umum digunakan dalam analisis kurva ROC (Receiver Operating Characteristi.
untuk mengukur kinerja model klasifikasi.
Nilai AUC berkisar antara 0 hingga 1, di mana semakin dekat ke 1 menunjukkan kinerja model yang lebih baik dalam membedakan antara kelas positif dan negatif.
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 3.
3 Performance Vector Nayve Bayes Gambar disamping adalah gambar hasil perhitungan dari rapit miner berdasarkan performance vectornya.
Digambar tersebut di jelaskan berapa hasil recall, percession dan akursi dari algoritma Nayve bayes.
Gambar 3.
4 Grafik presentasi berdasarkan status calon siswa Gambar 3.
4 merupakan gambar presentasi yang di tunjukan perhitungan nayve bayes.
Dari gambar disamping bisa dilihat bahwa garis berwarna biru lebih dominan disbanding garis warna Garis biru merupakan garis yang menandakan bahwa siswa tersebut di terima di SMA, sedangkan untuk garis biru adalah garis di tolak yang menandakan bahwa siswa tersebut di tolak / tidak di terima sebagai siswa di SMA Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 3.
5 Klaster diterima dan di tolak semua atribut pada algoritma Nayve Bayes Gambar 3.
5 adalah gambar klister atau penggolongan semua atribut yang menyatakan di tolak dan diterima.
Untuk lingkaran biru adalah diterima atau lolos menjadi siswa SMA, sedangkan untuk lingkaran merah adalah di tolak yang artinya tidak di terima sebagai siswa SMA.
Dari klister tersebut terlihat jelas bahwa tingkat diterima sangat besar dibandingkan dengan di tolak.
Yang artinya kualitas dari calon siswa yang mendaftar merupakan siswa yang berprestasi dan memiliki jarak yang tidak begtu jauh dari tempat tinggalnya.
Algoritma Regresi Logistik Algoritma Regresi Logistik adalah salah satu metode statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen .
dengan variabel dependen biner .
untuk tujuan klasifikasi.
Regresi logistik menghitung probabilitas bahwa suatu observasi akan termasuk dalam salah satu dari dua kategori atau kelas.
Berikut adalah langkah-langkah umum dalam menggunakan algoritma Regresi Logistik:
Pemilihan Variabel: Tentukan variabel independen yang akan digunakan untuk memprediksi variabel dependen biner.
Pastikan variabel independen yang dipilih relevan dengan tujuan analisis.
Persiapan Data: Siapkan data Anda dengan melakukan pembersihan data, pengkodean variabel kategori menjadi variabel dummy jika diperlukan, dan pemisahan data menjadi set pelatihan .
raining se.
dan set pengujian .
est se.
Spesifikasi Model: Tentukan model regresi logistik yang sesuai dengan masalah Anda, termasuk apakah akan memasukkan interaksi antar variabel dan bagaimana menangani variabel yang tidak relevan atau kolinearitas.
Estimasi Parameter: Gunakan metode seperti Metode Maksimum Likelihood untuk mengestimasi parameter model regresi logistik dari data pelatihan.
Evaluasi Model: Evaluasi kinerja model Anda menggunakan metrik seperti akurasi, presisi, recall.
F1-score, dan area di bawah kurva ROC (AUC).
Gunakan set pengujian untuk menguji bagaimana model Anda berkinerja pada data yang belum pernah dilihat Penyetelan Model: Jika diperlukan, lakukan penyetelan model dengan mengubah parameter-model atau mencoba berbagai kombinasi variabel untuk meningkatkan kinerja Penggunaan Model: Setelah Anda puas dengan kinerja model Anda.
Anda dapat menggunakannya untuk melakukan prediksi pada data baru dengan menggunakan variabel independen yang relevan.
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar 3.
6 Akurasi algoritma regresi logistic Gambar disamping adalah gambar akurasi dari algoritma regresi logistik.
Pada gambar jelas tertera bahwa acurassi nayve bayes memiliki presentasi sebesar 88.
Perhitungan akurai algoritma regresi logistic adalah :
TP = 23
Fp = 3 Fn-1 Tn=8 Precision = TP/(TP FP) 23/.
= 88.
Recall = TP / (TP FN) 23 / .
= 72.
Akurasi
= (TP TN) / (TP TN FP FN)
= 0,8833
Error rate = (FP FN) / (TP TN FP FN) = 0,021 Gambar 3.
7 Performance Vektor regresi logistik Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
Gambar disamping adalah gambar hasil perhitungan dari rapit miner berdasarkan performance Digambar tersebut di jelaskan berapa hasil recall, percession dan akursi dari algoritma regresi logistik.
Gambar 3.
8 Karnel Model Gambar disamping adalah gambar hasil karnel model pada algoritm regesi logistik.
Digambar tersebut di jelaskan model karnel perhitungan peratribut dalam datasetnya.
Hasilnya perhitungannya adalah sebagai berikut :
NO = 0.
NIS = 0.
L/P = 0.
jml un = 0.
rata2 un = 0.
Asal Sekolah = 0.
Alamat Rumah = -0.
Prestasi akademik / non akademik = 2.
Gambar 3.
9 Diagram Ring presentasi berdasarkan status calon siswa Gambar 3.
9 merupakan gambar presentasi yang di tunjukan perhitungan regresi logistik.
Dari gambar disamping bisa dilihat bahwa lingkaran berwarna biru lebih dominan disbanding lingkaran warna merah.
lingkaran biru merupakan tanda bahwa siswa tersebut di terima di SMA.
Eengineering Vol.
15 No.
1 April 2024 ISSN : 2087-3859 (Prin.
ISSN : 2549-8614 (Onlin.
sedangkan untuk lingkaran biru adalah tanda jika siswa di tolak dan menyatakan bahwa siswa tersebut di tolak / tidak di terima sebagai siswa di SMA Gambar 3.
10 Klaster diterima dan di tolak semua atribut pada algoritma Regresi Logistik Gambar 3.
10 adalah gambar klister atau penggolongan semua atribut yang menyatakan di tolak dan diterima.
Untuk lingkaran biru adalah diterima atau lolos menjadi siswa SMA, sedangkan untuk lingkaran merah adalah di tolak yang artinya tidak di terima sebagai siswa SMA.
Dari klister tersebut terlihat jelas bahwa tingkat diterima sangat besar dibandingkan dengan di Yang artinya kualitas dari calon siswa yang mendaftar merupakan siswa yang berprestasi dan memiliki jarak yang tidak begtu jauh dari tempat tinggalnya.
Kesimpulan Berdasarkan data di atas, perbandingan dari algoritma Nayve Bayes dan Regresi Logistik bahwa algoritma Nayve bayes lebih memiliki akurasi lebih besar di bandingkan dengan algoritma Regresi Logistik.
Nayve Bayes memiliki akurasi sekitar sebesar 0,9752, dan algoritma regresi logistik sebesar 0,883 untuk mendeteksi pendaftaran siswa baru di SMA Negri 1 Brebes.
Hasil Penelitian Nayve bayes di bandingkan Regresi Logistik memiliki tingkat akurasi yang besar untuk menyeleksi siswa baru, karena akurasinya sangat tinggi membuat para guru menjadi lebih mudah dalam menganalisis datanya.
Daftar Pustaka