Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Menentukan Program Studi Bagi Calon Mahasiswa Baru Menggunakan Metode Nayve Bayes Dan Metode Decision Tree Wildani Eko Nugroho1. Teguh Prihandoyo2 Program Studi Di Teknik Komputer. Politeknik Harapan Bersama Tegal. Jalan Mataram No. Pesurungan Lor. Kota Tegal. Provinsi Jawa Tengah. Indonesia, 52143 e-mail: 1wild4n1@gmail. com, 2 M_teguh_70@yahoo. Submitted Date: Agustus 12, 2021 Revised Date: Januari 11, 2022 Reviewed Date: Januari 5, 2022 Accepted Date: Agustus 10,2022 Abstract The place to develop competence and broaden knowledge is in college. The procedure for admitting new students is one of the workforce programs implemented in post-secondary tertiary institutions. A university must go through this process because it can find out whether prospective new students are interested in choosing a particular study program. Based on the skills possessed by prospective new students, an interesting study program can be determined for them. Several methodologies were used in this study, including data cleaning, data collection, criteria determination, probability determination, and final testing. The aim of this study is to use the Nave Bayes and Decision Tree methodologies to develop explanations for how prospective new students choose their program of study. The Nave Bayes method has been used in the same study to select the interests of prospective new students when deciding on a course of study. And 96. 68% is the output for the accuracy value. 2256 data records were used in this study, and 1671 recordsAiafter data collection and cleaningAiwere produced. The number of previous data records was divided into two parts, the first for training data using a percentage of 70% and the second for test data using a percentage of 30%, resulting in a total of 513. The accuracy of the results after testing was determined at 96. 68% using the Naive Bayes approach and 51 . 56% using the Decision Tree method. Compared to the Decision Tree approach, this shows that the Nave Bayes classification method for assessing the interest of prospective students in establishing a study program is very good. The Di Pharmacy study program was chosen because it is most in demand by prospective new students in this Keywords: Interest. Classification. Study program. Naive Bayes. Decision Tree. Abstrak Tempat untuk mengembangkan kompetensi dan memperluas pengetahuan adalah di perguruan tinggi. Tata cara penerimaan mahasiswa baru merupakan salah satu program tenaga kerja yang dijalankan di perguruan tinggi pasca sekolah menengah. Sebuah perguruan tinggi harus melalui proses ini karena dapat mengetahui apakah calon mahasiswa baru tertarik untuk memilih program studi tertentu. Berdasarkan keterampilan yang dimiliki oleh calon mahasiswa baru, maka dapat ditentukan program studi yang menarik bagi mereka. Beberapa metodologi digunakan dalam penelitian ini, termasuk pembersihan data, pengumpulan data, penentuan kriteria, penentuan probabilitas, dan pengujian akhir. Tujuan dari penelitian ini adalah untuk menggunakan metodologi Nave Bayes dan Decision Tree untuk mengembangkan penjelasan tentang bagaimana calon mahasiswa baru memilih program studi mereka. Metode Nave Bayes telah digunakan dalam studi yang sama untuk memilih minat calon mahasiswa baru saat memutuskan program studi. Dan 96,68% merupakan output untuk nilai akurasi. 2256 rekaman data digunakan dalam penelitian ini, dan 1671 rekamanAisetelah pengumpulan dan pembersihan dataAidiproduksi. Jumlah record data sebelumnya dibagi menjadi dua bagian, yang pertama untuk data pelatihan menggunakan persentase 70% dan yang kedua http://openjournal. id/index. php/informatika This work is licensed under a Creative Commons Attribution-NonCommercial 4. International (CC BY-NC 4. License Copyright A 2022 Wildani Eko Nugroho. Teguh Prihandoyo Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. untuk data pengujian menggunakan persentase 30%, menghasilkan total 513. Keakuratan hasil setelah pengujian adalah ditentukan sebesar 96,68% menggunakan pendekatan Naive Bayes dan 51,56% menggunakan metode Decision Tree. Dibandingkan dengan pendekatan Decision Tree, hal ini menunjukkan bahwa cara klasifikasi Nave Bayes untuk menilai minat calon mahasiswa dalam mendirikan program studi sangat baik. Program studi Di Farmasi dipilih karena paling diminati calon mahasiswa baru pada klasifikasi ini. Kata Kunci: Minat. Klasifikasi. Program Studi. Nayve Bayes. Decision Tree. Pendahuluan Berkembangnya teknologi informasi ke dalam setiap bidang kehidupan manusia. Seperti halnya bidang pendidikan misalnya, memberikan dampak yang cukup signifikan. Ini adalah posisi penting, terutama di Pengelolaan perguruan tinggi sangat dipengaruhi oleh teknologi informasi, khususnya untuk data mining dalam proses penerimaan dan dalam proses pemilihan program studi yang diminati. Memilih keputusan yang dimiliki dan dihargai oleh calon mahasiswa. Karena mahasiswa baru melakukan seleksi langsung saat mendaftar, mekanisme pemilihan program studi masih belum efektif . Penetapan program studi untuk perguruan tinggi menjadi sangat penting karena berkaitan dengan kepentingan yang diwakili oleh masyarakat. Warga dengan menekankan pada isu-isu tertentu dianggap peminat dalam hal ini. Perguruan tinggi di Indonesia, khususnya di lingkungan Tegal dan biasanya di provinsi Jawa Tengah, menawarkan berbagai pilihan studi yang menarik bagi penduduk setempat . Topik pembahasan penelitian ini adalah klasifikasi. Selain digunakan untuk mengevaluasi data numerik, klasifikasi juga dapat digunakan untuk menilai data Klasifikasi digunakan untuk mengidentifikasi foto menggunakan kriteria yang diinginkan selain melihat data numerik dan kategori . Naive Bayes adalah salah satu teknik penelitian yang digunakan. Teknik ini dapat diterapkan untuk memilih label yang Cara ini juga dapat memperluas klasifikasi label tunggal selain untuk melakukan tugas ini . Data eksperimen dan contoh prediksi dapat digunakan untuk menguji klasifikasi menggunakan pendekatan Naive Bayes . Karena diimplementasikan dalam berbagai aplikasi, seperti filter spam, evaluasi kanker, dan sosialisasi wajah, metode klasifikasi Nave Bayes merupakan metode klasifikasi yang lugas dan sederhana. Dalam penelitian yang memperhitungkan skenario pengguna yang meminta layanan deskripsi berdasarkan server pengklasifikasi Naive Bayes, itu adalah salah satu model implementasi berdasarkan metode Naive Bayes. Dan dalam penelitian ini, kami berkonsentrasi pada pengembangan klasifikasi Naive Bayes, suatu bentuk privasi yang dapat menahan serangan yang mudah dilakukan tetapi sulit ditemukan di server . Pendekatan Pohon Keputusan atau Decision Tree adalah teknik klasifikasi berikut yang digunakan dalam penelitian ini. Salah satu cara yang disarankan adalah ini karena kondisi pada suatu kriteria dapat diidentifikasi berkat Untuk mengurangi ketegangan memvalidasi pohon keputusan, teknik Pohon Keputusan menghasilkan satu set data pelatihan dan pengujian . Untuk kategorisasi, prediksi pola, dan deskripsi pasangan menggunakan variabel atribut x dan variabel target y dalam bentuk pohon, digunakan pohon keputusan . Berkaitan dengan studi sebelumnya tentang klasifikasi, fokus studi ini pada sistem pendukung keputusan terkait dengan pilihan program studi. Dimana dukungan dari berbagai pihak diperlukan untuk memilih atau menentukan jurusan mahasiswa, terutama dalam mensistematisasikan prosesnya . Pendekatan Nave Bayes digunakan dalam studi sebelumnya tentang proses http://openjournal. id/index. php/informatika This work is licensed under a Creative Commons Attribution-NonCommercial 4. International (CC BY-NC 4. License Copyright A 2022 Wildani Eko Nugroho. Teguh Prihandoyo Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . Informasi pemilihan jurusan mahasiswa dapat diketahui dengan cara ini dengan menggunakan proses mining yang dijelaskan disini. Data dari 100 siswa sedang dikumpulkan, dan menurut standar, data ini harus mencakup skor seragam untuk topik sains, hasil IPS berdasarkan rekomendasi instruktur, dan hasil survei siswa. 90% dan 10%, masing-masing, jurusan ditentukan dengan benar . Penelitian ini akan mendistribusikan karya sebelumnya yaitu dengan menggunakan data testing pada 1671 record data. Jumlah total catatan data kemudian dibagi menjadi dua bagian: data pelatihan, yang mencakup total 1158 data yang diproses pada tingkat 70%, dan data pengujian, yang mencakup total 513 data yang diproses pada tingkat 30%. Hasil pengujian dengan metodologi yang sama namun dengan jumlah record data yang berbeda akan meningkatkan tingkat akurasinya. Pendekatan Nave Bayes sebelumnya digunakan dalam studi, dan tingkat akurasinya adalah 96,68% . Permasalahan yang diangkat dari evaluasi ini adalah seberapa akurat pendekatan Naive Bayes dan metode Decision Tree dapat mengkategorikan mahasiswa yang memilih program studi bagi calon mahasiswa baru. Pendekatan Naive Bayes dan metode Decision Tree, manakah dari kedua metode tersebut yang lebih baik dalam memilih program studi, merupakan isu lain yang akan ditelaah dalam penelitian ini selain konflik tersebut. Oleh karena itu, tujuan dari proyek ini adalah untuk melakukan penelitian, khususnya tentang bagaimana menggunakan metodologi Naive Bayes dan Decision Tree untuk menentukan program studi bagi calon mahasiswa baru. Tujuan dari proyek ini adalah untuk mengklasifikasikan program studi bagi calon mahasiswa baru dengan menggunakan metode Naive Bayes dan Decision Tree pada unit penerimaan mahasiswa baru. Hasil klasifikasi tersebut akan dijadikan tolak ukur peningkatan mutu masing-masing program studi. Landasan Teori Metode Nayve Bayes Untuk menghitung klaster probabilitas dan menambahkan frekuensi serta kombinasi yang bergantung pada kumpulan data, salah satu kategorisasi probalistik langsung adalah teknik Nave Bayes . Salah satu manfaat naif Bayes ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. adalah hanya membutuhkan sedikit pelatihan data. Dalam proses klasifikasi, estimasi parameter dipilih menggunakan data pelatihan . Adapun persamaan teorema metode nayve bayes adalah: ycU ). ycU) = . cU) Di mana: : class data yang belum diketahui. : spesifik class yang merupakan hipotesis P(H|X) : posteriori probabilitas . robabilitas hipotesis H berdasarkan kondisi X) P(H) : berisi nilai probabilitas hipotesis H P(X|H) : berisi nilai probabilitas X berdasarkan kondisi pada hipotesis H P(X) : berisi nilai probabilitas hipotesis X Seperti diketahui bahwa metode klasifikasi Naive Bayes membutuhkan sejumlah pointer untuk memilih kelas yang sesuai untuk model data yang diperiksa . Ini adalah gambaran bagaimana cara kerja metode Naive Bayes, terlihat dari rumus dan banyak penjelasan sebelumnya: Gambar 1. Alur Metode Nayve Bayes Metode Decision Tree Algoritma Decision Tree adalah teknik klasifikasi yang menggunakan model pohon dengan node yang mewakili setiap atribut, daun yang mewakili setiap kelas, dan cabang yang mewakili nilai berdasarkan setiap kelas. Menurut pohon, simpul akar sesuai dengan simpul teratas. Masingmasing node ini berfungsi sebagai node divisi, memiliki setidaknya dua output dan satu input untuk masing-masing . Node terakhir, dikenal sebagai node daun, hanya memiliki satu input dan tidak ada output. http://openjournal. id/index. php/informatika This work is licensed under a Creative Commons Attribution-NonCommercial 4. International (CC BY-NC 4. License Copyright A 2022 Wildani Eko Nugroho. Teguh Prihandoyo Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . Label untuk setiap kelas diwakili oleh pohon keputusan di setiap simpul daun. Setiap node dari pohon keputusan memberikan nilai dari kelas data, dan setiap cabang dari pohon keputusan menentukan kondisi yang harus dipenuhi . Pendekatan ini memudahkan untuk memahami item yang dikelompokkan dengan juga mendeskripsikannya sebagai pohon keputusan. Metodologi Penelitian Merupakan rangkaian kegiatan yang dilakukan untuk merancang langkah-langkah Langkah-langkah diperlukan untuk setiap tahap proyek penelitian diselesaikan, termasuk pencarian data bagian pertama di bagian yang berkaitan dengan penerimaan siswa baru. Prosedur yang hanya berfokus pada penerimaan mahasiswa baru dapat menjadi salah satu cara untuk melakukan penelitian Mengumpulkan data, terus mempelajari faktorfaktor yang dikandungnya, dan menerapkan desain menjadi tindakan berikutnya setelah mencari data. Variabel diuji pada langkah terakhir, dan hasil pengujian dianalisis. Dengan penggunaan Nave Bayes dan Decision Tree, sejumlah kumpulan data calon siswa telah dimodifikasi untuk membuat kriteria yang mencakup data string dan numerik. Pada penelitian ini tahapan pengolahan data meliputi pembersihan data, pengumpulan data, penetapan kriteria, perhitungan probabilitas, dan pengujian hasil akhir. Dari langkah-langkah tersebut, kerangka penelitian dan pendekatan yang disarankan dalam grafik di bawah ini dapat digunakan untuk menggambarkan proses tersebut: PROBLE Nilai i calon a baru MODE Data Preparatio Data Cleaning TOOLS Software Rapidminer Studio Versi 9. ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Hasil dan Pembahasan Berikut adalah hasil temuan penelitian setelah melalui berbagai tahapan dan metode penelitian, antara lain pre-processing atau persiapan, pembersihan data, pengumpulan data, penentuan kriteria, penentuan probabilitas, dan pengujian: Hasil Penelitian Data preposisi merupakan langkah awal dari proyek penelitian yang melibatkan pengolahan data mentah berdasarkan informasi penerimaan calon mahasiswa baru tahun akademik 2019Ae2020 dengan menggunakan total 2256 dataset. Perbedaan yang diperoleh akan terlihat ketika memilih nilai probabilitas untuk setiap kriteria, apakah kriteria menggunakan nilai data string atau kriteria menggunakan data numerik, karena string kontinu atau data kategorikal dibedakan menjadi 2 jenis dalam metode Nave Bayes, yaitu data numerik Data Collection, dalam hal ini data pengujian calon mahasiswa baru dan data yang digunakan untuk pelatihan. Data pelatihan harus memenuhi 70% kriteria, sedangkan data pengujian harus memenuhi 30% kriteria. Data Cleaning, dimana suatu kriteria tetap dihapus karena tidak ada kaitannya dengan akurasi klasifikasi output menurut pendekatan Naive Bayes. Setelah menghapus dataset, tersisa total 1671 dataset dari total 2256 dataset. Sekarang ada 23 kualitas yang digunakan. Pilih kriteria. Kriteria data digunakan untuk memilih kriteria tersebut berdasarkan data yang telah dikumpulkan. Menghitung kemungkinan masing-masing kriteria, dalam hal ini memilih kriteria yang mengkategorikan prodi calon mahasiswa baru. Pengujian dalam konteks ini mengacu pada proses penerapan Unsupervised Discretization Naive Bayes memanfaatkan beberapa data yang dapat diuji. RESULT Data Collection Penentua n Akurasi Naive Bayes Decision Meningkatn ya nilai studi bagi Adapun 20 sample data yang telah dilakukan tahapan berikutnya adalah sebagai Gambar 2. Kerangka Penelitian http://openjournal. id/index. php/informatika This work is licensed under a Creative Commons Attribution-NonCommercial 4. International (CC BY-NC 4. License Copyright A 2022 Wildani Eko Nugroho. Teguh Prihandoyo Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . Gambar 3. Contoh DataSet Yang Akan Di Training Dan Testing ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. dataset dibagi menjadi dua bagian, dengan rasio 70% digunakan untuk data pelatihan menggunakan total 1158 record data dan 30% digunakan untuk data pengujian menggunakan 513 record data dari total record berdasarkan pada dataset 1671. Selain itu, nilai akurasi 96,68% diperoleh dengan Naive Bayes berdasarkan desain eksperimen yang dijelaskan di Nilai akurasi ini masih belum menggunakan Unsupervised Discretization. Grafik penentuan program studi pilihan mahasiswa menunjukkan nilai akurasi Setelah itu, data tersebut di atas disiapkan untuk pelatihan atau pelatihan dan pengujian dengan metode Nave Bayes dan Decision Tree. Rapidminer harus digunakan terlebih dahulu untuk melakukan pendekatan Naive Bayes sebelum melanjutkan ke langkah Decision Tree. Dimulai dengan mengubah nilai Cross Validation dan Sampling Type yang memungkinkan rapidminer, pengujian dilakukan pada berbagai fase. Metode Nayve Bayes Nilai akurasi tertinggi dari berbagai pengujian di atas adalah 19,33%. namun karena menggunakan Stratified Sample sebagai metode pengambilan sampel dan Number of Cross Validation 10, nilai akurasi ini tidak seperti yang Sedangkan desain rapidminer mirip dengan yang di bawah ini: Gambar 5. Grafik Hasil Pengujian Data Pada Naive Bayes Hasil grafik eksperimen mengarah pada kesimpulan bahwa calon mahasiswa baru lebih memilih program studi Di Farmasi ketika memilih program studi. Metode Decision Tree Gain ratio, information gain, gini index, dan akurasi adalah beberapa kriteria yang digunakan dalam pengujian dengan pendekatan Decision Tree. Salah satu dari sejumlah operasi yang akan menghasilkan prediksi tentang akurasi model adalah kriteria ini. Rancangan pengujian metode pohon keputusan adalah sebagai berikut: Gambar 4. Hasil Desain Eksperimen Dengan Cross Validation Pada Naive Bayes Nilai akurasi sebesar 96,68% pada uji coba berikutnya yang menggunakan desain eksperimen yang berbeda dengan eksperimen sebelumnya. Menurut desain pengujian yang dijelaskan di atas. Gambar 6. Hasil Desain Eksperimen Data Training Dan Testing Pada Decision Tree http://openjournal. id/index. php/informatika This work is licensed under a Creative Commons Attribution-NonCommercial 4. International (CC BY-NC 4. License Copyright A 2022 Wildani Eko Nugroho. Teguh Prihandoyo Jurnal Informatika Universitas Pamulang Penerbit: Program Studi Teknik Informatika Universitas Pamulang Vol. No. September 2022 . Berdasarkan desain eksperimen tersebut di atas, dataset dibagi menjadi dua bagian, dengan rasio 70% digunakan untuk pelatihan dengan total 1158 record data dan 30% digunakan untuk pengujian dengan total 513 record data dari dataset 1671 Dengan menggunakan teknik pengujian data pelatihan dan pengujian di atas Akurasi pohon keputusan adalah 51,56%. Beberapa pengujian antara lain kriteria indeks gini dengan nilai kedalaman maksimum 20. Apply Pruning Confidence 0. 1 dan 0. 2, serta Apply Prepruning 0. 02 digunakan untuk menghasilkan nilai akurasi ini. Jika pengujian dijalankan dengan nilai lebih dari 20 nilai kedalaman maksimum, seperti 50, dan Terapkan Pemangkasan: Gambar 7. Grafik Hasil Eksperimen Pada Decision Tree Dari hasil grafik eksperimen diatas bisa disimpulkan bahwa pemilihan program studi bagi calon mahasiswa baru masih memilih dalam program studi Di Farmasi. Pembahasan Temuan penelitian saat ini lebih unggul dari penelitian sebelumnya jika dibandingkan dengan penelitian sebelumnya, seperti yang ditunjukkan pada tabel terlampir, yang membandingkan hasil kedua jenis penelitian tersebut: Tabel 1. Perbadingan Hasil Penelitian Metode Hasil Akurasi Naive Bayes Decision Tree Berdasarkan akurasi output yang diperoleh, penelitian sebelumnya memperoleh nilai sebesar 96,68%, sedangkan penelitian saat ini mengalami penurunan akurasi, dengan menggunakan metode ISSN: 2541-1004 e-ISSN: 2622-4615 32493/informatika. Dicision Tree tanpa optimasi diperoleh nilai sebesar 51,56%. Seperti yang dapat dilihat dari tabel di atas, penelitian sebelumnya lebih unggul dari penelitian Eksperimen di atas menunjukkan bahwa pendekatan Nave Bayes 96,68% lebih unggul Decision Tree mengkategorikan minat saat memilih program studi bagi calon mahasiswa baru. Kesimpulan Dapat berdasarkan hasil klasifikasi saat pemilihan program studi calon mahasiswa baru dengan menggunakan pendekatan Naive Bayes dan metode Decision Tree di atas: Pendekatan Naive Bayes dan metode Decision Tree sama-sama dapat digunakan untuk mengklasifikasikan minat saat memilih program studi bagi calon mahasiswa baru. Akurasi penelitian dengan menggunakan metode klasifikasi Naive Bayes dari awal hingga tahap pengujian adalah 96,68%, pendekatan komparatif yaitu metode klasifikasi Decision Tree adalah 51,56%. Pendekatan Nave Bayes yang menghasilkan nilai akurasi sebesar 96,68% ditemukan sebagai metode klasifikasi terbaik dalam penelitian ini, khususnya untuk mengidentifikasi minat penentuan program studi bagi calon mahasiswa. Daftar Pustaka