Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. KLASIFIKASI KELULUSAN SISWA TAHUN 2024 MENGGUNAKAN METODE DECISION TREE (STUDI KASUS SMA ISLAM ALAZHAR 5 CIREBON) Farhan Rizky Al-Giffary*, 2 Martanto Program Studi Manajemen Informatika. STMIK IKMI Cirebon. Jawa Barat. Indonesia Email: 1 farhanrizkyallgifary@gmail. com, 2Martantomusijo@gmail. Abstrak Pesatnya perkembangan teknologi menyebabkan keterlimpahan data di berbagai bidang termasuk Hal ini membantu sekolah dan pengambil keputusan dalam merencanakan program pendidikan yang efektif dan mendukung keberhasilan siswa. Metode ini bekerja dengan membagi data menjadi beberapa node keputusan yang saling terkait. Setiap node keputusan menggambarkan atribut yang relevan dalam prediksi kelulusan siswa, seperti nilai rata-rta, kehadiran siswa, dan partisipasi dalam kegiatan ekstrakurikuler. Selain itu, data juga mencakup informasi tentang latar belakang sosiol ekonomi siswa seperti tingkat pendidikan orang tua, pekerjaan orang tua, dan status kepemilikan Di dunia pendidikan tentu banyak data yang dapat digali, mulai dari data kinerja pengajar data nilai siswa, data proses pembelajaran dalam beberapa tahun terakhir, terdapat siswa yang lulus tidak tepat waktu di Sekolah Menengah Akhir SMA ISLAM AL-AZHAR 5 CIREBON. Pernyataan ini oleh data kelulusan dari Sekolah Menengah Akhir SMA ISLAM AL-AZHAR 5 CIREBON. Metode yang digunakan dalam Laporan Tugas Akhir ini yaitu Knowledge Discovery in Database (KDD) dengan tahapan selection, preprocessing, transformation, data mining dan evaluation dan juga menggunakan algoritma decision tree untuk menentukan tingkat kelulusan siswa apakah siswa dinyatakan lulus atau belum lulus. Oleh karena itu, perlu dilakukan prediksi status kelulusan siswa untuk mengidentifikasi faktor yang mempengaruhi kelulusan siswa, yang juga dapat digunakan untuk membantu sekolah memecahkan masalah menjadi lebih mudah. Untuk mengatasi masalah tersebut, peneliti memprediksi kelulusan siswa berdasarkan informasi kelulusan siswa. Hasil dari Laporan Tugas Akhir ini memperoleh akurasi sebesar 91,43% Recall sebesar 75,00% dan Precison sebesar 60,00% Kata kunci : Kelulusan Siswa. Klasifikasi ,Decision Tree Abstract The rapid development of technology has resulted in an abundance of data in various fields including This helps schools and decision makers plan effective educational programs and support student success. This method works by dividing data into several interconnected decision nodes. Each decision node describes attributes that are relevant in predicting student graduation, such as grade point average, student attendance, and participation in extracurricular activities. In addition, the data also includes information about students' socio-economic background such as parents' education level, parents' occupation, and home ownership status. In the world of education, of course there is a lot of data that can be mined, starting from teacher performance data, student grade data, learning process data in the last few years, there are students who did not graduate on time at the Final Secondary School of SMA ISLAM AL-AZHAR 5 CIREBON. This statement is from student data from the Final Middle School of SMA ISLAM AL-AZHAR 5 CIREBON. The method used in this Final This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Project Report is Knowledge Discovery in Database (KDD) with the stages of selection, preprocessing, transformation, data mining and evaluation and also using a decision tree algorithm to determine the student's graduation level, whether the student is declared to have passed or not Therefore, it is necessary to predict student graduation status to identify factors that influence student graduation, which can also be used to help schools solve problems more easily. To overcome this problem, researchers estimate student gains based on students' informed consent. The results of this Final Project Report obtained an accuracy of 91. Recall of 75. 00% and Precison of 60. Keywords : student graduation . Klasification. Decision Tree Pendahuluan Pendidikan di Indonesia saat ini sudah lebih maju dalam segi pemanfaatan media pembelajaran. Terlebih lagi sekarang sudah memasuki era digital, sehingga penggunaan teknologi komunikasi dan informasi meluas dimana-mana. Selain itu, di era digital saat ini pendidikan Indonesia mendorong para siswanya untuk memiliki kemampuan berpikir lebih kritis, komunikatif, kreatif, serta kolaboratif, baik secara langsung maupun tidak langsung. Konsep decision tree digunakan untuk mengembangkan model prediksi kelulusan siswa. Decision tree (Pohon Keputusa. adalah pohon dimana setiap cabang nya menunjukkan pilihan diantara sejumlah alternatif pilihan yang ada, dan setiap daunnya menunjukkan keputusan yang Salah satu kelebihan Decision Tree yaitu daerah pengambilan keputusan yang sebelumnya kompleks dan dapat diubah menjadi lebih simpel dan spesifik. Berdasarkan hasil analisis metode Decision Tree dapat digunakan untuk mengidentifikasi komponen utama. Tentu saja, ada sejumlah faktor yang harus diperhitungkan saat menentukan tingkat kelulusan. Faktor pendukung tingkat kelulusan dibandingkan satu sama lain. Klasifikasi adalah teknik pengolahan data yang membagi objek menjadi beberapa kelas sesuai dengan jumlah kelas yang diinginkan . Klasifikasi merupakan suatu teknik menemukan suatu pola yang mampu memisahkan kelas data yang satu dengan yang lainnya untuk menentukan objek yang masuk dengan kategori tertentu dengan melihat kelakuan dan atribut dari kelompok yang telah . Data mining adalah proses untuk menemukan korelasi, pola, dan tren baru yang bermakna dengan memilah-milah data dalam jumlah besar yang disimpan di dalam repositori, menggunakan teknologi pengenalan pola serta teknik statistik dan matematika. Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara berbeda dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. Proses kelulusan adalah kegiatan paling akhir dari manajemen peserta didik. Kelulusan adalah pernyataan dari lembagapendidikan . tentang telah diselesaikan nya program pendidikan yang harus diikuti oleh peserta didik. Kriteria kelulusan siswa untuk ujian nasional harus memenuhi nilai minimal, menyelesaikan semua mata pelajaran, mengikuti ujian sekolah, ujian nasional, uji Decision tree atau pohon keputusan merupakan metode klasifikasi yang sangat kuat dan populer. Decision tree dapat mengubah data yang sangat besar menjadi sebuah pohon keputusan yang merepresentasikan aturan. Decision tree merupakan teknik yang digunakan untuk melakukan klasifikasi terhadap sekumpulan objek atau data dengan representasi struktur pohon. Decision Tree merupakan metode yang khusus dalam proses pengklasifikasian pada Text Mining. RapidMiner adalah aplikasi atau perangkat lunak yang berfungsi sebagai alat pembelajaran dalam ilmu data mining. Platform dikembangkan oleh perusahaan yang didedikasikan untuk semua langkah melibatkan sejumlah besar data dalam bisnis komersial, penelitian, pendidikan, pelatihan dan . RapidMiner adalah sebuah platform perangkat lunak yang andal untuk kebutuhan ilmu data dan pembelajaran mesin. This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 DOI: https://doi. org/10. 52362/jmijayakarta. Confusion matrix atau Matriks kebingungan adalah ukuran yang sangat populer digunakan saat memecahkan masalah klasifikasi. Ini dapat diterapkan untuk klasifikasi biner serta untuk masalah klasifikasi mult ikelas matriks ini digunakan untuk evaluasi kinerja metode yang digunakan setelah . Accuracy adalah metrik evaluasi yang paling umum digunakan untuk klasifikasi. Namun, untuk masalah klasifikasi data yang tidak seimbang, akurasi mungkin bukan pilihan yang baik karena akurasi sering kali memiliki bias terhadap kelas mayoritas. Knowledge Discovery In Database (KDD) merupakan suatu pendekatan untuk mendapatkan informasi berharga dari database yang sudah ada. Di dalam database, terdapat tabel-tabel yang memiliki keterkaitan atau hubungan satu sama lain. Tinjauan Literatur Berdasarkan permasalahan laporan tugas akhir dengan ini di sajikan data kelulusan nilai kelas XII di sekolah SMA Islam Al-Azhar 5 Cirebon pada tabel 1. 1 dengan terdapat 120 data dengan atribut Nama Siswa. Nilai KKM. Jurusan dan atribut tabel dengan class lulus dan belum lulus sebagai berikut Tabel 1. 1 Dataset Kelulusan Siswa SMA ISLAM AL-AZHAR 5 Cirebon. Nama siswa Nilai KKM DELYANA KHOIRUNNISA ADITYA NUGRAHA QEYSHA SALSABILLAH ZAIN Jurusan Status IPA 1 Lulus AJI 75 IPA 1 Tidak Lulus IPA 1 Lulus BRIYAN ANDRE 75 PRATAMA IPA 2 Lulus MEISHA NATHASIA STEFANNY IPA 2 Lulus SATRIO ACHMAD 75 IBRAHIM IPA 2 Lulus ANUGRAH ARYO 75 WIBOWO IPA 3 Lulus FAKHRI FAHRURROZI API IPA 3 Lulus ANGGILIA PUTRI 75 AYUNI IPS Lulus This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 A. DOI: https://doi. org/10. 52362/jmijayakarta. MUHAMMAD IPS Lulus NABIQ IRFAN ZASKIA ARRAHMAH IPS Lulus Berdasarkan Tabel 1. 1 data tersebut merupakan hasil data kelulusan siswa pada sekolah SMA Islam Al-Azhar 5 Cirebon yang dimana terdapat siswa yang tidak lulus dikarenakan siswa tersebut bahwa nilai nya dibawah kkm atau tidak masuk rataAy persemester Metode Penelitian Tahapan perancangan ini yang melibatkan proses dengan menggunakan menggunakan metode Knowledge Discovery in Database (KDD). Knowledge Discovery in Database (KDD) merupakan salah satu pendekatan sistematis untuk mengambil informasi yang penting, tersirat, dan belum diketahui dari sekumpulan data. Gambar 3. 1 Tahapan KDD Berikut merupakan proses data menggunakan KKD sebagai berikut : Selection Proses seleksi data merupakan langkah kritis dalam analisis informasi, di mana kita memilih subset yang relevan dan signifikan dari kumpulan data yang lebih besar untuk mendukung pengambilan keputusan yang akurat. Preprocessing Preprocessing untuk memprediksi data kelulusan siswa yang mencakup penghapusan nilai yang hilang, normalisasi skala nilai, dan konversi data kategorikal menjadi bentuk yang digunakan oleh model prediksi, sehingga memastikan keakuratan dan kehandalan hasil prediksi. Transformation This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Proses Transformation pada tahap ini dilakukan untuk mengubah bentuk data ke dalam suatu format tertentu, dan format tersebut memungkinkan untuk diproses melalui data Data mining Proses data mining pada tahap ini digunakan untuk proses mencari hasil prediksi kelulusan siswa. Evaluation Tahap ini yang digunakan untuk memproses hasil prediksi kelulusan siswa Hasil dan Pembahasan 1 Data Selection model yang digunakan dalam data selection menggunakan operator read excel yang berfungsi membaca dataset excel yang akan kita gunakan untuk model pada gambar 4. Gambar 4. 1 Read Excel 1 Tahapan pertama adalah membuat model data menggunakan read excel pada gambar 4. 1 berikut dengan memasukkan dataset kedalam operator read excel, setelah memasukkan dataset tersebut kemudian hubungkan output dengan result dengan klik tombol run yang ada diatas dan didapatkan hasil pada gambar 4. 2 sebagai berikut : Gambar 4. 2 Hasil Paramater pada read excel 1 This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Dari hasil gambar 4. 2 data tersebut tidak ada yang diubah, pada tahap selection pada gambar 2 Pre-processing Operator yang akan digunakan dalam melakukan cleaning data adalah split data yang merupakan operator untuk membagi kumpulan data menjadi dua atau lebih subset, yang dapat digunakan untuk pelatihan dan pengujian model. Berikut model yang digunakan pada gambar 4. Gambar 4. 3 Split Data 1 operator excel disambungkan dengan operator split data dan dari split data disambungkan ke result kemudian klik run dihasilkan pada gambar 4. Gambar 4. 4 Parameter Processing Pada gambar 4. 4 untuk mengambil rata-rata nilai dari data tersebut melakukan split data yang terdapat pada gambar 4. 5 sebagai berikut : This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Gambar 4. 5 Hasil Split Data Dari hasil split data pada gambar 4. 5 dari data tersebut yang berjumlah 119 data baik dari kolom atribut pertama hingga ke dua puluh tidak ada data yang noice atau salah cetak dan bisa di lanjutkan ke tahapan selanjutnya. 3 Transformation Tidak ada transformation karena tidak ada yang ingin dirubah maka akan dilanjut proses data nya ke data mining 4 Data Mining Pada model data mining menggunakan operator read excel 2 ditambah operator decision tree, apply model dan performance seperti pada gambar 4. 6 sebagai berikut : Gambar 4. 6 Model Data Mining 1 Pada gambar 4. 6 operator read excel disambungkan ke operator split data kemudian split data disambungkan ke decision tree dan apply model setelah tersambungkan semua operator decision tree dan appy model disambung Kembali ke performance dan ke result lalu klik run. Untuk tambahan operator sebagai berikut : Operator Decision Tree This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Gambar 4. 7 Decision Tree 1 Pada gambar 4. 7 decision tree merupakan pohon Keputusan dan parameter stidak ada yang dirubah Operator Apply Model Gambar 4. 8 Operator Apply Model 1 Pada gambar 4. 8 Apply model digunakan untuk menerapkan data atau mendapatkan sebuat klasifikasi atau prediksi. Operator Performance Gambar 4. 9 Operator Performance 1 This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Pada gambar 4. 9 Operator performance digunakan untuk memberikan hasil evaluasi kinerja dan memberikan nilai secara otomatis. Pada parameters performance menggunakan use example weights atau contoh bobot, parameter sesuai dengan rapid miner tidak ada perubahan. 5 Evaluation Confusion Matrix Untuk hasil dari Rapid miner untuk confusion matrix dapat menghasilkan hasil pada gambar 4. sebagai berikut : Gambar 4. 10 Confusion matrix 1 Pada gambar 4. 10 dapat diuraikan sebagai berikut : true positive: 29 false positive: 1 negative: 2 false negative: 3 Acuracy akurasi yang didapatkan dalam Laporan Tugas Akhir menggunakan rapid nimer adalah pada gambar 11 sebagai berikut: Gambar 4. 11 Acuracy 1 Untuk accuracy yang didapatkan dalam aplikasi rapidminer adalah 91,43% Pada gambar 4. 12 Dapat disimpulkan perhitungannya seperti di bawah ini : Acuracy= . 2 3 . = 0, 9142y 100% = 91,43% This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Maka didapatkan hasil dari perhitungannya adalah 91,43% Precision Hasil dari precision dalam Laporan Tugas Akhir menggunakan rapid miner pada gambar 4. 12 berikut: Gambar 4. 12 Precsion 1 Dapat disimpulkan untuk hasil precision pada gambar 4. 12 sebagai berikut : Precision = . = 5,8y 100% = 5,8%, karena hasil jawaban data koma nya diatas . 0,5 maka saya bulatkan angka menjadi 60%. Maka didapatkan hasil dari perhitungannya adalah 60,00% Recall Hasil dari recall dalam Laporan Tugas Akhir menggunakan menggunakan rapid miner pada gambar 13 Sebagai berikut: Gambar 4. 13 Recall 1 Dapat disimpulkan untuk perhitungan recall pada gambar 4. 12 sebagai berikut : Recall = . = 0,75 y 100% = 75,00% This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Maka didapatkan hasil dari perhitungan adalah 75,00% Kurva ROC Didalam rapid miner ada yang Namanya kurva AOC digamparkan pada gambar 14 sebagai berikut: Gambar 4. 14 Kurva ROC 1 Untuk hasil kurva ROC pada gambar 4. 14 didapatkan dari parid miner adalah 0. excelent yang berarti ini menghasilkan hasil data yang akurat. Pohon Keputusan Gambar 4. 15 Pohon Keputusan Kesimpulan . r Conclusio. Penelitian ini menerapkan metode Decision Tree untuk klasifikasi kelulusan siswa. Langkahlangkahnya melibatkan seleksi data dengan menggunakan atribut seperti nama siswa, nilai rata-rata semester, jurusan, dan status. Setelah seleksi, dataset dibagi menjadi subset pelatihan dan pengujian, tanpa adanya data anomali atau kesalahan cetak. Tidak diperlukan transformasi data, sehingga proses dilanjutkan ke tahap data mining. Model data mining menggunakan operator decision tree untuk membuat pohon keputusan, dan apply model diterapkan pada data uji. Hasil analisis klasifikasi menunjukkan performa yang baik dengan akurasi mencapai 91,43%. Evaluasi menggunakan confusion matrix, presisi, recall, dan kurva ROC juga menunjukkan hasil yang positif. Dengan demikian, dapat disimpulkan bahwa This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024: halaman 195-206 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. model Decision Tree memberikan prediksi kelulusan siswa yang dapat diandalkan dan akurat berdasarkan atribut yang telah dipilih. Model ini dapat berfungsi sebagai alat pendukung pengambilan keputusan terkait prestasi siswa. Referensi