Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. PENERAPAN ALGORITMA METODE NAyaVE BAYES UNTUK PENENTUAN PENERIMAAN BANTUAN PROGRAM INDONESIA PINTAR (PIP) (Studi Kasus SMP PGRI 1 CILACAP) Imansyah Priyanto1. Elsa Mayorita Dewanti2. Tundo3. Muhammad Nurdin4. Roy Kasiono5 1 ,2 Teknik Informatika. Universitas Nahdlatul Ulama Al Ghazali Cilacap Teknik Informatika. Sekolah Tinggi Ilmu Komputer Cipta Karya Informatika (STIKOM CKI) BPPTL Ae Kementerian Perhubungan Ketatalaksanaan Angkutan Laut dan Pelabuhan. Sekolah Tinggi Ilmu Pelayaran (STIP) email : imansyah811@gmail. com, elsadewanti80@admin. id, asna8mujahid@gmail. muhnuraldidika@gmail. com, kasionoroy@gmail. Abstrak Program Indonesia Pintar (PIP) melalui Kartu Indonesia Pintar (KIP) adalah program pemerintah yang ditawarkan dalam wujud pembiayaan pendidikan langsung kepada para siswa . -21 tahu. KIP merupakan bagian penyempurnaan dari program Bantuan Siswa Miskin (BSM) sejak akhir 2014. Sasaran PIP di SMP PGRI 1 Cilacap masih kurang tepat sasaranya, dikarenakan kurangnya kriteria penerima KKS. Oleh karena itu penulis menambahkan kriteria penerima KKS dalam penelitian. Penelitian ini dibuat berdasarkan data yang telah ada sebelumnya yaitu dengan 100 data training dan 9 data uji menggunakan metode data mining Nayve Bayes dan dengan 6 atribut yaitu pekerjaan orang tua, jumlah tanggungan, penghasilan orang tua, penerima KIP, penerima KPS, penerima KKS. Hasil pengujian akurasi yang didapatkan yaitu 88,89% dan perhitungan Recall 85,71%. Kata kunci: Data Mining. Nayve Bayes. Program Indonesia Pintar Abstract The Smart Indonesia Program (PIP) through the Smart Indonesia Card (KIP) is a government program offered in the form of direct education financing to students . -21 year. KIP is an improvement part of the Poor Student Assistance (BSM) program since the end of 2014. The target of PIP at SMP PGRI 1 Cilacap is still not well targeted, due to the lack of criteria for KKS recipients. Therefore, the author added criteria for KKS recipients in the research. This research was created based on previously existing data, namely 100 training data and 9 test data using the Nayve Bayes data mining method and with 6 attributes, namely parents' occupation, number of dependents, parents' income. KIP recipients. KPS recipients. KKS recipients. The accuracy test results obtained 89% and the Recall calculation was 85. Keywords: Data Mining. Nayve Bayes. Smart Indonesia Program PENDAHULUAN Sesuai dengan Undang-Undang yang ada di Indonesia tentang pentingnya sebuah pendidikan bagi warga Negara yang tertera pada pasal 31 Undang-Undang Dasar 1945 yang berisikan bahwa This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. setiap warga Negara berhak memperoleh dan mengikuti pendidikan dasar dan pemerintah wajib untuk membiayai. Pendidikan memiliki peranan sangat penting dalam meningkatkan sumber daya Pendidikan akan memajukan dan mengembangkan sikap, keterampilan, serta kecerdasan intelektual untuk memberikan manusia yang terampil, cerdas, dan berakhlak mulia. Namun pendidikan seringkali tidak berjalan dengan baik karena beberapa faktor penyebab putus sekolah, salah satu yang seringkali terjadi adalah faktor ekonomi yaitu dalam pendapatan pekerjaan orang tua. Dalam menyikapi permasalahan tersebut, pemerintah meluncurkan program Indonesia Pintar. Pada tahun 2015 Kebijakan Program Indonesia Pintar (PIP) didirikan lewat Permendikbud No. Tahun 2015 tanggal 12 Mei 2015. Program Indonesia Pintar adalah program pemerintah yang ditawarkan dalam wujud pembiayaan pendidikan langsung kepada para siswa . -21 tahu. Program ini ditunjukan kepada individu dari keluarga kurang mampu secara ekonomi yang ditandai dengan menggunakan Kartu Indonesia Pintar (KIP). KIP merupakan bagian penyempurnaan dari Program Bantuan Siswa Miskin (BSM) sejak akhir 2014. SMP PGRI 1 Cilacap bertempat di Jalan Rama No. Trajumas. Gumilir. Kecamatan Cilacap Utara. Kabupaten Cilacap. Jawa Tengah. SMP ini merupakan salah satu SMP yang berada dikawasan Gumilir yang mendapatkan dana Program Indonesia Pintar (PIP). Sasaran PIP di SMP PGRI 1 Cilacap masih kurang tepat sasaranya. Menurut penelitian terdahulu oleh Tundo dan Shofwatul Uyun . berjudul AuPenerapan Decision Tree J48 dan Reptree Dalam Menentukan Prediksi Produksi Minyak Kelapa Sawit Menggunakan Metode Fuzzy TsukamotoAy kajian tersebut menggunakan metode Fuzzy Tsukamoto dengan kombinasi decision tree J48 dan REPTree, akurasi yang didapat adalah 95,2381% untuk decision tree J48 dan 90,4762% untuk decision tree REPTree . , kemudian kajian oleh Okta Rin dan Suzi Oktavia Kunang . berjudul AuImplementasi Data Mining Menggunakan Metode Naive Bayes Untuk Penentuan Penerima Bantuan Program Indonesia Pintar (PIP) (Studi Kasus : Sd Negeri 9 Air Kumban. Ay Berdasarkan uraian di atas. Implementasi data mining dengan prosedur Nayve Bayes guna memprediksi kelayakan penerima PIP bersumber pada penambahan atribut dataset AuJumlah tanggunganAy sangat berguna untuk memastikan kelayakan penerima PIP. Bersumber pada informasi yang diperoleh, penentuan penerima PIP memakai prosedur algoritma Naive Bayes memberikan informasi prognostik yang lebih akurat tentang siswa yang berhak menerima dukungan PIP ketimbang dengan penentuan yang dicoba oleh sekolah. Dengan demikian, metode Naive Bayes berhasil melakukan prediksi dengan presisi 90,00%, presisi 98,57%, recall 87,67%, dan AUC 0,868 menggunakan 101 data . Sedangkan kajian oleh Putri Ayu Ani dan Andri . yang berjudul AuPenerapan Algortima Nayve Bayes untuk Klasifikasi Mahasiswa Penerima KIP (Studi Kasus : Universitas Bina Darm. Berdasarkan hasil penelitian dan pengujian tersebut dilakukan menggunakan pengklasifikasian algoritma naive bayes dengan teknik data mining CRISP-DM maka hasil akhir pengolahan data dengan menggunakan bantuan tools Rapidminer dari 342 data mahasiswa penerima KIP dengan nilai akurasi keseluruhan 49. 15% dan Class recall Diterima 34. Class recall tidak diterima 60. Class precision diterima 40. 31% dan Class precision tidak diterima 54. 46% . Berdasarkan hal-hal yang telah dijelaskan di atas, maka penelitian tertarik untuk melakukan penelitian tentang penentuan penerimaan Bantuan Program Indonesia Pintas (PIP) menggunakan Algoritma metode Nayve Bayes dengan data yang diperoleh dari SMP PGRI 1 CILACAP menggunakan 6 atribut yaitu Pekerjaan Orang Tua. Jumal Tanggungan. Penghasilan Orang Tua. Penerima KIP. Penerima KPS dan Penerima KKS. Dimana pada penelitian sebelumnya menggunakan 5 atribut untuk menentukan kelayakan penerima bantuan PIP. Berdasarkan penelitian saat ini, menggunakan 6 atribut dengan tambahan atribut penerima KKS (Kartu Keluarga Seha. dengan maksud dan tujuan dalam pemberian kelayakan penerimaan bantuan PIP tepat sasaran. METODE PENELITIAN Pada penelitian ini menggunakan metode pemodelan algoritma dengan pendekatan Knowledge Discovery in Database (KDD) . Tujuan dari metode pemodelan ini yaitu untuk menggali informasi This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 DOI: https://doi. org/10. 52362/jmijayakarta. serta pengetahuan yang belum diketahui sebelumnya dari database . Database ini berisikan informasi yang disimpan dalam tabel yang saling berelasi. Adapun tahapan KDD bisa dilihat pada Gambar 1. Collecting Data DATA SISWA Cleaning Data Modeling Evaluation Gambar 1. Tahapan KDD Collecting Data Data yang telah dikumpulkan adalah data siswa SMP PGRI 1 CILACAP penerima PIP dengan atribut NPSN. Pekerjaan Orang Tua. Jumlah Tanggungan. Penghasilan Orang Tua. Penerima KIP. Penerima KPS, dan Penerima KKS. Data yang akan digunakan pada penelitian ini dikelompokan menjadi dari 3 data yaitu : Data Latih Data training adalah data yang pada penelitian ini digunakan untuk proses pembuatan pemodelan prediksi penerima PIP SMP PGRI 1 Cilacap. Data Training . pada penelitian ini di ambil 100 data siswa. Data Uji Data Testing adalah data yang digunakan untuk melakukan uji pada pemodelan data yang terbentuk pada proses pemodelan. Data Uji pada penelitian ini di ambil 9 data siswa. Data Prediksi Data prediksi adalah data yang digunakan untuk melakukan prediksi penerima PIP SMP PGRI 1 Cilacap. Cleaning Data Data yang telah terkumpul selanjutnya dibersihkan dan beberapa diantaranya dihapus . , proses ini meliputi data yang tidak sesuai, data yang berisikan salah satu atribut kosong, data anomali, dan membersihkan atribut yang tidak digunakan pada saat pemodelan. Modeling Setelah tahap pembersihan dan transformasi data selesai, selanjutnya dilakukan tahap pemodelan, tahap ini akan menentukan hasil klasifikasi dan prediksi . Pada penelitian ini menggunakan pemodelan algoritma naive bayes. 4 Evaluation Hasil dari ujicoba pemodelan disajikan dalam bentuk confusion matrix atau matriks Confusion matrix ini menyajikan informasi yang aktual terhadap pemodelan yang telah dilakukan, confusion matrix ini juga memberikan informasi berupa hasil akurasi . HASIL DAN PEMBAHASAN 1 Collecting Data Pada tahap ini data yang dikumpulkan adalah By Name By NIPD dari penerima PIP dengan atribut Nama. NIPD. Jenis Kelamin. NISN. Tempat Lahir. Tanggal Lahir. NIK. Agama. Alamat. Jenis Tinggal. Alat Transportasi. Telepon / Hp. Penerima KPS. Data Orang Tua berupa Nama. Pekerjaan. Penghasilan. Nomer Seri Ijazah. Penerima KIP. Penerima KKS. Layak PIP . sulan dari sekola. Sekolah Asal. Anak ke-berapa. Jumlah Saudara Kandung. Jarak Rumah ke Sekolah data tersebut adalah data awal yang diambil dari dapodik SMP PGRI 1 Cilacap. Berikut data yang di dapatkan dari SMP PGRI 1 Cilacap dilampirkan pada Tabel 1. Tabel 1. Data Awal Siswa SMP PGRI 1 Cilacap Nama NIPD Layak . sulan PIP Sekolah Asal Anak keberapa Jumlah Saudara Kandung This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jarak Rumah ke Sekolah(K P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 DOI: https://doi. org/10. 52362/jmijayakarta. Abib A Layak Tidak Layak Layak Zian P Tidak Zulfa N Layak Achmad W Adam G SDN K 3 Kesugihan SDN G 4 Cilut SDN Tritih SDN K 3 Karangkan MI Nurul Huda SDN Mertasinga Ade D 2 Cleaning Data Setelah data dikumpulkan proses selanjutnya dilakukan pembersihan data, tahap ini menghapus data yang tidak digunakan sebagai data latih . seperti Jenis Kelamin. NISN. Tempat Lahir. Tanggal Lahir. NIK. Agama. Alamat. Jenis Tinggal. Alat Transportasi. Telepon / Hp. Nomer Seri Ijazah. Sekolah Asal, serta Jarak Rumah ke Sekolah. atribut yang digunakan untuk proses transformasi data yaitu Nama / NIPD. Pekerjaan Orang Tua. Jumlah Tanggungan. Penghasilan Orang Tua. Penerima KIP. Penerima KPS, dan Penerima KKS. Layak PIP . sulan dari sekola. Berikut data yang sudah dilakukan proses Cleaning Data yang terlihat pada Tabel 2. Tabel 2. Data Tabel setelah dilakukan Cleaning Data No. Nama Siswa Pekerjaan Orang Tua Silsi Irda P/8658 Candra R/8804 Dinda K/8991 Muhammad Faiz S/8936 Wandika/8630 Rafif Ibnu/8817 Syifa Dina/8759 Tian Fiki/8850 Uswatun Nur/8760 Vania Belva/8626 Penghasilan Tua Buruh Nelayan Buruh Nelayan Jmlh Tanggun Buruh Nelayan Buruh Nelayan Buruh Buruh Orang Penerima KIP Penerima KPS Penerima KKS PIP Rp. 000,00 Rp. 000,00 Rp. 000,00 Rp. 000,00 Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Layak Layak Tidak Layak Rp. 000,00 Rp. 000,00 Rp. Rp. Rp. Rp. Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Tidak Layak Tidak Tidak Layak Tidak Modeling Data Modeling menggunkan metode NBC tahap pemodelan ini akan menghasilkan nilai akurasi dari data yang diolah. pada penelitian ini menggunakan pemodelan Algoritma Naive Bayes adapun Persamaan teorema Naive bayes pada rumus . P (A|B) = (P(B|A) * P(A))/P(B) Artinya Peluang kejadian A sebagai B tentukan dari peluang B saat A, peluang A, dan peluang B. Data Uji yang dipilih agar cocok untuk langkah penambangan data serta pengunaan data diskirit dan continue untuk melakukan pengujian data. Setelah melakukan pembersihan data sebagai dataset (Data Lati. sebanyak 100 data siswa, serta Data Uji sebanyak 9 data siswa terlihat pada tabel 3. This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 DOI: https://doi. org/10. 52362/jmijayakarta. Tabel 3. Data Tabel Uji sebanyak 9 data siswa Nama Siswa / NIPD Ida Biora / 9245 Juanita Alicya Putri / Rangga Khaerul Dzakirin / 8876 Maolana Nurhidayat / Putri Laura Dani / Retno Gupito/ 8653 Riski Agung Sahputra / 8655 Zulfa Nur Ramadhani / 9122 Isbat Suyaki / 8682 Penerima KIP (Kartu Indonesia Pinta. Penerima KPS Keluarga Pra Sejahter. Tidak Tidak Tidak Tidak Buruh Nelayan Pedagang Kecil Penerima KKS ( Kartu Keluarga Sejahter. Layak PIP Atau Tidak ? Tidak Tidak Tidak Tidak Tidak Tidak Buruh Tidak Buruh Tidak Tidak Tidak Pedagang Kecil Tidak Tidak Pekerjaan Orang Tua Jmlh Tanggun Penghasilan Orang Tua Buruh Petani Karyawan Swasta Langkah 1 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Pekerjaan Orang Tua(C. pada tabel 4. Tabel 4. Hasil Perhitungan atribut Pekerjaan Orang Tua (C. Langkah 2 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Jumlah Tanggungan(C. pada tabel 5. Tabel 5. Hasil Perhitungan atribut Jumlah Tanggungan (C. Layak Jumlah (C. Tanggungan 1 Tidak This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Mean (AA) 0,83666 0,894427 DS (Deviasi Standa. Rumus 2 : This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Diketahui : e = 2,7183 Langkah 3 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Penghasilan Orang Tua(C. pada tabel 6. Tabel 6. Hasil Perhitungan atribut Penghasilan Orang Tua (C. Layak Tidak Penghasilan Orang Tua (C. This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 DOI: https://doi. org/10. 52362/jmijayakarta. Mean (AA) 273861,2788 447213,5955 DS (Deviasi Standa. Langkah 4 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Penerima KIP(C. pada tabel 7. Tabel 7. Hasil Perhitungan atribut Penerima KIP (C. Jumlah Kejadian Probabilitas (C. "Dipilih" Penerima KIP Layak Tidak Layak Tidak 0,72 Tidak 0,28 Langkah 5 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Penerima KPS(C. pada tabel 8. Tabel 8. Hasil Perhitungan atribut Penerima KPS (C. Langkah 6 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Penerima KKS(C. pada tabel 9. Tabel 9. Hasil Perhitungan atribut Penerima KKS (C. Langkah 7 : Menghitung Probabilitas kemunculan setiap nilai untuk atribut Dipilih sebagai Layak PIP(C. pada tabel 10. Tabel 10. Hasil Perhitungan atribut Dipilih sebagai Layak PIP (C. P(Layak / Tida. Total Data Layak Tidak This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta P-ISSN: 2746-5985 e-ISSN: 2797-0930 Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 DOI: https://doi. org/10. 52362/jmijayakarta. Langkah 8 : Menghitung Class Prediksi Layak PIP atau Tidak dari 9 data Uji pada tabel Tabel 11. Hasil Perhitungan Class Prediksi Layak PIP atau Tidak Class Prediksi Layak Tidak Layak Tidak Tidak Layak Layak Layak Layak Tidak Layak 87985,45334 788,349662 4582,575695 32941,75373 14274,75995 1852,973647 17104,37213 11825,24493 1281,068201 Langkah 9 : Membandingkan Hasil Class Prediksi dengan data yang sudah ada dari instansi SMP PGRI 1 Cilacap, disajikan dalam bentuk tabel 12. Tabel 12. Hasil Perbandingan Class Prediksi dengan data Instansi Layak PIP Atau Tidak ? (Instans. Class Prediksi Layak Layak Tidak Tidak Tidak Tidak Layak Layak Layak Layak Layak Layak Layak Layak Layak Tidak Layak Layak 10 Contoh perhitungan Class Prediksi untuk menentukan Layak atau Tidak Sebagai Penerima PIP yaitu dengan perhitungan C1*C2*C3*C4*C5*C6 dengan diketahui sesuai tabel 13. Tabel 13. Menghitung Layak atau Tidak untuk Class Prediksi Nama NIPD Siswa IDA BIORA Pekerjaan Orang Tua Jmlh Tanggun Penghasilan Orang Tua Penerima KIP Penerima KPS Penerima KKS Layak PIP Atau Tidak ? Buruh Tidak Tidak Class Prediksi Layak : 0,6 x 0,83666 x 273861,2788 x 0,72 x 0,48 x 0,64 = 87985,45334 Class Prediksi Tidak : 0,46 x 0,894427 x 447213,5955 x 0 x 1 x 1 = 0 Jadi, dapat diperoleh nilai probabilitas Class Prediksi dapat dihitung dengan melakukan normalisasi terhadap likelihood tersebut sehingga jumlah nilai yang diperoleh = 1. Perbandingan sampel perhitungan untuk menentukan Layak atau Tidak pada Class Prediksi yaitu Layak. This work is licensed under a Creative Commons Attribution 4. 0 International License. http://journal. id/index. php/JMIJayakarta Jurnal Manajemen Informatika Jayakarta Volume 4. Nomor 2. April 2024 halaman 162-172 P-ISSN: 2746-5985 e-ISSN: 2797-0930 DOI: https://doi. org/10. 52362/jmijayakarta. Evaluation Untuk mencari nilai akurasi dan recall pada pemodelan yang telah dilakukan terhadap data uji, langkah selanjutnya adalah melakukan pengujian terhadap data uji yang telah dipisahkan sebelumnya, nilai akurasi dan nilai recall disajikan dalam bentuk tabel 14. Confusion Matrix. Rumus 3 : Akurasi = TP TN / TP TN FP FN =6 2/6 2 0 1 = 8 / 9 = 0,8889 x 100% = 88,89% Akurasi Prediksi Layak Tidak Tabel 14. Confusion Matrix 88,89% class label confusion matrix Layak Tidak Rumus 4 : Perhitungan Recall = TP / (TP FN) = 6 / . = 6 / 7 = 0,8571 x 100% = 85,71 % TP = True Positive TN = True Negative FP = False Positive FN = False Negative KESIMPULAN Berdasarkan penelitian yang dilakukan, dapat ditarik kesimpulan bahwa, penerapan Data Mining menggunakan Metode Naive Bayes untuk memprediksi kelayakan penerima bantuan PIP berdasarkan dataset dengan menambahkan atribut Penerima KKS sangat membantu dalam menentukan kelayakan penerima bantuan PIP. Berdasarkan data yang telah diperoleh, proses penentuan penerima bantuan PIP menggunakan metode Naive Bayes menghasilkan informasi prediksi siswa yang layak mendapatkan bantuan PIP lebih akurat dibandingkan dengan penentuan yang dilakukan pihak sekolah. Dengan demikian metode Naive Bayes ini berhasil memprediksi dengan presentase Accuracy sebesar 88,89% dan perhitungan Recall 85,71% dengan menggunakan data sebanyak 100 data siswa sebagai Data uji sebanyak 9 Data Siswa. DAFTAR PUSTAKA