Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (KKS) Arief Prajoko1. Rahmat Widiya Sembiring2. Saifullah3 1STIKOM Tunas Bangsa Pematangsiantar. Sumatera Utara. Indonesia 2,3STIKOM Tunas Bangsa Pematangsiantar. Sumatera Utara. Indonesia Jln. Sudirman Blok A No. 1-3 Pematangsiantar. Sumatera Utara 1riefprajoko13@gmail. com, 3saifullah@amiktunasbangsa. Abstract The purpose of this study is to classify data on families who are entitled to receive a Prosperous Family Card (KKS), because there are still many other poor families who have not had the opportunity to receive this assistance program. Sources of data obtained from the Panghulu Nagori Mekar Rejo office. Bosar Maligas District. Simalungun Regency. The method used in this research is the C4. algorithm data mining technique which is implemented with the RapidMiner 5. 3 application. The variables used in determining which families are entitled to receive a Prosperous Family Card (KKS) are . Occupation, . Income of the Head of the Family, . Number of Dependents, . Highest Education, . Condition of the House Building. The results of the classification using the C4. algorithm and testing with the Rapidminer software found that the factor that determines the feasibility of providing the Prosperous Family Card (KKS) assistance is C2 (Head of Household Incom. with the highest gain value, namely 0. Keywords: C4. 5 Algorithm. Prosperous Family Card (KKS) Abstrak Tujuan penelitian ini untuk mengklasifikasi data keluarga yang berhak menerima Kartu Keluarga Sejahtera (KKS), karena masih banyak keluarga tidak mampu lainnya yang belum berkesempatan menerima program bantuan ini. Sumber data yang diperoleh dari kantor Panghulu Nagori Mekar Rejo Kec. Bosar Maligas Kab. Simalungun. Metode yang digunakan dalam penelitian adalah teknik data mining algoritma C4. 5 yang diimpelementasikan dengan aplikasi RapidMiner 5. Variabel yang digunakan dalam menentukan keluarga yang berhak menerima Kartu Keluarga Sejahtera (KKS) ini, adalah . Pekerjaan, . Penghasilan Kepala Keluarga, . Jumlah Tanggungan, . Pendidikan Tertinggi, . Kondisi Bangunan Rumah. Hasil dari klasifikasi menggunakan algoritma C4. 5 dan pengujian dengan software Rapidminer didapatkan factor yang menentukan kelayakan dalam pemberian bantuan Kartu Keluarga Sejahtera (KKS) adalah C2(Penghasilan Kepala Keluarg. dengan nilai gain tertinggi yaitu 0. Kata kunci: Algoritma C4. Kartu Keluarga Sejahtera (KKS) PENDAHULUAN Kartu Keluarga Sejahtera atau biasa disebut dengan KKS adalah salah satu program pemerintah dalam percepatan penanggulangan kemiskinan, hal ini tercantum pada Peraturan Presiden (Perpre. Nomor 166 Tahun 2014. Pada awalnya program tersebut adalah hasil dari pengembangan program sebelumnya, yaitu dengan nama Kartu Perlindungan Sejahtera (KPS) yang telah dilaksanakan pada era pemerintahan Presiden Susilo Bambang Yudhoyono, dan kini program tersebut diubah secara bertahap menjadi Kartu Keluarga Sejahtera (KKS). Fungsi KKS selain menjadi penanda masyarakat kurang mampu juga berfungsi sebagai kartu identitas untuk mendapatkan Program Simpanan Sejahtera (PSKS). Program bantuan ini dilaksanakan selama pemerintahan Presiden Joko Widodo yang Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik diberikan sebesar 25% dari total jumlah penduduk yang ada dengan status sosial ekonomi terrendah. Pengambilan data dalam program tersebut berdasarkan hasil pendataan dari program sebelumnya yaitu KPS, pada bulan Juli tahun 2013 . Jumlah tersebut berdasarkan Basis Data Terpadu (BDT) yang diolah oleh Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), dengan jumlah kisaran bantuan yang diberikan sebesar Rp. 000/keluarga/bulan. Pemerintah daerah dalam melakukan pengentasan kemiskinan melalui program Kartu Keluarga Sejahtera tersebut, harus didukung dengan tingkat akurasi data dan juga membutuhkan efisiensi waktu pengolahan data penerima bantuan dan menjumlah total banyaknya jumlah penduduk miskin yang ada. Nagori Mekar Rejo merupakan salah satu desa di Kecamatan Bosar Maligas Kabupaten Simalungun, dengan tingkat kemiskinan diatas rata-rata. Tetapi dalam melaksanakan program bantuan Kartu Keluarga Sejahtera (KKS) masih ada kesalahan dalam pemberian (KKS) pada masyarakat miskin yang tidak tepat Hal ini terjadi karena belum adanya sistem dalam pengolahan data calon penerima bantuan yang cukup besar oleh perangkat desa dikantor Panghulu Nagori Mekar Rejo sehingga terjadi kesalahan dalam pengambilan keputusan. Dalam masalah tersebut maka penulis akan menyelesaikan masalah diatas dengan menggunakan suatu metode yaitu dengan menggunakan metode teknik data mining klasifikasi C4. Adapun variable yang akan digunakan untuk menyelesaikan masalah diatas diantaranya adalah. Pekerjaan. Penghasilan Kepala Keluarga. Jumlah Tanggungan. Pendidikan Tertinggi. Kondisi Bangunan Rumah. Dengan variable tersebut maka penulis akan memberikan masukan kepada perangkat desa Nagori Mekar Rejo dalam memberikan (KKS) kepada masayarakat miskin yang benar-benar membutuhkannya. Berdasarkan permasalahan diatas, tujuan penelitian ini yaitu untuk mengetahui kelayakan kinerja perangkat desa di Kantor Panghulu Nagori Mekarejo dalam menentukan atau memberikan Kartu Keluarga Sejahtera di Nagori Mekar Rejo dari variable yang telah ditentukan. Diharapkan hasil dari penelitian ini dapat memberikan masukan kepada perangkat desa di Kantor Panghulu Nagori Mekar Rejo agar dapat memperbaikinya dalam memberikan Kartu Keluarga Sejahtera (KKS) kepada masyarakat secara layak, sehingga kemudian akan menghasilkan keadilan bagi masyarakat miskin yang benar-benar berhak menerima (KKS) METODOLOGI PENELITIAN Pengumpulan Data Pengumpulan data yang dilakukan penulis dengan cara mengambil secara langsung ke Kantor Panghulu Nagori Mekar Rejo. Dalam penelitian ini data yang digunakan akan diolah dari hasil wawancara yang diberikan oleh perangkat Desa Nagori Mekar Rejo dengan jumlah masyarakat sebanyak 86 orang. Penulis melakukan observasi langsung kepada masyarakat dengan jumlah 50 sampel data. Data yang digunakan terdiri dari : Pekerjaan (C. Penghasilan Kepala Keluarga (C. Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik . Jumlah Tanggungan (C. Pendidikan Teritinggi (C. Kondisi Bangunan Rumah (C. Setiap variabel terdiri dari pertanyaan yang diajukan kepada perangkat desa yang diberikan. Data yang digunakan merupakan jenis data deskriftif. Metode Penelitian . Data Mining Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran computer . achine learnin. untuk menganalisis dan mengekstrasi pengetahuan . secara otomatisAy. Definisi lain Data Mining didefinisikan sebagai sebuah proses untuk menemukan hubungan, pola dan tren baru yang bermakna dengan menyaring data yang sangat besar, yang tersimpan dalam penyimpanan, menggunakan teknik pengenalan pola seperti teknik Statistik dan MatematikaAy . Algoritma C4. Algoritma C4. 5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenalAy . Kelebihan utama Algoritma C4. 5 dapat membuat pohon keputusan . ecision tre. yang efisien menangani atribut tipe diskrit dan tipe diskrit- numerik, mudah untuk diinterprestasikan dan memiliki tingkat akurasi yang dapat diterima (Luvia et al. , 2. Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti yang tertera berikut: ( )Oc | | | | ( ) . Keterangan: S : Himpunan kasus A : Atribut n : Jumlah partisi atribut A |S. : Jumlah kasus pada partisi ke i |S| : Jumlah kasus dalam S Sebelum mendapatkan nilai Gain adalah dengan mencari nilai Entropi. Entropi digunakan untuk menentukan seberapa informatif sebuah masukan atribut untuk menghasilkan sebuah atribut. Rumus dasar ( ) Oc S : Himpunan Kasus n : Jumlah partisi S pi: Proporsi dari Si terhadap S Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik HASIL DAN PEMBAHASAN Perhitungan Menggunakan Metode K-means Perhitungan algoritma C4. 5 dimulai dengan memilih atribut akar terlebih dahulu dengan mencari jumlah kasus keseluruhan, jumlah kasus keputusan layak dan jumlah kasus keputusan tidak layak. Menghitung entrophy dari semua kasus yang dibagi berdasarkan Pekerjaan (C. Penghasilan Kepala Keluarga (C. Jumlah Tanggungan (C. Pendidikan Tertinggi (C. , dan Kondisi Bangunan Rumah (C. Setelah itu dilakukan perhitungan gain untuk masing Ae masing atribut. Hasil perhitungan ditunjukkan oleh tabel berikut ini. Tabel 1. Perhitungan Node 1 Jumlah . Tidak layak Entrophy Wiraswasta Buruh Guru/Honorer Kuli Bangunan Karyawan ART Rendah Cukup Tinggi 1 dan 2 SMP SMA Papan Batu Semi Permanen Total Gain Kolom entrophy pada baris total dihitung dengan persamaan . sebagai berikut : Entrophy . = - . * LOG2. - . * LOG2. Entrophy . = 0. Kemudian pada nilai gain pada baris C2 dihitung persamaan . sebagai berikut :Gain . otal,C. = . - (. *0 . * 0. * . Gain . otal,C. = 0. Dari hasil perhitungan pada tabel 4. 1 diperoleh atribut yang menjadi node . adalah C2 memiliki gain tertinggi yaitu 0. 46880137, dimana terdiri dari 3 sub atribut yaitu Rendah (Berpenghasilan Renda. Cukup (Berpernghasilan Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Cuku. , dan Tinggi ( Berpenghasilan Tingg. Berdasarkan nilai entrophy dari ketiga sub atribut diatas, sub atribut rendah sudah memiliki keputusan dan atribut tinggi sudah memperoleh keputusan, sedangkan sub atribut cukup belum memperoleh keputusan. Maka perlu dilakukan perhitungan lebih lanjut untuk menetukan node akar selanjutnya, dapat digambarkan pohon keputusan dari tabel diatas sebagai berikut: Gambar 1. Pohon Keputusan 1 Untuk hasil perhitungan selanjutnya algoritma C4. 5 dapat ditunjukkan pada tabel berikut ini Tabel 2. Perhitungan Node 1. Jumlah . Tidak layak Entrophy Wiraswasta Buruh Guru/Honorer Kuli Bangunan Karyawan ART 1 dan 2 SMP SMA Papan Batu Semi Permanen C2-Cukup Gain Dari hasil perhitungan diatas pada tabel 4. 2, atribut yang menjadi Node cabang dari atribut C2 Ae Cukup adalah C5. Dimana atribut dari C5 yang terdiri dari Papan. Batu. Semi Permanen. Dimana C5-Papan dan C5-Batu sudah memperoleh keputusan Layak. Sedangkan untuk sub atribut C5-Semi Permanen belum memperoleh keputusan maka akan dilakukan perhitungan kembali. Maka dapat digambarkan pohon keputusan dari tabel diatas sebagai berikut : Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Gambar 2. Pohon Keputusan 2 Dalam mencari hasil perhitungan seanjutnya pada node akar C2-Cukup dan C5-Semi Permanen dapat ditunjukkan pada tabel berikut ini. Tabel 3. Perhitungan node 1. Jumlah . Tidak Wiraswasta Buruh Guru/Honorer Kuli Bangunan Karyawan ART 1 dan 2 SMP SMA C2-Cukup dan C5-Semi Permanen Entrophy Gain Dari hasil perhitungan pada tabel 4. 3, atribut yang menjadi node cabang dari C2-Cukup dan C5-Semi Permanen adalah C1. Dimana sub atribut sudah menghasilkan keputusan sehingga perhitungan sudah selesai. Maka dapat digambarkan pohon keputusan dari tabel diatas sebagai berikut : Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Gambar 3. Pohon Keputusan 3 Pengujian Data Menggunakan Rapidminer Setelah dilakukan pengolahan data secara manual menggunakan algoritma C4. 5, selanjutnya dilakukan pengujian data menggunakan Tools Rapidminer untuk mencari rules dan accuracy serta kesamaan dari hasil perhitungan ,manual dengan menggunakan tools rapidminer. Berikut adalah Tampilan dari port decision tree, apply model dan performance. Gambar 4. Tampilan menghubungkan port decision tree, apply model dan Selanjutnya hubungkan port-port dari operator decision tree, operator Apply Model dan operator Performance seperti gambar diatas, kemudian klik icon Run pada toolbar untuk menampilkan hasil sebagai berikut: Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Gambar 5. Hasil decision tree Setelah dilakukan perhitungan dan pengujian data pada masing-masing atribut dengan algoritma C4. 5, maka akan didapatkan pola pohon keputusan akhir. Gambar 6. Deskripsi decision tree Gambar di atas menunjukkan hasil deskripsi secara lengkap dari pohon keputusan . ecision tre. yang telah terbentuk dengan menggunakan algoritma C4. Dari hasil deskripsi juga menunjukkan bahwa penggunaan data mining algoritma C4. 5 baik digunakan dalam proses menggali data . ata mining proces. untuk menarik beberapa kesimpulan yang divisualisasikan dengan pohon keputusan . ecision tre. Berikut ini rules yang dihasilkan dari pohon keputusan Tabel 4. Rule yang dihasilkan Rules Jika C2 = Cukup dan C5 = Papan Jika C2 = Semi Permanen dan C1 = Buruh Jika C1 = Karyawan Keputusan Layak Tidak Layak Layak Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Rules Jika C1 = Kuli Bangunan Jika C1 = Wiraswasta Jika C5 = Rendah Jika C5 = Tinggi Keputusan Layak Tidak Layak Layak Layak Gambar 7. Nilai Akurasi Algoritma C4. Hasil tingkat akurasi dan nilai AUC bisa kita lihat dan ketahui bersama dengan meng-klik tab PerformanceVector (Performanc. , maka akan terlihat hasil accuracy nya seperti gambar diatas. Dimana model yang telah dibentuk diuji tingkat akurasinya dengan memasukan atau uji yang berasal dari data training dengan menggunakan split validation pada aplikasi rapidminer studio 5. 3 untuk menguji tingkat akurasi. Dengan aplikasi rapidminer studio 5. 3 dihasilkan nilai akurasi, nilai class recall dan nilai class precision dijelaskan bahwa kategori AuLayakAy menghasilkan class recall sebesar 100. 00% dan class precision sebesar 100. dan kategori AuBerpotensiAy menghasilkan class recall sebesar 100. 00% dan class precision sebesar 100 %. Dan hasil akurasi diatas dari perhitungan algoritma C4. tersebut adalah sebesar 100. Gambar 8. Nilai Performance Vector Algoritma C4. Berdasarkan pengolahan data menggunakan software RapidMiner didapat nilai akurasi sistem sebesar 100,00%, artinya bahwa rule yang dihasilkan tingkat kebenaran mendekati 100%. Dimana model yang telah dibentuk diuji tingkat akurasinya dengan memasukan atau uji yang berasal dari data training dengan menggunakan split validation pada aplikasi rapidminer 5. 3 untuk menguji tingkat SIMPULAN Berdasarkan seluruh hasil tahapan penelitian yang telah dilakukan pada Penerapan Algoritma C4. 5 dalam mengklasifikasi masyarakat yang berhak menerima bantuan Kartu Keluarga Sejahtera (KKS) secara layak dapat disimpulkan sebagai berikut: Penerapan Algoritma C4. 5 Dalam Klasifikasi Penerima Kartu Keluarga Sejahtera (Arief Prajok. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 171-180 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik . Bahwa C2 (Penghasilan Kepala Keluarg. memiliki gain tertinggi yaitu . Permasalahan menentukan masyarakat yang layak dan tidak layak dapat diselesaikan menggunakan teknik data mining, yaitu dengan Algoritma C4. menghasilkan 8 (Delapa. rules dan Tingkat akurasi yang dihasilkan oleh metode tersebut adalah 100,00%. Dengan adanya penerapan data mining algoritma C4. 5 diharapkan mampu memberikan solusi kepada perangkat desa Nagori Mekar Rejo dalam menentukan masyarakat yang berhak dalam menerima bantuan Kartu Keluarga Sejahtera (KKS) DAFTAR PUSTAKA