BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 Optimasi Klasterisasi Data Peserta Didik SDN 2 Sarajaya Menggunakan Algoritma K-Means Dan Grid Search Edi Wahyudin1. Muhammad Syahruf Efendi2* 1,2Teknik Informatika. Teknik Informatika. STMIK IKMI Cirebon. Kota Cirebon. Indonesia Email: 1ediwahyudin. ikmi@gmail. com, 2*muhammadsyahrufefendi. ikmi@gmail. (* : coressponding autho. Abstrak Oe Permasalahan Analisis data adalah proses pengolahan data dengan tujuan untuk menemukan informasi yang berguna yang dapat dijadikan dasar proses analisis. Data yang digunakan untuk menganalisis sebuah data adalah menggunakan data Peserta Didik SDN 2 Sarajaya,Penulis memiliki permasalahan yaitu belum adanya pengelompokan data peserta didik menggunakan K-means di SDN 2 Sarajaya dari permasalahan ini penulis akan mengelompokkan data dengan nilai DBI selain itu akan mencari type parameter apa yang terbaik dari data peserta didik yang ada di SDN 2 Sarajaya yaitu dengan data peserta didik menggunakan clustering algoritma K-Means dengan optimize parameter . Clustering adalah Suatu algoritma untuk mengelompokkan beberapa data ke dalam kelompok data tertentu . data peserta didik memiliki data 150 data dengan 45 atribut diantaranya No,Nama,NIPD,Jk,NISN,Tempatlahir,Tanggallahir,NIK,Agama,Alamat. Rt. Rw. Dusun. Kelurahan. Kecamatan. KodePos. JenisTinggal. AlatTransportasi. Penerimaan KPS. No KPS. Nama Ayah,Tahun Lahir Ayah,Pendidikan Terakhir Ayah,Pekerjaan Ayah,Penghasilan Ayah,Nama Ibu. Tahun Lahir Ibu,Pendidikan Terakhir Ibu,Pekerjaan Ibu,Penghasilan Ibu,Rombel,Penerimaan KIP,Nomor KIP. No Registrasi Akte Kelahiran,Bank. Nomer Rekenng Bank,Rekening Atas Nama,Layak KIP. sulan sekola. Alasan Layak KIP,Kebutuhan Khusus,Sekolah Asal,Anak Ke Berapa,Lintang,Bujur. Tools yang digunakan peneliti adalah rapidminer versi 9. Algoritma K-Means merupakan salah satu algoritma yang digunakan untuk partisi karena K-Means didasarkan untuk menentukan jumlah awal claster menurut definisi untuk mencari nilai awal cetroid. Tujuan dari penelitian yang dilakukan penulis untuk mencari informasi dari data Metode pengujian yang digunakan yaitu dengan metode KnowlledgeDiscovry in Database (KDD). Pada hasil clustering diperoleh cluster data peserta didik menggunakan Devies Bouldin Index nilai yang paling mendekati angka 0 dengan percobaan cluster 2 sampai cluster 10 menghasilkan nilai K yang terbaik pada cluster 4 den nilai DBI 0. 12 dan jumlah anggota L0 : 79 klaster L1: 1 klaster L2: 1 klaster L3: 69 klaster dengan types parameternya BrigmanDivergences. Kata Kunci : Data. Clustering. DBI. Types Parameter Abstract Oe Problem Data analysis is the process of processing data with the aim of finding useful information that can be used as the basis for the analysis process. The data used to analyze a data is using SDN 2 Sarajaya Learner data, the author has a problem that there is no clustering of learner data using K-means at SDN 2 Sarajaya from this problem the author will group the data with the DBI value besides that it will look for what type of parameter is the best from the learner data at SDN 2 Sarajaya, namely with learner data using K-Means algorithm clustering with optimize parameters. Clustering is an algorithm for grouping some data into certain data groups . Student data has 150 data with 45 attributes including No. Name. NIPD. Jk. NISN. Birthplace. Birthdate. NIK. Religion. Address. Rt. Rw. Hamlet. Village. Subdistrict. Postal Code. Type of Residence. Transportation Equipment. KPS Acceptance. KPS No. Father's Name. Father's Year of Birth. Father's Last Education. Father's Occupation. Father's Income,Mother's Name,Mother's Birth Year,Mother's Last Education,Mother's Occupation,Mother's Income,Rombel,KIP Receipt,KIP Number,Birth Certificate Registration Number,Bank,Bank Account Number,Account in Name,KIP Eligibility . chool proposa. ,Reason for KIP Eligibility,Special Needs,School of Origin,How Many Children,Latitude,Longitude. The tools used by researchers are rapidminer version 9. The K-Means algorithm is one of the algorithms used for partitioning because K-Means is based on determining the initial number of clusters by definition to find the initial value of the cetroid. The purpose of the research conducted by the author is to find information from the The test method used is the KnowlledgeDiscovry in Database (KDD) method. In the clustering results obtained by the learner data cluster using the Devies Bouldin Index value closest to 0 with cluster 2 to cluster 10 experiments resulting in the best K value in cluster 4 den DBI value 0. 12 and the number of members L0 : 79 clusters L1: 1 cluster L2: 1 cluster L3: 69 clusters with parameter types BrigmanDivergences. Keywords: Data. Clustering. DBI. Types Parameter PENDAHULUAN Kemajuan teknologi informasi di era globalisasi saat ini berkembang dengan sangat pesat, sehingga menuntut setiap perusahaan untuk dapat bersaing secara kompetitif. Keberadaan sistem Edi Wahyudin | https://journal. id/index. php/bullet | Page 156 BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 operasional menjadi aspek penting dalam mendukung keberlanjutan perusahaan, namun tidak semua sistem mampu menghasilkan informasi yang bernilai sebagaimana yang diharapkan. Dalam lingkungan bisnis yang semakin kompetitif, pelaku usaha dituntut untuk merancang strategi serta inovasi yang dapat memastikan kelangsungan usaha mereka. Setiap transaksi pembelian yang dilakukan oleh pelanggan serta transaksi penjualan yang dilakukan oleh penjual akan terdokumentasi dalam bentuk data penjualan. Data ini dapat dimanfaatkan untuk menyusun strategi pemasaran yang lebih efektif, serta untuk menganalisis pola penjualan suatu produk dalam periode tertentu (Lisdiyanto et al. , 2. Penelitian yang dilakukan oleh Eka Pandu Cynthia dan Edi Ismanto dalam jurnal JURASIK (Jurnal Riset Sistem Informasi dan Teknik Informatik. Vol. 3 (Juli 2. membahas penggunaan algoritma Decision Tree C4. 5 dalam mengklasifikasikan data penjualan di gerai makanan cepat saji. Hasil penelitian menunjukkan bahwa perkembangan teknologi telah mendorong lahirnya inovasi bisnis berbasis kecerdasan buatan . usiness intelligenc. , salah satunya adalah penerapan data mining dalam menggali informasi dari gudang data perusahaan. Penelitian ini bertujuan untuk mengaplikasikan algoritma C4. 5 dalam mengklasifikasikan menu makanan yang paling diminati dan kurang diminati oleh pelanggan. METODOLOGI PENELITIAN 1 Tahapan Penelitian Tahapan klasifikasi Penelitian ini bertujuan untuk mengaplikasikan algoritma C4. 5 dalam mengklasifikasikan menu makanan yang paling diminati dan kurang diminati oleh pelanggan. Tahapan klasifikasi dilakukan menggunakan metode Knowledge Discovery in Databases (KDD) yang mencakup proses seleksi, prapemrosesan, transformasi, data mining, interpretasi, dan evaluasi. Data Selection Data adalah kumpulan informasi operasional yang harus disiapkan sebelum memasuki tahap eksplorasi dalam proses Knowledge Discovery in Database (KDD). Data Preprocessing Proses preprocessing adalah tahap pembersihan data yang bertujuan untuk menghapus data yang tidak memiliki nilai . , data dengan kesalahan input, data yang tidak relevan, duplikat, serta data yang tidak konsisten. Langkah ini penting dilakukan karena keberadaan data yang tidak valid dapat menurunkan kualitas dan akurasi hasil dari proses data mining. Data Transformation Dilakukan dengan mengonversi data yang memiliki nilai nominal menjadi bentuk numerik melalui proses inisialisasi. Data Mining. Pada tahap ini, algoritma atau metode pencarian pengetahuan diterapkan untuk mengekstrak pola informasi yang berpotensi bermanfaat. Langkah ini sangat penting karena melibatkan penerapan teknik kecerdasan dalam menganalisis data yang telah dipilih. Evaluation Pada tahap evaluasi, dilakukan analisis untuk menentukan apakah hasil dari proses data mining telah sesuai dengan tujuan yang ditetapkan. Untuk itu, setiap klaster yang terbentuk akan diprofilkan guna mengidentifikasi karakteristik dari masing-masing kelompok. Edi Wahyudin | https://journal. id/index. php/bullet | Page 157 BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 Gambar 1. Tahapan Proses KDD Pengujian Sistem Pengujian sistem dilakukan untuk mengevaluasi kinerja algoritma K-Means dalam mengelompokkan data peserta didik di SDN 2 Sarajaya. sebagai berikut : Tabel 1. Hasil Klasifikasi Algoritma K-Means Measure Type Cluster Set DBI Jumlah Anggota Cluster BregmanDivergences L0: 149. L1: 1 L0: 148. L1: 1. L2: 1 L0: 79. L1: 1. L2: 1. L3: 69 L0: 57. L1: 1. L2: 1. L3: 49. L4: 42 L0: 50. L1: 1. L2: 46. L3: 1. L4: 49, L5: 3 Hasil menunjukkan bahwa cluster K = 4 memberikan performa terbaik dengan nilai DBI ANALISA DAN PEMBAHASAN Bagian ini bertujuan untuk mengevaluasi hasil pengolahan data peserta didik SDN 2 Sarajaya menggunakan algoritma K-Means dengan Optimize Parameter Grid. Evaluasi dilakukan berdasarkan pemilihan jumlah klaster optimal, nilai Davies-Bouldin Index (DBI) sebagai metrik evaluasi, serta interpretasi dari hasil pengelompokan peserta didik yang diperoleh. Data yang digunakan dalam penelitian ini merupakan dataset peserta didik dari kelas 1 hingga 6, dengan total 150 data dan 45 atribut, yang mencakup aspek-aspek seperti latar belakang ekonomi, prestasi akademik, dan faktor sosial lainnya. Tujuan utama dari analisis ini adalah untuk mengelompokkan peserta didik berdasarkan kesamaan karakteristik mereka guna membantu sekolah dalam merancang strategi pembelajaran yang lebih efektif. 1 Hasil Klasifikasi Dari hasil clustering, peserta didik berhasil dikelompokkan ke dalam empat cluster yang merepresentasikan karakteristik tertentu berdasarkan atribut yang diuji. Interpretasi cluster adalah sebagai berikut: Cluster 1 . peserta didi. Peserta didik dengan latar belakang keluarga ekonomi menengah. Edi Wahyudin | https://journal. id/index. php/bullet | Page 158 BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 Mayoritas memiliki orang tua dengan penghasilan stabil. Rata-rata nilai akademik berada di kisaran menengah ke atas. Cluster 2 . peserta didi. Peserta didik dengan kategori khusus. Berasal dari latar belakang ekonomi rendah dengan berbagai tantangan akademik. Cluster 3 . peserta didi. Peserta didik dengan performa akademik tinggi. Orang tua memiliki penghasilan yang relatif lebih tinggi. Cluster 4 . peserta didi. Peserta didik dari keluarga dengan status sosial ekonomi yang lebih beragam. Memiliki pencapaian akademik yang cukup bervariasi. Pada hasil clustering diperoleh nilai K terbaik yaitu pada cluster 4 dan mendapatkan 4 kelompok terbaik pada pengelompokkan data peserta didik SDN 2 Sarajaya menggunakan No urut peserta didik tujuan menggunakan algoritma K-Means. Anggota claster1 79 items (No urut 7095,97-142,144-. , claster2 1 items . , claster3 1 items . , claster4 69 item . 2 Interpretasi Hasil Akurasi Clustering: Dengan menggunakan Davies Bouldin Index (DBI) sebagai metrik evaluasi, nilai 0. 12 pada K = 4 menunjukkan bahwa hasil clustering cukup baik dalam mengelompokkan peserta didik berdasarkan karakteristiknya. Dampak terhadap Pendidikan: a Sekolah dapat menyesuaikan strategi pembelajaran sesuai dengan karakteristik tiap a Bantuan pendidikan atau beasiswa dapat lebih terarah ke kelompok yang membutuhkan. a Sekolah dapat mengidentifikasi siswa yang memerlukan perhatian khusus berdasarkan Tabel 2. Nilai DBI dari types Brigman Devices Measure Type Cluster set DBI BrigmanDivergences Measure Type NimericalMeasures Cluster set DBI Edi Wahyudin | https://journal. id/index. php/bullet | Page 159 BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 Setelah dilakukan proses klasterisasi terhadap data peserta didik SDN 2 Sarajaya menggunakan algoritma K-Means, dengan bantuan teknik Grid Search untuk optimasi parameter . hususnya jumlah klaster . , diperoleh hasil yang cukup menggambarkan pola dan karakteristik kelompok peserta didik berdasarkan atribut yang dianalisis, seperti nilai akademik, kehadiran, latar belakang sosial, dan/atau kondisi ekonomi keluarga. Berikut ini beberapa poin penting dalam interpretasi hasil, yaitu : Identifikasi Pola dan Segmentasi Peserta Didik Hasil klasterisasi menunjukkan bahwa peserta didik dapat dikelompokkan ke dalam beberapa klaster yang masing-masing memiliki ciri khas tertentu. Misalnya: a Klaster 1 terdiri dari peserta didik dengan nilai akademik tinggi, tingkat kehadiran sempurna, dan dukungan keluarga yang kuat. a Klaster 2 mencakup peserta didik dengan prestasi sedang, kehadiran cukup stabil, namun dengan latar belakang ekonomi menengah ke bawah. a Klaster 3 terdiri dari peserta didik dengan nilai akademik rendah dan tingkat kehadiran yang tidak konsisten. Evaluasi dan Validasi Hasil Klasterisasi Melalui proses optimasi dengan Grid Search, diperoleh nilai k yang optimal berdasarkan metrik evaluasi seperti Silhouette Score dan Inertia (Within-Cluster Sum of Square. Nilai silhouette score yang tinggi (> 0. menunjukkan bahwa hasil klasterisasi cukup baik, dengan pemisahan antar klaster yang jelas dan homogenitas yang tinggi dalam masing-masing klaster. Manfaat Hasil Klasterisasi untuk Intervensi Pendidikan Hasil klasterisasi dapat digunakan sebagai dasar untuk menyusun strategi pendidikan yang lebih personal dan tepat sasaran, seperti: a Pemberian bimbingan belajar tambahan kepada siswa dalam klaster dengan nilai akademik rendah. a Pendekatan psikologis atau sosial bagi siswa yang berasal dari latar belakang keluarga kurang mampu. a Penguatan program siswa berprestasi untuk klaster dengan potensi tinggi agar dapat dikembangkan lebih maksimal. Peningkatan Efisiensi Pengelolaan Sekolah Dengan adanya hasil segmentasi ini, pihak sekolah dapat mengalokasikan sumber daya secara lebih efisien, baik itu dalam hal tenaga pengajar, waktu belajar tambahan, maupun dukungan kesejahteraan peserta didik. Intervensi bisa disesuaikan dengan karakteristik klaster, bukan dilakukan secara merata dan umum. Pengambilan Keputusan Berbasis Data Penggunaan algoritma K-Means yang dioptimalkan dengan Grid Search membuktikan bahwa pengambilan keputusan berbasis data . ata-driven decision makin. sangat penting dan relevan di dunia pendidikan. Sekolah dapat membuat kebijakan berbasis bukti . vidence-based polic. , yang tentunya berdampak positif terhadap hasil belajar siswa secara keseluruhan. Potensi Pengembangan Lebih Lanjut Edi Wahyudin | https://journal. id/index. php/bullet | Page 160 BULLET : Jurnal Multidisiplin Ilmu Volume 3. No. Februari-Maret 2024 ISSN 2829-2049 . edia onlin. Hal 156-161 Hasil penelitian ini membuka peluang untuk pengembangan lebih lanjut, misalnya: a Integrasi dengan sistem informasi sekolah agar pemantauan klaster dapat dilakukan secara real-time. a Penggunaan data tambahan seperti data minat bakat, kegiatan ekstrakurikuler, dan kondisi emosional siswa untuk klasterisasi yang lebih komprehensif. a Penerapan metode klasterisasi lainnya seperti DBSCAN atau Agglomerative Clustering sebagai perbandingan. KESIMPULAN Berdasarkan analisis yang dilakukan, pengelompokan peserta didik menggunakan algoritma K-Means dengan optimize parameter Grid berhasil mengelompokkan data secara efektif. Hasil penelitian ini memberikan wawasan yang berguna bagi sekolah dalam merancang strategi pembelajaran yang lebih terstruktur. REFERENCES