Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta Algoritma K-Means Untuk Klasterisasi Kampung Di Desa Bojong Berdasarkan Tingkat Pendidikan Yovi Yuliantin1. Ahmad Faqih2. Kaslani3 STMIK IKMI CIREBON123 yoviyuliantin18@gmail. com1, ahmadfaqih367@gmail. com2, kaslani@ikmi. Abstrak - Desa Bojong menghadapi tantangan dalam memetakan tingkat pendidikan penduduknya secara terstruktur. Meskipun data tersedia, kurangnya pengorganisasian menyebabkan kesenjangan akses pendidikan, terutama di wilayah-wilayah tertentu. Penelitian ini bertujuan untuk mengelompokkan tingkat pendidikan warga Desa Bojong menggunakan algoritma K-Means, sehingga dapat memberikan wawasan yang lebih mendalam tentang kondisi pendidikan masyarakat. Data yang digunakan mencakup 6. 027 penduduk dari 10 kampung, dengan atribut seperti usia, pendidikan terakhir, pekerjaan, dan status pernikahan. Proses analisis mengikuti tahapan Knowledge Discovery in Database (KDD) dan dilakukan menggunakan perangkat lunak RapidMiner. Hasil penelitian menunjukkan bahwa jumlah klaster yang ideal adalah 7, dengan nilai terbaik 0,467 untuk DaviesBouldin Index (DBI). Setiap klaster menunjukkan tingkat pendidikan tertentu. Cluster 6 memiliki tingkat pendidikan yang sangat tinggi, dengan banyak penduduk yang sampai perguruan tinggi. Sementara itu. Cluster 0 terdiri dari orang-orang yang hanya tamat SD atau bahkan tidak sekolah. Studi ini menunjukkan distribusi pendidikan di Desa Bojong. Hasil ini dapat membantu pemerintah desa membuat program pendidikan yang lebih baik. Kampung dengan tingkat pendidikan rendah dapat berkonsentrasi pada program yang meningkatkan akses pendidikan dasar, seperti literasi dan subsidi pendidikan, sedangkan kampung dengan tingkat pendidikan tinggi dapat berkonsentrasi pada pengembangan program pendidikan lanjutan atau pelatihan vokasional. Metode ini diharapkan dapat membantu Desa Bojong mengatasi kesenjangan pendidikan dan meningkatkan kualitas hidup warganya dengan menyediakan program yang tepat sasaran. Selain itu, penelitian ini membantu implementasi algoritma K-Means dalam pengelompokan data pendidikan di daerah pedesaan. Kata Kunci : K-Means Clustering, tingkat pendidikan, klasterisasi, pendidikan desa. RapidMiner Abstract - Bojong village faces challenges in mapping the education level of its residents in a structured way. Although data is available, the lack of organization leads to disparities in access to education, especially in certain areas. This study aims to cluster the education level of Bojong Village residents using the K-Means algorithm, so as to provide a deeper insight into the educational condition of the community. The data used includes 6, residents from 10 villages, with attributes such as age, latest education, occupation, and marital status. The analysis process followed the Knowledge Discovery in Database (KDD) stage and was conducted using RapidMiner software. The results showed that the ideal number of clusters was 7, with the best value of 0. 467 for the Davies-Bouldin Index (DBI). Each cluster shows a certain level of education. Cluster 6 has a very high level of education, with many residents attending university. Meanwhile. Cluster 0 consists of people who only finished elementary school or did not even go to school. This study shows the distribution of education in Bojong Village. These results can help village governments create better education programs. Villages with low education levels can concentrate on programs that improve access to basic education, such as literacy and education subsidies, while villages with high education levels can concentrate on developing further education programs or vocational training. This method is expected to help Bojong Village overcome the education gap and improve the quality of life of its citizens by providing targeted programs. In addition, this research helps implement the K-Means algorithm in clustering education data in rural areas. Keywords: K-Means Clustering, education level, clustering, village education. RapidMiner PENDAHULUAN Bidang informatika yang berkembang pesat telah mengubah banyak aspek kehidupan, seperti teknologi, bisnis, dan pendidikan . Metode seperti data mining dan klasterisasi dari pendidikan masyarakat yang lebih akurat dalam Metode pengambilan yang lebih tepat dan terarah dari berbagai kebijakan strategis pendidikan. Pada ISSN: 2338-9761 (Onlin. akhirnya, ini akan menghasilkan peningkatan kualitas pendidikan di daerah tertentu. Algoritma K-Means, memberikan wawasan tentang distribusi pendidikan dan membantu dalam menentukan program mana yang harus diprioritaskan di daerah pedesaan yang selama ini kurang terjangkau oleh program pendidikan formal . Pendidikan merupakan faktor penting dalam Desa Bojong memiliki data Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta pendidikan yang tidak terorganisir dengan baik, yang menyebabkan kesenjangan pendidikan di beberapa wilayahnya. Penelitian ini bertujuan untuk menyediakan peta distribusi pendidikan yang lebih akurat dengan menggunakan algoritma K-Means, yang diharapkan dapat membantu pemerintah desa membuat program pendidikan yang lebih tepat sasaran Penelitian dilakukan oleh (Gustino & Suprapti, 2. di Kecamatan Krangkeng menunjukkan bahwa klasterisasi dengan K-Means memberikan hasil signifikan dalam pemetaan tingkat pendidikan Selain itu, (Setianingsih & Alli, 2. menggunakan metode yang sama untuk menunjukkan bahwa K-Means efektif dalam (Novitasari et al. , 2. menganalisis tingkat kemiskinan dengan menggunakan K-Means. Mereka menunjukkan bahwa teknik ini dapat menangani data yang sangat besar dan menghasilkan klaster yang representatif. Meskipun penelitian-penelitian tersebut belum fokus pada pemetaan pendidikan di wilayah pedesaan seperti Desa Bojong, sehingga penelitian ini bertujuan untuk melengkapi kesenjangan tersebut. Penelitian mengidentifikasi dan mengelompokkan tingkat pendidikan penduduk di Desa Bojong menggunakan algoritma K-Means Clustering. Kontribusi utama dari penelitian ini adalah menyediakan peta distribusi pendidikan yang lebih akurat, yang dapat membantu pemerintah daerah dalam merancang program intervensi yang lebih efektif. Data Mining Proses pengolahan data menggunakan algoritma K- Means. Dalam menentukan jumlah menggunakan Elbow Method. Kemudian akan dilakukan pengolahan data menggunakan hasil Elbow Method dan algoritma K-Means (Abdussalam Amrullah et al. , 2. Beberapa penelitian telah menerapkan data mining dalam pendidikan. (Hasanah et al. menggunakan metode clustering untuk menentukan minat siswa terhadap mata pelajaran tertentu. Hasil penelitian mereka membantu sekolah dalam merancang program belajar yang lebih sesuai dengan kebutuhan Namun, penelitian ini masih terbatas pada pengelompokan minat dan tidak mempertimbangkan faktor sosial-ekonomi yang lebih luas. Dalam mempertimbangkan faktor tambahan seperti ISSN: 2338-9761 (Onlin. pekerjaan dan status pernikahan. Hal ini membedakannya dari penelitian sebelumnya yang hanya berfokus pada aspek pendidikan Clustering Algoritma yang banyak digunakan dalam clustering adalah K-Means, yang bekerja dengan membagi data menjadi k kelompok berdasarkan jarak ke centroid yang ditentukan (Basalamah & Setyadi, 2. (Gustino Suprapti, masyarakat di Kecamatan Krangkeng menjadi tiga klaster. Penelitian ini menggunakan data dari kantor kecamatan dan menunjukkan perencanaan pendidikan daerah. Namun, pekerjaan dan status pernikahan sebagai faktor K-Means K-means adalah salah satu algoritma clustering yang menggunakan metode partisi. K-means adalah algoritma clustering yang membagi masing-masing item data ke dalam satu cluster (R. Kurniawan et al. , 2. (Putri et al. , 2. Penelitian yang telah dilakukan, metode K-Means Clustering dapat Indonesia berdasarkan indikator pendidikan dengan cukup baik yang diukur dengan metode Silhouette Coefficient dengan struktur cluster standar dengan nilai 0. 6308 dengan parameter Selanjutnya, penentuan jumlah cluster terbaik dilakukan dengan melakukan percobaan menggunakan nilai K = 2 hingga K = 7. RapidMiner RapidMiner adalah perangkat lunak analisis data yang sering digunakan untuk data mining Platform memungkinkan pengguna untuk melakukan analisis data secara visual tanpa perlu menulis kode (Saputro & Sucihermayanti, 2. II. METODOLOGI PENELITIAN Melakukan klasterisasi data berdasarkan tingkat pendidikan, penelitian ini menggunakan pendekatan kuantitatif dan metode data mining, algoritma K-Means dipilih karena kemampuan untuk mengelompokkan data ke dalam klaster berdasarkan kesamaan fitur, seperti atribut Dalam penelitian data dn tahapan penelitian sebagai berikut: Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta Sumber : Olahan Penulis . Gambar 1. Metode penelitian Dari Gambar 1 tentang metode penelitian dapat dijelaskan sebagai berikut : Pengumpulan Data Mengumpulkan masyarakat kampung dari Kantor Desa Bojong. Seleksi Data dan Pemilihan Atribut Memastikan bahwa hanya data yang relevan dan berguna yang digunakan untuk analisis lebih lanjut Mempersiapkan Data Untuk menyediakan data untuk analisis, diperlukan untuk data berbagai skala. Ini diperlukan agar algoritma K-Means dapat melakukan klasterisasi dengan baik. Analisis K-Means dan Hasil Algoritma K-Means digunakan untuk mengelompokkan data berdasarkan tingkat Penduduk Desa Bojong saat ini berdasarkan kriteria tertentu, seperti tingkat pendidikan mereka. Sebelum ini, jumlah klaster k harus ditentukan Evaluasi hasil Keputusan dan tindakan proses data mining untuk nilai hasil Rapidminer dan DBI. Data yang digunakan yaitu data yang diambil bersumber dari kantor Desa Bojong adalah data yang terkait dengan pengelompokan kampung di desa bojong berdasarkan tingkat Pendidikan. Dari 10 kampung dan 9 atribut diantaranya adalah nama, alamat, tempat tanggal lahir, usia. Pendidikan terakhir, pekerjaan dan status. Data ini langsung di ambil dari tangan pertama tanpa perantara Peneliti mendapatkan data sekunder dengan izin untuk melihat data warga desa bojong. Penelitian ini mencakup semua warga Desa Bojong, dari anak-anak hingga orang dewasa. ISSN: 2338-9761 (Onlin. dengan berbagai latar belakang pendidikan. Untuk menganalisis distribusi pendidikan dan menetapkan kebijakan yang diperlukan untuk meningkatkan kualitas pendidikan di desa. Dalam penelitian ini, metode purposive sampling digunakan karena peneliti ingin tertentu, yaitu individu dengan latar belakang pendidikan yang jelas dan relevan untuk analisis klaster. Dengan menggunakan metode purposive sampling, dengan kriteria sebagai berikut : . Penduduk yang memiliki data pendidikan yang lengkap. Minimal usia 6 tahun untuk memastikan data relevan dengan pendidikan formal dan . Jumlah data setiap memastikan klasterisasi memiliki distribu yang Selain itu, sebelum dilakukan analisis,data mengalami proses normalisasi dilakukan uji dengan k=3 sampai k=7 . Pengumpulan data ini menggunakan data metode pengumpulan secara primer yang dimana peneliti memperoleh data langsung dari sumber yaitu dari kantor Desa Bojong. Tujuan utama observasi adalah untuk mengumpulkan data tingkat pendidikan dari setiap kampung di Desa Bojong dan Kemudian disimpan dalambentuk Excel. Penelitian ini menggunakan algoritma K-Means untuk clustering. Tujuannya adalah untuk menyatukan data penduduk berdasarkan tingkat pendidikan di berbagai kampung di Desa Bojong. Dengan menggunakan teknik ini, diharapkan dapat ditemukan kelompok yang memiliki karakteristik pendidikan tertentu (Oktarian Karakteristikkarakteristik ini dapat digunakan sebagai dasar untuk perencanaan dan intervensi pendidikan yang lebih baik. Mengubah data mentah menjadi informasi bermanfaat adalah tujuan dari proses KDD, yang terdiri dari sejumlah tahapan yang sistematis. Tahapan KDD dapat sebagai berikut: Sumber: Olahan Penulis . Gambar 2. Proses KDD Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta Vol. 13 No. 1 - Tahun 2025 Proses Knowledge Discovery Database (KDD) Sebagai Berikut: Pre-processing Pre-processing/Cleaning Penyeleksian data yang bisa dipakai. Pembersihan data meliputi: menghapus duplikasi data, membetulkan kesalahan data (Gustino & Suprapti, 2. Transformation Transformation ini yang dilakukan adalah mentransformasikan bentuk data yang belum memiliki entitas yang jelas kedalam bentuk data yang valid atau siap untuk dilakukan proses Data Mining (Setianingsih & Alli, 2. Data Mining Melakukan pengujian dengan menerapkan algoritma K-means dan tools Rapidminer untuk membentuk model cluster (Awaliah et , 2. Evaluation Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang Tahap ini merupakan bagian dari proses KDD yang disebut dengan interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya (M. Kurniawan et al. , 2. Knowledge Di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah diberikan kepada user (Romli & Dewi Puspita, 2. HASIL DAN PEMBAHASAN Hasil Peneltian Data Selection Dengan menggunakan Algoritma KMeans, kami akan mengolah data pengelompokan kampung dari Desa Bojong, yang terdiri dari 6. 027 data warga yang memiliki 9 atribut, yaitu nama, alamat, tempat tanggal lahir, usia, pendidikan terakhir, pekerjaan, dan status. Gamabaran lengkap dataset sebelum rekap ditunjukkan di bawah ini: --- SLT A/S ISSN: 2338-9761 (Onlin. Status Dalam Keluarga Statsus Pekerjaan Lak iLak Usia Pendidika Agama Tempat Lahir Tanggal Lahir Rt/Rw Jenis Kelamin Alamat Nama No. Tabel 1. Select data Per Dipl IV/S Per SLT A/S Per SLT P/S ------ Lak iLak Tida Sek --------- --- --------- ------------ --------------- ------ ----- Lak iLak Tam Sd/ Sed Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta Vol. 13 No. 1 - Tahun 2025 Lak iLak Belu Tam Sd/ Sed Sumber: Olahan Penulis . Tabel di atas menunjukkan gambar data lengkap yang diberikan oleh kantor desa Bojong dalam format Excel. Data ini belum direkap untuk pendidikan di desa Bojong. Dari data tersebut hanya perlu rekapan data dari pendidikan terakhir warga kampung di desa bojong saja saja dan hasilnya menjadi 11 atribut dan dapat dilihat pada gambar 4. di bawah. Grand Total Diploma IV/Strata I Akademi/Diploma i/S. Muda Strarata II ISSN: 2338-9761 (Onlin. Diploma I/ II Strata i Belum sekolah SLTA SLTP Tamat SD Pasir Huut (Rw . Duru Tengah . Kp. Pame (Rw . Durung Kidul 1 (Rw . Durung Kidul 2 (Rw . Cibisoro 1 (Rw Cibisoro 2 (Rw Tidak tamat SD Kampung No. Tabel 2. Hasil Rekapan Data Cibis (Rw . Cijauh (Rw . Cibisoro (Rw . Grand Total Sumber: Olahan Penulis . Preprocessing Dalam tahapan Preprocessing yaitu fungsinya adalah untuk memilih atribut mana saja yang digunakan dalam proses clustering data mining. Transformation Pada Transformation yaitu data diubah atau dimanipulasi untuk menyiapkannya agar lebih optimal dalam proses data mining. Data Mining . Operator Performance, data mining yaitu menggunakan algoritm kmeans untuk mengelompokkan berdasarkan tingkat pendidikan menggunakan Rapidminer. Operator Performance melibatkan proses pencarian nilai jarak dan nilai DBI untuk mengukur kinerja dari suatu sistem atau perangkat komunikasi secara efektif . Proses pengolahan Data cluster yang dibentuk yaitu 7 cluster diantaranya Sangat Rendah (C. Menengah Rendah (C. Rendah (C. Sedang (C. Tinggi (C. Menengah Tinggi (C. dan Sangat Tinggi (C. Sumber: Olahan Penulis . Gambar 5. Operator performance Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta . Setelah tahapan performa yang cermat dan data,pengukuran evaluasi berbagai parameter yang relevan akhirnya ditemukan hasil rata-rata (Av. yang mencerminkan tingkat efisiensi suatu sistem atau Sumber: Olahan Penulis . Gambar 6. Hasil Avg. within centroid distance . Evaluasi Selama proses pembuatan model, kumpulan data dikumpulkan untuk melakukan evaluasi model. Proses ini dilakukan untuk mendapatkan cluster terbaik dengan melihat hasil evaluasi DBI, yang merupakan indeks Davies Bouldien hasil evaluasi DBI adalah hasil nilai evaluasi paling kecil. Nilai kinerja menggunakan model k-means, yang mencakup masing-masing algoritma k-means dari k=3 hingga k=7. Sumber: Olahan Penulis . Gambar 7. Hasil Evaluasi DBI ISSN: 2338-9761 (Onlin. Setelah semua tahapan selesai dan telah ditemukan cluster terbaik yang terbentuk yaitu pada k=7. Maka tergolong ada 7 cluster yaitu Sangat Rendah ,Menengah Rendah ,Rendah. Sedang. Tinggi ,Menengah dan Sangat Tinggi. Dapat dilihat pada gambar berikut: Sumber: Olahan Penulis . Gambar 8. Hasil Clustering Pembahasan Mengimplementasikan algoritma KMeans pada masyarakat desa Bojong Penerapan Algoritma K-Means dalam pengelompokan kampung desa Bojong menggunakan Rapidminer pada data pendidikan kampung di Desa Bojong, telah terjadi kemajuan besar dan berhasil di pengelompokan pendidikan masyarakat yang dibantu dengan tahapan KDD dengan periapan data menggunakan data 6. penduduk dari 10 kampung Data diproses melalui set role untuk menentukan ID yang akan digunakan (Nama Kampun. dan select atribut tingkat pendidikan seperti Tidak sekolah,Tamat Sd,Tamat SLTP,Tamat SLTA,Diploma (I,II,. Strata I. Strata II dan Strata i. kemudian diolah menggunakan RapidMiner dengan nilai k bervariasi untuk menentukan jumlah cluster Penelitian ini berhasil menentukan bahwa 7 kelompok adalah jumlah yang berdasarkan tingkat pendidikan dengan menggunakan DBI untuk mengevaluasi Hasilnya pendidikan yang lebih sesuai dengan masing-masing Dengan evaluasi Nilai DBI semakin kecil nilai DBI maka semakin optimal cluster yang terbentuk. Pengelompkkan yang Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta optimal yaitu K=7 dengan niai DBI 4,67 terbentuk menjadi 7 cluster yaitu cluster 0 1 kampung . Cibisoro 02 Rw. ,cluster 1 2 kampung . Pasir Huut Rw. 01 dan kp. Cijauh Rw. ,cluster 2 2 kampung . p Durung Kidul 2 Rw. 05 dan Kampung Cibisoro 1 Rw. , cluster 3 1 kampung . Pamempeuk Rw. ,cluster 4 1 kampung . Cibisoro Rw. , cluster 5 2 kampung kp. Durung Tengah Rw. 02 dan Kp. Cibisoro 3 Rw. dan cluster 6 1 kampung . Durung Kidul 1 Rw. dengan semua total menjadi 10 kampung. Dari Cluster 7 paling tinggi dan cluster 0 paling rendah. Tahapan ini mengikuti model penelitian sebelumnya oleh (Gustino & Suprapti, 2. yang menerapkan k-means untuk Studi memberikan hasil yang signitif dalam memahami pola dsitribusi pendidikan untuk mendukung perencanaan intervensi. Menentukan pendidikan yang terbentuk dari hasil Berdasarkan hasil uji dengan nilai K=3 sampai K=7 bahwa nilai Davies-Bouldin Index (DBI) terkecil yaitu diperoleh pada K=7 dengan nilai DBI 0. 467 menunjukkan bahwa cluster yang terbentuk lebih optimal, semakin kecil nilai hasil DBI semakin optimal DBI yang terbentuk. Oleh karena itu. K=7 dipilih sebagai nilai optimal untuk pengelompokkan kampung berdasarkan tingkat pendidikan. Sumber: Olahan Penulis . Gambar 9. Hasil DBI Dari tabel hasil niai DBI dapat dilihat cluster yang optimal terdapat pada K=7 dengan nilai DBI terkecil yaitu 0,467 semkain rendah nilai DBI maka semakin baik cluster yang terbentuk. Dengan K=7 data terbagi menjadi 7. ISSN: 2338-9761 (Onlin. Sumber: Olahan Penulis . Gambar 10. Grafik Hasil Cluster Dari gambar Hasil Visualisasi diatas dapat disimpulkan bahwa grafik yang diperoleh data bahwa ada beberapa karakteristik dalam data penelitian ini. Cluster 0 memiliki tingkat pendidikan yang sangat rendah, didominasi Tamat SD dan memiliki sedikit di tingkat SLTA ke atas. Cluster 1 memiliki tingkat pendidikan menengah rendah, masih didominasi Tamat SD tetapi sedikit lebih tinggi dari pada Cluster 0. Cluster 2 memiliki tingkat pendidikan menengah rendah, didominasi Tamat SD dan memiliki distribusi yang lebih merata dibandingkan Cluster 0 dan 1. Cluster 3 memiliki tingkat pendidikan menengah, dengan variasi yang lebih dengan peningkatan pada SLTA dan Strata I dan peningkatan pada tidak tamat SD dan tamat SD. Cluster 4 terdiri dari pendidikan tinggi, didominasi Tamat SD dan SLTA, dengan sedikit representasi pendidikan . Cluster 5 terdiri dari pendidikan menengah tinggi, didominasi Tamat SD, tetapi ada yang mencapai SLTA dan Strata I. Cluster 6 memiliki tingkat pendidikan sangat tinggi dengan rata-rata tertinggi dan distribusi merata di semua tingkatan, menunjukkan populasi yang lebih beragam dan cenderung lebih berpendidikan dibandingkan dengan klaster lain. Klasterisasi penelitian (Setianingsih & Alli, 2. Vol. 13 No. 1 - Tahun 2025 Bianglala Informatika: Jurnal Komputer Dan Informatika Univesitas Bina Sarana Informatika Jakarta oleh , yang menggunakan K-means untuk klasterisasi pengeluaran desa. Hasilnya menunjukkan bahwa k-means efektif dalam menangkap pola dan karakteristik data multidimensi. Menganalisis Hasil klasterisasi untuk memberikan gambaran distribusi tingkat pendidikan yang dapat pengambilan kebijakan pendidikan di Desa Bojong Hasil analisis klasterisasi menunjukkan bahwa tingkat pendidikan masyarakat Desa Bojong bervariasi, yang dapat digunakan sebagai dasar untuk membuat kebijakan Kelompok menunjukkan tingkat pendidikan sangat rendah, didominasi oleh orang yang hanya tamat SD atau bahkan tidak sekolah. Cluster 2 hingga 4 menunjukkan tingkat pendidikan menengah, dengan sebagian besar penduduk menyelesaikan SLTA. Cluster 5 dan 6 menunjukkan distribusi pendidikan menengah yang sangat tinggi, dengan beberapa orang mencapai Strata I dan II. Mereka juga dapat menawarkan akses teknologi pendidikan dan program pelatihan vokasional di desa yang lebih Hasil penelitian ini memberi gambaran dasar kampung mana yang diperhatikan pemerataan pendidikan di Desa Bojong. Berdasarkan pada model yang disampaikan oleh (Novitasari et al. K-means mengidentifikasi tingkat kemiskinan Jawa Barat. Pendekatan berbasis data ini menunjukkan efektivita intervensi yang spesifik dan terarah. IV. KESIMPULAN Dengan menggunakan tahapan KDD dan alat bantu RapidMiner, algoritma K-Means berhasil digunakan untuk mengelompokkan sepuluh kampung di Desa Bojong berdasarkan tingkat Hasil pemeriksaan menunjukkan bahwa nilai ideal untuk jumlah cluster adalah K = 7 K=7, yang menghasilkan nilai terkecil dari Davies-Bouldin Index (DBI), yaitu 0,467. Pengelompokan ini membantu mengidentifikasi distribusi tingkat pendidikan secara lebih rinci, karena setiap kelompok mewakili pola tertentu pada tingkat pendidikan masyarakat. Hasil analisis menunjukkan bahwa cluster tersebut memiliki kualitas terbaik, dengan nilai DBI terendah ditemukan pada K = 7 K=7. Setiap kelompok terdiri dari tujuh cluster, dengan cluster mulai dari sangat rendah ISSN: 2338-9761 (Onlin. (Cluster . hingga sangat tinggi (Cluster . Setiap kelompok menunjukkan perbedaan besar dalam distribusi pendidikan. Ini dapat menjadi informasi penting untuk membuat rencana peningkatan pendidikan desa. Sebagai hasil dari analisis klasterisasi, tingkat pendidikan di Desa Bojong bervariasi. Kampung dengan tingkat pendidikan sangat (Cluster pendidikan dasar. Sebaliknya, kampung dengan tingkat pendidikan menengah hingga tinggi (Cluster 5 dan . dapat menjadi model untuk pengembangan fasilitas pendidikan lanjutan, termasuk teknologi pendidikan dan pelatihan vokasional. Hasil penelitian ini digunakan sebagai dasar strategis untuk membuat program pendidikan di Desa Bojong lebih seragam dan sesuai dengan kebutuhan REFERENSI