Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. No. April 2025, hlm. Akreditasi KEMENRISTEKDIKTI. No. 36/E/KPT/2019 DOI: 10. 25126/jtiik. p-ISSN: 2355-7699 e-ISSN: 2528-6579 IDENTIFIKASI POLA TINGKAT KESENJANGAN KETUNTASAN PENDIDIKAN DI INDONESIA DENGAN MENGGUNAKAN METODE K-MEDOIDS CLUSTERING Antika Zahrotul Kamalia*1. Ismasari Nawangsih2 Universitas Pelita Bangsa. Bekasi Email: antika. kamalia@pelitabangsa. id, 2ismasari. n@pelitabangsa. Penulis Korespondensi (Naskah masuk: 25 Januari 2025, diterima untuk diterbitkan: 13 April 2. Abstrak Pendidikan memiliki peran penting dalam pembangunan sosial dan ekonomi, namun masih ada kesenjangan ketuntasan pendidikan antar provinsi di Indonesia. Kesenjangan ini disebabkan oleh perbedaan akses fasilitas, kualitas pengajaran, dan kondisi ekonomi, yang mempengaruhi tingkat ketuntasan pendidikan. Penelitian ini menggunakan metode K-Medoids Clustering untuk mengelompokkan wilayah di Indonesia berdasarkan data ketuntasan pendidikan dari Badan Pusat Statistik Indonesia (BPS) 2018-2023 untuk sebagai pusat Cluster . , dan dipilih karena keunggulannya dalam mengelompokkan data berdasarkan median, yang pada gilirannya membuatnya lebih tahan terhadap pengaruh data outlier. Temuan utama penelitian ini menunjukkan kesenjangan pendidikan tinggi yaitu berada di wilayah Indonesia bagian tengah dan timur yaitu seperti provinsi Nusa Tenggara Timur (NTT) dan provinsi Papua, menjadi refleksi nyata dari keterbatasan akses dan fasilitas pendidikan di wilayah tersebut. Rendahnya tingkat ketuntasan pendidikan pada jenjang SD. SMP, dan SMA turut berdampak pada minimnya angka partisipasi di pendidikan tinggi dan disparitas signifikan dalam ketuntasan pendidikan dengan kondisi seperti ini mencerminkan perlunya kebijakan berbasis data, peningkatan infrastruktur pendidikan, serta program dukungan untuk siswa dan guru guna memperbaiki kesenjangan pendidikan. Wilayah Indonesia bagian barat dengan ketuntasan pendidikan lebih tinggi, seperti Jawa. Sumatra, dan Bali, diharapkan dapat berbagi praktik terbaik untuk mendukung wilayah yang tertinggal. Kata kunci: Pola. Kesenjangan. Pendidikan. K-Medoids IDENTIFICATION OF PATTERNS IN EDUCATIONAL COMPLETION DISPARITIES IN INDONESIA USING THE K-MEDOIDS CLUSTERING METHOD Abstract Education plays a crucial role in social and economic development. however, there are still significant disparities in educational completion rates across provinces in Indonesia. These disparities are caused by differences in access to facilities, teaching quality, and economic conditions, which affect educational outcomes. This study uses the K-Medoids Clustering method to group regions in Indonesia based on educational attainment data from Statistics Indonesia (BPS) 2018-2023, using this data as the cluster centers . This method was chosen for its effectiveness in clustering data based on the median, making it more resilient to the influence of outlier The main findings of this study reveal significant educational disparities in central and eastern Indonesia, such as in East Nusa Tenggara (NTT) and Papua provinces, reflecting the limited access to and availability of educational facilities in these regions. Low completion rates at the elementary, junior high, and high school levels also affect participation in higher education and significant disparities in educational attainment. This underscores the need for data-driven policies, improved educational infrastructure, and support programs for students and teachers to address educational inequalities. Western regions of Indonesia with higher educational attainment, such as Java. Sumatra, and Bali, are expected to share best practices to support underdeveloped Keywords: Pattern. Disparity. Education. K-Medoids 322 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2025, hlm. PENDAHULUAN Pendidikan merupakan faktor krusial dalam pembangunan sosial dan ekonomi suatu negara, namun di Indonesia masih terdapat kesenjangan ketuntasan pendidikan yang signifikan antara berbagai provinsi. Pendidikan merupakan suatu proses yang bertujuan untuk kemampuan individu(Richia Putri et al. , 2. Dalam penelitian yang dilakukan oleh Takyi pada tahun 2021 mengenai kesenjangan pendidikan di negara Ghana menyatakan bahwa kesenjangan pendidikan sering kali dipengaruhi oleh perbedaan akses ke fasilitas pendidikan, lokasi geografis, kualitas pengajaran, dan kondisi ekonomi lokal, yang menyebabkan variasi dalam tingkat ketuntasan pendidikan (Takyi et al. , 2. Untuk memahami dan mengatasi kesenjangan ini secara efektif, diperlukan analisis yang dapat mengidentifikasi polapola distribusi pendidikan di berbagai wilayah. Metode K-Medoids Clustering menawarkan pendekatan yang efektif untuk mengelompokkan daerah berdasarkan tingkat ketuntasan pendidikan dengan menggunakan data nyata sebagai pusat Cluster . K-Medoids Clustering terpilih mengelompokkan data menurut median. Keunggulan ini membuat metode tersebut lebih tahan terhadap pengaruh data outlier, sehingga menghasilkan analisis yang lebih akurat dan stabil (M. Puja Alif Budiman & Winarso, 2. Dalam penelitian yang dilakukan oleh Marlina. Fernando, & Ramadhan pada tahun 2018, yang membandingkan algoritma K-Medoids dengan algoritma K-Means, dapat disimpulkan bahwa KMedoids memberikan hasil validitas yang lebih baik dalam menggelompokkan data mengenai penyebaran anak cacat. Berbeda dengan algoritma K-Means. KMedoids menunjukkan performa yang lebih superior dalam hal ketepatan dan akurasi pengelompokan, sehingga lebih efektif untuk jenis data tersebut. (Gita Aprilianu, 2. Algoritma K-Medoids menawarkan keunggulan signifikan dengan mengatasi kelemahan yang sering ditemukan pada algoritma K-Means, terutama dalam hal sensitivitas terhadap noise dan Sementara K-Means cenderung terpengaruh oleh data yang tidak normal atau ekstrem, yang dapat mempengaruhi hasil clustering secara negatif. KMedoids menggunakan medoids sebagai pusat klaster, yang memberikan kestabilan lebih dalam situasi di mana data mengandung noise atau outlier. Dengan demikian. K-Medoids dapat menghasilkan pengelompokan yang lebih akurat dan andal, bahkan ketika menghadapi data yang tidak sempurna atau terdistorsi, sehingga meningkatkan kualitas dan efektivitas proses clustering secara keseluruhan (Rahayu et al. , 2. Penelitian ini bertujuan untuk mengidentifikasi pola-pola kesenjangan dalam tingkat ketuntasan pendidikan di seluruh wilayah bagian Indonesia, dengan memanfaatkan metode K-Medoids Clustering sebagai alat utama. Metode ini dipilih karena kemampuannya untuk mengelompokkan data secara efektif, memungkinkan peneliti untuk mengungkap variasi dan disparitas dalam penyelesaian pendidikan di berbagai daerah. Dengan menganalisis hasil clustering, penelitian ini juga bertujuan untuk mendalam mengenai perbedaan dalam pencapaian pendidikan, serta untuk mengidentifikasi provinsi-provinsi di Indonesia yang membutuhkan perhatian dan intervensi lebih lanjut dalam upaya meratakan kualitas pendidikan di seluruh provinsi. Oleh karena itu, penelitian ini diharapkan mampu memberikan pemahaman yang lebih mendalam tentang distribusi pendidikan di berbagai provinsi di Indonesia. Selain itu, hasil yang diperoleh dari penelitian ini diharapkan dapat memberikan kontribusi dalam merancang kebijakan pendidikan yang lebih efektif dan terarah, sehingga berperan dalam upaya mengurangi ketidakmerataan serta meningkatkan kualitas pendidikan di seluruh Indonesia. METODE PENELITIAN Metode yang digunakan dalam penelitian ini adalah data mining dengan pendekatan K-Medoids. Data mining, atau penambangan data, terdiri dari serangkaian proses yang dirancang untuk mengekstraksi, menganalisis, dan mengolah informasi berharga dari kumpulan data yang sangat Tujuan utama dari proses ini adalah untuk mengidentifikasi pola, tren, atau hubungan yang mungkin tersembunyi atau belum terdeteksi Dengan cara ini, data mining berfungsi untuk mengungkap wawasan baru dan menyediakan pemahaman yang lebih mendalam mengenai data, yang pada gilirannya dapat digunakan untuk membuat keputusan yang lebih baik serta merancang strategi yang lebih efektif (M. Puja Alif Budiman & Winarso, 2. Pendekatan mendasar dalam menggali inti dari data dan mengekstraksi informasi yang berharga, yang sering kali tersembunyi, melibatkan penggunaan berbagai teknik dan alat analitis. Proses ini bertujuan untuk mengungkap keterkaitan dan pola-pola yang mungkin tidak terlihat secara jelas. Dengan menerapkan berbagai metode analisis, kita dapat menerangi informasi yang terperangkap dalam kompleksitas data dan menemukan hubunganhubungan penting yang sebelumnya mungkin Pendekatan ini membantu dalam mengidentifikasi wawasan yang signifikan dan memberikan pemahaman yang lebih mendalam tentang data yang ada (Rahayu et al. , 2. Data mining terdiri dari serangkaian tahapan yang dirancang untuk mengungkap nilai tambah dari kumpulan data, dengan tujuan menghasilkan pengetahuan baru yang sebelumnya tidak dapat diperoleh secara manual. Proses ini melibatkan ekstraksi kecenderungan dan pola-pola data yang tersembunyi, dan selanjutnya mengubah hasil temuan Kamalia & Nawangsih. Identifikasi Pola Tingkat Kesenjangan A 323 tersebut menjadi informasi yang akurat dan mudah Dengan melalui proses data mining, kita dapat mengidentifikasi pola-pola yang signifikan dan transformasi hasil analisis menjadi wawasan yang berguna, yang pada gilirannya mempermudah pemahaman dan aplikasi informasi tersebut dalam konteks yang relevan (Zahrotul Kamalia et al. , 2. Berikut diagram alir dalam penelitian ini: Gambar 1. Diagram Alir Penelitian Alat yang digunakan dalam pengolahan data termasuk Rapidminer, yang merupakan salah satu solusi data mining yang paling populer. Rapidminer berfungsi sebagai alat yang sangat efektif karena menyediakan beragam metode analitis dan teknik yang diperlukan. Alat ini mencakup berbagai fungsi, mulai dari evaluasi statistik sederhana seperti analisis korelasi, hingga teknik yang lebih kompleks seperti regresi, klasifikasi, dan pengelompokan. Selain itu. Rapidminer juga mendukung pengurangan dimensi dan optimasi parameter, memungkinkan pengguna untuk mengolah dan menganalisis data secara Dengan kemampuannya yang luas. Rapidminer mempermudah proses pengolahan data dan membantu dalam mengungkap wawasan berharga dari kumpulan data yang besar dan (Junaedi et al. , 2. Rapidminer juga memungkinkan hasil analisis ditampilkan secara visual melalui berbagai grafik, yang memudahkan pemahaman dan interpretasi data. Fitur visualisasi ini membuat Rapidminer menjadi salah satu pilihan utama dalam proses ekstraksi data, karena tidak hanya menyediakan analisis mendalam tetapi juga menyajikan hasilnya dalam format yang jelas dan mudah diinterpretasikan. Dengan kemampuannya untuk menggabungkan analisis yang kuat dengan visualisasi yang intuitif. Rapidminer memfasilitasi pemahaman yang lebih baik tentang pola-pola data dan keterkaitan yang teridentifikasi, menjadikannya alat yang sangat berharga dalam aplikasi metode-metode data mining. (Chandra et al. 1 Pengumpulan Data Sumber data untuk penelitian ini diperoleh dari Badan Pusat Statistik (BPS) Indonesia, mencakup periode enam tahun dari 2018 hingga 2023. Data tersebut melibatkan seluruh 34 provinsi di Indonesia sebagai negara kepulauan, terbagi menjadi tiga wilayah geografis utama yang mencakup Indonesia bagian barat, tengah, dan timur. Wilayah barat meliputi Aceh. Sumatra Utara. Sumatra Barat. Riau. Jambi. Sumatra Selatan. Bengkulu. Lampung. Kepulauan Bangka Belitung. Kepulauan Riau. DKI Jakarta. Jawa Barat. Jawa Tengah. DI Yogyakarta. Jawa Timur, dan Banten. Wilayah tengah mencakup Bali. Nusa Tenggara Barat. Nusa Tenggara Timur. Kalimantan Barat. Kalimantan Tengah. Kalimantan Selatan. Kalimantan Timur. Kalimantan Utara. Sulawesi Utara. Sulawesi Tengah. Sulawesi Selatan. Sulawesi Tenggara. Sulawesi Barat, dan Gorontalo. Sedangkan wilayah timur mencakup Maluku. Maluku Utara. Papua Barat, dan Papua. Dalam penelitian ini, data yang digunakan meliputi tingkat penyelesaian pendidikan di jenjang SD. SMP, dan SMA selama periode 2018 hingga Data ini memberikan gambaran menyeluruh mengenai ketuntasan pendidikan di seluruh provinsi di Indonesia, dan memungkinkan analisis mendalam mengenai variabilitas serta tren dalam pencapaian pendidikan di berbagai wilayah. Dengan demikian, penelitian ini bertujuan untuk memahami dan pendidikan di seluruh wilayah bagian Indonesia. 2 Clustering K-Medoids Algoritma K-Medoids, atau Partitioning Around Medoids (PAM), adalah metode clustering yang membagi objek menjadi beberapa cluster dengan memilih medoids sebagai perwakilan paling representatif di setiap cluster. Algoritma ini membantu mengorganisasi data secara efektif, menghasilkan cluster yang mencerminkan struktur data secara akurat. Dengan pertumbuhan data yang pesat. K-Medoids menjadi solusi penting untuk mengelola data besar dan kompleks, mempermudah analisis serta pemahaman informasi (Harahap, 2. Algoritma K-Medoids memanfaatkan objek dalam kumpulan data untuk berfungsi sebagai pusat representatif dari masing-masing cluster. Dalam metode ini, objek yang dipilih untuk mewakili sebuah cluster dikenal sebagai medoids. Medoids berperan sebagai representasi yang paling representatif dari cluster tersebut, sehingga memudahkan dalam penentuan pusat dan pembentukan kelompok data yang lebih homogen. Dengan menggunakan medoids sebagai pusat cluster, algoritma ini dapat mengelompokkan data secara lebih efektif dan akurat, serta memberikan pemahaman yang lebih jelas tentang struktur data yang dianalisis. Dalam 324 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2025, hlm. Provinsi Aceh Sumatera Utara Sumatera Barat Riau Jambi Maluku Maluku Utara Papua Barat Papua Tabel 1. Ketuntasan Sekolah Dasar (SD) menunjukkan provinsi dengan tingkat kesenjangan ketuntasan pendidikan yang tinggi. Cluster sedang pendidikan yang sedang, dan Cluster rendah pendidikan yang rendah. Berikut merupakan langkahangkah dalam perhitungan algoritma K-Medoids diantaranya(Hardiyanti et al. , 2. Inisialisasikan pusat cluster sesuai dengan jumlah cluster yang diinginkan . Alokasikan setiap data . ke cluster terdekat dengan menggunakan ukuran jarak Euclidean Distance, yang dihitung dengan persamaan berikut: Tabel 2. Ketuntasan Sekolah Menengah Pertama (SMP) Provinsi Aceh Sumatera Utara Sumatera Barat Riau Jambi Maluku Maluku Utara Papua Barat Papua Tabel 3. Ketuntasan Sekolah Menengah Atas (SMA) Provinsi Aceh Riau Jambi Sumatera Utara Sumatera Barat Maluku Maluku Utara Papua Barat Papua Penelitian ini. Cluster akan dibagi menjadi tiga kategori: K=0 (C. Cluster tinggi, (C. Cluster sedang, dan K=2 (C. Cluster rendah. Cluster tinggi Dimana: D . ij,ck. : Jarak Euclidean Distance antara observasi ke-i pada variabel ke-j dengan pusat cluster ke-k pada variabel ke-j Xij: nilai objek pada observasi ke-i untuk variabel ke-j ckj: nilai pusat cluster ke-k pada variabel ke-j p: jumlah variabel yang diamati n: jumlah observasi yang diamati Pilih secara acak objek dari setiap cluster untuk dijadikan kandidat medoid baru. Hitung jarak antara setiap objek di dalam cluster dengan kandidat medoid yang baru. Hitung (S) membandingkan total jarak baru dengan total jarak sebelumnya. Jika nilai S kurang dari 0, lakukan pertukaran objek dengan data cluster untuk membentuk sekumpulan k objek baru sebagai medoid. Ulangi langkah 3 hingga 5 sampai tidak ada lagi perubahan pada medoid, sehingga diperoleh cluster yang stabil beserta anggotanya masingmasing. 3 Evaluasi Davies Bouldin Indeks (DBI) DBI merupakan teknik evaluasi internal yang digunakan untuk menilai kualitas klaster dalam pengelompokan data. Metode ini mengukur mengevaluasi baik jumlah maupun kualitas klaster yang terbentuk dari data yang telah dikumpulkan. Setelah data dipersiapkan secara menyeluruh, langkah selanjutnya adalah memproses data tersebut menggunakan algoritma K-Medoids. Dalam konteks penelitian ini, jumlah cluster ditentukan bervariasi antara 2 hingga 8, dan diterapkan pada berbagai jenjang pendidikan, termasuk Sekolah Dasar (SD). Sekolah Menengah Pertama (SMP), dan Sekolah Menengah Atas (SMA). Dengan pendekatan ini. Kamalia & Nawangsih. Identifikasi Pola Tingkat Kesenjangan A 325 diharapkan dapat diperoleh pemahaman yang lebih baik mengenai struktur data di setiap jenjang pendidikan dan efektivitas pengelompokan yang Jumlah cluster yang digunakan dalam penelitian ini ditentukan berdasarkan hasil evaluasi yang bertujuan untuk menetapkan jumlah cluster optimal pada setiap jenjang pendidikan. Evaluasi ini dilakukan dengan mempertimbangkan nilai DBI, di mana pengelompokan yang lebih baik diidentifikasi melalui nilai DBI yang lebih rendah. Dengan kata lain, penentuan jumlah cluster didasarkan pada upaya untuk mencapai nilai DBI terendah, yang mencerminkan pengelompokan yang lebih efektif dan representatif untuk masing-masing jenjang pendidikan yang diteliti. Pendekatan ini memastikan bahwa hasil pengelompokan tidak hanya sesuai dengan data yang ada, tetapi juga memberikan kualitas pengelompokan yang terbaik untuk analisis lebih lanjut (Hidayat & Rina, 2. Dalam penelitian ini, alat analisis data yang digunakan adalah RapidMiner, yang berfungsi sebagai perangkat lunak utama untuk melaksanakan proses analisis. RapidMiner memfasilitasi penggunaan berbagai metode analisis, termasuk penerapan algoritma KMedoids dalam proses clustering. Hasil dari evaluasi Indeks Davies-Bouldin (DBI) yang diperoleh melalui metode clustering dengan menggunakan algoritma KMedoids pada aplikasi RapidMiner dapat dilihat pada gambar berikut. Gambar 2 tersebut menunjukkan secara visual bagaimana DBI diukur dan memberikan gambaran mengenai efektivitas pengelompokan yang dilakukan dalam penelitian ini pengelompokan yang dilakukan memberikan hasil yang paling efisien dan representatif berdasarkan evaluasi DBI yang dilakukan. DBI-SMP DBI K=3 K=2 K=6 Gambar 3. Evaluasi Cluster Jenjang Pendidikan SMP Berdasarkan gambar 3 di atas, yang menyajikan hasil evaluasi cluster untuk jenjang pendidikan Sekolah Menengah Pertama (SMP) menggunakan algoritma K-Medoids, analisis dilakukan dengan menghitung nilai Indeks DaviesBouldin (DBI) untuk setiap klaster. Hasil rekapitulasi DBI, yang diperoleh untuk nilai k yang bervariasi antara 2 hingga 8, menunjukkan bahwa nilai k yang paling optimal adalah k=2. Hal ini disebabkan oleh k=2 yang menghasilkan nilai DBI terendah, yaitu Oleh karena itu, dalam penelitian ini, jumlah cluster yang dipilih untuk jenjang pendidikan SMP adalah sebanyak 2 cluster. Keputusan ini diambil untuk memastikan bahwa pengelompokan yang dilakukan memberikan hasil yang paling efisien dan representatif berdasarkan evaluasi DBI yang telah DBI-SMA K=7 K=4 K=5 K=2 K=5 K=6 DBI K=3 DBI K=2 K=8 K=4 Cluster (K) DBI-SD K=3 K=7 K=5 K=8 Cluster (K) Gambar 2. Evaluasi Cluster Jenjang Pendidikan SD Berdasarkan gambar 2 di atas, yang menunjukkan hasil evaluasi cluster untuk jenjang pendidikan Sekolah Dasar (SD) menggunakan algoritma K-Medoids, evaluasi dilakukan dengan menentukan nilai Indeks Davies-Bouldin (DBI) untuk masing-masing klaster. Hasil rekapitulasi DBI, yang ditampilkan untuk nilai k yang bervariasi dari 2 hingga 8, menunjukkan bahwa nilai k yang optimal adalah k=3. Hal ini disebabkan oleh k=3 yang menghasilkan nilai DBI terendah, yaitu 0. Oleh karena itu, dalam penelitian ini, jumlah cluster yang dipilih untuk jenjang pendidikan SD adalah sebanyak 3 cluster. Pendekatan ini memastikan bahwa K=4 K=7 K=6 K=8 Cluster (K) Gambar 3. Evaluasi Cluster Jenjang Pendidikan SMA Berdasarkan gambar 3 di atas, yang menampilkan hasil evaluasi cluster untuk jenjang pendidikan Sekolah Menengah Atas (SMA) dengan menggunakan algoritma K-Medoids, evaluasi dilakukan dengan menentukan nilai Indeks DaviesBouldin (DBI) untuk setiap klaster. Hasil rekapitulasi DBI, yang mencakup nilai k dari 2 hingga 8, menunjukkan bahwa nilai k yang paling optimal adalah k=2, karena pada percobaan ini diperoleh nilai DBI terendah, yaitu 0. Oleh karena itu, dalam penelitian ini, jumlah cluster yang dipilih untuk jenjang pendidikan SMA adalah sebanyak 2 cluster. Keputusan ini diambil untuk memastikan bahwa pengelompokan yang dilakukan adalah yang paling 326 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2025, hlm. efisien dan representatif, berdasarkan evaluasi DBI yang telah dilakukan. HASIL DAN PEMBAHASAN Atribut yang digunakan dalam pengolahan data terdiri dari tingkat pendidikan dan provinsi, sedangkan atribut kelas data yang dipertimbangkan adalah persentase ketuntasan pendidikan. Dataset yang relevan disimpan dalam format CSV dan kemudian diimpor ke dalam aplikasi analisis. Setelah proses impor selesai, data tersebut dimasukkan ke dalam aplikasi dan dilengkapi dengan menambahkan operator data serta operator K-Medoids di jendela Operator data berfungsi untuk mengelola data, sedangkan operator K-Medoids diterapkan untuk menjalankan algoritma K-Medoids pada dataset yang telah disiapkan. Pada tahap konfigurasi operator K-Medoids, pengaturan jumlah cluster . disesuaikan dengan hasil evaluasi Indeks Davies-Bouldin (DBI) yang telah dilakukan sebelumnya. Selain itu, pengukuran jarak antara data dan centroid dilakukan Euclidean Distance, memungkinkan penentuan jarak yang tepat untuk masing-masing data terhadap pusat cluster. Pendekatan ini memastikan bahwa proses clustering berjalan dengan efisien dan akurat, berdasarkan parameter yang telah ditetapkan dan analisis yang telah dilakukan. 1 Identifikasi pola pada jenjang pendidikan SD Hasil dari proses pengolahan data ketuntasan pendidikan jenjang SD menggunakan algoritma KMedoids dengan jumlah kluster yaitu 3 menggunakan alat Rapidminer pada tabel 4 dibawah ini: Tabel 4. Cluster Model SD Data dalam Cluster (%) Total Cluster Banyak Data Pada Tabel 4, hasil output menunjukkan bahwa data kluster untuk jenjang pendidikan Sekolah Dasar (SD) terbagi menjadi tiga kluster. Kluster pertama. C1, terdiri dari satu provinsi yaitu Papua yang merupakan Indonesia bagian timur. Kluster kedua. C2, mencakup empat provinsi, yakni Nusa Tenggara Timur. Kalimantan Barat. Gorontalo, dan Papua Barat yang merupakan Indonesia bagian tengah dan Sementara itu, kluster ketiga. C3, mencakup 29 provinsi yang meliputi Aceh. Sumatra Utara. Sumatra Barat. Riau. Jambi. Sumatra Selatan. Bengkulu. Lampung. Kepulauan Bangka Belitung. Kepulauan Riau. DKI Jakarta. Jawa Barat. Jawa Tengah. DI Yogyakarta. Jawa Timur. Banten. Bali. Nusa Tenggara Barat. Kalimantan Tengah. Kalimantan Selatan. Kalimantan Timur. Kalimantan Utara. Sulawesi Utara. Sulawesi Tengah. Sulawesi Selatan. Sulawesi Tenggara. Sulawesi Barat. Maluku, dan Maluku Utara yang merupakan rata-rata didominasi Indonesia bagian barat dan sebagianya lagi bagian Pembagian kluster ini memberikan gambaran menyeluruh mengenai distribusi provinsi di Indonesia berdasarkan hasil clustering yang dilakukan untuk jenjang pendidikan SD. Tabel 5. Nilai centroid SD Attibute Pada Tabel 5, ditunjukkan bagaimana penentuan nilai klaster dikategorikan menjadi tinggi, sedang, dan rendah berdasarkan nilai centroid. Tabel ini menguraikan hasil akhir dari pemetaan jenjang pendidikan Sekolah Dasar (SD) yang dilakukan dengan menggunakan nilai centroid. Proses ini melibatkan analisis centroid untuk setiap klaster, mengklasifikasikan klaster-klaster tersebut ke dalam kategori tingkat ketuntasan yang berbeda. Dengan cara ini. Tabel 5 memberikan gambaran jelas mengenai bagaimana setiap klaster dikelompokkan sesuai dengan nilai centroidnya, mencerminkan distribusi dan variasi ketuntasan pendidikan di jenjang SD. Nilai centroid menggambarkan rata-rata ketuntasan pendidikan untuk setiap Cluster dalam rentang waktu yang ditentukan. Nilai centroid C1 menunjukkan pola yang relatif lebih rendah dibandingkan dengan C2 dan C3. Terdapat peningkatan yang konsisten dari 71. 830 pada tahun 2018 menjadi 80. 090 pada tahun 2023. Ini menunjukkan bahwa meskipun ada peningkatan. Cluster ini cenderung memiliki ketuntasan pendidikan yang lebih rendah secara keseluruhan. memiliki nilai centroid yang lebih tinggi dibandingkan dengan C1 tetapi lebih rendah dibandingkan dengan C3. Terdapat juga peningkatan nilai dari 86. 460 pada tahun 2018 menjadi 92. pada tahun 2023. Pola ini menunjukkan bahwa ketuntasan pendidikan di Cluster ini lebih baik daripada C1 dan mengalami pertumbuhan yang stabil. C3 memiliki nilai centroid tertinggi dibandingkan dengan Cluster lainnya, menunjukkan ketuntasan pendidikan yang paling tinggi secara keseluruhan. Nilai centroid C3 meningkat dari 95. 650 pada tahun 2018 menjadi 98. 300 pada tahun 2023. Ini menunjukkan bahwa Cluster ini memiliki ketuntasan pendidikan terbaik dan terus mengalami peningkatan. Kamalia & Nawangsih. Identifikasi Pola Tingkat Kesenjangan A 327 Gambar 4 Visualisasi Clustering SD Visualisasi data pada gamber 4 menunjukkan bahwa C1 yang hanya mencakup Papua yang merupakan Indonesia bagian timur, memiliki ketuntasan pendidikan SD yang jauh lebih rendah dibandingkan provinsi lain sehingga termasuk kategori kesenjangan yag tinggi dan mencerminkan tantangan besar seperti kesulitan geografis dan keterbatasan infrastruktur. C2 yang meliputi Nusa Tenggara Timur. Kalimantan Barat. Gorontalo, dan Papua Barat yang merupakan Indonesia bagian tengah dan timur, juga menghadapi tantangan ketuntasannya lebih baik dari Papua. Sebaliknya. C3 yang terdiri dari 29 provinsi di pulau Jawa. Sumatra. Kalimantan, dan Sulawesi yang merupakan rata-rata Indonesia bagian barat dan sebagian bagian tengah, menunjukkan kemajuan signifikan dalam ketuntasan pendidikan, berkat infrastruktur dan akses yang lebih Sehingga dalam jenjang pendidikan SD terdapat kesenjangan yang jelas dalam ketuntasan pendidikan antara Cluster dengan jumlah provinsi yang lebih kecil, sedang dan yang lebih besar, mengindikasikan perlunya penyesuaian kebijakan pendidikan untuk menangani disparitas geografis dan meningkatkan kualitas pendidikan di wilayah Indonesia yang kurang Beberapa faktor penyebab ketimpangan pendidikan di wilayah Indonesia timur yaitu Papua Barat meliputi sejumlah isu krusial. Salah satunya adalah rendahnya tingkat ketersediaan sekolah, khususnya untuk jenjang pendidikan selain sekolah dasar, di daerah-daerah yang baru dimekarkan dan di wilayah-wilayah terpencil. Selain itu, biaya pendidikan yang dianggap terlalu tinggi seringkali menjadi hambatan signifikan bagi banyak keluarga, mengakibatkan kesulitan dalam melanjutkan proses Untuk mengatasi masalah ini, penting dilakukan sosialisasi yang intensif kepada masyarakat mengenai pentingnya anak-anak untuk menyelesaikan pendidikan dasar wajib selama sembilan tahun. Upaya sosialisasi ini diharapkan dapat meningkatkan kesadaran dan partisipasi masyarakat dalam memastikan bahwa semua anak mendapatkan akses dan kesempatan untuk menyelesaikan pendidikan dasar yang wajib (Nisa & Samputra, 2. Salah satu faktor utama yang mempengaruhi ketidakmerataan kualitas pendidikan antara kawasan urban dan pedalaman adalah ketidakcukupan sarana dan prasarana yang tersedia. Contohnya yang sering dijumpai adalah akses internet. Di kawasan kota, akses internet sangat mudah didapatkan. setiap siswa Sekolah Dasar (SD) memiliki smartphone mereka sendiri, yang dianggap sebagai hal yang umum. Bahkan, banyak orang tua di kota yang memasang jaringan Wi-Fi dengan kapasitas besar di rumah mereka. Sebaliknya, di desa-desa atau daerah pedalaman, memiliki handphone sudah dianggap luar biasa di mata anak-anak lainnya. Selain itu, masih ada wilayah-wilayah terpencil yang belum terjangkau oleh jaringan seluler. Kondisi ini berdampak signifikan pada perkembangan kualitas pendidikan di Indonesia, mengingat hampir semua informasi dapat diakses dengan cepat melalui koneksi Perbedaan ini menggambarkan betapa besar pengaruh sarana dan prasarana terhadap perbedaan kualitas pendidikan antara kota dan desa atau (Kogoya et al. , 2. 2 Identifikasi pola pada jenjang pendidikan SMP Hasil dari proses pengolahan data ketuntasan pendidikan jenjang SMP dengan penggunaan algoritma K-Medoids total kluster yaitu 3 menggunakan alat Rapidminer pada tabel 6 dibawah Cluster Tabel 6. Cluster Model SMP Data dalam Banyak Data Cluster (%) Total Pada Tabel 6, hasil output menunjukkan pembagian kluster untuk jenjang pendidikan Sekolah Menengah Pertama (SMP) yang terbagi menjadi dua Kluster pertama. C1, mencakup satu provinsi, yaitu Papua yang merupakan Indonesia bagian timur. Sementara itu, kluster kedua. C2, terdiri dari 33 provinsi, yang meliputi Aceh. Sumatra Utara. Sumatra Barat. Riau. Jambi. Sumatra Selatan. Bengkulu. Lampung. Kepulauan Bangka Belitung. Kepulauan Riau. DKI Jakarta. Jawa Barat. Jawa Tengah. DI Yogyakarta. Jawa Timur. Banten. Bali. Nusa Tenggara Barat. Nusa Tenggara Timur. Kalimantan Barat. Kalimantan Tengah. Kalimantan Selatan. Kalimantan Timur. Kalimantan Utara. Sulawesi Utara. Sulawesi Tengah. Sulawesi Selatan. Sulawesi Tenggara. Sulawesi Barat. Gorontalo. Maluku. Maluku Utara, dan Papua Barat yang merupakan gabungan dari Indonesia bagian barat tengah dan timur. Pembagian ini memberikan gambaran menyeluruh mengenai distribusi provinsi 328 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2025, hlm. di Indonesia untuk jenjang SMP berdasarkan hasil clustering yang dilakukan. Tabel 7. Nilai centroid SMP Attibute Pada Tabel 7, ditampilkan penentuan nilai klaster yang dikategorikan sebagai tinggi, sedang, dan rendah berdasarkan analisis nilai centroid. Tabel ini menggambarkan hasil akhir dari pemetaan jenjang pendidikan Sekolah Menengah Pertama (SMP), yang dilakukan dengan menggunakan nilai centroid sebagai acuan. Proses ini melibatkan evaluasi nilai centroid untuk setiap klaster, yang selanjutnya digunakan untuk mengklasifikasikan klaster-klaster tersebut ke dalam kategori tingkat ketuntasan pendidikan yang berbeda. C1 menunjukkan nilai centroid yang lebih rendah dibandingkan dengan C2 pada setiap tahun. Nilai centroid C1 meningkat dari 190 pada tahun 2018 dengan 67. 120 pada tahun Meskipun terdapat peningkatan yang konsisten dalam ketuntasan pendidikan SMP di C1, nilai ini tetap lebih rendah dibandingkan dengan C2. Peningkatan ini menunjukkan adanya kemajuan, tetapi ketuntasan pendidikan di Cluster ini masih berada di bawah rata-rata ketuntasan pendidikan C2 memiliki nilai centroid yang lebih tinggi dibandingkan dengan C1. Nilai centroid C2 meningkat dari 81. 190 pada tahun 2018 menjadi 630 pada tahun 2023. Ketuntasan pendidikan SMP di C2 menunjukkan tren yang stabil dan positif dengan nilai yang lebih tinggi setiap tahun. Ini mengindikasikan bahwa provinsi dalam Cluster ini mungkin mepunyai akses baik ke sumber daya pendidikan, infrastruktur yang lebih baik, atau kebijakan pendidikan yang lebih efektif. Visualisasi data di gambar 5 menunjukkan bahwa Papua yang merupakan Indonesia bagian timur, yang termasuk dalam Cluster C1, memiliki kesenjangan ketuntasan pendidikan SMP yang jauh lebih rendah daripada provinsi-provinsi di wilayah Indonesia dibagian lainnya, yang tergabung dalam C2. Ketuntasan pendidikan di Papua dipengaruhi oleh faktor-faktor seperti kondisi geografis yang sulit dan akses terbatas ke fasilitas pendidikan, yang menyebabkan keterlambatan dalam pengembangan Sebaliknya. Cluster C2 yang mencakup wilayah gabungan Indonesia bagian barat, tengah dan timur lebih maju seperti pulau Jawa. Sumatra. Kalimantan. Sulawesi, dan beberapa provinsi di Nusa Tenggara serta Maluku, menunjukkan ketuntasan pendidikan yang lebih baik berkat infrastruktur dan dukungan yang lebih baik. Gambar 5. Visualisasi Clustering SMP Perbedaan ketuntasan pendidikan antara Papua dan provinsi lain mencerminkan disparitas geografis yang signifikan, yang menunjukkan perlunya program intervensi yang lebih intensif untuk Papua dan penguatan kebijakan pendidikan di wilayah yang sudah lebih maju. Pelatihan dan peningkatan kualitas sumber daya manusia (SDM) di kalangan tenaga pendidik merupakan langkah awal yang sangat krusial untuk memastikan pemerataan kualitas pendidikan di seluruh wilayah. Dengan memiliki guru-guru yang berkualitas, sekolah-sekolah yang berada di daerah terpencil sekalipun akan mampu menghasilkan hasil pendidikan yang baik dan Peningkatan kompetensi tenaga pendidik ini akan berkontribusi secara signifikan dalam keseluruhan, sehingga menciptakan kesempatan yang sama bagi semua siswa, tidak peduli seberapa terpencil lokasi mereka. Dengan demikian, investasi dalam pelatihan dan pengembangan SDM pendidikan akan berdampak positif pada semua tingkat pendidikan dan memastikan bahwa setiap anak (Maulana, 2. 3 Identifikasi pola pada jenjang pendidikan SMA Hasil dari proses pengolahan data ketuntasan pendidikan jenjang SMA menggunakan algoritma KMedoids dengan jumlah kluster yaitu 3 menggunakan alat Rapidminer pada tabel 5 dibawah ini. Tabel 8. Cluster Model SMA Cluster Banyak Data Data dalam Cluster (%) Total Pada Tabel 8, hasil output menunjukkan pembagian kluster untuk jenjang pendidikan Sekolah Menengah Atas (SMA) yang terbagi menjadi dua Kluster C2 mencakup 32 provinsi, yaitu Kamalia & Nawangsih. Identifikasi Pola Tingkat Kesenjangan A 329 Aceh. Sumatra Utara. Sumatra Barat. Riau. Jambi. Sumatra Selatan. Bengkulu. Lampung. Kepulauan Bangka Belitung. Kepulauan Riau. DKI Jakarta. Jawa Barat. Jawa Tengah. DI Yogyakarta. Jawa Timur. Banten. Bali. Nusa Tenggara Barat. Kalimantan Barat. Kalimantan Tengah. Kalimantan Selatan. Kalimantan Timur. Kalimantan Utara. Sulawesi Utara. Sulawesi Tengah. Sulawesi Selatan. Sulawesi Tenggara. Sulawesi Barat. Gorontalo. Maluku. Maluku Utara, dan Papua Barat. Sementara itu, kluster C1 terdiri dari dua provinsi dari Indonesia bagian tengah dan timur, yakni Nusa Tenggara Timur dan Papua. Pembagian kluster ini memberikan gambaran yang jelas tentang distribusi provinsi di Indonesia pada jenjang pendidikan SMA, berdasarkan hasil clustering yang dilakukan. merendahkan atau mendiskreditkan suatu daerah, melainkan untuk menekankan posisi geografisnya yang memang cukup jauh dari pusat kota. Tabel 8. Nilai centroid SMA Attibute Gambar 6 Visualisasi Clustering SMA Pada Tabel 5, ditampilkan penentuan nilai klaster yang dikategorikan sebagai tinggi, sedang, dan rendah berdasarkan analisis nilai centroid dari pemetaan jenjang pendidikan Sekolah Menengah Atas (SMA). Tabel ini menunjukkan bahwa nilai ketuntasan pendidikan SMA di klaster C1 menunjukkan tren yang sedikit fluktuatif, namun nilai rata-ratanya tetap konsisten lebih tinggi dari tahun 2018 hingga 2023. Hal ini mengindikasikan bahwa provinsi-provinsi yang tergabung dalam klaster ini mungkin memiliki akses yang lebih baik ke sumber daya pendidikan dan fasilitas yang lebih memadai dibandingkan dengan provinsi-provinsi yang termasuk dalam klaster C2. Perbedaan ini menunjukkan adanya disparitas signifikan dalam kualitas pendidikan antara kedua klaster, yang terlihat jelas dari analisis nilai centroid yang dilakukan. Berdasarkan visualisasi pada gambar 6 mengambarkan bahwa menunjukkan adanya disparitas signifikan dalam kesenjangan ketuntasan pendidikan SMA antara provinsi di C1 dan provinsi di C2. Perbedaan ini mencerminkan ketidakmerataan atau kesenjangan dalam kualitas pendidikan di Indonesia, di mana sebagian besar provinsi di wilayah Indonesia bagian barat memiliki tingkat ketuntasan yang baik, sementara provinsi di wilayah Indonesia bagian tengah dan timur seperti Nusa Tenggara Timur dan Papua menunjukkan kebutuhan mendesak untuk Hasil penelitian ini menganalisis perlunya kebijakan pendidikan yang lebih terfokus untuk meningkatkan kualitas pendidikan di wilayah Indonesia yang mencakup provinsi-provinsi dengan ketuntasan yang rendah. Secara geografis, provinsi Nusa Tenggara Timur memiliki karakteristik yang mencakup baik wilayah perkotaan maupun pedalaman. Penggunaan istilah "pedalaman" di sini tidak dimaksudkan untuk Wilayah pedalaman Indonesia bagian tengah di Nusa Tenggara Timur membutuhkan perhatian khusus dalam upaya pemerataan pembangunan, terutama karena adanya keterbatasan dalam hal transportasi, infrastruktur, serta kebutuhan akan tenaga pengajar yang bersedia dan siap untuk mengabdi di daerahdaerah terpencil tersebut. Oleh karena itu, pengembangan dan peningkatan fasilitas serta dukungan bagi tenaga pendidik di daerah-daerah ini sangat penting untuk menciptakan keseimbangan dalam akses dan kualitas pendidikan (Metarum. Anak-anak di wilayah Indonesia bagian timur di provinsi Papua menghadapi serangkaian tantangan yang sangat khusus, termasuk aksesibilitas yang terbatas, infrastruktur yang belum memadai, serta kekurangan tenaga pengajar yang berkualifikasi. Selain itu, terdapat ketidakmerataan dalam kualitas pendidikan yang mereka terima. Situasi ini memerlukan perhatian mendalam dan upaya yang serius dari pihak pemerintah daerah untuk mengatasi berbagai masalah tersebut. Upaya tersebut harus meliputi peningkatan aksesibilitas, perbaikan infrastruktur pendidikan, serta penyediaan pelatihan dan dukungan bagi tenaga pengajar agar dapat Pentingnya pengambilan keputusan untuk mengambil tindakan segera atau bertahap dalam konteks penyediaan pendidikan berkualitas yang merata secara spasial melalui penentuan prioritas yang terinformasi (Sajjad et al. , 2. Untuk wilayah Indonesia bagian tengah dan timur membutuhkan strategi intervensi mungkin meliputi peningkatan infrastruktur pendidikan, penyediaan sumber daya tambahan, dan program-program dukungan khusus untuk siswa dan guru. KESIMPULAN DAN SARAN Berdasarkan hasil penelitian metode k-medoids yang digunakan dalam penelitian ini berhasil mengelompokkan provinsi berdasarkan tingkat ketuntasan pendidikan yang teridentifikasi terdapat 330 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2025, hlm. disparitas signifikan, khususnya pada wilayah Indonesia bagian timur yaitu provinsi Papua di tingkat SD. SMP dan SMA dan pada di wilayah Indonesia tengah yaitu Provinsi di wilayah Indonesia Tengah yaitu Nusa Tenggara Timur (NTT) ditingkat SD dan SMA. Wilayah Indonesia Barat, seperti Jawa. Sumatra, dan Bali, menunjukkan tingkat ketuntasan yang lebih tinggi. Hal ini mencerminkan kesenjangan antara wilayah maju dan tertinggal dalam kualitas Disarankan untuk peneliti selanjutnya dapat mempertimbangkan faktor sosial ekonomi dan aksesibilitas geografis dalam analisis selanjutnya. DAFTAR PUSTAKA