Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT Analysis Cluster K-Means Terhadap Fasilitas Sekolah Pada Tiap Provinsi Republik Indonesia Muhammad Faisal1*. Suharmanto2 Janu Ilham Saputro3. Wiranti Sri Utami4 1 Fakultas Sains dan Teknologi. Teknik Informatika. Universitas Raharja. Kota Tangerang. Indonesia 2Fakultas Teknologi Informasi,Sistem Informasi. Universitas Graha Ganesha. Kota Tangerang. Indonesia 3 Fakultas Sains dan Teknologi. Sistem Informasi. Universitas Raharja. Kota Tangerang. Indonesia 4Fakultas Teknik. Teknik Informatika. Universitas Cendekia Abditama. Kabupaten Tangerang. Indonesia Email: 1,*muhammad. faisal@raharja. info, 2suharmanto. java@gmail. com, 3janu@raharja. info, 4wirantisutami@uca. (* : coressponding autho. Abstrak- Fasilitas Sekolah merupakan Sarana yang disediakan oleh Pihak Sekolah maupun Perguruan Tinggi untuk menunjang kegiatan dan dapat dimanfaatkan oleh Siswa. Guru. Mahasiswa dan Staff yang berada pada ruang lingkup suatu Pendidikan tertentu. Demi terciptanya Kegiatan Belaja Mengajar (KBM) yang baik dan mendukung proses pengembangan maupun prestasi maka Sekolah atau Perguruan Tinggi yang baik harus memiliki Sarana ruang Kelas, laboratorium. Perpustakaan. Kantin, tempat Ibadah dan Lapangan. Dengan menerapkan data mining dan memanfaatkan sumber data yang didapatkan serta penerapan metode cluster K-Means dapat ditarik informasi terkait Fasilitas Sekolah. Jumlah cluster yang diperoleh adalah 2 cluster dengan jumlah kuadrat menurut cluster 76,0%. Kata Kunci: Data mining. Cluster K-Means. Fasilitas Abstract- School Facilities are facilities provided by schools or universities to support activities and can be utilized by students, teachers, students and staff within the scope of a particular education. In order to create good teaching and learning activities (KBM) and support the development process and achievements, good schools or universities must have classroom facilities, laboratories, libraries, canteens, places of worship and fields. By applying data mining and utilizing the data sources obtained and the application of the K-Means cluster method, information related to school facilities can be drawn. The number of clusters obtained is 2 clusters with the number of squares according to the cluster of 76. Keywords: Data mining. K-Means Cluster. Facilities PENDAHULUAN Pendidikan merupakan kunci utama dalam membuka pintu kemajuan, oleh sebab itu Kegiatan belajar mengajar tidak lepas dari sarana dan prasarana untuk mendukung proses Belajar Mengajar, hal ini termasuk dalam bangunan fisik sebagai ruang kelas, laboraturium, perpustakaan, dan bangunan lainnya sebagai sarana penunjang proses belajar Namun pada kenyataannya masih banyak fasilitas Sekolah yang masih jauh dari kata layak terutama didaerah Fasilitas yang ada pada sekolah merupakan sarana yang membantu guru, dan siswa dalam memberikan akses materi pembelajaran ataupun informasi terkait pembelajaran yang didapatkan dari Sekolah . Meskipun Fasilitas Sekolah merupakan peran kunci dalam keberhasilah proses belajar mengajar pada kenyataanya masih banyak sekolah yang belum memiliki fasilitas layak. Ketiadaan baik dalam hal pendidikan dapat disebabkan oleh beberapa faktor, misalnya Keterbatasan sarana serta prasarana, keterbatasan Sumber daya alam, dan ketidaksiapan kurikulum untuk menghadapi masa depan, dan tantangan paling besar adalah ketidakmerataan distribusi insfratruktur pendidikan . Keterbatasan tersebut harus menjadi fokus utama Pemerintah dalam menanggulangi ketimpangan Pendidikan. Fasilitas dalam pengelolaan lembaga pendidikan sekolah sering kali mengalami hambatan hal tersebut dapat mengganggu terlaksananya manajemen sarana dan prasaran fasilitas sekolah, hambatan yang terjadi dapat muncul dari beberapa faktor internal maupun eksternal, kerusakan, dan Minimnya Sumber Daya. Fasilitas pada dunia pendidikan merupakan sarana yang disediakan oleh Sekolah maupun Perguruan tinggi untuk siswa, guru, mahasiswa, dosen, dan staff yang berada pada lingkungan pendidikan untuk memberikan akses informasi pembelajaran secara bersamaan . Oleh karena itu penulis mencoba melakukan penelitian menggunakan teknik data mining dengan menerapkan metode cluster K-Means dalam mengelompokkan fasilitas sekolah di tiap Daerah atau Provinsi Republik Indonesia. Data mining merupakan proses ekstraksi dari suatu dataset yang besar untuk mendapatkan informasi , dan tujuan utaman dari data mining adalah melakukan identifikasi pola, hubungan, dan informasi yang mungkin belum ditemui dari dataset secara langsung . Analisis cluster adalah proses dalam menganalisa kumpulan obyek dalam menemukan kesamaan dan perbedaan, cluster bertujuan untuk mengelompokkan dan memahami struktud data, dengan menerapkan metode cluster K-Means dapat digunakan untuk menjelaska atau mendefinisikan algoritma dalam menentukan obyek kedalam cluster tertentu berdasarkan nilai terdekat . Algoritma cluster K-Means dapat diimplementasikan kedalam penelitian yang berkaitan dengan dataset salah satunya adalah analisa telur ayam kampung dan ayam negeri, data komoditas telur ayam tercatat pada Badan Pusat Statistik (BPS) dimana harga telur ayam sering mengalami naik turun dengan memanfaatkan cluster K-Means dapat mengetahui Provinsi dengan tingkat Komoditas Telur Ayam Terbesar . Kemudian Penelitian mengenai Cluster K-Means untuk mengelompokkan Rumah Tangga dengan status Sewa, dengan menerapkan metode cluster K-Means dapat memberikan informasi Provinsi dan Rumah Tangga dengan status Rumah Sewa atau kontrak . Penggunaan metode cluster K-Means Copyright A 2025 Author. Page 408 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT pada penelitian ini bertujuan untuk mencari informasi mengenai fasilitas sekolah yang masuk kedalam kelompok layak dan tidak layak berdasarkan dataset dari Badap Pusat Statistik (BPS). Berdasarkan hasil refrensi yang penulis buat, penulis dapat memberikan kesimpulan bahwa Analisa yang cocok untuk mengelompokkan Fasilitas sekolah Provinsi di setiap Republik Indonesia adalah dengan menerapkan Metode K-Means. METODOLOGI PENELITIAN 1 Dataset Penelitian Untuk mendukung proses penelitian ini penulis menggunakan dataset yang berasal dari Badan Pusat Statistik (BPS), data ini akan diolah menggunakan teknik data mining dengan menerapkan Metode cluster K-Means. Hasil data ini bertujuan untuk menggali informasi mengenai fasilitas Sekolah pada tiap Provinsi. Data yang akan digunakan dapat dilihat pada tabel dibawah ini. Tabel 1. Data Fasilitas Sekolah & Perguruan Tinggi Provinsi SMP SMU SMK Perguruan Tinggi Aceh Sumatera Utara Sumatera Barat Riau Jambi Sumatera Selatan Bengkulu Lampung Kep. Bangka Belitung Kep. Riau DKI Jakarta Jawa Barat Jawa Tengah DI Yogyakarta Papua Pegunungan Data yang sudah didapatkan tersebut kemudian akan diproses menggunakan tools atau Software Rstudio. Sebelum dilakukan analisa dengan Software Rstudio data akan di upload ke Rstudio dan kemudian akan diolah. 2 Data Mining Data mining merupakan bagian dari Knowledge discovery. Knowledge extraction, data/pattern analysis, information harversting, dan lain-lain. Pengertian lain dari teknik data mining merupakan suatu proses untuk menganalisa pola data yang tersembunyi dan menurut sebagian orang dapat diolah menjadi informasi yang berguna . Dalam data mining terdapat istilah atau teknik data mining yaitu Cluster analysis, cluster analysis merupakan teknik untuk mengetahui kelompok atau obyek yang memiliki kesamaan satu dengan lainnya dalam kelompok namum memiliki perbedaan dengan obyek atau kelompok lainnya . 3 Cluster K-Means Cluster K-Means merupakan merupakan pengelompokkan algoritma yang iteratif penerapannya digunakan sebagai partisi dataset kedalam sejumlah cluster data yang telah ditetapkan . Algoritma ini telah banyak digunakan Copyright A 2025 Author. Page 409 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT untuk penelitian yang berkaitan dengan dataset salah satu contohnya adalah dalam Bidang Migrasi Penduduk, dengan menerapka cluster K-Means untuk pengelompokkan data migrasi dengan cara mengklasifikasikan tiap kecamatan terhadap cluster yang telah ditetapkan . Kemudian Penelitian cluster K-Means untuk Prediksi jenis penyakit di Provinsi Jawa Timur, dengan menerapkan cluster K-Means bertujuan untuk mengembangkan sistem informasi dan mengimplementasikan pengelompokkan dan prediksi jumlah penyakit tiap Kota maupun Kabupaten pada Provinsi Jawa Timur . Kemudian mendukung penelitian ini penulis menggunakan metode elbow, metode elbow adalah sebuah metode yang digunakan sebagai penentuan jumlah optimal dari cluster yang akan dibentuk dengan menerapka metode cluster K-Means . Metode Elbow pada penelitian ini digunakan untuk memilih nilai k terkecil dari data yang didapatkan yang masih memiliki nilai within atau terendah dan nilai perbandingan sum of square errors (SSE) dapat ditarik kesimpulan dari total cluster yang membentuk grafik siku pada suatu pola titik . Persamaan atau rumus dari metode elbow dapat dilihat pada dibawah ini. yco ycIycIya = Oc = 1 Oc ycuycn = ycIyco || ycAycn Oe yayco || yco Selain menggunakan metode Elbow penulis juga menggunakan metode Korelasi Pearson. Korelasi pearson digunakan untuk menganalisa hubungan antara variabel masukan dan variabel keluaran . Dalam penelitian ini variabel masukkan yang akan digunakan adalah dataset fasilitas sekolah yang ada di Republik Indonesia. Korelasi pearson dapat dihitung menggunakan Rumus berikut ini. Oc ycuyc ycycuyc = A . cu Oe . ycIycu ycIyc Setelah menggunakan Pendekatan Elbow Penulis juga menggunakan pendekatan Silhouette coeffiecient. Nilai Silhouette coeffiecient terletak pada nilai -1 hingga 1, maksudnya adala jika mendekati nilai 1 maka semakin baik pengelompokkan dalam suatu cluster sebaliknya jika mendekati nilai -1 data semakin buruk kualitasnya dalam suatu cluster. Rumus tersebut dapat dilihat dibawah ini. = yca. Oe yca. , yca. ) 4 Tahapan Penelitian Tahap selanjutnya Adalah merumuskan Langkah-langkah yang akan dilakukan dalam penelitian ini, untuk menjelaskan alur penelitian secara lengkap berikut ini merupakan Gambaran penelitian menggunakan metode Cluster KMeans. Gambar 1. Langkah-langkah Penelitian Langkah berikutnya penulis akan melakukan Analisa menggunakan perhitungan statistik, untuk membantuk proses perhitungan statistik penulis menggunakan software Posit Cloud. Posit Cloud merupakan software yang menggunakan Bahasa pemrograman R, software ini bersifat open source dapat digunakan asalkan terkoneksi dengan jaringan internet. Copyright A 2025 Author. Page 410 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT HASIL DAN PEMBAHASAN Setelah mendapatkan dataset yang diperoleh dari Badan Pusat Statistik (BPS) dalam bentuk file Excel, data di import kedalam software Posit Cloud. 1 Import Data Data yang akan di import menggunakan fungsi read_excel(), fungsi tersebut merupakan bagian yang ada dalam software Posit Cloud. Hal ini dilakukan karena file yang didapatkan oleh penulis adalah file dalam bentuk Excel. Proses tersebut dapat dilihat pada gambar dibawah ini. Gambar 2. Data Fasilitas Sekolah yang telah di import ke software Posit Cloud 2 Analisa Data Setelah data di import langkah selanjutnya adalah melakukan proses statistik untuk mendapatkan ringkasan informasi dari data yang digunakan, fungsi yang digunakan adalah summary. Proses tersebut dapat dilihat pada gambar dibawah Gambar 3. Proses Statistik menggunakan fungs summary Dari informasi diatas dapat dilihat terdapat 38 character dari 5 variabel, dimana vairabel SD nilai Median-nya adalah 1221,5, nilai Mean-nya adalah 1907,1, dan nilain Max-nya adalah 8442,0. Kemudian untuk SMP nilai Median-nya adalah 746,5, nilai Mean-nya adalah 1022,0, dan nilai Max-nya adalah 4905,0. Selanjutnya untuk nilai SMU nilai Median-nya adalah 284,0, nilai Mean-nya adalah 477,1, dan nilai Max-nya adalah 2587,0. Selanjutnya untuk nilai SMK nilai Mediannya adalah 152,50, nilai Mean-nya adalah 289,74, dan nilai Max-nya adalah 2070,0. Selanjutnya untuk nilai Perguruan Tinggi nilai Median-nya adalah 46,50, nilai Mean-nya adalah 86,55, dan nilai Max-nya adalah 477,00. Setelah membuat proses statistik penulis mencoba melakukan analisa fasilitas sekolah dalam bentuk visualisasi Histogram untuk Sekolah Dasar (SD). Tampilan visualisasi teersebut dapat dilihat pada gambar dibawah ini. Gambar 4. Visualisasi Histogram Fasilitas Sekolah Dasar Tahun 2024 Dari gambar visualisasi histogram diatas dapat diperhatikan Provinsi Jawa Barat. Jawa Tengah, dan Jawa Timur memiliki tingkat Fasilitas yang tinggi. Oleh sebab itu Provinsi yang grafiknya rendah wajib menjadi perhatian khusus untuk meningkatkan Fasilitas Sekolah Dasar. Kemudian selanjutnya penulis akan membuat tampilan visualisasi untuk Sekolah Menengah Pertama (SMP) Tampilan tersebut dapat dilihat pada gambar dibawah ini. Copyright A 2025 Author. Page 411 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT Gambar 5. Visualisasi Histogram Fasilitas Sekolah Menengah Pertama Tahun 2024 Dari tampilan visualisasi Sekolah Menengah Pertama (SMP) dapat dilihat data histogram yang tinggi berada pada Provinsi Jawa Barat. Jawa Tengah, dan Jawa Timur memiliki tingkat Fasilitas yang tinggi. Provinsi lainnya yang rendah menjadi perhatian khusus pemerintah dalam memberikan fasilitas yang lebih layak. Setelah membuat tampilan visualisasi Sekolah Menengah Pertama (SMP) kemudian penulis membuat tampilan visualisasi Sekolah Menengah Umum (SMU) Tampilan tersebut dapat dilihat pada gambar dibawah ini. Gambar 6. Visualisasi Histogram Fasilitas Sekolah Menengah Umum Tahun 2024 Dari tampilan visualisasi Sekolah Menengah Umum (SMU) dapat dilihat data histogram yang tinggi berada pada Provinsi Jawa Barat. Jawa Tengah, dan Jawa Timur memiliki tingkat Fasilitas yang tinggi. Provinsi lainnya yang rendah menjadi perhatian khusus pemerintah dalam memberikan fasilitas yang lebih layak. Selanjutnya penulis akan membuat tampilan visualisasi histogram dari data Sekolah Menengah Kejuruan (SMK) tampilan tersebut dapat dilihat pada gambar dibawah Gambar 7. Visualisasi Histogram Fasilitas Sekolah Menengah Kejuruan Tahun 2024 Dari tampilan visualisasi Sekolah Menengah Kejuruan (SMK) dapat dilihat data histogram yang tinggi tetap berada pada Provinsi Jawa Barat. Jawa Tengah, dan Jawa Timur memiliki tingkat Fasilitas yang tinggi. Provinsi lainnya yang rendah Copyright A 2025 Author. Page 412 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT menjadi perhatian khusus pemerintah dalam memberikan fasilitas yang lebih layak. Kemudian penulis akan membuat tampilan visualisasi histogtam untuk Perguruan Tinggi tampilan tersebut dapat dilihat pada gambar dibawah ini. Gambar 8. Visualisasi Histogram Fasilitas Perguruan Tinggi Tahun 2024 Dari tampilan visualisasi histogram diatas Provinsi yang memiliki fasilitas lebih baik tetap berada pada Jawa Barat. Jawa Tengah, dan Jawa Timur. Masih ada beberapa Provinsi yang kategorinya rendah. Provinsi yang rendah tersebut menjadi perhatian khusus pemerintah dalam memberikan fasilitas yang lebih layak. Kemudian penulis akan melakukan uji Korelasi terhadap Fasilitas Sekolah dari tingkat SD sampai dengan Perguruan Tinggi berdasarkan data yang diperoleh menggunakan metode Pearson pada pemrograman R. Proses tersebut dapat dilihat pada gambar dibawah ini. Gambar 9. Proses Uji Korelasi menggunakan Metode Pearson Proses selanjutnya penulis akan menentukan banyaknya cluster yang akan digunakan pada peneltian ini. Proses tersebut menggunakan metode elbow. Proses dalam menentukan jumlah cluster yang akan dipakai pada penelitian ini adalah dari titik siku yang mengalami penurunan drastis diikuti dengan penurunan yang tidak terlalu drastis selanjutnya. Metode elbow yang digunakan pada penelitian ini dengan menerapkan fungsi WSS (Within-Cluster Sum of Squar. Gambar titik siku dari metode elbow dapat dilihat pada gambar dibawah ini. Gambar 10. Cluster Optimal menggunakan metode elbow Berdasarkan hasil analisa menggunakan metode elbow dapat diamati penurunan yang terjadi berada pada titik 2 namun terjadi penurunan drastis kembali berada pada titik 7. Penulis menyimpulkan cluster yang akan digunakan pada penelitian ini adalah 2 cluster. Copyright A 2025 Author. Page 413 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT Selain menggunaka metode elbow Penulis juga Menggunakan Metode Silhouette coeffiecient sebagai validitas analisis cluster fungsi yang digunakan pada Software Rstudio adalah AusilhouetteAy. Tampilan tersebut dapat dilihat pada gambar dibawah ini. Gambar 11. Hasil Validitas cluster menggunakan metode Silhouette coeffiecient Berdasarkan hasil validitas cluster menggunakan metode Silhouette coeffiecient, cluter optimal digunakan pada penelitian ini adalah sebanyak 2 cluster. Sehingga penulis membuat kesimpulan akhir bahwa jumlah cluster yang digunakan pada penelitian ini adalah 2 cluster. 3 Analisa Cluster Analisa cluster yang digunakan pada penelitian ini adalah menggunaka metode cluster K-Means, dalam penerapan Algoritma cluster K-Means hal yang perlu diperhatikan adalah penentuan nilai centeroid awal menggunakan metode KMeans. Pertama-tama dimulai dengan menentukan centeroid awal dengan cara random atau acak terhadap data yang akan Proses penggunaan centeroid awal secara acak dapat menyebabkan nilai yang dihasilkan dapat berbeda-beda jika hanya melakukan proses centeroid hanya sekali. Oleh sebab itu perlu dilakukan pengulangan dengan menggunakan Algortima K-Means beberapa kali dengan menempatkan nilai awal yang berlainan untuk mendapatkan nilai cluster yang Penerapan Algoritma K-Means menggunakan software Posit Cloud dapat dilihat pada gambar dibawah ini. Gambar 12. Hasil analisa menggunakan Algoritma K-Means Selanjtunya penulis akan membuat tampilan visualisasi dalam bentuk cluster Plot yang akan memberikan informasi Provinsi cluster 1 dan cluster 2 berdasarkan data yang diperoleh dari fasilitas Sekolah. Cluster plot tersebut dapat dilihat pada gambar dibawah ini. Gambar 13. Cluster Plot Fasilitas Sekolah pada tiap Provinsi Copyright A 2025 Author. Page 414 Jurnal BIT is licensed under a Creative Commons Attribution 4. 0 International License Bulletin of Information Technology (BIT) Vol 6. No 4. Desember 2025. Hal. 408 - 416 ISSN 2722-0524 . edia onlin. DOI 10. 47065/bit. https://journal. org/index. php/BIT Berdasarkan cluster plot diatas dapat dilihat Provinsi dengan Fasilitas Sekolah terbaik berada pada cluster 1 yang beradap pada Provinsi Jawa Timur. Kawa Tengah, dan Jawa Barat. Sedangkan sisanya berada pada cluster 2, untuk dapat melihat lebih detail Provinsi yang berada pada cluster 1 dan cluster 2 dapat dilihat pada tabel dibawah ini. Tabel 1. Cluster Fasilitas Sekolah pada tiap Provinsi KESIMPULAN Dengan dilakukannya penelitian ini diharapkan dapat menjadi informasi terhadap data fasilitas Sekolah yang perlu diperhatikan agar kegiatan proses belajar mengajar menjadi lebih efektif, dan dapat dijadikan sebagai bahan evaluasi oleh pihak terkait mengenai sarana prasarana fasilitas Sekolah. Berdasarakan Penelitian yang sudah dibahas diatas Provinsi yang fasilitasnya masuk kedalam kategori tertinggi berada pada Provinsi Jawa Barat. Jawa Tengah, dan Jawa Timur. REFERENCES