Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal.
id/index.
php/malcom Vol.
5 Iss.
3 July 2025, pp: 1143-1151
ISSN(P): 2797-2313 | ISSN(E): 2775-8575
Clustering Regencies in Indonesia for Regional Mapping Using the K-Means Algorithm Pengelompokan Kabupaten di Indonesia untuk Pemetaan Daerah Menggunakan Algoritma K-Means Gustri Romi Wahyudi1.
Rahmaddeni2*.
Ema Dini3.
Sukri Adrianto4 ,Rahmasari Fadila5
1,2,3,5
Teknik Informatika.
Universitas Sains dan Teknologi Indonesia.
Pekanbaru.
Indonesia Sistem Informasi.
Universitas Dumai.
Dumai.
Indonesia E-Mail: 1gustriromiwahyudi@gmail.
com, 2rahmaddeni@usti.
id, 3emadini2301@gmail.
sukriadrianto@gmail.
com, 5rahmasarifadila2@gmail.
Received Jun 28th 2025.
Revised Jul 24th 2025.
Accepted Jul 30th 2025.
Available Online Jul 31th 2025.
Published Aug 15th 2025 Corresponding Author: Gustri Romi Wahyudi Copyright A 2025 by Authors.
Published by Institut Riset dan Publikasi Indonesia (IRPI) Abstract Economic disparities among regions remain a critical issue in IndonesiaAos development, which can be observed through variations in Gross Regional Domestic Product (GRDP) at the district/city level.
This study aims to map the economic conditions of Indonesian regions by clustering districts and cities based on GRDP data for 2024 using the K-Means The data were obtained from the Central Bureau of Statistics (BPS) and underwent preprocessing, including data cleaning and Min-Max normalization.
The number of clusters was determined as four groups (Very Low.
Low.
Medium, and Hig.
based on quartile distribution, providing a more objective and representative classification of the The results indicate that most districts and cities fall into the Low and Medium categories, while the High category is dominated by regions with more advanced industrial and service sectors.
Evaluation using the Silhouette Score produced a value of 0.
778, signifying good clustering quality with clear separation between groups.
These findings highlight the persistence of regional economic disparities.
This research contributes to establishing a data-driven framework for classifying regional economies, which can serve as a reference for policymakers in designing more equitable development strategies and as a basis for future studies that integrate additional socio-economic variables.
Keywords: Clustering.
District/ City.
Economic Disparity.
GRDP.
K-Means.
Regional Development Abstrak Kesenjangan ekonomi antarwilayah merupakan permasalahan penting dalam pembangunan Indonesia, yang salah satunya dapat dilihat melalui variasi Produk Domestik Regional Bruto (PDRB) pada tingkat kabupaten/kota.
Penelitian ini bertujuan untuk memetakan kondisi ekonomi daerah di Indonesia dengan mengelompokkan kabupaten/kota berdasarkan nilai PDRB tahun 2024 menggunakan algoritma K-Means clustering.
Data penelitian diperoleh dari Badan Pusat Statistik (BPS), kemudian melalui tahap pra-pemrosesan berupa pembersihan data dan normalisasi Min-Max.
Jumlah klaster ditentukan sebanyak empat kelompok (Sangat Rendah.
Rendah.
Sedang, dan Tingg.
dengan dasar pembagian kuartil, sehingga menghasilkan klasifikasi yang lebih objektif dan representatif terhadap distribusi data.
Hasil penelitian menunjukkan bahwa mayoritas kabupaten/kota termasuk dalam kategori Rendah dan Sedang, sedangkan kategori Tinggi didominasi wilayah dengan basis industri dan jasa yang lebih maju.
Evaluasi menggunakan Silhouette Score menghasilkan nilai 0,778, yang menandakan kualitas klasterisasi cukup baik dengan pemisahan antarkelompok yang Temuan ini mengindikasikan masih adanya ketimpangan distribusi ekonomi antarwilayah.
Penelitian ini berkontribusi dalam menyediakan kerangka klasifikasi ekonomi daerah berbasis data kuantitatif yang dapat digunakan sebagai acuan dalam perumusan kebijakan pembangunan yang lebih merata serta menjadi dasar bagi penelitian lanjutan yang mengintegrasikan variabel sosial-ekonomi lainnya.
Kata Kunci: Kabupaten/ Kota.
Ketimpangan Ekonomi.
Klasterisasi.
K-Means.
PDRB.
Pembangunan Wilayah DOI: https://doi.
org/10.
57152/malcom.
MALCOM-05.
: 1143-1151
PENDAHULUAN
Indonesia Indonesia terdiri atas 38 provinsi dan 514 kabupaten/kota, dengan keragaman ekonomi yang luas di tiap wilayah.
Produk Domestik Regional Bruto (PDRB) menjadi alat pengukur utama dalam menilai kapasitas ekonomi tiap daerah dalam menghasilkan barang dan jasa.
Data Badan Pusat Statistik (BPS) menunjukkan bahwa PDRB nasional tahun 2023 mencapai Rp 20.
892,4 triliun, meskipun distribusinya tidak merata provinsi seperti Daerah Khusus Ibukota (DKI) Jakarta dan Jawa Barat mendominasi kontribusi, sedangkan banyak kabupaten/kota di wilayah timur memiliki kontribusi yang sangat kecil .
Kondisi ini menegaskan urgensi pemetaan ekonomi wilayah agar strategi pembangunan dapat disusun dengan lebih tepat dan adil.
Pada Triwulan II 2024, pertumbuhan ekonomi nasional tercatat sebesar 5,05% Year-on-Year dengan Produk Domestik Bruto (PDB) mencapai Rp 5.
536,5 triliun.
Meskipun angka pertumbuhan tersebut menunjukkan stabilitas perekonomian nasional, distribusinya belum merata antar wilayah.
Provinsi di Pulau Jawa bertanggung jawab atas sekitar 57% dari total PDRB nasional, sementara wilayah di luar Jawa, khususnya kawasan timur Indonesia, masih memberikan kontribusi yang relatif kecil.
Ketimpangan ini mencerminkan adanya konsentrasi aktivitas ekonomi di wilayah tertentu yang berimplikasi pada kesenjangan pembangunan antar daerah.
Oleh karena itu, penelitian ini berfokus pada penerapan metode K-Means clustering untuk mengelompokkan kabupaten/kota di Indonesia berdasarkan data PDRB 2024 secara objektif, serta menganalisis implikasi hasil klasterisasi terhadap strategi pembangunan daerah .
Permasalahan utama yang diangkat ialah bagaimana menyusun pemetaan ekonomi kabupaten/kota secara komprehensif berbasis data mutakhir (PDRB 2.
, sehingga strategi pembangunan dapat disusun berdasarkan karakteristik ekonomi setiap wilayah.
Oleh karena itu, penelitian ini berfokus pada penerapan metode K-Means clustering untuk mengelompokkan kabupaten/kota di Indonesia berdasarkan data PDRB 2024 secara objektif, serta menganalisis implikasi hasil klasterisasi terhadap strategi pembangunan daerah.
Unsupervised Learning seperti K-Means dipilih karena keunggulannya dalam efisiensi dan kemudahan interpretasi.
Misalnya, studi oleh Purba dan Hartanto membandingkan K-Means dan Fuzzy CMeans dalam analisis clustering harga saham BRI dan menemukan keunggulan yang spesifik terhadap kondisi data tertentu .
Selain itu.
Ningrum dan Ahadi menerapkan K-Means untuk klasifikasi laju PDRB kabupaten/kota di Jawa Timur dengan hasil yang memadai .
Penelitian lain juga menggunakan K-Means untuk mengelompokkan kabupaten/kota berdasarkan aspek sosial-ekonomi seperti pendidikan, kesehatan, dan pengeluaran per kapita, serta memanfaatkan DaviesAeBouldin Index (DBI) sebagai metrik evaluasi kualitas klaster .
Metode alternatif lain yang efektif meliputi Fuzzy C-Means, yang digunakan untuk mengelompokkan tingkat kemiskinan di Kabupaten/Kota Jawa Tengah .
, serta dalam pengelompokan indikator sosialekonomi .
Hierarchical clustering khususnya metode Ward banyak diterapkan dalam kajian ekonomi lokal dan lingkungan .
, sedangkan Self-Organizing Map (SOM) telah dipakai secara adaptif dalam analisis wilayah terdampak Covid-19 .
Penelitian ini menawarkan kebaruan yang jelas.
Pertama, penggunaan data PDRB tahun 2024 menjadikannya sangat terkini.
Kedua, hasil klasterisasi disajikan dalam empat kategori Sangat Rendah.
Rendah.
Sedang, dan Tinggi sehingga mudah ditafsirkan oleh pembuat kebijakan.
Ketiga, visualisasi spasial hasil klasterisasi disertakan untuk membantu pengambil kebijakan melihat peta ekonomi secara langsung.
Secara akademik, penelitian ini memperkaya literatur mengenai penerapan unsupervised learning untuk analisis ekonomi regional.
Secara praktis, hasil penelitian ini diharapkan dapat menjadi acuan bagi para pembuat kebijakan dalam merumuskan strategi pembangunan daerah yang adil dan berbasis data.
METODE PENELITIAN
Penelitian ini menggunakan algoritma K-Means clustering, yang merupakan salah satu metode unsupervised learning untuk mengelompokkan data berdasarkan kesamaan karakteristik tertentu.
Data yang dianalisis berupa PDRB tahun 2024 dari seluruh kabupaten dan kota di Indonesia.
Tahapan yang dilalui dalam penelitian ini mencakup .
ihat Gambar .
Pengumpulan Data Data PDRB kabupaten/kota diperoleh dari BPS tahun 2024.
Pra-pemrosesan Data (Preprocessin.
Tahap ini meliputi pembersihan data, pengecekan data yang hilang, serta normalisasi agar data berada pada skala yang sama dan tidak mempengaruhi hasil klasterisasi Penentuan Jumlah Klaster .
Jumlah klaster ditentukan sebanyak empat klaster, yaitu Sangat Rendah.
Rendah.
Sedang, dan Tinggi.
Penentuan jumlah klaster ini didasarkan pada tujuan kategorisasi yang memudahkan interpretasi dan mendukung perumusan kebijakan pembangunan wilayah.
Klasifikasi tersebut dijelaskan sebagai berikut:
Sangat Rendah: Kabupaten/kota dengan nilai PDRB yang berada pada kuartil pertama .
% Pengelompokan Kabupaten di Indonesia untuk Pemetaan.
(Wahyudi et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Rendah: Kabupaten/kota dengan nilai PDRB pada kuartil kedua .
Ae50%).
Sedang: Kabupaten/kota dengan nilai PDRB pada kuartil ketiga .
Ae75%).
Tinggi: Kabupaten/kota dengan nilai PDRB pada kuartil keempat .
% terata.
Pembagian berdasarkan kuartil ini dilakukan agar pembagian klaster lebih objektif dan menggambarkan distribusi PDRB secara menyeluruh.
Penerapan Algoritma K-Means Setelah jumlah klaster ditetapkan, algoritma K-Means digunakan untuk mengelompokkan kabupaten/kota ke dalam empat klaster sesuai dengan klasifikasi yang telah dirancang sebelumnya.
Evaluasi Hasil Klasterisasi Proses evaluasi dilakukan dengan menggunakan metrik Silhouette Score guna mengukur seberapa baik data terkelompok dan sejauh mana pemisahan antar klaster terbentuk secara optimal.
Interpretasi dan Analisis Klaster Langkah ini bertujuan untuk menelaah hasil klasterisasi guna memahami karakteristik masing-masing kelompok wilayah serta implikasinya terhadap kondisi ekonomi regional.
Gambar 1.
Metodologi Penelitian Pengumpulan Data Data yang digunakan dalam penelitian ini berasal dari PDRB atas dasar harga berlaku tahun 2024, mencakup seluruh kabupaten dan kota di Indonesia.
Sumber data diperoleh dari publikasi resmi BPS .
PDRB dipilih sebagai indikator utama karena mampu merepresentasikan tingkat kemampuan ekonomi suatu daerah dalam menghasilkan barang dan jasa.
Nilai yang digunakan adalah total PDRB per kabupaten/kota selama satu tahun penuh, yakni tahun 2024.
Pra-pemrosesan Data Tahapan pra-pemrosesan dilakukan untuk memastikan bahwa data telah siap dan sesuai untuk diolah menggunakan algoritma K-Means.
Proses ini mencakup beberapa langkah utama sebagai berikut:
Pemeriksaan kelengkapan data: Menghapus atau memperbaiki data yang hilang .
issing value.
Mengingat skala nilai PDRB sangat beragam antar wilayah, proses normalisasi dilakukan menggunakan metode Min-Max.
Tujuan dari normalisasi ini adalah untuk menyetarakan seluruh nilai agar berada dalam rentang 0 hingga 1, sehingga tidak terjadi dominasi nilai yang terlalu besar dalam proses klasterisasi.
Adapun rumus yang digunakan adalah metode Min-Max scaling.
xA = xOexmin xmax Oexmin Normalisasi diperlukan untuk menghindari dominasi variabel dengan skala lebih besar terhadap hasil klasterisasi .
MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1143-1151 MALCOM-05.
: 1143-1151
Penentuan Jumlah Klaster Penelitian ini menetapkan jumlah klaster sebanyak empat .
berdasarkan pertimbangan kebijakan dan kebutuhan analisis ekonomi.
Pembagian ini ditujukan untuk mengklasifikasikan kabupaten/kota ke dalam kategori Sangat Rendah.
Rendah.
Sedang, dan Tinggi.
Penentuan jumlah klaster secara langsung tanpa metode eksploratif seperti Elbow Method dilakukan agar hasil klasifikasi sesuai dengan tujuan kebijakan pembangunan ekonomi .
Dengan demikian, tidak dilakukan analisis eksploratif tambahan untuk menentukan jumlah klaster.
Penerapan K-Means Clustering K-Means merupakan teknik klasterisasi non-hierarki yang berfungsi untuk mengelompokkan data ke dalam sejumlah klaster berdasarkan kedekatannya terhadap pusat klaster .
Tahapan dalam pelaksanaan algoritma K-Means antara lain meliputi:
Menetapkan jumlah klaster yang diinginkan, pada penelitian ini digunakan empat klaster .
= .
Menentukan posisi awal centroid secara acak.
Mengelompokkan setiap data ke dalam klaster berdasarkan jarak Euclidean terdekat dengan centroid.
Memperbarui posisi centroid dengan menghitung rata-rata nilai dari seluruh anggota dalam masingmasing klaster.
Mengulangi proses pengelompokan dan pembaruan centroid hingga hasilnya konvergen atau jumlah iterasi maksimum tercapai .
Algoritma ini diimplementasikan menggunakan Python di platform Google Colab dengan library scikit-learn.
Parameter random state diatur untuk memastikan replikasi hasil.
Visualisasi dan Analisis Klaster Visualisasi hasil klasterisasi digunakan untuk mempermudah pemahaman pola data yang terbentuk.
Salah satu teknik yang umum dipakai adalah Principal Component Analysis (PCA), yang berfungsi sebagai alat bantu untuk menampilkan data dalam dua dimensi sehingga hubungan antar klaster lebih mudah diamati .
Namun, penerapan PCA dalam konteks ini hanya bersifat komplementer dan tidak dimaksudkan sebagai metode reduksi dimensi utama.
Setelah klaster terbentuk, dilakukan analisis distribusi wilayah berdasarkan hasil pengelompokan untuk mengidentifikasi ciri khas pada tiap kategori ekonomi.
Hal ini penting karena dapat memberikan gambaran mengenai kesenjangan maupun potensi yang ada di tiap daerah .
Selanjutnya, hasil klasterisasi dijadikan dasar dalam merumuskan rekomendasi kebijakan yang lebih tepat sasaran bagi pembangunan daerah, sehingga informasi yang diperoleh mampu mendukung perencanaan ekonomi yang lebih merata dan berkelanjutan .
Clustering Clustering merupakan salah satu metode analisis data yang digunakan untuk mengelompokkan objek ke Klasterisasi merupakan teknik dalam analisis data yang digunakan untuk membagi objek ke dalam kelompok-kelompok berdasarkan tingkat kemiripan tertentu.
Objek-objek dalam satu klaster memiliki ciriciri yang relatif homogen, sementara objek antar klaster menunjukkan perbedaan karakteristik.
Metode ini tergolong dalam pendekatan unsupervised learning, karena tidak memerlukan label atau nilai target dalam proses pembentukan kelompok .
Klasterisasi telah diterapkan secara luas dalam berbagai bidang, seperti segmentasi pasar, pemetaan wilayah, dan analisis perilaku.
Dalam konteks penelitian ini, metode klasterisasi diterapkan untuk mengelompokkan kabupaten dan kota di Indonesia berdasarkan nilai PDRB, guna memberikan dasar dalam penyusunan kebijakan pembangunan yang lebih adil dan terarah .
K-Means K-Means adalah algoritma klasterisasi non-hierarkis yang telah banyak digunakan dalam berbagai penelitian di Indonesia selama lima tahun terakhir, karena kepraktisannya dalam penerapan, efisiensi komputasi, serta kemampuannya dalam mengelola dataset besar secara efektif .
Algoritma ini dimulai dengan menentukan jumlah klaster yco dan pemilihan centroid awal secara acak.
Setiap data kemudian dievaluasi jaraknya terhadap centroid tersebut, biasanya menggunakan jarak Euclidean, dan ditempatkan ke klaster yang memiliki jarak terdekat.
Setelah pembagian awal selesai, posisi centroid diperbarui dengan menghitung rata-rata seluruh data dalam klaster.
Proses ini terus diulang hingga posisi centroid tidak mengalami perubahan signifikan atau fungsi objektif telah mencapai konvergensi .
Secara matematis, fungsi objektif K-Means dapat dituliskan sebagai:
ya = Ocycoycn=1 OcycuOOyaycn |.
cuycn Oe yuNyc.
Pengelompokan Kabupaten di Indonesia untuk Pemetaan.
(Wahyudi et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Dengan yco mewakili jumlah klaster, yaycn sebagai himpunan anggota klaster ke-ycn, ycu sebagai data ke-ycu, dan yuNycn sebagai centroid klaster ke-ycn .
Beberapa studi di Indonesia telah menyoroti efektivitas penerapan K-Means.
Algoritma ini digunakan untuk mengelompokkan wilayah tertinggal berdasarkan indikator kemiskinan .
, mengklasifikasikan provinsi berdasarkan tingkat risiko COVID-19 .
, serta mengelompokkan wilayah berdasarkan jumlah kasus dan kematian COVID-19 .
Berdasarkan temuan tersebut, penelitian ini mengadopsi K-Means untuk mengklasifikasikan kabupaten/kota di Indonesia ke dalam empat kategori ekonomi: sangat rendah, rendah, sedang, dan tinggi, berdasarkan data PDRB tahun 2024.
Hasil klasterisasi diharapkan dapat memberikan representasi distribusi ekonomi regional yang objektif sekaligus menjadi acuan bagi perumusan strategi pembangunan nasional yang lebih tepat sasaran .
HASIL DAN PEMBAHASAN
Pengumpulan Data Penelitian ini menggunakan data PDRB atas dasar harga berlaku tahun 2024 pada tingkat kabupaten dan kota di Indonesia .
ihat Tabel .
Sumber data diperoleh dari BPS dan mencakup total 514 daerah PDRB dipilih sebagai indikator utama karena dianggap mampu merepresentasikan kapasitas ekonomi suatu wilayah dalam menghasilkan barang dan jasa.
Dengan menggunakan data PDRB terkini, analisis ini diharapkan dapat menyajikan potret aktual kondisi ekonomi regional di seluruh Indonesia.
Tabel 1.
Data Produk Dosmetik Regional Bruto 2024
Kabupaten/ Kota
Simeulue Aceh Singkil
Aceh Selatan Aceh Tenggara
Aceh Timur
Pegunungan Bintang
PDRB
Pra-pemrosesan Data Pada tahap pra-pemrosesan, data diperiksa dan dibersihkan guna memastikan tidak terdapat nilai kosong atau data yang tidak valid.
Setelah itu, dilakukan proses normalisasi untuk menyetarakan skala nilai PDRB, sehingga tidak ada variabel yang mendominasi hasil klasterisasi.
Normalisasi ini menggunakan metode Min-Max scaling, yang mentransformasikan nilai PDRB ke dalam rentang 0 hingga 1.
Prosedur ini sangat penting agar algoritma K-Means dapat melakukan pengelompokan dengan lebih objektif dan tidak terpengaruh oleh perbedaan skala antar wilayah.
Data PDRB pra- procesing dapat dilihat pada Tabel 2.
Tabel 2.
Data PDRB Pra- Procesing Kabupaten_Kota Simeulue Aceh Singkil
Aceh Selatan Aceh Tenggara
Pegunungan Bintang
PDRB
PDRB_Norm PDRB_Normalized Penentuan Jumlah Klaster Jumlah Penelitian ini menetapkan jumlah klaster menjadi empat kelompok, yaitu Sangat Rendah.
Rendah.
Sedang, dan Tinggi.
Penentuan jumlah klaster ini bukan hanya berdasarkan metode eksploratif seperti Elbow Method atau Silhouette Analysis, tetapi juga disesuaikan dengan kebutuhan interpretasi yang relevan dalam merumuskan kebijakan pembangunan ekonomi di Indonesia.
Distribusi data PDRB menunjukkan perbedaan cukup besar antar daerah, sehingga pendekatan Setiap kuartil mewakili 25% dari seluruh data, sehingga memungkinkan pemetaan wilayah berdasarkan tingkat kemampuan ekonominya secara seimbang.
Metode ini sesuai dengan tujuan akhir penelitian, yaitu memberikan klasifikasi wilayah yang mudah dipahami dan bisa digunakan sebagai dasar awal dalam merencanakan pembangunan.
Berikut ini penjelasan mengenai klasifikasi wilayah:
Sangat Rendah: Kabupaten/ Kota yang berada di kuartil pertama .
% nilai PDRB terenda.
Rendah: Kabupaten/ Kota yang berada di kuartil kedua .
Ae50%) Sedang: Kabupaten/ Kota yang berada di kuartil ketiga .
Ae75%) Tinggi: Kabupaten/ Kota yang berada di kuartil keempat .
% nilai PDRB tertingg.
MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1143-1151 MALCOM-05.
: 1143-1151
Hasil awal menunjukkan bahwa pendekatan empat klaster ini mampu membagi data secara seimbang dan tidak tidak seimbang, dengan masing-masing klaster terdiri dari jumlah daerah yang cukup merata.
Hal ini menegaskan bahwa metode kuartil sebagai dasar penentuan jumlah klaster dalam penelitian ini adalah tepat dan sesuai baik secara statistik maupun secara substansi kebijakan.
Hasil Klasterisasi dengan Algoritma K-Means Setelah dilakukan pra-pemrosesan, algoritma K-Means diterapkan untuk mengelompokkan kabupaten/kota ke dalam empat klaster yang telah ditentukan.
Berdasarkan hasil klasterisasi, diperoleh distribusi yaitu Kategori Sangat Rendah 129 kabupaten/kota.
Kategori Rendah 128 kabupaten/kota.
Kategori Sedang 128 kabupaten/kota.
Kategori Tinggi 129 kabupaten/kota.
Gambar 2.
Scatter plot hasil klasterisasi Berdasarkan Dari Gambar 2 Scatter Plot hasil Klasterisasi, dapat terlihat bahwa :
Sumbu X Memperlihatkan bahwa Index atau jumlah Data Kota/Kabupaten di Indonesia dari urutan 0 hingga 514 daerah administratif yang terdata pada PDRB Sumbu Y Memperlihatkan nilai PDRB per kabupaten/kota.
Warna Titik Menunjukkan intensitas nilai PDRB dimulai dari warna ungu .
ke kuning .
Dapat diperhatikan bahwa berdasarkan dari hasil penelitian ini terlihat dengan jelas jumlah perbandingan pendapatan di setiap kategorinya berdasarkan dari pendapatan PDRB yang dihasilkan selama 1 tahun penuh.
Terlihat ada beberapa daerah yang ketimpangan pendapatannya sangat jauh berbeda dari yang Untuk memahami lebih lanjut dapat kita lihat penyebaran pada setiap daerah dengan memaparkan penyebaran data berdasarkan peta Indonesia dari hasil penelitian ini sehingga terlihat dengan jelas daerah mana saja yang terbagi berdasarkan klister yang telah terbentuk.
Gambar 3.
Peta Klasterisasi PDRB dari tingkat klasternya Dari Hasil Pembagian klister yang di perlihatkan pada Gambar 3 dari bentuk peta penyebarannya berdasarkan klasterisasinya dapat kita lihat dengan jelas daerah mana saja yang tergolong Kategori Rendah, sangat rendah,sedang dan Tinggi sehingga dapat kita Analisa sebagai berikut :
Kesenjangan Ekonomi antar daerah masih tinggi, dengan ditandai dengan dominasi kategori rendah dan sangat rendah masih besar terlihat di luar Pulau Jawa.
Pusat-pusat ekonomi Indonesia masih sangat terpusat, terutama di kota-kota besar dan daerah industri.
Pengelompokan Kabupaten di Indonesia untuk Pemetaan.
(Wahyudi et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Daerah dengan Kategori sedang memiliki potensi strategis untuk dikembangkan sebagai Kawasan penyangga pertumbuhan ekonomi di Indonesia.
Kemudian di paparkan Tabel 3 untuk jumlah daerah kabupaten/kota yang dihasilkan dari setiap klister yang terbentuk dari hasil penelitian ini.
Tabel 3.
Jumlah setiap tingkatan Klaster Tingkatan Klaster Sangat Rendah Rendah Sedang Tinggi Jumlah Kota/ Kabupaten Berdasarkan dari jumlah klaster yang terbentuk pada setiap kabupaten dan kota di indonesiamemperlihatkan bahwa masih banyaknya klister yang berada dalam kategori sangat rendah dan rendah yang tersebar di seluruh Indonesia.
Evaluasi Hasil Klasterisasi Evaluasi kualitas hasil klasterisasi dilakukan menggunakan Silhouette Score, yang pada penelitian ini menghasilkan skor sebesar 0.
ihat Gambar .
Nilai ini menunjukkan bahwa pembagian klaster memiliki pemisahan yang baik dan jarak antar klaster relatif jelas.
Semakin mendekati angka 1, semakin baik kualitas klaster yang dihasilkan, sehingga hasil ini dapat dikatakan cukup valid untuk dijadikan dasar analisis Gambar 4.
Silhoutte Plot untuk Setiap Klaster Interpretasi dan Analisis Klaster Berdasarkan hasil klasterisasi, kabupaten/kota terbagi menjadi empat kategori, yakni Sangat Rendah.
Rendah.
Sedang, dan Tinggi.
Mayoritas daerah termasuk dalam kategori Rendah dan Sedang, menunjukkan adanya kesenjangan ekonomi antarwilayah.
Kabupaten/kota dalam kategori Sangat Rendah umumnya memiliki keterbatasan dalam diversifikasi sektor ekonomi, sementara kategori Tinggi didominasi oleh wilayah dengan sektor industri dan jasa yang berkembang pesat serta menjadi pusat kegiatan ekonomi Evaluasi menggunakan Silhouette Score menghasilkan nilai 0,778, menandakan bahwa pemisahan klaster cukup baik dan jarak antar klaster relatif jelas, sehingga memperkuat validitas hasil sebagai dasar analisis lebih lanjut.
Hasil ini sejalan dengan penelitian sebelumnya yang memanfaatkan K-Means untuk pengelompokan wilayah di Indonesia.
Contohnya, penelitian di Pulau Sumatra pada 2023 menemukan bahwa perbedaan karakteristik sosial-ekonomi, seperti tingkat pendidikan, pengeluaran rumah tangga, dan tingkat pengangguran, menjadi faktor utama terbentuknya klaster kemiskinan .
Temuan tersebut mendukung hasil penelitian saat ini, di mana variasi kontribusi sektor ekonomi memengaruhi distribusi PDRB Penelitian lain terkait ketahanan pangan di Indonesia juga menunjukkan efektivitas K-Means dalam mengelompokkan kabupaten/kota berdasarkan indikator ekonomi dan sosial, termasuk PDRB per kapita .
Hal ini menegaskan bahwa metode K-Means dapat diterapkan secara luas untuk analisis wilayah berbasis variabel multidimensi.
Selain itu, penelitian di Provinsi Papua menggunakan metode alternatif seperti Single Linkage dan KMedoids untuk pengelompokan kabupaten/kota berdasarkan PDRB sektoral .
Hasil menunjukkan bahwa MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1143-1151 MALCOM-05.
: 1143-1151
metode non-hierarkis selain K-Means juga mampu menangani data dengan outlier kuat, sehingga dapat menjadi alternatif dalam penelitian mendatang.
Jika dibandingkan dengan hasil penelitian ini.
K-Means terbukti lebih efisien dan memberikan pemisahan klaster yang jelas, meskipun memiliki keterbatasan dalam menghadapi data ekstrem.
Implikasi dari penelitian ini menunjukkan pentingnya strategi pembangunan yang disesuaikan dengan karakteristik klaster daerah.
Kabupaten/kota dalam kategori Sangat Rendah membutuhkan intervensi khusus berupa diversifikasi ekonomi dan peningkatan infrastruktur dasar, sementara daerah dalam kategori Tinggi dapat difokuskan sebagai pusat pertumbuhan baru dengan memperkuat konektivitas ke wilayah sekitarnya.
Secara akademik, penelitian ini menegaskan relevansi K-Means dalam analisis spasial-ekonomi di Indonesia, dan secara praktis hasilnya dapat menjadi acuan bagi pemerintah dalam merumuskan kebijakan pembangunan yang lebih merata.
Keterbatasan penelitian ini terletak pada penggunaan satu variabel utama, yaitu PDRB, sehingga penelitian selanjutnya disarankan memasukkan indikator sosial-ekonomi tambahan agar hasil klasterisasi lebih komprehensif.
KESIMPULAN
Penelitian ini berhasil melakukan pengelompokan kabupaten dan kota di Indonesia berdasarkan data PDRB tahun 2024 menggunakan algoritma K-Means.
Hasil klasterisasi menunjukkan terbentuknya empat kategori tingkat ekonomi: Sangat Rendah.
Rendah.
Sedang, dan Tinggi.
Kategori Sangat Rendah mencakup daerah dengan keterbatasan diversifikasi ekonomi dan dominasi sektor primer.
Kategori Rendah dan Sedang menggambarkan wilayah yang berada dalam kondisi ekonomi transisi, di mana kontribusi sektor industri dan jasa mulai meningkat.
Sementara itu, kategori Tinggi didominasi oleh daerah dengan sektor industri dan jasa yang maju, sekaligus menjadi pusat kegiatan ekonomi nasional.
Evaluasi kualitas klasterisasi menggunakan Silhouette Score menunjukkan nilai 0,778.
Angka ini menandakan bahwa pemisahan antar klaster cukup jelas dan relatif optimal dibandingkan opsi jumlah klaster lainnya, sehingga kelompok wilayah yang terbentuk dapat dianggap valid dan representatif.
Secara praktis, hasil penelitian ini dapat menjadi dasar dalam perumusan strategi pembangunan daerah yang lebih terarah.
Pemerintah pusat maupun daerah dapat memanfaatkan pemetaan ini sebagai acuan dalam menentukan prioritas pembangunan, alokasi sumber daya, serta upaya pengurangan kesenjangan antarwilayah.
Kendati demikian, penelitian ini memiliki keterbatasan karena hanya menggunakan satu variabel utama, yaitu PDRB.
Penelitian selanjutnya disarankan untuk memasukkan indikator tambahan, seperti tingkat kemiskinan, pendidikan, dan infrastruktur, agar hasil klasterisasi dapat memberikan gambaran yang lebih menyeluruh mengenai kondisi ekonomi daerah.
REFERENSI