599 Progresif: Jurnal Ilmiah Komputer https://ojs. stmik-banjarbaru. id/index. php/progresif/index Jl. Ahmad Yani. 33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp. , e-mail: puslit. stmikbjb@gmail. e-ISSN: 2685-0877 Penerapan K-Means Clustering Untuk Mengelompokkan Tingkat Konsumsi Listrik Menurut Provinsi di Indonesia DOI: http://dx. org/10. 35889/progresif. Creative Commons License 4. 0 (CC BY Ae NC) Yenni Lutfhi Berliana1. Irwansyah2* Teknik Informatika. Universitas Muhammadiyah Prof. Dr. Hamka. Jakarta Timur. Indonesia *e-mail Corresponding Author: irwansyah@uhamka. Abstract Electricity consumption in Indonesia continues to increase every year, but its distribution is not evenly distributed across provinces. Therefore, an analysis is needed to group regions based on electricity consumption patterns to help plan more efficient distribution. This study aims to group regions in Indonesia based on their electricity usage patterns, considering customer types such as households, industry, business, social, government buildings, and street lighting. The clustering process is performed using the k-means clustering method. The data used is official PLN data from 2019 to 2024. The analysis process is performed using RapidMiner, with steps of data preprocessing, application of K-Means, and evaluation of the results using the DaviesBouldin Index (DBI) method. The results of the study show that the provinces in Indonesia are divided into two clusters, namely Cluster 0 with 29 provinces with low-medium consumption and Cluster 1 with 5 provinces with high consumption, especially in the Java Island region. The DBI value of 0. 507 indicates that the resulting clustering is quite optimal. These results are in line with the PLN report and should support more targeted infrastructure planning and power distribution policies. Keywords: Data Mining. K-Means Clustering. Electricity Consumption Abstrak Konsumsi energi listrik di Indonesia terus meningkat setiap tahunnya, namun distribusinya tidak merata di seluruh provinsi. Oleh karena itu, diperlukan analisis untuk mengelompokkan wilayah berdasarkan pola konsumsi energi listrik guna membantu perencanaan distribusi yang lebih Penelitian ini bertujuan untuk mengelompokkan wilayah-wilayah di Indonesia berdasarkan pola penggunaan listriknya, dengan mempertimbangkan jenis pelanggan seperti rumah tangga, industri, bisnis, sosial, gedung pemerintahan, dan penerangan jalan umum. Proses pengelompokan dilakukan dengan menggunakan metode k-means clustering. Data yang digunakan merupakan data resmi dari PLN tahun 2019 hingga 2024. Proses analisis dilakukan menggunakan RapidMiner, dengan tahapan pre-processing data, penerapan K-Means, dan evaluasi hasil menggunakan metode Davies-Bouldin Index (DBI). Hasil penelitian menunjukkan bahwa provinsi di Indonesia terbagi ke dalam dua cluster, yaitu Cluster 0 dengan 29 provinsi yang memiliki konsumsi rendah-menengah dan Cluster 1 dengan 5 provinsi berdaya konsumsi tinggi, khususnya wilayah Pulau Jawa. Nilai DBI sebesar 0,507 menunjukkan bahwa pengelompokan yang dihasilkan cukup optimal. Hasil ini sejalan dengan laporan PLN dan diharapkan dapat mendukung perencanaan infrastruktur serta kebijakan distribusi energi secara lebih tepat sasaran. Kata Kunci: Data Mining. K-Means Clustering. Konsumsi Listrik Pendahuluan Penggunaan listrik menjadi bagian penting dalam kehidupan masyarakat Indonesia. Aktivitas sehari-hari seperti penerangan, memasak, dan penggunaan alat elektronik sangat Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana 600 e-ISSN: 2685-0877 bergantung pada listrik. Perusahaan Listrik Negara (PLN) adalah perusahaan milik negara yang bergerak di bidang energi. PLN menyediakan listrik bagi seluruh warga, industri, dan sektor Sejak tahun 1945. PLN telah berkembang pesat dalam menyediakan layanan kelistrikan bagi masyarakat Indonesia dan turut memainkan peran signifikan dalam mendukung pertumbuhan ekonomi nasional. Pada tahun 2023. Tingkat elektrifikasi di Indonesia pada tahun 2023 telah mencapai 99,74%, menunjukkan hampir seluruh wilayah telah teraliri listrik. Menurut laporan yang dirilis oleh Kementerian ESDM, konsumsi listrik per kapita di Indonesia mengalami kenaikan dari 1. 173 kWh/kapita pada tahun 2022 menjadi 1. kWh/kapita pada tahun 2024. Selain itu, penjualan listrik PLN meningkat 5,32% dari tahun 2022 ke 2023, dengan segmen bisnis dan industri sebagai kontributor terbesar . Penjualan listrik PT PLN (Perser. meningkat 5,32 persen dari 270,82 TWh pada tahun 2022 menjadi 285,23 TWh pada tahun 2023. Dengan pertumbuhan 12,53%, segmen bisnis menjadi penopang Di sisi lain, segmen industri menyumbang 30,72% dari total penjualan energi. Peningkatan ini menunjukkan tren konsumsi listrik yang terus meningkat di Indonesia . Meskipun tren konsumsi listrik terus meningkat, distribusi penggunaannya tidak merata di setiap Wilayah dengan konsumsi listrik terbesar di Indonesia pada tahun 2023 adalah JawaMadura-Bali, dengan jumlah populasi mencapai 156 juta jiwa dan konsumsi listrik sebesar 035 GWh . Mengingat banyaknya jumlah provinsi di Indonesia, rata-rata penjualan energi di setiap provinsi tentu berbeda-beda. Ketimpangan ini menunjukkan adanya perbedaan besar dalam penggunaan energi antar daerah. Masalah utamanya adalah belum adanya pengelompokan atau klasifikasi wilayah berdasarkan tingkat penggunaan listrik secara sistematis dan jelas. Sampai saat ini. PLN hanya memberikan data mentah berupa angka penjualan energi untuk tiap jenis pelanggan, tanpa proses analisis lebih lanjut yang bisa membantu menentukan wilayah yang paling membutuhkan dalam distribusi energi. Oleh karena itu, dibutuhkan pendekatan yang menganalisis pola penggunaan listrik di tiap wilayah agar bisa mengelompokkan daerah yang memiliki karakteristik yang serupa. Untuk mengatasi masalah tersebut, diperlukan metode analisis data yang mampu mengelompokkan wilayah-wilayah dengan karakteristik konsumsi listrik yang serupa. Salah satu metode yang dapat digunakan adalah K-Means Clustering, metode dalam mengolah data yang termasuk dalam metode unsupervised learning. Algoritma ini digunakan untuk membagi data ke dalam beberapa cluster berdasarkan kesamaan sifat atau ciri yang dimiliki, dan memiliki cara kerja yang cepat serta mampu memberikan hasil pengelompokan dalam waktu singkat . Metode ini dianggap efisien karena mampu mengolah data dalam skala besar serta menghasilkan kelompok yang sederhana namun tetap memberikan informasi yang bermakna. Pendekatan ini telah diterapkan dalam penelitian oleh Cici Astria et al. Dalam studi tersebut, tiga provinsi termasuk dalam cluster dengan tingkat distribusi tinggi, sedangkan 31 provinsi lainnya masuk ke dalam kategori distribusi rendah . Dengan pengelompokan ini, pengambil kebijakan dapat lebih mudah menentukan daerah prioritas untuk pembangunan atau peningkatan infrastruktur kelistrikan. Penelitian ini dilakukan untuk membagi provinsi di Indonesia menjadi beberapa kelompok berdasarkan pola penggunaan listrik dari berbagai kategori pelanggan dengan menerapkan metode K-Means Clustering. Hasil pengelompokan ini diharapkan bisa membantu PLN dan pemerintah dalam mengetahui wilayah mana saja yang tingkat konsumsi listriknya tinggi, atau rendah. Dengan begitu, perencanaan pembangunan infrastruktur listrik, pembagian daya listrik, dan kebijakan lainnya bisa dibuat dengan lebih tepat dan sesuai kebutuhan di setiap wilayah. Tinjauan Pustaka Pada penelitian sebelumnya membahas mengenai Data Mining yang diaplikasikan pada Kasus Tenaga Listrik yang Dibangkitkan menunjukkan bahwa algoritma K-Means efektif dalam mengelompokkan provinsi di Indonesia berdasarkan kapasitas pembangkitan listrik periode 2011Ae2017. Hasilnya, dua provinsi masuk kategori kapasitas tinggi, empat provinsi sedang, dan 27 provinsi rendah . Penelitian kedua membuktikan bahwa metode K-Means Clustering berhasil diterapkan dalam menganalisa tingkat pemakaian listrik. Hasil penelitian menunjukkan perubahan dalam konsumsi, yang membantu mengidentifikasi area yang memerlukan intervensi, seperti kampanye konservasi energi . Progresif: Vol. No. Agustus 2025: 599-612 Progresif e-ISSN: 2685-0877 Pada penelitian ketiga, dijelaskan bahwa pelanggan pascabayar PLN di Helvetia dikelompokkan berdasarkan biaya energi dan kode pembaca meteran menggunakan metode Kmeans. Hasil pengelompokan dibagi ke dalam tiga kategori yaitu tinggi, sedang, dan rendah. Hal in dapat membantu PLN meningkatkan kualitas layanan dan mengembangkan strategi pemasaran, infrastruktur, dan program penghematan energi yang lebih terarah . Penelitian lainnya membahas penerapan algoritma K-Means untuk mengklasifikasikan provinsi-provinsi di Indonesia berdasarkan jumlah listrik yang didistribusikan. Latar belakang penelitian ini berkaitan dengan meningkatnya kebutuhan energi dan tantangan dalam pemerataan distribusi. Data yang digunakan mencakup periode 2011Ae2017 dan mencakup 34 Hasil analisis menghasilkan dua cluster, yaitu distribusi tinggi (C. dan rendah (C. Penelitian lain juga telah dilakukan dengan menggunakan algoritma Mini Batch KMeans Clustering untuk merancang sistem pemantauan penggunaan listrik pada gedung. Sistem berbasis unsupervised learning ini menampilkan informasi melalui website. Hasil uji menunjukkan nilai silhouette score pada Gedung N sebesar 0,62 . , 0,57 . , dan 0,73 . , menandakan struktur cluster yang baik . Dari berbagai studi terdahulu, terlihat bahwa algoritma K-Means sangat efektif dalam mengelompokkan data berdasarkan kecocokan sifat-sifatnya. Proses pengelompokkan ini memberikan informasi yang berguna untuk membantu membuat keputusan kebijakan yang lebih tepat dan akurat. Pada penelitian ini menawarkan pendekatan baru yaitu membagi provinsi di Indonesia berdasarkan tingkat pemakaian listrik berdasarkan jenis pelanggan. Penelitian ini tidak hanya mengandalkan total konsumsi, tetapi juga mempertimbangkan struktur konsumsi dari berbagai sektor pada tiap wilayah. Hal ini memberikan gambaran yang lebih lengkap mengenai pola konsumsi listrik secara menyeluruh. Selain itu, penelitian ini menggunakan data terbaru yang lebih relevan secara kebijakan . ingga tahun 2. dan mencakup seluruh wilayah administratif . Pendekatan ini memberikan kontribusi dalam membantu PLN dan pemangku kebijakan untuk memahami kebutuhan energi tiap wilayah secara lebih spesifik dan akurat, sehingga mendukung strategi perencanaan infrastruktur dan distribusi daya yang lebih efisien. Metodologi Penelitian ini dilakukan dengan menerapkan tahapan metode seperti yang ditunjukkan pada Gambar 1. Gambar 1. Tahapan Penelitian . Pengumpulan Data Data yang digunakan dalam penelitian ini meliputi data Energi Terjual per Kelompok Pelanggan berdasarkan kelompok pelanggan dan wilayah di Indonesia, yang diperoleh dari sumber data resmi PT Perusahaan Listrik Negara (PLN). Periode data yang digunakan adalah tahun 2019 hingga tahun 2024. Parameter yang digunakan adalah provinsi, dan jenis pelanggan . umah tangga, bisnis, industri, gedung pemerintah, dan penerangan jalan umu. Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana e-ISSN: 2685-0877 Dengan cakupan wilayah yang mencakup seluruh provinsi di Indonesia, data ini memberikan gambaran menyeluruh mengenai distribusi dan pola konsumsi listrik di berbagai provinsi. Pre-Processing Data Sebelum memulai proses clustering, data diolah terlebih dahulu agar siap digunakan. Tahapan ini meliputi seleksi atribut yang relevan, penghapusan wilayah gabungan yang berpotensi menyebabkan duplikasi, serta penyesuaian format angka, seperti menghapus pemisah ribuan agar dapat dikenali dan diproses dengan benar oleh RapidMiner. Serta, dilakukan akumulasi data setiap provinsi dari tahun 2019 hingga 2024 dengan menjumlahkan total energi terjual per provinsi untuk setiap tahun. Metode K-Means Clustering Setelah melewati proses pre-processing data dan data sudah siap digunakan, maka dilakukan clustering. Pada tahap ini, data diolah menggunakan RapidMiner. RapidMiner adalah software berbasis Java yang dirancang agar dapat dijalankan di berbagai sistem operasi, sehingga memberikan fleksibilitas bagi pengguna dalam melakukan analisis data di berbagai Aplikasi ini menjadi salah satu solusi dalam penerapan analisis data mining, karena menyediakan teknik analisis deskriptif dan prediktif yang membantu pengguna dalam mengambil keputusan secara optimal . Proses pengolahan dimulai dengan pemilihan atribut yang relevan, dilanjut dengan penerapan algoritma K-Means Clustering. Clustering adalah metode dalam data mining yang digunakan untuk membagi data menjadi beberapa kelompok berdasarkan kesamaan tertentu. K-means merupakan salah satu algoritma dalam metode clustering . Proses pengelompokan data menggunakan algoritma K-Means melibatkan langkah-langkah berikut: Inisialisasi Centroid Sebagai langkah awal, jumlah cluster . ditentukan, kemudian beberapa titik centroid dipilih secara acak untuk memulai proses klasifikasi data. Clustering Kelompokkan setiap data ke dalam cluster yang memiliki pusat . Jarak ini umumnya dihitung menggunakan jarak Euclidean, yaitu: = Oo[(X1i - X1. A (X2i - X2. A . (Xki - Xk. A] . Dimana: A D. = Jarak antara data ke-i dengan pusat cluster ke-j. A Xki = Data ke-i pada atribut data ke-k A Xkj = Titik pusat ke-j pada atribut ke-k Pembaruan Centroid Kelompok Untuk memperbarui posisi centroid, dihitunglah rata-rata dari semua data dalam setiap kelompok berdasarkan hasil klasifikasi yang sudah ada uj. = . /Ns. * jOOsj xj Dimana : A Uj . = centroid baru pada iterasi A Nsj = jumlah data dalam cluster sj Pengulangan Proses clustering dan pembaruan centroid dilakukan berulang kali sampai hasil pengelompokan stabil atau jumlah iterasi maksimum telah terpenuhi. Evaluasi Konvergensi Lakukan evaluasi konvergensi dengan memantau perubahan posisi centroid atau memastikan atribusi data dalam cluster sudah stabil dalam beberapa iterasi. Terminasi Algoritma akan berhenti ketika kriteria penghentian tercapai, baik karena iterasi maksimum telah dicapai atau tidak ada perubahan signifikan dalam pengelompokan data . Progresif: Vol. No. Agustus 2025: 599-612 Progresif e-ISSN: 2685-0877 . Hasil dan Analisis Setelah menerapkan algoritma K-Means pada data konsumsi listrik, diperoleh hasil pengelompokan menjadi 2 cluster utama. Kedua cluster ini merepresentasikan pola konsumsi yang berbeda. Visualisasi hasil clustering menggunakan line chart menggambarkan pembagian wilayah/provinsi ke dalam 2 cluster utama berdasarkan pola konsumsi energi listrik pada masing-masing sektor. Selain itu, visualisasi ini juga menampilkan perbandingan konsumsi energi berdasarkan jenis pelanggan. Analisis terhadap karakteristik tiap cluster mengungkapkan perbedaan signifikan dalam pola pemakaian listrik yang berkaitan dengan jenis pelanggan dan lokasi geografis. Evaluasi Davies Bouldin Index (DBI) Penilaian terhadap hasil clustering dilakukan dengan pendekatan Davies-Bouldin Index (DBI), yaitu suatu teknik evaluasi yang mengukur seberapa baik data terbagi dalam masingmasing cluster. Pendekatan pengujian DBI mencakup dua aspek, yaitu separasi dan kohesi. Kohesi merepresentasikan seberapa mirip data dalam suatu cluster terhadap pusat clusternya, sedangkan separasi menggambarkan seberapa jauh jarak antar pusat cluster. Pengelompokan yang ideal dicirikan oleh kohesi rendah dan pemisahan tinggi. Semakin dekat nilai Indeks Davis-Bouldin (DBI) ke 0, semakin akurat hasil pengelompokan. Semakin kecil nilai DBI, maka semakin optimal hasil pengelompokan yang diperoleh. Hasil dan Pembahasan 1 Pre-Processing Data Data Selection: Tahapan ini melibatkan pemilihan variabel yang dianggap relevan untuk dianalisis. Adapun variabel yang digunakan mencakup tahun . 9Ae2. , nama provinsi, serta kategori Tabel 1. Data Energi Terjual berdasarkan Kelompok Pelanggan (Gw. Tahun 2019 - 2024 Tahun Satuan PLN/ Provinsi UIW Aceh Rumah Tangga 1733,04 Industri Bisnis Sosial 159,59 466,06 UIW North Sumatera UIW West Sumatera UIW Riau and Riau Archipelago Riau 5362,88 2910,53 1650,11 Riau Archipelago UIW South Sumatera. Jambi, and Bengkulu South Sumatera Jambi Bengkulu UIW Bangka Belitung UID Lampung UIW West Kalimantan UIW South and Central Kalimantan South Kalimantan Central 199,25 Gdg Kantor Pemerintahan 104,06 Penerangan Jalan Umum 1695,35 422,76 141,08 411,26 925,12 535,31 165,07 76,81 92,66 3091,53 486,04 1395,39 248,15 142,13 169,81 447,31 1098,76 213,52 103,04 148,36 455,73 38,73 296,62 34,63 39,09 21,45 4829,39 1195,37 1445,64 309,42 183,18 178,54 969,99 925,91 195,82 106,07 132,67 151,43 386,29 75,82 46,76 669,68 73,95 133,43 37,77 30,36 10,28 689,04 185,66 204,76 43,87 34,42 9,18 2745,52 974,28 587,24 184,92 71,23 1588,66 183,33 567,38 107,99 78,52 46,81 2508,13 448,58 825,75 175,77 138,61 81,07 358,77 543,08 120,92 59,79 848,73 89,82 282,67 54,85 61,41 21,29 Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana e-ISSN: 2685-0877 Tahun Satuan PLN/ Provinsi Kalimantan Rumah Tangga Industri Bisnis Sosial Gdg Kantor Pemerintahan Penerangan Jalan Umum UIW East and North Kalimantan UIW North. Central Sulawesi. Gorontalo 2213,45 312,89 182,28 170,19 53,77 1967,25 387,26 692,59 162,22 136,54 125,38 UID Jakarta Raya 3915,90 1742, 43 1452,01 Data Cleaning Tahapan ini mencakup proses pembersihan terhadap data yang akan dianalisis, meliputi penghapusan pemisah ribuan . eperti angka titik atau kom. serta penghapusan nilai gabungan pada data provinsi agar dapat diproses dengan benar oleh Rapid Miner. Tabel 2. Menghapus Pemisah Ribuan Total (Sebelu. Total (Sesuda. 8,332. 5,308. 2,010. 1,013. 1,217. 4,959. 2,715. Tabel 3. Menghapus Nilai Gabungan Provinsi (Sebelu. Provinsi (Sesuda. UID Sumatera Selatan. Jambi. Bengkulu Sumatera Selatan Sumatera Selatan Jambi Jambi Bengkulu Bengkulu UID Riau dan Kepulauan Riau Riau Kepulauan Riau Kepulauan Riau Data Transformasi Pada tahap transformasi data, dilakukan proses penggabungan data dari seluruh tahun yang tersedia menjadi satu kesatuan. Proses ini bertujuan untuk mengakumulasi total nilai pada setiap kategori atau atribut yang dianalisis, sehingga menghasilkan representasi data yang lebih ringkas dan relevan. Dengan cara ini, pola konsumsi atau tren berdasarkan wilayah dapat dianalisis secara keseluruhan tanpa terfragmentasi oleh periode waktu tertentu. Tabel 4. Hasil Akumulasi Data Industri Bisnis Sosial Satuan PLN/Provinsi Rumah Tangga Aceh Sumatera Utara Sumatera Barat Progresif: Vol. No. Agustus 2025: 599-612 Gedung Kantor Pemerintahan Penerangan Jalan Umum Progresif e-ISSN: 2685-0877 Satuan PLN/Provinsi Rumah Tangga Industri Bisnis Sosial Gedung Kantor Pemerintahan Penerangan Jalan Umum Riau Kepulauan Riau Sumatera Selatan Jambi Bengkulu Bangka Belitung Lampung Kalimantan Barat Kalimantan Selatan Kalimantan Tengah Kalimantan Timur Sulawesi Utara Sulawesi Tengah Gorontalo Sulawesi Selatan Sulawesi Tenggara Sulawesi Barat Maluku Maluku Utara Papua Papua Barat Bali Nusa Tenggara Barat Nusa Tenggara Timur Batam Jawa Timur Jawa Tengah Yogyakarta Jawa Barat Banten Jakarta Raya Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana e-ISSN: 2685-0877 2 K-Means Clustering Clustering dilakukan dengan menerapkan algoritma K-Means untuk mengelompokkan data berdasarkan kesamaan karakteristiknya. Tujuan dari proses ini adalah untuk mengelompokkan wilayah atau provinsi berdasarkan kesamaan pola penggunaan energi listrik di setiap sektor. Clustering dibagi menjadi 2 cluster. Proses clustering ini dilakukan setelah data melalui tahapan cleaning dan transformasi, sehingga data yang digunakan telah siap dianalisis secara optimal. Proses Modelling Gambar 2. Proses Modelling Hasil Clustering Proses pemodelan dengan algoritma K-Means Clustering menghasilkan dua kelompok data, yaitu cluster 0 dan cluster 1. Masing-masing cluster merepresentasikan kelompok wilayah dengan karakteristik konsumsi energi listrik yang serupa berdasarkan sektor penggunaannya. Gambar 3 Jumlah Provinsi Setiap Cluster Gambar 4 Data Centroid Progresif: Vol. No. Agustus 2025: 599-612 Progresif e-ISSN: 2685-0877 Gambar 5. Hasil Clustering Tabel 5 Hasil Cluster 0 Cluster Provinsi Aceh Sumatera Utara Sumatera Barat Riau Kepulauan Riau Sumatera Selatan Jambi Bengkulu Bangka Belitung Lampung Rumah Tangga Industri Bisnis Sosial Gedung Kantor Penerangan Jalan Umum Kalimantan Barat Kalimantan Selatan Kalimantan Tengah Kalimantan Timur Sulawesi Utara Sulawesi Tengah Gorontalo Sulawesi Selatan Sulawesi Tenggara Sulawesi Barat Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana e-ISSN: 2685-0877 Cluster Maluku Gedung Kantor Maluku Utara Papua Papua Barat Bali Nusa Tenggara Barat Nusa Tenggara Timur Batam Yogyakarta Cluster Provinsi Industri Bisnis Sosial Jawa Timur Jawa Tengah Jawa Barat Banten Jakarta Raya Rumah Tangga Gedung Kantor Penerangan Jalan Umum Provinsi Rumah Tangga Industri Bisnis Sosial Penerangan Jalan Umum Tabel 6 Hasil Cluster 1 Interpretasi Hasil cluster Jenis Pelanggan Rumah Tangga Industri Bisnis Sosial Gedung Kantor Pemerintahan Penerangan Jalan Umum Tabel 7 Interpretasi Cluster 0 Tertinggi Provinsi Terendah Sumatra Utara Sumatra Utara Bali Sumatra Utara Kalimantan Timur Sumatra Utara Provinsi Sulawesi Barat Maluku Sulawesi Barat Sulawesi Barat Sulawesi Barat Papua Barat Berdasarkan hasil pengelompokan dengan algoritma K-Means. Cluster 0 mencakup provinsi-provinsi dengan konsumsi listrik yang rendah di hampir semua jenis pelanggan. Sumatera Utara menjadi pengecualian karena mencatat nilai tertinggi pada sektor rumah tangga, industri, sosial, dan penerangan jalan umum. Sebaliknya, provinsi seperti Sulawesi Barat. Papua Barat, dan Maluku menunjukkan konsumsi sangat rendah, terutama pada sektor bisnis dan gedung kantor. Secara umum. Cluster 0 merepresentasikan wilayah dengan tingkat pemakaian listrik yang masih rendah dan berpotensi untuk ditingkatkan. Progresif: Vol. No. Agustus 2025: 599-612 Progresif e-ISSN: 2685-0877 Jenis Pelanggan Rumah Tangga Industri Bisnis Sosial Gedung Kantor Pemerintahan Penerangan Jalan Umum Tabel 8 Interpretasi Cluster 1 Tertinggi Provinsi Terendah Jawa Barat Jawa Barat Jakarta Raya Jawa Timur Jakarta Raya Jawa Timur Provinsi Banten Jakarta Raya Jawa Barat Banten Banten Banten Berdasarkan hasil pengelompokan Cluster 1, wilayah-wilayah di dalamnya umumnya menunjukkan konsumsi listrik yang tinggi dan merata, terutama pada sektor rumah tangga, industri, dan gedung pemerintahan. Hal ini tercermin dari dominasi provinsi besar seperti Jawa Barat. Jakarta Raya, dan Jawa Timur yang menduduki peringkat tertinggi pada sebagian besar kategori pelanggan. Evaluasi / Pengujian menggunakan Davies Bouldin Index Hasil Evaluasi menunjukkan cluster terbaik yaitu 2 dengan nilai 0,508. Nilai ini menunjukkan bahwa hasil pengelompokan yang diperoleh melalui algoritma K-Means tergolong optimal, karena nilai DBI yang rendah mencerminkan adanya pemisahan yang jelas antar cluster dan kemiripan yang tinggi di dalam masing-masing cluster. Dengan demikian, model clustering yang dibentuk dapat dikatakan cukup optimal dalam mengelompokkan data berdasarkan pola konsumsi energi listrik. Tabel 9 Hasil Nilai Davies Bouldin Index (DBI) Penentuan Jumlah Cluster Terbaik Hasil DBI 2 Cluster 0,507 3 Cluster 0,781 4 Cluster 0,584 Gambar 6. Performance Vector Visualisasi Clutering Hasil visualisasi di bawah ini menunjukkan pengelompokan data yang diperoleh melalui penerapan algoritma K-Means. Visualisasi ini menggambarkan pembagian wilayah/provinsi ke dalam 2 cluster utama berdasarkan pola konsumsi energi listrik pada masing-masing sektor. Selain itu, visualisasi ini juga menampilkan perbandingan konsumsi energi berdasarkan jenis Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana e-ISSN: 2685-0877 pelanggan, sehingga memudahkan dalam menginterpretasi hasil pengelompokan secara visual dan sektor mana yang paling mendominasi konsumsi energi pada masing-masing cluster. Gambar 7. Visualisasi Clustering 3 Pengujian Akurasi Algoritma Tabel 10 Perbandingan Hasil Cluster Berdasarkan Provinsi Provinsi Hasil Cluster Data PLN Sesuai atau Tidak Pulau Jawa (Jakarta Tinggi Tinggi . Sesuai Raya. Jawa Barat. Jawa Timur. Jawa Tengah. Bante. Luar Pulau Jawa Lebih rendah pulau Jawa Lebih rendah pulau Jawa Sesuai Tabel menunjukkan bahwa provinsi di Pulau Jawa . eperti Jakarta. Jawa Barat, dan lainny. termasuk dalam cluster dengan konsumsi energi tinggi, sesuai dengan data PLN. Sementara itu, provinsi di luar Pulau Jawa tergolong dalam cluster dengan konsumsi lebih rendah, juga sesuai dengan data PLN. Hal ini menunjukkan bahwa hasil clustering sejalan dengan kondisi riil distribusi energi pada data PLN. 4 Pembahasan Penelitian ini memperkuat hasil-hasil dari penelitian sebelumnya yang juga menggunakan algoritma K-Means dalam mengelompokkan data konsumsi energi listrik. Beberapa studi terdahulu telah menunjukkan bahwa K-Means dapat digunakan secara efektif untuk mengidentifikasi pola konsumsi berdasarkan wilayah atau jenis pelanggan. Pada penelitian yang membahas tentang pendistribusian listrik, berhasil dikelompokkan dengan algoritma K-Means Clustering, hasilnya clustering membagi wilayah ke dalam dua cluster, yaitu distribusi tinggi dan rendah . Penelitian ini memiliki kemiripan dalam penggunaan variabel wilayah, namun cakupannya terbatas pada satu aspek yaitu volume distribusi. Berbeda dari penelitian tersebut, penelitian ini memberikan kontribusi, yaitu: Menggunakan lebih banyak atribut, seperti jenisAejenis pelanggan (Rumah Tangga. Industri. Bisnis. Sosial. Gedung Kantor, dan Penerangan Jalan Umu. Progresif: Vol. No. Agustus 2025: 599-612 Progresif e-ISSN: 2685-0877 Menggunakan data yang lebih terbaru, yaitu data konsumsi energi listrik dari tahun 2019 hingga tahun 2024, sementara penelitian sebelumnya hanya mencakup data hingga tahun Melakukan evaluasi dengan Davies-Bouldin Index (DBI) untuk mengukur performa model Penelitian ini tidak hanya memperluas cakupan wilayah, tetapi juga menyajikan analisis berdasarkan jenis-jenis pelanggan, sehingga memberikan informasi yang lebih spesifik mengenai sektor mana yang memiliki konsumsi energi tertinggi di masing-masing cluster. Simpulan Algoritma K-Means Clustering berhasil mengelompokkan 34 provinsi di Indonesia menjadi 2 cluster, berdasarkan data konsumsi energi listrik dari berbagai jenis pelanggan, seperti rumah tangga, industri, bisnis, sosial, gedung kantor pemerintahan, dan penerangan jalan umum. Hasil pengelompokan menunjukkan bahwa Cluster 0 terdiri dari 29 provinsi dengan tingkat konsumsi listrik yang relatif rendah, sementara Cluster 1 mencakup 5 provinsi dengan konsumsi tinggi. Evaluasi menggunakan Davies-Bouldin Index (DBI) menghasilkan nilai 0,507 yang menunjukkan bahwa hasil pengelompokan cukup optimal dengan struktur cluster yang Temuan ini juga selaras dengan laporan konsumsi listrik PLN, di mana wilayah Jawa mendominasi konsumsi nasional. Selain itu, penelitian ini memberikan kontribusi baru dengan memanfaatkan data yang lebih terkini . ahun 2019Ae2. , mempertimbangkan variasi jenis pelanggan secara lebih detail, serta mengukur performa model clustering. Diharapkan penelitian ini dapat memberikan hasil yang dapat dijadikan acuan dalam perencanaan penyaluran energi dan pengambilan keputusan yang lebih tepat bagi PLN dan pemerintah. Daftar Referensi . PLN. Au78 Tahun PLN Hadir Listriki Indonesia. Rasio Elektrifikasi Nasional Capai 99,74%,Ay PLN. Accessed: Oct. 20, 2024. [Onlin. Available: https://web. id/media/siaranpers/2023/10/78-tahun-pln-hadir-listriki-indonesia-rasio-elektrifikasi-nasional-capai-9974 . Setiawan. AuKonsumsi Listrik RI di 2024 Naik Jadi 1. 411 kWh/Kapita,Ay CNBC INDONESIA. [Onlin. Available: https://w. com/news/202502031515484-607561/konsumsi-listrik-ri-di-2024-naik-jadi-1411-kwh-kapita . Trianto. AuPenjualan Meningkat. Ini Upaya PLN Listriki Sektor Bisnis dan Industri Sepanjang Tahun 2023,Ay PLN. Accessed: Oct. 21, 2024. [Onlin. Available: https://web. id/media/siaran-pers/2024/01/penjualan-meningkat-ini-upaya-pln-listrikisektor-bisnis-dan-industri-sepanjang-tahun-2023 . Wibowo. AuPerbandingan Konsumsi Listrik Pulau-Pulau Besar di Indonesia,Ay GoodStats. Accessed: Oct. 20, 2024. [Onlin. Available: https://data. id/statistic/ perbandingan-konsumsi-listrik-pulau-pulau-besar-di-indonesia-imT74 . Anggriani. Arif, and F. Febriansyah. AuImplementasi Algoritma K-Means Clustering Dalam Menentukan Blok Tanaman Sawit Produktif Pada Pt Arta Prigel,Ay JATI (Jurnal Mhs. Tek. Inform. , vol. 8, no. 2, pp. 1820Ae1825, 2024, doi: 10. 36040/jati. Astria. Windarto. Wanto, and E. Irawan. AuMetode K-Means pada Pengelompokan Wilayah Pendistribusian Listrik,Ay Semin. Nas. Sains Teknol. Inf. , pp. 306Ae 312, 2019, [Onlin. Available: http://prosiding. seminar-id. com/index. php/sensasi/issue/ archivePage. Wati. Indriani. Manihuruk. Sintya. Manurung, and A. Windarto. AuImplementasi Datamining Pada Kasus Tenaga Listrik Yang Dibangkitkan Berdasarkan Provinsi,Ay KOMIK (Konferensi Nas. Teknol. Inf. dan Kompute. , vol. 3, no. 1, pp. 719Ae727, 2019, doi: 10. 30865/komik. Herdiansyah. AuPenerapan Algoritma K-Means Clustering Pada Penentuan Tingkat Pemakaian Listrik (Studi Kasus: PLTBg Rantau Sakt. ,Ay Skripsi. Jurusan Teknik Informatika. Fakultas Sains dan Teknologi. Universitas Islam Negeri Sultan Syarif Kasim, . Batubara and F. Lubis. AuClustering Data Pelanggan Pln Helvetia MenggunakanMetode K-Means Cluster,Ay J. Multidisiplin Saintek, vol. 2, no. 1, pp. 71Ae80, 2023, [Onlin. Available: https://ejournal. org/kohesi . Herlambang. Murti, and C. Setianingsih. AuPengelompokkan Data Penggunaan Energi Listrik menggunakan Algoritma Mini Batch K-Means Clustering,Ay e-Proceeding Eng. , vol. 9, no. 5, pp. 2144Ae2153, 2022. Penerapan K-Means Clustering Untuk Mengelompokkan a. Yenni Lutfhi Berliana 612 e-ISSN: 2685-0877 . Apriyadi. Lubis, and B. Damanik. AuPenerapan Algoritma C5. 0 Dalam Menentukan Tingkat Pemahaman Mahasiswa Terhadap Pembelajaran Daring,Ay Komputa Ilm. Komput. dan Inform. , vol. 11, no. 1, pp. 11Ae20, 2022, doi: 34010/komputa. Hendrastuty. AuPenerapan Data Mining Menggunakan Algoritma K-Means Clustering Dalam Evaluasi Hasil Pembelajaran Siswa,Ay J. Ilm. Inform. Dan Ilmu Komput. , vol. 3, no. 46Ae56, 2024, [Onlin. Available: https://doi. org/10. 58602/jima-ilkom. Suraya. Sholeh, and U. Lestari. AuEvaluation of Data Clustering Accuracy using KMeans Algorithm,Ay Int. Multidiscip. Approach Res. Sci. , vol. 2, no. 01, pp. 385Ae396, 2023, doi: 10. 59653/ijmars. Dewi and D. Pramita. AuAnalisis Perbandingan Metode Elbow dan Silhouette pada Algoritma Clustering K-Medoids dalam Pengelompokan Produksi Kerajinan Bali,Ay Matrix J. Manaj. Teknol. dan Inform. , vol. 9, no. 3, pp. 102Ae109, 2019, doi: 31940/matrix. IESR. AuMenerangi Indonesia,Ay Pojok Energi, 2017. Progresif: Vol. No. Agustus 2025: 599-612