Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Received: 31 Maret 2025.
Accepted: 28 April 2025.
Published: Septeber 2025 DOI: 10.
36350/jskom.
Penerapan Metode K-Means pada Pemetaan Persebaran Penyakit Diabetes untuk Rekomendasi Prioritas Pemberian Penyuluhan Priscila1*.
Hardi Jamhur2 Program Studi Sistem Informasi.
Fakultas Informatika dan Komputer.
Universitas Binaniaga Indonesia email:
cilawinata44@gmail.
*Corresponding Author
ABSTRACT
The process of mapping the distribution of diabetes is a grouping of the distribution of diabetes based on various criteria which will later be grouped .
based on the distribution of diabetes sufferers, whether high, medium, low, to help health workers in providing data and information references in order to determine strategies for providing counseling about diabetes in each sub-district that can be implemented in the next period.
this study, an application was developed that can determine the distribution of diabetes sufferers using the K-Means Clustering Algorithm approach, namely by analyzing the initial data group, transforming the initial data and grouping it.
In it, the variables applied are smoking, lack of physical activity, excessive sugar, excessive salt, excessive fat, lack of eating vegetables and fruits, alcohol consumption, and sugar checks.
This is done to see the distribution of diabetes, in order to help health workers in providing references.
In the application that was built, a feasibility test has been carried out and a feasibility percentage of 100% was obtained which can be categorized into the "Very Feasible" interpretation.
User testing has been conducted using the PSSUQ questionnaire according to the PSSUQ category including Overall of 73.
Sysuse of 69.
Infoqual of 78.
Interqual of 71.
5%, which means the application is worthy of use.
And the validity test of the cluster using the Silhouette Coefficient against the KMeans algorithm applied with a value of 0.
503 which means the cluster created is included in the "weak structure" category.
Keywords: Diabetes.
Clustering.
Distribution.
Providing Counseling.
K-Means Algorithm
ABSTRAK
Proses pemetaan persebaran penyakit diabetes merupakan pengelompokan persebaran penyakit diabetes berdasarkan dari berbagai kriteria yang nantinya dikelompokkan .
berdasarkan persebaran penderita diabetes baik itu tinggi, sedang, rendah guna membantu pihak tenaga kesehatan dalam menyediakan acuan data dan informasi agar dapat menentukan strategi pemberian penyuluhan mengenai penyakit diabetes di setiap kelurahan yang dapat dijalankan di periode selanjutnya.
Pada penelitian ini dikembangkan sebuah aplikasi yang dapat mengetahui persebaran penderita penyakit diabetes dengan pendekatan Algoritma K-Means Clustering yaitu dengan menganalisis kelompok data awal, mentransformasi data awal dan melakukan pengelompokkan.
Didalamnya diterapkan variabel-variabel yaitu merokok, kurang aktifitas fisik, gula berlebihan, garam berlebihan, lemak berlebihan kurang makan sayur dan buah, konsumsi alkohol, dan pemeriksaan gula.
Hal ini dilakukan untuk melihat persebaran penyakit diabetes, supaya dapat membantu pihak tenaga kesehatan dalam menyediakan acuan.
Pada aplikasi yang dibangun telah dilakukan uji kelayakan dan diperoleh presentase kelayakan 100% yang dapat dikaterogikan kedalam interpretasi yang AuSangat LayakAy.
Telah dilakukan uji pengguna dengan menggunakan kuesioner PSSUQ sesuai dengan kategori PSSUQ diantaranya yaitu Overall sebesar 73,2% .
Sysuse sebesar 69,01% .
Infoqual sebesar 78,6% .
Interqual sebesar 71,5% , yang artinya aplikasi layak digunakan.
Serta telah uji validitas cluster menggunakan Silhouette Coefficient terhadap algoritma K-Means yang diterapkan dengan nilai yang di dapat sebesar 0,503 yang berarti klaster yang dibuat termasuk dalam kategori Auweak structureAy.
Keywords: Penyakit Diabetes.
Klasterisasi.
Persebaran.
Pemberian Penyuluhan.
Algoritma K-Means PENDAHULUAN Latar Belakang Masalah Angka kematian yang disebabkan oleh penyakit diabetes ini semakin banyak dan setiap tahunnya diperkirakan akan terus meningkat angka kasus kematiannya.
Namun belum dapat dilihat persebaran penyakit diabetes .
inggi, sedang, renda.
di masing-masing daerah.
Pemberian penyuluhan dan edukasi kesehatan yang bertujuan untuk meningkatkan kesadaran dan pencegahan terhadap diabetes belum dapat dilakukan secara optimal, karena tidak sesuai dengan tingkat prioritas persebaran penyakit di setiap daerah.
Maka pemberian penyuluhan masih belum sesuai dengan tingkat prioritas persebaran penyakit diabetes.
Dengan menggunakan teknik komputasi, proses klasterisasi akan menjadi lebih efektif dan efisien.
Permasalahan Dalam melakukan upaya kegiatan penyuluhan maupun sosialisasi pada masyarakat dalam pencegahan dan penanggulangannya terhadap penyakit diabetes ini, terkadang pemilihan lokasi kurang sesuai dengan tingkat kerawanan kasus diabetes.
Menjadikan pada saat ini masih belum dapat diketahui tingkat persebaran mengenai pemetaan pemberian penyuluhan terhadap penyakit diabetes.
Dalam hal ini dapat mempengaruhi langkah pihak terkait untuk melakukan upaya pencegahan dan penanganan pemberian penyuluhan terhadap penyakit diabetes.
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
PASIEN
MEROKOK
KURANG AKTIFITAS
FISIK
GULA
BERLEBIHAN
GARAM
BERLEBIHAN
LEMAK
BERLEBIHAN
KURANG MAKAN
BUAH DAN SAYUR
KONSUMSI ALKOHOL
FAKTOR RISIKO
PEMERIKSAAN GULA
Tabel 1 Penderita Diabetes Puskesmas Tanah Sareal Tahun 2023
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
TIDAK
POLA MAKAN
Berdasarkan dari permasalahan yang diuraikan tersebut, maka dapat di identifikasi masalah yaitu:
Belum dapat diketahui pemetaan persebaran penyakit diabetes di masing-masing daerah untuk rekomendasi prioritas pemberian penyuluhan.
Belum dapat diketahui efektifitas penerapan metode K-Means pada pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan.
Tujuan Penelitian Adapun tujuan dari penelitian ini adalah sebagai berikut:
Mendapatkan hasil persebaran penyakit diabetes di masing-masing daerah.
Mendapatkan efektifitas penerapan metode K-Means pada pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan.
Mengembangkan prototype aplikasi K-Means pada pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan.
Mengukur persebaran penyakit diabetes di masing-masing daerah dan ke efektifitas penerapan metode KMeans pada pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan.
Tinjauan Pustaka Pengertian Data Mining Dalam proses menemukan informasi yang menarik terdapat sebuah data yang akan diolah dengan menggunakan metode tertentu.
Menurut (Arhami and Nasir, 2020, p.
data mining merupakan proses untuk menganalisa sebuah pola pada data menjadi sebuah informasi yang berguna sehingga dapat membantu dalam membuat keputusan yang lebih baik.
Memiliki tujuan untuk menemukan sebuah pola yang memiliki arti dan maksud tertentu yang dapat digunakan untuk menggali dan menganalisis dari sebagian besar data yang ada.
Proses yang terjadi seperti pengambilan informasi, analisa pola dan ringkasan pengetahuan yang memiliki pemahaman mengenai data serta menggiring pengukuran secara konstruktif dari area yang terlibat.
Data mining memiliki beberapa metode diantaranya klasifikasi, clustering, asosiasi, estimasi, prediksi dan regresi.
Pada penelitian ini menggunakan metode clustering.
(Arhami and Nasir, 2020, p.
mengutarakan bahwa clustering merupakan data atau nilai yang belum memiliki label pada kelasnya perlu diprediksi ke dalam sebuah kelas untuk mengetahui objek tersebut akan dimasukan pada kelas yang sesuai berdasarkan kesamaan pola atau karakteristik pada kelompoknya.
Pada penelitian ini dalam memetakan penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan digunakan model clustering dengan pendekatan partisi clustering.
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Algoritma K-Means Menurut (Santosa, 2007, p.
K-Means merupakan sebuah teknik klastering yang umum dikenal dan paling sederhana, dengan K-Means dapat mengelompokkan suatu objek kedalam sebuah klaster.
(Prasetyo, 2014, p.
mengutarakan bahwa algoritma K-Means sederhana untuk diimplementasikan, mudah dipahami, umum dalam penggunaannya dan relatif cepat.
METODE
Algoritma K-Means Dalam penelitian ini, pemetaan penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan diperlukannya sebuah algoritma.
Dengan algoritma K-Means dapat dilakukan pembagian data ke dalam sebuah kelompok yang memiliki karakteristik yang serupa dikelompokkan ke dalam satu set yang serupa, sebaliknya jika memiliki karakteristik berbeda, maka akan dikelompokkan ke dalam set yang berbeda pula, hal ini dilakukan untuk meminimalkan nilai variatif pada suatu kelompok (Putra et al.
, 2023, p.
Menurut (Arhami and Nasir, 2020, p.
berikut ini langkah-langkah dasar pada algoritma K-means tentukan nilai k klaster sesuai dengan yang diinginkan.
pilih titik-titik atau sampel yang menjadi anggota klaster secara acak.
tentukan nilai centroid atau titik tengah dari klaster tersebut dengan rumus.
hitung square error untuk setiap klaster yang merupakan jumlah kuadrat dari jarak Euclidean antara tiap sampel dalam dan titik tengahnya .
, error dikenal juga dengan nama within cluster variation (WCV), yaitu.
selajutnya jumlah dari keseluruhan error dari k-cluster juga dihitung dengan rumus.
kelompokkan kembali semua sampel berdasarkan jarak minimum dari masing-masing pusat sehingga diperoleh distribusi baru dari sampel sesuai kelasternya, untuk memperoleh distribusi baru dari sampel baru tersebut dapat dilakukan dengan menghitung jarak masing-masing titik pusat dengan keseluruhan sampel d( ) A d( perhitungan jarak dari masing-masing titik tersebut dapat menggunakan beberapa metode, contohnya Euclidean Distance, dimana jarak antara dua titik dalam satu, dua, tiga atau sampai dimensi n dapat dihitung sebagai berikut.
tuliskan hasil anggota klaster baru sesuai dengan hasil yang diperoleh pada langkah ke-5 dan ulangi langkah ke-3 sampai beberapa iterasi yang nantinya akan ditemukan nilai total square error turun secara Teknik Analisis Data Pengujian model yang dilakukan untuk menekankan kedekatan relasi antar objek dan mengetahui seberapa jauh klaster terpisah dengan klaster lainnya dan kombinasi dari proses agregasi dan pemisahan disebut sebagai Silhouette Coefficient.
Berikut tahapan perhitungan Silhouette Coefficient menurut (Handoyo.
M, & Michrandi, 2.
sebagai berikut.
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 .
menghitung rata-rata jarak dari suatu data dengan permisalan i dengan semua data lain yang berada dalam satu klaster.
dengan j adalah data lain dalam suatu klaster A dan d.
, .
merupakan jarak antara data i dengan j.
menghitung rata-rata jarak dari data i tersebut dengan semua data pada klaster lain dan diambil nilai dengan d.
, .
merupakan jarak rata-rata data i dengan semua objek pada klaster lain C dimana A .
dengan rumus Silhouette Coefficient sebagai berikut.
dimana s.
merupakan semua rata-rata pada semua data.
Untuk menilai Silhouette Coefficient dapat dilihat pada tabel 2 sebagai berikut:
Tabel 2 Tabel Nilai Silhouette Coefficient Nilai Silhouette Coefficient 0,71 - 1,00 Strong Structure 0,51 - 0,70 Medium Structure 0,26 - 0,50 Weak Structure O 25 No Structure Struktur Sumber : (Rousseeuw, 1.
HASIL DAN PEMBAHASAN HASIL Penentuan Variabel Penelitian Variabel yang digunakan dalam pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan adalah Merokok.
Kurang Aktifitas Fisik.
Gula Berlebihan.
Garam Berlebihan.
Lemak Berlebihan.
Kurang Makan Buah dan Sayur.
Konsumsi Alkohol.
Pemeriksaan Gula dan Kelurahan.
Tabel 3 menjelaskan definisi tiap variabel yang digunakan dalam pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan.
Tabel 3 Variabel Penelitian Variabel Merokok Kurang Aktifitas Fisik Gula Berlebihan Garam Berlebihan Lemak Berlebihan Kurang Makan Buah Dan Sayur Konsumsi Alkohol Pemeriksaan Gula Kelurahan Definisi Menyatakan faktor risiko diabetes dari faktor merokok Menyatakan faktor risiko diabetes dari faktor kurang aktifitas fisik Menyatakan faktor risiko diabetes dari faktor gula berlebihan Menyatakan faktor risiko diabetes dari faktor garam berlebihan Menyatakan faktor risiko diabetes dari faktor lemak berlebihan Menyatakan faktor risiko diabetes dari faktor kurang makan buah dan sayur Menyatakan faktor risiko diabetes dari faktor konsumsi alkohol Menyatakan faktor risiko diabetes dari hasil pemeriksaan gula Menyatakan kelurahan dari penderita diabetes Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Data Transformasi dan Normalisasi Diperlukan transformasi data pada beberapa atribut, yaitu merokok, kurang aktivitas fisik, gula berlebihan, garam berlebihan, lemak berlebihan, kurang makan buah dan sayur, dan konsumsi alkohol dimana proses transformasi dilakukan dengan melihat tingkat prioritas dari masing-masing atribut dan diberi inisial berupa angka jika 1 = ya dan 2 = tidak setelah dilakukannya transformasi data maka langkah selanjutnya yaitu normalisasi dengan menggunakan scaling.
Adapun proses perhitungan scaling untuk normalisasi data menurut (Han.
Kamber, & Pei, 2.
adalah sebagai berikut:
Keterangan:
= data hasil normalisasi = data yang digunakan = nilai maksimal dari kriteria Contoh perhitungan scaling untuk normalisasi data pada beberapa atribut, yaitu merokok, kurang aktivitas fisik, gula berlebihan, garam berlebihan, lemak berlebihan, kurang makan buah dan sayur, dan konsumsi alkohol yaitu:
Maka tabel data setelah dilakukan proses transformasi dan normalisasi adalah sebagai berikut:
Tabel 4 Transformasi Data Atribut Merokok Inisial Merokok Keterangan Tidak Tabel 5 Transformasi Data Atribut Kurang Aktivitas Fisik Kurang Aktivitas Fisik Inisial Keterangan Tidak Tabel 6 Transformasi Data Atribut Gula Berlebihan Inisial Gula Berlebihan Keterangan Tidak Tabel 7 Transformasi Data Atribut Garam Berlebihan Garam Berlebihan Inisial Keterangan Tidak Tabel 8 Transformasi Data Atribut Lemak Berlebihan Inisial Lemak Berlebihan Keterangan Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Inisial Lemak Berlebihan Keterangan Tidak Tabel 9 Transformasi Data Atribut Kurang Makan Buah dan Sayur Kurang Makan Buah dan Sayur Inisial Keterangan Tidak Tabel 10 Transformasi Data Atribut Konsumsi Alkohol Konsumsi Alkohol Inisial Keterangan Tidak Selanjutnya terdapat atribut pemeriksaan gula yang dimana proses normalisasi dilakukan dengan menggunakan z-score.
Z-score merupakan nilai standar yang berupa selisih nilai tersebut dengan nilai rata-rata yang dibagi dengan nilai standar baku sebagai pembanding posisi nilai tersebut dengan keseluruhan data.
Adapun rumus Z-Score menurut (Hastie.
Tibshirani.
, & Friedman, 2.
adalah sebagai berikut:
Keterangan:
= nilai yang diamati .
kor menta.
= rata-rata populasi = standar deviasi populasi = Z-Score (Nilai Bak.
Untuk mencari nilai AA atau rata-rata dari populasi maka dapat menggunakan rumus menurut (Bluman, 2.
berikut ini:
= rata-rata populasi = jumlah semua nilai dalam populasi = jumlah keseluruhan elemen pada populasi Contoh perhitungan AA atau rata-rata dari populasi untuk digunakan dalam menghitung Z-Score sebagai berikut:
Untuk mencari nilai atau standar deviasi populasi maka dapat menggunakan rumus menurut (DeGroot & Schervish, 2.
berikut ini:
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 = standar deviasi populasi = nilai individu dalam populasi = rata-rata populasi = jumlah keseluruhan elemen pada populasi Contoh perhitungan atau standar deviasi populasi untuk digunakan dalam menghitung Z-Score sebagai berikut:
Jika sudah diperoleh nilai AA atau rata-rata dari populasi dan atau standar deviasi populasi, maka selanjutnya dapat menghitung nilai Z-Score.
Contoh perhitungan Z-Score untuk normalisasi data pada atribut pemeriksaan gula adalah sebagai berikut:
Data ke-1 Data ke-2 Data ke-3 Data ke-4 Data ke-5 Data ke-186 Tabel 11 merupakan hasil dari perhitungan Z-Score untuk normalisasi data sebagai berikut:
Tabel 11 Transformasi Data Atribut Pemeriksaan Gula
Data Ke- Pemeriksaan Gula
0,496
3,543
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
Data Ke- Pemeriksaan Gula
0,003
0,432
-0,233
0,217
Lalu terdapat atribut kelurahan dimana proses transformasi dilakukan berdasarkan dengan frekuensi terbesar yang diberi inisial mulai dari angka 1, 2, 3 dan seterusnya hingga frekuensi data terkecil agar data dapat diolah menggunakan Algoritma K-Means seperti pada tabel 12.
Tabel 12 Transformasi Data Atribut Kelurahan Inisial
Keterangan Frekuensi
Tanah Sareal
Kebon Pedes Kedung Badak
Cibadak
Sukaresmi Sukadamai Mekarwangi Kedung Waringin
Kedung Jaya
Kencana
Kayumanis Pasien
Merokok Kurang Aktifitas Fisik
Gula Berlebihan Garam Berlebihan Lemak Berlebihan Kurang Makan Buah Dan Sayur
Konsumsi Alkohol
Pemeriksaan Gula
Kelurahan Tabel 13 Data Penderita Diabetes Puskesmas Tanah Sareal Tahun 2023 Hasil Transformasi
0,496
3,543
0,003
P10
0,432
0,233
0,019
0,840
0,019
0,019
0,217
No Pasien Merokok Kurang Aktifitas Fisik Gula Berlebihan Garam Berlebihan Lemak Berlebihan Kurang Makan Buah Dan Sayur Konsumsi Alkohol Pemeriksaan Gula Kelurahan Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
P186
0,217
Proses Algoritma K-Means Dari data yang tertera pada tabel 13 akan dibuat klaster pemetaan persebaran penyakit diabetes untuk rekomendasi prioritas pemberian penyuluhan berdasarkan variabel yang telah ditentukan.
Secara umum Algoritma K-Means bertujuan untuk membagi data menjadi beberapa kelompok dengan tahapan sebagai berikut:
Menyiapkan Dataset Dataset yang digunakan pada perhitungan ini menggunakan variabel data Merokok.
Kurang Aktifitas Fisik.
Gula Berlebihan.
Garam Berlebihan.
Lemak Berlebihan.
Kurang Makan Buah dan Sayur.
Konsumsi Alkohol.
Pemeriksaan Gula dan Kelurahan dari data Penderita Diabetes Puskesmas Tanah Sareal Tahun 2023 yang telah ditransformasi.
Dataset tersebut terdiri dari 186 Dataset terdapat pada tabel 13.
Menentukan Jumlah Klaster Dari dataset penderita diabetes puskesmas tanah sareal tahun 2023 pada tabel 13 akan dibentuk menjadi 3 klaster sehingga nilai K pada perhitungan ini yaitu 3, dengan keterangan klaster 0 merupakan klaster dengan tinggi penderita diabetes, klaster 1 merupakan klaster dengan sedang penderita diabetes, dan klaster 2 merupakan klaster dengan rendah penderita diabetes.
Menentukan Titik Centroid Dataset penderita diabetes puskesmas tanah sareal tahun 2023 akan dibagi ke dalam 3 klaster, sehingga diperlukan 3 titik awal centroid untuk klaster 0, klaster 1, dan klaster 2.
Titik awal centroid yang digunakan yaitu pada tabel 14.
Tabel 14 Nilai Centroid Awal Klaster 0
0,196
Klaster 1
0,260
Klaster 2
-0,255
Hitung Jarak Dengan Centroid Perhitungan jarak data dengan centroid berfungsi untuk menentukan jarak terpendek pada pengelompokkan klaster, menghitung jarak data dengan centroid dengan menggunakan rumus Euclidean Distance.
Euclidean Distance merupakan perhitungan jarak dari 2 buah titik dan untuk mempelajari hubungan antara sudut dan jarak dengan rumus sebagai berikut:
Keterangan:
= Euclidean Distance = Banyaknya Objek Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 = Koordinat Objek = Koordinat Centroid Iterasi Pertama Perhitungan Jarak dengan Klaster 0:
Data ke 1:
Data ke 2:
Data ke 3:
Data ke 4:
Data ke 5:
Data ke 186:
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
Tabel 15 Hasil Pengelompokkan Iterasi Pertama A Pasien
P186
1,158
3,493
1,135
1,143
6,118
4,093
4,069
5,199
4,070
4,066
2,178
0,043
9,031
9,781
9,004
9,026
3,000
5,072
Jarak Terdekat 1,158 3,493 1,135 1,143 2,178 A 0,043 Cluster Tabel 15 merupakan hasil perhitungan dengan rumus Euclidean Distance antara tiap variabel dengan centroid Cluster 0.
Cluster 1, dan Cluster 2 sehingga didapat jarak terdekat dari masingmasing atribut, kemudian untuk ditentukan masuk ke cluster masing-masing.
Setelah proses pengelompokkan data lalu dilakukan penentuan titik centroid baru.
Nilai centroid baru didapatkan dengan menggunakan rumus:
Keterangan:
= Titik centroid dari klaster ke-k = Banyaknya data pada klaster ke-k =Data ke-I klaster ke-k Mencari nilai centroid cluster 0 baru:
Mencari nilai centroid cluster 1 baru:
Mencari nilai centroid cluster 2 baru:
Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Lalu didapatkan centroid baru untuk Cluster 0.
Cluster 1 dan Cluster 2 pada tabel 16.
Tabel 16 Centroid Hasil Iterasi Pertama Cluster 0
0,972
0,925
0,956
0,956
0,956
0,956
0,996
0,182
1,262
Cluster 1
0,902
0,990
0,990
0,990
0,902
-0,327
4,059
Cluster 2
-0,696
8,889
Ulangi perhitungan jarak data dengan centroid hingga nilai titik centroid tidak berubah.
Iterasi kedua dapat dilihat pada perhitungan berikut.
Dari perhitungan yang dilakukan pada penelitian ini terjadi sebanyak 3 kali, titik pusat cluster tidak ada lagi perubahan dan data pertama hingga data yang terakhir tidak terdapat lagi yang bergeser dari satu cluster ke cluster yang lainnya.
Dari perhitungan yang sudah dilakukan maka dapat disimpulkan bahwa hasil clustering dari dataset perhitungan K-Means menghasilkan pembagian objek ke masing-masing klaster, yaitu:
Klaster 0 Tabel 17 merupakan anggota klaster 0 dengan penderita penyakit diabetes tinggi terdiri dari 126 data penderita penyakit diabetes di puskesmas Tanah Sareal tahun 2023.
Merokok Kurang Aktifitas Fisik
Gula Berlebihan Garam
Berlebihan Lemak
Berlebihan Kurang Makan
Buah Dan Sayur
Konsumsi
Alkohol
Pemeriksaan Gula
Tanah Sareal
Tanah Sareal
Tanah Sareal
Tanah Sareal
Tanah Sareal
Tanah Sareal
Tanah Sareal
P10
Tanah Sareal
Kelurahan Pasien
Tabel 17 Hasil Klaster 0
P11
Kebon Pedes P12
Tanah Sareal
P185
Tanah Sareal Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 i.
Klaster 1 Tabel 18 merupakan anggota klaster 1 dengan penderita penyakit diabetes sedang terdiri dari 47 data penderita penyakit diabetes di puskesmas Tanah Sareal tahun 2023.
Pasien
Merokok Kurang Aktifitas Fisik
Gula Berlebihan Garam
Berlebihan Lemak
Berlebihan Kurang Makan
Buah Dan Sayur
Konsumsi
Alkohol
Pemeriksaan Gula
Kelurahan Tabel 18 Hasil Klaster 1
Sukadamai P14
Cibadak
P17
Kedung Badak
P22
Cibadak
P24
Kedung Badak
P28
Kedung Badak
P34
Kedung Badak
P36
Sukadamai P38
Sukaresmi P46
Cibadak
P186
Sukaresmi .
Klaster 2 Tabel 19 merupakan anggota klaster 2 dengan penderita penyakit diabetes rendah terdiri dari 13 data penderita penyakit diabetes di puskesmas Tanah Sareal tahun 2023.
Pasien
Merokok Kurang Aktifitas Fisik
Gula Berlebihan Garam Berlebihan Lemak Berlebihan Kurang Makan
Buah Dan Sayur
Konsumsi Alkohol
Pemeriksaan Gula
Kelurahan Tabel 19 Hasil Klaster 2
Mekarwangi P18
Kedung Waringin
P47
Kencana
P66
Kedung Jaya
P67
Kedung Waringin
P72
Kedung Waringin
P99
Mekarwangi P100
Kayumanis P113
Mekarwangi P143
Kedung Jaya
P178
Mekarwangi Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
PEMBAHASAN
Berdasarkan hasil pengembangan terkait dengan metode yang diterapkan pada sistem informasi.
Hasil diuji dengan menggunakan metode Silhouette Coefficient.
Metode ini digunakan untuk menguji kualitas klaster, dengan hasil akhir perhitungan dari K-Means sebagai hasil klaster.
Adapun proses perhitungan Silhouette Coefficient dengan langkah langkah seperti berikut :
Menghitung rata-rata jarak dari suatu data, misal data ke-1 dengan semua data lain yang berada dalam satu klaster:
Klaster 1:
Klaster 2:
Klaster 3:
Tabel 20 Rata-Rata Jarak Dalam Satu Klaster Data Ke-1 a.
0,915 Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Data Ke-2 Ke-3 Ke-4 Ke-5 Ke-186 a.
3,453 0,860 0,894 0,867 A 1,759 Tabel 20 merupakan hasil perhitungan jarak rata-rata dari setiap data yang terletak dalam satu klister.
Menghitung rata-rata jarak, misal data ke-1 dengan semua data pada klaster lain dan diambil nilai Klaster 1 ke Klaster 2 Klaster 1 ke Klaster 3 Klaster 2 ke Klaster 1 Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Klaster 2 ke Klaster 3 Klaster 3 ke Klaster 1 Klaster 3 ke Klaster 2 Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN e-ISSN: 3109 - 1350 Tabel 21 Rata-Rata Jarak Pada Klaster Lain Data Ke-1 Ke-2 Ke-3 Ke-4 Ke-5 Ke-186 d(I,.
A 5,832 d(I, .
d(I,.
3,097 4,937 3,004 3,080 3,002 A 3,391 d(I,.
7,435 8,418 7,386 7,426 7,385 A Tabel 21 merupakan hasil perhitungan jarak rata-rata dari data i dengan semua data pada klaster lain.
Jika jarak rata-rata dari data i dengan semua data pada klaster lain sudah dilakukan, maka diambilah nilai terkecilnya.
Maka diperoleh nilai terkecil pada jarak rata-rata dari data i dengan semua data pada klaster lain dapat dilihat pada tabel 22.
Tabel 22 Nilai Terkecil Pada Jarak Rata-Rata Klaster Lain Data
Ke-1
3,097
Ke-2
4,937
Ke-3
3,004
Ke-4
3,080
Ke-5
3,002
Ke-186
3,391
Setelah mengetahui nilai .
dan d.
, hitung nilai Sillhouette Coefficient sebagai berikut:
Data Ke-1 Data Ke-2 Data Ke-3 Data Ke-4 Data Ke-5 Data Ke-186 Jurnal SAINTEKOM (Sains dan Teknologi Komputas.
Vol.
No.
September, 2025 Lembaga Penelitian.
Pengembangan, dan Pengabdian Kepada Masyarakat UNBIN
e-ISSN: 3109 - 1350
Tabel 23 Silhouette Coefficient Semua Data
Data
Ke-1
0,704
Ke-2
0,300
Ke-3
0,714
Ke-4
0,710
Ke-5
0,711
Ke-186
0,481
Tabel 23 merupakan hasil perhitungan dari Silhouette Coefficient semua data.
Maka, diperoleh untuk Silhouette Coefficient secara keseluruhan yaitu dengan menghitung rata-rata nilai Silhouette Coefficient pada semua data sebagai berikut:
Semakin Silhouette Score mendekati nilai 1 artinya semakin kuat klaster.
Sebaliknya jika nilai silhouette score semakin mendekati 0, maka semakin kurang baik pengelompokkan data kedalam suatu Maka perhitungan uji hasil dengan menerapkan Silhouette Coefficient dengan tiga klaster diperoleh nilai rata-rata 0,503 yang berarti masuk kedalam kategori weak structure.
KESIMPULAN
Berdasarkan dari hasil penelitian yang dilakukan, kesimpulan yang bisa diuraikan antara lain:
Menerapkan metode K-Means dapat memberikan persebaran penderita diabetes dengan optimal karena telah dilakukan uji akurasi dengan menggunakan Silhouette Coefficient.
Menerapkan metode K-Means dalam pemetaan persebaran penyakit diabetes di masa yang akan datang menjadi lebih efektif dari proses yang dilakukan sebelumnya.
Hasil pengembangan prototype untuk pemetaan persebaran penyakit diabetes adalah menampilkan hasil klaste dan ploting data.
Hasil uji akurasi dengan Silhouette Coefficient sebesar 0,503 yang berarti termasuk kedalam kategori weak structure, kemudian hasil kuesioner kepada pengguna sebesar 73,2% serta hasil kuesioner kepada ahli dengan pengujian blackbox sebesar 100% dan pengujian whitebox sebesar 100%.
DAFTAR PUSTAKA