Volume 20 Nomor 1 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
OPTIMASI NILAI DAVIES BOULDIN INDEX PADA PROGRAM
PENDAFTARAN TANAH SISTEMATIS LENGKAP (PTSL)
MENGGUNAKAN ALGORITMA K-MEANS DAN PCA
Muhammad Hilmy Naufan.
Rudi Kurniawan.
Tati Suprapti.
1,2,.
Jurusan Teknik Informatika.
STMIK IKMI Cirebon Jl.
Perjuangan No.
10 B Majasem.
Kec.
Kesambi.
Kota Cirebon.
Jawa Barat.
Indonesia E-mail : .
muhammadhilmynaufan28@gmail.
com, .
rudi226ikmi@gmail.
tatisuprapti112004@gmail.
ABSTRAK
Pada data program Pendaftaran Tanah Sistematis Lengkap (PTSL) ditemukan sebuah fenomena masalah terkait tidak adanya tindak lanjut dikarenakan masih terhambat dalam proses pengelompokkan, oleh karena itu penelitian ini dengan mengembangkan solusi berbasis teknologi informasi berupa teknik Clustering yang mengimplementasikan algoritma K-Means dikombinasikan dengan Principal Component Analysis (PCA), pada akhirnya dapat mencapai sebuah tujuan optimasi yaitu proses mengoptimalkan sesuatu menjadi lebih baik dengan melihat hasil akurasi dari nilai Davies Bouldin Index (DBI) terendah yang mendekati angka 0.
Metode penelitian mencakup pengumpulan dan pemrosesan data dari desa Bandorasawetan.
Kecamatan Cilimus.
Kabupaten Kuningan hingga tahap evaluasi dengan menggunakan Davies Bouldin Index (DBI).
Hasil penelitian menunjukkan bahwa Cluster yang optimal dicapai pada K = 5 dengan penggunaan PCA melalui pendekatan Fixed Number yang mengatur berdasarkan jumlah komponen utama yang ingin dipertahankan yaitu = 1, diketahui hasilnya mempertahankan berupa atribut NJOP Bangunan.
Atribut ini memiliki distribusi yang lebih terpusat dalam satu Cluster, dalam arti memiliki pola yang konsisten dengan nilai DBI mencapai 0.
049, memiliki kinerja lebih baik dibandingkan K-Means tanpa PCA dengan nilai DBI sebesar 0.
Studi ini diharapkan dapat meningkatkan kualitas dalam pengelolaan data pertanahan agar menjadi lebih efektif.
Kata kunci : Pendaftaran Tanah Sistematis Lengkap.
Clustering.
Davies Bouldin Index
ABSTRACT
In the Complete Systematic Land Registration (PTSL) program data, a problem phenomenon was found related to the absence of follow-up due to still being hampered in the grouping process, therefore this study by developing an information technology-based solution in the form of Clustering techniques that implement the K-Means algorithm combined with Principal Component Analysis (PCA), can ultimately achieve an optimization goal, namely the process of optimizing something to be better by looking at the accuracy results of the lowest Davies Bouldin Index (DBI) value The research method includes data collection and processing from Bandorasawetan Village.
Cilimus District.
Kuningan Regency to the evaluation stage using the Davies Bouldin Index (DBI).
The results showed that the optimal Cluster was achieved at K = 5 with the use of PCA through the Fixed Number approach which regulates based on the number of main components to be maintained, namely = 1, it is known that the results maintain the NJOP Building attribute.
This attribute has a more centralized distribution in one Cluster, in the sense that it has a consistent pattern with a DBI value reaching 0.
049, has better performance than K-Means without PCA with a DBI value of 0.
This study is expected to improve the quality of land data management to make it more Keywords : Complete Systematic Land Registration.
Clustering.
Davies Bouldin Index Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika jumlah Cluster yang disebut nilai K, perlu diatur secara acak setiap kali proses dilakukan.
Oleh Latar Belakang Penelitian karena itu, beberapa kali percobaan diperlukan Pendaftaran tanah merupakan kegiatan untuk menemukan jumlah inisialisasi yang lebih yang dilakukan oleh pemerintah dalam rangka baik .
Seiring dengan terus berkembangnya menjamin kepastian dan perlindungan hukum bidang informatika, sangat penting untuk terhadap hak-hak atas tanahnya .
Ini sebagai meningkatkan sebuah pemahaman khususnya langkah strategis untuk mengurangi konflik dalam penggunakan kombinasi K-Means dan dapat Principal Component Analysis (PCA) pada data meningkatkan pertumbuhan ekonomi, untuk agraria dan pertanahan, hal ini menunjukkan mendukung tercapainya keadilan dalam bahwa penelitian lebih lanjut di bidang ini kepemilikan lahan .
Seperti yang telah diperlukan untuk menghasilkan solusi yang lebih diketahui, program PTSL dapat menggunakan optimal.
teknologi informasi untuk mempercepat Penelitian sebelumnya berfokus pada pendaftaran dan pengumpulan data pertanahan penerapan Principal Component Analysis (PCA) .
Kemajuan teknologi informasi ini membawa untuk mereduksi dimensi data produksi pertanian dampak signifikan di bidang informatika di Kabupaten Bojonegoro, dan metode K-Means terutama dalam data Mining dan analisis data.
Clustering untuk pengelompokan wilayah telah membuka peluang baru untuk menerapkan berdasarkan hasil produksi padi sawah tahun teknik Clustering yang merupakan proses 2017-2020.
Hasilnya menunjukkan bahwa pengelompokan berdasarkan sejumlah kesamaan dengan penetapan pada jumlah Number of .
Metode Clustering dengan menggunakan Components atau berfokus pada komponen algoritma K-Means dapat membagi data ke dalam utama dapat menghasilkan DBI paling optimal.
sejumlah Cluster yang ditentukan, data dalam dataset yang direduksi menjadi satu komponen satu kelompok memiliki karakteristik yang sama utama dan dikelompokkan dalam tiga Cluster tetapi memiliki karakteristik yang berbeda menghasilkan DBI paling optimal yaitu 0.
dengan kelompok lainnya, namun algoritma ini Secara teoritis, penelitian ini mendukung hanya bekerja pada atribut numerik .
Agar penerapan PCA dalam meningkatkan efisiensi hasil lebih optimal, maka sebelum proses dan kualitas Clustering, sementara secara praktis.
Clustering K-Means dilakukan, hasil pengelompokan ini dapat membantu diperlukan Principal Component Analysis (PCA), pemerintah dalam pengambilan keputusan terkait yaitu teknik Dimensionality Reduction untuk pengelolaan sektor pertanian .
menyederhanakan data dengan membantu dalam Tujuan utama dari penelitian ini adalah menentukan variabel-variabel paling signifikan untuk optimasi nilai Davies Bouldin Index (DBI) dan berpengaruh, namun tetap mempertahankan pada model pengelompokkan data program sebagian besar informasi .
Pendaftaran Tanah Sistematis Lengkap (PTSL).
Permasalahan yang relevan untuk diteliti mengembangkan solusi berbasis teknologi dalam konteks ini adalah terkait penerapan teknik informasi menggunakan algoritma K-Means dan pengelompokan, yang sering kali terhambat Principal Component Analysis (PCA).
Penelitian dalam menentukan jumlah Cluster yang optimal, ini tidak hanya berkontribusi pada wacana terutama ketika berhadapan dengan data tanah akademis tetapi juga menawarkan solusi praktis yang kompleks dan banyak seperti pada data bagi para pembuat kebijakan dan administrator program PTSL.
Dalam penelitian ini meskipun pertanahan yang ingin meningkatkan hasil
PCA
menyederhanakan pendaftaran tanah.
penggunaan Dimensionality Reduction dengan 1.
Landasan Teori Fixed Number pada jumlah Number of Pendaftaran Tanah Sistematis Lengkap Components menjadi pertimbangan untuk menerapkan PCA.
Lalu membutuhkan penetapan PENDAHULUAN Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Program Pendaftaran Tanah Sistematis Lengkap (PTSL) merupakan salah satu program Kementerian Agraria dan Tata Ruang/Badan Pertanahan Nasional untuk mensertifikatkan tanah di seluruh Indonesia.
Dengan terdaftarnya hak atas tanah berarti secara hukum diakui hubungan kepemilikan antara subjek dan objek secara administratif.
Dalam mewujudkan Indonesia lengkap terdaftar, dimulai dengan melakukan perbaikan kualitas data pertanahan dan sistematis lengkap (PTSL) yang pada akhirnya menuju pendaftaran desa lengkap .
Data Mining Data Mining merupakan proses yang menggunakan teknik statistik, kecerdasan buatan, matematika, dan Machine Learning untuk mengolah serta mengidentifikasi informasi yang bisa digunakan sebagai pengetahuan yang berasal dari sebuah Big data .
Clustering Clustering adalah proses pengelompokan benda serupa ke dalam kelompok yang berbeda, atau lebih tepatnya partisi dari sebuah data set kedalam Subset, sehingga dalam setiap data memiliki arti yang bermanfaat, dimana dalam Cluster terdiri dari kumpulan benda-benda yang mirip antara satu dengan yang lainnya dan berbeda dengan benda yang terdapat pada Cluster lainnya .
K-Means K-Means merupakan algoritma Clustering yang berulang-ulang dengan menetapkan nilai K secara acak, dimana nilai tersebut menjadi pusat dari Cluster atau disebut sebagai Centroid.
Mean atau Means.
Algoritma K-Means dalam implementasinya sangat mudah, cepat, sederhana dan mudah beradaptasi serta mempunyai kemampuan yang besar dalam mengolah data cukup besar, adapun yang menjadi kelemahan dalam algoritma K-Means yaitu saat menentukan jumlah Cluster awal, karena bergantung pada inisial data yang diberikan .
Principal Component Analysis (PCA) Principal Components Analysis (PCA) memungkinkan representasi data berdimensi tinggi ke dalam bentuk dimensi rendah yang variabel tanpa kehilangan terlalu banyak informasi, ide utama dari analisis komponen utama adalah pengurangan dimensi, hal ini dapat dicapai dengan mentransformasi ke satu set variabel baru, yang disebut juga sebagai komponen utama (PC) .
METODE PENELITIAN
Dalam penelitian ini, metode yang digunakan adalah metode kuantitatif dengan pendekatan eksperimental, karena untuk meneliti terhadap suatu masalah yang sudah jelas tertera.
Akan diuji untuk mengetahui hubungan sebab akibat dari variabel yang ada agar hasilnya bisa bersifat empiris.
Metode penelitian kuantitatif merupakan penelitian yang memakai data yang berhubungan dengan angka-angka ditambahkan pada penekanan terhadap pengukuran hasil yang objektif disertai dengan analisis statistik menggunakan perangkat lunak yang sesuai untuk mengungkap hubungan atau perbedaan yang signifikan antar variabel .
Tahapan untuk metode atau teknik yang diusulkan divisualisasikan dalam Gambar 1 Gambar 1.
Tahapan Metode Penelitian Pengumpulan Data Dalam penelitian ini data yang digunakan merupakan teknik data sekunder, yang didapat secara observasi dari Pemerintah Desa Bandorasawetan.
Kecamatan Cilimus.
Kabupaten Kuningan.
Badan Pertanahan Nasional (BPN) Kabupaten Kuningan untuk mendapatkan data resmi dan informasi terkini tentang para pendaftar Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Program Pendaftaran Tanah Sistematis Lengkap (PTSL) di desa tersebut.
Dengan diambilnya data dari instansi tersebut dipastikan dapat dipertanggungjawabkan dengan jumlah total 775 data dan dikelompokkan dalam 17 atribut yaitu Nomor.
Kabupaten.
Kecamatan.
Desa.
Nomor Berkas.
Nama.
NIK.
Alamat.
NIB.
Letak Tanah.
Luas.
Alas Hak.
Tanggal Surat Pernyataan.
No.
SPT PBB.
NJOP Tanah.
NJOP Bangunan, dan Penggunaan Tanah.
Pemilihan Data Pada tahap ini merupakan proses menganalisis data dari database dengan memilih data-data seperti apa saja yang kita butuhkan karena sering ditemukan bahwa tidak semua data dibutuhkan dalam proses data Mining.
Proses seleksi dilakukan pada atribut data program Pendaftaran Tanah Sistematis Lengkap (PTSL) Bandorasawetan.
Kecamatan Cilimus.
Kabupaten Kuningan pada tahun 2024 sebanyak 17 atribut.
Pemrosesan Data Dari data yang telah diseleksi sebelumnya akan dilihat apakah pada data tersebut terdapat data yang ganda, kosong dan Missing.
Oleh karena itu dari data yang sudah dikumpulkan akan dibersihkan dari kesalahan atau ketidaklengkapan dengan melakukan proses Cleaning agar sesuai dengan format yang diinginkan.
Transformasi Data Transformasi adalah tahap membuat data yang akan diproses menjadi sesuai dengan model ataupun algoritma yang ingin digunakan dalam tahap pengolahan data.
Data Mining Pada tahap data Mining, data akan di proses menggunakan Machine Learning, dengan penerapan kombinasi Principal Component Analysis (PCA) dan algoritma K-Means.
Interpretasi/Evaluasi Pada tahap interpretasi/evaluasi, data yang sudah diproses menggunakan Machine Learning akan diukur menggunakan operator kinerja untuk menghitung Davies Bouldin Index (DBI), dengan tujuan untuk memperoleh nilai K yang optimal.
HASIL DAN DISKUSI
Dalam pembahasan ini akan menguraikan proses optimasi nilai Davies Bouldin Index (DBI) pada model pengelompokkan data, yang akan mempengaruhi terbentuknya jumlah Cluster pada data program Pendaftaran Tanah Sistematis Lengkap (PTSL) menggunakan Machine Learning yaitu AI Studio 2024.
1 dengan penerapan kombinasi algoritma K-Means dan Principal Component Analysis (PCA), lalu Tools Microsoft Excel Home 2024 untuk proses penentuan atribut komponen utama.
Pengumpulan Data Data yang telah diperoleh pada program Pendaftaran Tanah Sistematis Lengkap (PTSL) di desa Bandorasawetan.
Kecamatan Cilimus.
Kabupaten Kuningan dapat dilihat secara singkat pada Tabel 1 berikut :
Tabel 1.
Dataset Program PTSL 2024
Berkas Nama A Penggunaan Tanah
Rumah
Tinggal
Rumah
Tinggal
Rumah
Tinggal
TAUFIK
RACHMAT
MASKINAH
RASMIAH
HJ.
AMINI
Rumah
Tinggal
Kebun
AHMAD
SAROJI
PEMERIN
TAH DESA
BANDORA
SAWETAN
Kebun Pemilihan Data Pada tahap ini sebelum melakukan pemilihan data, maka perlu memasukkan operator AuRead ExcelAy yang berfungsi untuk membaca data Excel pada program Pendaftaran Tanah Sistematis Lengkap (PTSL).
Selanjutnya melakukan Import data.
Operator Read Excel dapat dilihat pada Gambar 2 berikut :
Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Pada bagian Select Attributes terdapat 7 atribut yang tidak digunakan dalam analisis karena alasan tertentu.
C Atribut Nomor tidak diperlukan karena AI Gambar 2.
Operator Read Excel Studio 2024.
1 sudah otomatis memberi nomor pada setiap baris data.
Pada Tabel 2 berikut merupakan parameter pada operator Read Excel untuk menampilkan sumber C Atribut Desa.
Kabupaten, dan Kecamatan dianggap sebagai satu kesatuan yang data utama dalam proses analisis :
mewakili wilayah administrasi, sehingga tidak perlu disertakan karena analisis lebih Tabel 2.
Parameter Operator Read Excel berfokus pada aspek lain.
No.
Parameter Lokasi Penyimpanan C Atribut Tgl Surat Pernyataan dan Alas Hak Excel File E:\PCA\DATASET-PTSLtidak banyak memberikan variasi atau 2024-DESA perbedaan yang berarti antara data, sehingga BANDORASAWETAN.
dianggap kurang relevan.
Tahap berikutnya yaitu memasukkan C Dengan mengabaikan atribut-atribut ini, operator AuSelect AttributesAy, yang berguna untuk analisis dapat lebih terfokus pada informasi memilih atau menentukan atribut mana saja yang yang benar-benar penting.
Lalu terdapat 10 akan dipakai dalam analisis.
Operator Select atribut yang akan digunakan karena atribut Attributes dapat dilihat pada Gambar 3 berikut :
ini memiliki karakteristik yang beragam dan memberikan informasi yang lebih mendalam serta relevan untuk analisis.
Pemrosesan Data Tahap Pemrosesan merupakan langkah Gambar 3.
Operator Select Attributes yang dilakukan untuk membersihkan dan mempersiapkan data sebelum analisis dimulai.
Namun, untuk memilih atribut tertentu dari Dengan penggunaan operator AuReplace Missing dataset yang akan digunakan dalam analisis.
ValuesAy dalam proses ini, dilakukan beberapa perlu mengatur pada parameter Select Attributes langkah penting seperti menangani data yang dengan mengubah Attributes filter type menjadi a kosong, menghapus data yang duplikat, dan Subset.
Dalam proses pengelompokkan dari total mengisi atau menangani nilai-nilai yang hilang 17 atribut, yang digunakan hanya 10 atribut.
agar formatnya sesuai dengan standar yang Dapat dilihat pada Tabel 3 berikut :
Operator Replace Missing Values dapat dilihat pada Gambar 4 berikut :
Tabel 3.
Select Attributes No.
Attributes Kecamatan Kabupaten
Desa
Nama Alas Hak
Tgl Surat Pernyataan Select Attributes No Berkas NIK
Alamat
NIB
Letak Tanah Luas Tanah No SPT PBB NJOP Tanah NJOP Bangunan Penggunaan Tanah Gambar 4.
Operator Replace Missing Values Parameter pada operator Replace Missing Values menggunakan pengaturan standar tanpa ada Untuk hasil yang diperoleh seperti yang ditampilkan pada Tabel 4 berikut :
Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Tabel 4.
Hasil Missing Values No.
Atribut
No Berkas NIK
Alamat
NIB
Letak Tanah
Luas No SPT PBB
NJOP Tanah
NJOP
Bangunan Penggunaan Tanah Type Atribut Integer Polynominal Polynominal Integer Polynominal Integer Polynominal Integer Integer Missing Values Polynominal agar dapat bekerja secara optimal.
Berikut pada Tabel 5 ini menampilkan hasil awal dari atribut data yang masih dalam bentuk kategorikal saja dan belum diubah menjadi atribut numerik :
Tabel 5.
Atribut Kategorikal NIK NIK.
NIK.
NIK.
NIK.
NIK.
Pada data program Pendaftaran Tanah Sistematis Lengkap (PTSL) tidak menunjukan adanya perbedaan terkait data yang kosong, ganda, ataupun Missing.
Karena data tersebut sudah memiliki kualitas yang baik sehingga data sudah siap untuk dianalisis.
Transformasi Data Dalam tahap ini transformasi data akan merubah atribut yang telah dipilih ke dalam bentuk yang cocok untuk digunakan, diperlukan untuk mengatasi setiap atribut yang terdapat pada data program Pendaftaran Tanah Sistematis Lengkap (PTSL) yang bersifat numerik dan nonnumerik.
Pada pengelompokkan menggunakan algoritma K-Means hanya bekerja pada atribut numerik, oleh karena itu memerlukan operator AuNominal to NumericalAy, sehingga data program PTSL sudah sesuai dengan format yang Operator Nominal to Numerical dapat dilihat pada Gambar 5 berikut :
No.
SPT
PBB
Penggunaan Tanah
DSN
PON 2
Rumah
Tinggal
DSN
PON 1
Rumah
Tinggal
Rumah
Tinggal
DSN
PON 1
Kebun
DSN
WAGE
Kebun
DSN
PON 1
Lalu Tabel 6 berikut menampilkan hasil yang semula berupa tipe atribut kategorikal, telah diubah menjadi atribut numerik yaitu NIK.
Letak tanah.
No.
SPT PBB dan Penggunaan tanah :
Tabel 6.
Hasil Operator Nominal to Numerical NIK Gambar 5.
Operator Nominal to Numerical Pada operator Nominal to Numerical hanya mengubah pada parameter Coding Type menjadi Unique Integers untuk mengonversi data kategorikal .
menjadi nilai numerik yang unik.
Hal ini berguna dalam analisis data Letak Tanah Letak Tanah No.
SPT
PBB
Penggunaan Tanah Jumlah data pada kolom NIK dan No.
SPT
PBB diketahui tidak mencapai angka 775 disebabkan oleh adanya pemohon yang sama pada kolom NIK, di mana satu pemohon Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika dapat mengajukan lebih dari satu bidang Selain itu, kolom No.
SPT PBB juga menunjukkan adanya data yang sama, karena satu nomor SPT PBB dapat digunakan untuk beberapa bidang tanah.
Data Mining Sebelum tahap Clustering dilakukan, maka operator Principal Component Analysis (PCA) diperlukan untuk optimasi nilai Davies Bouldin
Index
(DBI)
pengelompokkan data agar menjadi lebih optimal.
Operator PCA dapat dilihat Gambar 6 berikut :
Gambar 6.
Operator PCA Penggunaan Principal Component Analysis (PCA) dalam Clustering berpengaruh karena dapat mereduksi dimensi data tanpa kehilangan informasi penting, sehingga menghindari masalah Curse of Dimensionality yang memiliki arti yaitu menurunnya kinerja algoritma sehingga sulit untuk menemukan pola yang bermakna.
PCA juga menghilangkan redundansi dengan mengubah variabel asli menjadi komponen utama yang saling tidak berkorelasi, sehingga algoritma K-Means dapat bekerja lebih optimal.
Dengan menyaring variabel yang paling berpengaruh, hasil pengelompokan menjadi lebih akurat, stabil, dan lebih mudah divisualisasikan.
Parameter PCA Dimensionality Reduction yang digunakan yaitu Fixed Number dengan Number of Components = Setelah operator PCA diterapkan, maka tahap berikutnya memasukkan operator Clustering yang berfungsi untuk mengelompokkan data.
Penelitian ini menggunakan algoritma K-Means dengan menggunakan Cluster yang ingin dibentuk yaitu K=5.
Operator Clustering (KMean.
dapat dilihat pada Gambar 7 berikut :
Gambar 7.
Operator Clustering (K-Mean.
Parameter pada operator Clustering (K-Mean.
dimana diketahui K=5.
Max run=10 kali putaran.
Type Measure=Numerical Measures dengan Euclidean Distance dan Max Optimization Steps = 100.
Hasil operator Clustering (K-Mean.
yang dikombinasikan dengan PCA menghasilkan Cluster Model, dengan total 5 Cluster yang terbentuk, seperti yang ditampilkan pada Tabel 7 Tabel 7.
Cluster Model No.
Cluster Model Cluster 0 518 Items Cluster 1 108 Items Cluster 2 5 Items Cluster 3 124 Items Cluster 4 20 Items Setelah K-Means PCA, berikutnya adalah memvalidasi hasil klaster yang Salah satu metode yang biasa digunakan untuk ini adalah dengan mengukur performa jarak antar klaster (Cluster Distance Performanc.
, yang membantu mengevaluasi seberapa baik klaster yang terbentuk.
Pada tahap evaluasi ini, digunakan model Performance untuk menghitung nilai Davies Bouldin Index (DBI) pada setiap proses yang dilakukan secara berulang, agar dapat menentukan nilai K yang paling optimal dalam proses klasterisasi dengan melihat hasi nilai DBI yang terendah dalam arti angka yang mendekati 0, menunjukkan klaster yang lebih baik.
Operator Performance dapat dilihat pada Gambar 8 berikut :
Gambar 8.
Operator Performance Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Pada parameter Cluster Distance Performance, hanya mengubah Main Criterion menjadi Davies Bouldin dan klik untuk memberikan tanda (E) pada Maximize, agar hasil Average dan DBI yang diperoleh tidak bernilai negatif.
Dari penelitian ini, nilai Davies Bouldin Index yang diperoleh paling mendekati 0 adalah Nilai ini dicapai dengan menggunakan pendekatan Fixed Number dengan jumlah Number of Components = 1, dan K = 5.
Berikut hasil Operator Performance dapat dilihat pada Tabel 8 berikut :
pada Tabel 9 berikut dengan pendekatan Fixed Number yang menampilkan nilai DBI untuk setiap percobaan dengan PCA dan tanpa penggunaan PCA :
Tabel 9.
Hasil DBI (PCA dan Tanpa PCA) Fixed Number (Number of Component.
Tabel 8.
Hasil Operator Performance Performance Vector Avg.
within centroid Avg.
within centroid distance_cluster_0 Avg.
within centroid distance_cluster_1 Avg.
within centroid distance_cluster_2 Avg.
within centroid distance_cluster_3 Avg.
within centroid distance_cluster_4 Davies Bouldin Avg.
Within Centroid Distance adalah ratarata jarak semua data dalam seluruh Cluster ke pusatnya masing-masing.
Avg.
Within Centroid Distance_Cluster adalah rata-rata jarak semua data dalam satu Cluster tertentu ke pusatnya.
Nilai ini menunjukkan seberapa rapat atau tersebar data dalam Cluster.
Interpretasi/Evaluasi Pada tahap ini sebanyak 6 kali percobaan dilakukan dengan nilai K yang berbeda untuk menentukan nilai yang paling optimal.
Nilai K yang optimal adalah yang menghasilkan nilai DBI mendekati 0.
Dari rangkaian percobaan ini.
K = 5.
Dengan jumlah Number of Component = 1, yaitu mempertahankan 1 komponen utama yang memberikan hasil terbaik dengan nilai DBI
049 dibanding tanpa menggunakan PCA menghasilkan nilai DBI lebih besar yaitu Hasil percobaan ini dapat ditampilkan Nilai K
Hasil
DBI
PCA
Nilai DBI Tanpa PCA PCA secara signifikan meningkatkan kinerja pengelompokan karena mengurangi dimensi data dengan tetap mempertahankan informasi yang paling relevan, sehingga algoritma K-Means dapat bekerja lebih efisien.
Dengan menghilangkan variabel yang memiliki korelasi tinggi.
PCA membantu membentuk klaster yang lebih terpisah dan stabil sehingga perhitungan jarak antar titik dalam K-Means menjadi lebih akurat.
Hal ini terbukti dalam penelitian ini, di mana penggunaan PCA menurunkan nilai Davies Bouldin Index (DBI) 466 menjadi 0.
049, menunjukkan bahwa klaster yang terbentuk lebih optimal.
Gambar 9 berikut menampilkan hasil dari metode Elbow yang digunakan untuk menentukan jumlah klaster optimal dengan melihat perubahan nilai Davies Bouldin Index (DBI).
Pada grafik Elbow, titik optimal ditandai dengan perubahan signifikan dalam kemiringan kurva, yang menunjukkan bahwa menambah jumlah klaster setelah titik ini tidak lagi memberikan perbaikan yang signifikan dan membuktikan bahwa K=5 merupakan hasil yang Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika distance.
Cluster 0 ditetapkan sebagai yang terbaik karena memiliki jarak terdekat dengan komponen utama (PC.
dengan nilai 1, menunjukkan struktur yang kompak dan menunjukkan bahwa data dalam Cluster tersebut mencerminkan fitur atau karakteristik utama yang memiliki kemiripan yang lebih tinggi dari data keseluruhan dengan total 518 items.
Gambar 11 berikut ini merupakan hasil Scatter Plot saat penggunaan algoritma K-Means saja dengan penggunaan K=5 :
Gambar 9.
Metode Elbow Berikut pada Gambar 10 ini menunjukkan seluruh rangkaian langkah dalam model proses yang dijalankan di AI Studio 2024.
1 mulai dari pemrosesan data awal hingga analisis akhir, untuk memastikan hasil yang optimal dalam pengelompokan data :
Gambar 11.
Hasil Scatter Plot K-Means Gambar 10.
Model Seluruh Rangkaian di AI Studio 2024.
Pada Tahap ini mengidentifikasikan dari total 5 klaster yang terbentuk, manakah Cluster yang terbaik dengan menghitung selisih setiap rata-rata yang dihasilkan dari Cluster 0 sampai dengan Cluster 4, dapat diketahui hasil yang mendekati angka 0 disebut sebagai Cluster Dibuktikan pada Tabel 10 berikut :
Pada scatter plot tanpa PCA, klaster tampak lebih menyebar dan beberapa titik data masih berdekatan satu sama lain, menunjukkan kemungkinan adanya tumpang tindih antar Tanpa PCA, semua informasi digunakan, yang bisa membuat pemisahan kelompok menjadi kurang optimal jika ada fitur yang memiliki korelasi tinggi.
Tabel 10.
Cluster Terbaik Gambar 12 berikut ini merupakan hasil 39565 23133 Scatter Plot antara penggunaan algoritma K4.
867 Means dan Principal Component Analysis (PCA) dengan K=5, dan Number of Components = 1 :
K=5
Avg.
Avg.
Selisih Pemilihan Cluster 0 sebagai yang terbaik murni berdasarkan nilai selisih dari Avg.
within centroid distance_cluster dan Avg.
within centroid Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
17-28 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Gambar 12.
Hasil Scatter Plot K-Means Dengan PCA PCA membantu menyaring informasi yang paling penting dari data, sehingga pola kelompok lebih mudah dikenali.
Gambar tersebut membuktikan bahwa Cluster 0 memiliki tingkat kemiripan karakteristik data yang lebih tinggi.
Secara keseluruhan.
Scatter Plot ini menunjukkan perbedaan yang jelas di antara setiap Cluster, yang mengindikasikan adanya variasi karakteristik antar kelompok dan dapat membantu dalam analisis data lebih lanjut.
Lalu Pada tahap akhir adalah proses untuk menentukan satu komponen utama dalam atribut yang dipertahankan dengan menggunakan operator AuWrite ExcelAy untuk mengekspor jumlah Cluster yang dihasilkan dalam data.
Penggunaan operator Write Excel dapat pada Gambar 13 berikut :
pada atribut yang terdapat pada data.
Pivot Table Fields dapat dilihat pada Gambar 14 berikut :
Gambar 14.
Pivot Table Fields Rows yang diisi dengan atribut data luas yang tertuju pada luas tanah, menunjukkan variasi data yang cukup beragam, dengan luas yang tersebar di berbagai Cluster dalam arti tidak terkonsentrasi hanya pada satu Cluster.
Oleh karena itu, atribut luas tidak dapat dianggap sebagai satu komponen utama yang dicari.
Hasilnya ditampilkan pada Tabel 11 berikut :
Tabel 11.
Rows Atribut Luas Gambar 13.
Operator Write Excel Pada parameter Write Excel, hanya perlu menentukan lokasi penyimpanan hasil ekspor proses dalam bentuk file berformat .
Data hasil Cluster nantinya akan disalin dan digabungkan dengan data Excel dari program PTSL.
Dalam karakteristik data, terdapat satu menggunakan operator PCA dengan pendekatan Fixed Number.
Untuk menentukan atribut yang dipertahankan, dapat menggunakan Pivot Table yang tersedia pada menu Insert di Microsoft Excel.
Dengan memilih semua data atribut yang ada, kemudian masukkan atribut ke dalam Pivot Table Fields.
Atur Columns dan Values yang dapat diisi menggunakan atribut Cluster, sementara Rows diisi dengan melakukan Drag Luas Tanah Rows yang diisi dengan atribut data letak tanah menunjukkan bahwa terdapat beberapa blok dan dusun tertentu yang tersebar di berbagai Cluster dalam arti tidak terpusat pada satu Cluster saja.
Hal ini menunjukkan bahwa atribut letak tanah bukanlah satu komponen utama yang Hasilnya ditampilkan pada Tabel 12 Tabel 12.
Rows Atribut Letak Tanah
Letak
Tanah
CIGOWEK 1
CIKENDAN
Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
CIPENDEUY
LAME
DSN
CIKONDANG
PGR
CIHAMBAR
Tabel 15.
Rows Atribut NJOP Bangunan Rows yang diisi dengan atribut data penggunaan tanah menunjukkan bahwa jenisjenis penggunaan tanah tersebar di berbagai Cluster dalam arti tidak terpusat pada satu Cluster tertentu.
Dengan demikian, atribut penggunaan tanah tidak dapat dianggap sebagai satu komponen utama yang dicari.
Hasilnya ditampilkan pada Tabel 13 berikut :
Tabel 13.
Rows Atribut Penggunaan Tanah Penggunaan Tanah Bangunan SMA Pertiwi Kantor Desa Kebun Kolam Taman Bandorasawetan nilai jual objek pajak bangunan memiliki pola yang lebih konsisten atau homogen di antara data, tidak tersebar, dan cenderung terpusat dalam satu Cluster.
Oleh karena itu, atribut NJOP bangunan dapat dianggap sebagai satu komponen utama yang dicari.
Hasilnya ditampilkan pada Tabel 15
NJOP
Bangunan C4 4.
KESIMPULAN DAN SARAN
Penelitian ini menunjukkan bahwa kombinasi algoritma K-Means dan Principal - Component Analysis (PCA) dapat mengoptimasi - nilai Davies Bouldin Index (DBI) sebesar 0.
2 pada model pengelompokan data program - Pendaftaran Tanah Sistematis Lengkap (PTSL).
A A A A A dengan nilai klaster optimal yaitu K = 5 dengan menggunakan Number of Components = 1, yang - mempertahankan atribut NJOP Bangunan sebagai komponen utama.
Cluster terbaik Rows yang diisi dengan atribut data NJOP ditetapkan pada Cluster 0 yang memiliki tanah menunjukkan bahwa nilai jual objek pajak kedekatan dengan komponen utama (PC.
tanah tersebar di berbagai Cluster dalam arti tidak dengan nilai sebesar 128918767.
Jadi dapat terpusat pada satu Cluster tertentu.
Oleh karena disimpulkan bahwa karakteristik data dari itu, atribut NJOP tanah tidak dapat dianggap Cluster 0 yang memiliki nilai NJOP Bangunan sebagai satu komponen utama yang dicari.
sebesar 0 dan 128.
Cluster 1 yang memiliki Hasilnya ditampilkan pada Tabel 14 berikut :
nilai NJOP Bangunan sebesar 595.
000, 700.
Tabel 14.
Rows Atribut NJOP Tanah
Cluster 2 yang memiliki nilai NJOP
NJOP
C4 Bangunan sebesar 1.
Cluster 3 yang Tanah memiliki nilai NJOP Bangunan sebesar 000, dan Cluster 4 yang memiliki nilai NJOP Bangunan sebesar 968.
Untuk 2 penelitian mengeksplorasi metode Clustering lain seperti DBSCAN atau algoritma berbasis hierarki untuk 3 membandingkan hasil yang diperoleh dan memberikan alternatif pendekatan yang lebih Selanjutnya.
Rows yang diisi dengan optimal.
atribut data NJOP bangunan menunjukkan bahwa Diterima Redaksi : 17 Desember 2024 | Selesai Revisi : 6 Maret 2025 | Diterbitkan Online : 9 Mei 2025 Volume 20 Nomor 1 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
DAFTAR PUSTAKA