Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol.
No.
Februari 2026, hlm.
p-ISSN: 2355-7699
e-ISSN: 2528-6579
PERBANDINGAN METODE K-NEAREST NEIGHBOR DAN ARTIFICIAL
NEURAL NETWORK UNTUK KLASIFIKASI INDEKS PEMBANGUNAN
MANUSIA
Rahayu Widayanti *1.
Mochamad Husni2 .
Jauharul Maknunah3.
Garwita Widyadhana Putri 4
1,2,3,4
Sekolah Tinggi Manajemen Informatika dan Komputer Pradnya Paramita.
Malang Email: 1rahayu@stimata.
id, 2husni@stimata.
id, 3jauharul@stimata.
Agarwitawidyaa12@stimata.
Penulis Korespondensi (Naskah masuk: 31 Agustus 2024, diterima untuk diterbitkan: 07 November 2.
Abstrak Indeks Pembangunan Manusia (IPM) adalah pengukuran perbandingan standar hidup, harapan hidup, dan pendidikan di semua negara.
IPM digunakan sebagai indikator untuk menilai aspek kualitas pembangunan, mengklasifikasikan negara, dan mengukur pengaruh kebijakan ekonomi terhadap kualitas hidup.
IPM adalah data strategis karena selain digunakan sebagai ukuran kinerja pemerintah, juga digunakan sebagai alokator penentuan Dana Alokasi Umum (DAU).
Pengukuran Indeks pembangunan manusia sangat penting bagi pemerintah, karena digunakan sebagai pendukung keputusan perencanaan pembangunan manusia di suatu wilayah.
Oleh karena itu pemilihan metode pengukuran IPM yang memiliki akurasi tinggi sangat penting, agar keputusan perencanaan pembangunan manusia menjadi efektif dan tepat sasaran.
Tujuan penelitian ini adalah membandingkan akurasi dari metode K-Nearest Neighbor dan Artificial Neural Network untuk klasifikasi IPM menggunakan data kabupaten dan kota di Pulau Jawa.
Hasil penelitian menunjukkan bahwa metode K-Nearest Neighbor menggunakan 80%-20% data training dan testing, pada nilai K=7 menunjukkan tingkat akurasi sebesar 95,83%, sedangkan pada metode Artificial Neural Network dengan pembagian data 70%-30% menghasilkan tingkat akurasi sebesar 94,44%.
Berdasarkan perbandingan tersebut Metode K-Nearest Neighbor mempunyai akurasi yang lebih baik dibandingkan metode Artificial Neural Network.
Namun evaluasi menggunakan Fold Cross Validation, dengan nilai K=3, pada metode K-Nearest Neighbor menunjukkan akurasi terbaik sebesar 84,85%, sedangkan pada metode Artificial Neural Network terdapat overfitting sehingga hasil kurang baik.
Penerapan metode KNN dan ANN pada klasifikasi IPM kabupaten/kota di Pulau Jawa menunjukkan bahwa antara kedua metode memiliki kelemahan, dimana pada pembagian data dengan nilai akurasi tertinggi, bukan merupakan model terbaik.
Pada kedua metode dengan tingkat akurasi yang tertinggi, berdasarkan Fold Cross Validation bukan merupakan model terbaik, sehingga dapat disimpulkan bahwa kedua metode tersebut tidak lebih baik dari yang lain.
Kata kunci: Akurasi.
K-Nearest Neighbor.
Artificial Neural Network.
Indeks pembangunan manusia
COMPARISON OF K-NEAREST NEIGHBOR AND ARTIFICIAL NEURAL
NETWORK METHODS FOR HUMAN DEVELOPMENT INDEX CLASSIFICATION
Abstract The Human Development Index (HDI) is a comparative measure of living standards, life expectancy, and education across countries.
The HDI is used as an indicator to assess aspects of development quality, classify countries, and measure the impact of economic policies on quality of life.
The HDI is strategic data because in addition to being used as a measure of government performance, it is also used as an allocator for determining the General Allocation Fund (DAU).
Measuring the Human Development Index is very important for the government, because it is used to support decisions on human development planning in a region.
Therefore, choosing a high-accuracy HDI measurement method is very important, so that human development planning decisions are effective and on target.
The purpose of this study was to compare the accuracy of the K-Nearest Neighbor method and Artificial Neural Network for HDI classification using district and city data in Java.
The results showed that the K-Nearest Neighbor method used 80%-20% training and testing data, at a value of K = 7 showed an accuracy level of 95.
83%, while the Artificial Neural Network method with a data division of 70%-30% produced an accuracy level of 94.
Based on the comparison, the K-Nearest Neighbor method has better accuracy than the Artificial Neural Network method.
However, the evaluation using Fold Cross Validation, with a value of K = 3, in the K-Nearest Neighbor method shows the best accuracy of 84.
85%, while in the Artificial Neural Network method there is overfitting so that the results are not good.
The application of the KNN and ANN methods to the classification of the HDI of districts/cities in Java shows that both methods have weaknesses, such 32 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
that the model with the highest accuracy in data distribution is not the best model.
In both methods with the highest level of accuracy, based on Fold Cross Validation, it is not the best model, so it can be concluded that the two methods are not better than the others.
Keywords: Accuracy.
K-Nearest Neighbor.
Artificial Neural Network.
Human Development Index
PENDAHULUAN
Saat ini Indonesia telah memasuki fase bonus demografi, dimana sebagian besar penduduk Indonesia merupakan penduduk usia kerja 15-64 tahun (Nuryani.
Jlia.
Sanda 2.
Terjadinya masa bonus demografi ini, membuat pemerintah harus meningkatkan pemerataan pembangunan pada seluruh wilayah Indonesia untuk menyesuaikan dengan pertumbuhan penduduknya.
Pemerataan pembangunan merupakan sebuah upaya dari pemerintah untuk mensejahterakan masyarakat dan mengatasi ketimpangan (Tenaga Ahli Madya Kedeputian, 2.
Salah satu pemerataan pembangunan yang dilakukan oleh pemerintah adalah pada pembangunan manusia.
Pembangunan manusia telah dilakukan di wilayah-wilayah Indonesia, salah satunya di Pulau Jawa.
Pada tahun 2021, sekitar 56,01% dari jumlah penduduk Indonesia berdomisili di Pulau Jawa (Fakrulloh, 2.
Peningkatan jumlah penduduk mengharuskan pemerintah lebih memperhatikan pembangunan di Pulau Jawa.
Oleh karena itu, diperlukan pengukuran Indeks Pembangunan Manusia (IPM) untuk mengukur hasil dari proses peningkatkan kualitas hidup penduduk, dan menentukan kebijakan pada daerah-daerah di kabupaten/kota di Pulau Jawa.
IPM terdiri dari 3 .
aspek, yaitu umur panjang dan hidup sehat, standar hidup layak, dan Berdasarkan 3 .
aspek tersebut, terdapat 4 .
indikator yang menjadi perhitungan IPM, yaitu umur harapan hidup saat lahir yang merujuk pada aspek umur panjang dan hidup sehat, rata-rata lama sekolah yang merujuk pada aspek pengetahuan, dan pengeluaran per kapita yang merujuk pada aspek standar hidup layak (Badan Pusat Statistik 1, 2.
BPS juga menjelaskan bahwa indikator-indikator tersebut kemudian diolah selanjutnya dikelompokkan menjadi 4 .
kategori berdasarkan United Nations Development Programme (UNDP), yaitu Indeks Pembangunan Manusia (IPM) memiliki hasil yang rendah .
urang dari .
, sedang .
O IPM < .
, tinggi .
O IPM < .
, dan sangat tinggi .
ebih dari .
(Badan Pusat Statistik 2, 2.
Dalam perhitungan IPM, terdapat beberapa metode klasifikasi yang telah digunakan oleh peneliti sebelumnya, salah satunya pada penelitian yang menyimpulkan bahwa metode Artificial Neural Network (ANN) lebih unggul dengan nilai akurasi 97,4% sedangkan metode Support Vector Machine (SVM) menghasilkan nilai akurasi 53,25% (Fathurrahman.
Qisthi, 2.
Hasil klasifikasi kualitas udara di Jakarta menunjukkan algoritma Support Vector Machine memiliki kinerja akurasi yang lebih baik dibandingkan dengan algoritma KNearest Neighbor.
Algoritma Support Vector Machine menggunakan kernel RBF dan 100 parameter kernel mendapatkan nilai akurasi sebesar 98%, sedangkan algoritma K-Nearest Neighbor menggunakan jumlah K sebanyak 6 mendapatkan nilai akurasi sebesar 96% (Bryan VJ.
Teny H.
Manatap DL, 2.
Pada penelitian untuk mendeteksi diabetes, hasil evaluasi confusion matrix.
KNN menunjukkan kinerja yang lebih unggul dibandingkan SVM dalam hal akurasi dan metrik evaluasi lainnya, hasil ini menunjukkan bahwa KNN lebih efektif (Asri M .
Sarah K .
Dede K, 2.
Penelitian yang mengklasifikasikan data SUSENAS dengan membandingkan K-Nearest Neighbor (KNN) dan Support Vector Machines (SVM menunjukkan bahwa metode KNN memiliki kinerja klasifikasi yang lebih baik dibandingkan metode SVM.
Nilai akurasi metode KNN 80,95% lebih tinggi dibandingkan nilai akurasi metode SVM, yaitu 78,79% (Wahyu AR .
Arief RH .
Triastuti W, 2.
Studi yang membandingkan kinerja algoritma KNearest Neighbor (KNN) dan Support Vector Machine (SVM) untuk memprediksi risiko kehamilan pada pasien, menunjukkan bahwa KNN mencapai tingkat akurasi 81% sedangkan SVM mencapai 75,50% (Marchelya RPS, dkk, 2.
Penelitian untuk memprediksi predikat kelulusan mahasiswa berdasarkan nilai mata kuliah dasar yang telah dipelajari dan melihat pengaruh nilai tersebut menggunakan metode Artificial Neural Network (ANN).
Hasil menunjukkan metode Artificial Neural Network (ANN) mampu memprediksi prestasi akhir mahasiswa dengan akurasi terbaik sebesar 73% (Annisa RS .
Irma P, 2.
Penelitian yang bertujuan untuk membandingkan efektivitas Algoritma Support Vector Machine (SVM) dan Artificial Neural Network (ANN) untuk intrusi deteksi.
Hasil dari eksperimen menunjukkan bahwa kedua model bagus untuk mendeteksi intrusi, karena SVM dan ANN memiliki skor di atas 90%.
SVM lebih efektif daripada ANN dalam deteksi intrusi dengan akurasi pelatihan dan pengujian 99,87% dan 99,81% (Tony T.
Hendi S.
Gautama W.
Osei EA, 2.
Penelitian yang bertujuan untuk membandingkan kinerja KNearest Neighbors (KNN).
Jaringan Syaraf Tiruan (JST), dan Support Vector Machines (SVM), metode klasifikasi untuk menemukan metode yang paling cocok untuk melatih mesin untuk mengklasifikasikan seseorang kedalam kelompok tingkat obesitas mereka Widayanti, dkk.
Perbandingan Metode K-Nearest NeighborA 33 menurut kebiasaan makan, dan kondisi fisik mereka.
Hasil percobaan ini menunjukkan bahwa metode klasifikasi SVM dengan kernel linier memberikan kinerja keseluruhan terbaik untuk mengklasifikasikan tingkat obesitas, dengan akurasi rata-rata 0,944 (Georgia S.
Teny H, 2.
Berbagai teknik memprediksi tren harga opsi di masa mendatang.
Penelitian untuk membandingkan efektivitas model Support Vector Machine (SVM) dan Artificial Neural Network (ANN) untuk prediksi harga opsi, menunjukkan bahwa model ANN berkinerja lebih baik daripada model SVM, dan harga opsi yang diprediksi sesuai dengan harga opsi aktual yang sesuai (Madhu.
B, dkk, 2.
Tujuan penelitian ini adalah membandingkan metode KNN dan ANN untuk mendapatkan nilai akurasi yang tertinggi, sehingga dapat digunakan untuk perhitungan IPM oleh pemerintah dengan lebih akurat.
METODE PENELITIAN
Tahapan penelitian ini terdiri dari: perancangan data, pembagian data training dan testing, dan penggunaan data validasi untuk klasifikasi menggunakan metode KNN dan ANN.
Klasifikasi tersebut menghasilkan 2 .
model yang akan melalui proses evaluasi dan validasi data.
Input yang diberikan berupa dataset dengan output akhir berupa perbandingan hasil akurasi dari kedua metode DATASET Penelitian ini menggunakan data sekunder dari website Badan Pusat Statistik (BPS).
Dataset yang digunakan mencakup 119 kabupaten/kota di Pulau Jawa tahun 2021 dan terdiri dari 4 .
indikator IPM: umur harapan hidup saat lahir (UHH), rata-rata lama sekolah (RLS), harapan lama sekolah (HLS), pengeluaran yang disesuaikan, dan keterangan label status IPM.
PREPROCESSING
Preprocessing merupakan proses mengolah dataset murni menjadi bentuk informasi yang lebih mudah dipahami (Dharma, 2.
Preprocessing melalui 3 tahap, yaitu tahap cleaning data, transformasi data, dan normalisasi data dengan menggunakan Jupyter Notebook.
PEMBAGIAN DATA
Data yang dihasilkan dari preprocessing dibagi menjadi data training dan data testing.
Penelitian ini membagi 3 .
kelompok data training dan testing untuk menentukan hasil akurasi terbaik dari kedua metode tersebut.
Pembagian data training dan testing pertama adalah 60%- 40%, kedua, 70% -30%, dan ketiga 80%-20%.
Setelah itu dilakukan pembagian data validasi sebesar 10% yang diambil dari data training.
METODE K-NEAREST NEIGHBOR
Nilai K yang dihitung ada 3 .
angka ganjil, yaitu 3, 5, dan 7.
Hal ini karena nilai K yang ganjil digunakan untuk menghindari munculnya kesamaan jarak saat proses K-Nearest Neighbor (KNN) dijalankan (Hussein, 2.
Pada tabel 1, teknik validasi data Metode KNN yang digunakan menggunakan metode KFold Cross-Validation, yang digunakan untuk mengetahui overfitting atau underfitting model, dan mengukur perfoma model.
Adapun nilai k pada penelitian ini adalah 5-fold cross-validation untuk (Azis.
Purnawansyah.
Fattah & Putri, 2.
Data akan dijalankan sebanyak 5 kali dengan subset data yang bergantian menjadi data training dan data validasi pada setiap iterasi.
Gambar 1.
Framework Penelitian METODE ARTIFICIAL NEURAL NETWORK Gambar 2.
Multi Layer Percepteron 34 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
Tabel 1.
K-Fold Cross Validation KFold Tabel 2 Confusion Matrix mengunakan 3 .
kategori IPM, yaitu Sedang.
Tinggi, dan Sangat Tinggi.
Pada baris paling atas pada tabel 2 merupakan label prediksi, dan pada kolom paling kiri merupakan label asli atau aktual.
True positive artinya label yang diprediksi sama dengan label asli, sedangkan False Negative merupakan label yang diprediksi tidak sama dengan label asli.
Cross Validation Valida Training Training Training Training Training Training Valida Training Training Training Training Training Training Valida Training Training Training Valida Training Training Training Training Training Valida Penerapan metode KNN dan ANN untuk klasifikasi Indeks Pembangunan Manusia (IPM) kabupaten/kota di Pulau Jawa menggunakan tools Jupyter Notebook, tedapat pada Gambar 3.
Pada gambar 2 terdapat 3 .
kelas dasar arsitektur Artificial Neural Network (ANN), yaitu Single Layer Feedforward Network.
Multi Layer Feedforward Network, dan Recurrent Network (Haykin, 2.
Penelitian ini menggunakan metode ANN dengan Multi Layer Feedforward Network.
Jika pada Single Layer Feedforward Network memiliki 2 layer yaitu input layer dan output layer, maka pada Multi Layer Feedforward Network terdapat 1 layer tambahan yang disebut hidden layer.
Pada arsitektur multi layer, jumlah hidden layer yang digunakan bisa lebih dari satu, tergantung kasus atau masalah yang ingin EVALUASI Confusion Matrix membandingkan hasil klasifikasi dari model yang dibuat dengan hasil klasifikasi yang sebenarnya,.
Nilai akurasi terdiri dari perbandingan antara data yang berhasil terklasifikasi dengan total data yang diprediksi (Kuncahyo, 2.
Akurasi digunakan sebagai ukuran seberapa sering algoritma klasifikasi tersebut membuat prediksi yang benar (Kurniawan & Mustikasari, 2.
Adapun rumus perhitungan nilai akurasi yang digunakan adalah sebagai berikut HASIL DAN PEMBAHASAN Gambar 3.
Grafik Hasil Akurasi KNN ycNycE ycNycA yaycoycycycaycycn = ycNycE ycNycA yaycE yaycA ycu100% Gambar 3 Merupakan grafik dari hasil akurasi metode KNN.
Pada pembagian 60%- 40%, nilai K dengan hasil akurasi tertinggi pada K=5 dan K=7.
Pada pembagian 70%- 30%, nilai K yang memiliki hasil akurasi tertinggi pada K=7, dengan nilai 94,44%.
Pada pembagian 80%-20%, nilai K yang memiliki hasil akurasi tertinggi pada K=7 dengan nilai 95,83%.
Secara keseluruhan, nilai K=7 dengan pembagian 80%-20% menghasilkan nilai akurasi tertinggi dengan nilai 95,83%.
Tabel 3.
Mean Cross Validation Score
Nilai K
Cross Validation Score
K=3
0,8485
K=5
0,7981
K=7
0,8224
Predicted Tabel 4.
Confusion Matrix KNN Sedang Tinggi Keterangan :
TP : True Positive TN : True Negative FP : False Postive FN : False Negative Tabel 2.
Confusion Matrix Predicted Sedang Tinggi Actual Sedang Tinggi Sangat Tinggi True Positive False Negative False Negative True Positive False Negative False Negative Sangat Tinggi False Negative False Negative True Positive Sangat Tinggi Actual Sedang Tinggi Sangat Tinggi Tabel 3 adalah hasil evaluasi model dengan K-Fold Cross-Validation menunjukkan bahwa nilai K yang memiliki model Widayanti, dkk.
Perbandingan Metode K-Nearest NeighborA 35 terbaik adalah K=3, dengan nilai mean Cross Validation Score 84,85%.
Tabel 4.
merupakan tabel Confusion Matrix metode KNN dengan nilai K=7.
Data yang diprediksi benar sebagai label AoSedangAo adalah 6 Data yang seharusnya memliki label AoSedangAo, namun diprediksi sebagai label AoTinggiAo, dan data yang seharusnya memiliki label AoSedangAo, namun diprediksi sebagai label AoSangat TinggiAo terdapat 0 atau tidak ada.
Kemudian data yang diprediksi benar sebagai label AoTinggiAo adalah 13 Data yang seharusnya memliki label AoTinggiAo, namun diprediksi sebagai label AoSedangAo terdapat 1 Data yang seharusnya memiliki label AoTinggiAo, namun diprediksi sebagai label AoSangat TinggiAo adalah 0 atau tidak ada.
Terakhir, data yang diprediksi benar sebagai label AoSangat TinggiAo adalah 6 data.
Data yang seharusnya memliki label AoSedangAo, namun diprediksi sebagai label AoTinggiAo, dan data yang seharusnya memiliki label AoSedangAo, namun diprediksi sebagai label AoSangat TinggiAo adalah 0 atau tidak ada.
Gambar 4.
Grafik Hasil Akurasi ANN Gambar 4 merupakan grafik hasil akurasi metode ANN, pada pembagian data traning dan testing 60%- 40%, nilai akurasi yang dihasilkan adalah 87,50%, sedangkan pada pembagian 700%, nilainya 94,44%, sedangkan pada pembagian 80%-20%, nilai akurasinya adalah 91,67%.
Dari ketiga pembagian tersebut, yang memiliki nilai akurasi tertinggi adalah pada pembagian 70%-30% sebesar 94,44%.
lebih tinggi dibandingkan garis validasi loss, dan memiliki bentuk yang hampir sama, tetapi pada akhir Epoch grafik training loss mengalami penurunan, sedangan grafik validasi loss sebaliknya, sehingga terjadi underfitting pada model ANN Gambar 6.
Training dan Validasi Loss 70%-30% Gambar 6.
merupakan grafik training loss dan validasi loss pada pembagian data traning dan testing 70%-30%.
Garis berwarna biru merupakan garis yang menunjukkan grafik validasi loss, sedangkan garis berwarna merah merupakan grafik training loss dengan sumbu x menunjukkan jumlah Epoch dan sumbu y berupa nilai loss.
Gambar 6.
menunjukkan bahwa terjadi overfitting pada model ANN yang telah dilatih, karena grafik training loss berada lebih tinggi dibandingkan grafik validasi loss, tetapi pada akhir Epoch terjadi sebaliknya dimana grafik training loss lebih rendah dari validasi loss.
Gambar 7.
Training dan Validasi Loss 80%-20% Gambar 5.
Training dan Validasi Loss 60%-40% Gambar 5.
merupakan grafik training loss dan validasi loss pada pembagian data traning dan testing 60%-40%.
Pada Gambar 5.
bahwa terjadi underfitting pada model ANN yang telah dilatih, meskipun garis training loss berada Gambar 7.
menunjukkan bahwa terjadi overfitting pada model ANN pada pembagian data training dan testing, 80%-20%.
Hal itu dapat dilihat pada perbedaan garis antara training loss dan validasi loss yang memiliki gap yang cukup besar, dan juga garis validasi loss yang lebih tinggi dibandingkan training loss.
36 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
Tabel 5.
Confusion Matrix ANN Predicted Sedang Tinggi Sangat Tinggi Actual Sedang Tinggi Sangat Tinggi Tabel 5.
merupakan tabel Confusion Matrix pada pembagian 70%-30%, dengan jumlah data pada tabel Confusion Matrix sama dengan jumlah data pada dataframe y_test yaitu sebesar 36 data.
Data yang diprediksi benar sebagai label Sedang adalah 11 data.
Data yang seharusnya memliki label AoSedangAo, namun diprediksi sebagai label AoTinggiAo, dan data yang seharusnya memiliki label AoSedangAo, namun diprediksi sebagai label AoSangat TinggiAo ada 0 atau tidak ada.
Kemudian data yang diprediksi benar sebagai label AoTinggiAo adalah 17 data.
Data yang seharusnya memliki label AoTinggiAo, namun diprediksi sebagai label AoSedangAo terdapat 3 data.
Data yang seharusnya memiliki label AoTinggiAo, namun diprediksi sebagai label AoSangat TinggiAo ada 0 atau tidak ada.
Terakhir, data yang diprediksi benar sebagai label AoSangat TinggiAo adalah 5 data.
Data yang seharusnya memliki label AoSedangAo, namun diprediksi sebagai label AoTinggiAo dan data yang seharusnya memiliki label AoSedangAo, namun diprediksi sebagai label AoSangat TinggiAo ada 0 atau tidak ada.
KESIMPULAN
Berdasarkan implementasi dari metode KNN dan ANN pada pengklasifikasian Indeks Pembangunan Manusia kabupaten/kota di Pulau Jawa menggunakan Jupyter Notebook, maka dapat disimpulkan bahwa Nilai k metode KNN yang memiliki hasil akurasi yang paling tinggi pada K = 7 dengan pembagian data 80%-20% dengan hasil 0,9583 atau 95,83%, namun bukan merupakan model terbaik, karena hasil evaluasi model menggunakan K-Fold Cross-Validation menunjukkan bahwa nilai K yang memiliki model terbaik adalah K=3, dengan nilai mean Cross Validation Score 84,85%.
Pada metode ANN, pembagian data yang menghasilkan nilai akurasi paling tinggi adalah 70%-30% dengan nilai akurasi 0,9444 atau 94,44%, tetapi juga bukan model yang terbaik karena model ANN pada pembagian ini termasuk overfitting.
Penerapan metode KNN dan ANN pada klasifikasi IPM kabupaten/kota di Pulau Jawa menunjukkan bahwa antara kedua metode memiliki kelemahan, dimana pada pembagian data dengan nilai akurasi tertinggi, bukan merupakan model Dapat disimpulkan bahwa klasifikasi IPM kabupaten/kota di Pulau Jawa tahun 2021 menggunakan metode KNN dan ANN, antara kedua metode tersebut tidak lebih unggul dari yang lain.
DAFTAR PUSTAKA