Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 Implementasi Algoritma K-Nearest Neighbor (KNN) Untuk Klasifikasi Status Gizi Balita Fadhillah Rashidatul AAola*1.
Ahmad Homaidi2.
Lukman Fakih Lidimillah3 1,2,3Universitas Ibrahimy.
Situbondo.
Jawa Timur.
Indonesia Email: 1fadhhillah5@gmail.
com, 2ahmadhomaidi@ibrahimy.
id, 3luky.
lukman7@gmail.
*Penulis Korespondensi Abstrak Pemantauan status gizi balita merupakan salah satu upaya penting dalam mencegah masalah pertumbuhan seperti kurang gizi, obesitas, maupun stunting.
Pada penelitian ini bertujuan untuk mengklasifikasikan status gizi balita dengan algoritma K-Nearest Neighbor (KNN) berdasarkan data antropometri seperti umur, jenis kelamin, dan tinggi badan.
Implementasi algoritma KNN untuk klasifikasi status gizi balita ini menggunakan data yang diperoleh dari platform Kaggle dengan entri berjumlah 120.
Data tersebut kemudian diolah melalui platform Google Colab menggunakan bahasa pemrograman Python dan perangkat lunak RapidMiner untuk mendukung proses data preprocessing, pelatihan, dan evaluasi model.
Evaluasi model ini dilakukan untuk menghasilkan metrik evaluasi utama pada setiap kelas seperti confusion matrix, presisi, recall, dan F1-Score.
Melalui evaluasi model yang sudah dilakukan, hasil klasifikasi menggunakan algoritma KNN mampu mengklasifikasikan status gizi balita dengan akurasi tinggi, yakni 97%.
Penelitian ini menunjukkan bahwa klasifikasi status gizi balita, efektif menggunakan algoritma KNN dan dapat membantu dalam pengambilan keputusan di bidang kesehatan masyarakat.
Kata kunci: Balita.
Data Mining.
Gizi.
K-Nearest Neighbor.
Klasifkasi Abstract Monitoring the nutritional status of toddlers is an important measure in preventing growth problems such as malnutrition, obesity, and stunting.
This study aims to classify the nutritional status of infants using the K-nearest Neighbor (KNN) algorithm based on anthropometric data such as age, gender, and height.
The implementation of the KNN algorithm for classifying the nutritional status of infants uses data obtained from the Kaggle platform with 999 entries.
The data was then processed through the Google Colab platform using the Python programming language dan RapidMiner software to support the data preprocessing, training, and model evaluation.
The model evaluation was conducted to generate key evaluation metrics for each class, such ad confusion matrix, precision, recall, and F1-Score.
Through the model evaluation that has been conducted, the classification results using the KNN algorithm were able to classify the nutritional status of toodlers with high accuracy, namely 97%.
This study shows that the classification of toodler nutritional status is effective using the KNN algorithm and can assist in decisionmaking in the field of public health.
Keywords: Classification.
Data Mining.
K-Nearest Neighbor.
Nutrition.
Toddlers.
PENDAHULUAN
Salah satu langkah penting dalam upaya pencegahan malnutrisi yang dapat mengganggu pertumbuhan anak dan kualitas hidup jangka panjang adalah dengan mendeteksi dini status gizi balita.
Indonesia, yang masih menjadi permasalahan kesehatan masyarakat itu gizi buruk dan kurang gizi yang Selain angka stunting yang tinggi, kasus obesitas dan kelebihan berat badan juga meningkat.
Berdasarkan data dari Kementrian Kesehatan, persentase stunting mencapai angka 24,4% pada balita di Hal ini menunjukkan bahwa satu dari empat anak mengalami gangguan pertumbuhan kronis.
Suatu kondisi ketika panjang atau tinggi badan balita tidak sesuai dengan usianya didefinisikan sebagai stunting.
Pengukuran antropometri diperlukan untuk mengetahui status gizi anak yang kemudian dibandingkan dengan ketetapan standar pertumbuhan.
Maka dari itu, sebelum kondisi gizi berdampak lebih lanjut pada kesehatan anak, deteksi dini sangat penting agar tindakan pencegahan dapat dilakukan.
Teknologi machine learning telah digunakan untuk membantu pengambilan keputusan di bidang kesehatan dalam beberapa tahun terskhir, termasuk dalam klasifikasi status gizi.
Algoritma K-Nearest Neighbor (KNN) yang termasuk algoritma lazy learning berbasis jarak merupakan salah satu algoritma yang banyak digunakan.
Cara kerja KNN adalah dengan mengklasifikasikan kedekatan antara data baru dengan data yang sudah ada.
Halaman - 18 Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 Algoritma KNN memiliki performa akurasi tinggi berdasarkan beberapa penelitian terdahulu dalam mendeteksi status gizi balita.
Sebuah studi melakukan penelitian dengan membandingkan KNN dan Nayve Bayes.
Perbandingan dua algoritma tersebut mencapai 96,10% dengan KNN yang memiliki akurasi lebih tinggi.
Meski demikian, dalam penerapan KNN masih ditemukan tantangannya, antara lain, ketidakseimbangan data, pemilihan fitur yang relevan, serta sensitivitas terhadap pemilihan parameter k.
Penelitian ini bertujuan mengimplementasikan algoritma KNN untuk memperluas pemanfaatan teknologi di bidang kesehatan dalam mengklasifikasikan status gizi balita berdasarkan data antropometri yaitu, umur, jenis kelamin, dan tinggi badan.
Data yang digunakan diperoleh dari repositori Stunting Toodler Detection di platform Kaggle dengan 120.
999 entri.
Proses pengolahan dan pelatihan model menggunakan RapidMiner untuk visualisasi dan juga menggunakan Python pada Google Colaboratory.
II.
METODE PENELITIAN
Metode penelitian pada dasarnya merupakan pendekatan sistematis untuk mengumpulkan data guna mencapai tujuan tertentu.
Proses ilmiah dilakukan dengan tujuan menyelesaikan suatu permasalah dengan suatu metode yang dirancang secara teliti, terencana, dan sistematis dengan tujuan menemukan fakta atau prinsip yang mendasarinya.
Penelitian untuk klasifikasi status gizi balita ini termasuk jenis penelitian kuantitatif dengan pendekatan data mining menggunakan algoritma K-Nearest Neighbor (KNN).
Metode Algoritma K-Nearest Neighbor (KNN) Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut .
Penelitian ini dilakukan melalui beberapa tahapan utama untuk mengimplementasikan performa algoritma KNN dalam mengklasifikasikan staus gizi balita.
Setiap tahapan dirancang secara sistematis agar proses pengujian dapat berjalan dengan optimal.
Alur proses penelitian ditunjukkan pada gambar 1 berikut:
Gambar 1.
Flowchart Tahapan Penelitian Gambar tersebut menunjukkan alur kerja penelitian dimulai dengan fitur Read CSV sebagai input Kemudian dilanjutkan dengan tahapan preprocessing dimana tahap tersebut untuk membersihkan, menyiapkan data, serta membagi data menjadi data training dan data testing.
Setelah data sudah disiapkan, selanjutnya adalah evaluasi algoritma KNN untuk mengklasifikasikan data, kinerja algoritma kemudian diukur melalui metrik performa meliputi akurasi, presisi, recall, dan F1-Score.
Pengumpulan dan Preprocessing Data Data Stunting Toddler Detection dengan jumlah entri 120.
999 tersebut didapatkan dari repositori Kaggle https://w.
com/datasets/rendiputra/stunting-balita-detection-121k-rows/data format CSV (Comma Separated Value.
berisi atribut umur, jenis kelamin, tinggi badan, dan Tabel 1.
Atribut Pada Data Status Gizi Balita Sumber: Kaggle Ae Stunting Toddler Detection Tinggi Badan No.
Umur Jenis Kelamin Status .
0 Bulan Laki-laki Normal 1 Bulan Perempuan Tinggi 2 Bulan Laki-laki Stunted 3 Bulan Perempuan Severely Stunted 57 Bulan Laki-laki Normal 58 Bulan Perempuan Tinggi 59 Bulan Laki-laki Stunted Halaman - 19 Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan 60 Bulan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 Perempuan Severely Stunted Langkah pertama setelah data berhasil dikumpulkan adalah preprocessing data untuk memastikan kualitas data.
Langkah ini mencakup pemeriksaan data kosong, penghapusan data yang tidak lengkap, serta mengubah data kategorikal menjadi data numerikal.
Kolom yang dikodekan adalah atribut jenis kelamin dan atribut status.
Data numerik dinormalisasi menggunakan metode MinMax Scalling agar skala serupa antara 0-1.
Normalisasi ini dilakukan agar penghitungan jarak antar titik dalam algoritma KNN tidak dipengaruhi oleh perbedaan skala antar fitur .
, .
Pemisahan Data Setelah data selesai dinormalisasi, langkah selanjutnya adalah pembagian data menjadi dua bagian, yaitu data latih dan data uji.
Data latih sebesar 80% dan data uji sebesar 20%.
Lalu, dilanjutkan dengan pemisahan data antara fitur .
dan target .
utput/labe.
Implementasi KNN Setelah data selesai dilatih dan digunakan untuk memprediksi data uji, langkah selanjutnya adalah melakukan implementasi algoritma .
Tahapan-tahapan untuk mengimplementasikan algoritma KNN adalah sebagai berikut:
Menentukan Data Uji Menyusun Data Latih Menghitung Jarak Euclidean Menentukan Parameter Nilai K Prediksi Akhir i.
HASIL DAN PEMBAHASAN
Implementasi Algoritma K-Nearest Neighbor (KNN) Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.
KNN
memiliki beberapa kelebihan, yaitu ketangguhan terhadap training data yang memiliki banyak noise dan efektif apabila training datanya besar.
Selain itu.
KNN juga merupakan algoritma yang menggunakan seluruh data latih untuk melakukan proses klasifikasi.
Proses klasifikasi pada KNN merupakan teknik yang melakukan prediksi tegas pada data uji berdasarkan perbandingan K tetangga terdekat.
K adalah jumlah tetangga terdekat yang dilibatkan dan mempunya pengaruh dalam penentuan hasil prediksi.
Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean.
Secara umum, nilai K yang tinggi akan mengurangi efek noise pada klasifikasi .
Setelah menghitung jarak Euclidean, langkah selanjutnya adalah menentukan K neighborsnya dengan cara mengurutkan nilai dari yang terkecil sampai yang terbesar.
Dari K neighbors terdekat, tentukan label berdasarkan mayoritas tetanga terdekat untuk mengevaluasi model dari algoritma KNN tersebut.
Setelah evaluasi, langkah berikutnya adalah menentukan kelas dataset.
Dari seluruh penghitungan tersebut, terbagi menjadi penghitungan dengan class label AoNormalAo.
AoTinggiAo.
AoStuntingAo, dan AoSeverely StuntingAo.
Kemudian, hasil yang paling besar dari perbandingan keempat label tersebut merupakan hasil dari prediksi algoritma K-Nearest Neighbor tersebut.
Untuk menggambarkan bagaimana algoritma KNN bekerja dalam mengklasifikasikan, berikut adalah penghitungan jarak Euclidean antara satu data uji dengan beberapa data latih yang telah dinormalisasi.
1 Menentukan Data Uji Setelah data dinormalisasi, langkah pertama yang dilakukan adalah memilih satu data uji yang akan diklasifikasikan.
Data ini akan dibandingkan jaraknya dengan data latih yang telah tersedia.
Data uji memiliki:
Umur: 24 bulan Tinggi Badan: 85 cm.
Kemudian dilakukan normalisasi dengan rumus Min-Max berikut:
ycuOeycuycoycnycu ycuycuycuycyco = .
ycuycoycaycu Oeycuycoycnycu Dengan nilai berikut:
24Oe0 Umur Min: 0.
Umur Max: 60 = = 0.
60Oe0 85Oe40 Tinggi Min: 40.
Tinggi Max: 128 = = 0.
Sehingga hasil data uji setelah dinormalisasi adalah x = .
4, 0.
Halaman - 20 Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 2 Menyusun Data Latih Langkah berikutnya adalah memilih beberapa data latih yang akan dihitung jaraknya terhadap data uji.
Data latih juga harus sudah dinormalisasi.
Contoh tiga data latih yang digunakan:
Tabel 2.
Data Latih Data Latih Umur .
Tinggi Umur_norm Tinggi_norm Label Kelas 0 (Norma.
Kelas 2 (Stunte.
Kelas 0 (Norma.
3 Menghitung Jarak Euclidean Jarak antara data uji dan masing-masing data latih dihitung menggunakan rumus Euclidean Distance berikut:
cu, y.
= Oo.
cu1 Oe yc1 )2 .
cu2 Oe yc2 )2 .
Jarak ke y1 Data latih ini memiliki umur dan tinggi sedikit lebih besar dari data uji.
ycc = Oo.
4 Oe 0.
511 Oe 0.
2 = Oo0.
0032 = Oo0.
0132 = 0.
Jarak ke y2 Data ini memiliki umur dan tinggi sedikit lebih rendah dibanding data uji.
ycc = Oo.
4 Oe 0.
511 Oe 0.
2 = Oo0.
0031 = Oo0.
0131 = 0.
Jarak ke y3 Data ini memiliki nilai yang identik dengan data uji, sehingga jaraknya adalah nol.
ycc = Oo.
4 Oe 0.
511 Oe 0.
2 = Oo0 0 = Oo0 = 0 4 Menentukan Parameter K Setelah seluruh jarak dihitung, langkah berikutnya adalah mengurutkan jarak dari yang terkecil, lalu memilih K data latih terdekat.
Jika K = 3, maka tiga jarak terdekat beserta labelnya adalah Tabel 3.
Hasil Penghitungan Data Latih Data Latih Jarak Label Kelas 0 (Norma.
Kelas 2 (Stunte.
Kelas 0 (Norma.
5 Prediksi Akhir Dari tiga tetangga terdekat, akan dilakukan voting untuk menentukan prediksi kelas dari data uji berdasarkan label mayoritas.
Tabel 4.
Prediksi Akhir Label Kelas 0 (Norma.
Kelas 2 (Stunte.
Maka, hasil prediksi adalah Normal .
Jumlah Muncul 2 kali 1 kali 6 Evaluasi Model Setelah proses klasifikasi dilakukan menggunakan algoritma K-Nearest Neighbor (KNN), langkah selanjutnya adalah mengevaluasi seberapa baik model dalam memprediksi status gizi balita.
Evaluasi ini dilakukan untuk mengetahui keakuratan dan keandalan model dalam konteks data nyata.
Penilaian performa dilakukan dengan menggunakan beberapa metrik evaluasi standar dalam klasifikasi, yaitu akurasi, precision, recall, dan F1-Score yang masing-masing evaluasi memberikan gambaran dari sudut pandang berbeda terhadap kinerja model.
Selain itu, digunakan juga confusion Halaman - 21 Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 matrix untuk melihat distribusi kesalahan prediksi secara lebih detail antar kelas.
Berikut adalah penjelasan masing-masing metrik yang digunakan dalam penelitian ini.
Akurasi Mengukur proporsi data yang diklasifikasikan dengan benar dari seluruh data uji.
yaycoycycycaycycn = ycNycE ycNycA ycNycE ycNycA yaycE yaycA Precision Mengukur ketepatan prediksi untuk masing-masing kelas, yakni seberapa banyak prediksi positif yang benar.
ycNycE ycEycyceycaycnycycnycuycu = .
ycNycE yaycE Recall Mengukur sejauh mana model berhasil menangkap semua data yang benar-benar termasuk dalam suatu kelas.
ycIyceycaycaycoyco = ycNycE ycNycE yaycA F1-Score Merupakan rata-rata harmonis dari precision dan recall, digunakan saat distribusi kelas tidak ya1 Oe ycIycaycuycyce = 2 O ycEycyceycaycnycycnycuycuOycIyceycaycaycoyco ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco Penelitian ini menggunakan dataset yang berisi atribut antropometri pada status gizi diatas.
Dataset tersebut dibagi menjadi data latih sebesar 80% dan data uji sebesar 20%.
Dengan menggunakan algoritma KNN yang diimplementasikan menggunakan bahasa pemrograman Python pada platform Google Colaboratory.
Hasil klasifikasi dari algoritma KNN, di evaluasi menggunakan metrik meliputi akurasi, presisi, recall, dan F1-Score.
Tabel 6.
Berikut menunjukkan hasil evaluasi berdasarkan confusion matrix yang dihasilkan.
Tabel 6.
Hasil Evaluasi Model KNN Sumber: Hasil Pengujian Metode Menggunakan Google Colab Kelas Akurasi Presisi Recall F1-Score Hasil evaluasi kinerja model menunjukkan bahwa algoritma KNN memiliki performa yang sangat baik dalam mengklasifikasikan status gizi balita.
Untuk semua kelas, model mencapai akurasi 97%.
Untuk kelas 0 presisinya mencapai 98%, recall 99%, dan F1-Score 98% yang menandakan kemampuan model dangat tinggi dalam mengenali dan memprediksi kelas ini secara tepat.
Kelas 1 dan kelas 3 juga menunjukkan kinerja yang seimbang dengan nilai presisi, recall, dan F1-Score masing-masing sebesar 97% yang mencerminkan prediksi konsisten dan akurat.
Sementara untuk kelas 2, memiliki kinerja sedikit lebih rendah dibandingkan kelas lainnya dengan presisi 96%, recall 94%, dan F1-Score 95%, yang menunjukkan bahwa masih terdapat beberapa kasus pada kelas 2 yang kurang terdeteksi secara optimal.
Secara keseluruhan, nilai metrik yang tinggi pada keempat kelas membuktikan bahwa model KNN efektif dalam tugas klasifikasi status gizi berdasarkan data antropometri.
IV.
KESIMPULAN
Berdasarkan hasil evaluasi yang diperoleh, dapat disimpulkan bahwa implementasi algoritma K-Nearest Neighbor (KNN) untuk klasifikasi status gizi balita dengan akurasi tinggi sebesar 97%.
Kinerja model yang konsisten di tiap kelas membuktikan efektivitas KNN dalam tugas ini.
Untuk selanjutnya, penelitian ini Halaman - 22 Prosiding Seminar Nasional KARSA NUSANTARA Kolaborasi Rekayasa dan Sains Nasional untuk Teknologi.
Riset, dan Kecerdasan Buatan Fakultas Teknik.
Universitas Wijaya Kusuma Surabaya ISSN 3090-1154 (Media Onlin.
Volume 2.
Tahun 2025 dapat dikembangkan dengan optimasi parameter K, pemilihan fitur otomatis, atau integrasi ke dalam sistem aplikasi kesehatan untuk deteksi dini yang lebih luas dan praktis.
REFERENSI