SMATIKA : STIKI Informatika Jurnal Vol. No. Desember 2024, pp. ISSN: 2087-0256, e-ISSN: 2580-6939 Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Dian Hasna Ramadhani1* Jumadi2 Gitarja Sandi3 1,2,3Teknik Informatika. UIN Sunan Gunung Djati Bandung. Jalan A. H Nasution No. Cipadung. Cibiru. Kota Bandung. Jawa Barat 40614. Indonesia 11207050026@uinsgd. id, 2jumadi@uinsgd. id, 3sandi@uinsgd. *Penulis Korespondensi: Dian Hasna Ramadhani 1207050026@uinsgd. Abstrak Gizi buruk menjadi masalah serius di negara-negara berkembang, disebabkan oleh kekurangan asupan makanan yang mengandung zat-zat esensial seperti protein dan energi. Implementasi algoritma machine learning dapat memberikan diagnosis yang akurat terhadap kondisi kesehatan gizi buruk pada balita, memfasilitasi deteksi dini dan intervensi yang Tujuan penelitian ini untuk mengetahui kinerja algoritma K-Nearest Neighbors (KNN) dalam memprediksi gizi buruk berdasarkan ciri klinis yang dimiliki oleh balita. Data yang digunakan adalah ciri-ciri klinis dari gizi buruk yang bersumber dari seorang nutrisionis. Dari hasil penelitian, nilai akurasi yang paling optimal dalam memprediksi gizi buruk adalah 87%. Dengan dataset yang ada dapat dibuktikan bahwa algoritma K-Nearest Neighbors (KNN) mampu mengklasifikasikan gizi buruk kedalam 2 kondisi, yaitu marasmus dan kwashiorkor. Kata Kunci: gizi buruk. K-Nearest Neighbors. pembelajaran mesin Abstract Malnutrition is a serious problem in developing countries, caused by a lack of food intake containing essential substances such as protein and energy. The implementation of machine learning algorithms can provide an accurate diagnosis of malnutrition health conditions in toddlers, facilitating early detection and appropriate interventions. The purpose of this study is to determine the performance of the K-Nearest Neighbors (KNN) algorithm in predicting malnutrition based on clinical characteristics possessed by toddlers. The data used are clinical characteristics of malnutrition sourced from a From the research results, the most optimal accuracy value in predicting malnutrition is 87%. With the existing dataset, it can be proven that the K-Nearest Neighbors (KNN) algorithm is able to classify malnutrition into 2 conditions, namely marasmus and kwashiorkor. Keywords: K-Nearest Neighbors. machine learning. Pendahuluan Menurut data Survei Status Gizi Indonesia (SSGI) tahun 2022, terdapat 7,7% balita yang mengalami wasting atau gizi buruk, angka ini meningkat 0,6% dari tahun 2021 . Kelompok usia yang paling berisiko mengalami gizi buruk adalah balita. Kebutuhan nutrisi balita sangat penting untuk perkembangan otak mereka . Gizi buruk merupakan masalah kesehatan pada anak-anak dan balita yang timbul akibat kekurangan asupan makanan yang mengandung nutrisi penting seperti protein dan energi. Gizi buruk meningkatkan risiko infeksi, menghambat pertumbuhan dan perkembangan anak, serta memperburuk kesehatan anak saat dewasa . Terjadinya gizi buruk di Indonesia merupakan akibat dari konsumsi makanan yang tidak merata sehingga mengganggu perkembangan fisik dan psikologis anak. Hal ini menyebabkan menurunnya kesehatan sumber daya manusia (SDM) secara umum. Gizi buruk saat ini menjadi isu nasional yang perlu dikaji secara berkala karena menjadi penyebab utama kematian di negaranegara berkembang ketika kebutuhan gizi tidak terpenuhi . Cite: Ramadhani. dkk, . Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk. SMATIKA : STIKI Informatika Jurnal, 14. doi: https://doi. org/10. 32664/smatika. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Gizi buruk berkembang secara bertahap. Pada fase awal, asupan protein tidak perlu diberikan untuk memenuhi kebutuhan energi mereka. sebagai gantinya, asupan kalori yang harus Asupan protein dapat dimulai setelah jumlah kalori yang dibutuhkan tercapai. Pemberian protein dapat memulai dengan dosis yang sederhana dan meningkatkannya secara bertahap . Terdapat beberapa jenis gizi buruk, diantaranya kwashiorkor, marasmus, dan marasmus-kwashiorkor . Jenis penyakit gizi buruk yang dikenal sebagai kwashiorkor ditandai dengan pembengkakan di seluruh tubuh, terutama di bagian belakang kaki. Tanda dan gejala tambahan termasuk wajah yang membengkak dan bulat, perut yang membesar, otot-otot yang menyusut, mata yang terkulai, dan rambut yang tipis atau berwarna kemerahan. Marasmus adalah jenis malnutrisi di mana anak-anak mengalami dua fase malnutrisi parah yang berbeda yang disebabkan oleh asupan makanan yang tidak mencukupi. Kwashiorkor-Marasmus menggabungkan gejala-gejala kwashiorkor dan marasmus . Menganalisis status gizi anak dapat dilakukan salah satunya dengan mengukurnya menggunakan data antropometri . Ciri klinis gizi buruk juga dapat digunakan untuk mendiagnosa kondisi tersebut, namun untuk mendapatkan hasil diagnosa dan pengobatan yang terbaik, dibutuhkan seorang pakar yang memiliki keahlian di bidang gizi. Untuk mengatasi masalah gizi ini, machine learning dapat diterapkan dalam membantu tenaga medis memprediksi gizi buruk dengan akurat. Hasilnya, proses analisis dan pengambilan keputusan akan menghasilkan hasil yang lebih tepat dan efektif, sehingga dapat dilakukan penanganan dini . Telah banyak penelitian mengenai deteksi atau diagnosis penyakit menggunakan machine learning seperti penelitian yang dilakukan oleh Ferliandini and Risnanto . menggunakan metode K-Nearest Neighbor (KNN) dalam memprediksi status gizi balita dengan tingkat akurasi 91,94%. Penelitian lain dilakukan oleh Lonang et al. , . menggunakan metode Logistic Regression. Decision Tree. Random Forest. K-Nearest Neighbors (KNN), dan Support Vector Machine (SVM) dalam mendeteksi stunting, dari metode yang digunakan, metode K-Nearest Neighbors (KNN) memiliki tingkat akurasi tertinggi yaitu 94,85%. Serta pada penelitian Viransyah and Sugiarto . menggunakan metode Nayve Bayes dalam mendiagnosa penyakit gizi buruk menghasilkan tingkat akurasi 80%. Berdasarkan penelitian . metode K-Nearest Neighbors (KNN) memiliki akurasi yang baik dalam mendiagnosis penyakit. Dalam penelitian Amien et al. , . disebutkan bahwa KNN memiliki kelebihan, yaitu proses pelatihan yang sangat cepat, sederhana, dan efektif terutama pada dataset yang besar. Pada penelitian sebelumnya yang menggunakan algoritma K-Nearest Neighbors banyak yang menggunakan data antropometri, sedangkan pada penelitian ini data yang digunakan adalah data ciri klinis. Tujuan penelitian ini adalah untuk melakukan deteksi gizi buruk marasmus dan kwashiorkor dilihat dari ciri klinis atau gejala menggunakan algoritma K-Nearest Neighbors (KNN) serta mengetahui kinerja algoritma K-Nearest Neighbors (KNN) terhadap dataset yang digunakan. Metode Penelitian Berdasarkan masalah diatas, penelitian ini akan dilakukan berdasarkan tahapan-tahapan yang digambarkan pada Gambar 1 berikut. Gambar 1. Alur Penelitian A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Dari gambar diatas, tahap pertama adalah pengumpulan data, proses pengumpulan data dilakukan dengan wawancara bersama petugas dari lembaga. Selain itu, data juga diambil dari sumber-sumber terpercaya di internet dan telah divalidasi oleh ahli gizi untuk memastikan akurasi dan relevansinya. Ciri klinis kondisi gizi buruk pada balita menjadi fokus utama, dan data diperoleh dengan mengumpulkan informasi mengenai ciri-ciri tersebut. Dari hasil wawancara diperoleh 50 data ciri klinis. Setelah memperoleh data, dilakukan preprocessing pada data sehingga model machine learning dapat menanganinya dengan lebih efisien . Tahapan preprocessing yang dilakukan antara lain menghapus tanda baca, tokenisasi, stop word, stemming, dan augmentasi data. Tahap selanjutnya yaitu splitting data dimana data dibagi menjadi dua subset yaitu data latih dan data uji. Data latih digunakan untuk melatih model algoritma dan data uji digunakan untuk melihat kinerja model yang telah dibuat . Menggunakan library ScikitLearn pada Python untuk secara otomatis membagi dataset menjadi data uji dan data latih. Tahap selanjutnya ekstraksi fitur yaitu Proses pengambilan fitur yang dapat menggambarkan informasi yang diperlukan dikenal sebagai ekstraksi fitur. Dalam penelitian ini. TF-IDF digunakan untuk proses ekstraksi fitur . TF adalah frekuensi kata yang ditemukan dalam dokumen, sedangkan IDF adalah nilai invers dari dokumen yang mengandung kata tersebut. Dengan menggunakan TF-IDF, proses pembobotan pada kata terdiri dari perhitungan nilai TF . rekuensi kat. dan IDF . rekuensi dokumen bali. Pembobotan TF memiliki beberapa formula, pada penelitian ini menggunakan raw term, yaitu dihitung frekuensi kemunculan term pada setiap dokumen, dan IDF . rekuensi dokumen bali. menghitung frekuensi sebuah term yang tersebar luas di seluruh dokumen. Berikut formula untuk menghitung IDF : yayayayc =ycoycuyci ycoycuyci . ccyce ) 1 yc N adalah total jumlah dokumen dalam data latih, dan dfj adalah total dokumen yang didalamnya terdapat term. TF-IDF membantu menghitung bobot dari setiap kata yang dihasilkan dari preprocessing. Pembobotan kata mengubah kata menjadi angka yang dapat menampilkan data secara Hasil dari proses ini adalah matriks yang terdiri dari kolom dan baris, dengan data dalam bentuk baris dan fitur dalam bentuk kolom . Untuk nilai TF-IDF, rumus umumnya adalah menggabungkan rumus perhitungan TF dengan rumus IDF seperti berikut: ycycyc = ycNya ycu yayayayc Di mana wtj adalah bobot term . terhadap dokumen . Sedangkan TF adalah jumlah kemunculan term . dalam dokumen . IDFj adalah hasil dari perhitungan seberapa luas term tersebar dalam kumpulan dokumen yang relevan. Setelah melakukan ekstraksi fitur pada data, selanjutnya membuat model klasifikasi menggunakan algoritma K-Nearest Neighbor (KNN) Prinsip dasar K-Nearest Neighbor adalah mencari jarak terdekat antara data yang akan dievaluasi dengan k tetangga dalam dataset Ini merupakan salah satu algoritma pembelajaran mesin yang bersifat non parametrik, artinya tidak membuat asumsi tentang distribusi data . Menggunakan dataset sebagai data latih, menghitung nilai k, memasukkan nilai data baru untuk pengujian, menghitung nilai Euclidean distance, mengurutkan data dari yang terkecil hingga terbesar, mengambil data sesuai dengan angka nilai k, dan mengambil prediksi yang keluar teratas sebagai hasil prediksi merupakan langkah-langkah yang dilakukan dalam implementasi algoritma KNN pada penelitian ini. Dataset yang diberi label x adalah data latih untuk model dan y adalah data uji atau data baru. Pada penelitian ini metode perhitungan jarak menggunakan metode Euclidean Distance dengan rumus seperti persamaan . A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk ycc. cu, y. = ocycuycn=1. cuycn Oe ycycn )2 . Dalam persamaan diatas, xi merupakan data latih, yi merupakan data uji dan n adalah banyaknya data yang digunakan dalam penelitian. Jarak antara data latih dengan data masukan baru . dapat dihitung dengan menggunakan hasil komputasi Euclidean Distance. Data tersebut kemudian diurutkan dari terkecil hingga terbesar, dan jarak ke tetangga terdekat dibatasi dengan menggunakan nilai k. Nilai mayoritas kemudian dipilih sebagai hasil ramalan dari jumlah maksimum data yang dikumpulkan dengan menggunakan nilai k . Setelah proses klasifikasi selesai, langkah terakhir adalah evaluasi kinerja sistem. Ini dilakukan untuk mengevaluasi kinerja sistem yang akan dibangun. Penelitian ini menggunakan confusion matrix sebagai metode yang digunakan untuk menguji kinerja sistem klasifikasi, yang akan membandingkan data hasil klasifikasi dengan data sebenarnya. Dengan bantuan hasil confusion matrix, perhitungan akurasi, precision, dan recall juga dapat dilakukan . Akurasi didefinisikan sebagai perilaku kedekatan antara hasil prediksi dan nilai sebenarnya . Presisi adalah tingkat ketepatan antara hasil yang dihasilkan oleh sistem dan informasi yang diminta. Tingkat keberhasilan sistem dalam mengumpulkan informasi dikenal sebagai recall. Selain itu, nilai F1 terdiri dari nilai recall dan nilai ketepatan yang telah dihitung sebelumnya . Tabel 13 adalah konsep yang digunakan pada confusion matrix. Tabel 1. Konsep Confusion Matrix Nilai Prediksi Positif Negatif Nilai Sebenarnya Positif Negatif Tabel confusion matrix di atas menunjukkan bahwa TP adalah data yang diproyeksi positif dan data yang sebenarnya positif. FP adalah data yang diproyeksi positif tetapi data yang sebenarnya TN adalah data yang diproyeksi negatif tetapi data yang sebenarnya negatif. dan FN adalah data yang diproyeksi negatif tetapi data yang sebenarnya positif . Untuk menghitung akurasi, precision, dan recall menggunakan confusion matrix dapat menggunakan persamaan . , . , dan . yaycoycycycaycycn = ycNycE ycNycA yaycE yaycA y 100% ycNycE ycNycA ycEycyceycaycnycycnycuycu = ycNycE yaycE y 100% ycNycE ycNycE ycIyceycaycaycoyco = ycNycE yaycA y 100% Hasil Dataset yang digunakan pada penelitian ini adalah 50 data ciri klinis dari gizi buruk yang terdiri dari 27 ciri klinis kondisi marasmus dan 23 ciri klinis kondisi kwashiorkor. Wawancara dilakukan dengan nutrisionis dalam sebuah lembaga kesehatan yaitu puskesmas untuk mendapatkan pemahaman mendalam mengenai ciri klinis yang mungkin muncul dan data didapat dari sumbersumber terpercaya di internet. Dataset yang digunakan seperti pada tabel 1 dan 2. Tabel 2. Data Kondisi Gizi Buruk Kondisi Marasmus Kwashiorkor Kode A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Pada Tabel 1 merupakan data penyakit yang nantinya akan diprediksi menggunakan data ciri klinis yang terdapat pada Tabel 2. Tabel 3. Data Ciri Klinis Ciri Klinis Rakhitis Infeksi perut dan intoleran laktosa Imunitas rendah Mudah terkena penyakit infeksi Mudah menangis dan apatis . esadaran menuru. Pertumbuhan terhambat Diare kronik Susah buang air kecil Kulit tubuh longgar Kepala tampak lebih besar Wajah terlihat tua Kulit kering dan kendur Rambut kering dan rapuh Perut cekung pada bayi Lesu dan lemah Tensi rendah Hipotensi Perut kembung Dehidrasi Sering menangis Iritabilitas Oedema Mata Kering Bitot spot di mata Hipotermia Kode Ciri Klinis Koilonikia Kuku berbentuk sendok Penurunan badan yang signifikan Kehilangan otot Wajah yang bulat dan sembab (Moon Fac. Kode G26 G27 G28 G29 G30 G10 G11 G12 G13 G14 G15 G16 G17 G18 G19 G20 G21 G22 G23 G24 G25 Penurunan selera makan Penurunan Kekebalan otot Dermatosis Kulit berwarna kemerahan Kulit bersisik Kulit terkelupas Kuku rapuh Kuku mudah patah Warna rambut kuning kemerahan Gangguan tumbuh kembang Sering lemas Pembengkakan Tidak memiliki nafsu makan Ruam yang meluas Penyembuhan luka yang lambat Nadi lambat Bradikardi Suhu rendah Kulit Kering Bengkak yang ditekan menimbulkan lubang G31 G32 G33 G34 G35 G36 G37 G38 G39 G40 G41 G42 G43 G44 G45 G46 G47 G48 G49 G50 Tabel 2 diatas merupakan data yang digunakan dalam memprediksi kondisi gizi buruk, setiap kondisi memiliki gejala seperti pada Tabel 3. Tabel 4. Ciri Klinis Dari Setiap Kondisi Kondisi Marasmus Kwashiorkor Ciri Klinis G1. G2. G3. G4. G5. G6. G7. G8. G9. G10. G11. G12. G13. G14. G15. G16. G17. G23. G24. G25. G26. G27. G28. G29. G46. G47. G48. G18. G19. G20. G21. G22. G30. G31. G32. G33. G34. G35. G36. G37. G38. G39. G40. G41. G42. G43. G44. G45. G49. G50 Tabel 3 merupakan pembagian ciri klinis berdasarkan kondisi yang dialami balita, untuk memprediksi kondisi gizi buruk sesuai ciri pada data tabel 3. Preprocessing atau pengolahan data adalah proses membersihkan, menstandarisasi, dan menyiapkan data sehingga model machine learning dapat menanganinya dengan lebih efisien . Tahapan preprocessing yang dilakukan antara lain menghapus tanda baca, tokenisasi, stopword, stemming, dan augmentasi data. Pada Tabel 4 merupakan potongan dataset sebelum dan sesudah dilakukan preprocessing. A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Tabel 5. Potongan Dataset Setelah Preprocessing Sebelum Mudah terkena penyakit infeksi Diare kronik Susah buang air kecil Warna rambut kuning Kulit kering Sesudah mudah kena sakit infeksi diare kronik susah buang air warna rambut kuning merah kulit kering Setelah melakukan preprocessing data dan data siap dipakai, selanjutnya adalah pembagian data menjadi dua atau lebih subset terpisah dikenal sebagai splitting data, dan biasanya dilakukan untuk melatih dan mengevaluasi model pembelajaran mesin. Umumnya dataset dibagi menjadi 2 subset, yaitu data latih dan data uji. Pada penelitian ini, pembagian data dibagi menjadi 4 skenario yaitu komposisi 90:10, 80:20, 70:30, dan 60:40. Tabel 6. Potongan Data Latih Ciri Klinis kulit kelupas diare kronik tensi rendah kulit kering kendur suhu rendah wajah bulat moon face sembuh luka lambat Kondisi Setelah melakukan pembagian data, selanjutnya proses ekstraksi fitur dengan menggunakan TFIDF. Hasil dari proses ini adalah matriks yang terdiri dari kolom dan baris, dengan data dalam bentuk baris dan fitur dalam bentuk kolom . Untuk menghitung TF-IDF data latih, setiap term data dihitung pada seluruh data latih, hasil dari TF-IDF ini akan menjadi acuan dalam menghitung TF-IDF data baru. Berikut hasil dari TF-IDF data baru tensi rendah, suhu rendah, dan iritabilitas terhadap data latih. Tabel 7. Hasil TF-IDF pada Data Baru Term IDF 1,9030 1,6020 1,9030 1,9030 TF-IDF 1,9030 3,2040 1,9030 1,9030 Tabel 6 merupakan hasil perhitungan pada proses TF-IDF, data baru dihitung dengan acuan data latih pada Tabel 5 menggunakan persamaan . Nilai TF-IDF ini nantinya akan digunakan sebagai inputan yang masuk ke model untuk memprediksi kondisi gizi buruk. Untuk prediksi kondisi dilakukan menggunakan algoritma K-Nearest Neighbors. K-Nearest Neighbor (KNN) mengukur kemiripan data untuk mengukur jarak. Untuk menghitung jarak antar data yang digunakan pada metode KNN ini menggunakan jarak Euclidean . Dari perhitungan TF-IDF pada Tabel 6 dihitung jarak Euclidean menggunakan persamaan . Setelah dihitung, diambil jarak terdekat sebanyak nilai K. Nilai K sangat berpengaruh terhadap hasil prediksi . Pada penelitian ini nilai K yang digunakan ada 5. A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Tabel 8. Jarak Euclidean Antara Data Latih Dengan Data Baru Dokumen Doc3 Doc6 Doc5 Doc1 Doc2 Jarak Euclidean 2,9892 2,9892 4,1843 4,5957 4,5957 Kondisi Marasmus Marasmus Kwashiorkor Kwashiorkor Marasmus Berdasarkan tabel 7 merupakan hasil perhitungan jarak Euclidean antara data latih dan data baru yang sudah diurutkan dan dipilih 5 jarak paling dekat, dari 5 dokumen terdekat kondisi marasmus terdapat pada 3 dokumen dan kwashiorkor terdapat pada 2 dokumen. Hasil prediksi dapat dilihat dari label yang lebih banyak, sehingga data baru yaitu tensi rendah, suhu rendah, dan iritabilitas termasuk dalam klasifikasi kondisi marasmus. Setelah proses klasifikasi selesai, langkah terakhir adalah evaluasi kinerja sistem. Ini dilakukan untuk mengevaluasi kinerja sistem yang akan dibangun. Penelitian ini menggunakan confusion matrix sebagai metode yang digunakan untuk mengukur kinerja sistem klasifikasi, yang akan membandingkan data hasil klasifikasi dengan data sebenarnya. Dengan bantuan hasil confusion matrix, perhitungan akurasi, precision, dan recall juga dapat dilakukan . Pembahasan Evaluasi Komposisi 90:10 Dataset yang digunakan sejumlah 300 data hasil augmentasi, dibagi menjadi 2 subset yaitu data latih dan data uji. Komposis yang digunakan yaitu 90% data latih dan 10% data uji. Pada gambar 1 merupakan hasil evaluasi atau pengujian dari komposisi ini. Gambar 2. Confusion Matrix Komposisi 90:10 Pada gambar 2 merupakan akurasi, presisi, dan recall dari model. Gambar 3. Akurasi. Presisi, dan Recall Komposisi 90:10 Dari gambar diatas terlihat bahwa hasil akurasi, presisi, dan recall semuanya 100% yang artinya model dapat memprediksi sempurna data uji, namun pada saat memprediksi data baru, hasil prediksinya tidak akurat, keadaan ini dapat disebut overfitting. A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Evaluasi Komposisi 80:20 Pada gambar 3 merupakan hasil evaluasi atau pengujian dengan komposisi 80% data latih dan 20% data uji. Gambar 4. Confusion Matrix Komposisi 80:20 Pada gambar 3 terlihat bahwa model melakukan kesalahan prediksi terhadap 4 data pada masingmasing kondisi (FP dan FN). Pada gambar 4 merupakan hasil akurasi, presisi, dan recall. Gambar 5. Akurasi. Presisi, dan Recall Komposisi 80:20 Akurasi model K-Nearest Neighbors (KNN) dengan komposisi 80:20 adalah 87%. Evaluasi Komposisi 70:30 Pada gambar 5 merupakan hasil evaluasi dengan komposisi 70% data latih dan 30% data uji. Gambar 6. Confusion Matrix Komposisi 70:30 Pada gambar 5 terlihat bahwa nilai FP adalah 5 dan nilai FN adalah 9. Pada gambar 6 merupakan hasil akurasi, presisi, dan recall pada komposisi ini. A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk Gambar 7. Akurasi. Presisi, dan Recall Komposisi 70:30 Pada gambar 6 terlihat bahwa nilai akurasi pada komposisi ini adalah 84%. Evaluasi dengan Komposisi 60:40 Pada gambar 7 merupakan hasil evaluasi dengan komposisi 60% data latih dan 40% data uji. Gambar 8. Confusion Matrix Komposisi 60:40 Pada gambar 7 terlihat bahwa nilai FP adalah 6 dan nilai FN adalah 17. Pada gambar 8 merupakan hasil akurasi, presisi, dan recall pada komposisi ini. Gambar 9. Akurasi. Presisi, dan Recall Komposisi 60:40 Pada gambar 6 terlihat bahwa nilai akurasi pada komposisi ini adalah 81%. Pada tabel 13 merupakan hasil dari pengujian terhadap skenario yang dilakukan, yaitu membagi dataset menjadi beberapa komposisi. Tabel 9. Hasil Akurasi Pada Setiap Komposisi Splitting Data Trainning : Testing 90 : 10 80 : 20 70 : 30 60 : 40 Akurasi Pada empat hasil pengujian diatas dapat disimpulkan bahwa komposisi 90:10 menjadi komposisi yang memiliki nilai akurasi paling tinggi, namun pada saat diimplementasikan untuk memprediksi data baru hasil prediksi seringkali salah, sehingga dari empat pengujian diatas yang A 2024 SMATIKA Jurnal. Published by LPPM STIKI Malang This is an open access article under the CC BY SA license. ttps://creativecommons. org/licenses/by-sa/4. Implementasi Algoritma K-Nearest Neighbors (KNN) untuk Prediksi Gizi Buruk optimal saat diimplementasikan untuk memprediksi data baru adalah komposisi 80:20 dengan akurasi 87%. Hasil penelitian ini sejalan dengan penelitian terdahulu yang menunjukkan keberhasilan penggunaan algoritma KNN dalam mendeteksi atau mendiagnosa kondisi menggunakan machine learning seperti penelitian yang dilakukan oleh Wulandari & Avianto . melakukan penelitian menggunakan K-Nearest Neighbor (KNN) untuk diagnosis kelainan stunting pada Dari penelitian ini dihasilkan tingkat akurasi 96% yang terdiri dari 119 prediksi benar dan 6 prediksi salah. Selain itu, penelitian lain dilakukan oleh Safitri et. menggunakan metode K-Nearest Neighbor (KNN) untuk menentukan status gizi dan memonitoring perkembangan balita. Tingkat akurasi dari metode K-Nearest Neighbor (K-NN) dengan nilai k=3 dan k=5 sebesar 87,5%. Hasil penelitian ini menguatkan temuan bahwa KNN adalah alat yang andal untuk klasifikasi kondisi kesehatan, termasuk prediksi gizi buruk. Penutup Pada penelitian mengenai prediksi gizi buruk menggunakan K-Nearest Neighbors (KNN) . Sebelum memulai klasifikasi, dilakukan preprocessing terhadap data yang digunakan. Setelah itu dilakukan pembagian data menjadi data latih dan data set, lalu dilakukan ekstraksi fitur menggunakan TF-IDF sehingga dapat membuat model klasifikasi dan yang terakhir pengujian. Dengan dataset yang digunakan sebanyak 50 data asli yang telah melalui proses augmentasi menjadi 300 data, model algoritma KNN mampu mengklasifikasikan kondisi menjadi 2 kelas yaitu kwashiorkor dan marasmus. Model ini dapat digunakan untuk alat pengambil keputusan oleh tenaga medis. Berdasarkan hasil pengujian dengan menggunakan 4 komposisi dataset yang berbeda, dapat disimpulkan bahwa komposisi 80:20 dengan akurasi 87% lebih optimal dalam memprediksi kondisi gizi buruk dibandingkan komposisi 90:10. Model ini memiliki potensi besar sebagai alat bantu bagi tenaga medis dalam pengambilan keputusan, memungkinkan diagnosis lebih cepat dan tepat. Saran untuk penelitian selanjutnya adalah memperbanyak dataset sehingga algoritma K-Nearest Neighbors (KNN) dapat lebih optimal dalam memprediksi dan mendapatkan nilai akurasi yang lebih tinggi. Referensi