Positif : Jurnal Sistem dan Teknologi Informasi Volume 10.
No 2, 2024.
Page:
E-ISSN 2460-9552
P-ISSN 2620-3227
Article history Received Jan 8, 2024
Accepted Nov 30, 2024
Publish Nov 30, 2024
PENERAPAN ALGORITMA K-NEAREST NEIGHBOR UNTUK DETEKSI DINI
STATUS GIZI PASIEN DEWASA
Dian Wijayanti.
, .
Arief Hermawan.
Donny Avianto.
Magister Teknologi Informasi.
Universitas Teknologi Yogyakarta Rumah Sakit Umum Daerah Sleman email: dianwijayanti077@gmail.
com, ariefdbuty@gmail.
com, donny@uty.
Abstract Assessing the nutritional status of adult patients is essential to gain a comprehensive understanding of their condition and assist healthcare workers in planning appropriate treatment.
However, manual assessment is time-consuming and labor-intensive, especially when the number of patients exceeds the number of available healthcare workers.
This can hinder the timely and accurate delivery of nutritional The K-Nearest Neighbor (KNN) algorithm is a commonly used method for nutritional status classification, particularly in toddlers, pregnant women, or for obesity classification in adults.
The use of KNN for early detection of adult nutritional status remains rarely explored.
This study applies the KNN algorithm to classify the nutritional status of adult patients using data from the Alamanda 1 ward and the ICU ward at Sleman Regional General Hospital, collected from January 2 to October 18, 2023.
The dataset includes patient height, weight, and nutritional status.
The algorithm was implemented using RapidMiner with odd k-values less than 20, and data splits of 90:10, 70:30, and 50:50 for training and testing.
Results show that the optimal k-values for the highest accuracy were k = 1 and k = 3 using the 70:30 data split, both achieving an accuracy of 96.
The highest sensitivity, 97.
61%, was also achieved at k = 3 with the same data split.
The KNN algorithm demonstrates strong potential to be developed into an early detection system for assessing the nutritional status of adult patients in hospitals, supporting faster and more accurate nutritional care services.
Keywords: K-Nearest Neighbor algorithm, nutritional status classification, adult patients, rapidminer.
Abstrak Penilaian status gizi pasien dewasa penting untuk memahami kondisi gizi secara menyeluruh dan membantu tenaga kesehatan merencanakan perawatan yang sesuai.
Namun, proses penilaian manual memerlukan waktu dan tenaga besar, terutama saat jumlah pasien tidak sebanding dengan jumlah tenaga Hal ini dapat menghambat pemberian perawatan gizi yang cepat dan tepat.
Algoritma KNearest Neighbor (KNN) merupakan metode yang sering digunakan dalam klasifikasi status gizi, terutama pada balita, ibu hamil, atau klasifikasi obesitas pada orang dewasa.
Penggunaan KNN untuk deteksi dini status gizi pasien dewasa masih jarang dibahas.
Penelitian ini menerapkan algoritma KNN untuk mengklasifikasikan status gizi pasien dewasa menggunakan data dari ruang Alamanda 1 dan ruang ICU RSUD Sleman, yang dikumpulkan dari 2 Januari hingga 18 Oktober 2023.
Dataset mencakup tinggi badan, berat badan, dan status gizi pasien.
Implementasi dilakukan menggunakan RapidMiner dengan nilai k ganjil kurang dari 20, serta pembagian data pelatihan dan pengujian dalam rasio 90:10, 70:30, dan 50:50.
Hasil menunjukkan bahwa nilai k optimal untuk akurasi tertinggi adalah k = 1 dan k = 3 pada rasio data 70:30, dengan akurasi sebesar 96,77%.
Sensitivitas tertinggi sebesar 97,61% juga dicapai pada k = 3 dengan rasio 70:30.
Algoritma KNN menunjukkan potensi tinggi untuk dikembangkan menjadi sistem deteksi dini status gizi pasien dewasa di rumah sakit, guna mendukung pelayanan gizi yang lebih cepat dan akurat.
Kata Kunci: algoritma K-Nearest Neighbor, klasifikasi status gizi, pasien dewasa, rapidminer.
PENDAHULUAN
Status gizi pasien merupakan faktor penting yang mempengaruhi respons terhadap pengobatan dan tingkat pemulihan pasien.
Penilaian status gizi dapat memberikan gambaran komprehensif mengenai kondisi nutrisi pasien, termasuk berat badan dan tinggi badan.
Indeks Massa Tubuh (IMT), lingkar lengan atas, kadar albumin serum, dan kadar hemoglobin.
Penilaian status gizi juga dapat membantu petugas kesehatan memantau kemajuan pasien dan Dengan demikian, penilaian status gizi merupakan komponen penting dalam perawatan berkontribusi pada peningkatan kesehatan pasien.
Penilaian status gizi secara manual merupakan proses yang memakan waktu dan tenaga, terutama ketika menangani sejumlah besar pasien.
Hal ini dapat menjadi kendala dalam pemberian perawatan gizi yang tepat dan efektif, terutama jika jumlah pasien tidak sebanding dengan jumlah tenaga kesehatan yang melayani.
Oleh karena itu, penerapan teknologi dalam bidang kesehatan menghadirkan alternatif untuk deteksi dini status gizi pasien dewasa.
Salah satu pendekatan yang relevan adalah penggunaan algoritma K-Nearest Neighbor (KNN) dalam klasifikasi status gizi pasien dewasa.
Algoritma K-Nearest Neighbors telah digunakan dalam klasifikasi status gizi balita, ibu hamil dan klasifikasi obesitas.
Metode Modified K-Nearest Neighbor (M-KNN) telah digunakan dalam mengidentifikasi faktor risiko status gizi balita dengan akurasi sebesar 75% menggunakan 295 data status gizi balita pada nilai k=4 .
K-Nearest Neighbor memiliki kelebihan dalam mengatasi data yang memiliki kesalahan acak .
Penelitian menggunakan 412 data gizi balita, membandingkan metode Nayve Bayes dan KNN untuk klasifikasi status gizi balita diperoleh hasil akurasi 80,60% dengan Nayve Bayes dan 91,79% dengan K-Nearest Neighbor .
Tingkat akurasi sistem yang diuji dengan metode KNN untuk penentuan status gizi ibu hamil mencapai 86,7% dari 30 data sampel yang diuji.
Hasil akurasi tertinggi diperoleh melalui pengujian k-optimal dengan nilai k=3, 5, dan 6 .
Klasifikasi Status Gizi Balita Menggunakan Algoritma Fuzzy KNearest Neighbor in Every Class (FK-NNC) di Puskesmas Wonorejo menunjukkan bahwa nilai k optimal yang menghasilkan akurasi klasifikasi tertinggi adalah k=8 dengan akurasi 100% .
Pada penelitian Implementasi Algoritma KNearest Neighbor (KNN) untuk Klasifikasi Tingkat Obesitas, nilai k optimal yang menghasilkan akurasi tertinggi adalah k=2 dengan akurasi sebesar 78.
Nilai k yang lebih kecil menghasilkan akurasi yang lebih tinggi namun nilai k yang terlalu kecil dapat menyebabkan overfitting, sehingga sebaiknya dipilih nilai k yang optimal untuk menghasilkan akurasi yang tinggi tanpa menyebabkan overfitting .
Algoritma KNN telah digunakan untuk mengklasifikasikan sentimen publik mengenai vaksinasi COVID-19 menjadi kategori positif dan Dengan nilai k=3 diperoleh akurasi 85%.
Algoritma K-Nearest Neighbor (KNN) digunakan untuk mengklasifikasikan penyakit diabetes dengan menggunakan algoritma Particle Swarm Optimization (PSO) sebagai metode seleksi fitur.
Sebelum dilakukan seleksi fitur menggunakan PSO, akurasi algoritma KNN adalah 75% dengan k-optimal 19.
Namun, setelah dilakukan seleksi fitur menggunakan PSO, terjadi peningkatan akurasi menjadi 77,213% pada k=19 .
Klasifikasi kelayakan darah yang dapat didonorkan menggunakan metode K-NN (KNearest Neighbo.
dengan optimasi algoritma KMeans menggunakan nilai k=3 untuk K-NN, nilai sensitivitas mencapai 100% dengan nilai spesifisitas sebesar 90,48% dan AUC (Area Under the Curv.
sebesar 95%.
Akurasi tertinggi yang dicapai adalah 98,91% dengan tingkat kesalahan sebesar 1,09% .
Pengujian kinerja algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan kerentanan penyakit jantung menunjukkan bahwa KNN dengan nilai k=5 menghasilkan akurasi tertinggi sebesar 0,95 .
Komparasi Metode Support Vector Machine (SVM).
K-Nearest Neighbors (KNN), dan Random Forest (RF) untuk Prediksi Penyakit Gagal Jantung, metode KNN menghasilkan akurasi sebesar 93% dengan k=20 .
Optimasi Algoritma K-Nearest Neighbor (KNN) dengan Normalisasi dan Seleksi Fitur untuk Klasifikasi Penyakit Liver menghasilkan akurasi tertinggi pada normalisasi min-max dengan seleksi fitur Information Gain dan Gain Ratio, yaitu sebesar 78,2%, dengan k=10 .
Pada penelitian berjudul Sistem Deteksi Pelat Kendaraan dengan Menggunakan Metode KNearest Neighbour (KNN), nilai k yang optimal adalah 1 dengan akurasi 88,88% dalam jarak 40 Semakin besar nilai k, maka semakin banyak data yang digunakan untuk memprediksi kelas dari data baru.
Namun, jika nilai k terlalu besar, maka Positif : Jurnal Sistem dan Teknologi Informasi Volume 10.
No 2, 2024.
Page:
model akan menjadi overfitting, yaitu model akan terlalu baik dalam memprediksi data training tetapi tidak baik dalam memprediksi data baru .
Pada penelitian yang berjudul Optimasi Nilai K pada Algoritma KNN untuk Klasifikasi Spam dan Ham Email nilai k optimal yang menghasilkan akurasi tertinggi adalah k=49 dengan akurasi Semakin besar nilai k, maka akurasi klasifikasi juga semakin tinggi.
Namun nilai k yang terlalu besar dapat menyebabkan overfitting, sehingga sebaiknya dipilih nilai k yang optimal untuk menghasilkan akurasi yang tinggi tanpa menyebabkan overfitting .
Penelitian yang mengklasifikasikan penyakit pada daun jagung menggunakan algoritma K-Nearest Neighbors (KNN) dengan ekstraksi fitur GrayLevel Co-occurrence Matrix (GLCM) dan Hue Saturation Value (HSV), menunjukkan bahwa akurasi tertinggi diperoleh pada algoritma KNNGLCM-HSV dengan nilai k = 3 dan jarak piksel = 1, yaitu sebesar 85%.
Klasifikasi Citra Penyakit Daun Padi Menggunakan KNN Berdasarkan Ekstraksi Fitur GLCM mendapatkan nilai k optimal untuk KNN adalah 11 dengan akurasi sebesar 65.
83% .
Pada penelitian yang berjudul Analisis Perbandingan Algoritma SVM Dan KNN Untuk Klasifikasi Anime Bergenre Drama, algoritma KNN menggunakan nilai k=10 menghasilkan akurasi sebesar 84%.
Algoritma KNN memiliki akurasi yang lebih tinggi dibandingkan dengan algoritma SVM karena algoritma KNN lebih sederhana dan mudah dipelajari .
Pada Prediksi Harga Saham PT Bank Central Asia Tbk Berdasarkan Data dari Bursa Efek Indonesia Menggunakan Metode K-Nearest Neighbors (KNN), nilai k=37 memberikan performa yang baik, dengan akurasi sebesar 61.
79% dan kesalahan klasifikasi sebesar 38.
21% .
Pada penelitian berjudul Perbandingan Metode KNearest Neighbor dan LBPH pada Klasifikasi Daun Herbal, metode K-Nearest Neighbor (KNN) dengan nilai k=9 menghasilkan akurasi tertinggi yaitu 97,5%.
Nilai k yang lebih tinggi pada metode K-Nearest Neighbor (KNN) menghasilkan akurasi yang lebih tinggi karena lebih banyak data tetangga yang digunakan untuk klasifikasi .
Perbandingan Metode Klasifikasi KNN dan Nayve Bayes untuk Menentukan Tingkat Stres Siswa Sekolah Menengah Pertama, nilai k yang optimal untuk KNN adalah 3 dengan akurasi 86,61% .
Algoritma KNN merupakan algoritma klasifikasi yang dapat digunakan untuk memprediksi kelas data baru berdasarkan data yang sudah ada.
Dalam E-ISSN 2460-9552
P-ISSN 2620-3227
konteks penilaian status gizi, algoritma KNN dapat memanfaatkan data antropometri pasien, seperti tinggi badan dan berat badan untuk memprediksi status gizi pasien dewasa.
Penggunaan algoritma KNN memiliki beberapa keuntungan dalam penilaian status gizi pasien Pertama, algoritma KNN mudah diimplementasikan dan tidak memerlukan pelatihan data yang ekstensif.
Kedua, algoritma KNN dapat menangani data yang tidak lengkap atau noisy.
Ketiga, algoritma KNN dapat memberikan hasil yang akurat dan reliable.
Dengan demikian, penerapan algoritma KNN dalam klasifikasi status gizi pasien dewasa dapat menjadi pendekatan yang efisien dan terukur untuk mendukung penilaian status gizi pasien dewasa di lingkungan rumah sakit.
Berdasarkan studi literatur, nilai k optimal untuk akurasi tertinggi sangat bervariasi pada masingmasing hasil penelitian.
Penelitian ini berupaya menjawab pertanyaan: berapa nilai k optimal yang akan digunakan dalam algoritma K-Nearest Neighbor (K-NN) untuk mengklasifikasikan status gizi pasien dewasa supaya mendapatkan waktu tercepat, akurasi tertinggi, dan sensitivitas METODE PENELITIAN Rancangan Kegiatan Tahapan dalam penelitian ini yaitu proses pengumpulan data, preprocessing yang bertujuan untuk membersihkan data dari missing value, setelah itu dilakukan pembagian data latih dan uji, kemudian data akan dimodelkan menggunakan model klasifikasi K-nearest neighbor, dan dilakukan evaluasi.
Ruang Lingkup Penelitian ini menggunakan algoritma KNN dengan aplikasi Rapidminer.
Penelitian ini berfokus mencari k optimal untuk mendapatkan waktu tercepat, akurasi tertinggi dan sensitivitas Teknik Pengumpulan Data Data dikumpulkan dari laporan bulanan asuhan gizi pasien dewasa di Bangsal Alamanda 1 dan Bangsal Intensive Care Unit (ICU) Rumah Sakit Umum Daerah Sleman.
Data yang digunakan adalah data tanggal 2 Januari hingga 18 Oktober Data set yang digunakan adalah tinggi badan, berat badan dan status gizi pasien.
Tabel 1.
Pembagian Data Set Variasi Pembagian Data Set Data Latih Data Uji Pada penelitian ini data set akan dilatih menggunakan menggunakan tool RapidMiner Studio dengan model klasifikasi K-nearest neighbor, sebanyak 30 kali, dengan k bilangan ganjil < 20, lalu akan dievaluasi waktu pemrosesan, tingkat akurasi, dan sensitivitasnya.
Model Klasifikasi Gambar 1 adalah desain RapidMiner K-Nearest Neighbor (KNN) yang menggambarkan langkahlangkah penerapan algoritma KNN pada data.
terhadap proses dan hasil yang dihasilkan dari algoritma ini.
Evaluasi Evaluasi sensitivitas dilakukan untuk hasil akurasi tertinggi menggunakan confusion matrix multiple classes classification.
Confusion Matrix, adalah cara tabel untuk memvisualisasikan kinerja model prediksi pada pembelajaran supervised learning.
Setiap data dari masingmasing kelas dalam tabel confusion matrix menunjukkan jumlah prediksi yang dibuat guna untuk mengklasifikasikan kelas yang benar atau Tabel 2 menunjukkan contoh format confusion matrix dengan n kelas:
Tabel 2.
Confusion Matrix Multiple Classes .
Actual Number Teknik Analisis Atribut diberikan pada data set yang tersedia.
Tinggi badan dan berat badan pasien termasuk dalam kategori atribut reguler, sedangkan data status gizi termasuk dalam kategori atribut Label status gizi dibagi menjadi lima kriteria, yaitu kurang, normal, lebih, obesitas I, dan obesitas II.
Data set dibagi menjadi 2, yaitu data latih dan data uji.
Dilakukan 3 variasi pembagian data latih dan data uji seperti disajikan pada Tabel 1 berikut ini:
Class 1
Class 2
Class n Class 1
X11
X21
Xn1
Predicted Number
Class 2
Class n X12
X1n
X22
X2n Xn2 Xnn Gambar 2 menunjukkan confusion matrix untuk klasifikasi multiple classes dengan tiga kelas (A.
B, dan C).
Gambar 2.
Confusion Matrix Tiga Kelas .
Gambar 1.
Desain RapidMiner Pada tahap awal, data disiapkan dan dimuat ke dalam platform RapidMiner.
Selanjutnya, membersihkan data dari missing value.
Setelah itu dilakukan split data dan algoritma KNN dijalankan pada data set dengan k yang telah Hasil dari klasifikasi data dilihat melalui output yang dihasilkan.
Desain ini implementasi KNN menggunakan RapidMiner, memfasilitasi pemahaman yang lebih baik Diagonal hijau mewakili prediksi yang benar dan kotak merah muda menunjukkan prediksi yang Jika sampel positif dan diklasifikasikan sebagai positif, yaitu diklasifikasikan positif dengan benar sampel dihitung positif benar atau true positive (TP).
jika diklasifikasikan sebagai negatif, maka dianggap sebagai kesalahan negatif palsu false negative (FN) atau kesalahan tipe II.
Jika sampelnya negatif dan diklasifikasikan sebagai negatif, maka disebut sebagai true negative (TN).
jika diklasifikasikan positif maka dihitung false positive (FP), atau kesalahan Tipe Seperti yang ditunjukkan, pada Gambar 2.
TPA adalah jumlah sampel positif sebenarnya di kelas A, yaitu jumlah sampel yang diklasifikasikan Positif : Jurnal Sistem dan Teknologi Informasi Volume 10.
No 2, 2024.
Page:
dengan benar dari kelas A, dan EAB sebagai sampel dari kelas A yang salah diklasifikasikan sebagai kelas B, yaitu sampel yang salah Jadi, negatif palsu pada kelas A (FNA) adalah jumlah EAB dan EAC (FNA = EAB EAC) yang menunjukkan jumlah semua sampel kelas A yang salah diklasifikasikan sebagai kelas B atau C.
Sederhananya.
FN kelas mana pun yang terletak di suatu kolom dapat dihitung dengan menambahkan kesalahan pada kelas/kolom Sedangkan yang false positive (FP) untuk setiap kelas prediksi yang terletak pada suatu baris mewakili jumlah semua kesalahan pada baris tersebut.
Misalnya, positif palsu di kelas A (FPA) dihitung sebagai berikut.
FPA = EBA ECA .
Sensitivitas, atau true positive rate (TPR), atau hit rate, atau recall, dari suatu klasifikasi adalah sampel positif yang diklasifikasikan dengan benar ke jumlah total sampel positif, dan diperkirakan berdasarkan rumus:
ycNycEycI = ycNycE ycNycE yaycA Keterangan:
TPR : True Positive Rate (Sensitivita.
TP : True Positive FN : False Negative Setelah diketahui nilai TPR masing-masing kelas, kemudian dihitung nilai rata-rata sensitivitas dari semua kelas dengan menjumlahkan dan dibagi jumlah kelas, menggunakan rumus:
Aycoyco ycNycEycI = E-ISSN 2460-9552
P-ISSN 2620-3227
atribut reguler dan 1 atribut khusus.
Pada saat preprocessing data dilakukan pengecekan missing value dan data set ini tidak ada missing Variabel tinggi badan dan berat badan diberi atribut reguler, sedangkan variabel status gizi diberi atribut khusus, yaitu label.
Distribusi klasifikasi status gizi disajikan dalam Tabel 3.
Tabel 3.
Distribusi Klasifikasi Status Gizi No.
HASIL DAN PEMBAHASAN
Hasil Penelitian Data set yang digunakan adalah data tinggi badan, berat badan dan status gizi pasien dewasa.
Data diperoleh dari data primer pasien di bangsal 1 Alamanda dan ICU RSUD Sleman pada tanggal 2 Januari sampai dengan 18 Oktober Jumlah data set sebanyak 312 dengan 2 Jumlah Setelah dilakukan preprocessing kemudian dilakukan proses split data.
Skema split data disajikan dalam Tabel 4.
Tabel 4.
Skema Split Data Persentase (Data Latih:Data Uj.
90:10 70:30 50:50 Data Latih Data Uji Proses pengujian data menggunakan tool RapidMiner Studio dengan model klasifikasi Knearest neighbor.
Tabel 5 merupakan hasil pengujian pada k bilangan ganjil < 20 dengan split data 90:10, 70:30, dan 50:50.
ycNycEycI .
aycoycaycyc 1 yaycoycaycyc 2 U yaycoycaycyc yc.
ycu Keterangan:
All TPR : Rata-rata sensitivitas TPR : True Positive Rate : jumlah kelas Klasifikasi Status Gizi Kurang Normal Lebih Obes I Obes II Jumlah Tabel 5.
Hasil Pengujian Split
Data
90:10
90:10
90:10
90:10
90:10
90:10
90:10
90:10
90:10
90:10
70:30
70:30
70:30
Akurasi
(%)
ExecutionTime .
Akurasi
(%)
ExecutionTime .
Dari hasil pengujian diperoleh hasil akurasi tertinggi pada k=1 dan k=3 yaitu sebesar 96.
dengan split data 70:30.
Selanjutnya dilakukan evaluasi sensitivitas menggunakan Confusion Matrix seperti disajikan pada Tabel 6 dan Tabel Confusion Matrix pada penelitian ini adalah Confusion Matrix Multiple Classes yang terdiri dari 5 kelas klasifikasi yaitu normal, kurang, obes I, lebih, dan obes II.
Kotak warna hijau menunjukkan jumlah prediksi yang benar dan kotak warna kuning menunjukkan jumlah prediksi yang salah.
Jumlah prediksi diperoleh dari hasil pengujian menggunakan tool RapidMiner Studio.
Sensitivitas dihitung pada masing-masing kelas, kemudian dihitung rataratanya.
Tabel 6.
Confusion Matrix k=1 pada Split Data
70:30
Predicted Number
Actual Number
Norma
Kuran Obes I Lebi
Obes
Obes I Lebih Obes II
86,36
Norma Kuran Sensitivity Rata-rata 97,27% Tabel 7.
Confusion Matrix k=3 pada Split Data
70:30
Actual Number
Predicted Number
Split
Data
70:30
70:30
70:30
70:30
70:30
70:30
70:30
50:50
50:50
50:50
50:50
50:50
50:50
50:50
50:50
50:50
50:50
Norma Kuran Obes I Lebi Obes Obes I Lebih 90,91 Norma Kuran Obes II Sensitivity 97,15 Rata-rata 97,61% Hasil evaluasi sensitivitas disajikan pada Tabel 6.
Tabel 8.
Evaluasi Sensitivitas Split Data
70:30
70:30
Sensitivitas 97,27% 97,61% Sensitivitas tertinggi diperoleh pada split data 70:30 dengan k=3.
Pembahasan K-Nearest Neighbors (KNN) adalah algoritma pembelajaran mesin yang beroperasi berdasarkan prinsip "kesamaan tetangga.
" Jika suatu data memiliki tetangga-tetangga yang memiliki label tertentu, maka kemungkinan besar data tersebut juga akan memiliki label tersebut.
Parameter utama dalam KNN adalah nilai k, yang menentukan jumlah tetangga terdekat yang akan diambil untuk membuat prediksi.
Nilai k yang dipilih dapat memengaruhi tingkat kompleksitas dan performa model.
KNN menggunakan metrik jarak, seperti Euclidean distance atau Manhattan distance, untuk mengukur seberapa dekat atau jauh antara dua data.
Metrik ini menentukan cara mengukur "jarak" antara data dalam ruang fitur.
Untuk memprediksi label suatu data.
KNN mencari k tetangga terdekat berdasarkan metrik Prediksi dilakukan dengan mayoritas suara .
atau nilai rata-rata .
dari tetangga-tetangga tersebut.
Pemilihan nilai k berpengaruh pada kompleksitas model.
Nilai k kecil dapat menyebabkan overfitting, sementara k besar dapat menyebabkan underfitting .
Hasil uji coba menunjukkan bahwa akurasi tertinggi diperoleh pada nilai k=1 dan k=3 yakni 77% dengan perbandingan data latih:data uji sebesar 70:30.
Pada penelitian ini, rasio data latih Positif : Jurnal Sistem dan Teknologi Informasi Volume 10.
No 2, 2024.
Page:
dan data uji 70:30 menghasilkan akurasi dan sensitivitas yang tertinggi.
Evaluasi kinerja model pembelajaran mesin mengungkapkan bahwa kemampuan prediksi sangat dipengaruhi oleh proporsi data latih dan data uji.
Perbandingan 70:30 menghasilkan kinerja terbaik berdasarkan parameter evaluasi .
Analisis lebih lanjut mengungkapkan bahwa sensitivitas tertinggi dicapai pada rasio 70:30 dengan nilai k=3.
Uji sensitivitas dilakukan pada variasi nilai k yang berbeda yakni k=1 dan k=3 yang menggunakan perbandingan split data training dan test yang sama, yaitu 70:30.
Hasil pengujian sensitivitas menunjukkan bahwa model KNN dengan k=3 menghasilkan sensitivitas sedikit lebih tinggi, yaitu sebesar 97,61%, dibandingkan model KNN dengan k=1 yang menghasilkan sensitivitas 97,27%.
Hal ini mengindikasikan bahwa kemampuan model KNN dengan k=3 untuk mendeteksi sampel positif secara akurat .
rue positiv.
lebih baik dibandingkan model KNN dengan k=1.
Dengan kata lain, model KNN dengan k=3 cenderung menghasilkan jumlah sampel positif yang terlewatkan atau salah diklasifikasi sebagai negatif .
alse negativ.
lebih sedikit.
Secara keseluruhan, dalam ranah diagnostik model KNN dengan k=3 memiliki performa yang lebih unggul meskipun perbedaan sensitivitasnya relatif kecil.
Sensitivitas merepresentasikan kemampuan model dalam mendeteksi kondisi positif secara Ukuran ini digunakan untuk menilai kinerja karena dapat mengetahui sejauh mana model dapat memprediksi kasus positif dengan tepat .
Di bidang kesehatan sensitivitas merupakan hal yang penting.
Semakin besar kemampuan model untuk memprediksi kasus positif dengan akurat.
Masing-masing proses pengujian memerlukan durasi 0 detik, hal ini menunjukkan kemampuan algoritma KNN untuk memprediksi status gizi pasien secara real-time.
Kecepatan pelayanan merupakan hal yang penting di dunia kesehatan.
Deteksi dini status gizi pasien dewasa menggunakan algoritma KNN dapat mempercepat proses pengambilan keputusan dalam pelayanan pasien.
PENUTUP
Kesimpulan Algoritma K-Nearest Neighbors (KNN) dapat digunakan untuk klasifikasi status gizi pasien
E-ISSN 2460-9552
P-ISSN 2620-3227
dewasa dengan memanfaatkan data antropometri tinggi badan dan berat badan.
Nilai k yang optimal untuk mendapatkan akurasi klasifikasi tertinggi adalah k=3 dengan split data 70:30, akurasinya 77% dan sensitivitas 97.
Algoritma KNN dengan nilai k optimal dapat digunakan untuk mengklasifikasi status gizi pasien dewasa secara akurat dan dapat dikembangkan menjadi sistem deteksi dini status gizi pasien di rumah sakit.
Saran Jumlah data sample yang digunakan saat ini masih relatif kecil yaitu 312 data.
Penambahan jumlah data set akan meningkatkan akurasi model karena akan lebih mewakili populasi yang sebenarnya.
Selain KNN, dapat diuji pula model klasifikasi lain seperti Naive Bayes.
Decision Tree.
Random Forest untuk dibandingkan kinerjanya.
Model mana yang paling akurat untuk kasus ini.
REFERENSI