METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
KLASIFIKASI BERISIKO STUNTING PADA BALITA: PERBANDINGAN KNEAREST NEIGHBOR.
NAyaVE BAYES.
SUPPORT VECTOR MACHINE Ramadya Wahyu DwinantoA.
Arif Setia Sandi A.
Rian Ardianto Universitas Harapan Bangsa.
Purwokerto.
Indonesia Email: ramadyawahyudwinanto1208@gmail.
DOI: https://doi.
org/10.
46880/jmika.
Vol8No2.
ABSTRACT
Stunting in children under five is a significant health problem that impacts child development.
This study aims to develop a classification model to predict stunting risk using SVM.
KNN, and Nayve Bayes algorithms.
Data from the Jatilawang Health Center included 523 under-fives with variables such as age, weight, length, arm circumference, z-score, parental education, and maternal health history.
Following the CRISP-DM steps, the data was processed through handling missing data, feature selection, and dividing the data into training and testing sets with a ratio of 80:20.
Results showed SVM had the highest accuracy of 90%, followed by KNN 89%, and Nayve Bayes 85%.
This research produces a stunting risk prediction model that is implemented in a simple website, supporting early intervention and decision-making in stunting prevention efforts.
Keyword: Stunting.
Classification.
Support Vector Machine.
Nayve Bayes.
K-Nearest Neighbor.
ABSTRAK
Stunting pada balita adalah masalah kesehatan signifikan yang berdampak pada perkembangan anak.
Penelitian ini bertujuan mengembangkan model klasifikasi untuk memprediksi risiko stunting menggunakan algoritma SVM.
KNN, dan Nayve Bayes.
Data dari Puskesmas Jatilawang mencakup 523 balita dengan variabel seperti umur, berat badan, panjang badan, lingkar lengan, z-score, pendidikan orang tua, dan riwayat kesehatan ibu.
Mengikuti tahapan CRISP-DM, data diproses melalui penanganan missing data, seleksi fitur, dan pembagian data menjadi set pelatihan dan pengujian dengan rasio 80:20.
Hasil menunjukkan SVM memiliki akurasi tertinggi 90%, diikuti KNN 89%, dan Nayve Bayes 85%.
Penelitian ini menghasilkan model prediksi risiko stunting yang diimplementasikan dalam website sederhana, mendukung intervensi dini dan pengambilan keputusan dalam upaya penanggulangan stunting.
Kata Kunci: Stunting.
Klasifikasi.
Support Vector Machine.
Nayve Bayes.
K-Nearest Neighbor.
PENDAHULUAN
Penanggulangan stunting esensial dalam mencapai Tujuan Pembangunan Berkelanjutan Sustainable Development Goals (SDG.
nomor 2, "Pemberantasan Kelaparan," dan nomor 3, "Kesehatan dan Kesejahteraan.
" Stunting bukan hanya masalah kesehatan, tetapi juga mencakup hak anak, pendidikan, dan pemberdayaan ekonomi.
Mencegah stunting melalui nutrisi yang baik pada masa awal kehidupan menciptakan dasar kuat bagi pertumbuhan dan perkembangan anak.
Dengan mendukung upaya pencegahan stunting, kita meningkatkan kesehatan generasi masa depan dan memperkuat fondasi untuk mencapai tujuan pembangunan berkelanjutan secara menyeluruh (Kementrian Kesehatan RI, 2.
Salah satu tolok ukur keberhasilan pencapaian tujuan pembangunan berkelanjutan (SDG.
adalah kondisi kesehatan anak umur bawah lima tahun atau balita, yang dapat dilihat dari status gizinya.
Anak-anak balita termasuk dalam kelompok rentan terhadap kondisi gizi yang kurang, dan stunting menjadi salah satu permasalahan kesehatan yang dapat terjadi pada masa ini.
Indonesia adalah salah satu negara yang memiliki peringkat stunting tinggi di dunia dengan angka stunting 21,6% pada tahun 2022 (Kementerian Kesehatan Republik Indonesia, 2.
Stunting sendiri merujuk pada kondisi ketidakberhasilan pertumbuhan pada anak bawah lima tahun yang disebabkan oleh kurangnya gizi kronis, yang mengakibatkan anak memiliki postur tubuh yang lebih rendah daripada seharusnya sesuai usianya (Erik et al.
, 2.
Stunting menjadi isu gizi utama yang dapat berpengaruh terhadap aspek sosial dan ekonomi dalam kehidupan bermasyarakat (Azizah et al.
, 2.
Stunting sering dibahas dalam konteks kesehatan, namun integrasi dengan ilmu komputer, khususnya analisis data, diperlukan untuk pemahaman dan penanganan yang holistik.
Analisis data, terutama Halaman 264 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
data mining, dapat mengidentifikasi pola dan faktor risiko kompleks melalui deskripsi, estimasi, prediksi, klasifikasi, pengklusteran, dan asosiasi (Sukmawati et , 2.
Klasifikasi bertujuan untuk memprediksi label kelas dari data tanpa label melalui dua tahap:
pembelajaran, yaitu analisis menggunakan algoritma klasifikasi, dan klasifikasi, yaitu memprediksi keakuratan dengan data uji (Ariyadi, 2.
Teknologi machine learning menawarkan potensi yang besar dalam upaya ini, terutama dalam hal klasifikasi status stunting berdasarkan data kesehatan yang tersedia.
Melalui machine learning, kita dapat menganalisis data secara lebih mendalam untuk mengidentifikasi pola tersembunyi serta faktor risiko yang memengaruhi stunting.
Algoritma seperti Nayve Bayes.
K-Nearest Neighbor (KNN), dan Support Vector Machine (SVM) menjadi relevan dalam konteks ini karena kemampuan mereka untuk melakukan klasifikasi yang akurat terhadap data kesehatan.
Penelitian yang telah dilakukan oleh Syahrial et dalam 'Stunting Classification in Children's Measurement Data Using Machine Learning Models' menggunakan metode SVM-RBF menunjukkan hasil akurasi sebesar 78% (Syahrial et al.
, 2.
Penelitian lain, 'Klasifikasi Status Stunting Pada Balita Menggunakan K-Nearest Neighbor dengan Feature Selection Backward Elimination,' menunjukkan bahwa algoritma K-Nearest Neighbor dengan nilai k=5 menghasilkan rata-rata akurasi 91,90% dengan 9 Dengan penambahan Backward Elimination, akurasi meningkat menjadi 92,20% dengan 8 atribut (Lonang & Normawati, 2.
Penelitian lainnya dalam 'Klasifikasi Penentuan Stunting Menggunakan Metode Nayve Bayes (Studi Kasus: Desa Letekonda Selata.
' menunjukkan bahwa metode Nayve Bayes mencapai akurasi rata-rata 92% dalam setiap iterasinya (Malo & Janga, 2.
Berdasarkan dari penelitian terdahulu yang memiliki hasil akurasi yang tinggi, ketiga algoritma tersebut dipilih karena karakteristik unik yang dapat berkontribusi pada keefektifan klasifikasi stunting.
Nayve Bayes, kesederhanaannya dan efisiensinya dalam bekerja dengan dataset yang berukuran besar dan memiliki banyak fitur.
Algoritma ini sering digunakan dalam masalah klasifikasi yang melibatkan probabilitas antar variabel (Setiawan et al.
, 2.
K-Nearest Neighbor fleksibilitasnya dalam menangani dataset yang nonlinear, serta kemampuannya untuk memberikan hasil yang presisi ketika data memiliki struktur yang cukup ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
Algoritma ini mudah diterapkan dan dapat dioptimalkan melalui metode feature selection untuk mengurangi dimensi data tanpa mengorbankan akurasi (Cahyanti et al.
, 2.
Support Vector Machine (SVM) dipilih karena kemampuannya yang kuat dalam menangani data dengan margin yang jelas antara dua kelas.
SVM sangat efektif dalam kasus-kasus di mana terdapat garis batas yang tegas antara kelompok data, seperti dalam klasifikasi status gizi anak.
Algoritma ini juga mampu menghindari overfitting, terutama dengan kernel yang sesuai, seperti RBF (Radial Basis Functio.
(Nalatissifa et al.
, 2.
Penelitian ini bertujuan untuk membandingkan ketiga algoritma tersebut Nayve Bayes.
K-Nearest Neighbor, dan Support Vector Machine untuk menentukan algoritma mana yang menghasilkan akurasi tertinggi dalam klasifikasi status stunting.
Diharapkan, hasil penelitian ini dapat memberikan rekomendasi praktis bagi pemangku kebijakan dalam pengambilan keputusan berbasis data untuk menekan angka stunting di Indonesia.
Berdasarkan pemaparan penelitian sebelumnya terkait pada klasifikasi stunting, maka penelitian ini memiliki tujuan untuk memperoleh pengambilan keputusan risiko berstatus stunting pada anak usia bawah lima tahun menggunakan metode klasifikasi yang mampu menentukan secara lebih tepat.
KAJIAN LITERATUR
Machine Learning Gambar 1.
Machine Learning Machine learning adalah bagian integral dari kecerdasan buatan yang melibatkan pembangunan model matematika berdasarkan data latih untuk membuat prediksi atau keputusan otomatis.
Menggunakan algoritma dan teknik yang sesuai, machine learning mengenali pola kompleks dalam data, meningkatkan kinerja sistem tanpa pemrograman manual berkelanjutan.
Gambar 1 menjelaskan terdapat dua jenis utama machine learning: supervised learning, menghasilkan prediksi akurat, dan unsupervised learning, yang bekerja dengan dataset tanpa label untuk menemukan pola atau struktur baru.
Kedua paradigma Halaman 265 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
ini penting dalam pengembangan kecerdasan buatan dan analisis data (Nisa Sofia Amriza et al.
, 2.
kemudahan implementasi dalam berbagai konteks Supervised Learning Metode supervised learning menggunakan data berlabel untuk membentuk model yang dapat memprediksi atau mengklasifikasi data baru.
Supervised learning terbagi menjadi dua masalah utama: klasifikasi, di mana variabel output berupa kategori seperti warna atau status kesehatan, dan regresi, di mana variabel output berupa nilai kontinu seperti mata uang atau berat objek (Roihan et al.
, 2.
Naive Bayes Naive Bayes classifier adalah metode klasifikasi berdasarkan Teorema Bayes yang mengasumsikan independensi antar fitur dalam dataset (Setiawan et al.
Metode ini menggunakan probabilitas untuk memprediksi kejadian di masa depan berdasarkan informasi dari kejadian-kejadian sebelumnya, dengan asumsi bahwa setiap fitur dalam dataset bersifat independen satu sama lain.
Klasifikasi Klasifikasi dalam analisis data adalah proses mengekstrak pola untuk meramalkan label kelas pada dataset tertentu (Abadi et al.
, 2.
Proses ini terdiri dari dua tahap: pembelajaran, di mana model dibentuk dengan mempelajari pola dari data pelatihan, dan pengklasifikasian, di mana model diterapkan untuk memprediksi label kelas dari data baru (Adriyendi & Melia, 2.
Klasifikasi tidak hanya meramalkan kelas tetapi juga memahami pola tersembunyi dalam data untuk membentuk model prediktif yang optimal (Syahrir et al.
, 2.
Confusion matrix Penilaian dilaksanakan untuk menilai sejauh mana kinerja model yang telah diterapkan.
Confusion matrix dapat digunakan sebagai alat evaluasi pada tahap ini.
Pendekatan ini menghasilkan sejumlah nilai yang berfungsi sebagai indikator evaluasi kinerja model, seperti F1-skor, akurasi, presisi, dan recall (Purwono et al.
, 2.
Tabel 1 menjelaskan perhitungan confusion matrix.
TP adalah jumlah tepat positif.
TN adalah jumlah tepat negatif.
FP adalah jumlah negatif keliru, dan FN adalah jumlah positif keliru oleh model klasifikasi.
Support Vector Machine (SVM) Support Vector Machine (SVM) diperkenalkan oleh Vapnik pada tahun 1992 sebagai teknik machine learning yang mengadopsi prinsip Structural Risk Minimization (SRM) untuk menemukan hyperplane optimal yang memisahkan dua kelas berbeda (Maulidah et al.
, 2.
SVM menggunakan fungsi linier dalam ruang fitur berdimensi tinggi dan dapat diterapkan pada klasifikasi dan regresi (Saputra et al.
SVM berfokus pada pemisahan linier dalam klasifikasi, namun dapat menangani masalah non-linier dengan konsep kernel, mencari hyperplane yang memaksimalkan margin antara dua kelas untuk menciptakan model prediktif yang efisien dan akurat (Nalatissifa et al.
, 2.
Tabel 1.
Confusion Matrix Kelas Hasil Prediksi Kelas Aktual True Positive True Negative (TP) (TN) False Positive False Negative (FP) (FN) K-Nearest Neighbor (K-NN) Metode K-Nearest Neighbor (K-NN) adalah pendekatan klasifikasi yang menggunakan data terdekat berdasarkan jarak dalam dataset.
Penentuan nilai k sangat memengaruhi proses pengklasifikasian, karena nilai ini menentukan jumlah tetangga terdekat yang dipertimbangkan untuk menentukan kelas observasi (Cahyanti et al.
, 2.
K-NN memiliki kelebihan seperti ketahanan terhadap dataset besar dan Akurasi adalah persentase data uji yang (Rarasati.
Perhitungan nilai akurasi sebuah model dapat dilihat pada persamaan .
yaycaycaycycycaycayc = TP TN Total Data Presisi mencerminkan jumlah data pada kategori positif yang diklasifikasikan dengan benar, dibagi oleh total data yang diklasifikasikan sebagai positif (Pratiwi et al.
, 2.
Presisi dapat dihitung dengan persamaan .
ycEycyceycaycnycycycnycuycu = TP FP Halaman 266 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
Sementara itu, recall menunjukkan persentase data dari kategori positif yang diklasifikasikan dengan benar oleh sistem (Religia et al.
, 2.
Recall dapat dihitung dengan formula .
ycIyceycaycaycoyco = TP FN Understanding.
Data Understanding.
Data Preparation.
Modeling.
Evaluation, dan Deployment (Nurkhaliza & Wijayanto, 2.
Proses ini menggambarkan alur data mining secara sistematis, seperti yang ditunjukkan pada Gambar 3.
Skor F1 adalah nilai yang mewakili rata-rata harmonik antara presisi dan recall, yang menciptakan metrik evaluasi yang menggabungkan kedua aspek tersebut dengan mempertimbangkan keseimbangan antara keduanya (Hidayat & Astuti, 2.
F1-Score dicari menggunakan persamaan .
ya1 Oe ycIycaycuycyce ycEycyceycaycnycycycnycuycu O ycIyceycaycaycoyco ycEycyceycaycnycycycnycuycu ycIyceycaycaycoyco ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
Cross-validation Gambar 2.
Cross-validation Cross-validation, atau estimasi rotasi, adalah teknik validasi model yang menilai kemampuan generalisasi hasil analisis ke kumpulan data independen, penting dalam machine learning dan Teknik umum yang digunakan adalah k-fold cross-validation, di mana dataset dibagi menjadi K lipatan yang berukuran sama.
Setiap lipatan bergantian digunakan sebagai data uji, sementara lipatan lainnya digunakan sebagai data pelatihan.
Proses ini diulang sebanyak K kali sehingga setiap lipatan digunakan sekali sebagai data uji (Azizah et al.
, 2.
Misalnya pada Gambar 2, dengan K=5, dataset dibagi menjadi lima bagian yang berukuran sama, model dilatih pada empat bagian dan diuji pada bagian kelima.
Proses ini diulang lima kali dan hasilnya dirata-rata untuk memberikan estimasi performa model yang lebih akurat (Tembusai et al.
, 2.
METODE PENELITIAN
Metode penelitian ini menggunakan CRISPDM (Cross-Industry Standard Process Model for Data Minin.
, yang mencakup enam tahap: Business Gambar 3.
CRISP-DM
Penjelasan mengenai fase pada model CRISPDM melibatkan beberapa langkah penting.
Tahap Business Understanding adalah awal dari proses, di mana fokusnya adalah memahami substansi kegiatan data mining, menetapkan tujuan penelitian, dan menerjemahkan tujuan tersebut menjadi objektif data mining yang jelas.
Sementara itu, pada Tahap Data Understanding, dilakukan pengumpulan dan analisis data untuk memahami karakteristiknya serta mengidentifikasi masalah terkait data yang akan Selanjutnya.
Tahap Data Preparation melibatkan upaya mempersiapkan struktur basis data agar memfasilitasi proses mining dengan efektif (Lundyn et al.
, 2.
Pada Tahap Modeling, fokusnya beralih ke penentuan teknik, algoritma, dan parameter yang optimal untuk mencapai tujuan data mining.
Tahap Evaluation berkaitan dengan interpretasi hasil dari pemodelan, dengan tujuan untuk menyelaraskan model dengan sasaran yang ingin dicapai.
Terakhir, pada Tahap Deployment, laporan pengetahuan yang diperoleh dari evaluasi proses data mining disusun.
Keseluruhan proses ini memberikan kerangka kerja yang terstruktur dan sistematis untuk memandu para profesional data science dalam menjalankan proyek penambangan data dengan tujuan bisnis yang jelas (Nalatissifa et al.
, 2.
Penelitian ini menggunakan metode CRISP-DM dengan enam tahap:
Business Understanding:
Fokus klasifikasiAiSVM.
KNN, dan Naive Bayes Classifier (NBC)Aidalam mengidentifikasi risiko stunting pada balita.
Data Understanding: Data awal dari Puskesmas Jatilawang terdiri dari 1281 balita, disaring menjadi 523 data balita yang lengkap.
Halaman 267 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
Data Preparation: Melibatkan penanganan missing data, label encoding, feature selection, dan pembagian data .
% untuk testing, 80% untuk trainin.
untuk memastikan keakuratan dan keandalan analisis.
Modeling:
Model menggunakan dataset pelatihan dengan algoritma SVM.
KNN, dan NBC, kemudian diuji pada dataset Evaluation: Menggunakan confusion matrix untuk membandingkan akurasi ketiga model dan mengidentifikasi model terbaik.
Deployment: Mengembangkan website sederhana untuk menyajikan fungsionalitas identifikasi dan pengelolaan risiko stunting pada balita, berdasarkan hasil evaluasi algoritma.
Variabel penelitian ini adalah untuk memahami, mengukur, atau mengidentifikasi hubungan antara fenomena stunting.
Dengan merinci variabel penelitian, peneliti dapat memperoleh pemahaman yang lebih akurat tentang faktor-faktor yang mempengaruhi fenomena stunting, yang pada gilirannya dapat membantu dalam pengembangan kebijakan, praktik, atau teori yang lebih baik.
Variabel pada penelitian ini dapat dilihat pada Tabel 2.
Tabel 2.
Variabel Penelitian Variabel Keterangan Jenis Kelamin Jenis Kelamin Anak :Perempuan, 1:Laki-lak.
Umur Umur Bayi Bawah Lima Tahun .
-60 Bula.
Berat Badan Berat Badan Panjang Badan Panjang Badan terakhir diukur .
Lingkar Lengan Lingkar Lengan terakhir diukur .
z-Score BB/U Nilai z-Score Berat Badan
Sekarang Umur
BB/U
Berat Badan Sekarang Umur .
:Gizi Buruk, 1:Gizi Kurang, 2:Gizi Normal, 3:Gizi Lebih, 4:Gizi Berlebi.
z-Score BB/PB Nilai z-Score Berat Badan Sekarang Panjang Badan Sekarang BB/PB Berat Badan Sekarang Panjang Badan Sekarang .
:Sangat Kurus, 1:Kurus, 2:Normal.
Variabel z-Score PB/U PB/U Pendidikan Ayah Pendidikan Ibu Riwayat Hamil Hasil ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
Keterangan 3:Gemuk, 4:Sangat Gemu.
Nilai z-Score Panjang Badan Sekarang dibandingkan Umur Panjang Badan Sekarang Umur .
:Sangat Pendek, 1:Pendek, 2:Normal, 3:Tinggi, 4:Sangat Tingg.
Pendidikan terakhir Ayah .
:Tidak Sekolah, 1:SD, 2:SMP, 3:SMA, 4:Sarjan.
Pendidikan terakhir Ibu .
:Tidak Sekolah, 1:SD, 2:SMP, 3:SMA, 4:Sarjan.
Riwayat Ibu saat hamil .
:Tidak Ada Riwayat, 1:
Ada Riwaya.
Hasil dari Status Berisiko Stunting .
:Tidak Berisiko Stunting, 1:Berisiko Stuntin.
HASIL DAN PEMBAHASAN Bussines Understanding Stunting pada anak-anak, yang disebabkan oleh kekurangan gizi selama masa pertumbuhan, memiliki dampak luas di bidang kesehatan dan ekonomi.
Dari segi kesehatan, stunting meningkatkan risiko penyakit infeksi dan kronis serta memengaruhi perkembangan kognitif anak.
Dampak ekonominya termasuk pengurangan produktivitas di masa depan dan peningkatan beban sistem kesehatan.
Secara sosial, stunting memperdalam kesenjangan ekonomi dan pendidikan, mempengaruhi pertumbuhan ekonomi suatu negara.
Oleh karena itu, penanganan stunting pengembangan manusia secara menyeluruh.
Data dari Badan Pusat Statistik Provinsi Jawa Tengah 2021 menunjukkan bahwa Banyumas memerlukan perhatian khusus dalam layanan kesehatan Dengan 24.
381 kelahiran bayi.
Banyumas berada di peringkat kelima di Provinsi Jawa Tengah.
Jumlah bayi dengan berat lahir rendah sebanyak 1.
629 dan kasus gizi buruk sebanyak 2.
985 menunjukkan masalah yang perlu diatasi dalam gizi dan perawatan anak.
Kecamatan Jatilawang.
Kabupaten Banyumas, data dari BPS 2022 menunjukkan 853 kelahiran bayi, dengan 246 bayi mengalami gizi buruk dan 61 bayi lahir dengan berat rendah.
Data ini menyoroti kebutuhan mendesak untuk fokus pada perawatan maternal dan anak, termasuk pencegahan gizi buruk Halaman 268 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
dan intervensi dini untuk mengurangi risiko kelahiran bayi dengan berat rendah.
Penelitian ini bertujuan mengembangkan pengambilan keputusan risiko stunting pada anak usia di bawah lima tahun menggunakan metode klasifikasi yang lebih akurat.
Dengan membandingkan tiga algoritma klasifikasiAiNayve Bayes.
K-Nearest Neighbor, dan Support Vector MachineAipenelitian ini bertujuan menentukan algoritma dengan nilai akurasi Hasil penelitian diharapkan memberikan manfaat signifikan dalam penerapan dan peningkatan upaya terkait, sehingga dapat menurunkan tingkat risiko stunting pada anak dan meningkatkan kesehatan serta kesejahteraan anak-anak di wilayah tersebut.
Data Understanding Pada penelitian ini, tahap awal yang krusial adalah melakukan Data Understanding dan Exploratory Data Analysis (EDA) untuk mendapatkan pemahaman yang mendalam tentang data yang akan Melalui analisis ini, penulis akan mengidentifikasi tipe data, dan memahami distribusi Selain itu, penulis juga akan melihat hubungan antar-variabel melalui perhitungan korelasi dan visualisasi grafik.
Dalam proses ini, penulis akan mencari pola, anomali, atau kekurangan data yang perlu diperhatikan.
Data understanding dan EDA ini penting untuk memvalidasi asumsi yang mendasari model klasifikasi yang akan dibangun.
Dengan memahami karakteristik data secara menyeluruh, penulis dapat membuat keputusan yang lebih baik dalam pemilihan fitur, penanganan data yang hilang, dan pemilihan metode klasifikasi yang sesuai.
Selanjutnya, penulis akan menggunakan berbagai diagram dan visualisasi data seperti histogram, scatter plot, dan box plot untuk mempresentasikan temuan secara jelas dan terstruktur.
ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
dimulai dari 0 bulan hingga 60 bulan.
Melihat dari diagram yang ditunjukan memberikan informasi umur terendah pada data adalah 1 bulan sedangkan umur tertinggi adalah 59 bulan.
Pada data tersebut juga menunjukan rata-rata umur balita yang terdapat di Puskesmas Jatilawang adalah 33 bulan.
Umur 40 bulan pada data menjadi jumlah balita paling banyak, seangkan umur 1 bulan adalah data paling sedikit pada dataset di Puskesmas Jatilawang.
Gambar 5.
Distribusi Berat Badan Gambar 5 menunjukan gambar diagram distribusi berat badan balita, dapat dilihat bahwa distribusi berat badan balita cenderung mengikuti pola Pada sumbu x, terdapat rentang berat badan balita yang dibagi menjadi beberapa kategori.
Pada sumbu y, terdapat frekuensi atau jumlah balita yang masuk dalam setiap kategori berat badan.
Dari gambar tersebut, terlihat bahwa sebagian besar balita memiliki berat badan yang berada di sekitar nilai rata-rata, ditandai dengan puncak yang lebih tinggi pada kategori Terdapat juga beberapa balita yang memiliki berat badan di luar rentang normal, ditandai dengan ekor yang lebih panjang pada kedua ujung diagram.
Informasi ini memberikan gambaran tentang sebaran berat badan balita dalam populasi yang diamati.
Dengan memahami distribusi berat badan balita, kita dapat mengidentifikasi potensi masalah gizi dan memperoleh wawasan yang berguna dalam upaya meningkatkan kesehatan dan pertumbuhan balita secara keseluruhan.
Gambar 4.
Distribusi Umur Gambar 4 menunjukan informasi distribusi umur balita pada dataset.
Umur balita pada dataset ini Gambar 6.
Distribusi Panjang Badan Balita Halaman 269 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
Pada gambar 6 menunjukan gambar diagram distribusi panjang badan balita, terlihat bahwa persebaran panjang badan balita memiliki pola yang menunjukkan persebaran negatif atau lebih tinggi di bagian kanan.
Pada sumbu x, terdapat rentang panjang badan balita yang dibagi menjadi beberapa kategori.
Pada sumbu y, terdapat frekuensi atau jumlah balita yang masuk dalam setiap kategori panjang badan.
Dalam gambar tersebut, terlihat bahwa sebagian besar balita memiliki panjang badan yang berada di sekitar nilai rata-rata atau di bagian kiri diagram.
Namun, terdapat juga sejumlah balita yang memiliki panjang badan yang lebih tinggi, ditandai dengan ekor yang lebih panjang di bagian kanan diagram.
Informasi ini memberikan gambaran tentang distribusi panjang badan balita dalam populasi yang diamati.
Gambar 7.
Pendidikan Orang Tua Pada gambar 7 menampilkan diagram lingkaran pendidikan ayah dan ibu balita, terlihat persebaran pendidikan orang tua dalam persentase.
Untuk pendidikan ayah, terdapat 1,2% yang tidak sekolah.
ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
24,0% lulusan SD, 39,3% lulusan SMP, 31,6% lulusan SMA, dan 3,9% lulus perguruan tinggi.
Sedangkan untuk pendidikan ibu, terlihat 0,4% tidak sekolah, 23,3% lulusan SD, 40,8% lulusan SMP, 29,1% lulusan SMA, dan 6,5% lulus perguruan tinggi.
Dari gambar tersebut, dapat dilihat bahwa sebagian besar ayah dan ibu balita memiliki pendidikan setidaknya hingga tingkat SMP.
Persentase tertinggi terletak pada kategori lulus SMP, diikuti oleh lulus SMA.
Terdapat perbedaan antara tingkat pendidikan ayah dan ibu balita, dengan persentase ibu yang lulus perguruan tinggi sedikit lebih tinggi daripada ayah.
Informasi ini memberikan gambaran tentang tingkat pendidikan orang tua balita dalam populasi yang diamati, yang dapat menjadi faktor penting dalam memahami konteks sosial dan pendidikan yang mempengaruhi pertumbuhan dan perkembangan balita.
Data Preparation Dalam penelitian ini, peneliti berfokus pada klasifikasi risiko stunting pada balita, memulai dengan tahap data preparation yang kritis.
Tahap pertama adalah menangani missing data atau data yang tidak lengkap, yang penting untuk memastikan kebersihan dan keakuratan dataset.
Peneliti menggunakan teknik menghapus data yang kosong karena terlalu banyak data yang kosong.
Setelah memastikan dataset lengkap, peneliti melanjutkan dengan proses feature selection.
Tujuannya adalah memilih fitur-fitur yang paling relevan dan signifikan dalam memprediksi risiko Dengan menggunakan metode statistik atau algoritma tertentu, peneliti dapat mengidentifikasi fitur-fitur yang tidak penting atau redundan.
Proses ini membantu meningkatkan efisiensi model, mengurangi dimensionalitas dataset, meningkatkan kecepatan komputasi, dan mengurangi risiko overfitting.
Langkah terakhir dalam data preparation adalah data splitting, dengan pembagian 20:80.
Sebanyak 20% dari dataset digunakan sebagai data testing, sedangkan 80% digunakan sebagai data Pembagian ini penting untuk memastikan evaluasi model yang akurat.
Data training digunakan untuk melatih model, sedangkan data testing digunakan untuk mengukur performa model dalam memprediksi risiko stunting.
Dengan pembagian ini, peneliti dapat memastikan bahwa model yang dihasilkan memiliki kemampuan generalisasi yang baik dan memberikan prediksi yang akurat pada data baru.
Halaman 270 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
Modeling SVM (Support Vector Machin.
Tabel 3.
Cross-validation SVM
Metric
CV1
CV2
CV3
CV4
CV5
AVG
Acc
Prec
Rec
AVG
ACC
Nayve Bayes Tabel 4.
Cross-Validation Nayve Bayes CV2
CV3
CV4
CV5
AVG
Acc Prec Rec cross validation dengan nilai k=5 menunjukkan bahwa model KNN memiliki performa yang baik, dengan ratarata nilai akurasi sebesar 0.
Selain itu, nilai precision, recall, dan f1-score yang dicapai adalah 86, 0.
64, dan 0.
Pada penelitian ini, model SVM (Support Vector Machin.
digunakan untuk memprediksi risiko stunting pada balita.
Model ini dipilih karena kemampuannya yang baik dalam memisahkan data dengan margin yang maksimal.
Tabel menunjukan hasil dari k-fold cross validation dengan nilai k=10 menunjukkan bahwa model SVM memiliki akurasi yang konsisten dan cukup tinggi.
Rata-rata nilai akurasi yang dicapai adalah 0.
90, dengan nilai precision, recall, dan f1-score masing-masing sebesar 0.
95, 0.
Metric CV1 ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
AVG
ACC
Evaluation Berdasarkan hasil modeling tiga model yang digunakan untuk memprediksi risiko stunting pada balita, evaluasi dari SVM menunjukkan performa terbaik dengan akurasi rata-rata 0.
90, precision 0.
69, dan f1-score 0.
Model ini menunjukkan kemampuannya dalam memisahkan data dengan margin yang maksimal.
Namun, recall yang relatif lebih rendah menunjukkan adanya potensi kasus positif yang terlewatkan.
Model Naive Bayes juga menunjukkan performa yang cukup baik dengan akurasi rata-rata 0.
85, precision 0.
74, recall 0.
77, dan f1-score 0.
74, meskipun terdapat beberapa variabilitas ketidakkonsistenan dalam subset data tertentu.
Model KNN, dengan akurasi rata-rata 0.
87, precision 0.
64, dan f1-score 0.
73, menunjukkan kemampuan yang baik dalam menangani variasi data, namun juga memiliki kekurangan pada aspek recall.
Model Naive Bayes juga diaplikasikan dalam penelitian ini untuk memprediksi risiko stunting pada Model ini terkenal dengan pendekatannya yang sederhana namun efektif, terutama dalam menangani dataset yang berukuran besar dan beragam.
Hasil k-fold cross validation dengan k=5 menunjukkan bahwa model Naive Bayes memiliki akurasi yang memadai, dengan rata-rata nilai akurasi sebesar 0.
Nilai precision, recall, dan f1-score yang dihasilkan oleh model ini adalah 0.
74, 0.
77, dan 0.
74 secara berturutturut.
K-Nearest Neighbors (KNN) Tabel 5.
Cross-Validation KNN
Metric
CV1
CV2
CV3
CV4
CV5
AVG
Acc
Prec
Rec
AVG
ACC
Dalam penelitian ini, model K-Nearest Neighbors (KNN) digunakan untuk memprediksi risiko stunting pada balita dengan mempertimbangkan kedekatan antar data.
KNN dipilih karena keunggulannya dalam menangani data non-linear dan sederhana dalam implementasinya.
Hasil dari k-fold
ACC
PREC
REC
SVM
Nayve Bayes KNN Gambar 8.
Diagram Evaluasi Stabilitas performa model SVM terlihat dari distribusi nilai evaluasi pada setiap lipatan, menunjukkan konsistensi yang baik dalam prediksi.
Naive Bayes, meskipun sederhana, efektif dalam menangani dataset yang beragam tetapi memerlukan perbaikan untuk meningkatkan konsistensinya.
KNN,
dengan kemampuan menangani data non-linear, menunjukkan variabilitas hasil yang menandakan perlunya tuning parameter lebih lanjut.
Berdasarkan hasil evaluasi ini, model SVM dapat dianggap sebagai model yang paling andal untuk mendeteksi risiko stunting pada balita, mendukung upaya pencegahan yang lebih efektif.
Namun, setiap model memiliki kelebihan yang dapat diintegrasikan untuk Halaman 271 METHOMIKA: Jurnal Manajemen Informatika & Komputerisasi Akuntansi Vol.
8 No.
2 (Oktober 2.
menciptakan pendekatan yang lebih komprehensif dalam pencegahan stunting.
Deployment Setelah melalui evaluasi menyeluruh, model SVM terbukti menjadi model terbaik dalam memprediksi risiko stunting pada balita dibandingkan dengan KNN dan Naive Bayes.
Dengan mempertimbangkan hasil akurasi, precision, recall, dan f1-score, model SVM dipilih untuk di-deploy agar dapat digunakan dalam aplikasi nyata.
Untuk tujuan ini, peneliti menggunakan Flask, sebuah framework web ringan yang memungkinkan pembuatan aplikasi web berbasis Python dengan cepat dan mudah.
Model SVM diintegrasikan ke dalam aplikasi Flask, yang menyediakan antarmuka web yang dapat diakses oleh pengguna untuk memprediksi risiko stunting berdasarkan input data yang relevan.
Gambar 9.
Web Prediksi Risiko Stunting pada Balita Aplikasi web yang dihasilkan memiliki tampilan yang intuitif dan user-friendly.
Pengguna dapat memasukkan data balita seperti jenis kelamin, umur, berat badan, panjang badan, lingkar lengan, serta informasi tambahan terkait pendidikan orang tua dan kondisi lingkungan.
Setelah data dimasukkan, aplikasi akan mengirimkan data tersebut ke model SVM untuk diproses dan mengembalikan prediksi risiko stunting.
Hasil prediksi ditampilkan secara langsung pada halaman web, memberikan informasi yang jelas dan mudah dipahami.
Implementasi ini diharapkan dapat membantu tenaga kesehatan dan pembuat kebijakan dalam mengambil keputusan yang lebih tepat dan cepat dalam upaya pencegahan stunting.
Gambar 9 di atas ini menunjukkan tampilan antarmuka web yang sudah jadi, menggambarkan kemudahan penggunaan dan efektivitas sistem yang telah dikembangkan.
ISSN: 2598-8565 .
edia ceta.
ISSN: 2620-4339 .
edia onlin.
KESIMPULAN Penelitian ini bertujuan untuk mengkomparasi tiga algoritma klasifikasi yaitu Naive Bayes.
K-Nearest Neighbor (KNN), dan Support Vector Machine (SVM) dalam mengklasifikasikan status berisiko stunting pada anak usia bawah lima tahun.
Hasil evaluasi menunjukkan bahwa SVM memiliki performa terbaik dibandingkan dengan Naive Bayes dan KNN.
SVM
mencapai rata-rata akurasi 0.
90, dengan precision 0.
69, dan f1-score 0.
Performa yang konsisten dan akurasi yang tinggi menjadikan SVM sebagai model yang paling andal untuk mendeteksi risiko stunting pada balita.
Selain itu, implementasi model SVM dalam bentuk aplikasi web menggunakan Flask telah dilakukan sebagai langkah lanjutan dari penelitian ini.
Aplikasi web tersebut memungkinkan pengguna untuk memasukkan data balita dan mendapatkan prediksi risiko stunting secara langsung.
Dengan antarmuka yang user-friendly, aplikasi ini diharapkan dapat membantu tenaga kesehatan dalam mengidentifikasi balita yang berisiko stunting dengan cepat dan akurat.
Penggunaan teknologi ini tidak hanya meningkatkan efisiensi kerja, tetapi juga menyediakan alat bantu yang sangat diperlukan dalam upaya pencegahan stunting.
DAFTAR PUSTAKA