Artikel Sistem Pendukung Keputusan untuk Klasifikasi Risiko Diabetes Menggunakan Algoritma Decision Tree Hafizah Zuriyat Tayyibah1*.
Toat Tuloh1.
Khoirun Nisa1.
Glagah Eskacakra Setyowisnu2.
Rosyid Ridlo Al-Hakim3.
Esa Rinjani Cantika Putri4 1Program Studi Informatika.
Universitas Harapan Bangsa.
Purwokerto.
Indonesia 2Program Studi Matematika.
Universitas Jenderal Soedirman.
Purwokerto.
Indonesia 3Program Studi Sistem Informasi.
Universitas Harapan Bangsa.
Purwokerto.
Indonesia 4Program Studi Kearsipan.
Universitas Terbuka.
Tangerang.
Indonesia * Korespondensi: hafizah.
zuriyat@student.
Abstrak: Diabetes melitus merupakan penyakit metabolik kronis yang memerlukan diagnosis dini untuk mencegah komplikasi serius.
Penelitian ini bertujuan untuk membangun model klasifikasi risiko diabetes menggunakan algoritma Decision Tree berdasarkan dataset dari Kaggle yang terdiri dari 520 data pasien dengan 17 fitur klinis dan demografis, yang mana dapat dimanfaatkan oleh dokter spesialis endokrinologi dalam melakukan pemeriksaan.
Hasil evaluasi menunjukkan bahwa model yang dikembangkan memiliki performa Capaian ini menjadikan model lebih unggul dibanding enam penelitian terdahulu yang menggunakan algoritma seperti C4.
SVM,
Adaboost.
KNN, dan Nayve Bayes, baik dari segi akurasi maupun sensitivitas deteksi terhadap kasus diabetes.
Selain hasil metrik yang tinggi, penelitian ini juga menonjol dalam aspek interpretabilitas melalui visualisasi pohon keputusan yang mempermudah pemahaman logika klasifikasi oleh tenaga medis.
Dengan cakupan atribut yang lebih luas dan evaluasi performa yang komprehensif, model ini dinilai efektif dan layak digunakan sebagai dasar pengembangan sistem pendukung keputusan untuk diagnosis dini diabetes yang akurat dan transparan.
Received: 1 Juli 2025 Revised: 30 Juli 2022 Accepted: 17 Agustus 2025 Published: 19 Agustus 2025 Copyright: A 2025 by the authors.
License Universitas Harapan Bangsa.
Purwokerto.
Indonesia.
This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license.
Kata Kunci: sistem pendukung keputusan.
decision tree.
KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Page 10 of 19 Pendahuluan Diabetes mellitus (DM) merupakan penyakit metabolik kronis yang prevalensinya meningkat secara global, dengan dampak yang signifikan terhadap kualitas hidup dan beban biaya kesehatan masyarakat (Camerlingo et , 2022.
Ratre et al.
, 2.
Penyakit ini disebabkan oleh gangguan pada sistem produksi atau respons tubuh terhadap insulin, yang mengakibatkan tingginya kadar glukosa dalam darah (Hardianto, 2.
Jika tidak ditangani dengan tepat, kondisi ini dapat menimbulkan komplikasi serius seperti penyakit jantung koroner, gagal ginjal, neuropati, dan kebutaan (Sriyati, 2.
Oleh karena itu, diagnosis dini sangat penting dilakukan untuk memungkinkan intervensi medis lebih awal guna mencegah dampak jangka panjang.
Seiring perkembangan teknologi, metode berbasis kecerdasan buatan seperti machine learning dan sistem pendukung keputusan (SPK) telah banyak dimanfaatkan dalam diagnosis penyakit, termasuk diabetes (Fadhillah et al.
, 2.
Salah satu algoritma yang populer dan banyak digunakan adalah Decision Tree, karena menghasilkan struktur model berbentuk pohon keputusan yang mudah dipahami dan diinterpretasikan, bahkan oleh tenaga medis non-teknis (Charbuty & Abdulazeez, 2021.
Thakur et al.
, 2.
Berbagai studi sebelumnya telah mengevaluasi efektivitas metode klasifikasi dalam mendeteksi diabetes.
Misalnya, (Fadhillah et al.
, 2.
menerapkan algoritma C4.
5 dan berhasil mencapai akurasi sebesar 76%, lebih tinggi dibanding algoritma SVM yang hanya mencapai 70% pada dataset Pima Indians Diabetes.
Sementara itu, (Nurussakinah & Faisal, 2.
menggunakan algoritma Decision Tree dan memperoleh nilai precision sebesar 78, recall 0.
45, dan F1-score 0.
57, yang menunjukkan bahwa masih ada kelemahan model dalam mendeteksi kasus diabetes positif secara sensitif.
Di sisi lain.
Adaboost classifier yang dikembangkan oleh (Abdurrahman, 2.
menunjukkan hasil yang cukup tinggi dengan akurasi 80.
09% setelah proses imputasi data dengan metode mean, meskipun performanya sensitif terhadap nilai kosong .
issing value.
(Mucholladin et al.
, 2.
mengimplementasikan dua model Support Vector Machine (SVM), yaitu model benchmark dan model scratch, dengan akurasi masing-masing 87% dan 78%, serta recall model terbaik mencapai 78%.
Selain itu, (Indrayanti et al.
, 2.
mengoptimalkan nilai K dalam algoritma K-Nearest Neighbor dan menemukan nilai optimal pada K=13 yang menghasilkan akurasi 75.
sedangkan (Ridwan, 2.
melaporkan bahwa Nayve Bayes mampu mencapai akurasi 90.
20% dan AUC 0.
95 dalam mendeteksi risiko diabetes pada fase awal.
Melanjutkan hasil-hasil penelitian tersebut, studi ini bertujuan untuk mengembangkan model klasifikasi diabetes menggunakan algoritma Decision Tree dengan memperluas cakupan atribut, serta mengevaluasi kinerja model secara komprehensif menggunakan metrik akurasi, precision, recall, f1-score, dan confusion matrix.
Dataset yang digunakan dalam penelitian ini berasal dari platform Kaggle dan memuat 520 data pasien dengan 17 fitur yang mencakup faktor demografis dan gejala klinis.
Selain menekankan pada akurasi model, penelitian ini juga menitikberatkan pada interpretabilitas hasil klasifikasi melalui visualisasi pohon keputusan.
Visualisasi ini diharapkan dapat membantu tenaga medis untuk memahami logika pengambilan keputusan yang dihasilkan oleh model, sehingga dapat menjadi dasar pertimbangan dalam proses diagnosis.
Dengan pendekatan yang lebih menyeluruh dan berbasis data global, penelitian ini diharapkan dapat memberikan kontribusi dalam pengembangan sistem pendukung keputusan yang akurat, transparan, dan aplikatif dalam lingkungan klinis untuk diagnosis dini penyakit diabetes.
Pemilihan algoritma Decision Tree dalam penelitian ini didasarkan pada kelebihannya dalam menangani fitur campuran KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Page 11 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 .
umerik dan kategorika.
, kemudahan interpretasi hasil, serta kemampuannya dalam mengidentifikasi aturan klasifikasi secara eksplisit tanpa memerlukan transformasi data kompleks.
Dibandingkan algoritma lain seperti SVM atau Neural Network.
Decision Tree lebih ringan secara komputasi dan cocok digunakan untuk aplikasi berbasis sistem pendukung keputusan yang memerlukan transparansi dan penelusuran logika keputusan.
Metode Penelitian Penelitian ini menggunakan pendekatan kuantitatif dengan metode eksperimen berbasis machine learning, yaitu algoritma Decision Tree, untuk membangun sistem pendukung keputusan dalam klasifikasi risiko diabetes.
Penelitian ini terdiri dari lima tahap utama sebagaimana ditunjukkan pada Gambar 1.
Pengumpulan Data Pra-pemrosesan Data Pembentukan Model Decision Tree Evaluasi dan Validasi Model Visualisasi Pohon Keputusan Gambar 1.
Metode Penelitian Pengumpulan Data Data yang digunakan pada penelitian ini diperoleh dari dataset publik AuDiabetes Risk PredictionAy oleh Himanshu di platform Kaggle .
ttps://w.
com/datasets/rcratos/diabetes-risk-predictio.
, yang berisi 520 entri data pasien.
Masing-masing entri memuat 17 atribut, yang mencakup faktor demografis seperti usia dan jenis kelamin, serta gejala klinis seperti polyuria, polydipsia, sudden weight loss, dan delayed healing.
Data ini bersifat anonim dan tidak mengandung informasi identitas pribadi, sehingga aman untuk digunakan sebagai bahan analisis (Sadiq et al.
, 2.
Keputusan untuk menggunakan dataset ini didasarkan pada kebutuhan akan data dengan variabel yang beragam dan representatif secara klinis.
Hal ini cukup penting agar model dapat belajar dari variasi faktor risiko yang lebih luas, yang mana akan menghasilkan klasifikasi yang lebih akurat dan mendekati kondisi nyata.
Tabel 1.
Atribut Dataset Atribut Age Gender KORISA 2025.
Page 9-19.
Deskripsi Usia individu Jenis kelamin Nilai Angka .
isal: 25, .
Male.
Female https://ejournal.
id/index.
php/korisa Page 12 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Polyuria Polydipsia Sudden weight loss Weakness Polyphagia Genital thrush Visual blurring Itching Irritability Delayed healing Partial paresis Muscle stiffness Alopecia Obesity Class Sering buang air kecil Sering merasa haus Penurunan berat badan tiba-tiba Tubuh terasa lemah Lapar berlebihan Infeksi jamur di area genital Penglihatan kabur Gatal-gatal Mudah marah / tersinggung Luka sulit sembuh Kelumpuhan sebagian Kekakuan otot Rambut rontok Kegemukan / obesitas Kelas Positif dan Negatif Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No Yes.
No 1, 0 Pra-pemrosesan Data Sebelum dilakukan pelatihan model, data terlebih dahulu melalui tahap pra-pemrosesan guna memastikan bahwa seluruh variabel berada dalam format yang sesuai untuk diolah oleh algoritma klasifikasi.
Tahap ini memastikan data siap diproses mesin tanpa kehilangan makna dari atribut.
Salah satu tahap awal dalam pra-pemrosesan data ini adalah mengubah nilai pada kolom 'class' dari format string ('Negative' dan 'Positive') menjadi nilai numerik .
menggunakan fungsi .
map().
Konversi tersebut diperlukan agar kompatibel dengan algoritma sklearn.
Setelah konversi, dilakukan pengecekan distribusi kelas menggunakan fungsi .
value_counts() untuk melihat apakah jumlah data pada masing-masing kelas relatif seimbang.
Kedua langkah ini penting untuk memastikan integritas data sebelum masuk ke tahap pelatihan model.
Proses lengkap dari konversi dan analisis distribusi kelas tersebut dapat dilihat pada Gambar 2.
Gambar 2.
Pengubahan Label Target Setelah memastikan bahwa label target telah dikonversi ke dalam format numerik dan distribusinya seimbang, tahap selanjutnya adalah melakukan encoding pada fitur-fitur kategorikal.
Semua fitur bertipe kategorikal seperti Polyuria.
Polydipsia.
Itching, dan Polyphagia diubah ke dalam bentuk numerik menggunakan teknik one-hot encoding, sebagaimana juga diterapkan oleh (Charbuty & Abdulazeez, 2.
Teknik ini digunakan agar nilai-nilai kategorikal dapat direpresentasikan secara numerik tanpa mengasumsikan urutan atau bobot antar kategori, sehingga lebih sesuai untuk algoritma seperti Decision Tree.
Hasil dari proses one-hot encoding ditunjukkan pada Gambar 3.
KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Page 13 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Gambar 3.
Hasil Encoding pada Fitur Kategorikal Langkah selanjutnya setelah proses one-hot encoding selesai dan seluruh fitur berada dalam format numerik adalah membagi dataset menjadi dua bagian, yaitu data latih dan data uji.
Pembagian dilakukan menggunakan fungsi train_test_split dari pustaka Scikit-learn dengan rasio 80:20 dan parameter random_state=42 untuk memastikan hasil yang konsisten di setiap eksekusi.
Dari total 520 data pasien, sebanyak 416 data digunakan sebagai data latih, sedangkan 104 data sisanya digunakan sebagai data uji.
Pemisahan ini penting untuk memastikan bahwa model hanya belajar dari data latih dan dievaluasi menggunakan data yang belum pernah dilihat sebelumnya, sehingga performa model dapat diukur secara objektif dan risiko overfitting dapat Pembentukan Model Decision Tree Model klasifikasi dibentuk menggunakan algoritma Decision Tree Classifier dari pustaka sklearn.
Model ini dipilih karena kemampuannya dalam menghasilkan aturan klasifikasi yang mudah dipahami dan efektif untuk data dengan tipe campuran, baik numerik maupun kategorikal (Charbuty & Abdulazeez, 2021.
Nurussakinah & Faisal, 2.
Dalam implementasi ini, model dibuat menggunakan parameter default dengan nilai random_state=42 untuk memastikan reprodusibilitas hasil pelatihan.
Pemilihan fitur terbaik pada setiap node dalam pohon dilakukan secara otomatis berdasarkan kriteria pemisahan Gini Impurity, yang merupakan metode default di Scikit-learn.
Kriteria ini juga relatif lebih efisien secara komputasi, terutama jika diterapkan pada dataset dengan 17 atribut.
Rumus untuk menghitung Gini Impurity pada suatu node dijelaskan pada Persamaan .
= 1 Oe *!$% ycy!" .
Keterangan:
: nilai impurity pada node yc yca : jumlah kelas ycy! : proporsi data dari kelas ke-ycn pada node tersebut Semakin kecil nilai Gini, semakin baik suatu atribut dalam memisahkan data ke dalam kelas-kelas target.
Proses pelatihan dilakukan pada data latih menggunakan perintah model.
fit(X_train, y_trai.
, sedangkan hasil prediksi model kemudian dievaluasi menggunakan data uji.
Evaluasi dan Validasi Model Evaluasi performa model dilakukan untuk mengukur sejauh mana algoritma Decision Tree mampu mengklasifikasikan risiko diabetes dengan benar terhadap data uji.
Proses evaluasi dimulai dengan melakukan prediksi menggunakan model.
predict(X_tes.
, yang hasilnya disimpan dalam variabel y_pred.
Selanjutnya, hasil prediksi dibandingkan dengan data aktual .
_tes.
menggunakan fungsi KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Page 14 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 accuracy_score, classification_report, dan confusion_matrix dari pustaka Scikit-learn.
Evaluasi ini menghasilkan empat metrik utama, yaitu akurasi, precision, recall, dan f1-score, yang masing-masing menggambarkan aspek berbeda dari performa model.
Akurasi mengukur proporsi prediksi yang benar dari seluruh data, dirumuskan pada Persamaan .
&'(&)
yaycaycaycycycaycayc = &'(&)(*'(*) .
Precision mengukur ketepatan model dalam mengklasifikasikan kelas positif (Persamaan .
ycEycyceycaycnycycnycuycu = &'(*' .
Recall mengukur seberapa banyak data positif yang berhasil terdeteksi (Persamaan .
ycIyceycaycaycoyco = &'(*) .
F1-score merupakan harmonisasi antara precision dan recall (Persamaan .
' ,#!-!.
/y1,#233 ya1 = 2 y ' ,#!-!.
,#233
Keterangan:
TP (True Positiv.
: jumlah kasus positif yang diprediksi benar.
TN (True Negativ.
: jumlah kasus negatif yang diprediksi benar.
FP (False Positiv.
: jumlah kasus negatif yang salah diprediksi sebagai positif oleh model.
FN (False Negativ.
: jumlah kasus positif yang salah diprediksi sebagai negatif oleh model.
Keempat metrik ini ditampilkan secara otomatis melalui classification_report.
_test, y_pre.
dalam format tabel.
Selain itu, untuk visualisasi hasil klasifikasi, confusion matrix divisualisasikan menggunakan fungsi heatmap() dari pustaka Seaborn.
Melalui confusion matrix ini, pengguna dapat dengan jelas melihat jumlah prediksi benar dan salah untuk masing-masing kelas, sehingga evaluasi model tidak hanya bersifat numerik, tetapi juga visual dan interpretatif.
Visualisasi Pohon Keputusan Langkah terakhir dari metode ini adalah memvisualisasikan struktur pohon keputusan yang telah dilatih menggunakan fungsi plot_tree() dari pustaka Scikit-learn.
Visualisasi ini bertujuan untuk memberikan interpretasi terhadap alur logika klasifikasi yang dibentuk oleh model, sehingga hasil klasifikasi tidak hanya menjadi keluaran numerik, tetapi juga dapat dipahami oleh praktisi kesehatan yang memerlukan transparansi dalam proses pengambilan keputusan.
Pendekatan visual seperti ini telah digunakan dalam studi oleh (Fadhillah et al.
, 2.
, yang menunjukkan bahwa model yang bersifat interpretable dapat meningkatkan kepercayaan pengguna terhadap sistem berbasis kecerdasan buatan, terutama dalam aplikasi medis.
Lebih lanjut, pengguna dapat langsung menghubungkan hasil model dengan gejala klinis nyata.
Hasil dan Pembahasan Pra-pemrosesan Data KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Page 15 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Berikut adalah output dari perubahan nilai pada kolom 'class' dari format string ('Negative' dan 'Positive') menjadi nilai numerik .
beserta visualisasinya dalam bentuk diagram.
Gambar 4.
Visualisasi Distribusi Kelas Visualisasi distribusi kelas setelah konversi label target ke format numerik ditampilkan pada Gambar 4.
Diagram batang ini menunjukkan jumlah data pasien berdasarkan dua kategori utama, yaitu kelas Negative .
dan Positive .
, yang masing-masing merepresentasikan pasien non-diabetes dan pasien dengan risiko diabetes.
Dari gambar tersebut terlihat bahwa jumlah data pada kelas positif lebih tinggi, yaitu sekitar 320 pasien, sedangkan kelas negatif berjumlah sekitar 200 pasien.
Pelatihan dan Evaluasi Model Setelah dilakukan pelatihan dan evaluasi model Decision Tree pada data uji, diperoleh hasil klasifikasi yang menunjukkan performa cukup tinggi.
Model ini mampu melakukan klasifikasi risiko diabetes secara akurat dengan mempertimbangkan kombinasi dari berbagai fitur demografis dan gejala klinis.
Evaluasi model dalam penelitian ini dilakukan menggunakan empat metrik utama, yaitu akurasi, precision, recall, dan f1-score.
Seluruh metrik dihitung berdasarkan data uji sebanyak 104 data pasien.
Hasil evaluasi lengkap disajikan dalam Tabel 2 Tabel 2.
Hasil Evaluasi Model Decision Tree Kelas Negatif .
Positif .
Accuracy Macro Avg Weighted Avg KORISA 2025.
Page 9-19.
Precision Recall F1-Score Support https://ejournal.
id/index.
php/korisa Page 16 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Hasil pada Tabel 2 menunjukkan bahwa model memiliki akurasi keseluruhan sebesar 95,19% yang mana lebih tinggi dari penelitian-penelitian sebelumnya.
Kemudian diperoleh pula precision 1.
00 pada kelas positif, yang berarti tidak ada kasus negatif yang salah diklasifikasikan sebagai positif .
alse positive = .
Hal ini memberikan dampak di mana kesalahan diagnosis pada pasien sehat dapat dihindari.
Kemudian recall untuk kelas positif 93, yang berarti model berhasil mendeteksi sebagian besar pasien dengan diabetes secara akurat.
Lebih lanjut, nilai f1-score sebesar 0.
96 menunjukkan model yang digunakan sangat baik dalam klasifikasi, di mana hampir setiap prediksi yang dilakukan positif benar.
Hal ini menunjukkan bahwa model ini cocok diaplikasikan dalam bidang medis, khususnya diabetes.
Gambar 5.
Visualisasi Confusion Matrix Visualisasi dari Confusion Matrix pada Gambar 5 menunjukkan bahwa dari 71 data pasien yang benar-benar positif diabetes, sebanyak 66 berhasil diklasifikasikan dengan benar dan hanya 5 yang terklasifikasi salah sebagai Ini sangat penting dalam konteks medis, di mana kesalahan dalam mendeteksi pasien positif .
alse negativ.
dapat berakibat pada keterlambatan diagnosis dan penanganan klinis.
KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Page 17 of 19 Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Visualisasi Pohon Keputusan Gambar 6.
Visualisasi Pohon Keputusan Hasil visualisasi pohon keputusan yang ditampilkan pada Gambar 6 memperlihatkan struktur model dalam bentuk hierarki cabang yang menggambarkan proses pemisahan data berdasarkan fitur-fitur penting.
Pada bagian akar pohon, terlihat bahwa fitur seperti Polyuria_Yes dan Polydipsia_Yes menjadi pemisah utama, yang menandakan bahwa gejala sering buang air kecil dan rasa haus berlebih merupakan indikator awal yang sangat kuat dalam klasifikasi risiko diabetes.
Cabang-cabang selanjutnya menunjukkan kombinasi fitur-fitur lain seperti Itching.
Delayed healing.
Age, dan Gender, yang juga memainkan peran penting dalam keputusan Warna pada node digunakan untuk menunjukkan kelas mayoritas yang diprediksi pada setiap simpul.
Warna oranye mewakili kelas positif .
enderita diabete.
dan warna biru mewakili kelas negatif .
on-diabete.
Semakin gelap warnanya, semakin kuat dominasi kelas tersebut dalam node tersebut.
Setiap simpul juga dilengkapi dengan informasi seperti jumlah sampel .
, nilai Gini Impurity .
, dan distribusi kelas .
, yang dapat digunakan untuk menganalisis kontribusi masing-masing atribut secara lebih mendalam.
Dengan demikian, visualisasi ini tidak hanya meningkatkan interpretabilitas model, tetapi juga memberikan wawasan tambahan bagi praktisi medis dalam memahami korelasi antar gejala dan hasil diagnosis.
Namun demikian, model ini memiliki beberapa keterbatasan, seperti potensi overfitting apabila pohon terlalu dalam, serta ketergantungan terhadap distribusi data yang digunakan.
Distribusi data yang tidak seimbang antara kelas positif dan negatif juga dapat mempengaruhi sensitivitas model.
Oleh karena itu, pengembangan lebih lanjut perlu mempertimbangkan teknik pruning dan peningkatan generalisasi model agar hasil klasifikasi tetap andal pada data populasi berbeda.
KORISA 2025.
Page 9-19.
https://ejournal.
id/index.
php/korisa Jurnal Kolaborasi Riset Sarjana.
Vol.
2 No.
3 Tahun 2025 Page 18 of 19 Secara keseluruhan, hasil penelitian ini menunjukkan bahwa algoritma Decision Tree mampu menghasilkan klasifikasi yang akurat, sensitif, dan mudah diinterpretasikan, menjadikannya cocok untuk digunakan dalam sistem pendukung keputusan diagnosis dini diabetes.
Kelebihan lainnya adalah visualisasi pohon yang jelas, sehingga model ini dapat dijadikan alat bantu analisis oleh tenaga medis tanpa kehilangan transparansi logika Dengan performa yang lebih baik dibandingkan penelitian sebelumnya, model ini berpotensi untuk diintegrasikan dalam sistem klinis sebagai bagian dari alat skrining atau edukasi pasien berbasis data.
Kesimpulan Berdasarkan hasil evaluasi model, penelitian ini menunjukkan performa yang sangat baik dalam mengklasifikasikan risiko diabetes menggunakan algoritma Decision Tree.
Model yang dibangun berhasil mencapai akurasi sebesar 95,19%, dengan precision 1.
00, recall 0.
93, dan f1-score 0.
96 pada kelas positif .
enderita diabete.
Dibandingkan dengan enam penelitian terdahulu, model ini memiliki keunggulan yang (Fadhillah et al.
, 2.
melaporkan akurasi 76% dengan C4.
5, sementara (Nurussakinah & Faisal, 2.
memperoleh precision 0.
78 dan recall yang masih rendah sebesar 0.
Metode Adaboost oleh (Abdurrahman, 2.
menghasilkan akurasi 80.
09%, dan SVM oleh (Mucholladin et al.
, 2.
mencapai akurasi 87% dengan recall 0.
Selain itu, model KNN oleh (Indrayanti et al.
, 2.
dan Nayve Bayes oleh (Ridwan, 2.
masing-masing memperoleh akurasi 75.
14% dan 90.
Keunggulan utama dari penelitian ini terletak pada kombinasi akurasi tinggi, keseimbangan metrik precision dan recall, serta interpretabilitas model melalui visualisasi pohon keputusan.
Selain itu, penelitian ini menggunakan cakupan fitur yang lebih luas .
dibanding studi terdahulu yang umumnya hanya menggunakan 8Ae9 atribut, sehingga meningkatkan kekayaan informasi dalam proses klasifikasi.
Dengan demikian, model yang dikembangkan tidak hanya unggul secara kuantitatif, tetapi juga mendukung transparansi dan kemudahan interpretasi bagi tenaga medis.
Penelitian ini diharapkan dapat berkontribusi pada pengembangan sistem pendukung keputusan yang efektif dan akurat untuk diagnosis dini penyakit diabetes.
Langkah selanjutnya yang disarankan dari penelitian ini adalah pengembangan sistem pendukung keputusan (SPK) berbasis web atau desktop yang mengintegrasikan model klasifikasi ini ke dalam antarmuka pengguna interaktif.
Hal ini akan memungkinkan tenaga medis atau pasien untuk melakukan deteksi awal secara mandiri dengan interpretasi hasil yang mudah dipahami.
Selain itu, pengujian sistem pada data klinis nyata secara prospektif perlu dilakukan untuk validasi eksternal sebelum implementasi secara luas.
Referensi