JSI (Jurnal Sistem Informas. Universitas Dirgantara Marsekal Suryadarma p-ISSN: 2355-9675 e-ISSN: 2541-3228 Analisis Prediksi Penyakit Diabetes Menggunakan Metode Decision Tree C4. 5 Dan Naive Bayes Yamin Nuryamin1. Fitria Risyda2 yny@bsi. id, 2frisyda@gmail. Universitas Bina Sarana Informatika, 2Universitas Dirgantara Marsekal Suryadarma Article Info Article history: Received May 2, 2025 Accepted June 10, 2025 Published July 1, 2025 Kata Kunci: Diabetes Algoritma Prediksi Decision Tree Nayve Bayes Rapidminer ABSTRAK Diabetes melitus merupakan salah satu penyakit kronis yang prevalensinya terus meningkat di seluruh dunia. Di Indonesia sendiri penyakit diabetes melitus berada di urutan 3 . besar penyakit penyebab kematian tertinggi, sedangan di dunia Indonesia berada di urutan 5 . Deteksi dini dan prediksi penyakit ini sangat penting untuk mengurangi risiko komplikasi dan meningkatkan kualitas hidup penderita. Penelitian ini bertujuan untuk memprediksi penyakit diabetes melitus berdasarkan berbagai faktor resiko, untuk mengetahui cara implementasi metode diagnosa penyakit diabetes melitus dengan menggunakan metode Decision Tree dan Nayve Bayes. Dataset yang digunakan adalah dataset publik, dan diolah menggunakan metode algoritma. Perbandingan hasil penelitian penggunaan algoritma Decision Tree dan Nayve Bayes menunjukan tingkat akurasi pada algoritma Decision tree 70. 87 % dan Nayve Bayes dan 73. Data tersebut menunjukkan penggunaan algoritma nayve bayes lebih tinggi tingkat akurasi nilainya dibandingkan algoritmadecision tree. Corresponding Author: Fitria Risyda. Department of Information Management. Universitas Dirgantara Marsekal Suryadarma. Email: *frisyda@gmail. PENDAHULUAN Seiringan perubahan dalam pola hidup secara signifikan terhadap kehidupan, kemajuan teknologi, urbanisasi, dan perubahan sosial yang mebuat pola baru atau yang dikenal dengan gaya hidup modern, yang mengaplikasikan hal-hal baru yang lebih praktis, cepat dan efisien. Pola hidup modern saat ini yang dipermudah oleh kemajuan teknologi seperti gadget seperti komputer, smartphone, terlalu lama menatap layar gadget tersebut membuat tidak banyak melakukan pergerakan, dan membuat malas bergerak, menjadi kurang berolahraga, kebiasaan mengkonsumsi makanan yang mengandung tinggi kadar lemak, mengandung banyak takaran gula dalam minuman dan takaran garam masakan, ditambah kebiasaan merokok dan mengonsumsi minuman beralkohol, gaya hidup seperti itu mengakibatkan resistensi insulin dan kerusakan pangkreas yang dapat menyebabkan masalah kesehatan, salah satunya adalah diabetes melitus (Murtiningsih et al. , 2. Di Indonesia sendiri penyakit diabetes melitus berada di urutan 3 . besar penyakit tingkat kematian tertinggi, sedangan di dunia Indonesia berada di urutan 5 . besar (Fauzi et al. , 2. Data yang diperoleh pada tahun 2021 di seluruh dunia menunjukan bertambahnya jumlah penderita penyakit diabetes melitus sudah mencapai 537 juta jiwa berasal dari laporan International Diabetes Federation (IDF). Akan diprediksi terus meningkat hingga 643 juta jiwa pada tahun 2030 sedangkan diprediksi tahun 2045 bisa mencapai 783 juta jiwa. Menurut sumber dari International Diabetes Federation. Indonesia dengan banyaknya penderita penyakit diabetes melitus total 19,5 juta jiwa di 2021 sehingga mendapatkan peringkat 5 . negara dengan ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) jumlah diabetes melitus yang diperkirakan pada 2045 bisa mencapai 28,6 juta (Aschner et al. , 2. Diabetes melitus dapat AumelahirkanAy berbagai penyakit atau komplikasi penyakit lainnya. Berdasarkan data tersebut Kementerian Kesehatan Republik Indonesia, mengeluarkan Nomor 30 Tahun 2013 Peraturan Menteri Kesehatan tentang pencantuman Informasi kandungan jumlah gula, jumlah garam, dan kadar lemak serta pesan kesehatan untuk pangan siap saji dan pangan olahan. Peraturan ini bertujuan agar masyarakat mengetahui dan lebih peduli terhadap informasi yang dituliskan dalam label nilai gizi yang terkandung di sebuah makanan dan minuman(PERATURAN MENTERI KESEHATAN REPUBLIK INDONESIA, 2. Namun implementasinya di Indonesia banyak Masyarakat yang tidak melihat nilai gizi pada setiap kemasan produk yang dijual karena rendahnya minat baca Masyarakat dan dari sisi industri banyak yang mengubah nilai gizi pada kemasan karena lemahnya pengawasan dari pemerintah, sehingga banyak produk yang beredar di Masyarakat memiliki kadar gula yang sangat tinggi maupun kadar pengawet yang tinggi yang dapat merusak fungsi ginjal dan mengakibatkan komplikasi Kesehatan di masa depan. Diabetes melitus adalah gangguan metabolisme dikarenakan tidak mampunya organ pankreas untuk melakukan sekresi insulin(Bulu et al. , 2. Diabetes melitus terbagi menjadi 2 yaitu Diabetes melitus tipe 1 . dan tipe 2 . esistensi insuli. dan gestational(Lestari et al. , 2. Dalam hiperglikemik sudah kronis yang dapat menimbulkan ketidak berfungsinya beberapa organ dan kerusakan berkepanjangan seperti pembuluh darah, ginjal, mata, ginjal dan jantung(Campbell et al. Gejala penyakit diabetes melitus sering tanpa kita sadari karena tidak langsung kita rasakan sakitnya seperti poliuria . ering buang air keci. , polidipsi . aus berlebiha. , polifagi . apar teru. , dan penurunan berat badan(Lestari et al. , 2. Tanda penyakit diabetes melitus adalah tingginya glukosa dalam darah dan harus test pada laboratorium terlebih dahulu untuk mendapatkan hasil GDP. GD2PP. HbA1c, hasil HbA1c >6,5% mengindikasikan diabetes(Fauzi et al. , 2. Glukosa adalah sumber utama energi untuk sel didalam tubuh (Awaludin. Yasin, & Risyda, 2. Namun, pada penderita diabetes melitus, fungsi pankreas dalam hal ini yang mengatur produksi hormon insulin tidak dapat melakukan tugas produksi hormon insulin yang dibutuhkan oleh tubuh. Sehingga tanpa insulin yang cukup, sel tubuh tidak dapat bekerja dengan baik dalam memproses atau mengolah glukosa tersebut menjadi energi, sehingga glukosa berlebih tersebut menumpuk di dalam tubuh dan menyebabkan penyakit diabetes melitus. Diabetes melitus dipengaruhi oleh berbagai faktor, antara lain faktor genetik atau keturunan, tingginya kadar kolesterol, berat badan, perilaku kurang gerak atau olahraga, usia, tekanan darah tinggi, dan trigliserida(IP. SUIRAOKA, 2. 80% penderita diabetes tipe 2 mengalami obesitas (Kurniasari et al. , 2. Dalam mengatasi dan mencegah bertambahnya jumlah penderita, diperlukan deteksi dini mungkin untuk faktor penyebab penyakit diabetes melitus. Sehingga dapat dilakukan tindakan pencegahan terhadap penyakit diabetes melitus. Perlu sosialisasi yang lebih masif yang berkolaborasi dari pemerintah dan masyarakat yang biasa dilakukan di Posbindu (Fitriyani et al. , 2. agar lebih banyak orang yang mengetahui faktor-faktor penyebab dan bahayanya penyakit diabetes melitus tersebut, serta diperlukan cara untuk sebuah penyakit dapat diprediksi dengan memanfaatkan macammacam metode yang ada (Awaludin & Ridyustia Raveena, 2. Salah satunya yang digunakan adalah metode pengolahan data mining dengan prinsip klasifikasi yang bertujuan untuk menugaskan objek hanya ke salah satu kategori yang disebut kelas. Yang dimaksud dengan klasifikasi adalah sebuah proses pengidentifikasian obyek ke dalam sebuah kategori, kelompok kelas berdasarkan dari prosedur, dan karakteristik yang telah ditentukan sebelumnya. Selain metode klasifikasi dapat dilakukan juga menggunakan teknik clustering dalam proses pengelompokkan obyek (Nur Khomarudin, 2. Untuk memprediksi diabetes melitus dapat menggunakan beberapa metode algoritma. Algoritma Decision Tree dan Nayve bayes penulis pilih karena keduanya memiliki kelebihan dalam klasifikasi data dan interpretasi hasil yang baik. Decision Tree mampu menangani data dengan atribut numerik maupun kategorikal, serta memberikan visualisasi pohon keputusan yang mudah dipahami(Nursyahfitri et al. , n. Sementara itu, algoritma Nayve Bayes memiliki keunggulan dalam kecepatan komputasi dan efektivitas pada dataset berukuran besar, serta cocok untuk data yang memiliki asumsi independensi antar fitur (Awaludin & Gani, 2. (Zhafira et al. , 2. Oleh karena itu, kedua algoritma ini dinilai sesuai untuk digunakan dalam pemodelan prediksi penyakit diabetes berdasarkan data klinis pasien. Dataset pada penelitian ini diperoleh dari situs web Kaggle. Selanjutnya penelitian ini akan membandingkan algoritma Decision Tree dan Nayve Bayes untuk untuk memprediksi penyakit diabetes melitus dan melihat mana Tingkat akurasi yang lebih baik. ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) METODE Dalam penelitian ini menggunakan metode kuantitatif. Bertujuan untuk memprediksi dan mengevaluasi dari algoritma Decision Tree dan Nayve Bayes untuk mengetahui keakuratan dalam prediksi penyakit diabetes melitus. 1 Tahapan Penelitian Penelitian menggambarkan sebuah proses dalam melakukan penelitian. Tahapan ini bertujuan untuk dapat dipastikan bahwa setiap proses dalam penelitian dilakukan dengan secara tanpa menemui kesalahan, sistematis atau proses yang berulang-ulang. Tahapan penelitian ditunjukan pada gambar dibawah ini. Mulai Pengumpulan Data Preprocesing Data Eksperimen dan pengujian Algoritma C45 Desicion Tree Evaluasi dan validasi hasil Selesai Gambar 1. Tahapan Penelitian Pengumpulan Data Pengumpulan data pada penelitian dengan mempergunakan dataset diabetes melitus di website Kaggle dengan mendapatkan 769 data yang terdiri terdiri dari beberapa fitur atau atribut yang relevan dengan risiko diabetes, seperti Pregnancies. Glucose . Blood Pressure . Skin Thickness. Insulin. BMI (Body Mass Inde. Diabetes Pedigree Function. Age. Dalam kombinasi, parameter-parameter ini membantu dalam mengevaluasi risiko seseorang terkena diabetes dengan memberikan gambaran yang lebih holistik tentang berbagai faktor yang berkontribusi terhadap perkembangan penyakit diabetes Dengan menggunakan algoritma atau model Decision Tree dapat mengintegrasikan semua informasi ini untuk memprediksi apakah seseorang memiliki risiko tinggi atau rendah terkena diabetes. dataset ini dapat di unduh : https://w. com/code/melikedilekci/diabetes-dataset-for-beginners . ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Gambar 2. Data Set Keseluruhan 3 Preprocessing Data Serangkaian teknik yang digunakan untuk menyiapkan data mentah yang berasal dari dataset untuk dianalisis. Langkah ini sangat penting karena kualitas dan struktur data sangat signifikan mempengaruhi kinerja algoritma data mining(Sirojul Munir et al. , 2. Pembersihan Data Pembersihan data meliputi identifikasi dan penanganan nilai-nilai yang hilang atau anomali. Nilai yang hilang dapat diisi . atau dihapus berdasarkan kebijakan tertentu. Identifikasi Nilai Hilang: Memeriksan apakah ada nilai yang hilang pada setiap fitur. Penanganan Nila Hilang: Mengisi nilai yang hilang dengan median atau mean untuk fitur numerik. Mengisi nilai yang hilang dengan modus untuk fitur kategorikal. Transformasi Data Transformasi data diperlukan untuk menyesuaikan skala atau distribusi data agar sesuai dengan asumsi model Decision Tree. Normalisasi: adalah mengubah nilai fitur ke dalam rentang . , . Standardisasi: mengubah nilai fitur menjadi pendistribusi dengan mean 0 dan standar Pembagian Data Pembagian data dilakukan untuk memisahkan data ke dalam pelatihan dan pengujian. Pelatihan digunakan untuk membangun model, sedangkan pengujian digunakan untuk mengevaluasi performa model. Pembagian Data ke Dalam Set Pelatihan dan Pengujian dengan rasio 70:30 Menggunakan dataset dan membandingkan dengan dataset yang lain. 4 Eksperimen dan Pengujian Algoritma Eksperimen dan pengujian yang dilakukan untuk mengevaluasi performa algoritma Decision Tree dan Nayve bayes dalam memprediksi penyakit diabetes melitus. Penggunaan metode algoritma Decision Tree dan Nayve bayes untuk prediksi penyakit diabetes melitus dalam aplikasi RapidMiner melibatkan beberapa langkah, mulai dari persiapan data hingga penerapan dan evaluasi model. Langkah-langkah dalam RapidMiner Berikut Langkah-langkahnya: ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Persiapan Data. Buka aplikasi RapidMiner dan buat proses baru. Import dataset ke RapidMiner. Mengatur peran kolom: Atur kolom AoOutcomeAo Set Role kolom Outcome sebagai label Tambahkan operator AoRead ExcelAo untuk mengimpor dataset diabetesnya. Tambahkan operator AoSplit DataAo untuk mengatur rasio pembagian data Training 70% dan data Testing 30%. Tambahkan operator AoDecision TreeAo atau AoNayve BayesAo untuk melatih model menggunakan data training. Tambahkan operator AoApply ModelAo untuk menerapkan model pada data testing. Tambahkan operator AoPerformance (Binomial Classificatio. Ao untuk mengevaluasi kinerja model berdasarkan prediksi dan label sebenarnya dari data testing, seperti akurasi, presisi, recall, dan F1-score. act Primary Use Cases Read Excel Split Data Training 70% Desicion tree Naiv e Bayes Apply Model Data Testing 30% Performance Gambar 3. Langkah-langkah RapidMiner Kinerja Accuracy Precision Recall Tabel 1 Metrik Kinerja Keterangan Proporsi prediksi yang benar dari semua Proporsi prediksi benar positif dari semua prediksi positif Proporsi prediksi benar positif dari semua kasus positif sebenarnya Evaluasi Dan Validasi Hasil Dari hasil tersebut akan dilakukan evaluasi model menunjukan performa Decision Tree dan Nayve Bayes dalam memprediksi penyakit diabetes berdasarkan dataset yang digunakan. Sehingga dapat dilihat beberapa kelebihan dan kekurangan dalam metode Decision Tree dan Nayve Bayes dalam memprediksi penyakit diabetes melitus. ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) HASIL DAN PEMBAHASAN Penelitian yang telah dilakukan untuk memprediksi penyakit diabetes melitus menggunakan algoritma Desision Tree dan Nayve Bayes. Hasil yang disajikan meliputi analisis data, hasil implementasi algoritma Desision Tree, dan evaluasi kinerja model. Data Training dan Data Testing Setelah melakukan persiapan data training berjumlah . %): 537 baris data record, langkah selanjutnya adalah melakukan persiapan data testing sebanyak . %): 231 baris. Data seperti terlihat pada gambar dibawah ini : Gambar 4. Split data training dan data testing Pengujian algoritma Decision Tree Hasil dari eksperimen algoritma Desision Tree menggunakan RapidMiner, dimana operator Read Excel digunakan untuk memanggil dataset diabetes melitus, sedangkan operator Split Data digunakan untuk membagi dataset menjadi 2 . jenis yaitu: data training 70% dan data testing 30%. Data training berfungsi untuk melatih model, sedangkan data testing untuk menguji model yang Gambar 5. Tahapan Import Dataset di RapidMiner Pada gambar 6 eksperimen menggunakan operator Decision Tree merupakan algoritma dari Desision Tree, sedangkan operator Apply Model digunakan untuk menerapkan rule model dari dataset testing menggunakan operator Desision Tree. Selanjutnnya tambahkan Apply Model dan Performance pada menu operator untuk mendapatkan hasil Akurasi dari metode Decision Tree ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Gambar 6. Operasi pada Rapid miner dengan model Decision Tree Gambar 7. Hasil Penggunan Algortma Decision Tree Gambar 8. Accuracy menggunakan decision tree Hasil pengujian yang telah dilakukan dengan menggunakan model Decision Tree memperoleh akurasi sebesar 70. 87 %, dengan classification_error: 29. 13% . Pada tabel dapat dilihat model memprediksi dengan benar sekitar 163 dari 230 kasus. Hasil ini cukup baik tapi dapat ditingkatkan dengan mentraining model dengan lebih banyak data sebagai data training dan data testing. Pengujian algoritma Nayve Bayers Hasil dari eksperimen algoritma Nayve Bayes menggunakan RapidMiner menghasilkan model seperti gambar 9. ISSN: 2355-9675 (PRINT), 2541-3228 (ON LINE) Gambar 9. Operasi pada Rapid miner dengan model Nayve Bayes Pada gambar 11 menunjukkan hasil pengujian yang telah dilakukan dengan menggunakan model Nayve Bayes memperoleh akurasi sebesar 73. 48 % dengan classification_error: 26. Model ini menghasilkan accuracy yang lebih tinggi dengan memprediksi nilai benar sebanyak 169 dari 230 Gambar 11. Accuracy menggunakan nayve bayes KESIMPULAN Penerapan algoritma Desision Tree dan Algoritma Nayve bayes untuk kasifikasi penyakit diabetes melitus menggunakan aplikasi Rapidminer, telah berhasil diimplementasikan. Proses ini melibatkan beberapa tahapan dalam memprediksi penyakit diabetes melitus, algoritma Nayve bayes menunjukkan nilai akurasi yang lebih tinggi sebesar 73. 48 % dibandingkan algoritma decision tree yang memiliki nilai akurasi sebesar 70. 87 %,. Hasil ini mengindikasikan bahwa pada data set kasus diabetes melitus ini, model Nayve bayes lebih efektif dalam memodelkan pola untuk melakukan prediksi dengan akurasi yang lebih baik dibandingkan algoritma decision tree. Model algoritma Decision Tree dan Nayve bayes memiliki kelebihan mudah dipahami, diimplementasikan, kesederhanaan dan kecepatan dalam melakukan prediksi. Namun memiliki kekurangan dalam keterbatasan dari algoritma independensi antar variabel yang tidak selalu sesuai dengan kondisi nyata, dan untuk mendapati hasil accuracy dengan hasil yang maksimal, harus dilakukan beberapa kali ujicoba dengan merubah proporsi data testing dan training. DAFTAR PUSTAKA