Jurnal Prosiding | Seminar Nasional Rekayasa.
Sains dan Teknologi Vol 3 No 1 Tahun 2024
ANALISIS METODE DECISION TREE DAN
NAyaVE BAYES PADA PASIEN PENYAKIT LIVER Damar Adji Sodikin1.
El Thaariq IsAoad2.
Rangga Prayoga3.
Ahmad Nur Ihsan Purwanto4 Sekolah Tinggi Ilmu Manajemen dan Ilmu Komputer ESQ.
s@students.
Sekolah Tinggi Ilmu Manajemen dan Ilmu .
Komputer ESQ.
i@students.
Sekolah Tinggi Ilmu Manajemen dan Ilmu Komputer ESQ.
p@students.
Sekolah Tinggi Ilmu Manajemen dan Ilmu Komputer ESQ.
ihsan@students.
AbstrakAi Penyakit liver disebabkan oleh konsumsi alkohol, penyakit hati berlemak, genetika dari orang tua, penyakit diabetes, obesitas, serta bahan kimia dalam obat.
Hati adalah organ dalam manusia yang terbesar dan terpenting.
Pemeriksaan bagian organ dalam, termasuk organ paruparu, organ jantung, kulit, otak, sistem saraf, serta lambung dapat memberikan tanda mengenai penyebab penyakit liver.
Fungsi hati adalah untuk mendetoksifikasi racun dari dalam tubuh.
Data yang diteliti merupakan hasil telaah dari 583 data yang diperoleh dengan 416 orang dinyatakan AupositifAy penyakit liver dan sisanya 167 orang AunegatifAy penyakit hati .
Oleh karenanya dibutuhkan sebuah analisis data mining yang menggunakan algoritma pohon keputusan dengan nilai akurasi optimal sebesar 70.
29%, sedangkan metode Naive Bayes memiliki nilai akurasi optimal sebesar 70.
29%, 67.
Dapat disimpulkan bahwa metode pohon keputusan merupakan salah satu metode yang dapat memecahkan masalah penentuan penyakit Keywords Ai Decision Tree.
Nayve Bayes, liver AbstractAi Liver infection is caused by liquor utilization, greasy liver illness, hereditary qualities from guardians, diabetes, corpulence, and chemicals in drugs.
The liver is the biggest and most critical human inner organ.
Examination of parts of the body, counting the lungs, heart, skin, brain, apprehensive framework, and stomach, can give clues around the cause of liver infection.
The work of the liver is to detoxify poisons from the body.
The information examined was the result of a audit of 583 information gotten with 416 individuals pronounced "positive" for liver illness and the remaining 167 individuals "negative" for liver malady.
Subsequently, we require a information mining examination framework that employments the choice tree calculation strategy with an ideal exactness esteem of 70.
29%, whereas the Credulous Bayes strategy has an ideal exactness esteem of 70.
29%, 67.
It can be concluded that the choice tree strategy is one strategy that can fathom the issue of deciding liver infection.
Keywords Ai Decision Tree.
Nayve Bayes, liver
PENDAHULUAN
Gangguan liver/hati adalah penyakit yang timbul di organ hati manusia, dimana kesehatan organ hati sangat vital bagi tubuh.
Liver atau hati mengubah zat yang beracun menjadi sebuah nutrisi, dimana selanjutnya digunakan tubuh untuk mengontrol hormon dalam tubuh .
Selain itu, juga berfungsi untuk memproduksi protein yang membantu pembekuan darah, dan memecah sel darah merah.
Penyebab penyakit liver adalah Damar Adji Sodikin1.
El Thaariq IsAoad2.
Rangga Prayoga3.
Ahmad Nur Ihsan Purwanto4 konsumsi alkohol berlebihan, penumpukan lemak pada hati, faktor genetik, diabetes, dan obesitas Dampak kerusakan hati antara lain peradangan, penggumpalan darah, serta gagal Fungsi hati adalah menyaring seluruh darah dari usus melalui vena portal, kemudian menyimpan dan mengatur komponen makanan yang diterima melalui vena portal.
Komponen makanan ini kemudian dilepaskan ke aliran darah sesuai kebutuhan.
Hati juga akan menjaga kebutuhan organ tubuh terutama otak terhadap zat-zat beracun yang mau tidak mau akan diserap .
oleh usus, misalnya amonia dari usus merupakan zat yang sangat beracun.
Penyakit hati, yang menyebabkan kematian karena dianggap sebagai silent killer tanpa gejala.
Terdapat 28 juta penderita penyakit liver di Indonesia, menjadikan penyakit liver termasuk dalam 10 penyakit dengan angka kematian tertinggi, sehingga angka kematian meningkat setiap tahunnya.
Diagnosis adalah identifikasi ciri-ciri suatu penyakit atau kondisi atau membedakan suatu penyakit atau kondisi dengan penyakit atau kondisi lainnya.
Evaluasi dapat dilakukan melalui pemeriksaan fisik, pengujian laboratorium, atau cara lain dan dapat juga dibantu dengan program komputer yang pengambilan keputusan.
Dalam industri perawatan kesehatan, salah mendiagnosis penyakit pasien adalah tanggung jawab terberat bagi seorang profesional perawatan kesehatan.
Kesalahan diagnosis dapat membahayakan kesehatan pasien, bahkan berujung pada kematian .
Penambangan data, melibatkan pencarian informasi bisnis yang berharga dari database yang sangat besar .
Data mining adalah proses mengekstraksi informasi atau menarik data dalam database yang besar.
Dan dalam jurnal data mining dikenal juga dengan Knowledge Discovery in Databases (KDD) digunakan untuk mengembangkan masalah identifikasi penyakit liver menggunakan metode pohon keputusan dan membandingkan Nayve Bayes untuk menentukan metode apa yang paling akurat .
Sumber data https://w.
com/datasets/uciml/indianliver-patient-records.
Data tersebut adalah hasil pemeriksaan terhadap 583 orang yang berasal dari wilayah Andhra Pradesh.
India.
II.
METODE PENELITIAN
Metodologi penelitian dilaksanakan sebagai pedoman bagi peneliti agar mencapai hasil dan tujuan yang sesuai.
Desain Kajian Kajian eksperimental yang bertujuan untuk membuat perbandingan antara algoritma Decision Tree dengan Naive bayes.
Studi eksperimental ini didasarkan pada alur pemecahan masalah yang ditunjukkan pada Gambar 1 sebagai berikut:
Gambar 1.
Metode penelitian Klasifikasi Metode Dalam metode penelitian ini digunakan klasifikasi algoritma Decision Tree dan Naive Untuk membandingkan metode mana yang Jurnal Prosiding | Seminar Nasional Rekayasa.
Sains dan Teknologi Vol 3 No 1 Tahun 2024 dapat menyelesaikan masalah dalam menentukan penyakit liver dari data-data yang ada.
Pengumpulan Data Data yang diambil secara langsung oleh peneliti disebut sebagai sumber primer, sedangkan sumber data yang digunakan disebut sumber sekunder .
Data yang dipakai adalah data sekunder karena didapat dari data yang digunakan pada penelitian yang bersumber dari:
https://w.
com/datasets/uciml/indianliver-patient-records.
Kumpulan data tersebut berisi sebanyak 416 catatan pasien liver/hati dan 167 catatan pasien tanpa penyakit liver/hati yang dikumpulkan dari Timur Laut Andhra Pradesh.
India.
Kolom AuDatasetAy adalah label yang digunakan untuk membagi kelompok menjadi pasien liver .
enyakit live.
dan yang tidak terinfeksi.
Kumpulan data ini berisi 441 catatan pria dan 142 catatan pasien wanita.
Di mana atributnya meliputi age of the patient.
Gender of the patient, total billirubin, direct billirubin, alkaline aspartate aminotransferase, total Protiens.
Albumin.
Albumin and Globulin Ratio.
Total Protiens <6 Rendah, <=6 <=8 Normal, >8 Tinggi Albumin <3.
4 Rendah, <=3.
4 <=4.
8 Normal, >4.
Tinggi Ration Albumin and Globulin Ratio >1 Normal dan <= 1 Dataset 1 (Positi.
dan 2 (Negati.
Analisis Data Pengklasteran data dilakukan berdasarkan hasil prediksi pasien dari atribut dataset yang terdapat pada kelas atribut.
Berikut grafik dari pengelompokan datanya :
Tabel 1.
Parameter atribut Dataset Atribut Nilai Rujukan Age <20 Anak, <=20 - <50 Muda, dan >=500 Dewasa Gender Male .
aki-lak.
dan Female .
Total Bilirubin <=1 Normal dan >1 Abnormal Direct Bilirubin <=0.
2 Normal dan >0.
2 Abnormal Alkaline Phosphotase <=30 - <=120 Normal dan >120 Tinggi Alamine Aminotransferase <47 Normal dan >=47 Abnormal Gambar 3.
Pengelompokan Data Positif dan Negatif Kemudian diperoleh 583 data dengan rincian sebanyak 416 pasien terinfeksi penyakit hati/liver dan sejumlah 167 orang negative dari penyakit Selanjutnya pengelompokan data Berikut Damar Adji Sodikin1.
El Thaariq IsAoad2.
Rangga Prayoga3.
Ahmad Nur Ihsan Purwanto4 Setelah mentransformasi data maka data akan dibagi yaitu data training dan validasi atau testing.
Data training sebesar 80% sedangkan data validasi atau testing sebesar 20%.
Gambar 4.
Pengelompokan Data Pria dan Wanita` Dan didapatkan data pria sebanyak 441 orang dan wanita 142 orang pada data ini.
Terakhir mengecek missing value yang ada pada Berikut Pemodelan Pemodelan terbagi menjadi dua proses yaitu memisahkan data training dan data testing kemudian membuat modelnya.
Pada praproses data sudah dibagi sebesar 80% data training dan 20% data testing.
Pembagian data menggunakan model splitting sklearn model train_test_split.
Setelah data terbagi selanjutnya adalah pemodelan kita menggunakan model Decision Tree dan naive bayes.
Algoritma Pohon Keputusan dapat dipakai untuk meramalkan atau mengelompokkan sebuah peristiwa dengan pembuatan decision tree dimana algoritma ini yang dikembangkan oleh J.
Ross .
Nayve Bayes atau multinomial nayve bayes merupakan metodeyang digunakan untuk mengklasifikasikan sekumpulan dokumen .
Evaluasi Model Tahap evaluasi model bertujuan untuk meningkatkan model dengan penskalaan fitur untuk mengetahui keberhasilan dari sistem yang Ternyata terdapat 4 data record missing value pada albumin dan globulin ratio.
Untuk mengatasi missing value dari variabel berikut dan untuk memiliki hasil yang maksimal dalam memprediksi maka data tersebut akan didrop Memprediksi data uji Memprediksi data uji bertujuan untuk melihat hasil, serta memprediksi nilai selanjutnya yang akan menjadi nilai data liver selanjutnya dan hasil nilainya akan diekspor menjadi data frame.
Dari 10 kali iterasi didapatkan beberapa kali data yang sama.
Oleh karena itu model yang telah dibuat sudah cukup untuk dapat melakukan data uji sebenarnya.
Gambar 5.
Hasil pemeriksaan pada missing value Praproses Data Praproses data ini tujuannya untuk menormalisasi data yang berbeda bentuknya dan juga mengisi kekosongan data yang ada pada kolom, serta drop kolom yang tidak perlu.
Pada tahapan ini juga mengubah tipe data menjadi satu tipe data yang sama, mengubah tipe data .
kolom kategori menjadi numerik agar data dapat diproses ke tahapan Penarikan kesimpulan Analisis hasil pengujian sistem yang dilakukan pada tahap ini, setelah melakukan seluruh rangkaian langkah-langkah yang telah Kelebihan dan kekurangan dari metode yang dibuat dapat diturunkan dari ini.
Tahap akhir ini menentukan tindakan yang akan dilakukan oleh peneliti berikutnya untuk lebih mengembangkan penelitian sebelumnya.
Hasil Jurnal Prosiding | Seminar Nasional Rekayasa.
Sains dan Teknologi Vol 3 No 1 Tahun 2024 yang didapatkan dari prediksi kasus terbaru penyakit liver, terdapat data yang tidak seimbang dari keseluruhan data, artinya data yang ada saat ini harus dievaluasi kembali untuk mendapatkan nilai yang merata.
a Transformasi data menjadi numerik Dalam data terdapat 1 kolom data bertipe data Berikut gambar datanya :
HASIL DAN PEMBAHASAN
Praproses Data Data yang digunakan adalah kasus 5 tahun lalu di India.
Berikut hasil dari proses EDA:
a Drop Column Menghapus record dengan missing value dengan perintah df.
nplace=Tru.
Sebelum dihapus :
Gambar 8.
Info data Data gender kemudian diubah menjadi tipe data numerik dengan perintah :
le = LabelEncoder() df.
Gender = fit_transform.
Gende.
Berikut hasil dari data yang telah di ubah :
Gambar 6.
Hasil Pengecekan Missing value Gambar 9.
Info data Dan setelah dihapus hasilnya seperti berikut :
Data gender berubah menjadi integer.
Modelling Membuat sebuah model machine learning yang akan memprediksi angka AoNew CaseAo dengan metode Decision Tree dan naive bayes, dengan langkah-langkah berikut:
A Splitting Membagi dataset menjadi dua bagian yaitu data tes dan data uji dengan ketentuan yang sudah dijelaskan pada tahap praproses data.
A Evaluation Proses pengukuran hingga mana tujuan dari program ini telah tercapai.
Disini kita akan melakukan feature scaling atau juga bisa disebut Gambar 7.
Hasil Pengecekan Missing value Damar Adji Sodikin1.
El Thaariq IsAoad2.
Rangga Prayoga3.
Ahmad Nur Ihsan Purwanto4 MinMaxScaler() dari library Scikit-learn.
Setelah itu kita mengubah data yang telah di normalisasi ke dalam sebuah bentuk DataFrame dan melakukan pemodelan kembali dengan data yang sudah di normalisasi tadi.
Dan mendapatkan hasil 034% dari akurasi Decision Tree yang sudah di normalisasi.
A Predict Test Digunakan untuk testing sebuah model, sebagai simulasi testing untuk dunia nyata.
Disini kami melakukan prediksi dengan data uji, lalu mengubah hasilnya menjadi kedalam bentuk sebuah DataFrame.
Gambar 12.
Matrix Confusion dari Decision Tree Hasil dari Naive bayes seperti berikut :
HASIL
Hasil dari Decision Tree seperti berikut :
IV.
Gambar 13.
Klasifikasi Matrix Decision Tree Gambar 10.
Klasifikasi Matrix Decision Tree Gambar 14.
Prediksi Aktual Naive bayes Gambar 11.
Prediksi Aktual Decision Tree Jurnal Prosiding | Seminar Nasional Rekayasa.
Sains dan Teknologi Vol 3 No 1 Tahun 2024 .
Adler J.
Diagnosa penyakit dengan gejala demam pada manusia berbasis mobile:
Knowledge based system.
Komputika: Jurnal Sistem Komputer.
2017 Oct 31.
:51-8.
Rahman NT.
Analisa Algoritma Decision Tree dan Naive Bayes pada Pasien Penyakit Liver.
Jurnal Fasilkom.
2020 Aug 13.
:144-51.
Khormarudin AN.
Teknik Data Mining:
Algoritma K-Means Clustering.
Ilmu Komput.
2016:1-2.
Gambar 15.
Matrix Confusion dari Naive bayes .
Siregar AM.
Kom S.
Puspabhuana MK.
Kom S.
Kom M.
Data Mining: Pengolahan Data Menjadi Informasi dengan RapidMiner.
Kekata Group.
SIMPULAN DAN SARAN
Secara singkat, kajian ini memanfaatkan data pasien dengan penyakit hati/liver dengan memanfaatkan Pohon Keputusan / Decision Tree dan Nayve Bayes untuk mencari algoritma terbaik dalam mengidentifikasi penyakit liver.
Gunanya mengevaluasi efisiensi pada kedua teknik tersebut, yaitu teknik Split Validation dan Cross Validation digunakan untuk mengukur kinerja dari kedua metode tersebut.
Dari pengukuran tersebut disimpulkan bahwa pada metode pohon keputusan dalam klasifikasinya menghasilkan akurasi sebesar 70,29%.
termasuk dalam klasifikasi ekuitas.
Nayve Bayes menghasilkan akurasi sebesar 67,05%.
Dengan demikian dapat disimpulkan bahwa metode untuk menyelesaikan masalah penentuan penyakit liver adalah dengan menggunakan pohon keputusan.
Learning.
September .
Indian Kaggle.
https://w.
com/datasets/uciml/indianliver-patient-records.
Adriansa M.
Yulianti L.
Elfianty L.
Analisis Kepuasan Pelanggan Menggunakan Algoritma C4.
Jurnal Teknik Informatika UNIKA Santo Thomas.
2022 Jun 22:115-21.
Yuliza R.
Sistem Pakar Akurasi dalam Mengidentifikasi Penyakit Gingivitis pada Gigi Manusia dengan Metode Naive Bayes.
Jurnal Sistim Informasi dan Teknologi.
2023:27-32.
Wibisono A.
Filtering Spam Email Menggunakan Metode Naive Bayes.
Jurnal Teknologi Pintar.
2023 Jun 6.
DAFTAR PUSTAKA