Volume 19 Nomor 2 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676
Jurnal Teknik Elektro dan Informatika
PERBANDINGAN METODE KLASIFIKASI PENGUJIAN KENDARAAN BERMOTOR DENGAN
ALGORITMA C4.
5 DAN NAyaVE BAYES Fahreza Adams Lazuardy.
Ahmad Homaidi.
Ahmad Lutfi.
Jurusan Teknologi Informasi.
Fakultas Sains dan Teknologi.
Universitas Ibrahimy Jl.
KHR.
Syamsul Arifin No.
Sukorejo.
Situbondo 68374.
Jawa Timur.
Indonesia e-mail : .
lazuardy@gmail.
com, .
ahmadhomaidi@ibrahimy.
id, .
14@gmail.
ABSTRAK
Penelitian ini bertujuan untuk membandingkan metode klasifikasi pengujian kendaraan bermotor pada algoritma C4.
5 dengan Nayve Bayes di Dinas Perhubungan Kabupaten Situbondo.
Dataset yang digunakan 264 record yang dibagi menjadi 2 subset data, data training dan data testing.
Atribut yang dianalisis meliputi tahun pembuatan, kepemilikan kendaraan, emisi opasitas timbal, total gaya pengereman, standarisasi klakson, kelayakan ban kendaraan, kekuatan sinar lampu, penyimpangan pancar lampu, dan hasil pengujian.
Hasil perbandingan ini menghasilkan dalam algoritma C4.
5 memiliki akurasi senilai 99.
69% dengan precision 68% dan recall 100% untuk kelas AuLULUSAy, serta precision 100% dan recall 90.
48% untuk kelas AuTIDAK LULUSAy.
Sementara algoritma Nayve Bayes menunjukkan akurasi senilai 99.
13% dengan precision 99.
dan recall 99.
51% untuk kelas AuLULUSAy serta precision 81.
82% dan recall 84.
38% untuk kelas AuTIDAK LULUSAy.
C4.
5 lebih unggul mendeteksi kendaraan yang AuTIDAK LULUSAy, sedangkan Nayve Bayes lebih efisien dalam komputasi.
Temuan ini menyimpulkan bahwa algoritma C4.
5 lebih efektif untuk pola interaksi data yang kompleks, sedangkan Nayve Bayes menawarkan kecepatan komputasi yang lebih tinggi.
Pemilihan algoritma harus mempertimbangkan karakteristik dataset dan kebutuhan spesifik dari aplikasi pengujian kendaraan bermotor.
Kata Kunci: Data mining.
C4.
Nayve Bayes.
Klasifikasi.
Pengujian Kendaraan Bermotor.
Akurasi.
ABSTRACT
This study compares vehicle inspection classification methods using the C4.
5 and Nayve Bayes algorithms at the Department of Transportation in Situbondo Regency.
The dataset comprises 3,264 records, divided into training and testing subsets.
Analyzed attributes include year of manufacture, vehicle ownership, lead opacity emissions, total braking force, horn standardization, tire feasibility, headlight strength, headlight deviation, and test results.
The C4.
5 algorithm achieves 99.
69% accuracy, with 99.
68% precision and 100% recall for the AuPASSAy class, and 100% precision and 90.
48% recall for the AuFAILAy class.
Nayve Bayes shows 99.
accuracy, with 99.
59% precision and 99.
51% recall for the AuPASSAy class, and 81.
82% precision and 84.
recall for the AuFAILAy class.
C4.
5 is superior in detecting AuFAILAy vehicles, while Nayve Bayes is more computationally efficient.
These findings suggest that the C4.
5 algorithm is more effective for complex data interaction patterns, whereas Nayve Bayes offers higher computational speed.
Algorithm selection should consider dataset characteristics and the specific needs of vehicle inspection applications.
Keywords: Data mining.
C45.
Nayve Bayes.
Classification.
Motor Vehicle Testing.
Accuracy.
PENDAHULUAN
1 Latar Belakang Penelitian Dinas Perhubungan Kabupaten Situbondo, sebagaimana diatur oleh Peraturan Bupati Situbondo Nomor 24 Tahun 2022 tentang Kedudukan.
Susunan Organisasi.
Uraian Tugas, dan Fungsi Dinas Perhubungan Kabupaten Situbondo, adalah sebuah lembaga yang berfungsi membantu Bupati dalam melaksanakan urusan pemerintahan yang menjadi Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika kewenangan daerah di bidang perhubungan.
Selain itu, lembaga ini juga bertugas melaksanakan tugas pembantuan yang diberikan kepada daerah.
Salah satu unit penting di dalamnya adalah Unit Pelaksana Teknis Dinas yang bertugas memberikan layanan pengujian kendaraan bermotor.
Unit ini bertanggung jawab atas pelaksanaan kegiatan teknis operasional dan/atau teknis penunjang, serta urusan pemerintahan yang bersifat pelaksanaan dari organisasi induknya, yang pada prinsipnya tidak berkaitan langsung dengan perumusan dan penetapan kebijakan daerah .
Unit Pelaksana Teknis Pengujian Kendaraan Bermotor bertanggung jawab menyelenggarakan layanan pengujian kendaraan bermotor secara cumacuma bagi masyarakat.
Proses ini mencakup pendaftaran, pengisian formulir, dan pemeriksaan teknis untuk memastikan kendaraan memenuhi standar keselamatan yang telah ditetapkan.
Meskipun layanan ini diberikan secara gratis, masih ditemukan sejumlah kendaraan yang tidak laik jalan dan gagal dalam pengujian.
Kondisi ini sering kali disebabkan oleh kurangnya perawatan rutin serta usia kendaraan yang telah melebihi satu dekade.
Kendaraan yang tidak dirawat dengan baik cenderung mengalami berbagai kerusakan, seperti emisi gas buang yang berlebihan, kondisi ban yang terlalu tipis, pancar lampu yang redup atau tidak berfungsi, sistem pengereman yang tidak optimal, serta tingkat kebisingan klakson yang tidak sesuai dengan standar Keadaan ini tidak hanya membahayakan pengendara, tetapi juga para pengguna jalan lainnya.
Pengujian kendaraan bermotor merupakan upaya esensial untuk menjamin keselamatan dan efisiensi operasional kendaraan di jalan raya.
Menurut data dari Kepolisian Resor Situbondo yang menunjukkan bahwa persentase kecelakaan lalu lintas di wilayah Kabupaten Situbondo meningkat sebesar 575,92% dimana sebagian besar disebabkan oleh kendaraan yang tidak laik jalan .
Dalam konteks ini, teknologi data mining berperan sangat penting dalam meningkatkan akurasi dan efisiensi pengujian kendaraan bermotor.
Dengan melakukan perbandingan pada algoritma C4.
dengan Nayve Bayes, proses klasifikasi dapat dianalisa dan dapat ditemui algortima mana yang lebih tepat dan efisien.
Hal ini memungkinkan identifikasi kendaraan yang tidak laik jalan dilakukan dengan lebih cepat dan akurat.
Teknologi ini diharapkan dapat mendukung Dinas Perhubungan Kabupaten Situbondo dalam menjalankan tugasnya dengan lebih efektif, serta memberikan kontribusi yang signifikan terhadap peningkatan keselamatan lalu lintas.
Tinjauan Penelitian Penelitian sebelumnya pernah dilakukan oleh Eka Fitriani dalam jurnal "SISTEMASI: Jurnal Sistem Informasi" melakukan perbandingan antara algoritma C4.
5 dan Nayve Bayes dalam menilai kualifikasi penerima pada Program Keluarga Harapan (PKH).
Penelitian ini menyoroti masalah verifikasi data yang belum tepat sasaran dalam pemilihan penerima PKH, sehingga sering terjadi ketidaktepatan sasaran.
Melalui analisis komparatif, penelitian ini menemukan bahwa algoritma C4.
5 menghasilkan akurasi sebesar 91.
25% dengan AUC 0.
sedangkan algoritma Nayve Bayes memiliki akurasi 11% dengan AUC 0.
Hasil ini menunjukkan bahwa algoritma C4.
5 lebih unggul dalam menentukan kelayakan penerima PKH dibandingkan dengan Nayve Bayes.
Penelitian ini juga menegaskan pentingnya pemilihan algoritma yang tepat berdasarkan karakteristik data dan tujuan aplikasi, di mana C4.
5 lebih efektif untuk data dengan pola interaksi yang kompleks, sementara Nayve Bayes lebih menawarkan pada kecepatan komputasi yang tinggi .
Penelitian ini memiliki relevansi langsung dengan kendaraan bermotor menggunakan algoritma C4.
dan Nayve Bayes di Dinas Perhubungan Kabupaten Situbondo.
Kedua penelitian ini menggarisbawahi pentingnya pemilihan algoritma yang sesuai untuk meningkatkan akurasi dan efisiensi dalam proses Dalam konteks pengujian kendaraan bermotor, pemanfaatan algoritma yang tepat dapat membantu dalam mengidentifikasi kendaraan yang tidak laik jalan dengan lebih cepat dan akurat.
Dengan demikian, hasil penelitian Fitriani memberikan dasar yang kuat untuk menerapkan metode yang sama dalam konteks yang berbeda, yakni pengujian Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika kendaraan bermotor, untuk mencapai tujuan yang serupa yaitu meningkatkan ketepatan dan efisiensi proses klasifikasi.
Landasan Teori Data Mining Data Mining adalah kombinasi secara logis antara pengetahuan data, dan Analisa statistic yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan Teknik statistic, matematika, kecerdasan buatan, tiruan dan machinelearning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang terkait dari berbagai database besar .
Klasifikasi Klasifikasi adalah tipe analisis data yang dapat membantu orang dalam menentukan kelas label dari sampel yang ingin di klasifikasi untuk menemukan hubungan antara atribut masukan dan atribut target .
Algoritma C 4.
Algoritma C 4.
5 menghasilkan beberapa rule dan pohon Keputusan dengan tujuan untuk meningkatkan keakuratan dari prediksi yang sedang dilakukan, disamping itu algoritma C 4.
5 merupakan algoritma yang mudah dimengerti .
Nayve Bayes Metode Nayve Bayes merupakan pendekatan statistik untuk melakukan inferensi induksi pada persoalan Keuntungan menggunakan Nayve Bayes adalah metode ini hanya membutuhkan jumlah data pelatihan (Training Dat.
yang kecil untuk menentukan parameter yang diperlukan dalam proses klasifikasi .
Gambar 1.
Tahapan Penelitian Berikut penjabaran gambar 1 Data dikumpulkan melalui teknik ekspor database SQL dari aplikasi Pengujian Kendaraan Bermotor yang digunakan oleh Dinas Perhubungan Kabupaten Situbondo.
Pemrosesan data mencakup pengolahan data mentah yang mengandung beberapa informasi yang tidak Oleh karena itu, diperlukan tahap persiapan data untuk memastikan data siap dianalisis.
Data yang telah diproses sebelumnya dianalisis menggunakan metode CRISP-DM.
2 Metode Analisa Data Pendekatan analisis data mining dalam penelitian ini menggunakan model CRISP-DM .
II.
METODE PENELITIAN
1 Tahapan Penelitian Langkah-langkah metodologis yang diambil oleh peneliti akan diuraikan pada gambar 1 .
Gambar 2.
Tahapan CRISP Ae DM.
Tahapan CRISP Ae DM sebagai berikut :
Fase Pemahaman Bisnis Penelitian ini bertujuan untuk menerapkan metode data mining dengan Algoritma C4.
5 Decision Tree dan Nayve Bayes guna membandingkan hasil klasifikasi pengujian kendaraan bermotor dengan akurasi tinggi.
Dengan demikian, pola atau aturan Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika yang dihasilkan dari pohon keputusan C4.
5 dan hasil klasifikasi dari Nayve Bayes dapat digunakan sebagai dasar untuk pengambilan keputusan dan kriteria yange.
jelas di masa depan.
Fase Pemahaman Data Pada fase ini, data dikumpulkan menggunakan basis data dari aplikasi pengujian kendaraan bermotor di Dinas Perhubungan Kabupaten Situbondo untuk memperoleh informasi hasil pengujian kendaraan4.
yang mencakup 3.
264 record.
Fase Persiapan Data Langkah-langkah dalam fase persiapan data adalah sebagai berikut :
Tahap Seleksi Data Pada tahapan penyeleksian data, perlu dilakukan seleksi atribut dalam dataset karena tidak semuaa.
atribut pada dataset awal akan diolah dalam proses data mining.
Dataset yang telah melalui seleksi dapat dilihat pada Tabel 1.
Tabel 1.
Atribut Dataset yang siap diolah No.
Atribut Tahun produksi kendaraan Kepemilikan kendaraan Emisi opasitas timbal Total gaya pengereman Standarisasi suara klakson Kelayakan ban Kekuatan sinar lampu utama Penyimpangan pancar lampu utama Hasil Pengujian mencakup nilai keputusan 'LULUS' dan 'TIDAK LULUSAy.
Pembagian Data Penelitian ini melibatkan 3.
264 record data yang dibagi menjadi 80% untuk data training dan 20% untuk data testing.
Data tersebut akan diterapkan dalam penghitungan secara manual dengan tools RapidMiner.
Fase Pemodelan Teknik pemodelan data mining yang diterapkan adalah metode klasifikasi dengan algoritma C 4.
Decision Tree dan Nayve Bayes, di mana pemodelan dan desain pengujian model dilakukan menggunakan tools RapidMiner untuk memungkinkan analisis dan penilaian akurat terhadap setiap model.
Flowchart analisis data mining dengan algoritma C4.
5 ditampilkan pada Gambar 3.
Tahap Pembersihan Data Pada tahap ini.
Data yang tidak lengkap atau tidak relevan dihapus melalui proses pembersihan data.
Diskretisasi data Gambar 3.
Flowchart Analisa Data Mining Pada tahap ini, tahun produksi kendaraan diklasifikasikan menjadi dua kategori: kurang dari 10 Penjabaran dari Flowchart Analisa Data Mining tahun dan lebih dari 10 tahun, sebagaimana adalah sebagai berikut :
Mulai: Tahap awal di mana proses dimulai.
ditampilkan pada Tabel 2.
Input Data: Data yang akan digunakan dalam analisis Tabel 2.
Atribut hasil diskretisasai dimasukkan ke dalam sistem.
Tahun Produksi
Atribut
Data Preprocessing: Data yang telah dimasukkan Kendaraan kemudian diproses untuk mempersiapkan data yang 1979 - 2013
< 10 TAHUN
2014 Ae 2024
> 10 TAHUN
bersih dan sesuai untuk analisis.
Tahap ini mencakup Penentuan Atribut Target pemilihan atribut, pembersihan data, dan Setelah proses diskretisasi, langkah berikutnya adalah pendiskretan atribut.
menetapkan atribut dataset yang akan digunakan sebagai label, yakni atribut dataset hasil yang Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Data Training: Data yang telah diproses dibagi menjadi dua bagian: data training dan data testing.
Data training digunakan untuk melatih model.
Modeling (Algoritma C4.
5 & Nayve Baye.
: Pada tahap ini, data training digunakan untuk membangun model dengan menggunakan algoritma C4.
5 Decision Tree dan Nayve Bayes.
Model ini dibuat untuk memahami pola dalam data.
Data Testing: Data testing digunakan untuk menguji model yang telah dibangun.
Tujuan dari tahap ini adalah untuk mengevaluasi seberapa baik model dapat memprediksi hasil berdasarkan data yang tidak terlihat sebelumnya.
Validation (Apply Model & Performanc.
: Model yang telah dibangun diaplikasikan pada data testing Gambar 4.
Flowchart Algoritma C4.
untuk mengukur performa model.
Evaluasi dilakukan dengan melihat akurasi dan confusion matrix untuk Berikut penjabaran dari Flowchart Algoritma C4.
memahami seberapa baik model melakukan untuk membangun pohon keputusan.
Mulai: Tahap awal di mana proses dimulai.
Hasil (Accuracy & Confusion Matri.
: Hasil dari 2.
Input atribut : Data atribut dimasukkan ke dalam evaluasi model ditampilkan, termasuk tingkat akurasi sistem untuk analisis.
dan confusion matrix yang menunjukkan detail 3.
Menghitung entropy total : Entropy total dari dataset dihitung untuk mengukur ketidakpastian dalam data.
performa model dalam mengklasifikasikan data.
Kesimpulan: Berdasarkan hasil evaluasi, kesimpulan Entropy ini akan menjadi acuan untuk menentukan diambil mengenai performa model dan pola yang seberapa baik atribut memisahkan data .
Dalam Kesimpulan ini digunakan untuk penghitungan entropy total menggunakan persamaan membuat keputusan yang informatif.
ycu Selesai: Proses analisis data mining berakhir setelah Entropy.
cI) = Oe Oc ycyycn ycoycuyci2 .
cyycn ) kesimpulan diambil.
ycn=1 Flowchart ini secara keseluruhan menggambarkan dimana :
proses analisis data mining mulai dari pengumpulan C S adalah himpunan data atau dataset data hingga evaluasi hasil dan pengambilan C ycu adalah jumlah kelas dalam dataset kesimpulan, dengan fokus pada penggunaan C ycyycn adalah probabilitas atau proporsi kasus dalam kelas algoritma C4.
5 dan Nayve Bayes untuk membangun dan mengevaluasi model klasifikasi.
Menghitung entropy beserta gain pada tiap atribut :
Setiap atribut dalam dataset dianalisis untuk Flowchart Algoritma C4.
menghitung entropy dan information gain.
Pada diagram ini dapat dijelaskan bahwa langkahInformation gain digunakan untuk mengukur langkah proses dalam algoritma C4.
5 dapat dimulai seberapa banyak ketidakpastian berkurang saat data dari pengambilan data mentah, preprocessing data, dipisahkan oleh atribut tersebut.
Penghitungan pemilihan atribut terbaik untuk membangun pohon entropy beserta gain untuk setiap atribut keputusan, hingga pembentukan cabang-cabang menggunakan persamaan berikut pohon berdasarkan nilai atribut, serta evaluasi dan Menghitung entropy untuk setiap subset atribut validasi model untuk menghasilkan pohon keputusan menggunakan persamaan berikut.
yang optimal.
Dapat dilihat di gambar 4.
Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika yco Pohon keputusan ini digunakan untuk memprediksi hasil berdasarkan atribut yang ada.
yc=1 Selesai: Proses penerapan algoritma C4.
5 berakhir setelah pohon keputusan selesai dibangun.
C ycIycn adalah subset data hasil pemisahan berdasarkan Flowchart ini secara keseluruhan menjelaskan atribut A.
langkah-langkah sistematis dalam menerapkan C yco adalah jumlah kelas dalam subset ycIycn .
algoritma C4.
5, dimulai dari input data atribut.
C ycyycnyc adalah probabilitas atau proporsi kasus dalam perhitungan entropy dan information gain, hingga kelas yc di subset ycIycn .
pembentukan pohon keputusan yang dapat digunakan untuk klasifikasi data.
Menghitung Gain untuk setiap atribut menggunakanc.
Flowchart Algoritma Nayve Bayes persamaan berikut.
Berikut adalah flowchart algoritma Nayve Bayes dapat dilihat pada Gambar 5.
Gain.
= yaycuycycycuycyyc.
cI) Entropy.
cIycn ) = Oe Oc ycyycnyc ycoycuyci2 .
cyycnyc ) yco Oe Oc( .
cIycn | ) yaycuycycycuycyyc.
cIycn ) .
cI| ycn=1 C A adalah atribut yang digunakan untuk pemisahan C ycI adalah himpunan data atau dataset C ycIycn adalah subset data hasil pemisahan berdasarkan atribut A.
C .
cIycn | adalah jumlah kasus dalam subset ycIycn C .
cI| adalah jumlah total kasus dalam dataset C yco adalah jumlah subset yang dihasilkan dari pemisahan oleh atribut A.
Menentukan root node : Atribut dengan nilai gain tertinggi dipilih sebagai root node .
ode aka.
karena atribut ini paling baik dalam memisahkan data berdasarkan ketidakpastian yang dikurangi.
Melakukan perulangan proses : Node dibuat berdasarkan atribut yang telah dipilih sebagai root Proses ini mencakup pembagian data menjadi1.
subset yang lebih kecil berdasarkan nilai atribut.
Pohon Keputusan : Proses ini memeriksa apakah semua atribut telah dieksekusi dan dipertimbangkan dalam pembagian data.
Jika belum, proses kembali ke langkah perhitungan entropy dan gain untuk atribut3.
C Tidak: Jika belum semua atribut dieksekusi, kembali ke langkah menghitung entropy dan gain untuk atribut yang tersisa.
C Ya: Jika semua atribut telah dieksekusi, lanjutkan ke4.
langkah berikutnya.
Setelah semua atribut dieksekusi dan node-node dibuat, pohon keputusan lengkap dapat dibangun.
Gambar 5.
Flowchart Algoritma Nayve Bayes Berikut penjabaran Flowchart Algoritma Nayve Bayes pada setiap tahapannya.
Mulai: Tahap awal di mana proses dimulai.
Data Training: Data yang akan digunakan untuk melatih model Nayve Bayes dimasukkan ke dalam Data ini digunakan untuk memahami pola dan hubungan antara atribut dan label.
Data Uji: Data yang akan digunakan untuk menguji model dimasukkan ke dalam sistem.
Data ini berfungsi untuk mengevaluasi seberapa baik model dapat memprediksi hasil pada data yang belum pernah dilihat sebelumnya.
Menghitung Kemunculan Tiap Atribut Menggunakan Rumus Gaussian: Pada tahap ini, model menghitung probabilitas kemunculan setiap atribut dalam data training menggunakan rumus Gaussian.
Rumus Gaussian digunakan untuk memperkirakan distribusi Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika data dan menghitung probabilitas berdasarkan diterapkan, sehingga dapat menentukan apakah ada distribusi normal dengan penjabaran rumus sebagai langkah yang terlewatkan atau perlu adanya kebutuhan tambahan dalam mengidentifikasi pola data sehingga dapat dilakukan perbandingan.
cu Oe yuN)2 ycE.
= exp(Oe Fase Deployment : Hasil penelitian klasifikasi data 2yua 2 Oo2yuUyua 2 mining telah disusun dalam bentuk laporan yang siap ycE.
adalah probabilitas likelihood dari nilai x dipresentasikan kepada pihak terkait.
Laporan ini akan menjelaskan perbandingan dari proses data diberikan ke kelas ya.
mining yang telah dilakukan, termasuk perbandingan yuN adalah rata-rata .
dari atribut untuk kelas ya.
yua adalah simpangan baku .
tandart deviatio.
dari pola yang dihasilkan oleh Algoritma C4.
5 dan Nayve Bayes.
atribut untuk kelas ya.
yceycuycy adalah fungsi eksponensial .
adalah basis i.
HASIL DAN PEMBAHASAN
logaritma natural, sekitar 2.
Peluang ke Kategori Lulus dan Tidak Lulus:3.
1 Perhitungan Manual Menggunakan Excel dengan Berdasarkan perhitungan probabilitas atribut, model Algoritma C4.
menghitung peluang setiap record untuk masuk ke Dalam penelitian ini, perhitungan manual dalam kategori "Lulus" atau "Tidak Lulus".
Peluang ini dihitung dengan mengalikan probabilitas atribut menggunakan algoritma C4.
5 dilakukan untuk memahami proses klasifikasi dan membangun pohon untuk setiap kategori.
Lulus > Tidak Lulus: Model membandingkan peluang keputusan berdasarkan dataset yang digunakan.
"Lulus" dan "Tidak Lulus" untuk menentukan Dataset yang digunakan terdiri dari 3.
264 record, yang kemudian dibagi menjadi data training .
%) kategori akhir.
C Jika peluang "Lulus" lebih besar dari peluang "Tidak dan data testing .
%).
Atribut-atribut yang dianalisis Lulus", maka record diklasifikasikan sebagai meliputi tahun produksi, kelayakan ban, kekuatan sinar lampu utama, total gaya pengereman, dan "Lulus".
atribut lainnya yang relevan.
Berikut adalah tahapan C Jika peluang "Lulus" kurang dari atau sama dengan perhitungan manual menggunakan algoritma C4.
peluang "Tidak Lulus", maka record diklasifikasikan sebagai "Tidak Lulus".
Menentukan Root Node:
Masuk Klasifikasi Lulus: Jika peluang "Lulus" lebih Root node dalam pohon keputusan adalah titik besar, record masuk ke dalam kategori "Lulus".
awal dari pohon tersebut.
Root node dipilih Masuk Klasifikasi Tidak Lulus: Jika peluang "Tidak berdasarkan atribut yang memiliki nilai gain terbesar Lulus" lebih besar atau sama, record masuk ke dalam setelah perhitungan entropy.
Menentukan root node kategori "Tidak Lulus".
adalah langkah krusial karena node ini akan Selesai: Proses klasifikasi selesai setelah semua data mengarahkan bagaimana data akan dibagi dalam uji diklasifikasikan ke dalam kategori yang sesuai.
langkah-langkah selanjutnya dalam pohon keputusan.
Flowchart ini menjelaskan proses langkah demi Atribut yang dihitung meliputi tahun produksi langkah penerapan algoritma Nayve Bayes, mulai dari kendaraan, kepemilikan kendaraan, emisi opasitas memasukkan data training dan data uji, menghitung timbal, total gaya pengereman, standarisasi suara probabilitas atribut, menentukan peluang kategori, klakson, kelayakan ban, kekuatan sinar lampu utama, hingga mengklasifikasikan data uji ke dalam kategori penyimpangan pancar lampu utama, dan hasil "Lulus" atau "Tidak Lulus".
Sebagai contoh, perhitungan manual Fase Evaluasi : Evaluasi ini dilakukan terhadap hasil untuk atribut kelayakan ban telah dilakukan, dan perbandingan klasifikasi data mining dengan berikut hasilnya ditampilkan pada Tabel 3.
algoritma C4.
5 dengan Nayve Bayes yang bertujuan untuk mengetahui apakah pola atau aturan yang dihasilkan telah memenuhi tujuan model bisnis yang Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Perhitungan Entropy dan Gain pada Node 1 Setelah menentukan root node dengan atribut Kelayakan Ban, langkah selanjutnya adalah menghitung entropy dan gain untuk atribut-atribut berikutnya pada node pertama.
Atribut yang akan dihitung selanjutnya meliputi tahun produksi, total gaya pengereman dan kekuatan sinar lampu utama.
Hasil perhitungan node pertama digambarkan pada Tabel 3.
Perhitungan Root Node Pada Tabel 3, atribut kelayakan ban memiliki nilai Tabel 4.
Tabel 4.
Hasil Perhitungan Node 1 gain terbesar yaitu 0.
13, sehingga dipilih sebagai root node untuk pembentukan pohon keputusan.
Ini menunjukkan bahwa atribut kelayakan ban paling signifikan dalam menentukan apakah sebuah kendaraan lulus atau tidak dalam pengujian.
Semenatara pada atribut tahun produksi dan kekuatan sinar lampu utama memiliki nilai gain yang lebih kecil, masing-masing 0.
01 dan 0.
menunjukkan bahwa mereka kurang signifikan Pada Tabel 4, perhitungan entropy dan gain untuk dibandingkan dengan Kelayakan Ban dalam proses setiap atribut pada Node 1 adalah sebagai beriku:
Perhitungan Entropy dan Gain untuk Setiap Atribut Hasil perhitungan tersebut menunjukkan langkah- pada Node 1:
langkah nilai entropy dan gain yang digunakan untuka.
Tahun Produksi:
menentukan root node dalam pohon keputusanC Value: > 10 Tahun dan < 10 Tahun menggunakan algoritma C4.
Atribut kelayakan banC Label (LULUS): 1465 (> 10 Tahu.
dan 1058 (< 10 dipilih sebagai root node berdasarkan nilai gain Tahu.
Struktur pohon keputusan dengan root nodeC Label (TIDAK LULUS): 23 (> 10 Tahu.
dan 5 (< 10 tersebut dapat dilihat pada Gambar 5.
Tahu.
C Jumlah Kasus: 1488 (> 10 Tahu.
dan 1063 (< 10 Tahu.
C Entropy: 0.
C Gain: 0.
Gambar 5.
Root node pada decision tree Total Gaya Pengereman:
Dapat dilihat pada gambar 5.
Root node yang C Value: > 50% dan < 50% dipilih adalah atribut Kelayakan Ban karena atribut C Label (LULUS): 2523 (> 50%) dan 0 (< 50%) ini memiliki nilai gain terbesar, yaitu 0.
13, yang C Label (TIDAK LULUS): 14 (> 50%) dan 14 (< 50%) menunjukkan bahwa atribut ini paling signifikan dalam menentukan apakah sebuah kendaraan akanC Jumlah Kasus: 2537 (> 50%) dan 14 (< 50%) lulus atau tidak dalam pengujian.
Node iniC Entropy: 0.
C Gain: 0.
menghasilkan dua struktur cabang:
Kekuatan Sinar Lampu Utama:
Alur Ban < 1.
Kendaraan dengan alur ban kurang dari 1.
6mmC Value: > 12.
000 cd dan < 12.
000 cd memiliki kemungkinan besar tidak lulus pengujian.
C Label (LULUS): 2523 (> 12.
000 c.
dan 0 (< 12.
Alur Ban > 1.
Kendaraan dengan alur ban lebih dari 1.
6mm Label (TIDAK LULUS): 12 (> 12.
000 c.
dan 16 (< 000 c.
memiliki kemungkinan besar lulus pengujian.
C Jumlah Kasus: 2535 (> 12.
000 c.
dan 16 (< 12.
Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Kendaraan dengan kekuatan sinar lampu utama lebih Entropy: 0.
dari 12000 cd dipastikan LULUS pengujian karena Gain: 0.
Pada atribut Kekuatan Sinar Lampu Utama memenuhi standar pencahayaan yang ditetapkan.
memiliki nilai gain terbesar yaitu 0.
05 pada node C < 12000 cd:
pertama, yang berarti atribut ini paling signifikan Kendaraan dengan kekuatan sinar lampu utama dalam menentukan kelayakan kendaraan setelah kurang dari 12000 cd akan diproses lebih lanjut untuk Kelayakan Ban.
Kemudian pada atribut Total Gaya atribut Total Gaya Pengereman.
Pengereman memiliki nilai gain 0.
04, menunjukkan3.
Total Gaya Pengereman .
ntuk kendaraan dengan bahwa atribut ini juga cukup signifikan namun tidak Kekuatan Sinar Lampu Utama < 12000 c.
sebesar Kekuatan Sinar Lampu Utama.
Sementara C > 50%:
Tahun Produksi memiliki nilai gain 0.
Kendaraan dengan total gaya pengereman lebih dari menunjukkan bahwa atribut ini kurang signifikan 50% dipastikan LULUS pengujian karena memenuhi dalam menentukan kelayakan kendaraan pada node standar pengereman yang ditetapkan.
pertama ini.
Dengan demikian, atribut Kekuatan C < 50%:
Sinar Lampu Utama dipilih sebagai node berikutnya.
Kendaraan dengan total gaya pengereman kurang dari proses klasifikasi akan lebih akurat dan efisien dalam 50% dipastikan TIDAK LULUS pengujian karena mengidentifikasi kendaraan yang laik jalan nantinya.
tidak memenuhi standar pengereman yang Struktur Node 1 Pada struktur node pertama ini kelayakan ban Adapun Strukur pohon keputusan selanjutnya merupakan atribut pertama .
oot nod.
yang paling dijabarkan pada Gambar 6.
signifikan dalam menentukan kelulusan pengujian Kendaraan dengan alur ban kurang dari 6mm langsung dikategorikan sebagai TIDAK LULUS.
Kendaraan dengan alur ban lebih dari 1.
selanjutnya dievaluasi berdasarkan Kekuatan Sinar Lampu Utama.
Jika kekuatan sinar lampu lebih dari 12000 cd, kendaraan tersebut LULUS pengujian.
Kendaraan dengan kekuatan sinar lampu utama kurang dari 12000 cd masih perlu dievaluasi lebih Gambar 6.
Decision tree node 1 lanjut pada atribut Total Gaya Pengereman.
Jika total Pada decision tree node 1 berikut dari masinggaya pengereman lebih dari 50%, kendaraan tersebut masing cabang dapat dihasilkan bahwa :
LULUS pengujian.
jika kurang dari 50%, kendaraan Kelayakan Ban (Root Nod.
tersebut TIDAK LULUS C Alur Ban < 1.
Perhitungan Node kedua Semua kendaraan dengan alur ban kurang dari 1.
6mm Pada analisis struktur node pertama, yaitu untuk alur dipastikan TIDAK LULUS pengujian karena kondisi ban < 1.
6 mm, terdapat 60 kasus dengan hasil 0 ban yang tidak memenuhi standar minimum AuLULUSAy dan 60 AuTIDAK LULUSAy.
Karena tidak ditemukan kasus AuLULUSAy pada node ini, maka C Alur Ban > 1.
perhitungan untuk atribut lainnya tidak diperlukan.
Kendaraan dengan alur ban lebih dari 1.
6mm akan Seluruh kasus pada node ini secara otomatis diproses lebih lanjut untuk atribut Kekuatan Sinar diklasifikasikan sebagai AuTIDAK LULUSAy.
Lampu Utama.
Confusion Matrix Kekuatan Sinar Lampu Utama:
Dalam analisis ini, confusion matrix digunakan C > 12000 cd:
untuk mengukur akurasi model dalam memprediksi hasil pengujian kendaraan bermotor.
Adapun hasil perhitungan terdapat pada tabel 5.
Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Tabel 5.
Confusion Matrix
PREDIKSI: LULUS
PREDIKSI: TIDAK LULUS
AKTUAL:LULUS
AKTUAL:TIDAK LULUS
Pada Tabel 5 menghasilkan hasil dari data testing dengan jumlah 653 record menunjukkan bahwa model memiliki akurasi yang sangat tinggi dalam4.
memprediksi AuLulusAy dengan 635 prediksi yangC benar dan hanya 2 kasus yang salah.
Model juga sangat akurat dalam memprediksi AuTidak LulusAyC dengan 18 prediksi yang benar dan tidak ada prediksiC yang salah sebagai AuLulusAy.
Berikut hasil dari penghitungan menggunakan rumus akurasi.
Akurasi ycNycE ycNycA ycu 100% ycNycE ycNycA yaycE yaycA ycu 100% 635 18 0 2 ycu 100% ycu 100% C = 99.
2 Implementasi Algoritma C4.
5 menggunakan RapidMiner C Dalam C4.
diimplementasikan menggunakan tools RapidMinerC Dataset yang terdiri dari 3.
264 recordC dibagi menjadi dua bagian dengan proporsi 80:20.
Tujuan dari pembagian ini adalah untuk melatihC model decision tree menggunakan 80% data training, dan kemudian menguji model tersebut dengan 20%C data testing untuk menilai kinerjanya.
Langkah-C langkah dalam proses ini meliputi:
Retrieve Hasil Pengujian (Retriev.
C C Fungsi: Mengambil dataset yang berisi hasil pengujian kendaraan.
C Input: Dataset yang akan digunakan dalam analisis.
C Output: Data yang siap untuk diproses lebih lanjut.
Select Attributes C C Fungsi: Memilih atribut yang relevan dari dataset.
C Input: Dataset lengkap.
C Output: Dataset dengan atribut yang dipilih untuk Filter Example Fungsi: Memfilter data berdasarkan kondisi tertentu.
Input: Dataset dengan atribut yang dipilih.
Output: Dataset yang telah difilter sesuai dengan kriteria yang ditentukan.
Discretize Fungsi: Mengubah atribut kontinu menjadi atribut Input: Dataset yang telah difilter.
Output: Dataset dengan atribut yang telah Set Role Fungsi: Menentukan peran atribut dalam model, seperti menentukan atribut target .
dan atribut prediktor .
Input: Dataset yang telah didiskretisasi.
Output: Dataset dengan peran atribut yang telah Split Data Fungsi: Membagi dataset menjadi data training dan data testing.
Input: Dataset dengan peran atribut yang telah Output: Dua subset data, satu untuk training dan satu untuk testing.
Decision Tree (C4.
Fungsi: Membuat model pohon keputusan menggunakan algoritma C4.
Input: Data training.
Output: Model pohon keputusan yang terlatih.
Apply Model Fungsi: Menerapkan model yang telah dilatih ke data testing untuk melakukan prediksi.
Input: Model pohon keputusan dan data testing.
Output: Hasil prediksi pada data testing.
Retrieve Hasil Pengujian (Retriev.
Fungsi: Mengevaluasi kinerja model dengan menghitung metrik evaluasi seperti akurasi, precision, recall, dan F1-score.
Input: Hasil prediksi dan data testing yang Output: Metrik kinerja model yang menunjukkan seberapa baik model bekerja.
Model pengujian dapat dilihat pada gambar 7.
Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Gambar 7.
Proses pemodelan menggunakan algoritma C4.
5 pada RapidMiner Pada gambar 7 dijelaskan bahwa proses ini dimulai dengan pengambilan dataset, seleksi atribut yang relevan, dan pemfilteran data.
Selanjutnya, atribut secara langsung di diskretisasi dan peran tiap atribut ditentukan.
Dataset kemudian dilakukan pembagian untuk dijadikan data training dan datab.
testing sebagai pengolahan nilai prediksi.
Sehingga kinerja model dapat dievaluasi untuk menentukan mengklasifikasikan data uji.
Dengan model langkah ini, kita dapat membangun model klasifikasi yang efektif menggunakan algoritma C4.
5 dalam RapidMiner dan mengevaluasi kinerjanya secara komprehensif.
Decision Tree Hasil pengujian algoritma C4.
5 menggunakan tools RapidMiner menunjukkan pohon keputusan atau Decision Tree yang dibuat digunakan untuk memprediksi apakah suatu kendaraan akan "LULUS" atau "TIDAK LULUS" uji berdasarkan beberapa atribut seperti pada gambar 8.
tingkat standarisasi klakson.
Setiap keputusan yang dibuat berdasarkan nilai atribut pada node tersebut, sehingga mencapai keputusan akhir dari pengujian yang bernilai AuLULUSAy atau AuTIDAK LULUSAy.
Berikut hasil dari keterangan Decision Tree yang diperoleh dengan tools RapidMiner pada gambar 9.
Gambar 9.
Keterangan Decision Tree Hasil Pengukuran Akurasi Hasil pengukuran akurasi menggunakan tools RapidMiner dengan data testing sebanyak 20% dari total record, serta confusion matrix, dapat dilihat pada Gambar 10.
Gambar 10.
Hasil akurasi algoritma C4.
5 dengan confusion matrix Pada gambar 10.
Model yang dinilai memiliki akurasi yang sangat tinggi .
69%), menunjukkan bahwa model ini sangat efektif dalam memprediksi hasil uji Selain itu tingkat presisi untuk kelas AuLULUSAy juga bernilai sangat baik .
68%) dan untuk kelas AuTIDAK LULUSAy bernilai sempurna .
%), hal ini menunjukkan bahwa model sangat jarang melakukan suatu kesalahan.
Begitu pula pada class recall untuk kelas AuLULUSAy adalah 100.
yang berarti model mendeteksi semua kasus AuLULUSAy dengan benar.
Recall untuk kelas AuTIDAK LULUSAy adalah 90.
48%, menunjukkan bahwa ada beberapa kasus AuTIDAK LULUSAy yang tidak terdeteksi dengan benar.
Dengan hasil ini, model algoritma C4.
5 yang digunakan sangat efektif dan akurat dalam memprediksi hasil uji kendaraan, baik untuk kelas AuLULUSAy maupun AuTIDAK LULUSAy.
Gambar 8.
Decision Tree pada aplikasi RapidMiner 3 Perhitungan Manual Menggunakan Excel algoritma C4.
dengan Algoritma Nayve Bayes Pada Gambar 8 menunjukkan atribut yang paling Pada perhitungan algoritma Nayve Bayes, dataset penting dalam menentukan apakah kendaraan lulus yang digunakan tetap menggunakan 3.
264 record atau tidak adalah nilai pengukuran kelayakan ban.
dimana untuk pembagian data training disini Jika kelayakan ban memenuhi syarat, atribut 000 record dan untuk data test berikutnya yang diperiksa adalah kekuatan sinar 264 record.
Berikut adalah langkahlampu utama, total gaya pengereman, dan terakhir Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika langkah untuk melakukan perhitungan manual menggunakan Excel dengan algoritma Nayve Bayes.
Perhitungan Probabilitas Prior (P(Clas.
) Dalam Probabilitas Prior (P(Clas.
) diperlukan penghitungan jumlah total instance untuk setiap kelas dalam data training.
Setelah itu probabilitas prior untuk setiap kelas dapat dihitung dengan membagi jumlah instance dari masing-masing kelas dengan jumlah total instance dalam data training dengan hasil pada Tabel 6.
Tabel 6.
Probabilitas Prior Kelas Jumlah Probabilitas Prior Lulus Tidak Lulus Pada Probabilitas (P(Clas.
Attribute.
) dalam algoritma Nayve Bayes dihitung dengan mengalikan probabilitas prior (P(Clas.
) (P(Attribute | Clas.
) dalam setiap atribut untuk kemudian menormalkan hasilnya seperti pada Tabel Tabel 8.
Probabilitas Posterior (P(Clas.
Attribute.
) Probabilitas Probabilitas Probabilitas Prior P(> 1.
Clas.
P(> 50%|Clas.
P(> 12.
000 c.
Clas.
Posterior .
idak Posterior (Ternormalisas.
LULUS
TIDAK LULUS
Kelas Dari probabilitas posterior tersebut dapat disimpulkan bahwa untuk memprediksi kelas dengan instance baru menggunakan atribut AuKelayakan Ban > 1.
6mmAy.
AuTotal gaya pengereman > 50%Ay, dan AuKekuatan sinar lampu utama > 12.
000 cdAy diperoleh hasil probabilitas berikut :
Perhitungan Probabilitas Likelihooda.
Probabilitas Posterior untuk kelas AuLULUSAy:
(P(Attribut.
Clas.
) ycE.
aycOyaycOycI.
Oy Pada Likelihood ycE.
aycOyaycOycI)ycu ycE(> 1.
6 ycoyc.
yaycOyaycOycI)ycu (P(Attribut.
Clas.
) di setiap atributnya perlu ycE (> 50%.
aycOyaycOycI)ycu ycE (> 12.
yaycOyaycOycI) menghitung jumlah instance yang terjadi pada setiap kelas dalam data training.
Setelah itu probabilitas ycE.
aycOyaycOycI.
likelihood untuk setiap atribut dalam setiap kelas Oy 0.
973 ycu 1.
00 ycu 1.
00 ycu 1.
dapat dihitung dengan membagi jumlah instance dari = 0.
atribut tersebut dalam kelas dengan jumlah total instance dalam kelas seperti pada Tabel 7 berikut.
Probabilitas Posterior untuk kelas AuTIDAK LULUSAy:
Tabel 7.
Probabilitas Likelihood (P(Attribut.
Clas.
) ycE.
cNyayayaya yaycOyaycOycI.
Oy Atribut Nilai Kelas Jumlah Probabilitas Likelihood Kelayakan Ban > 1.
LULUS
cNyayayaya yaycOyaycOycI) ycu ycE(> 1.
6 ycoyco | ycNyayayaya yaycOyaycOycI) Kelayakan Ban < 1.
LULUS
Kelayakan Ban > 1.
TIDAK LULUS
ycu ycE (> 50% | ycNyayayaya yaycOyaycOycI) Kelayakan Ban < 1.
TIDAK LULUS
Total Gaya Pengereman > 50% LULUS ycu ycE ( > 12.
000ycaycc | ycNyayayaya yaycOyaycOycI) Total Gaya Pengereman < 50% LULUS
Total Gaya Pengereman Total Gaya Pengereman Kekuatan Sinar Lampu
Kekuatan Sinar Lampu
Kekuatan Sinar Lampu
Kekuatan Sinar Lampu
> 50%
< 50%
> 12.
000 cd < 12.
000 cd > 12.
000 cd < 12.
000 cd
TIDAK LULUS
TIDAK LULUS
LULUS
LULUS
TIDAK LULUS
TIDAK LULUS
aycOyaycOycI.
Oy 0.
027 ycu 0.
35 ycu 0.
53 ycu 0.
= 0.
Pada Tabel 7 memperlihatkan bahwa Probabilitas likelihood memberikan informasi tentang seberapa Normalisasi Probabilitas Posterior sering suatu nilai atribut muncul dalam masingUntuk mendapatkan nilai total probabilitas posterior masing kelas.
Atribut "Alur Ban", "Total gaya yang ternormalisasi adalah sebagai berikut :
pengereman", dan "Kekuatan Pancar" memiliki nilai Perhitungan Total Probabilitas Posterior :
yang sangat mempengaruhi klasifikasi "LULUS" dan ycNycuycycayco = 0.
0039 = 0.
"TIDAK LULUS".
Probabilitas likelihood ini digunakan dalam perhitungan posterior dalam2.
Normalisasi probabilitas tiap kelas :
algoritma Nayve Bayes untuk memprediksi kelas ycE( yaycOyaycOycI O yaycycycycnycaycycyceyc ) = = 0.
suatu instance berdasarkan nilai-nilai atributnya.
ycE( ycNyayayaya yaycOyaycOycI O yaycycycycnycaycycyceyc ) = Perhitungan Probabilitas Posterior (P(Clas.
Attribute.
) = 0.
Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Dari perhitungan di atas, probabilitas posterior yang ternormalisasi menunjukkan bahwa instance baru dengan atribut Kelayakan Ban > 1.
6 mm.
Total gaya pengereman > 50%, dan Kekuatan sinar lampu utama > 12.
000 cd lebih mungkin termasuk dalam kelas "LULUS" dengan probabilitas sekitar 99.
dibandingkan dengan kelas "TIDAK LULUS" yang hanya memiliki probabilitas sekitar 0.
4 Implementasi Algoritma Nayve Bayes Menggunakan RapidMiner Implementasi algoritma Nayve Bayes diaplikasikan dengan tools RapidMiner versi 9.
008 dengan menggunakan split data.
Adapun pembagian data tersebut sebesar 2.
000 record data training dan 1.
data testing.
Adapun proses pemodelan menggunakan algoritma Nayve Bayes dalam suatu alat analisis data yang diterapkan pada gambar 11.
menghitung probabilitas prior untuk setiap kelas berdasarkan data training.
Dengan probabilitas prior yang lebih tinggi untuk kelas "LULUS" .
model akan cenderung memprediksi "LULUS" kecuali ada bukti kuat dari atribut yang menunjukkan Probabilitas prior ini dikombinasikan dengan distribusi atribut untuk membuat prediksi akhir menggunakan algoritma Nayve Bayes.
distributions" menunjukkan bahwa model Nayve Bayes menggunakan 8 atribut .
untuk menentukan distribusi probabilitas.
Setiap atribut akan memiliki distribusi probabilitas tersendiri yang .
bahwa data baru termasuk dalam salah satu kelas.
Distribusi ini digunakan dalam rumus Nayve Bayes untuk menghitung probabilitas posterior ycE (Class O Attributes ), yang kemudian digunakan untuk membuat prediksi Hasil pengukuran akurasi Hasil evaluasi model Nayve Bayes berdasarkan confusion matrix dan metrik kinerja lainnya dapat dilihat pada gambar 13.
Gambar 11.
Proses pemodelan menggunakan algoritma Nayve Bayes pada RapidMiner Pada gambar 11.
Proses yang ditampilkan adalah proses standar dalam membangun, menerapkan, dan mengevaluasi model klasifikasi menggunakan algoritma Nayve Bayes.
Model ini pertama-tama dilatih dengan data training, kemudian diterapkan pada data testing, dan akhirnya dievaluasi menggunakan metrik kinerja untuk menentukan efektivitas model dalam melakukan prediksi.
Simple Distribution Representasi dari distribusi probabilitas untuk kelas yang diprediksi oleh model Nayve Bayes berdasarkan data training.
Hasil model distribusi sederhana yang dihasilkan oleh algoritma Nayve Bayes untuk atribut label "Hasil PengujianAy dapat dilihat pada gambar 12.
Gambar 12.
Simple Distribution model algoritma Nayve Bayes Hasil Simple Distribution dari model Nayve Bayes memberikan informasi tentang bagaimana model Gambar 13.
Hasil akurasi algoritma Nayve Bayes dengan confusion matrix Model Nayve Bayes memiliki akurasi yang sangat tinggi .
13%) sehingga menunjukkan bahwa model ini sangat efektif dalam memprediksi hasil uji Pada tingkat precision untuk kelas AuLULUSAy adalah 81.
82%, menunjukkan bahwa model jarang melakukan kesalahan positif pada kelas AuAyLULUSAy, tetapi masih ada beberapa kesalahan positif pada kelas AuTIDAK LULUSAy.
Recall pada kelas AuLULUSAy bernilai 99.
51%, yang berarti model mendeteksi hampir semua kasus AuLULUSAy dengan Recall untuk kelas AuTIDAK LULUSAy adalah 38%, menunjukkan bahwa ada beberapa kasus AuTIDAK LULUSAy yang tidak terdeteksi dengan Dengan hasil ini, model Nayve Bayes yang digunakan sangat efektif dan akurat dalam memprediksi hasil uji kendaraan, khususnya dalam mendeteksi kendaraan yang "LULUS".
Namun, ada ruang untuk perbaikan dalam mendeteksi kendaraan Diterima Redaksi :18 Juli 2024 | Selesai Revisi : 17 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 .
140-154 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika yang "TIDAK LULUS", meskipun hasilnya sudah cukup baik.
IV.
KESIMPULAN DAN SARAN
KESIMPULAN
Berdasarkan data hasil perbandingan pada model pengujian kendaraan bermotor menggunakan algoritma C4.
5 dan Nayve Bayes dapat disimpulkan Tingkat Akurasi Pada algoritma C4.
5 menunjukkan bahwa akurasi yang sangat tinggi dalam memprediksi hasil pengujian kendaraan bermotor, dengan akurasi Sedangkan pada algoritma Nayve Bayes sedikit lebih rendah yang bernilai 99.
Precision dan Recall Untuk kelas AuLULUSAy pada algoritma C4.
memiliki precision sebesar 99.
68% dan recall sempurna 100%.
Sedangkan pada algoritma Nayve Bayes memiliki precision sebesar 81.
82% dan recall Kemampuan Deteksi Algoritma C4.
5 lebih unggul dalam mendeteksi kendaraan yang AuTIDAK LULUSAy dibandingkan dengan Nayve Bayes, hal ini terlihat pada precision dan recall yang lebih tinggi pada kelas AuTIDAK LULUSAy.
Sedangkan Nayve Bayes memiliki performa yang sangat baik dalam mendeteksi kendaraan yang AuLULUSAy, namun sedikit lebih rendah dalam mendeteksi kendaraan yang AuTIDAK LULUSAy dibandingkan dengan C4.
Kecepatan Komputasi dan Kompleksitas Model Untuk algoritma Nayve Bayes umumnya lebih cepat dalam komputasi dikarenakan asumsi independensi antar atribut, yang membuatnya lebih efisien dalam menghitung probabilitas.
Kemudian untuk algoritma C4.
5, meskipun sedikit lebih kompleks dan lebih memerlukan waktu komputasi yang lebih lama, algoritma ini dapat memberikan pohon keputusan yang dapat diinterpretasikan dengan mudah dan memberikan wawasan yang lebih jelas mengenai aturan-aturan klasifikasi.
Penggunaan Atribut Algoritma C4.
5 mampu menghasilkan pohon keputusan yang mengidentifikasi atribut-atribut yang paling berpengaruh dalam klasifikasi, seperti kelayakan ban, kekuatan sinar lampu utama, dan total gaya pengereman.
Sementara pada algoritma Nayve Bayes lebih kepada penghitungan probabilitas menunjukkan pentingnya atribut-atirbut seperti kelayakan ban dan total gaya pengereman.
SARAN