JURNAL ILMU KOMPUTER (JUIK) - VOL.
5 NO.
3 OCTOBER 20255
PERBANDINGAN ALGORITMA NAIVE BAYES.
LOGISTIC
REGRESSION DAN ARTIFICIAL NEURAL NETWORK UNTUK
KLASIFIKASI TINGKAT KESEJAHTERAAN KELUARGA
Natalia R.
Simon1*.
Alter Lasarudin2.
Wahyudin Hasyim3 Sistem Informasi.
Universitas Muhammadiyah Gorontalo
1,2,3,
Coresponding: nataliasimon769@gmail.
Submitted: 03-10-2025.
Accepted: 03-11-2025.
Published: 03-11-2025
ABSTRACT
Batu Hijau Village is one of the coastal villages located in the Bonepantai District.
Bone Bolango Regency.
The villageAos economic livelihood depends directly on the utilization of marine and coastal resources.
Most of the people living in coastal areas are classified as poor because they lack access to capital, markets, and participation in natural resource management.
Currently, the classification of family welfare levels in this area is not entirely accurate, leading to misdirected subsidy distribution.
Therefore, it is essential to understand the level of family welfare in the village.
In this study, the author used the Naive Bayes.
Logistic Regression, and Artificial Neural Network algorithms.
Based on the experimental results using RapidMiner and Google Colab tools, the Naive Bayes.
Logistic Regression, and Artificial Neural Network algorithms achieved the same performance with 100% accuracy, 100% precision, and 100% recall.
The testing results indicate that these algorithms are capable of perfectly classifying family welfare level data, demonstrating that the models can classify data without errors.
Keywords: Family Welfare Level.
Classification.
Naive Bayes.
Logistic Regression.
Artificial Neural Network
ABSTRAK
Desa Batu Hijau adalah salah satu desa di pesisir pantai yang ada di Kecamatan Bonepantai Kabupaten Bone Bolango.
Kehidupan ekonomi desa Batu Hijau mereka bergantung secara langsung pada pemanfaatan sumber daya laut dan pesisir.
Sebagian besar masyarakat yang ada di daerah pesisir pantai tergolong miskin karena mereka tidak memiliki sumber modal, tidak memiliki akses ke pasar, dan tidak terlibat dalam pengelolaan sumber daya Saat ini klasifikasi tingkat kesejahteraan keluarga di wilayah tersebut belum sepenuhnya tepat, yang mengakibatkan distribusi subsidi yang tidak tepat sasaran.
Oleh karena itu, sangat penting untuk memahami tingkat kesejahteraan keluarga di Desa tersebut.
Dalam penelitian ini, penulis menggunakan algoritma Naive Bayes.
Logistic Regression, dan Artificial Neural Network.
Berdasarkan hasil percobaan menggunakan tool rapidminer dan google colab algoritma naive bayes, logistic regression, dan artificial neural network memiliki nilai akurasi yang sama yaitu 100%, precision 100%, serta recall 100%.
Berdasarkan Hasil pengujian menggunakan tool rapidminer dan google colab algoritma Naive Bayes.
Logistic Regression, dan Artificial Neural Network mampu mengklasifikasikan data tingkat kesejahteraan keluarga dengan sempurna yang menunjukkan bahwa model mampu mengklasifikasikan data tanpa kesalahan.
Kata Kunci: Klasifikasi Tingkat Kesejahteraan Keluarga.
Naive Bayes.
Logistic Regression.
Artificial Neural Network.
PENDAHULUAN
Kesejahteraan keluarga merupakan suatu kondisi dimana seluruh kebutuhan dasar setiap anggota keluarga terpenuhi baik itu secara material, sosial, dan spritual, sehingga mereka dapat hidup layak dan sehat.
Keluarga sejahtera juga mencakup hubungan yang harmonis antar anggota keluarga, masyarakat serta lingkungan.
Kualitas keluarga sangat dipengaruhi oleh tingkat kesejahteraannya, dimana peran anggota keluarga sangat penting untuk mencapai tujuan kesejahteraan keluarga itu sendiri.
Namun, jumlah dan kualitas masalah kesejahteraan terus Keterbatasan ekonomi sosial menyebabkan banyak orang tidak dapat memenuhi kebutuhan dasar https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 Di daerah pesisir pantai, khususnya di Desa Batu Hijau, kehidupan ekonomi mereka bergantung secara langsung pada pemanfaatan sumber daya laut dan pesisir.
Sebagian besar masyarakat yang ada di daerah pesisir pantai tergolong miskin karena mereka tidak memiliki sumber modal, tidak memiliki akses ke pasar, dan tidak terlibat dalam pengelolaan sumber daya alam.
Oleh karena itu, sangat penting untuk memahami tingkat kesejahteraan keluarga di Desa tersebut.
Saat ini klasifikasi tingkat kesejahteraan keluarga di wilayah tersebut belum sepenuhnya tepat yang mengakibatkan distribusi subsidi yang tidak tepat sasaran.
Maka diperlukan Analisa data menggunakan klasifikasi agar dapat membantu dalam pengambilan keputusan.
Klasifikasi merupakan metode yang mengklasifikasikan objek berdasarkan model yang dimiliki objek klasifikasi.
Metode ini membuat model pada data pelatihan sebelumnya dan kemudian menggunakan model tersebut untuk mengklasifikasikan data baru.
Klasifikasi mempelajari suatu fungsi objektif yang mengaitkan setiap himpunan atribut .
dengan sejumlah abel kelas yang ada.
Data mining menjadi metode utama untuk menganalisis pola dan pengetahuan dari data medis guna meningkatkan ketepatan dan efisiensi dalam pengambilan keputusan klinis.
Sejumlah algoritma telah diterapkan dalam konteks ini, termasuk Nayve Bayes (NB).
Logistic Regression (LR) dan Artificial Neural Network (ANN), yang dikenal memiliki tingkat akurasi tinggi dalam proses klasifikasi.
Data mining suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam database.
Data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar.
Dalam penelitian ini, penulis menggunakan beberapa algoritma perbandingan yaitu Naive Bayes.
Logistic Regression, dan Artificial Neural Network.
Algoritma ini dipilih karena merupakan algoritma klasifikasi yang memiliki performa dan akurasi yang baik.
Dalam pengklasifikasian, algoritma Naive Bayes menggunakan konsep probabilitas sederhana untuk menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan.
Logistic regression memodelkan hubungan antara berbagai faktor independen .
eperti memori perangkat, ukuran perangkat, dan durasi batera.
dan variabel hasil .
ari kelompok harga rendah, sedang, tinggi, atau sangat tingg.
dalam data nominal atau ordinal.
Artificial Neural Network biasa digunakan untuk memproses kumpulan data yang besar, untuk dapat menyediakan informasi analisis yang dapat berguna untuk memprediksi kanat maupun identifikasi klasifikasi suatu data.
Fungsi aktivasi merupakan fungsi yang digunakan pada jaringan saraf untuk mengaktifkan atau tidak mengaktifkan neuron.
Dengan menggunakan aplikasi RapidMiner dan Google Collab sebagai Solusi untuk menganalisis penambangan data.
RapidMiner merupakan sebuah aplikasi yang digunakan dalam mengolah sebuah data dengan berbagai teknik dan metode dalam sebuah data mining, sehingga data dapat menjadi informasi yang berguna.
Google Collab merupakan platform berbasis cloud yang digunakan untuk menulis dan menjalankan kode Python secara daring melalui peramban .
tanpa memerlukan instalasi perangkat lunak tambahan.
Pada penelitian sebelumnya melakukan klasifikasi data profil nasabah yang memiliki peluang untuk mengajukan kredit pinjaman atau tidak menggunakan data mining dengan bantuan tiga algoritma yaitu Naive Bayes.
Decision Tree.
Artificial Neural Network (ANN).
Hasil yang didapatkan menunjukkan bahwa algoritma ANN menghasilkan nilai akurasi tertinggi dengan akurasi sebesar 99.
61% dan AUC = 0.
Disusul dengan decision tree menghasilkan nilai akurasi sebesar 99.
36% dan AUC = 0.
Terakhir, algoritma nayve bayes dengan nilai akurasi = 90.
79% dan AUC sebesar 0.
Dan peneliti .
menyimpulkan bahwa dalam mengklasifikasikan kualitas air diperoleh dari metode yang digunakan akan dibandingkan dan mengambil nilai akurasi tertinggi.
Hasil akurasi dari metode KNN.
Naive Bayes, dan Logistic Regression masing-masing sebesar 62%, 78.
69%, dan 89.
Kemudian peneliti .
menyimpulkan bahwa untuk mengklasifikasi penyakit Dengan menggunakan ketiga algoritma yaitu K-Nearest Neighbors (KNN).
Naive Bayes, dan Regresi Logistik.
Hasil penelitian menunjukkan bahwa metode Naive Bayes memberikan akurasi terbaik, mencapai 79% pada pembagian data 80:20.
Oleh karena itu, dapat disimpulkan bahwa algoritma Naive Bayes adalah pilihan terbaik untuk klasifikasi data diabetes dalam penelitian ini.
https://journal.
id/index.
php/juik/index METODE PENELITIAN Objek Penelitian Objek penelitian ini berfokus pada klasifikasi tingkat kesejahteraan keluarga dengan menggunakan Perbandingan Algoritma Naive Bayes.
Logistic Regression dan Artificial Neural Network.
Pengumpulan data Pengumpulan data penduduk untuk tingkat kesejahteraan keluarga dilakukan di Desa Batu Hijau.
Data yang digunakan yaitu sebanyak 156 data kepala keluarga (KK).
Dari hasil pengumpulan data tersebut akan ditemukan berapa jumlah keluarga yang termasuk kategori pra sejahtera untuk dijadikan sebagai acuan dalam pemberian bantuan sehingga tepat sasaran.
Data tersebut akan diuji menggunakan Perbandingan Algoritma Naive Bayes.
Logistic Regression dan Artificial Neural Network Untuk Klasifikasi Tingkat Kesejahteraan Keluarga.
Observasi Untuk mengumpulkan informasi dan pengambilan data, maka peneliti turun langsung untuk mengamati kondisi yang ada di desa tersebut.
Wawancara Dalam penelitian ini, wawancara dilakukan dengan aparat Desa Batu Hijau untuk mendapatkan informasi yang diperlukan dalam penelitian.
Tahapan naive bayes adalah sebagai berikut :
Menghitung jumlah kelas atau label Menghitung jumlah kasus per kelas Kalikan semua variabel Bandingkan hasil perkelas Gambar 1.
Tahapan Penelitian https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 e.
Rumus algoritma naive bayes adalah sebagai berikut:
P .
= .
Keterangan :
x : data dengan class yang belum diketahui c : hipotesis data merupakan suatu class spesifik p .
: Probabilitas hipotesis berdasar kondisi p.
: Probabilitas hipotesis .
rior probabilit.
: Probabilitas berdasarkan kondisi pada hipotesis p.
: Probabilitas c Jadikan Variabel Tak Terbatas Menjadi Non-Negatif: Hapus centang Pilih Metode Penyelesaian: GRG Nonlinie.
Nilai koefisien regresinya otomatis berubah Masukan data baru untuk melihat peluang suatu kejadian Tahapan Perhitungan Algoritma Logistic Regression Tahapan Logistic Regression adalah sebagai berikut:
Tentukan koefisien regresi b0,b1,b2 Hitung nilai logit dengan mengambil logaritma peluang probabilitas .
terjadinya suatu peristiwa menggunakan Logit .
) ycy 1Oeycy .
Buat nilai e logit yang dipangkatkan dengan nilai di kolom logit e logit = logit ^2.
Hitung nilai probabilitas yceyca ycaycu P =1 yceyca ycaycu .
Keterangan :
p adalah probabilitas nilai 1 .
roposi angka 1, rata rata Y) e adalah konstanta a dan b adalah parameter algoritma https://journal.
id/index.
php/juik/index Menghitung nilai kemungkinan log likelihood Log kemungkinan = Ln (Probabilita.
Jumlahkan semua nilai likelihood Likelihood = Sum .
ilai likelihoo.
menghitung estimasi koefisien regresi secara otomatis.
Dalam excel perhitungan koefisien regresi adalah sebagai berikut:
Instal add-in Solver Excel dengan mengeklik terlebih dahulu menu Beranda, lalu menu Add-In.
Cari dan instal Solver dengan mengikuti petunjuknya.
Pilih menu Data dari navigasi tingkat atas dan klik Solver di sisi kanan untuk menjalankan add in.
Di panel Parameter Pemecah Masalah, masukkan nilai berikut Jumlah likelihood Tetapkan Tujuan: pilih sel dengan jumlah kemungkinan logaritma Untuk: Max Dengan Mengubah Sel Variabel: Pilih sel yang berisi koefisien regresi Anda Jadikan Variabel Tak Terbatas Menjadi Non-Negatif: Hapus centang Pilih Metode Penyelesaian: GRG e.
Nonlinier.
Nilai koefisien regresinya otomatis berubah Masukan data baru untuk melihat peluang suatu kejadian Dengan Mengubah Sel Variabel: Pilih sel yang berisi koefisien regresi Anda Jadikan Variabel Tak Terbatas Menjadi Non-Negatif: Hapus centang
Tahapan Perhitungan Algoritma Artificial Neural Network
Pada tahap ini dilakukan perancangan model ANN dengan menentukan: Normalisasikan Data dengan rumus
ycuycn 0,8 ( ycuycn ycoycnycu
) 0,1
ycoycaycuOeycoycnycu Penentuan struktur ANN seperti input layer, hidden layer dan output layer.
Menentukan Bobot dan Bias ANN 2.
Melakukan tahapan feedforward Setiap neuron input dengan i = 1, 2, 3,An mendapatkan sinyal dan diteruskan ke semua neuron pada hidden Setiap neuron pada hidden layer dengan j = 1, 2, 3,An menjumlahkan sinyal-sinyal input berbobot, menggunakan persamaan sebagai berikut :
ycu yc_ycnycu ycuycn ycycnyc a.
ycn=1 yc = ycycuyc Oc Hitung sinyal output pada hidden layer kemudian kirimkan sinyal yang diperoleh ke semua neuron pada lapisan output.
Pengaktifan bobot pada hidden layer dengan menggunakan persamaan y =f .
= ( 1 yceOeycyc a.
Setiap neuron output dengan k = 1, 2, 3,A,n menjumlahkan sinyal-sinyal input berbobot :
ycy y_ycnycuycn=1 yco = ycycuyco Oc .
ycyc ycycycoa.
Hitung sinyal output pada output layer dengan menggunakan fungsi aktivasi berikut :
https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 ycyco a.
AA.
1 yceOeyc_ycnycuyco Setiap neuron input dengan k = 1, 2, 3,An menerima target pola output yang berkaitan dengan pola input dengan pelatihan.
Hitung error pada output layer :
yuyco = .
cNyco - ycyc.
* .
* 1ycyco .
yuyco adalah target output yang diharapkan.
Selanjutnya hitung perubahan bobot .
igunakan untuk memperbaiki nilai bobot ycycyco OIycycyco = ycayuyco ycyc a.
Kirimkan ini ke neuron pada lapisan tersembunyi.
Setiap neuron pada hidden layer dengan j = 1, 2, 3,An menjumlahkan faktor delta pada hidden layer, menggunakan persamaan sebagai berikut :
yu_ycnycuycoyco=1Ocyco ycyco ycycycoa.
Nilai ini dikalikan dengan turunan dari fungsi aktivasinya dan digunakan untuk menghitung informasi error pada hidden layer dengan menggunakan persamaan berikut :
yu = yu 1 yceOeycyc ) * .
- (
)) .
1 yceOeycyc Selanjutnya hitung perubahan bobot pada setiap unit keluaran .
OIycycyco = ycayuyco ycuycn a.
Selanjutnya hitung perubahan bobot input layer ke hidden layer.
OIycycycu = yca yuyco a.
Perbaharui bobot awal input layer ke hidden layer ycycnyc (Bar.
= ycycyco (Lam.
OIycycycoa.
Setiap neuron output dengan k = 1,2,3,A,n memperbaharui bobot hidden layer ke output layer .
= 0,1,2,A,.
ycycyco (Bar.
= ycycyco .
OIycycyco .
Setiap neuron pada hidden layer , dengan memperbaharui bobot persamaan .
dan biasnya persamaan .
sebagai berikut:
ycycycu (Bar.
= ycycycu (Lam.
OIycycycu .
ycycycu (Bar.
= ycycycu (Lam.
OIycycycu .
Pengujian Menjumlahkan semua produk antara nilai input dan bobotnya, ditambah dengan bias.
Proses ini adalah langkah penting dalam forward propagation, di mana informasi bergerak melalui jaringan dari lapisan input ke lapisan yc_ycnycuyc = ycycuyc Ocycuycn=1 ycuycn ycycnyc a.
AA.
kemudian dapat diteruskan ke fungsi aktivasi untuk mendapatkan output akhir dari neuron tersebut.
https://journal.
id/index.
php/juik/index yc =( yc 1 yceOeycycnycuyc ) yc a.
ycnyc menjumlahkan semua produk antara nilai output dari neuron sebelumnya dan bobotnya, ditambah dengan bias.
yc_ycnycuyco = ycycuyco Ocycyycn=1 ycycn ycycyco a.
kemudian dapat diteruskan ke fungsi aktivasi untuk menghasilkan output akhir dari neuron tersebut.
yc =( ) yc ycnyc a.
https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 yco
1 yceOeycycnycuyco
HASIL DAN PEMBAHASAN
Hasil Penelitian Tujuan dari penelitian ini adalah membandingkan Algoritma Klasifikasi Naive Bayes.
Logistic Regression, dan Artificial Neural Network.
Dataset yang digunakan dalam penelitian ini adalah Data Tingkat kesejahteraan keluarga yang terdiri dari dua kategori yaitu sejahtera dan prasejahtera.
Penelitian ini diawali dengan tahap pengolahan data awal.
Pada tahap pengolahan data awal atau prepocessing peneliti merubah data dari nominal ke numerik agar data dapat diolah di tool Rapidminer.
Hasil Pengolahan Data Awal Tahapan prepocessing adalah merubah data nominal ke numerik sehingga data dapat diolah.
Pada penelitian ini penulis menggunakan 6 atribut yang digunakan dalam mengklasifikasikan tingkat kesejahteraan keluarga.
Adapun atribut-atribut tersebut adalah Pendidikan (X.
Pekerjaan (X.
Kepemilikan Rumah (X.
Bantuan (X.
Bahan Bakar (X.
, dan Sumber Penerangan ( X.
Dan yang menjadi targetnya adalah Status Kesejahteraan (Y).
Data tingkat kesejahteraan keluarga seperti tampak pada tabel berikut.
Data Awal Data awal yang digunakan yaitu data sebanyak 155 data tingkat kesejahteraan keluarga Tabel 1.
Data Awal Sumber : Dinas sosial bone bolango 2024 Atribut data Dalam penelitian ini atribut yang digunakan yaitu pendidikan kepala keluarga, pekerjaan kk, kepemilikan rumah, bantuan, bahan bakar dan sumber penerangan https://journal.
id/index.
php/juik/index Tabel 2.
Atribut Data Data Preprocessing Preprocessing bertujuan merubah data awal menjadi data yang lebih sederhana atau mengubah data yang berupa kategori menjadi angka agar lebih mudah diolah.
Training Testing Prosedur standar adalah dengan memilih 80% data training dan 20% data testing yang digunakan sebagai data latih dan data uji.
Rasio ini memungkinkan model untuk dilatih pada jumlah data yang besar dan diuji pada jumlah data yg kecil, yang cukup dalam menetukan akurasi model dalam klasifikasi hasil dengan benar.
Pengujian Menggunakan RapidMiner Berikut tampilan pola rapidminer menggunakan aplikasi rapidminer menggunakan algoritma naive bayes, logistik regression dan artifisial Neural network dapat dilihat pada gambar 2.
Gambar 2.
Tampilan pola pada rapid miner Pada gambar 2 di atas diawali dengan import data, split data, dan multiplay.
Split data digunakan untuk membagi data training dan data testing menggunakan perbandingan 80:20%.
Jumlah data training 124 data dan data training 32 data.
Ketiga operator ini dihubungkan ke Cross validation.
Berdasarkan pengujian menggunakan aplikasi Rapidminer dengan algoritma naive bayes dapat dilihat pada https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 gambar 3.
berikut dan nilai performance dapat dilihat pada gambar 4.
Gambar 3.
Tampilan X- Validation Naive Bayes Gambar 4.
Accuracy Naive Bayes Berdasarkan data pada gambar 4.
disimpulkan bahwa hasil akurasi algoritma Naive Bayes yaitu sebesar 100%, dengan jumlah data yang di prediksi sejahtera dan true sejahtera sebanyak 94, prediksi sejahtera dan true prsejahtera sebanyak 0 dan prediksi prsejahtera true sejahtera sebanyak 0 dan prediksi prsejahtera dan true prsejahtera sebanyak Untuk nilai Precision 100%.
dan Recall 100%.
Berdasarkan pengujian menggunakan aplikasi rapidminer Miner dengan algoritma logistic Regression dapat dilihat pada gambar 5.
dan nilai performance dapat dilihat pada gambar 6.
Gambar 5 Tampilan X- Validation Logistik Regression Gambar 6 Accuracy Logistic Regression Berdasarkan data pada gambar 6.
disimpulkan bahwa hasil akurasi algoritma Logistik Regression yaitu sebesar 100%, dengan jumlah data yang di prediksi sejahtera dan true sejahtera sebanyak 94, prediksi sejahtera dan true prsejahtera sebanyak 0 dan prediksi prsejahtera true sejahtera sebanyak 0 dan prediksi prsejahtera dan true prsejahtera Untuk nilai Precision 100%.
dan Recall 100%.
Untuk nilai Precision 100%.
dan Recall https://journal.
id/index.
php/juik/index https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 Berdasarkan pengujian menggunakan aplikasi Rapidminer dengan algoritma Artificial Neural Network dapat di lihat pada gambar 7.
dan nilai performance dapat di lihat pada gambar 8.
Gambar 5.
Tampilan X -Validation Artificial Neural Network Gambar 6.
Accuracy Artificial Neural Network Berdasarkan data pada gambar 8.
disimpulkan bahwa hasil akurasi algoritma Artificial Neural Network yaitu sebesar 100%, dengan jumlah data yang di prediksi sejahtera dan true sejahtera sebanyak 94, prediksi sejahtera dan true prsejahtera sebanyak 0 dan prediksi prsejahtera true sejahtera sebanyak 0 dan prediksi prsejahtera dan true prsejahtera sebanyak 30.
Untuk nilai Precision 100%.
dan Recall 100%.
Pengujian Menggunakan Collab Gambar 7.
Script Import Library Dalam tahap ini, peneliti menggunakan platform google collab untuk menjalankan program python dengan mengimpor library yang digunakan seperti perintah pandas dan sklearn.
Gambar 8.
Script yang menghubungkan Excel ke drive Dalam tahap ini, peneliti menggunakan format drive.
mount untuk mengimpor model drive yang memungkinkan mengakses file dari drive, dan format df read excel untuk untuk membaca file excel dengan perbandingan 80:20 untuk data training dan testing.
https://journal.
id/index.
php/juik/index Gambar 9.
Potongan Kode python untuk data frame, label encorder dan encoder fitur kategorikal Pada gambar 11 ini peneliti menggunakan script data untuk fitur dari kategori yang digunakan yaitu pendidikan, pekerjaan, kepemilikan rumah, batuan, bahan bakar dan sumber penerangan.
Script df = pd.
DataFrame.
Menggunakan fungsi dari library pandas untuk mengubah dictionary menjadi DataFrame, yaitu struktur data 2 dimensi seperti tabel .
aris dan kolo.
df adalah variabel yang menyimpan hasil konversi tersebut dalam bentuk DataFrame, yang akan digunakan untuk analisis selanjutnya seperti: Pra-pemrosesan .
ncoding, scalin.
Pelatihan model klasifikasi, dan Evaluasi performa model.
Menggunakan LabelEncoder untuk mengubah kategori menjadi angka dengan format label_encoder = Label Encoder() untuk mengubah data kategorikal menjadi Gambar 10.
Mengubah fitur kategorikal, ecode target label, membagi data training dan testing, dan menstandarisasi fitur Pada gambar 12 ini peneliti menggunakan script encode target label untuk mengubah label kategori menjadi angka agar bisa diproses.
Membagi data training dan testing dengan format 80:20.
Standard Scaler():Membuat objek untuk menstandarkan fitur .
itur akan memiliki mean = 0 dan standar deviasi = .
fit_transform(X_trai.
Melakukan fit .
enghitung mean dan std dari X_trai.
dan langsung transform data pelatihan agar distandarkan.
transform(X_tes.
: Menstandarkan data uji menggunakan mean dan std dari data pelatihan, bukan dari data uji Gambar 11.
Membuat dan melatih model nayve bayes, logistic regression Pada gambar 13 ini peneliti membuat dan melatih model algoritma denga model GaussianNB():Ini merupakan sebuah model Naive Bayes untuk klasifikasi yang mengasumsikan bahwa fitur-fitur yang ada dii data terdistribusi normal atau (Gaussia.
Logistic Regression.
ax_iter=.
: Membuat model regresi logistik yang digunakan untuk klasifikasi.
Parameter max_iter=200 menyatakan jumlah maksimal iterasi dalam proses pelatihan, untuk memastikan model cukup waktu untuk konvergen .
esuai kebutuha.
fit(X_train_scaled, y_trai.
: digunakan https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 untuk melatih sebuah model regresi logistik pada data pelatihan (X_train_scale.
dan label target .
_trai.
predict(X_test_scale.
: menghasilkan prediksi berdasarkan data uji yang sudah distandarisasi (X_test_scale.
y_pred_lr: Menyimpan hasil prediksi dari model regresi logistik.
MLPClassifier .
idden_layer_sizes= .
,), dengan max_iter=2.
: Membuat model Neural Network untuk klasifikasi.
Ini hidden_layer_sizes=.
,) menyatakan bahwa terdapat satu layer tersembunyi dengan 10 neuron.
max_iter=2000 menunjukkan bahwa model diizinkan untuk melakukan 2000 iterasi selama pelatihan .
ntuk memastikan konvergensi mode.
fit(X_train_scaled, y_trai.
: Melatih model ANN pada data pelatihan yang sudah distandarisasi (X_train_scale.
dan label target .
_trai.
predict(X_test_scale.
: Menghasilkan prediksi dari model ANN berdasarkan data uji yang sudah distandarisasi (X_test_scale.
y_pred_ann: Menyimpan hasil prediksi dari model Artificial Neural Network (ANN).
Gambar 12.
Menghitung confusion matrix dan clasification report untuk masing-masing model Pada gambar 14 ini confusion_matrix.
_test, y_pred_n.
: Menghitung confusion matrix antara nilai sebenarnya .
_tes.
dan hasil prediksi .
_pred_n.
Confusion Matrix memberikan sebuah gambaran visual mengenai jumlah prediksi yang benar dan salah dari setiap kelas, termasuk true positives, true negative, false positives, dan false negatives.
classification_report.
_test, y_pred_n.
:Menghasilkan classification report yang mencakup metrik seperti: Precision: Kemampuan model untuk mengklasifikasikan dengan benar kelas positif.
Recall: Kemampuan model untuk menangkap seluruh kelas positif yang benar.
F1-score: Rata-rata harmonis antara precision dan recall.
Akurasi: Rasio prediksi yang benar dengan jumlah total prediksi.
Hasil accuracy menggunakan google collab pada algoritma naive bayes dapat dilihat pada gambar 15.
Logistic Regression gambar 16 dan Artificial neural network pada gambar 17.
Gambar 15.
Accuracy naive bayes Gambar 16.
Accuracy Logistik Regression https://journal.
id/index.
php/juik/index Gambar 13.
Accuracy Artificial Neural Network Perbandingan algoritma naive bayes, logistik regression dan artificial neural network menggunakan rapidminer dan colab.
Accuracy ANN
ANN
Gambar 14.
Perbandingan Algoritma Naive Bayes.
Logistic Regression dan Artificial Neural Network Menggunakan Rapidminer Pada gambar 18 di atas dapat di lihat bahwa perbandingan rata-rata tingkat akurasi hasil klasifikasi menggunakan Naive Bayes.
Logistic Regression, dan Artificial neural network memiliki akurasi, precission, dan recall yang sama.
Hasil percobaan menggunakan tool rapidminer untuk algoritma naive bayes, nilai akurasinya 100%, dan Algoritma Logistic Regression akurasi 100%, dan Algoritma Artificial neural network nilai akurasinya Berdasarkan akurasi yang didapatkan Algoritma Naive Bayes.
Logistic Regression dan Artificial Neural Network memiliki tingkat akurasi yang baik untuk Klasifikasi Tingkat Kesejahteraan keluarga.
Accuracy ANN
ANN
Gambar 15.
Hasil Perbandingan Algoritma Naive Bayes.
Logistic Regression dan Artificial Neural Network Menggunakan Colab Pada gambar 19 di atas dapat di lihat bahwa perbandingan yang didapatkan nilai rata-rata tingkat akurasi https://journal.
id/index.
php/juik/index e-ISSN:2774-924004 menggunakan algoritma naive bayes, logistic regression dan artificial neural network memiliki accuracy.
Precision dan recall yang sama.
KESIMPULAN
Berdasarkan Hasil pengujian menggunakan tool rapidminer dan google colab algoritma Naive Bayes.
Logistic Regression, dan Artificial Neural Network mampu mengklasifikasikan data tingkat kesejahteraan keluarga dengan sempurna , yang menunjukkan bahwa model mampu mengklasifikasikan data secara sempurna tanpa kesalahan.
Dari penjelasan diatas baik rapidminer maupun google collab memiliki kemampuan yang sangat baik dalam membangun sebuah model klasifikasi yang akurat dengan akurasi yang sama pada kedua platform.
Oleh karena itu tidak ada perbedaan yang signifikan dalam hal akurasi antara penggunaan rapidminer dan google colab, dan keberhasilan klasifikasi lebih bergantung pada kualitas data, pemilihan fitur, dan evaluasi model yang tepat.
Dengan demikian seluruh algoritma dan tool yang digunakan terbukti memiliki akurasi yang baik untuk klasifikasi tingkat kesejahteraan keluarga.
DAFTAR PUSTAKA