JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
OPTIMALISASI MODEL CREDIT SCORING MENGGUNAKAN
ALGORITMA LOGISTIC REGRESSION DAN DECISION TREE
Muhammad Gald Teary [Sistem Komputer Universitas Indo Global Mandir.
[Jalan Jenderal Sudirman No.
Km.
Palembang 30.
Email :m.
gald@uigm.
ABSTRACT
This research aims to evaluate and compare two popular machine learning algorithms.
Logistic Regression and Decision Tree, in the context of credit scoring.
The focus is on optimizing these models using techniques such as regularization, ensemble methods, and data balancing.
The study emphasizes the challenges of data imbalance and multicollinearity in credit scoring, which can affect the accuracy of predictions.
Logistic Regression, optimized with LASSO regularization, and Decision Tree, optimized with AdaBoost, were evaluated based on various performance metrics such as accuracy, precision, recall.
F1-score, and ROC-AUC.
The results indicate that Logistic Regression performed better in terms of accuracy, precision, and ROC-AUC, while Decision Tree with AdaBoost demonstrated superior recall, making it more effective in detecting high-risk borrowers.
Additionally, the application of SMOTE (Synthetic Minority Over-sampling Techniqu.
improved the models' ability to predict minority class outcomes, though it caused a slight reduction in precision for Logistic Regression.
The findings suggest that Logistic Regression is ideal for institutions prioritizing model interpretability and stability, while Decision Tree with AdaBoost is better suited for those focusing on detecting at-risk borrowers in imbalanced datasets.
This research contributes to the field of credit scoring by providing insights into the application of machine learning algorithms and optimization techniques in financial institutions.
Keywords: Credit scoring.
Logistic Regression.
Decision Tree.
AdaBoost.
SMOTE
ABSTRAK
Penelitian ini bertujuan untuk mengevaluasi dan membandingkan dua algoritma pembelajaran mesin yang populer.
Logistic Regression dan Decision Tree, dalam konteks credit scoring.
Fokus penelitian ini adalah pada optimasi model menggunakan teknik-teknik seperti regularisasi, metode ensemble, dan penyeimbangan data.
Penelitian ini menyoroti tantangan ketidakseimbangan data dan multikolinearitas dalam credit scoring, yang dapat memengaruhi akurasi prediksi.
Logistic Regression yang dioptimasi dengan regularisasi LASSO dan Decision Tree yang dioptimasi dengan AdaBoost dievaluasi berdasarkan berbagai metrik kinerja seperti akurasi, precision, recall.
F1-score, dan ROC-AUC.
Hasil penelitian menunjukkan bahwa Logistic Regression memberikan performa lebih baik dalam hal akurasi, precision, dan ROC-AUC, sementara Decision Tree dengan AdaBoost menunjukkan recall yang lebih unggul, menjadikannya lebih efektif dalam mendeteksi peminjam berisiko tinggi.
Selain itu, penerapan SMOTE (Synthetic Minority Over-sampling Techniqu.
meningkatkan kemampuan model untuk memprediksi hasil kelas minoritas, meskipun menyebabkan sedikit penurunan pada precision untuk Logistic Regression.
Temuan ini menunjukkan bahwa Logistic Regression lebih cocok untuk lembaga yang mengutamakan interpretabilitas dan stabilitas model, sementara Decision Tree dengan AdaBoost lebih sesuai untuk lembaga yang fokus pada deteksi peminjam berisiko pada dataset yang tidak seimbang.
Penelitian ini memberikan kontribusi bagi bidang credit scoring dengan memberikan wawasan tentang penerapan algoritma pembelajaran mesin dan teknik optimasi pada lembaga keuangan.
Kata Kunci: Credit scoring.
Logistic Regression.
Decision Tree.
AdaBoost.
SMOTE JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025 Pendahuluan 1 Latar Belakang C Pemberian kredit merupakan salah satu aspek penting dalam sistem perbankan dan lembaga keuangan di seluruh dunia.
Kredit memungkinkan individu dan perusahaan untuk mengakses dana yang diperlukan untuk investasi, pengembangan, atau konsumsi.
Namun, pemberian kredit yang tidak tepat dapat menyebabkan risiko besar bagi lembaga keuangan, seperti gagal bayar atau kredit macet, yang dapat berimbas pada stabilitas Oleh karena itu, sistem credit scoring atau penilaian kelayakan kredit menjadi sangat penting dalam membantu lembaga keuangan membuat keputusan yang Credit scoring adalah metode yang digunakan untuk menilai kelayakan calon peminjam berdasarkan data historis dan informasi terkait lainnya.
Dalam proses ini, data peminjam dikumpulkan dan dianalisis untuk memprediksi apakah calon peminjam memiliki kemampuan untuk membayar kembali pinjaman mereka.
Sistem ini memainkan peran vital dalam memperkecil ketidakpastian yang ada, dengan memberikan indikator yang jelas mengenai risiko yang terkait dengan pemberian Seiring dengan kemajuan teknologi dan meningkatnya ketersediaan data, lembaga keuangan kini memiliki akses ke data yang jauh lebih banyak dan Oleh karena itu, penggunaan metode analisis yang lebih canggih, seperti machine learning dan algoritma pembelajaran mesin, telah menjadi pilihan utama untuk mengembangkan model credit scoring yang lebih akurat dan efisien.
Di antara berbagai algoritma pembelajaran mesin yang dapat diterapkan dalam credit scoring.
Logistic Regression dan Decision Tree adalah dua algoritma yang paling sering digunakan.
Kedua algoritma ini memiliki keunggulan dan kelemahan masing-masing dalam hal akurasi, interpretabilitas, dan ketahanan terhadap masalah data yang tidak seimbang atau noise.
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
Mengevaluasi dan mengidentifikasi teknik optimasi yang dapat meningkatkan akurasi kedua model tersebut dalam konteks prediksi kredit.
Memberikan berdasarkan hasil evaluasi akurasi dan transparansi untuk implementasi credit scoring di lembaga 3 Metodologi Penelitian Metodologi penelitian ini menjelaskan langkahlangkah yang diambil untuk membangun dan mengevaluasi model credit scoring menggunakan algoritma Logistic Regression dan Decision Tree yang dioptimalkan dengan teknik-teknik yang relevan.
Langkah-langkah yang diambil meliputi pengumpulan data, pra-pemrosesan data, seleksi fitur, pengembangan model, dan evaluasi model.
Logistic Regression Logistic Regression adalah teknik statistik yang paling sering digunakan untuk memodelkan hubungan antara variabel dependen biner dengan satu atau lebih variabel independen.
Fungsi utama dari Logistic Regression adalah untuk memprediksi probabilitas dari dua kemungkinan hasil, yaitu 0 atau 1, misalnya penerimaan atau penolakan kredit.
Namun.
Logistic Regression cenderung kurang optimal pada dataset yang tidak seimbang, seperti yang ditemukan dalam banyak dataset kredit, di mana peminjam yang layak lebih banyak dibandingkan dengan yang tidak layak.
Untuk meningkatkan performa model Logistic Regression, teknik seperti LASSO (Least Absolute Shrinkage and Selection Operato.
dan penyeimbangan data dengan SMOTE dapat dipergunakan untuk menangani permasalahan seperti multikolinearitas dan ketidakseimbangan pada suatu kelas (Wang et al.
Decision Tree Decision Tree adalah algoritma pembelajaran mesin yang membagi data berdasarkan aturan-aturan yang dihasilkan oleh data itu sendiri.
Keputusan dibuat dengan mengikuti cabang-cabang pohon berdasarkan fitur yang Model ini sangat mudah diinterpretasikan, karena visualisasi pohon keputusan memberikan gambaran yang jelas tentang bagaimana model membuat keputusan.
Namun.
Decision Tree rentan terhadap overfitting, terutama ketika dataset sangat kompleks.
Oleh karena itu, teknik optimasi seperti AdaBoost dapat digunakan untuk meningkatkan performa Decision Tree, mengurangi overfitting, dan meningkatkan akurasi, terutama pada data yang tidak seimbang (Hidayat, 2.
2 Rumusan Masalah Berdasarkan latar belakang tersebut, rumusan masalah dari penelitian ini adalah: Bagaimana mengoptimalkan model credit scoring dengan menggunakan algoritma Logistic Regression dan Decision Tree untuk menghasilkan prediksi yang lebih akurat dan dapat diandalkan dalam proses pemberian 3 Tujuan Penelitian Penelitian ini bertujuan untuk:
Membandingkan kinerja model credit scoring berbasis Logistic Regression dan Decision Tree yang teknik-teknik regularisasi, ensemble, dan penyeimbangan data.
Pembahasan Pada bagian ini, hasil dari eksperimen yang dilakukan untuk membandingkan model Logistic Regression dan Decision Tree dalam konteks credit scoring akan dibahas.
Evaluasi dilakukan dengan menggunakan berbagai metrik untuk menilai akurasi.
JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025 Precision.
Recall.
F1-Score, dan AUC-ROC dari kedua Selain itu, pengaruh teknik optimasi seperti regularisasi LASSO.
SMOTE, dan AdaBoost akan dianalisis untuk melihat sejauh mana teknik-teknik ini dapat meningkatkan performa model.
kerugian yang besar akibat kesalahan dalam pemberian 3 Recall: 0.
Recall mengukur kemampuan model dalam menangkap semua peminjam yang seharusnya ditolak, yaitu berapa banyak peminjam yang tidak layak kredit yang berhasil teridentifikasi oleh model.
Dengan nilai Recall sebesar 91.
37%, model ini dapat mendeteksi lebih dari 91% dari peminjam yang tidak layak untuk diberi Recall yang tinggi menunjukkan bahwa model berhasil mendeteksi sebagian besar peminjam yang berisiko gagal bayar.
Meskipun Recall yang tinggi bermanfaat untuk meminimalkan pemberian kredit kepada individu yang berisiko tinggi, ini juga menunjukkan bahwa model tidak banyak melewatkan peminjam yang seharusnya ditolak.
Evaluasi Kinerja Model Hasil Evaluasi Model Logistic Regression Logistic Regression dibangun dengan menggunakan regularisasi LASSO untuk mengurangi multikolinearitas antar fitur dan menghindari overfitting.
Model ini diuji pada data latih dan data uji, dan hasilnya dievaluasi menggunakan beberapa metrik kinerja.
Tabel 1 menunjukkan hasil evaluasi kinerja Logistic Regression pada dataset yang telah dipra-pemrosesan, menggunakan data uji yang diambil dari 20% dataset.
Tabel 1.
Tabel Metrik Nilai Logistic Regression No.
Metrik
Accuracy Precision Recall F1-Score
ROC AUC
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
Nilai Logistic Regression 4 F1-Score: 0.
F1-Score adalah ukuran yang menggabungkan Precision dan Recall menjadi satu nilai tunggal dengan cara menghitung rata-rata harmonik antara keduanya.
Nilai F1-Score sebesar 92.
34% menunjukkan keseimbangan yang sangat baik antara Precision dan Recall, yang penting dalam model yang berfokus pada pengambilan keputusan yang akurat dalam penilaian kelayakan kredit.
F1-Score yang tinggi ini menandakan bahwa model ini tidak hanya dapat mengidentifikasi peminjam yang layak dengan baik, tetapi juga tidak banyak melewatkan peminjam yang seharusnya ditolak.
Nilai F1-Score yang optimal mencerminkan keseimbangan antara Precision dan Recall, yang sangat penting dalam konteks bisnis di mana kesalahan dalam pemberian kredit dapat berdampak 2 Analisis Hasil Logistic Regression 1 Accuracy: 0.
Accuracy mengukur persentase prediksi yang benar dari total data yang diuji.
Dengan nilai Accuracy sebesar 46%, model Logistic Regression menunjukkan bahwa hampir 93% dari seluruh prediksi yang dilakukan oleh model sesuai dengan label yang sebenarnya.
Hal ini menunjukkan bahwa model ini secara umum sangat baik dalam mengklasifikasikan data, meskipun perlu dicatat bahwa Accuracy saja tidak cukup untuk menilai performa model, terutama dalam kasus dataset yang tidak Akurasi yang tinggi ini menunjukkan bahwa model Logistic Regression berhasil melakukan prediksi dengan baik pada umumnya.
Namun, akurasi saja tidak memberikan gambaran lengkap mengenai kemampuan model dalam mendeteksi kelas minoritas atau peminjam yang tidak layak kredit.
4 ROC AUC: 0.
ROC AUC (Receiver Operating Characteristic Area Under the Curv.
adalah metrik yang mengukur kemampuan model dalam membedakan antara dua kelas .
ayak dan tidak layak kredi.
Dengan nilai ROC AUC 43%, model Logistic Regression menunjukkan performa yang sangat baik dalam membedakan peminjam yang layak dan tidak layak.
Interpretasi: Nilai ROC AUC yang sangat tinggi .
menunjukkan bahwa model ini memiliki kemampuan luar biasa dalam memisahkan kelas positif dan negatif.
Artinya, model ini sangat efektif dalam memberikan probabilitas yang tepat bahwa seorang peminjam layak atau tidak layak kredit.
ROC AUC yang tinggi sangat penting dalam konteks aplikasi dunia nyata, di mana model harus memiliki kemampuan untuk mengidentifikasi dengan akurat siapa yang berisiko dan siapa yang layak diberikan kredit.
Secara keseluruhan, model Logistic Regression menunjukkan performa yang sangat baik dalam memprediksi kelayakan kredit.
Dengan Accuracy 46%.
Precision 93.
Recall 91.
F1-Score 34%, dan ROC AUC 97.
43%, model ini memberikan 2 Precision: 0.
Precision mengukur seberapa banyak prediksi positif yang benar, yaitu berapa proporsi dari prediksi yang menyatakan peminjam layak kredit yang benar-benar layak kredit.
Nilai Precision sebesar 93.
menunjukkan bahwa ketika model memprediksi seseorang layak menerima kredit, 93.
33% dari prediksi tersebut benar-benar valid.
Interpretasi:Precision yang tinggi menunjukkan bahwa model memiliki tingkat ketepatan yang sangat baik dalam mengidentifikasi peminjam yang layak kredit, sehingga meminimalisir risiko memberikan kredit kepada peminjam yang tidak layak.
Hal ini sangat penting dalam konteks sistem credit scoring, karena lembaga keuangan dapat menghindari JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025 hasil yang sangat baik dalam mengidentifikasi peminjam yang layak dan tidak layak kredit.
Metrik-metrik tersebut menunjukkan bahwa model memiliki keseimbangan yang baik antara mendeteksi peminjam yang layak dan menghindari peminjam yang berisiko gagal bayar.
Keunggulan: Model ini sangat efektif dalam memprediksi kredit yang layak dan meminimalkan pemberian kredit kepada individu yang berisiko.
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
3 Recall: 0.
Recall mengukur seberapa baik model dalam menemukan semua sampel yang benar-benar positif.
Dari semua kasus yang benar-benar positif, model ini berhasil 46% di antaranya.
Analisis:
Recall yang tinggi menunjukkan bahwa model memiliki kemampuan sangat baik dalam mendeteksi kelas positif, yang sangat penting dalam aplikasi seperti deteksi penyakit atau penipuan.
Rekomendasi: Model ini sangat cocok digunakan dalam pengambilan keputusan pemberian kredit oleh lembaga keuangan, terutama dalam menghadapi dataset yang besar dan tidak seimbang.
4 F1-Score: 0.
F1-Score adalah rata-rata harmonik antara Precision dan Recall.
Nilai F1-Score sebesar 90.
94% menunjukkan keseimbangan yang sangat baik antara Precision dan Recall.
Analisis:Dengan F1-Score yang tinggi, model ini menunjukkan keseimbangan yang sangat baik antara kedua metrik ini.
1 Hasil Evaluasi Model Decision Tree Decision Tree dibangun dengan pengaturan parameter optimal dan dioptimasi menggunakan AdaBoost, yang diharapkan dapat meningkatkan akurasi model dengan mengurangi masalah overfitting yang biasa terjadi pada Decision Tree.
Model ini juga diuji pada data latih dan data uji, dengan hasil evaluasi yang disajikan pada Tabel 2.
5 ROC AUC: 0.
ROC-AUC mengukur kemampuan model dalam membedakan antara kelas positif dan negatif pada berbagai threshold.
Nilai AUC sebesar 0.
menunjukkan bahwa model ini memiliki kemampuan yang sangat baik dalam membedakan antara dua kelas.
AUC yang tinggi ini menegaskan bahwa model ini tidak hanya akurat, tetapi juga sangat baik dalam membedakan kelas positif dan negatif.
Decision Tree dengan AdaBoost pada dataset ini menunjukkan kinerja yang luar biasa dengan semua metrik utama (Accuracy.
Precision.
Recall.
F1-Score, dan ROC AUC) yang lebih dari 90%.
Keunggulan: Model ini sangat efektif dalam memprediksi dengan akurat dan mendeteksi sebagian besar kasus Mengingat AUC yang sangat baik, model ini sudah sangat baik dalam klasifikasi dan bisa lebih ditingkatkan dengan penyesuaian lebih lanjut pada hyperparameter AdaBoost.
Tabel 2.
Tabel Metrik Nilai Decision Tree dengan Adaboost No.
Nilai Decision Tree Metrik (Dengan Adaboos.
Accuracy Precision Recall F1-Score
ROC AUC
2 Analisis Hasil Decision Tree with AdaBoost 1 Accuracy: 0.
Accuracy menunjukkan persentase prediksi yang benar dibandingkan dengan total prediksi yang dibuat oleh model.
Dalam hal ini, model memprediksi dengan benar sekitar 90.
83% dari total data.
Analisis:
Dengan Accuracy lebih dari 90%, model ini menunjukkan kinerja yang sangat baik dalam membedakan antara kelas yang ada.
Namun.
Accuracy tidak selalu mencerminkan performa yang optimal dalam kasus data yang tidak C Pengaruh Teknik Optimasi: SMOTE dan AdaBoost SMOTE yang diterapkan pada dataset ini terbukti memberikan hasil yang signifikan dalam meningkatkan performa kedua model.
Pada dataset yang tidak seimbang, penerapan SMOTE menghasilkan distribusi kelas yang lebih seimbang dan meningkatkan Recall pada kedua Penggunaan AdaBoost pada Decision Tree juga terbukti efektif dalam meningkatkan performa model dengan mengurangi overfitting dan meningkatkan Precision dan Recall.
2 Precision: 0.
Precision mengukur proporsi prediksi positif yang benar di antara seluruh prediksi positif yang dilakukan oleh model.
Artinya, dari semua prediksi yang mengatakan Aupositif,Ay sekitar 89.
47% adalah benar.
Analisis: Precision yang tinggi mengindikasikan bahwa model jarang melakukan false positive, yang sangat penting dalam aplikasi-aplikasi dengan dampak besar dari kesalahan klasifikasi positif.
D Perbandingan Antara Logistic Regression dan Decision Tree Dari hasil evaluasi yang diperoleh, dapat disimpulkan bahwa Logistic Regression menunjukkan kinerja yang lebih baik dalam hal Accuracy.
Precision.
F1-Score, dan ROC AUC, sementara Decision Tree JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025 AdaBoost Recall.
Rekomendasi:
Jika tujuannya adalah untuk meningkatkan Recall.
Decision Tree dengan AdaBoost adalah pilihan yang lebih baik.
Jika Precision.
AUC, dan stabilitas model lebih diutamakan.
Logistic Regression lebih disarankan.
Tabel 3 berikut menunjukkan perbandingan keseluruhan antara kedua model:
Tabel 3.
Tabel Metrik Nilai Perbandingan Logistic Regression dan Decision Tree dengan Adaboost No.
Metrik
Accuracy Precision Recall F1-Score
ROC AUC
Nilai Logistic Regressi Nilai Decision Tree (Dengan AdaBoos.
Akurasi: Kedua model menunjukkan tingkat akurasi yang serupa, dengan model Logistic Regression sedikit lebih unggul daripada model Decision Tree dengan AdaBoost .
% vs.
93%).
Presisi: Logistic Regression memiliki presisi yang lebih tinggi .
%) dibandingkan dengan Decision Tree dengan AdaBoost .
%), yang berarti Logistic Regression sedikit lebih andal ketika memprediksi kelas "Approved.
Recall: Kedua model memiliki kinerja yang sangat mirip dalam hal Recall, dengan Logistic Regression pada 91% dan Decision Tree dengan AdaBoost pada 92%, yang berarti keduanya dapat mengidentifikasi sebagian besar kasus "Approved.
Kedua model menunjukkan kinerja yang baik dengan akurasi, presisi, dan Recall yang relatif tinggi.
Namun.
Logistic Regression sedikit lebih unggul dalam hal presisi, yang menunjukkan bahwa model ini lebih dapat diandalkan ketika memprediksi kelas "Approved.
Meskipun model Decision Tree dengan AdaBoost sedikit lebih buruk dalam hal presisi, ia tetap memiliki Recall dan akurasi yang sangat baik, yang membuatnya menjadi pilihan yang layak tergantung pada kebutuhan spesifik dari tugas klasifikasi.
Untuk peningkatan di masa depan, penalaan lebih lanjut dan validasi hyperparameter pada kedua model, terutama pada pohon keputusan dalam AdaBoost, dapat menghasilkan kinerja yang lebih baik.
Selain itu, kedua model dapat dievaluasi dengan metrik lain seperti F1Score atau ROC AUC untuk memberikan perbandingan yang lebih komprehensif dari kemampuan prediktif Gambar 1.
Confussion Matrix dari Metric Logistic Regression dan Decision Tree dengan Adaboost Confussion Matrix yang ditunjukkan pada gambar 1 dapat memberikan evaluasi komprehensif dari dua model pembelajaran mesin yang berbeda: Logistic Regression dan Decision Tree dengan AdaBoost, yang diterapkan pada masalah klasifikasi biner dengan dua kemungkinan hasil: "Approved" (Disetuju.
dan "Not Approved" (Tidak Disetuju.
Matriks ini membandingkan hasil prediksi dengan hasil yang sebenarnya.
Model Logistic Regression:
True Negatives (TN): 1076 data berhasil diklasifikasikan dengan benar sebagai "Not Approved.
False Positives (FP): 130 data salah diklasifikasikan sebagai "Approved" padahal sebenarnya "Not Approved.
False Negatives (FN): 90 data salah diklasifikasikan sebagai "Not Approved" padahal sebenarnya "Approved.
True Positives (TP): 1104 data berhasil diklasifikasikan dengan benar sebagai "Approved.
Perbandingan:
True Positives (TP): 1091 data berhasil diklasifikasikan dengan benar sebagai "Approved.
Model Decision Tree dengan AdaBoost:
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
True Negatives (TN): 1128 data berhasil diklasifikasikan dengan benar sebagai "Not Approved" False Positives (FP): 78 data salah diklasifikasikan sebagai "Approved" padahal sebenarnya "Not Approved" False Negatives (FN): 103 data salah diklasifikasikan sebagai "Not Approved" padahal sebenarnya "Approved" JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025 Analisis Kesalahan dan Potensi Peningkatan Model akurasi.
Precision.
Recall.
F1-Score, dan AUC-ROC, namun Decision Tree dengan AdaBoost lebih unggul dalam mendeteksi kelas positif.
Performa Model:
Logistic Regression menunjukkan hasil yang lebih baik dalam hal akurasi .
46%) dibandingkan dengan Decision Tree dengan AdaBoost .
83%).
Namun.
Decision Tree dengan AdaBoost unggul dalam Recall .
46%) dan F1-Score .
94%), yang menunjukkan kemampuannya dalam mendeteksi lebih banyak kelas positif secara akurat.
Logistic Regression memiliki Precision dan ROC-AUC yang lebih tinggi, namun Decision Tree dengan AdaBoost menunjukkan kemampuan yang lebih baik dalam mendeteksi kelas positif meskipun ada sedikit penurunan pada Precision.
Kesalahan Tipe I dan Tipe II .
Tipe I (False Positiv.
: Model mungkin mengklasifikasikan contoh negatif sebagai positif.
Dampak: model yang sering melakukan kesalahan tipe I bisa mengarah pada pemborosan sumber daya atau dampak negatif lainnya.
Tipe II (False Negativ.
: Kesalahan ini bisa berujung pada kasus yang terlewatkan dan menyebabkan kerugian serius.
Overfitting dan Underfitting .
Overfitting dapat terjadi pada Decision Tree dan bisa diatasi dengan pruning dan regularization.
Underfitting dapat terjadi pada Logistic Regression, terutama ketika data yang kompleks tidak dapat Pengaruh Teknik Optimasi:
Penerapan teknik AdaBoost pada Decision Tree berhasil meningkatkan Recall dan Precision, meskipun mengurangi akurasi keseluruhan dibandingkan dengan Logistic Regression.
SMOTE
(Synthetic Minority Over-sampling Techniqu.
yang diterapkan pada kedua model meningkatkan Recall, terutama untuk kelas minoritas, meskipun menyebabkan penurunan pada Precision pada Logistic Regression.
Data Imbalance SMOTE dapat digunakan untuk menyeimbangkan data dan mengurangi bias dalam model.
Feature Engineering dan Pemilihan Fitur Menggunakan teknik feature selection seperti RFE atau PCA dapat meningkatkan performa model dengan memilih fitur yang paling relevan.
Rekomendasi untuk Lembaga Keuangan:
Decision Tree dengan AdaBoost lebih cocok digunakan oleh lembaga keuangan yang memerlukan deteksi yang lebih akurat terhadap peminjam yang tidak layak, terutama pada dataset yang tidak seimbang.
Logistic Regression lebih disarankan untuk lembaga yang mengutamakan transparansi dan interpretabilitas model, serta stabilitas pada dataset yang lebih seimbang.
Potensi Peningkatan Model Peningkatan pada Logistic Regression Penyesuaian hyperparameter dan penggunaan ensemble methods seperti stacking dapat meningkatkan performa.
Peningkatan pada Decision Tree dengan AdaBoost Hyperparameter tuning dan pruning pada Decision Tree dapat mengurangi overfitting.
Peningkatan Umum Data augmentation dan ensemble learning seperti Bagging dan Gradient Boosting dapat meningkatkan stabilitas model.
Validasi Silang dan Evaluasi K-fold cross-validation dan metrik lainnya seperti MCC dapat digunakan untuk menghindari overfitting dan meningkatkan evaluasi model pada data yang lebih beragam.
ISSN PRINT : 2302-500X
ISSN ONLINE : 2477-3786
Arahan Penelitian Selanjutnya:
Penelitian ini membuka peluang untuk pengembangan lebih lanjut dalam bidang credit scoring.
Beberapa arahan untuk penelitian mendatang meliputi:
Eksplorasi algoritma lain seperti Random Forest.
XGBoost, atau Neural Networks, yang dapat memberikan akurasi lebih tinggi dan lebih tahan terhadap masalah data tidak seimbang.
Penerapan Deep Learning untuk mengatasi kompleksitas data yang lebih besar dan untuk meningkatkan kemampuan model dalam mengenali polapola yang lebih kompleks pada data kredit.
Kesimpulan Penelitian ini bertujuan untuk mengevaluasi dan membandingkan dua algoritma pembelajaran mesin yang populer.
Logistic Regression dan Decision Tree, dalam konteks credit scoring, dengan fokus pada optimasi menggunakan teknik regularisasi, ensemble, dan penyeimbangan data.
Berdasarkan hasil yang diperoleh, dapat disimpulkan bahwa Logistic Regression memberikan performa yang lebih baik dibandingkan dengan Decision Tree dengan AdaBoost dalam hal Analisis sensitivitas terhadap parameter model: Penelitian lebih lanjut dapat menyelidiki dampak pengaturan parameter (Hyperparameter Tunin.
terhadap performa model, serta evaluasi lebih lanjut mengenai cara mengoptimalkan parameter pada kedua model (Logistic Regression dan Decision Tre.
JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No.
03 Desember 2025
Daftar Pustaka