933 Progresif: Jurnal Ilmiah Komputer https://ojs. stmik-banjarbaru. id/index. php/progresif/index Jl. Ahmad Yani. 33,5 - Kampus STMIK Banjarbaru Loktabat - Banjarbaru (Tlp. , e-mail: puslit. stmikbjb@gmail. e-ISSN: 2685-0877 Prediksi Keberhasilan Menindaklanjuti Pelanggan pada Dealer Mobil dengan Komparasi Algoritma Random Forest dan XGBoost DOI: http://dx. org/10. 35889/progresif. Creative Commons License 4. 0 (CC BY Ae NC) Helma Nopijani Heidy1*. Dimas Eko Putro2. Muhammad Fadli3. Erliyan Redy Susanto4 1,2,3,4Magister Ilmu Komputer. Universitas Teknokrat Indonesia. Bandar Lampung. Indonesia 3Ekonomi dan Bisnis. Politeknik Negeri Lampung. Bandar Lampung. Indonesia *e-mail Corresponding Author: helmanopijaniheidy@teknokrat. Abstract The automotive industry is facing intense competition in boosting vehicle sales, where the followup process with prospective customers plays a crucial role in sales conversion. This study develops a predictive model for the success of follow-ups at car dealerships by comparing two machine learning algorithms: Random forest and XGBoost. A dataset of Honda car dealership customers from 2023 was processed through a preprocessing stage, including handling data imbalance and encoding categorical data. The models were evaluated using accuracy, precision, recall, and F1-score metrics. The results show that XGBoost outperforms with an accuracy of 67%, compared to Random forest's 88. Both models demonstrate balanced performance across positive and negative classes, indicating a significant improvement over previous This study recommends expanding the dataset and developing a prediction-based decision support system to enhance the marketing effectiveness of car dealerships. Keywords: Machine learning. Random forest. XGBoost Abstrak Industri otomotif menghadapi persaingan ketat dalam meningkatkan penjualan kendaraan, di mana proses tindak lanjut (Follow-u. kepada calon pelanggan menjadi faktor krusial dalam konversi penjualan. Penelitian ini mengembangkan model prediksi keberhasilan Follow-up pada dealer mobil dengan membandingkan dua algoritma machine learning, yaitu Random forest dan XGBoost. Dataset pelanggan dealer mobil Honda tahun 2023 diproses melalui tahap preprocessing, termasuk penanganan ketidakseimbangan data menggunakan encoding data Model dievaluasi menggunakan metrik akurasi, precision, recall, dan F1-score. Hasil menunjukkan XGBoost unggul dengan akurasi 91,67%, lebih baik dibanding Random forest dengan akurasi 88,89%. Kedua model menunjukkan performa yang seimbang pada kelas positif dan negatif, menandai peningkatan signifikan dari pendekatan sebelumnya. Penelitian merekomendasikan perluasan dataset dan pengembangan sistem pendukung keputusan berbasis prediksi untuk meningkatkan efektivitas pemasaran dealer mobil. Kata kunci: Machine learning. Random forest. XGBoost Pendahuluan Industri otomotif merupakan salah satu sektor yang sangat kompetitif, di mana efektivitas strategi pemasaran menjadi faktor penentu keberhasilan penjualan. Salah satu aspek penting dari strategi ini adalah proses tindak lanjut . ollow-u. terhadap calon pelanggan, yang bertujuan untuk mengubah prospek menjadi konsumen aktual. Mengingat keputusan pembelian mobil sering kali melibatkan pertimbangan yang kompleks dan waktu yang panjang, pendekatan follow-up yang tepat menjadi sangat krusial dalam meningkatkan konversi penjualan . Pada praktiknya, banyak dealer mobil masih menerapkan proses follow-up secara manual dan berdasarkan intuisi individu, tanpa menggunakan pendekatan berbasis data. Hal ini Prediksi Keberhasilan Menindaklanjuti Pelanggan pada a. Helma Nopijani Heidy e-ISSN: 2685-0877 menyebabkan tidak efisiennya alokasi sumber daya tenaga pemasaran, serta sulitnya mengukur faktor-faktor yang memengaruhi keberhasilan tindak lanjut. Dari observasi data internal, tercatat bahwa tingkat keberhasilan follow-up pelanggan pada beberapa tim penjualan masih berada di bawah 60%, menandakan perlunya upaya sistematis untuk meningkatkan akurasi dalam menentukan prospek yang potensial. Seiring berkembangnya teknologi kecerdasan buatan (AI), khususnya machine learning, pendekatan prediktif berbasis data menjadi solusi yang potensial dalam mengoptimalkan strategi follow-up. Algoritma seperti Random forest dan XGBoost telah terbukti mampu melakukan klasifikasi dan prediksi yang andal pada berbagai domain, termasuk perilaku konsumen . Keduanya dapat mengolah data pelanggan dalam jumlah besar, mengenali pola-pola tersembunyi, serta memberikan rekomendasi prospek yang layak ditindaklanjuti. Model prediktif ini memungkinkan dealer untuk fokus pada pelanggan dengan kemungkinan konversi tinggi, sehingga efisiensi kerja meningkat dan hasil penjualan dapat ditingkatkan secara signifikan. Beberapa studi sebelumnya telah membandingkan performa algoritma Random forest dan XGBoost dalam konteks customer retention dan purchase behavior. XGBoost unggul dalam metrik akurasi, precision, recall. F1-score, dan ROC AUC pada dataset multisektoral, terutama setelah menerapkan teknik penyeimbangan data seperti SMOTE . Selanjutnya, studi lain menunjukkan bahwa XGBoost mencapai akurasi hingga 94. 5% dalam prediksi perilaku pembelian, melebihi model lain seperti Logistic Regression dan SVM . Penelitian ini bertujuan untuk membandingkan kinerja algoritma Random forest dan XGBoost dalam membangun model prediksi keberhasilan follow-up pelanggan di sebuah dealer Evaluasi model dilakukan berdasarkan metrik akurasi, precision, recall, dan F1-score. Hasil dari penelitian ini diharapkan dapat memberikan kontribusi dalam bentuk solusi berbasis data untuk membantu tim pemasaran dalam menentukan strategi tindak lanjut yang lebih efektif, serta memberikan sumbangan akademik dalam bidang penerapan machine learning di industri otomotif. Tinjauan Pustaka Penelitian terkait prediksi keberhasilan pekerjaan telah banyak dilakukan dengan pendekatan machine learning pada berbagai bidang. Prediksi churn pelanggan menggunakan algoritma Random forest dan XGBoost pada data pelanggan layanan telekomunikasi . Mereka menggunakan parameter histori pembelian, frekuensi kontak, dan lama berlangganan. Hasil penelitian menunjukkan bahwa XGBoost memiliki keunggulan dalam akurasi dan kestabilan prediksi dibandingkan algoritma lainnya. Machine learning diterapkan untuk mengidentifikasi pelanggan potensial pada dealer mobil dengan algoritma Decision Tree dan Random forest. Penelitian ini memproses variabel seperti usia kendaraan, jenis kelamin pelanggan, status follow-up sebelumnya, dan lokasi domisili. Hasilnya menunjukkan bahwa Random forest mampu memberikan hasil klasifikasi lebih baik dibanding metode dasar lainnya . Algoritma XGBoost dan Naive Bayes dibandingkan dalam prediksi respon pelanggan terhadap promosi e-commerce. Mereka mengolah parameter seperti waktu kunjungan, frekuensi pembelian, serta segmentasi usia. Dalam penelitian ini. XGBoost unggul dari sisi presisi dan recall dalam memprediksi keberhasilan promosi . Beragam studi sebelumnya telah membuktikan efektivitas algoritma Random forest dan XGBoost dalam prediksi sales dan perilaku konsumen. Secara langsung membandingkan SVM. Random forest, dan XGBoost dalam prediksi penjualan dan menemukan performa kuat dari kedua algoritma pohon keputusan . Begitu pula dalam konteks retail besar, hasil XGBoost lebih unggul dibanding metode klasik dalam memprediksi volume penjualan Walmart . Lebih lanjut, penelitian tentang churn pelanggan menunjukkan bahwa penggunaan teknik oversampling (SMOTE. ADASYN) dapat meningkatkan akurasi pada dataset tidak seimbang dengan model Random forest maupun XGBoost . Dalam domain perilaku pembelian konsumen. XGBoost menunjukkan keunggulan signifikan dibanding KNN. SVM, dan Random forest dari sisi stabilitas dan metrik F1, recall, precision . Studi lokal di Indonesia juga telah menunjukkan capability Random forest untuk prediksi harga mobil bekas, memperkuat relevansi aplikasi ML di industri otomotif domestic . Penggunaan XGBoost dalam sistem pendukung keputusan untuk prediksi konversi penawaran pinjaman bank. Variabel yang digunakan meliputi histori transaksi, status pekerjaan, dan wilayah geografis. Mereka menyimpulkan bahwa XGBoost sangat cocok digunakan pada data yang kompleks dan tidak seimbang, karena fitur regularisasi yang dimilikinya . Pembelajaran mesin untuk memprediksi tingkat keberhasilan pasien dalam terapi pernapasan menggunakan dataset medis. Parameter yang digunakan antara lain usia, jenis kelamin, riwayat medis, serta frekuensi terapi. Dalam penelitiannya. XGBoost memberikan Progresif: Vol. No. Agustus: 933-939 Progresif e-ISSN: 2685-0877 performa terbaik dibandingkan Logistic Regression dan Random forest dalam hal akurasi dan F1score . Berdasarkan studi-studi tersebut, dapat disimpulkan bahwa pendekatan prediktif berbasis machine learning, khususnya Random forest dan XGBoost, telah terbukti efektif dalam memprediksi keberhasilan suatu tindakan berdasarkan data historis pelanggan. Namun, sebagian besar penelitian sebelumnya fokus pada domain selain otomotif dan tidak secara spesifik mengkaji keberhasilan tindak lanjut . ollow-u. pelanggan sebagai objek prediksi. Penelitian ini menawarkan novelty dengan menerapkan kedua algoritma tersebut dalam konteks dealer mobil, memproses data real pelanggan yang mencakup status follow-up, data kontak, lokasi, hingga data kendaraan. Selain itu, penelitian ini mengevaluasi kinerja model secara menyeluruh menggunakan empat metrik evaluasi utama . kurasi, precision, recall, dan F1-scor. untuk menghasilkan model yang akurat dan praktis sebagai dukungan pengambilan keputusan bagi tim pemasaran dealer. Metodologi 1 Jenis dan Sumber Data Penelitian ini memanfaatkan dataset pelanggan dari dealer mobil Honda yang dikumpulkan melalui sistem Customer Relationship Management (CRM). Dataset tersebut mencakup informasi demografis pelanggan, data kendaraan, serta catatan hasil Follow-up selama tahun 2023. Penggunaan data serupa telah terbukti efektif dalam penelitian terkait prediksi perilaku konsumen untuk meningkatkan akurasi model. 2 Pengolahan Data (Preprocessin. Random forest dan XGBoost dalam memprediksi kredit bermasalah dan menekankan pentingnya teknik preprocessing untuk meningkatkan akurasi prediksi . Tahapan preprocessing meliputi beberapa langkah penting: Pembersihan data: Proses menghilangkan data yang duplikat serta menangani nilai yang hilang . issing value. dengan teknik imputasi median untuk data numerik dan modus untuk data kategorikal. Transformasi data kategorikal: Variabel seperti model kendaraan dan alamat diubah menjadi format numerik menggunakan teknik one-hot encoding. 3 Variabel dan Fitur Variabel fitur yang digunakan mencakup nomor polisi kendaraan, model kendaraan, tahun pembuatan, alamat, nomor telepon pelanggan, serta status hasil Follow-up sebelumnya. Target klasifikasi berupa dua kelas, yaitu Follow-up berhasil . dan tidak berhasil . , sesuai dengan skema klasifikasi biner. 4 Pembagian Dataset Dengan terbatasnya data uji yaitu 36 data uji dalam 1501 baris dan 20 kolom maka dataset dibagi menjadi data pelatihan . %) dan data pengujian . %) menggunakan stratified sampling untuk menjaga proporsi kelas target. 5 Implementasi Model . Random forest Model Random forest dikembangkan menggunakan library Scikit-learn, dengan proses optimasi hyperparameter seperti jumlah pohon . _estimator. , kedalaman maksimal pohon . ax_dept. , dan jumlah fitur yang dipilih saat pemisahan . ax_feature. Random forest bekerja dengan membangun banyak pohon keputusan dan menggabungkan prediksi dari setiap pohon untuk menghasilkan prediksi akhir yang lebih stabil dan akurat. Random forest memiliki keunggulan dalam mengurangi overfitting dibanding Decision Tree tunggal karena sifat ensemble-nya. Dalam konteks pemasaran, algoritma ini terbukti lebih akurat dalam memprediksi tingkat kepuasan pelanggan. XGBoost Model XGBoost diimplementasikan menggunakan library XGBoost dengan pendekatan boosting dan penyetelan parameter seperti learning rate, max_depth, subsample, dan n_estimators. XGBoost menggunakan teknik gradient boosting, di mana model dibangun secara bertahap untuk meminimalkan fungsi kerugian . oss functio. Secara matematis, prediksi model XGBoost pada iterasi ke-t adalah: Prediksi Keberhasilan Menindaklanjuti Pelanggan pada a. Helma Nopijani Heidy - yi. adalah prediksi pada literasi ke-t, - ft . adalah pohon regresi baru, - F adalah ruang fungsi pohon keputusan. e-ISSN: 2685-0877 Fungsi objektif yang diminimalkan dalam XGBoost adalah: Dalam berbagai studi, kombinasi Random forest dan XGBoost telah menunjukkan peningkatan performa yang signifikan dalam prediksi klasifikasi customer churn (. al ini menunjukkan potensi model untuk diadaptasi pada prediksi keberhasilan follow-up pelanggan. Evaluasi Model Model dievaluasi menggunakan metrik: akurasi, precision, recall, dan F1-score. Metrik tersebut digunakan untuk menilai keseimbangan kemampuan model dalam mengenali kelas positif dan negatif secara akurat. Analisis Perbandingan Performa Random forest. XGBoost, dan Logistic Regression dibuat perbandingan dan dinyatakan bahwa XGBoost memiliki performa terbaik dari segi akurasi dan ketahanan terhadap overfitting . Perbandingan performa antara kedua model dilakukan dengan menganalisis nilai metrik evaluasi pada data testing. Hasil dan Pembahasan 1 Sampel Data Penelitian: Dataset yang digunakan dalam penelitian ini merupakan data hasil tindak lanjut . ollow-u. pelanggan dari sebuah dealer mobil. Beberapa fitur penting yang digunakan antara lain: jenis kelamin, status follow-up sebelumnya, lokasi, sumber data, jenis kendaraan, serta label target yang menunjukkan keberhasilan atau kegagalan follow-up. Dataset awal terdiri dari 180 entri, kemudian dibagi menjadi data pelatihan . %) dan data pengujian . %) menggunakan teknik stratified sampling untuk menjaga distribusi kelas target. Gambar 1 Dataset awal 2 Evaluasi Performa Algoritma dan Analisis Perbandingan . Hasil Evaluasi Model Random forest Model Random forest yang dikembangkan menunjukkan performa yang memuaskan pada data pengujian dengan precision 0,91 untuk kelas negatif dan 0,86 untuk kelas positif. Recall untuk kelas negatif dan positif masing-masing sebesar 0,91 dan 0,86, sedangkan F1-score mencapai 0,91 untuk kelas negatif dan 0,86 untuk kelas positif. Secara keseluruhan, model ini memperoleh akurasi sebesar 88,89%. Progresif: Vol. No. Agustus: 933-939 Progresif e-ISSN: 2685-0877 Gambar 2 Confusion Matrix-Random forest Hasil Evaluasi Model XGBoost Pemodelan XGBoost pada data kampanye pemasaran menghasilkan prediksi yang lebih akurat dibandingkan model klasifikasi lainnya, terutama pada data tidak seimbang . Model XGBoost memberikan hasil evaluasi yang lebih baik dengan precision sebesar 0,91 . elas negati. dan 0,92 . elas positi. , recall 0,95 dan 0,86, serta F1-score 0,93 dan 0,89 untuk kelas negatif dan positif secara berurutan. Akurasi keseluruhan mencapai 91,67%. Gambar 3 Confusion Matrix-XGBoost . Perbandingan Performa Kedua Model Gambar 4 Perbandingan Performa 2 Model Prediksi Keberhasilan Menindaklanjuti Pelanggan pada a. Helma Nopijani Heidy e-ISSN: 2685-0877 Perbandingan metrik evaluasi menunjukkan bahwa XGBoost secara konsisten memberikan hasil yang lebih baik dibandingkan Random forest, khususnya pada akurasi dan recall kelas Hal ini menunjukkan bahwa XGBoost lebih mampu mengurangi kesalahan dalam mengklasifikasikan calon pelanggan yang tidak berhasil di-Follow-up, sehingga meningkatkan efisiensi sumber daya pemasaran. XGBoost menunjukkan performa klasifikasi kredit yang lebih baik dibanding Random forest, terutama dalam hal presisi pada data tidak seimbang . XGBoost memberikan hasil akurasi dan F1-score yang lebih tinggi dibandingkan LightGBM dalam memprediksi churn pelanggan, membuktikan efektivitasnya untuk klasifikasi biner . Namun, perbedaan performa kedua model tidak terlalu signifikan pada recall kelas positif . eduanya 0,. , yang menandakan bahwa masih terdapat ruang untuk peningkatan dalam mendeteksi keberhasilan Follow-up secara tepat. Gambar 5 Grafik Perbandingan Akurasi 3 Pembahasan Klasifikasi performa UMKM menunjukkan bahwa kombinasi preprocessing yang baik dengan model XGBoost menghasilkan peningkatan akurasi yang signifikan, mendukung strategi serupa pada prediksi Follow-up pelanggan . Berdasarkan hasil ini, beberapa rekomendasi pengembangan dapat diajukan seperti: Perluasan Dataset, dengan memp erbesar dan memperkaya data untuk membantu model belajar pola dan mengurangi risiko overfitting. Peningkatan Preprocessing juga direkomendasikan dengan menggunakan teknik lanjutan seperti ADASYN dan penghilangan noise data untuk meningkatkan kualitas input model Temuan dari penelitian ini menunjukkan bahwa kedua model mampu memprediksi keberhasilan follow-up pelanggan dengan akurasi tinggi. Hal ini menjawab permasalahan yang diangkat dalam pendahuluan mengenai ketidakefisienan strategi follow-up manual, karena kedua model machine learning ini dapat digunakan untuk memprioritaskan pelanggan potensial secara otomatis dan berbasis data. Keunggulan XGBoost yang terlihat dalam hasil evaluasi memperkuat posisinya sebagai algoritma unggulan untuk klasifikasi kompleks. Penelitian ini juga memberikan kontribusi terhadap literatur sebelumnya yang membahas penerapan machine learning pada klasifikasi perilaku pelanggan. Random forest telah digunakan secara luas dan terbukti andal, sementara XGBoost semakin populer karena efisiensinya . Penelitian ini mengintegrasikan temuan tersebut dalam konteks industri otomotif, khususnya pada tahap follow-up pelanggan, yang sebelumnya belum banyak dikaji secara mendalam. Simpulan Penelitian ini telah berhasil mengembangkan dan membandingkan dua model machine learning, yaitu Random forest dan XGBoost, dalam memprediksi keberhasilan tindak lanjut . pelanggan pada dealer mobil. Berdasarkan evaluasi yang dilakukan menggunakan metrik akurasi, precision, recall, dan F1-score, model XGBoost menunjukkan performa yang lebih unggul dengan akurasi mencapai 91,67%. Nilai precision, recall, dan F1-score pada model ini juga lebih tinggi untuk kedua kelas target dibandingkan dengan model Random forest yang memperoleh akurasi sebesar 88,89%. Hal ini menunjukkan bahwa XGBoost memiliki kemampuan yang lebih baik dalam menangani kompleksitas data dan ketidakseimbangan kelas. Walaupun demikian, kedua model menunjukkan performa yang relatif seimbang dalam mendeteksi keberhasilan maupun kegagalan follow-up pelanggan. Hasil ini menunjukkan adanya peningkatan akurasi klasifikasi berkat penerapan teknik preprocessing data seperti encoding pada variabel kategorikal. Namun, terdapat beberapa faktor yang membatasi performa optimal model, antara lain keterbatasan ukuran dataset yang relatif kecil dan pola perilaku pelanggan yang Progresif: Vol. No. Agustus: 933-939 Progresif e-ISSN: 2685-0877 Kondisi ini mengindikasikan bahwa diperlukan pendekatan pembelajaran yang lebih canggih atau pengumpulan data yang lebih representatif untuk meningkatkan akurasi dan generalisasi model prediktif pada masa mendatang. Referensi