Infotekmesin Vol.
No.
Juli 2024 p-ISSN: 2087-1627, e-ISSN: 2685-9858 DOI: 10.
35970/infotekmesin.
2314, pp.
Pembelajaran Ensemble Untuk Klasifikasi Ulasan Pelanggan E-commerce Menggunakan Teknik Boosting Matius Rama Hadi Suryanto1*.
Danang Wahyu Utomo2 1,2Program Studi Teknik Informatika.
Universitas Dian Nuswantoro 1,2Jalan Imam Bonjol No.
207 Semarang Tengah.
Semarang.
Jawa Tengah.
Indonesia E-mail: 111202012395@mhs.
id1, danang.
wu@dsn.
Abstrak Info Naskah:
Naskah masuk: 22 Mei 2024 Direvisi: 25 Juni 2024 Diterima: 2 Juli 2024 Saat ini aktivitas jual beli telah banyak dilakukan pada layanan e-commerce.
Tingginya pengguna e-commerce menjadi faktor utama dalam meningkatkan kualitas layanan ecommerce.
Salah satu faktor peningkatan kualitas layanan e-commerce adalah ulasan Ulasan pelanggan berguna bagi pemilik toko untuk mengetahui produk yang ditawarkan memiliki ulasan positif atau negatif.
Masalah utama adalah jumlah ulasan pelanggan yang banyak menjadi kendala pemilik toko dalam melakukan klasifikasi ulasan pelanggan.
Penelitian ini mengusulkan klasifikasi ulasan pelanggan menggunakan pembelajaran ensemble dengan teknik boosting yaitu XGBoost.
AdaBoost.
Gradient Boosting dan LightGBM.
Teknik yang diusulkan ditujukan untuk meningkatkan performa algoritma.
Pada skenario uji, teknik majority voting digunakan untuk menghasilkan performa terbaik dari masing Ae masing algoritma.
Hasil menunjukkan bahwa algoritma XGBoost menghasilkan akurasi lebih tinggi dari teknik boosting lainnya yaitu sebesar 92.
Pada analisis matriks evaluasi presisi, recall, dan F1-Score XGBoost menghasilkan nilai true positif lebih tinggi dibandingkan Teknik lainnya seperti AdaBoost.
Gradient Boosting dan Light GBM.
Abstract Keywords:
sentiment analysis.
e-commerce.
ensemble learning.
Selling and buying activities are carried out in e-commerce services.
The high number of e-commerce users is the main factor in improving the quality of e-commerce One factor in improving the quality of e-commerce services is customer Customer reviews are useful for shop owners to find out whether the product has positive or negative reviews.
The main problem is that the large number of customer reviews is an obstacles for shop owners in classifying customer reviews.
This study proposes classifying customer reviews using ensemble learning with boosting techniques such as XGBoost.
AdaBoost.
Gradient Boosting, and LightGBM.
The proposed technique is aimed at improving the performance of the algorithm.
In a test scenario, majority voting use to produce the best performance from each algorithm.
The result shows that the XGBoost algorithm produces higher accuracy than other techniques are 92.
In matric evaluation of precision, recall, and F1-Score.
XGBoost produces higher true positive values than other techniques such as AdaBoost.
Gradient Boosting, and Light GBM.
*Penulis korespondensi:
Matius Rama Hadi Suryanto E-mail: 1111202012395@mhs.
p-ISSN: 2087-1627, e-ISSN: 2685-9858 Pendahuluan Perkembangan teknologi telah berkembang pesat dan memberikan dampak perubahan perilaku dalam kehidupan sehari Ae hari.
Salah satu perubahan besar adalah aktivitas jual Saat ini aktivitas jual beli banyak dilakukan melalui Melalui e-commerce, platform yang memberikan kemudahan aktivitas jual beli bagi pengguna.
Menurut .
, e-commerce memberikan kemudahan bagi para pelaku bisnis dalam memasarkan produknya secara luas.
Pemasaran produk dapat disebarkan secara luas untuk mendapatkan pembeli atau konsumen yang lebih besar.
Adanya ecommerce terbukti menjadi faktor pendorong utama pelanggan menggunakan platform e-commerce .
Dari sisi pelanggan, e-commerce memberikan kemudahan dalam pencarian produk tanpa terbatas ruang dan waktu.
Peningkatan e-commerce ditandai dengan tingginya jumlah pengguna pada platform jual beli online.
Menurut laman website dataindonesia.
id jumlah pengguna ecommerce di Indonesia pada tahun terakhir 2023 adalah 196,47 juta jiwa.
Transaksi jual beli dalam platform ecommerce melibatkan data pengguna dan produk.
Dapat disimpulkan bahwa banyaknya pengguna e-commerce maka data produk dan data pengguna yang digunakan juga besar.
Layanan dalam platform menyediakan produk dalam jumlah besar .
Produk yang ditawarkan dalam platform ecommerce memiliki bermacam Ae macam variasi jumlah dan deskripsi produk.
Peningkatan layanan e-commerce terus dilakukan untuk memberikan layanan terbaik kepada para pelanggan.
Peningkatan layanan tidak hanya fokus pada kemudahan dalam transaksi namun juga fokus pada sisi kemudahan pelanggan dalam mengoperasikan perangkat, sistem memberikan rekomendasi produk, dan kategorisasi produk.
Selain itu, peningkatan layanan e-commerce dan produk juga dapat melibatkan pengguna yaitu melalui ulasan pelanggan.
Beberapa peneliti telah mengusulkan alat, metode, dan model dalam meningkatkan layanan e-commerce:
penggunaan kecerdasan buatan dalam e-commerce .
, klasifikasi produk.
, kategorisasi produk .
, analisis sentimen ulasan pelanggan .
, analisis sentimen ulasan produk .
Ulasan pelanggan menjadi satu hal yang penting dalam upaya peningkatan kualitas layanan e-commerce.
Ulasan pelanggan adalah hasil review atau komentar dari pelanggan terhadap produk yang ditawarkan.
Ulasan pelanggan sangat berguna bagi pelaku bisnis untuk mengetahui kualitas dari produk dari sisi konsumen .
Ulasan atau komentar memberikan beragam informasi dan umpan balik terhadap kualitas produk yang ditawarkan.
Komentar berupa kritik, saran dan rating dari angka dapat menjadi evaluasi dalam peningkatkan layanan e-commerce.
Ulasan juga digunakan untuk mengetahui tren dari produk yang banyak diminati .
Dari beragam ulasan tersebut dapat dianalisis untuk mengetahui produk mana yang banyak diminati pelanggan dan mengikuti tren saat ini.
Ulasan pelanggan menjadi bagian penting bagi pelaku bisnis dalam meningkatkan kualitas layanan e-commerce.
Namun, permasalahan juga ditemukan dalam penggunaan ulasan pelanggan.
Beragamnya ulasan pelanggan dan banyaknya produk yang diulas menjadi faktor pelaku bisnis atau pemilik toko kesulitan dalam melakukan analisis ulasan pelanggan .
Pemilik toko membutuhkan waktu untuk melakukan analisis ulasan pelanggan guna mengetahui ulasan yang baik atau sebaliknya.
Menurut Istiqamah .
, ketidakseimbangan jumlah ulasan pelanggan juga menjadi masalah dalam menganalisis ulasan pelanggan.
Ulasan yang tidak seimbang dapat menjadikan kesalahan dalam menganalisis ulasan pelanggan.
Jika diterapkan pada model atau algoritma dapat menjadikan performa tidak optimal.
Berdasarkan penelitian terdahulu, solusi terkait permasalahan analisis ulasan pengguna telah diusulkan.
Pendekatan, model dan algoritma diusulkan untuk mengatasi permasalahan ulasan pelangan: algoritma XGBoost .
, ensemble learning .
, random forest .
, support vector machine (SVM) .
K Nearest Neighbor (KNN) .
Solusi ulasan pelanggan berbasis klasifikasi teks dianggap mampu menangani permasalahan dalam analisis sentimen ulasan pelanggan.
Berdasarkan uraian diatas, studi ini mengusulkan pembelajaran ensemble .
nsemble learnin.
untuk klasifikasi ulasan pelanggan.
Pembelajaran ensemble menggabungkan algoritma dengan performa yang lemah, kemudian dilatih dengan model baru untuk mendapatkan performa yang lebih dari sebelumnya.
Teknik boosting mampu memberikan akurasi lebih baik dibandingkan algoritma individu dalam pembelajaran mesin .
Pada penelitian ini menggunakan algoritma XGBoost dengan pendekatan teknik boosting yang digunakan untuk menggabungkan beberapa pohon keputusan .
ecision tre.
untuk meningkatkan performa dari model sebelumnya.
Metode 1 Ensemble Learning Pembelajaran ensemble adalah teknik dalam pembelajaran mesin yang digunakan untuk meningkatkan kinerja dan akurasi model dengan menggabungkan hasil prediksi dari beberapa model atau algoritma yang berbeda.
Teknik ini menggabungkan beberapa algoritma atau model dengan performa yang kurang baik untuk menghasilkan model dengan performa yang lebih baik dibandingkan pembelajaran tunggal.
Menurut Mamun N .
, pembelajaran ensemble merupakan teknik menggabungkan pengklasifikasi dasar .
ase classifie.
untuk mengembangkan model baru dengan menggunakan performa pengklasifikasi individu.
Teknik ensemble menghitung komputasi rata Ae rata probabilitas dari pengklasifikasi dasar.
Hasil maksimum dari probabilitas tersebut digunakan sebagai label akhir.
Pada penelitian ini pembelajaran ensemble diusulkan untuk menggabungkan teknik boosting dengan tujuan mencari performa terbaik dari algoritma tunggal seperti XGBoost.
AdaBoost.
Gradient Boosting dan LightGBM Dari algoritma tunggal tersebut dijadikan sebagai pengklasifikasi dasar untuk mendapatkan hasil atau performa terbaik dari hasil pembelajaran ensemble 2 Teknik Boosting Teknik boosting adalah teknik dalam pembelajaran mesin yang melatih pembelajar .
dengan performa yang lemah untuk menghasilkan model dengan performa p-ISSN: 2087-1627, e-ISSN: 2685-9858 yang kuat.
Secara teknis, teknik boosting melatih pembelajar lemah, menghitung prediksi, memilih sampel yang terklasifikasi tidak sesuai, melatih pembelajar lainnya dengan sampel salah dari iterasi sebelumnya.
Salah satu tujuan utama teknik boosting adalah meningkatkan pembelajar lemah dengan bias yang tinggi .
Algoritma seperti AdaBoost.
XGBoost memberikan performa yang lebih baik.
Menurut Bertini Junior, metode ensemble dengan teknik boosting mampu diterapkan dalam pembelajaran mesin dan memberikan hasil terbaik .
Pada penelitian ini menggunakan pembelajaran ensemble dengan teknik boosting seperti AdaBoost.
XGBoost.
Gradient Boosting dan LightGBM.
Tujuannya, untuk menguji pembelajar dengan performa yang lemah dan mendapatkan hasil dari pembelajaran dengan akurasi lebih baik dari algoritma individu.
Kata sebelum pra pemrosesan:
AuIt was nice produt.
I like it\'s design a lot.
It\'s easy to And.
Looked stylish.
Ay Kata setelah pra pemrosesan:
Aunice produt like design lot easy carry looked stylishAy pada contoh diatas, beberapa kata telah dihilangkan setelah dilakukan proses pra pemrosesan seperti kata AoIAo.
AoitAosAo.
Aoit wasAo.
Tahap ketiga adalah pelabelan data yaitu memberikan label data seperti positif .
dan negative .
untuk memudahkan dalam komputasi probabilitas label.
Tahap keempat adalah pembagian data .
plit dat.
yaitu dataset dibagi kedalam data uji dan data latih untuk diterapkan pada model klasifikasi.
Tahap kelima pengaturan model klasifikasi yaitu pengaturan XGBoost dalam pembelajaran ensemble dengan menggunakan majority voting.
Tahap keenam adalah evaluasi menggunakan confusion matrix untuk mengetahui model dengan membandingkan prediksi model dari nilai aktual data.
Tabel confusion matrix menghasilkan nilai true positive, true negative, false positive, false negative.
Dari matriks ini dapat digunakan untuk mengetahui nilai akurasi, presisi, recall dan f1-score.
4 Sekenario Uji Skenario uji dimulai dengan pengaturan data uji dan data latih yaitu data uji 20% dan data latih 80%.
Pengaturan selanjutnya adalah pengaturan parameter pada pelatihan XGBoost atau biasa disebut pengaturan hyperparameter yang meliputi: n_estimator, learning_rate dan max_depth.
Berikut Tabel I daftar pengaturan hyperparameter pada XGBoost Model XGBoost.
Gradient Boosting.
LightGBM Gambar 1.
Alur eksperimen 3 Eksperimen Berdasarkan alur eksperimen pada Gambar 1, tahap pertama dimulai dari pengumpulan data yaitu menggunakan data publik flipkart yang diambil dari laman https://w.
com/datasets/kabirnagpal/flipkartcustomer-review-and-rating.
Dataset tersebut merupakan kumpulan ulasan pengguna yang fokus pada produk Dataset terdiri dari 2 kolom yaitu review dan rating dengan jumlah 9976.
Format dataset adalah csv.
Tahap kedua adalah pra pemrosesan data yaitu tahap pembersihan data dengan cara mengubah ulasan ke konversi huruf kecil, menghilangkan kata Ae kata tidak relevan yang sering muncul .
topword remova.
, mengganti kata dengan pola kata yang baku .
e su.
, mengecek dan menghapus data yang kosong, dan data ganda.
Sebagai contoh kata pada dataset baris ke 1 yaitu AdaBoost Tabel 1 Hyperparameter Tuning N_estimator Learning_rate Max_depth .
, 5, .
, 5, .
Berdasarkan pengaturan parameter pada Tabel I dengan teknik pencarian acak .
andom searc.
digunakan untuk mengetahui perbandingan performa dari masing Ae masing Khusus algoritma AdaBoost pengaturan hyperparameter hanya menggunakan n_estimator dan learning_rate.
Algoritma AdaBoost tidak menggunakan parameter max_depth.
Hasil dan Pembahasan 1 Hasil Pra-Pemrosesan Data Eksperimen dimulai dengan prapemrosesan data .
reprocessing dat.
yaitu pembersihan data.
Data dinormalisasi untuk dihilangkan beberapa hal seperti: ulasan ganda .
edundant dat.
dan ulasan kosong.
Selain itu, pembersihan juga dilakukan untuk tiap Ae tiap ulasan seperti penghilangan tanda baca, penghapusan kata tidak relevan p-ISSN: 2087-1627, e-ISSN: 2685-9858 .
topword remova.
, pengubahan kata dalam bentuk lowercase, dan mengubah kata menjadi kata dasar.
Prapemrosesan data ditujukan untuk memudahkan penghitungan pada model algoritma XGBoost.
Gambar 2.
Sample Hasil SentimentIntensity Analyze Prapemrosesan selanjutnya adalah pelabelan data, dari parameter review dan rating diberikan kolom baru yang class label, yang ditujukan sebagai penentu ulasan masuk dalam kategori positif atau negatif.
Pelabelan dengan cara memberikan nilai 1 untuk ulasan yang dianggap positif dan nilai 0 untuk ulasan yang dianggap negatif.
Pada SentimentIntensityAnalyzer.
Library tersebut menampilkan hasil masing - masing ulasan mendapatkan nilai positif, negative dan netral.
Nilai yang ditampilkan dalam rentang 01.
Pada Gambar 1 menunjukkan bahwa masing Ae masing ulasan memiliki nilai positif, negatif, dan netral.
Sebagai contoh, pada ulasan indeks ke 0 menunjukkan nilai positive 367 maka dapat diartikan bahwa ulasan tersebut adalah sentiment positif.
Gambar 3.
Sampel Hasil Pelabelan Aoclass labelAo Selanjutnya pemberian label didasarkan pada polaritas label AoratingAo.
Hal ini digunakan untuk mengetahui dari ulasan dan rating yang digunakan apakah produk memiliki sentiment positif atau negatif.
Pada Gambar 2 yaitu pada label Aoclass labelAo berisi nilai 1 dan 0.
Nilai 1 didasarkan pada rating diatas atau sama dengan 4 sedangkan nilai 0 didasarkan pada rating dibawah 4.
Hasil dari pelabelan tersebut ditampilkan dalam bentuk grafik untuk mengetahui apakah dataset yang digunakan termasuk dataset imbalanced atau balanced.
Berdasarkan Gambar 4, visualisasi ditampilkan dalam bentuk diagram pie, menunjukkan bahwa jumlah pelabelan untuk kelas 1 1% dan kelas 0 adalah 18.
dari visualisasi ini menunjukkan bahwa dataset dikategorikan dataset imbalanced karena adanya ketidakseimbangan dalam jumlah label yang dihasilkan.
Prosentase yang dihasilkan kelas 1 lebih tinggi dibandingkan kelas 0.
Gambar 4.
Visualisasi Jumlah Class Label 1 dan 0 Perlu dilakukan penyeimbangan dataset atau pengaturan agar dataset seimbang .
Upsampling adalah salah satu metode yang digunakan untuk penambahan manual pada kelas minoritas agar jumlah antara kelas Dalam hal ini jumlah kelas 0 dan kelas 1 sama atau prosentase yang dihasilkan 50%.
Tujuan utama dari upsampling adalah untuk keseimbangan data, meningkatkan performa model yang diusulkan dan mencegah terjadinya overfitting atau prediksi yang tidak akurat untuk data baru.
2 Pembagian data Setelah dilakukan prapemrosesan data, selanjutnya adalah pembagian data yaitu dibagi ke dalam data latih dan data uji.
Ukuran data uji yang digunakan adalah 0.
2 atau 20% dari total jumlah dataset yang digunakan.
Jadi, jumlah data latih yang digunakan adalah 8091 dan data uji yang digunakan adalah 1885.
3 Hasil Pemodelan Pada uji eksperimen menggunakan pembelajaran ensemble dengan teknik boosting yaitu algoritma AdaBoost.
XGBoost.
Gradient Boosting dan LightGBM.
Masing Ae masing algoritma dijalankan dengan pengaturan hyperparameter seperti pada Tabel I.
pembelajaran ensemble menggunakan Teknik majority voting untuk mendapatkan nilai terbaik dari pembelajar.
Estimator pada Teknik voting menggunakan Pembelajar dasar dalam hal ini adalah masing Ae masing algoritma.
Tujuannya, untuk melatih algoritma individu dengan performa lemah untuk mendapatkan hasil performa yang lebih baik.
Pada Tabel 2 menunjukkan hasil akurasi dengan pengaturan parameter yang telah ditentukan.
Uji pertama adalah pembelajar XGBoost.
Hasil terbaik uji Ensemble XGBoost pada n_estimator 200, learning rate 0.
2 dan max depth 9 dengan akurasi 92.
dari semua hasil uji XGBoost, tingginya n_estimator, learning rate dan max depth mempengaruhi hasil akurasi XGBoost.
Semakin besar nilai pada hyperparameter, nilai akurasi yang dihasilkan lebih besar.
p-ISSN: 2087-1627, e-ISSN: 2685-9858 Tabel 2 Hasil Pengujian Model Hyperparameter Model n_estimator XGBoost AdaBoost Gradient Boosting (GradBoos.
LightGBM Hasil Uji kedua adalah pembelajar AdaBoost.
Pada pembelajar AdaBoost hanya menggunakan parameter n_estimator dan learning rate.
Hasil akurasi terbaik adalah 34% pada parameter n_estimator 200 dan learning rate Tingginya n estimator dapat meningkatkan akurasi pada AdaBoost.
Terbukti, dengan learning rate yang sama .
namun n_estimator berbeda, nila n_estimator 200 menghasilkan akurasi lebih tinggi dibandingkan n_estimator Uji ketiga adalah pembelajar Gradient Boosting.
Uji model menggunakan pengaturan hyperparameter yang sama dengan uji XGBoost.
Hasil akurasi terbaik pada pembelajar Gradient Boosting adalah 91.
68% pada pengaturan n_estimator 200, learning rate 0.
2 dan max_depth 9.
Sama seperti pembelajar XGBoost, pada Gradient Boosting akurasi dapat dipengaruhi oleh n_estimator, learning rate, dan max Semakin tinggi nilai pada parameter tersebut semakin tinggi nilai akurasi yang dihasilkan.
Uji keempat adalah pembelajar LightGBM.
Hasil akurasi terbaik dihasilkan pada n estimator 200, learning 2, dan max depth 9 yaitu dengan nilai akurasi 91.
Dari hasil ini, faktor peningkatan performa pembelajar LightGBM juga dipengaruhi oleh parameter n_estimator, learning rate, dan max depth.
Dari keseluruhan hasil uji dapat ditarik kesimpulan bahwa pembelajar XGBoost menghasilkan performa terbaik dibandingkan pembelajar AdaBoost.
Gradient Boosting dan LightGBM.
Dalam pengaturan hyperparameter yang sama antara XGBoost.
Gradient Boosting dan LightGBM, pembelajar XGBoost unggul pada masing Ae masing Sebagai contoh, pada n_estimator 100, learning rate 0.
1, dan max_depth 5 pembelajar XGBoost menghasilkan akurasi 87.
Gradient Boosting 86.
dan LightGBM 85.
Dalam pengaturan nilai parameter terendah, pembelajar XGBoost tetap unggul melebihi pembelajar Gradient Boosting dan LightGBM Analisis pengujian model ditampilkan dalam matriks yaitu confusion matrix.
Confusion matrix adalah evaluasi performa dalam bentuk tabel yang membandingkan model yang diprediksi dengan nilai aktual data.
Pada uji pembelajar XGBoost dengan nilai akurasi tertinggi yaitu 92.
30% maka confusion matrix ditampilkan seperti pada Gambar 5.
Confusion matrix menunjukkan bahwa nilai true positif lebih besar dibandingkan nilai false negative, false positif dan true negative yaitu 1504.
Gambar 5.
Confusion Matrix - XGBoost Pada Gambar 6 menunjukkan Confusion Matrix pada pembelajar AdaBoost dengan n_estimator 200 dan learning Nilai kelas true positive lebih besar yaitu 1397 dibandingkan kelas lainnya.
Pada Gambar 7 menunjukkan Confusion Matrix pada pembelajar Gradient Boosting dengan parameter n_estimator 200, learning rate 0.
2 dan max_depth 9.
Pada Gradient Boosting nilai kelas terbesar adalah true negative dengan nilai 1489.
Pada Gambar 8, menunjukkan bahwa tabel Confusion Matrix LightGBM menghasilkan true positive 1489 pada n_estimator 200, learning rate 0.
2 dan max depth 9.
Nilai ini lebih tinggi dibandingkan kelas lainnya.
p-ISSN: 2087-1627, e-ISSN: 2685-9858 Gambar 6.
Confusion Matrix Ae AdaBoost Gambar 7.
Confusion Matrix Ae Gradient Boosting Berdasarkan hasil yang ditampilkan pada confusion matrix ketiga algoritma yaitu XGBoost.
AdaBoost dan LightGBM menghasilkan nilai true positive lebih besar dibandingkan kelas lain.
Hal ini membuktikan bahwa pembelajar atau model yang digunakan mampu menghasilkan prediksi yang sesuai dengan aktual.
Selaras dengan nilai akurasi yang dihasilkan, algoritma XGBoost menghasilkan nilai true positive lebih besar jika dibandingkan dengan AdaBoost dan LightGBM.
Hal ini dapat disimpulkan bahwa algorimta XGBoost mampu memberikan peningkatan performa lebih baik setelah dilakukan pembelajaran ensemble.
Sedangkan pada algoritma Gradient Boosting nilai true positive yang dihasilkan lebih kecil dibandingkan true negative.
Perlu adanya peningkatan pada algoritma Gradient Boosting untuk meningkatkan nilai true positive seperti penanganan data tidak seimbang, penggunaan teknik selain boosting seperti bagging dan stacking.
Analisis evaluasi confusion matrix digunakan untuk mengetahui dengan pasti bahwa prediksi kelas positif benar Ae benar positif atau sesuai.
Perlu adanya evaluasi melalui analisis presisi, recall dan f1-score.
Evaluasi presisi digunakan untuk mengevaluasi seberapa akurat model mampu melakukan prediksi kelas positif yaitu benar Ae benar Pada Tabel IV menunjukkan nilai XGBoost 0.
AdaBoost 0.
Gradient Boosting 0.
92 dan Light GBM Hanya algoritma AdaBoost yang menghasilkan presisi 90 atau 90%.
Artinya, dari keempat Teknik boosting yang digunakan, hanya AdaBoost yang memiliki performa kurang baik dalam keakuratan menghasilkan prediksi kelas positif.
Evaluasi recall digunakan untuk mengevaluasi bahwa kelas positif yang diprediksi sesuai atau benar diidentifikasi.
Hasil Tabel 3 menunjukkan bahwa algoritma XGBoost.
AdaBoost, dan Gradient Boosting menghasilkan Recall diatas 90%.
Artinya, algoritma tersebut mampu diimplementasikan pada klasifikasi ulasan pelanggan dan mampu menghasilkan prediksi klasifikasi yang benar.
Tabel 3 Analisis Matriks Model XGBoost AdaBoost GradBoost LightGBM Akurasi Precision Recall F1-Score Evaluasi F1-score merupakan evaluasi keseimbangan antara presisi dan recall.
Hasil Tabel IV menunjukkan bahwa XGBoost.
Gradient Boosting dan LightGBM menghasilkan nilai diatas 90 yang artinya tingginya nilai F1-score yang dihasilkan membuktikan bahwa model mampu bekerja dengan lebih baik dan mampu mengurangi prediksi kelas Gambar 8.
Confusion Matrix - LightGBM Kesimpulan Berdasarkan pengujian model dan analisis evaluasi confusion matrix dapat ditarik kesimpulan bahwa algoritma XGBoost menghasilkan nilai akurasi lebih baik dibandingkan AdaBoost.
Gradient Boosting dan LightGBM.
Nilai akurasi yang dihasilkan adalah 92.
p-ISSN: 2087-1627, e-ISSN: 2685-9858 akurasi juga didasarkan oleh adanya pengaturan hyperparameter seperti n_estimator, learning rate, dan max_depth.
Dari hasil ini membuktikan bahwa Teknik boosting mampu menangani beragamnya ulasan pelanggan.
Nilai akurasi tinggi memberikan kepastian bahwa hasil klasifikasi ulasan.
pelanggan yang dihasilkan dapat digunakan untuk informasi baik buruknya ulasan pelanggan terhadap suatu produk e-commerce.
Pada penelitian selanjutnya ditujukan untuk peningkatan Teknik boosting seperti AdaBoost dan Gradient Boosting.
Pada algoritma AdaBoost masih rendahnya nilai akurasi yang dihasilkan.
Pada algoritma Gradient Boosting nilai true negative melebihi true positive.
Perlu adanya peningkatan model seperti penerapan upsampling untuk menyeimbangkan .
Daftar Pustaka