Jurnal Infortech Volume 7 No. 1 Juni 2025 E-ISSN: 2715-8160 Implementasi Metode Nayve Bayes Pada Ulasan Pengguna Aplikasi Dana Di Google Play Store Raenaldi Ferryan Chandra1. Dwi Andini Putri2* Universitas Bina saran Informatika e-mail: raenaldiferryan@gmail. com, dwi. dwd@bsi. Diterima 28-05-2025 Direvisi 03-06-2025 Disetujui 13-06-2025 Abstrak - Studi ini bertujuan untuk mengalisis sentimen dengan mengimplementasikan metode naive bayes pada ulasan pengguna aplikasi DANA yang terdapat di Google Play Store. Implementasi merupakan proses atau tindakan dalam menerapkan suatu ide, teori, atau rencana ke dalam bentuk yang dapat dijalankan atau digunakan secara nyata. Pendapat pada ulasan aplikasi DANA berjumlah sangat besar. Tujuan dari penelitian ini adalah untuk melakukan analisis sentimen terhadap aplikasi Dana yang ada di Google Play Store menggunakan metode Naive Bayes Classifier. Metode Nayve Bayes adalah salah satu metode klasifikasi yang populer dalam analisis sentimen karena kemampuannya yang tinggi dalam mengklasifikasikan teks berdasarkan probabilitas dari kata-kata yang terdapat di dalamnya. Pengambilan data ulasan dilakukan menggunakan teknik scraping yang dilakukan dengan Google Collab lalu data diolah hingga menhasilkan 500 data. Dari hasil Confusion Matrix menghasilkan akurasi sebesar Hasil penelitian ini membuktikan bahwa algoritma Naive Bayes Classifier memiliki performa yang tinggi dalam menganalisis sentimen ulasan pengguna aplikasi DANA. Kata kunci : Implementasi. DANA, metode Naive Bayes, scraping, google play. Abstract - This study aims to analyze sentiment by implementing the Naive Bayes method on user reviews of the DANA application on the Google Play Store. Implementation is the process or action of applying an idea, theory or plan into a form that can be implemented or used for real. Opinions on DANA application reviews are very The aim of this research is to conduct sentiment analysis of the Dana application on the Google Play Store using the Naive Bayes Classifier method. The Nayve Bayes method is a popular classification method in sentiment analysis because of its high ability to classify text based on the probability of the words contained in it. Review data was collected using a scraping technique using Google Collab and then the data was processed to produce 500 data. From the results of the Confusion Matrix, it produces an accuracy of 80. The results of this research prove that the Naive Bayes Classifier algorithm has high performance in analyzing the sentiment of DANA application user reviews. Keywords: Implementation. DANA. Naive Bayes method, scraping. Google Play. PENDAHULUAN Teknologi informasi dan komunikasi berkembang pesat pada revolusi industri keempat. Kompleksitas kegiatan, khususnya di sektor komersial, menjadi penentu periode ini. Transaksi online menjadi salah satu kemudahan yang mendorong banyak masyarakat untuk menggunakan uang elektronik atau E-Money. E-money memiliki dampak yang signifikan terhadap pemasaran digital serta sejumlah bidang lainnya, seperti transaksi online yang memfasilitasi jual beli online dan mengarah pada berkembangnya aplikasi dompet digital. (Riansyah Ramadhan & Agus Sugianto, 2. Analisis sentimen merupakan teknik yang digunakan untuk memahami opini atau perasaan pengguna http://ejournal. id/ejurnal/index. php/infortech terhadap suatu aplikasi. Dalam penelitian ini, algoritma Nayve Bayes yang telah terbukti efektif dalam klasifikasi teks akan diterapkan untuk mengolah data sentimen mengenai Aplikasi Dana yang tersedia di Google Play Store. (Novita Sianipar & Devega, 2. Algoritma Nayve Bayes adalah salah satu metode yang paling sering dimanfaatkan dalam berbagai penerapan analisis data, terutama dalam tugas klasifikasi teks dan pengolahan sentimen karena metode ini dapat menghasilkan akurasi yang baik dan (Riansyah Ramadhan & Agus Sugianto, 2. Analisis sentimen atau opinion mining adalah proses memahami, mengekstrak, dan mengolah data tekstual secara otomatis untuk memperoleh informasi Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 emosional yang terkandung dalam kalimat opini. Analisis sentimen dilakukan untuk melihat pendapat atau kecenderungan seseorang tentang suatu masalah atau objek. Tidak masalah jika orang tersebut memiliki opini negatif atau positif. (Nurian et al. Inovasi mutakhir dalam layanan pembayaran digital kini didukung oleh kemajuan teknologi yang terus Berbagai startup dan penyedia layanan dompet digital, seperti Aplikasi Dana, secara aktif memanfaatkan platform digital untuk mengembangkan sistem informasi serta merancang strategi bisnis. Meski demikian, peningkatan adopsi dompet digital, terutama di negara berkembang maupun maju, menuntut adanya pemahaman yang mendalam terkait persepsi dan sentimen pengguna terhadap aplikasi tersebut. (Cindy Caterine Yolanda et al. , 2. Dengan penggunaan aplikasi bernama Digital Wallet, nasabah dapat melakukan transaksi keuangan dengan percaya diri hanya dengan menggunakan smartphone. Setelah Gopay dan OVO. DANA menempati posisi sebagai salah satu aplikasi dompet digital yang paling sering digunakan selama masa pandemi. (Audina Rambe et al. , 2. Diluncurkan pada tahun 2018, program DANA memungkinkan pengguna melakukan aktivitas keuangan non tunai, seperti menambah dana investasi atau membayar kebutuhan sehari-hari. Sumber: . com,2. Pada gambar I. 1 terdapat jumlah pengunduh aplikasi DANA menurut data dari Google Play Store, terdapat lebih dari 100 juta lebih para pengguna yang telah mengunduh aplikasi DANA. Dengan total tersebut, pada tahun 2024 DANA yang merupakan uang elektronik atau aplikasi pembayaran pintar meraih peringkat pertama dalam penghargaan Top Publisher Award karna menawarkan beberapa fitur canggih Salah satunya dengan adanya kolaborasi antara TixID dengan DANA untuk memunculkan fitur pemesanan tiket bioskop. Tak hanya itu DANA juga telah bekerjasama dengan pihak SamSat dalam urusan pembayaran tagihan kepolisian. Salah satu hal yang menjadikan aplikasi DANA lebih unggul dari aplikasi elektronik lain yaitu DANA memberikan biaya admin Rp 0 kepada para penggunaanya saat akan melakukan pengisian saldo akun. Terlepas dari berbagai keuntungan yang ditawarkan terdapat informasi dari ojk. id pada tahun 2021 mengenai pencabutan status tercatat dengan pihak aplikasi DANA dikarenakan aplikasi DANA telah melanggar http://ejournal. id/ejurnal/index. php/infortech ketentuan yang telah diterapkan oleh ojk. Pelepasan dengan pihak OJK beriringan dengan hilangnya saldo pengguna DANA. Pengguna DANA mengalami kerugian tak terduga karena berkurangnya saldo dari aktivitas terkait Google Play. DANA telah mengatasi masalah ini dengan menjelaskan bahwa hal ini akan di ajukan claim ke Google Play. Dengan maraknya berbagai isu terkait kasus aplikasi DANA, pengguna uang elektronik perlu mengevaluasi secara cermat aplikasi pilihannya untuk memastikan transaksi yang akan dilakukan agar terhidar dari hal yang tidak diinginkan. Karena banyaknya pengguna, aplikasi Dana sering kali menerima ulasan yang negatif dan positif serta tidak ada hubungannya dengan rating yang diterima di Google Play Store. Rapid Miner merupakan platform berbasis perangkat lunak untuk mengkhususkan diri dalam analisis data. (Rofiani et al. Rapid menggunakan bahasa pemograman java. Rapid miner dapat dioperasikan diberbagai sistem operasi dan menawarkan alat analisis data yang komprehensif tanpa perlu pengetahuan teknis yang mendalam. Text mining berfokus pada analisis data berbasis teks, yakni proses mengekstraksi informasi bernilai dari kumpulan data teks berukuran besar dengan menggabungkan berbagai teknik pengolahan informasi yang berkualitas. Salah satu alat yang mendukung proses ini adalah RapidMiner, yang mampu menangani pengolahan data kompleks berkat beragam fitur dan kemampuannya. Pendekatan analisis sentimen dinilai efektif dalam menggambarkan opini atau persepsi pengguna terhadap suatu aplikasi. Penelitian ini berfokus pada pengolahan dan analisis data sentimen. Salah satu metode yang digunakan adalah algoritma Nayve Bayes, yang telah terbukti andal dalam klasifikasi Algoritma ini akan diterapkan untuk mengevaluasi ulasan pengguna terhadap Aplikasi Dana yang tersedia di Google Play Store . (Novita Sianipar. , & Devega, 2. Dalam penelitian ini, analisis sentimen pada level kalimat dilakukan dengan menggunakan pendekatan algoritma Nayve Bayes Classifier. Biasanya analisis sentimen berkaitan dengan sentimen, emosi, sikap, atau Analisis diperlukan untuk menyampaikan sentimen dan menghitung wawasan untuk menyelidiki bisnis karena data yang digunakan bersifat tekstual. Metode Nayve Bayes adalah metode yang banyak digunakan karena metode ini dapat menghasilkan akurasi yang baik dan stabil (Riansyah Ramadhan. & Agus Sugianto, 2. Memahami sentimen pengguna, baik positif maupun negatif, hanyalah salah satu aspek pentingnya analisis sentimen. Hal lainnya adalah kemampuannya membantu pengembang dalam meningkatkan kualitas layanan mereka. Walaupun algoritma klasifikasi Nayve Bayes tergolong sederhana, algoritma ini sering memberikan hasil yang akurat dan Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 efektif, terutama dalam menangani data berukuran (Ramadhan. Adam dan Maulana, 2. Dengan demikian, penelitian ini akan mengeksplorasi algoritma Nayve Bayes menganalisis data sentimen ulasan Aplikasi Dana di Google Play Store METODE PENELITIAN Dalam penelitian ini, teknik scraping data dari Google Play Store dilakukan menggunakan bahasa pemrograman Python dengan menargetkan tautan aplikasi DANA. Metode yang diterapkan dalam studi ini mengacu pada pendekatan Knowledge Discovery from Data (KDD). KDD sendiri terdiri dari lima tahapan utama, yaitu: Pengumpulan Data: Data diperoleh melalui teknik web scraping yang dilakukan pada kolom ulasan pengguna aplikasi DANA di platform Google Play Store. Pra-pemrosesan Data: Data yang telah dikumpulkan kemudian dibersihkan dari berbagai elemen yang tidak relevan . guna memastikan kualitas data sebelum memasuki tahap analisis lebih lanjut. Penerapan TF-IDF: Term FrequencyInverse Document Frequency digunakan untuk menghitung bobot kata berdasarkan frekuensi kemunculannya dalam dokumen, di mana kata-kata yang sering muncul dalam dokumen tertentu namun jarang di keseluruhan korpus akan diberi bobot yang lebih tinggi. Klasifikasi dengan Nayve Bayes: Untuk mengklasifikasikan sentimen dalam data yang telah diproses, digunakan algoritma Nayve Bayes. Validasi model dilakukan dengan menggunakan metode 10-fold crossvalidation guna mengukur akurasi prediksi dari algoritma tersebut. Evaluasi Kinerja Model: Kinerja klasifikasi menggunakan confusion matrix untuk mengukur tingkat ketepatan Nayve Bayes dalamengklasifikasikan sentimen pengguna. Teknik Scraping Pada tahap ini, peneliti melaksanakan proses pengumpulan data dengan mengambil ulasan pengguna aplikasi DANA yang tersedia di Google Play Store. Proses pengambilan data dilakukan melalui teknik web scraping menggunakan platform Google Colab. Melalui tahapan ini, berhasil dikumpulkan sebanyak 500 ulasan pengguna dari halaman aplikasi DANA di Google Play Store. (Astuti et al. , 2. Sumber : Hasil Penelitian . Gambar 1. Hasil Scraping Pelabelan Setelah data berhasil dikumpulkan, langkah berikutnya adalah melakukan pelabelan terhadap ulasan yang diperoleh melalui proses scraping. Sebelum pelabelan dilakukan, terlebih dahulu dilakukan penghapusan kolom yang tidak relevan seperti username dan score, sehingga data yang kolom content . dan kolom sentiment. Proses ini bertujuan untuk mengidentifikasi dan mengklasifikasikan sentimen dari setiap ulasan menjadi kategori positif, negatif, atau netral. Awalnya, kolom user, score, at . , dan content. Setelah pelabelan dilakukan, akan terbentuk struktur data baru dengan penambahan kolom sentiment yang merepresentasikan kecenderungan opini dalam teks yang dianalisis. Analisis sentimen terhadap aplikasi DANA dilakukan menggunakan metode Nayve Bayes, dengan proses pengolahan data yang dijalankan melalui platform Google Colab. Contoh data hasil scraping, data yang telah dilabeli, tahapan preprocessing, serta nilai akurasi dari model akan disajikan dan dijelaskan secara rinci pada subbab berikutnya. Preprocesing Preprocessing data adalah tahap berikutnya yang dilakukan setelah pengumpulan dataset yang terdiri Tujuan menghilangkan atau membersihkan data yang tidak terstruktur agar data lebih mudah untuk dianalisis, serta menyiapkan data agar bisa melakukan proses Operator tokenize, yang membagi data teks menjadi unit-unit diskrit seperti karakter atau kata sesuai kebutuhan, merupakan salah satu tahapan dokumen dari subproses operator data berikutnya. Untuk mengubah karakter kapital menjadi huruf kecil, gunakan fungsi transform case. Dengan menggunakan dokumen stopword list yang kita masukkan di operator, filter stopword menghilangkan http://ejournal. id/ejurnal/index. php/infortech HASIL DAN PEMBAHASAN Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 kata penghubung dan kata keterangan yang tidak perlu dan tidak mengandung istilah unik. Dengan menyetel parameter panjang kata minimum ke 3 dan maksimum ke 25, filter token . erdasarkan Panjan. menghapus kata dari teks . etelah proses tokenisas. bersyarat dari kejadian H terhadap kejadian X. Model klasifikasi ini divalidasi menggunakan metode 10fold cross-validation, di mana dataset dibagi menjadi dua bagian: 90% data digunakan untuk pelatihan . , dan 10% sisanya untuk pengujian . Gambar berikut menyajikan ilustrasi proses klasifikasi dengan metode Nayve Bayes Classifier (NBC) yang divalidasi melalui teknik 10-fold crossvalidation Sumber : Hasil Penelitian . Gambar 3. Preprocesing Data Replace Untuk mengubah nilai atau teks pada kolom dataset tertentu, peneliti menggunakan operator replace untuk melakukan transformasi data dasar seperti mengubah nilai yang salah, menukar teks tertentu dengan teks lain, atau menghilangkan karakter tertentu dari string, penggantian sangat berguna Nominal Text Dalam membangun model analisis sentimen menggunakan metode Nayve Bayes. Penelitian ini menerapkan prosedur yang memanfaatkan teks ulasan atau komentar sebagai fitur utama, serta kategori atau label nominal sebagai target klasifikasi. Model ini dirancang untuk mengevaluasi dan memprediksi sentimen pengguna terhadap layanan yang tersedia dalam aplikasi DANA dengan mengelompokkan opini berdasarkan kombinasi dari fitur-fitur tersebut. Procces Document From Data Operator Memproses Dokumen dari Data yang Untuk menampilkan nilai bobot setiap kata, operator ini juga Sumber: . com:2. Gambar i. 10 k-fold cross validation Metode Nayve Bayes Classifier (NBC) digunakan untuk memprediksi sentimen dari ulasan pengguna terhadap aplikasi DANA dengan menerapkan pendekatan 10-fold cross-validation. Data yang telah tahap preprocessing dan menggunakan metode term weighting kemudian dibagi menjadi 10 bagian . , di mana setiap fold berfungsi secara bergantian sebagai data uji, sementara sisanya digunakan sebagai data latih. Pendekatan ini bertujuan untuk mengevaluasi kinerja model NBC dalam mengklasifikasikan sentimen secara akurat dan obyektif. Gambar berikut operator Cross Validation beserta konfigurasi parameter k-fold yang digunakan dalam proses validasi. konfigurasi tf-idf. Berikut gambar parameter tf-idf dan advanced preprocessing pada operator yang mengolah dokumen dari data. Data diolah dengan menentukan frekuensi kemunculan suatu kata setelah dilakukan sejumlah operator Output yang dihasilkan diberi bobot menggunakan pendekatan tf-idf, yang telah dikonfigurasikan ke parameter proses dokumen data. Model Klasifikasi Nayve Bayes Dalam proses klasifikasi, salah satu keunggulan dari metode Nayve Bayes adalah kebutuhan data pelatihan yang relatif sedikit untuk mengestimasi parameterparameter model. Perbedaan utama antara teorema Bayes dan metode statistik lainnya terletak pada asumsi terhadap parameter: dalam pendekatan Bayes, parameter dianggap sebagai variabel acak, sedangkan dalam statistik klasik, parameter dianggap tetap namun tidak diketahui nilainya. Teorema Bayes sendiri menggambarkan hubungan antara probabilitas http://ejournal. id/ejurnal/index. php/infortech Sumber: (Penulis,2. Gambar IV. Cross Validation Operator Cross Validation memiliki subproses dimana Data train dan data test Jurnal Infortech. Volume 7 No. 1 Juni 2025 E-ISSN 2715-8160 Operator Cross Validation memiliki subproses dimana Data train dan data test yang telah dibagi 1/10 berdasarkan k-fold yang ditentukan pada parameter operator cross validation dilatih dengan metode klasifikasi NBC dan data testing diproses melalui operator apply model dan performance test. Berikut ini merupakan gambar model klasfikasi didalam subproses operator cross validation. Sumber : Hasil Penelitian . Gambar 4. Hasil Akurasi Sumber : Hasil Penelitian . Gambar 3. Implementasi Algoritma Nayve Bayes Evaluasi Hasil Evaluasi terhadap kinerja model klasifikasi dilakukan dengan membandingkan hasil prediksi yang benar dan salah. Tingkat akurasi model menunjukkan persentase data yang berhasil diklasifikasikan secara Hasil evaluasi tersebut disajikan dalam bentuk confusion matrix, yang memuat berbagai nilai seperti true negative negative (TNegNe. , true neutral neutral (TNetNe. , true positive positive (TPP), serta beberapa jenis kesalahan prediksi seperti negative false neutral (NegFNe. , negative false positive (NegFP), neutral false negative (NetFNe. , neutral false positive (NetFP), positive false negative (PFNe. , dan positive false neutral (PFNe. Dalam penelitian ini, confusion matrix digunakan sebagai alat utama untuk menilai performa model klasifikasi, guna memberikan gambaran mengenai tingkat ketepatan maupun kesalahan model dalam mengelompokkan data sentimen. Accuracy = ycNycE ycNycA ycNycE yaycE ycNycA yaycA Sumber:(Franseda C Anggraeni, 2. TP = Jumlah True Positive TN = Jumlah True Negative FP = Jumlah False Positive FN = Jumlah False Negative Nilai hasil yang di dapatkan dari output pemodelan menggunakan algoritma dengan 500 ulasan aplikasi DANA dari playstore serta hasil akurasi yang di dapat (Data prediksi negatif berada di angka 54. Data negatif yang dinilai masuk prediksi positif berada di angka 102. Sedangkan data positif yang masuk dalam prediksi negatif berada di angka 302 dan data negatif yang masuk dalam prediksi positf berada diangka 42 data KESIMPULAN Bab ini berfungsi sebagai bagan terakhir, dan penulis akan menarik kesimpulan dari semua informasi yang disajikan pada bab-bab sebelumnya. Setelah dilakukan analisis dan modifikasi terhadap perangkat lunak yang dikembangkan. Setelah melakukan analisis dan evaluasi terhadap program yang telah dikembangkan, penulis menyimpulkan bahwa: Dengan data akurasi dari Confusion Matrix memperoleh akurasi sebesar 80. hipotesis H1 tervalidasi. Akurasi ini menunjukkan sejauh mana model berhasil mengidentifikasi data secara akurat. Algoritma Nayve Bayes terbukti cukup baik dalam melakukan tugas sentimen analisis. Hasil analisis sentimen mengungkapkan sejumlah system yang mungkin bisa dikembangkan oleh aplikasi DANA. Untuk meningkatkan kualitas layanan, mengatasi kekurangan, dan meluncurkan fitur baru yang lebih sesuai dengan kebutuhan menggunakan data dari ulasan pengguna. REFERENSI