Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 Hal: 44-49 E-ISSN: 2962-7982 Analisis Sentimen Ulasan Pengguna Aplikasi Atma Menggunakan Algoritma Nayve Bayes Risna Kurnia Permata Ramadani1*. Arya Soma Wicaksana2. Nunung Hidayatun3 1,2,3 Teknik dan Informatika. Sistem Informasi. Universitas Bina Sarana Informatika. Jakarta. Indonesia Jl. Kramat Raya No. E-mail: 1*19210498@bsi. id, 219210946@bsi. id, 3nunung. ntn@bsi. (*: corresponding autho. AbstrakAi Pada masa ini kemajuan teknologi digital telah mendorong munculnya berbagai aplikasi pencari kerja berbasis mobile, salah satunya adalah Atma. Aplikasi ini dirancang untuk memudahkan pengguna dalam mencari lowongan pekerjaan, khususnya di sektor food and beverage (F&B). Namun, beragamnya ulasan pengguna dan volume yang terus meningkat di Google Play Store membuat analisis manual menjadi lambat dan rawan subjektivitas, sehingga menyulitkan pengembang memahami kebutuhan pengguna secara akurat. Penelitian ini bertujuan untuk menganalisis sentimen pengguna terhadap aplikasi Atma dengan menggunakan algoritma Nayve Bayes serta mengevaluasi performanya dalam mengklasifikasikan ulasan ke dalam kategori positif dan negatif. Pendekatan yang digunakan mengacu pada metode SEMMA (Sample. Explore. Modify. Model. Asses. dengan tahapan preprocessing teks, pembobotan menggunakan TF-IDF, dan penyeimbangan data menggunakan teknik SMOTE. Data yang dianalisis berjumlah 2000 ulasan, dan dilakukan tiga skenario pengujian berdasarkan rasio pembagian data latih dan data uji. Hasil pengujian menunjukkan bahwa akurasi algoritma meningkat secara signifikan setelah penerapan SMOTE. Akurasi tertinggi yang dicapai adalah sebesar 85,56% dengan proporsi 90% data latih dan 10% data uji. Temuan ini menunjukkan bahwa kombinasi Nayve Bayes. TF-IDF, dan SMOTE cukup efektif dalam melakukan analisis sentimen terhadap ulasan pengguna aplikasi. Penelitian ini diharapkan dapat memberikan masukan konstruktif bagi pengembang aplikasi dalam meningkatkan kualitas layanan sesuai kebutuhan indicate that combining Nayve Bayes. TF-IDF, and SMOTE is effective for sentiment analysis of user reviews and can provide valuable input for developers to enhance the Atma platformAos service quality and overall user experience. KeywordAi Sentiment Analysis. Atma Application. Nayve Bayes. SEMMA PENDAHULUAN Seiring berkembangnya teknologi digital, platform pencarian kerja online kini berperan sebagai sumber utama bagi individu dalam memperoleh peluang kerja yang sesuai dengan kualifikasi mereka . Perkembangan ini mendorong pergeseran media informasi dari cetak ke digital, sehingga lowongan pekerjaan semakin mudah diakses melalui aplikasi, media sosial, maupun situs web berkat ketersediaan internet . Di Indonesia, aplikasi pencari kerja semakin berkembang dengan hadirnya berbagai platform populer seperti Glints. JobStreet. Kitalulus, dan Atma. Atma menjadi salah satu platform yang cukup diminati, terlihat dari jumlah unduhan yang telah melampaui satu juta kali di Google Play Store. Sebagai aplikasi berbasis mobile. Atma berfokus pada penyediaan lowongan kerja terutama di sektor food and beverage (F&B), sekaligus menawarkan fitur pengembangan karier bagi para penggunanya. Ulasan atau feedback dari pengguna merupakan sumber informasi yang berharga bagi perusahaan. Melalui feedback tersebut, perusahaan dapat mengetahui berbagai permasalahan, kekurangan, serta ketidakpuasan yang dirasakan konsumen, sehingga dapat dijadikan dasar untuk melakukan perbaikan . Meskipun demikian, tantangan yang muncul juga semakin besar, terutama dalam hal mengolah dan menganalisis data ulasan secara efisien . Menurut . salah satu tantangan yang dihadapi adalah beragamnya ulasan yang diberikan, mulai dari opini positif hingga negatif, yang membuat proses pemahaman terhadap preferensi pengguna menjadi sulit. Selain itu, meningkatnya jumlah pengguna, volume ulasan yang terus bertambah setiap hari menjadikan proses analisis secara manual menjadi kurang Analisis data secara manual tidak hanya memakan waktu yang lama, tetapi juga berpotensi dipengaruhi oleh subjektivitas . Oleh karena itu, diperlukan pendekatan yang lebih otomatis dan objektif, salah satunya adalah analisis Analisis sentimen sendiri didefinisikan sebagai proses sistematis untuk mengenali serta mengelompokkan opini atau perasaan seseorang terhadap layanan, aplikasi. Kata KunciAi Analisis Sentimen. Aplikasi Atma. Nayve Bayes. SEMMA. AbstractAi In the current digital era, rapid advancements in technology have encouraged the development of various mobilebased job search applications, one of which is Atma, focusing on the food and beverae (F&B) sector. However, the wide variety of user reviews and the continuously increasing volume of feedback on the Google Play Store make manual analysis slow and prone to subjectivity, making it difficult for developers to accurately understand user needs. This study aims to analyze user sentiment towards the Atma application using the Nayve Bayes algorithm and to evaluate its performance in classifying reviews into positive and negative categories. The research adopts the SEMMA methodology (Sample. Explore. Modify. Model. Asses. , including text preprocessing, feature weighting with the TF-IDF method, and data balancing using the SMOTE technique. A total of 2,000 user reviews were analyzed under three different testing scenarios with varying proportions of training and testing data. The results show that the Nayve Bayes algorithmAos accuracy improves significantly after applying SMOTE, with the highest accuracy of 85. 56% achieved using a 90% training and 10% testing data ratio. These findings Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 Hal: 44-49 E-ISSN: 2962-7982 maupun produk ke dalam tiga kategori, yaitu positif, negatif, dan netral . Naive Bayes merupakan salah satu algoritma yang banyak digunakan dalam analisis sentimen berbasis teks karena kemampuannya mengolah data dalam jumlah besar secara efisien dengan beban komputasi yang relatif ringan. Oleh karena itu, penelitian ini menerapkan algoritma Naive Bayes sebagai pendekatan untuk meningkatkan efektivitas dan ketepatan analisis sentimen. Namun, dalam beberapa kasus dataset dapat mengalami masalah khusus, seperti ketidakseimbangan kelas data. Ketidakseimbangan kelas terjadi ketika jumlah data pada setiap kategori proporsinya tidak sama . Untuk itu. SMOTE (Synthetic Minority Oversampling Techniqu. diterapkan dengan menambahkan data sintetis pada kelas minoritas, sehingga proporsi antar kelas lebih seimbang dan permasalahan oversampling dapat diminimalkan. Berdasarkan uraian tersebut, penelitian ini bertujuan untuk menganalisis dan mengklasifikasikan ulasan pengguna aplikasi Atma menggunakan algoritma Naive Bayes guna memahami persepsi mereka terhadap aplikasi tersebut. Selain itu, penelitian ini juga berfokus pada evaluasi efektivitas algoritma Naive Bayes dalam melakukan klasifikasi sentimen, serta menilai apakah penerapan teknik SMOTE (Synthetic Minority Over-Sampling Techniqu. dapat meningkatkan performa model dalam analisis sentimen. Hasil dari penelitian ini diharapkan dapat memberikan kontribusi dalam pengembangan aplikasi pencari kerja yang lebih adaptif serta mampu menjawab kebutuhan pengguna secara lebih baik. Selain itu, penelitian ini juga diharapkan dapat menjadi landasan untuk penelitian selanjutnya dalam upaya meningkatkan akurasi dan efisiensi algoritma-algoritma sejenis. Sample Sampel yang digunakan dalam penelitian ini berjumlah 000 ulasan yang diperoleh dari Google Play Store. Proses pengumpulan data dilakukan melalui web scraping menggunakan Python dengan library google-play-scraper pada platform Google Colab. Data hasil scraping disimpan dalam format CSV dan kemudian diseleksi agar sesuai dengan kebutuhan penelitian. II. METODE PENELITIAN Penelitian ini menggunakan metode SEMMA, yaitu metodologi data mining yang terdiri dari 5 tahap, yaitu Sample. Explore. Modify. Model, dan Assess. Alur penelitian dengan metode SEMMA dapat dilihat pada Gambar 1 berikut. Transform Case Transform case atau case folding merupakan proses penyamaan bentuk huruf dalam suatu teks, dengan cara mengubah huruf besar menjadi huruf kecil atau sebaliknya. Explore Pada bagian ini membahas mengenai deskripsi dan visualisasi data. Deskripsi data bertujuan memberikan gambaran umum mengenai informasi yang terkandung dalam data, sedangkan visualisasi data menyajikan informasi tersebut dalam bentuk grafis . Modify Tahap Modify dalam penelitian ini merupakan proses persiapan data atau pre-processing . Teknik ini bertujuan membantu sistem komputer dalam memahami beragam jenis Selain itu, fase ini berfungsi untuk mengubah data dari yang tidak terstruktur menjadi data yang terstruktur . Proses ini meliputi beberapa langkah, yaitu cleaning, tokenize, transform case, stopword removal, filter token, dan stemming. Cleaning Tahap cleaning dilakukan untuk menghapus elemenelemen yang tidak diperlukan dalam analisis, seperti URL, retweet, hashtag, mention, tanda baca, simbol, dan karakter . Tokenize Pada tahap ini, setiap kalimat diuraikan menjadi potonganpotongan kata atau suku kata untuk mempermudah proses pengolahan teks selanjutnya. Stopword Removal Pada tahap ini, kata-kata yang tidak relevan dihapus agar dapat diperoleh inti dari teks yang akan dianalisis. Filter Token Pada tahap ini, data disaring berdasarkan jumlah karakter dalam setiap kata, di mana kata-kata yang memiliki kurang dari 4 huruf atau lebih dari 25 huruf akan dihapus. Stemming Stemming merupakan proses yang dilakukan untuk mengubah suatu kata menjadi bentuk dasarnya. Model Pada tahap ini, dilakukan proses pelabelan sentimen, pemberian bobot menggunakan metode TF-IDF, pembagian data menjadi data latih dan data uji, penerapan teknik SMOTE, serta pengujian model menggunakan algoritma Nayve Bayes. Pelabelan Pelabelan merupakan proses pemberian nilai sentimen pada teks, yang dapat berupa positif, negatif, maupun netral. Proses pelabelan dilakukan secara manual oleh peneliti dengan Gambar 1. Alur Penelitian Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 menggunakan Microsoft Excel. Setiap ulasan dibaca secara seksama satu per satu, kemudian diberi label sesuai dengan isi Hal: 44-49 E-ISSN: 2962-7982 evaluasi untuk mengetahui seberapa akurat model dalam mengklasifikasikan sentimen pada setiap ulasan . Synthetic Minority Oversampling Technique (SMOTE) SMOTE merupakan pendekatan yang digunakan untuk mengatasi ketidakseimbangan distribusi kelas data. Cara kerja SMOTE yaitu dengan menambahkan data sintetis pada kelas minoritas agar jumlahnya seimbang dengan kelas mayoritas . TF-IDF Term Frequency-Inverse Document Frequency (TF-IDF) merupakan metode yang digunakan dalam analisis teks untuk menentukan bobot suatu kata dalam dokumen. Teknik ini bertujuan untuk mengenali kata-kata yang memiliki tingkat kepentingan tinggi dalam satu dokumen maupun kumpulan Term Frequency (TF) merupakan jumlah kemunculan sebuah kata dalam satu dokumen. Namun, nilai TF saja tidak cukup untuk menunjukkan seberapa penting kata Kata umum atau kata hubung bisa saja memiliki nilai TF yang tinggi karena sering muncul, padahal sebenarnya tidak terlalu berpengaruh terhadap makna isi dokumen. Karena itu, diperlukan konsep Inverse Document Frequency (IDF), yang memberikan nilai lebih tinggi pada kata-kata yang jarang muncul di seluruh dokumen. Nilai TF-IDF yang tinggi menunjukkan bahwa kata tersebut memiliki tingkat kepentingan yang besar dalam menentukan konteks atau topik dari dokumen tersebut . Algoritma Nayve Bayes Selanjutnya, data latih dan data uji yang telah dibagi diproses menggunakan algoritma Nayve Bayes Classifier. Algoritma Nayve Bayes merupakan metode berbasis probabilitas yang menghitung peluang terbesar berdasarkan frekuensi kemunculan setiap kategori dalam data pelatihan . Metode ini dipilih karena sesuai untuk analisis sentimen berbasis teks, bersifat sederhana, efisien, serta mampu memberikan kinerja yang baik pada data teks berskala besar. Selain itu, menurut penelitian yang dilakukan oleh Devita et al. menunjukkan bahwa algoritma Nayve Bayes dapat menghasilkan akurasi yang cukup tinggi meskipun hanya menggunakan jumlah data pelatihan yang terbatas . Pembagian data Pada tahap ini, data akan dipisahkan menjadi dua kelompok, yaitu data pelatihan dan data pengujian. Penelitian ini menggunakan tiga skenario pembagian data, yakni 90:10, 80:20, dan 70:30, di mana masing-masing menunjukkan proporsi antara data yang akan digunakan dalam proses pelatihan dan pengujian model. Data latih dimanfaatkan untuk membangun model serta melatihnya agar mampu mengenali karakteristik sentimen, sedangkan data uji digunakan sebagai Assess Pada tahap ini, akan dilakukan evaluasi terhadap model yang telah dikembangkan berupa nilai confusion matrix, yang mencakup accuracy, precision, dan recall. Confusion Matrix merupakan sebuah matriks yang digunakan untuk mengevaluasi performa algoritma klasifikasi dengan cara menyajikan jumlah prediksi benar dan keliru berdasarkan hasil klasifikasi . HASIL DAN PEMBAHASAN Sample Penelitian ini menggunakan 2000 ulasan aplikasi Atma yang diperoleh dari Google Play Store melalui proses web scraping menggunakan Python dengan library google-play-scraper pada platform Google Colab. Data hasil scraping disimpan dalam format CSV dan kemudian diseleksi agar sesuai dengan kebutuhan penelitian. Gambar 2. Hasil Scraping Data yang digunakan karena atribut lainnya dianggap tidak berpengaruh secara langsung terhadap analisis sentimen. Dari 000 ulasan tersebut, terdapat 1. 562 ulasan positif, 292 ulasan negatif, dan 146 ulasan netral. Explore Data ulasan yang diperoleh memiliki berbagai atribut, yaitu reviewId, userName, content, score, thumbsUpCount, reviewCreatedVersion, at, replyContent, repliedAt, dan appVersion. Namun, dalam analisis ini hanya atribut content Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 Hal: 44-49 E-ISSN: 2962-7982 Stemming Proses mengubah kata menjadi bentuk dasarnya, misalnya kata 'mencari' menjadi 'cari'. Proses stemming dilakukan menggunakan bahasa pemrograman Python dengan menginstal sejumlah dependensi yang diperlukan seperti pandas, sastrawi, dan openpyxl. TABEL I HASIL PRE-PROCESSING Gambar 3. Visualisasi Distribusi Sentimen Modify Tahapan modify dilakukan dengan preprocessing teks menggunakan RapidMiner. Proses ini meliputi beberapa langkah berikut: Cleaning Proses menghapus elemen yang tidak relevan, seperti URL, tanda baca, simbol, angka, dan karakter khusus. Setelah melalui tahap ini, diperoleh 1. 993 data yang siap untuk diproses lebih Tahap Cleaning Sebelum Aplikasi ini sangat bagus sekali & sangat membantu dalam melamar pekerjaan Sesudah Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Tokenize Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Aplikasi, ini, sangat, bagus, sekali, sangat, membantu, dalam, melamar, pekerjaan Transform Case Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Stopword Removal Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Aplikasi bagus membantu melamar pekerjaan Filter Token . y Lengt. Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Aplikasi sangat bagus sekali sangat membantu dalam melamar Stemming Aplikasi ini sangat bagus sekali sangat membantu dalam melamar pekerjaan Aplikasi ini sangat bagus sekali sangat bantu dalam lamar kerja Gambar 4. Proses Cleaning Model Pada tahap pemodelan, dilakukan proses pelabelan sentimen, pemberian bobot menggunakan metode TF-IDF, pembagian data menjadi data latih dan data uji, penerapan teknik SMOTE, serta pengujian model menggunakan algoritma Nayve Bayes. Pelabelan Pelabelan dilakukan secara manual menggunakan Microsoft Excel dengan kategori sentimen positif dan negatif. Dari total 2. 000 data ulasan, diperoleh 1. 513 data berlabel positif, 291 data berlabel negatif, 146 data berlabel netral, serta 50 data tanpa label . osong akibat proses preprocessin. Namun, dalam penelitian ini hanya data dengan sentimen positif dan negatif yang digunakan, sedangkan data netral dan tanpa label dikeluarkan dari proses analisis. Tokenize Proses memecah kalimat menjadi kata-kata . agar dapat diproses lebih lanjut. Transform Case Proses mengubah seluruh huruf menjadi huruf kecil . Stopword Removal Proses menghapus kata-kata umum yang tidak memiliki kontribusi signifikan, misalnya 'dan', 'atau', 'yang'. Kata-kata tersebut mengacu pada daftar stopwords bahasa Indonesia yang diunduh dari situs Kaggle. Filter Token . y Lengt. Proses menghapus kata dengan panjang kurang dari 4 karakter atau lebih dari 25 karakter. Pembobotan TF-IDF Metode ini digunakan untuk menghitung tingkat kepentingan setiap kata dalam dokumen. Kata yang jarang muncul pada keseluruhan dokumen tetapi sering muncul pada ulasan tertentu akan memperoleh bobot yang lebih tinggi. Proses pembobotan TF-IDF dalam penelitian ini dilakukan dengan menggunakan aplikasi RapidMiner. Gambar 5. Proses Pre-processing Gambar 6. Process Documents from Data Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 Hal: 44-49 E-ISSN: 2962-7982 Gambar 9. Pengujian Algoritma Nayve Bayes Assess Evaluasi dilakukan menggunakan Confusion Matrix dengan tiga metrik utama, yaitu accuracy, precision, dan recall. Gambar 7. Hasil TF-IDF Pembagian Data Latih dan Data Uji Selanjutnya data dibagi menjadi dua bagian, yaitu data latih dan data uji. Pembagian dilakukan dengan menggunakan tiga skenario, yakni perbandingan 90:10, 80:20, dan 70:30. TABEL II SKENARIO PEMBAGIAN DATA Skenario 90:10 80:20 70:30 Data Latih Data Uji Gambar 10. Confusion Matrix 90:10 SMOTE SMOTE digunakan untuk menyeimbangkan distribusi data ulasan positif dan negatif dengan cara menambahkan data sintetis pada kelas minoritas. Dalam penelitian ini terdapat ketidakseimbangan kelas, di mana jumlah sampel pada kelas positif jauh lebih banyak dibandingkan dengan kelas negatif. Untuk mengatasi hal ini, metode SMOTE diterapkan agar distribusi data menjadi lebih seimbang dan performa klasifikasi dapat ditingkatkan. Gambar 11. Confusion Matrix 80:20 Gambar 12. Confusion Matrix 70:30 Sebelum penerapan SMOTE, model cenderung bias terhadap kelas mayoritas, sehingga menghasilkan akurasi lebih Namun, setelah penerapan SMOTE terjadi peningkatan performa model secara signifikan. Hasil terbaik diperoleh pada skenario 90:10 dengan accuracy 85,56%, precision 84,12%, dan recall 86,40%. TABEL i AKURASI SEBELUM PENERAPAN SMOTE Gambar 8. Hasil SMOTE Skenario 90:10 80:20 70:30 Nayve Bayes Classifier Model klasifikasi dibangun menggunakan algoritma Nayve Bayes. Algoritma ini dipilih karena sederhana, efisien, dan terbukti memberikan hasil yang baik pada dataset berbasis teks. Pada tahap ini, pengujian algoritma dilakukan menggunakan aplikasi RapidMiner. Accuracy Precision Recall TABEL IV AKURASI SETELAH PENERAPAN SMOTE Skenario 90:10 80:20 70:30 Accuracy Precision Recall Jurnal TICOM: Technology of Information and Communication Volume 14. Nomor 1. September 2025 IV. PENUTUP Berdasarkan hasil penelitian analisis sentimen pengguna terhadap aplikasi Atma menggunakan algoritma Nayve Bayes dengan metode SEMMA, dapat ditarik kesimpulan bahwa . Analisis sentimen pengguna aplikasi Atma berhasil dilakukan dengan memanfaatkan ulasan berbahasa Indonesia dari Google Play Store. Dari 2000 data awal, setelah melalui tahap preprocessing, diperoleh 1804 data yang terdiri dari 1513 ulasan positif dan 291 ulasan negative, . Penerapan algoritma Nayve Bayes dengan pembobotan TF-IDF menunjukkan bahwa model mampu mengklasifikasikan sentimen pengguna secara cukup baik. Namun, sebelum penerapan SMOTE, distribusi data yang tidak seimbang menyebabkan akurasi model kurang . Teknik SMOTE (Synthetic Minority Oversampling Techniqu. terbukti efektif dalam menyeimbangkan distribusi kelas data. Hasil pengujian menunjukkan adanya peningkatan performa algoritma setelah dilakukan penyeimbangan data. Hasil terbaik diperoleh pada skenario 90:10, dengan akurasi 85,56%, precision 84,12%, dan recall 86,40%. Hal ini menunjukkan bahwa kombinasi Nayve Bayes. TF-IDF, dan SMOTE cukup efektif dalam melakukan analisis sentimen pada ulasan pengguna aplikasi Atma. Penelitian selanjutnya dapat memperluas cakupan dengan menambahkan jumlah data lebih besar agar hasil analisis lebih Disarankan untuk membandingkan algoritma Nayve Bayes dengan algoritma lain seperti Logistic Regression. Random Forest, atau Support Vector Machine untuk mengetahui perbedaan kinerja pada dataset yang sama. Penggunaan teknik optimasi lain, seperti ensemble learning, dapat dipertimbangkan untuk meningkatkan akurasi model. REFERENSI