Jurnal Infortech Volume 7 No. 2 Desember 2025 E-ISSN: 2715-8160 Pemanfaatan Algoritma Support Vector Machine dalam Analisis Sentimen Ulasan Pengguna Aplikasi POLRI Presisi Yopi Handrianto1. Omar Pahlevi2. Mateus Hantoro Winarsa3 1,2,3 Universitas Bina Sarana Informatika e-mail: yopi. yph@bsi. id, 2omar. opi@bsi. id, 3mateus. hantoro@gmail. Diterima 27-09-2025 Direvisi 09-11-2025 Disetujui 22-12-2025 Abstrak - Kepolisian Negara Republik Indonesia (Polr. merupakan institusi penting dalam pelayanan publik, termasuk pengurusan administrasi SIM dan SKCK. Untuk mendukung transformasi digital. Polri merilis aplikasi POLRI Presisi. Penelitian ini menganalisis sentimen ulasan pengguna terhadap fitur layanan SIM dan SKCK pada aplikasi tersebut. Penelitian ini menghimpun 4. 000 ulasan dari Google Play Store dengan metode web scraping, yang selanjutnya diberi label sentimen positif, negatif, dan netral menggunakan pendekatan lexicon-based. Data ulasan terlebih dahulu melalui tahap prapengolahan teks yang meliputi cleaning, case folding, normalisasi kata, tokenisasi, penanganan negasi dan stopword removal serta proses stemming. Selanjutnya, fitur teks direpresentasikan dalam bentuk vektor menggunakan metode Term FrequencyAeInverse Document Frequency (TFIDF) dan diintegrasikan dengan fitur leksikal untuk memperkaya informasi yang digunakan pada tahap klasifikasi. Synthetic Minority Oversampling Technique atau SMOTE diterapkan untuk menyeimbangkan data latih. Model klasifikasi dibangun menggunakan Support Vector Machine atau SVM dan dioptimalkan melalui GridSearchCV. Hasil analisis terlihat bahwa sentimen negatif mendominasi dengan proposi 76,36%, diikuti sentimen netral mencapai 12,23% dan sentimen positif mencapai 11,41%. Model Support Vector Machine mencapai akurasi dengan proposi 91,50% dengan nilai macro F1-score 0,82 dan macro ROC-AUC 0,9693. Dari angka tersebut dapat disimpulkan algoritma Support Vector Machine memiliki kinerja yang efektif dalam mengklasifikasikan sentimen ulasan pengguna aplikasi POLRI Presisi dengan tingkat ketepatan yang tinggi. Kata Kunci: Sentimen Ulasan. SVM. POLRI Presisi Abstract - The Indonesian National Police (Polr. is a key institution in the provision of public services, including the administration of driving licenses (SIM) and police clearance certificates (SKCK). To support digital transformation. Polri launched the POLRI Presisi mobile application. This study analyzes user sentiment toward the SIM and SKCK service features of the application based on user reviews. A total of 4,000 reviews were collected from the Google Play Store using web scraping techniques and subsequently labeled into positive, negative, and neutral sentiment categories through a lexicon-based approach. The review data underwent several text preprocessing stages, including cleaning, case folding, word normalization, tokenization, negation handling, stopword removal, and stemming. Text features were then represented as vectors using the Term FrequencyAe Inverse Document Frequency (TF-IDF) method and integrated with lexical features to enrich the information used in the classification process. The Synthetic Minority Oversampling Technique (SMOTE) was applied to balance the training data. The classification model was developed using the Support Vector Machine (SVM) algorithm and optimized through GridSearchCV. The analysis results show that negative sentiment dominates the reviews with a proportion of 76. 36%, followed by neutral sentiment at 12. 23% and positive sentiment at 11. The Support Vector Machine model achieved an accuracy of 91. 50%, with a macro F1-score of 0. 82 and a macro ROC-AUC value of 0. These results indicate that the Support Vector Machine algorithm performs effectively in accurately classifying user sentiment toward the POLRI Presisi application. Keywords: Sentiment Analysis. SVM. POLRI Presisi PENDAHULUAN Perkembangan teknologi informasi dan komunikasi menjadi faktor utama yang mempercepat perubahan sistem pelayanan publik di Indonesia melalui penerapan e-government, dengan tujuan http://ejournal. id/ejurnal/index. php/infortech meningkatkan efisiensi, transparansi, serta efektivitas layanan (Rizky et al. , 2. Salah satu implementasi nyata dari transformasi ini adalah aplikasi POLRI Presisi, yang dirilis oleh Kepolisian Negara Republik Indonesia administrasi seperti perpanjangan SIM dan Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 penerbitan SKCK. Namun, meskipun aplikasi ini diharapkan memberikan kemudahan, ulasan pengguna di Google Play Store menunjukkan adanya keluhan terkait kinerja aplikasi, stabilitas fitur, dan kepuasan layanan, yang menandakan perlunya evaluasi berbasis data terhadap pengalaman Pendekatan analisis sentimen terhadap ulasan pengguna digunakan untuk memperoleh gambaran objektif mengenai opini masyarakat serta mendukung proses evaluasi dan pengembangan layanan publik digital (Anggraini & Alita, 2. Support Vector Machine banyak digunakan pada klasifikasi teks dengan dimensi fitur yang besar, serta menunjukkan kemampuan yang baik dalam menghasilkan akurasi tinggi pada analisis sentimen (Iqrom et al. , 2. Studi lain juga mendukung efektivitas SVM untuk pemrosesan opini publik, khususnya dalam konteks ulasan aplikasi dan media sosial (Sevilla & Cahyono, 2. Untuk mencapai kinerja model yang optimal, diperlukan prapemrosesan teks yang memadai, mencakup cleaning, case folding, normalisasi, tokenisasi, stopword removal, dan stemming guna menjamin kualitas data input (Findawati & Rosid. Representasi teks tidak hanya mengandalkan TF-IDF, tetapi juga diperkuat dengan fitur leksikal berupa jumlah kata positif, negatif, dan polaritas sentimen untuk meningkatkan kemampuan model klasifikasi (Pratama et al. , 2. Ketidakseimbangan kelas data menjadi salah satu kendala dalam analisis sentimen karena menyebabkan distribusi sentimen yang tidak proporsional dan berpengaruh pada performa model. Pendekatan SMOTE dipakai sebagai balancing data dengan menghasilkan contoh sintetis pada kelas minoritas (Ridwan et al. , 2. Pendekatan yang diterapkan ini mendukung model SVM dalam mempelajari distribusi pola pada sentimen positif, negatif, dan netral secara lebih seimbang. Studi ini difokuskan pada pengkajian sentimen ulasan pengguna terhadap fitur layanan SIM dan SKCK pada aplikasi POLRI Presisi dengan algoritma SVM. Riset 000 ulasan pengguna aplikasi POLRI Presisi yang diperoleh dari Google Play Store melalui pengambilan data otomatis. Ulasan tersebut diklasifikasikan ke dalam sentimen positif, negatif, dan netral menggunakan pendekatan leksikal, kemudian direpresentasikan melalui kombinasi TFIDF dan fitur leksikal. Ketidakseimbangan data ditangani dengan SMOTE, sementara optimasi model klasifikasi dilakukan menggunakan GridSearchCV. Dengan demikian, penelitian ini diharapkan dapat memberikan gambaran empiris mengenai kinerja algoritma Support Vector Machine dalam analisis sentimen, sekaligus menyumbangkan dasar informasi yang relevan bagi upaya peningkatan kualitas layanan publik digital di masa mendatang dan memberikan kontribusi praktis dalam mendukung transformasi digital POLRI sekaligus memperkaya literatur http://ejournal. id/ejurnal/index. php/infortech analisis sentimen berbasis SVM pada aplikasi layanan publik di Indonesia. METODE PENELITIAN Analisis sentimen dalam penelitian ini dilakukan dengan pendekatan kuantitatif deskriptif berbasis komputasi terhadap ulasan pengguna aplikasi POLRI Presisi terkait layanan SIM dan SKCK. Pendekatan kuantitatif memungkinkan pengolahan data yang telah direpresentasikan secara numerik dilakukan secara sistematis dan terukur (Tampubolon, 2. Desain Penelitian Gambar 1 ini merupakan pola penelitian yang Sumber: Penelitian . Gambar 1. Pola Penelitian SVM Pengumpulan Data Pengumpulan data menggunakan web scraping. Rentang waktu pengambilan data adalah 1 September 2022 hingga 1 Juni 2025. Dari hasil web scraping diperoleh 4000 ulasan berbahasa Indonesia yang secara khusus menyebut layanan SIM dan SKCK. Ulasan ini kemudian dijadikan sampel penelitian. Text Processing (Pra-Pemrosesan Tek. Tahapan Text Processing dilakukan dengan Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Cleaning, menghilangkan elemen yang tidak sesuai seperti angka, tanda baca. URL, emoji, dan karakter khusus. Case Folding, mengkonversi semua teks menjadi huruf kecil agar terjaganya konsistensi penulisan. Normalisasi kata, mengubah kata tidak baku menjadi bentuk baku sesuai kaidah bahasa. Tokenisasi, memecah teks menjadi unit-unit kata. Stopword Removal, menghapus kata-kata umum yang tidak memiliki pengaruh signifikan terhadap makna teks. Negation Handling, yaitu menangani kata negasi agar makna kalimat tetap terjaga dengan tepat. Stemming, yakni mengembalikan kata ke bentuk fundamental untuk menggabungkan variasi kata Precision. Recall, dan F1-Score untuk mengukur performa per kelas. ROC-AUC untuk menilai kemampuan model dalam membedakan kelas sentimen (Muttaqin et , 2. HASIL DAN PEMBAHASAN Hasil Klasifikasi Sentimen. Dari total 4000 ulasan yang diperoleh, hasil klasifikasi menunjukkan distribusi sebagai berikut: Negatif: 3. 053 ulasan . ,36%) Positif: 489 ulasan . ,23%) Netral: 456 ulasan . ,41%) Pelabelan Sentimen. Proses pelabelan sentimen dilakukan dengan menerapkan metode lexicon-based yang mengacu pada kamus sentimen Bahasa Indonesia. Setiap ulasan diklasifikasikan ke dalam kategori positif, negatif, atau netral berdasarkan nilai polaritas dari kata-kata yang terkandung di dalamnya (Putra & Setiawan, 2. Ekstraksi Fitur. Ulasan yang telah diberi label diubah menjadi representasi numerik menggunakan TF-IDF untuk kalkulasi nilai bobot kata, serta ditambah fitur leksikal seperti jumlah kata positif, kata negatif, netral, polaritas, dan rasio polaritas (Gifari et al. Penelitian ini menggunakan SMOTE sebagai solusi terhadap data yang tidak balance dengan cara menghasilkan sampel sintetik pada kelas minoritas agar distribusi lebih merata dan model tidak bias terhadap kelas mayoritas. Penelitian ini sesuai dengan riset yang dilakukan (Ridwan et al. , 2. , dimana pendekatan yang dilakukan menjelaskan bahwa SMOTE efektif untuk mengatasi data imbalanced dalam klasifikasi teks. Klasifikasi dengan Support Vector Machine. Algoritma SVM memiliki kemampuan bekerja baik pada data linier maupun non-linier (R. Putra et al. , 2. Parameter SVM dioptimalkan menggunakan GridSearchCV untuk memperoleh kombinasi terbaik dari nilai C dan gamma. Evaluasi Model. Model dievaluasi menggunakan beberapa metrik, antara lain: Confusion Matrix untuk membandingkan hasil prediksi dengan data aktual. Akurasi untuk mengukur proporsi prediksi yang http://ejournal. id/ejurnal/index. php/infortech Sumber: Hasil Olah Data . Gambar 2. Distribusi Sentimen Hasil Klasifikasi Pembagian Data Latih dan Uji. Selanjutnya, pembagian data menjadi 2 proporsi, yakni 80% data latih dan 20% data uji. Sumber: Hasil Olah Data . Gambar 3. Proporsi Distribusi Data Solusi atas ketidakseimbangan kelas, terapkan SMOTE yang hanya pada data latih saja. Tujuannya supaya model belajar dari distribusi data yang balance, sementara data uji tetap mempertahankan kondisi aslinya agar evaluasi tetap objektif. Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 Sumber: Hasil Olah Data . Gambar 4. Distribusi Data Latih Sebelum dan Sesudah SMOTE Dengan pendekatan ini, model dapat belajar lebih baik mengenali kelas minoritas tanpa mengurangi validitas hasil pengujian. Evaluasi Model SVM. Model klasifikasi menggunakan Support Vector Machine (SVM) dengan parameter terbaik hasil GridSearchCV . ernel RBF. C=10, gamma=scal. Hasil evaluasi menunjukkan performa sebagai Akurasi: 91,50% Macro F1-score: 0,82 ROC-AUC Makro: 0,9693 Sumber: Hasil Olah Data . Gambar 6. Hasil Klasifikasi SVM. Pada Gambar 6 diatas, memperlihatkan detail prediksi model terhadap tiap kelas: Negatif: dari 611 data, sebanyak 597 terklasifikasi benar, hanya 14 salah . ke netral, 3 ke positi. Netral: dari 98 data, hanya 59 terklasifikasi benar, sementara 39 salah . ke negatif, 11 ke positi. Positif: dari 91 data, sebanyak 77 terklasifikasi benar, sisanya 14 salah . ke negatif, 12 ke netra. Dari hasil ini terlihat bahwa model sangat baik mengenali kelas negatif dan positif, namun masih cukup banyak kesalahan pada kelas netral. Hal ini selaras dengan nilai recall netral yang rendah . Sumber: Hasil Olah Data . Gambar 5. Hasil Evaluasi Model SVM. Detail per kelas diperoleh sebagai berikut. Negatif Ie Precision 0,95. Recall 0,98. F1-score 0,96 Positif Ie Precision 0,85. Recall 0,86. F1-score 0,85 Netral Ie Precision 0,72. Recall 0,59. F1-score 0,65 Hasil diatas terlihat dimana model mampu mengenali ulasan negatif dengan tingkat akurasi paling optimal, sedangkan ulasan netral masih menjadi tantangan karena sering bercampur dengan ekspresi positif maupun negatif. Visualisasi Hasil Klasifikasi Untuk memperjelas hasil, dilakukan beberapa bentuk visualisasi: Sumber: Hasil Olah Data . Gambar 7. Kurva ROC-AUC Tiap Kelas Pada Gambar 7 Kurva ROC menunjukkan kemampuan model dalam membedakan tiap kelas Nilai AUC yang diperoleh adalah: Negatif: 0,98 Netral: 0,93 Positif: 0,99 Macro Average: 0,9693 Nilai AUC diatas 0,90 pada semua kelas menunjukkan bahwa model memiliki kemampuan diskriminasi yang sangat baik. Kinerja paling kuat ada pada kelas positif (AUC 0,. , diikuti negatif http://ejournal. id/ejurnal/index. php/infortech Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 (AUC 0,. , sedangkan kelas netral (AUC 0,. masih lebih rendah tetapi tetap tergolong sangat baik. Sumber: Hasil Olah Data . Gambar 8. Ulasan Negatif. Pada Gambar 8 diatas, untuk ulasan negatif menampilkan dominasi kata yang merepresentasikan penilaian negatif. Sumber: Hasil Olah Data . Gambar 9. Ulasan Positif. Pada Gambar 9 diatas, untuk ulasan positif menampilkan kata-kata yang mencerminkan penilaian positif. Sumber: Hasil Olah Data . Gambar 10. Wordcloud Ulasan Netral Pada Gambar 10 untuk ulasan netral diatas menampilkan kata-kata yang bersifat umum dan cenderung tidak memihak ke arah positif maupun Visualisasi wordcloud ini berfungsi untuk menegaskan perbedaan karakteristik dari setiap kelas Dengan menampilkan kata-kata yang http://ejournal. id/ejurnal/index. php/infortech paling sering muncul pada masing-masing kategori, wordcloud memberikan gambaran umum pola bahasa yang digunakan pengguna dalam menyampaikan Pola tersebut memperlihatkan ciri khas tersendiri pada kelas positif, negatif, maupun netral, sehingga hasil klasifikasi yang diperoleh tidak hanya ditunjukkan oleh angka evaluasi, tetapi juga dapat dipahami secara visual melalui representasi kata dominan yang muncul. Nilai Baru dan Implikasi. Penelitian ini menunjukkan bahwa kombinasi lexicon-based labeling. TF-IDF, fitur leksikal. SMOTE, dan SVM memberikan performa yang kuat dalam analisis sentimen teks berbahasa Indonesia. Model mencapai akurasi 91,50%, macro F1-score 0,82, dan macro ROC-AUC 0,9693. Pada kelas negatif, model memperoleh precision 0,95, recall 0,98. F1-score 0,96, dan AUC 0,98. Kelas positif memiliki precision 0,85, recall 0,86. F1-score 0,85, dan AUC 0,99, sementara kelas netral mendapat precision 0,72, recall 0,59. F1-score 0,65, dan AUC 0,93. Hasil ini menunjukkan model sangat andal mengenali sentimen negatif dan positif, meskipun kelas netral masih menjadi tantangan. Nilai baru penelitian terletak pada penggunaan fitur leksikal tambahan serta penerapan SMOTE hanya pada data latih, yang membuat model lebih adaptif tanpa mengurangi objektivitas evaluasi. Metode ini berpotensi diterapkan pada layanan publik lain untuk monitoring opini masyarakat dan evaluasi kualitas layanan digital secara real-time. KESIMPULAN Hasil riset ini dapat disimpulkan bahwa tujuan penelitian berhasil dicapai dan mampu melakukan analisis sentimen terhadap ulasan pengguna aplikasi POLRI Presisi pada layanan SIM dan SKCK dengan memanfaatkan pendekatan machine learning secara Hasil penelitian menunjukkan bahwa kombinasi lexicon-based labeling. TF-IDF, fitur leksikal, balancing data dengan SMOTE pada data latih, serta klasifikasi menggunakan SVM mampu memberikan hasil yang akurat dan konsisten. Pendekatan ini menegaskan bahwa integrasi metode tersebut efektif untuk mengidentifikasi sentimen positif, negatif, dan netral dalam teks berbahasa Indonesia. Prospek pengembangan penelitian ini dapat diarahkan pada penggunaan algoritma berbasis deep learning seperti LSTM atau transformer model . isalnya IndoBERT) yang berpotensi menangkap konteks kalimat lebih baik. Selain itu, penelitian di masa depan juga dapat memperluas data dengan mencakup ulasan dari berbagai aplikasi layanan publik lain, sehingga model dapat digunakan secara lebih umum untuk memantau opini masyarakat. Sebagai rekomendasi, penelitian selanjutnya Jurnal Infortech. Volume 7 No. 2 Desember 2025 E-ISSN 2715-8160 disarankan untuk mengoptimalkan pengolahan kelas netral yang masih sulit dibedakan, serta mempertimbangkan pendekatan hibrid yang menggabungkan machine learning tradisional dengan model deep learning agar hasil klasifikasi semakin REFERENSI