Website: ojs.
itb-ad.
id/index.
php/JUSIN E-ISSN: 2797-8516
ANALISIS SENTIMEN OPINI MASYARAKAT TERKAIT
PENGGUNAAN MOBILE JKN PADA MEDIA SOSIAL X DENGAN
PERBANDINGAN ALGORITMA K-NEAREST NEIGHBOR (KNN) DAN
LOGISTIC REGRESSION (LR)
Kelvin Valensio Hematang.
Nengah Widya Utami2 .
I Nyoman Purnama3 Universitas Primakara.
Bali Universitas Primakara.
Bali Universitas Primakara.
Bali Abstract BPJS Kesehatan launched the Mobile JKN application in 2017 to enhance healthcare accessibility and simplify membership management.
As of September 2024, 98.
67% of IndonesiaAos population has joined the JKN program, highlighting the importance of public opinion in the applicationAos development.
This study analyzes public sentiment toward Mobile JKN through the social media platform X using the KNearest Neighbor (KNN) and Logistic Regression (LR) algorithms.
From 4,777 reviews, 4,648 clean data were obtained after Preprocessing and labeled using IndoBERT, resulting in 2,066 positive reviews and 2,581 negative reviews.
The Evaluation results show that KNN achieved an accuracy of 83.
87%, while LR performed better with 87.
85% along with higher precision, recall, and f1-score.
The findings reveal the dominance of negative sentiment in user reviews and provide insights for BPJS Kesehatan to improve Mobile JKN into a more responsive application that meets usersAo needs and Kata Kunci: Mobile JKN, sentiment analysis, social media X.
K-Nearest Neighbor (KNN).
Logistic Regression (LR) Informasi Artikel:
Dikirim : 21 September 2025
Ditelaah : 22 September 2025
Diterima: 30 September 2025
Publikasi : 23 Desember 2025
(*)
Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 A2025 Institut Teknologi dan Bisnis Ahmad Dahlan.
All rights reserved.
Korespondensi: kelfinvalensio@gmail.
com (Kelvin Hematan.
PENDAHULUAN Seiring perkembangan teknologi, layanan kesehatan di Indonesia terus berinovasi untuk mempermudah akses masyarakat.
Pemerintah melalui BPJS Kesehatan mengelola program Jaminan Kesehatan NasionalAeKartu Indonesia Sehat (JKN-KIS) guna menjamin akses layanan kesehatan bagi seluruh penduduk.
Hingga September 2024, jumlah peserta JKN mencapai 330 orang (BPJS, 2.
Untuk meningkatkan kualitas layanan.
BPJS meluncurkan aplikasi Mobile JKN pada 2017 sebagai sarana digital bagi peserta dalam mengakses informasi kepesertaan dan layanan kesehatan (Putri, et al.
, 2.
Cakupan kepesertaan JKN yang mencapai 98,67 persen dari penduduk Indonesia (Antaranews, 2.
menegaskan pentingnya keberlanjutan layanan digital seperti Mobile JKN.
Analisis sentimen diperlukan untuk memahami opini masyarakat karena berpengaruh terhadap pengembangan layanan.
Analisis sentimen merupakan metode untuk mengidentifikasi pandangan publik terhadap produk atau layanan melalui opini daring (Pamungkas dan Kharisudin, 2.
Media sosial X dengan 24,85 juta pengguna di Indonesia menjadi sumber data relevan karena banyak digunakan untuk menyampaikan pengalaman dan ulasan terkait layanan kesehatan (We Are Social dan Meltwater, 2.
Dalam mengolah opini di media sosial, data mining berperan untuk mengekstraksi pola dari data tidak terstruktur menjadi informasi bermakna (Dewi, et al.
, 2.
Salah satu algoritma yang banyak digunakan adalah K-Nearest Neighbor (KNN), yang bekerja dengan mengelompokkan data berdasarkan kedekatan jarak antar-poin (Legito, et al.
, 2.
Logistic Regression (LR) juga umum dipakai dalam klasifikasi teks karena kemampuannya memodelkan hubungan variabel input dengan kelas target menggunakan fungsi logistik (Satviki dan Sanjaya, 2.
Penelitian sebelumnya mendukung efektivitas metode ini.
KNN mencapai akurasi 71,39% pada analisis ulasan aplikasi Tokopedia (Afdal, et al.
, 2.
Pada ulasan agen perjalanan online.
KNN lebih unggul dibanding Nayve Bayes (Sholeha, et al.
, 2.
Sementara itu, penelitian sentimen terhadap film Sri Asih menunjukkan Logistic Regression .
%) lebih baik dibanding CNN .
%) dan KNN .
%) (Dwi Wijaya, 2.
Berdasarkan uraian tersebut, penelitian ini menganalisis sentimen masyarakat terhadap aplikasi Mobile JKN melalui data media sosial X dengan membandingkan kinerja K-Nearest Neighbor dan Logistic Regression.
Tujuannya untuk mengetahui opini publik, mengidentifikasi pola sentimen, serta menentukan algoritma paling optimal dalam klasifikasi
METODE
Penelitian ini dijalankan dengan memanfaatkan metode Knowledge Discovery from Data (KDD).
Urutan proses yang terlibat dalam KDD dapat dilihat dalam ilustrasi berikut.
Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 Gambar 1.
Proses Knowledge Discovery from Data Berikut adalah penjelasan dari gambar diatas terkait tahapan proses Knowledge Discovery from Data (KDD):
Selection Selection merupakan proses pertama dalam KDD di mana perlu melakukan Selection data dari kumpulan data yang ada menuju tahap penggalian informasi.
Preprocessing Preprocessing adalah tahap penting dalam proses Knowledge Discovery in Databases (KDD) yang berfokus pada pengolahan data.
Tahapan ini mencakup penghapusan data duplikat, pemeriksaan inkonsistensi data, serta perbaikan kesalahan data untuk memastikan kualitas data yang optimal sebelum analisis lebih lanjut.
Transformation Transformation data yang telah dipilih, data yang terpilih harus diubah sesuai dengan algoritma yang akan digunakan dalam data mining.
Data mining Pada tahap data mining, proses ini melibatkan pencarian pola atau informasi yang relevan dan menarik dalam data yang telah dipilih, menggunakan algoritma tertentu untuk mengungkap wawasan yang tersembunyi.
Evaluation Pada tahap ini, pola informasi yang diperoleh dari proses data mining perlu dievaluasi.
Pengetahuan yang diperoleh harus disajikan dalam bentuk yang lebih mudah dipahami oleh pengguna, seperti ringkasan atau visualisasi, untuk mempermudah pemahaman dan pengambilan keputusan.
Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
Gambar 2.
Kerangka Penelitian Berikut di bawah ini merupakan penjelasan dari alur penelitian yang terdapat pada gambar di Identifikasi Masalah Pada tahap identifikasi masalah, peneliti melakukan proses untuk menggali permasalahan yang ada pada objek penelitian, yaitu aplikasi Mobile JKN.
Adapun permasalahan yang ada yaitu banyak keluhan terhadap fitur maupun layanan yang ada pada aplikasi Mobile JKN.
Studi Literatur Setelah melakukan identifikasi masalah, peneliti melakukan pengkajian teori-teori yang ada pada jurnal yang berkaitan dengan penelitian yang akan dilaksanakan.
Studi literatur terkait tentang data mining, algoritma K-Nearest Neighbor.
Logistik egression.
Pengumpulan Data Pengumpulan data dilakukan dengan cara Web Scrapping dari Google Colabs.
Dengan jumlah data 4648 yang di ambil dari bulan Januari 2024 hingga bulan November 2024.
Data Selection Data Selection adalah proses memilih data relevan dari kumpulan besar agar analisis lebih efisien dan berkualitas.
Pada penelitian ini, data diambil dari media sosial X Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 melalui web scraping berupa opini masyarakat tentang aplikasi Mobile JKN.
Pelabelan dilakukan dengan IndoBERT yang dioptimalkan untuk klasifikasi sentimen Bahasa Indonesia .
ositif, netral, negati.
Metode ini lebih akurat dan efisien dibanding berbasis kata kunci karena IndoBERT mampu memahami konteks, struktur bahasa, serta makna kalimat, termasuk yang ambigu.
HASIL DAN PEMBAHASAN
Pada tahapan Preprocessing, dataset akan dilakukan pembersihan data yang rusak atau tidak lengkap dengan cara dihapus atau diperbaiki.
Tahapan-tahapan yang dilakukan dalam Preprocessing adalah sebagai berikut.
Cleaning Data Cleaning data yang dilakukan pada penelitian ini yaitu proses penghapusan data.
Pada proses ini ada 1 data yang terhapus karena tidak sesuai dengan elemen penelitian dan data ada yang kosong yang menyebabkan data tersebut dihapus.
Tabel 1 hasil Cleaning Data Ulasan Mobile jkn kenapa yu error ah rese skali Sentimen ka tp ak ga bsa login Mobile jkn nya trs gmn yh halo kenapa saya gabisa daftar ya di aplikasi Mobile jkn ini kenapa otp Mobile jkn ga masuk masuk makin kesini makin upgrade fitur Mobile jkn jadi makin positive mudah dan membantubpjs bpjskesehatan 4648 halo min izin nanya aku tadi daftar Mobile jkn tapi gabisa negative min karna sms nya ga masuk itu solusinya gimana ya min bpjs aku juga ilang jadi mau ngurus juga bingung kemana min terimakasih min Case Folding Case Folding dilakukan pada penelitian ini yaitu proses merubah seluruh data dari huruf besar menjadi huruf kecil yang bertujuan untuk mengkonsistensi representasi teks pada analisis data.
Pada penelitian ini mengacu pada table 2.
Tabel 2 Hasil Case Folding Ulasan Mobile jkn kenapa yu error ah rese skali Sentimen ka tp ak ga bsa login Mobile jkn nya trs gmn yh halo kenapa saya gabisa daftar ya di aplikasi Mobile jkn ini kenapa otp Mobile jkn ga masuk masuk Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
makin kesini makin upgrade fitur Mobile jkn jadi makin positive mudah dan membantubpjs bpjskesehatan 4648 halo min izin nanya aku tadi daftar Mobile jkn tapi gabisa negative min karna sms nya ga masuk itu solusinya gimana ya min bpjs aku juga ilang jadi mau ngurus juga bingung kemana min terimakasih min Stopword Removal Stopword Removal pada penelitian ini dilakukan untuk menghapus kata kata yang tidak memiliki makna signifikan, yang bertujuan untuk meningkatkan kualitas analisis.
Hasil dari Stopword Removal dapat dilihat pada tabel 3.
Tabel 3 Hasil Stopward Removal Ulasan Mobile jkn kenapa yu error ah rese skali Sentimen ka tp ak ga bsa login Mobile jkn nya trs gmn yh halo gabisa daftar ya aplikasi Mobile jkn otp Mobile jkn ga masuk masuk kesini upgrade fitur Mobile jkn mudah membantubpjs positive 4648 halo min izin nanya daftar Mobile jkn gabisa min karna negative sms nya ga masuk solusinya gimana ya min bpjs ilang ngurus bingung kemana min terimakasih min Tokenizing Tokenizing dilakukan pada penelitian ini bertujuan untuk memisahkan kata-kata, frasa pada setiap kalimat menjadi lebih kecil yang bertujuan untuk melanjutkan pemrosesan Hasil dapat dilihat pada table 4 dibawah ini.
Tabel 4 Hasil Tokenizing Ulasan ['Mobile', 'jkn', 'yu', 'error', 'ah', 'rese', 'skali'] Sentimen ['ka', 'tp', 'ak', 'ga', 'bsa', 'login', 'Mobile', 'jkn', 'nya', 'trs', negative 'gmn', 'yh'] ['halo', 'gabisa', 'daftar', 'ya', 'aplikasi', 'Mobile', 'jkn'] ['otp', 'Mobile', 'jkn', 'ga', 'masuk', 'masuk'] ['kesini', 'upgrade', 'fitur', 'Mobile', 'membantubpjs', 'bpjskesehatan'] Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 'jkn', 'mudah', positive 4648 ['halo', 'min', 'izin', 'nanya', 'daftar', 'Mobile', 'jkn', 'gabisa', negative 'min', 'karna', 'sms', 'nya', 'ga', 'masuk', 'solusinya', 'gimana', 'ya', 'min', 'bpjs', 'ilang', 'ngurus', 'bingung', 'kemana', 'min', 'terimakasih', 'min'] Stemming Stemming merupakan proses yang bertujuan untuk merubah kata menjadi bentuk kata dasarnya, atau menghilangkan imbuhan dan juga akhiran dari kata, yang berfungsi untuk mengurangi variasi kata yang digunakan dalam analisis dan meningkatkan efisiensi dalam analisis.
Tabel 5 Hasil Stemming Ulasan Sentimen Mobile jkn yu error ah rese skali ka tp ak ga bsa login Mobile jkn nya trs gmn yh halo gabisa daftar ya aplikasi Mobile jkn otp Mobile jkn ga masuk masuk kesini upgrade fitur Mobile jkn mudah membantubpjs positive 4648 halo min izin nanya daftar Mobile jkn gabisa min karna negative sms nya ga masuk solusi gimana ya min bpjs ilang ngurus bingung mana min terimakasih min Data Mining Pada proses data mining akan menentukan penggunaan algoritma yang akan digunakan untuk menganalisis data.
Pada penelitian ini menggunakan algoritma KNN dan Logistic Regression , menggunakan confusion matrix sebagai evaluasi dan menggunakan google colabs untuk melakukan analisis dalam penelitian ini.
Dataset yang sudah siap digunakan selanjutnya akan dilakukan proses data mining menggunakan google colab.
Pada proses ini memiliki bebrapa tahapan yang perlu Berikut tahapan-tahapan untuk melakukan klasifikasi menggunakan KNN dan Logistic Regression pada google colab.
Import libraries Library yang diperlukan dalam melakukan klasifikasi menggunakan KNN dan Logistic Regression yaitu numpy, pandas, dan scikit-learn, library numpy digunakan untuk operasi matriks, pandas digunakan untuk membaca data, scikit-learn digunakan untuk KNN dan Logistic Regression dan untuk mengimport performa model.
Berikut adalah code program untuk mengimport library yang diperlukan dapat dilihat pada tabel 6.
Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
Tabel 6 Import Library import pandas as pd import numpy as np from sklearn.
model_Selection import train_test_split from sklearn.
feature_extraction.
text import TfidfVectorizer from sklearn.
metrics import classification_report, accuracy_score, precision_score, recall_score, f1_score from sklearn.
neighbors import KNeighborsClassifier from sklearn.
linear_model import LogisticRegression from sklearn.
metrics import confusion_matrix.
ConfusionMatrixDisplay Read data Dataset yang digunakan dalam penelitian ini dan sudah dilakukan Preprocessing disimpan dalam memory Local Disk Cyang di impor ke google colab, maka diperlukan code untuk memuat dataset dengan menggunakan method " data_labeled_roberta.
Pada table 7 merupakan code untuk memanggil data set.
Tabel 7 Read Data data = pd.
Read_csv("data_labeled_roberta.
IndoBert Dataset yang telah melalui Preprocessing, selanjutnya dilakukan proses labeling untuk memberi label pada ulasan.
Tabel 8 Indobert # Load dataset df = pd.
Read_csv("data_preprocessed.
# Gunakan kolom text_clean texts = df["text_cleaned"].
# Load tokenizer dan model RoBERTa multibahasa untuk klasifikasi model_name = "cardiffnlp/twitter-xlm-roberta-base-sentiment" tokenizer = AutoTokenizer.
from_pretrained.
odel_nam.
AutoModelForSequenceClassification.
from_pretrained.
odel_nam.
# Fungsi prediksi batched untuk efisiensi, 2 label output def predict_batch_binary.
exts, batch_size=.
predicted_labels = [] for i in range.
, len.
, batch_siz.
batch = texts.
:i batch_siz.
Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 inputs = tokenizer.
atch, return_tensors="pt", padding=True, truncation=Tru.
with torch.
no_grad():
outputs = model(**input.
probs = torch.
logits, dim=-.
for prob in probs:
# Ambil probabilitas label positive dan negative positive_prob = prob.
negative_prob = prob.
# Pilih label berdasarkan probabilitas yang lebih tinggi if positive_prob >= negative_prob:
predicted_labels.
append("positive") predicted_labels.
append("negative") return predicted_labels # Lakukan prediksi df["predicted_label_roberta"] = predict_batch_binary.
# Simpan hasilnya output_path = "data_labeled_roberta.
to_csv.
utput_path, index=Fals.
output_path TF-IDF Setelah data selesai diproses, representasi data dilakukan menggunakan pembobotan Term Frequency-Inverse Document Frequency (TF-IDF).
Dengan menggunakan AuTfidfVectorizerAy dari AusklearnAy mengubah teks ke representasi numerik .
seperti code pada tabel 9.
Tabel 9 TF-IDF vectorizer = TfidfVectorizer() X = vectorizer.
fit_transform.
f["text_cleaned"]) y = df["predicted_label_roberta"] Split Data Selanjutnya, data yang telah diubah ke bentuk numerik dibagi menjadi dua bagian, yaitu data latih dan data uji.
Pembagian ini dilakukan menggunakan fungsi Autrain_test_splitAy dengan proporsi 80% untuk pelatihan dan 20% untuk pengujian, dikarenkan mendapatkan akurasi yang lebih baik.
Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
Parameter random_state=42 digunakan untuk memastikan hasil pembagian data tetap konsisten setiap kali kode dijalankan.
Penggunaan parameter random_state=42 bertujuan agar proses pembagian data selalu menghasilkan hasil yang sama setiap kali kode Dengan demikian, eksperimen menjadi konsisten, mudah direplikasi, serta meminimalkan perbedaan hasil akibat pembagian data yang berubah-ubah.
Angka 42 hanya digunakan sebagai nilai acak populer tanpa makna khusus.
Seperti tabel 10.
Tabel 10 Split Data X_train.
X_test, y_train, y_test = train_test_split(X, y, test_size=0.
random_state=.
Klasifikasi algoritma KNN K-Nearest Neighbors (KNN), yaitu algoritma klasifikasi berbasis instance-based yang memprediksi kelas data baru berdasarkan kedekatan dengan data latih.
Dengan n_neighbors=5, model menentukan kelas berdasarkan lima tetangga terdekat.
Proses pelatihan dilakukan dengan AufitAy, dan prediksi terhadap data uji menggunakan AupredictAy.
Seperti tabel 11.
Tabel 11 KKN
# KNN
knn = KNeighborsClassifier.
_neighbors=.
fit(X_train, y_trai.
y_pred_knn = knn.
predict(X_tes.
results['KNN'] = { 'accuracy': accuracy_score.
_test, y_pred_kn.
, 'precision': precision_score.
_test, y_pred_knn, zero_division=.
, average='weighted', 'recall': recall_score.
_test, y_pred_knn, average='weighted'), 'f1_score': f1_score.
_test, y_pred_knn, average='weighted') Hasil dari setelah mencjalankan program diatas dapat dilihat pada gambar dibawah ini:
Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 Gambar 3.
Hasil dari KNN Logistic Regression Logistic Regression yang digunakan untuk klasifikasi multi-kelas dengan parameter multi_class='multinomial'.
Model ini menggunakan solver AulbfgsAy untuk optimasi dan max_iter=1000 agar pelatihan mencapai konvergensi.
seperti tabel 12 Tabel 12 Logistic Regression # Logistic Regression logreg = LogisticRegression.
ulti_class='multinomial', solver='lbfgs', max_iter=1.
fit(X_train, y_trai.
y_pred_log = logreg.
predict(X_tes.
results['Logistic Regression'] = { 'accuracy': accuracy_score.
_test, y_pred_lo.
, 'precision':
precision_score.
_test, y_pred_log, average='weighted', zero_division=.
, 'recall': recall_score.
_test, y_pred_log, average='weighted'), 'f1_score': f1_score.
_test, y_pred_log, average='weighted') Hasil dari setelah mencjalankan program diatas dapat dilihat pada gambar dibawah ini:
Gambar 4 Hasil dari Logistik Regression Confusion matrix Untuk analisis lebih dalam terhadap hasil klasifikasi, ditampilkan confusion matrix dari masing-masing model.
Confusion matrix menunjukkan jumlah prediksi benar dan salah untuk setiap kelas, sehingga kita dapat melihat pola kesalahan model.
seperti tabel dibawah Tabel 12 Hasil Confusion matrix
# KNN
cm_knn = confusion_matrix.
_test, y_pred_knn, labels=logreg.
Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
disp_knn ConfusionMatrixDisplay.
onfusion_matrix=cm_knn, display_labels=logreg.
disp_knn.
map='Blues') title("Confusion matrix - KNN") # Logistic Regression cm_log = confusion_matrix.
_test, y_pred_log, labels=logreg.
disp_log ConfusionMatrixDisplay.
onfusion_matrix=cm_log, display_labels=logreg.
disp_log.
map='Greens') title("Confusion matrix - Logistic Regression") Hasil AuConfusionMatrixDisplayAy dengan pewarnaan berbeda untuk setiap model .
iru untuk KNN dan hijau untuk Logistic Regressio.
dapat dilihat pada gambar dibawah ini:
Gambar 5 Hasil Confusion matrix KNN Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 Gambar 6 Hasil Confusion matrix Logistik Regression Visualisasi Visualisasi berfungsi untuk membuat informasi berupa topik yang paling sering muncul yang dibuat oleh pengguna aplikasi JKN Mobile, sehingga dari banyak teks ulasan yang ada dapat dibuat informasi yang dianggap penting.
Dalam penelitian ini visualisasi dilakukan dengan cara membuat word cloud.
Sentimen Positif Data sentimen positif merupakan hasil dari pelabelan yang di klasifikasi kedalam kelas positif.
Berikut merupakan hasil visualisasi ulasan positif yang dibuat menggunakan word cloud pada Gambar 4.
Gambar 7 Wordcloud Sentimen Positif Gambar 5 menunjukan bahwa pada kelas sentimen positif kata yang paling sering muncul yaitu seperti bpjs, menu info, terima kasih.
Sentimen Negatif Ulasan yang memiliki kelas negatif adalah hasil pelabelan data yang termasuk dalam kelas negatif dalam analisis sentimen.
Berikut adalah hasil visualisasi ulasan negatif dalam wordcloud pada Gambar 4.
Analisis Sentimen Opini Masyarakat Terkait Penggunaan Mobile Jkn Pada Media Sosial X Dengan Perbandingan Algoritma K-Nearest Neighbor (Kn.
Dan Logistic Regression (L.
(Kelvin Valensio Hematang.
Nengah Widya Utami & I Nyoman Purnam.
Gambar 8 Wordcloud Sentimen Negatif Gambar 6 Menunjukan bahwa pada kelas sentimen negative kata yang paing sering muncul yaitu kata-kata seperti aplikasi, daftar.
Perbandingan algoritma KNN dan Logistik Regression Evaluasi performa model K-Nearest Neighbor (KNN) dan Logistik Regression (LR) dilakukan untuk klasifikasi sentimen ulasan pengguna aplikasi JKNMobile, dengan hasil metrik precision, recall, f1-score, dan accuracy.
Gambar 9 Perbandingan KNN dan Logistik Regression Grafik di atas menunjukkan perbandingan kinerja dua model klasifikasi sentimen, yaitu KNearest Neighbor (KNN) dan Logistic Regression (LR), berdasarkan empat metrik evaluasi:
accuracy, precision, recall, dan f1-score.
Hasilnya.
Logistic Regression unggul di semua metrik dengan skor accuracy 86.
13%, precision 90.
46%, recall 77.
93%, dan f1-score 73%, dibandingkan KNN yang mencatat accuracy 83.
33%, precision 85.
75%, recall 29%, dan f1-score 80.
Perbedaan ini menunjukkan bahwa Logistic Regression mampu memberikan prediksi yang lebih konsisten dan akurat dalam mengklasifikasikan sentimen ulasan pengguna aplikasi JKN Mobile, menjadikannya pilihan model yang lebih efektif dibandingkan KNN untuk tugas ini.
Interpretasi hasil Dataset penelitian ini berupa ulasan pengguna aplikasi JKN Mobile yang telah melalui Preprocessing dan pelabelan sentimen otomatis dengan model Roberta bahasa Indonesia.
Data kemudian dikategorikan menjadi dua kelas, positif dan negatif, untuk pelatihan serta Jurnal Sistem Informasi (JUSIN) Juli Ae Desember 2025.
Vol 6 .
: hlm 131-146 evaluasi model klasifikasi.
Dua algoritma yang digunakan adalah K-Nearest Neighbor (KNN) dan Logistic Regression.
Hasil evaluasi menunjukkan Logistic Regression lebih unggul dengan akurasi 87,85%, sedangkan KNN memperoleh akurasi 83,87%.
KESIMPULAN
Berdasarkan hasil penelitian yang telah dilakukan maka diperoleh beberapa kesimpulan sebagai berikut:
Dari 4.
777 data ulasan mengenai aplikasi Mobile JKN, menghasilkan 4.
648 data yang bersih setelah dilakukan Preprocessing, selanjutnya proses pelabelan data menggunakan IndoBert.
Berdasarkan pelabelan tersebut mendapatkan ulasan kelas positif sebanyak 066 data, dan ulasan kelas negatif sebanyak 2.
581 data.
Hasil evaluasi model klasifikasi menunjukkan bahwa penerapan algoritma K-Nearest Neighbor (KNN) menghasilkan akurasi sebesar 83.
87%, sedangkan algoritma Logistic Regression menghasilkan akurasi sebesar 87.
Dengan demikian, dapat disimpulkan bahwa Logistic Regression memiliki performa yang lebih baik dalam mengklasifikasikan sentimen ulasan pengguna aplikasi JKN Mobile dibandingkan dengan KNN, berdasarkan nilai akurasi serta metrik evaluasi lainnya seperti precision, recall, dan f1-score.
DAFTAR PUSTAKA