JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No. 03 Desember 2025 ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786 ANALISIS SENTIMEN REBRANDING APLIKASI CICI MENJADI DOLA PADA GOOGLE PLAY STORE MENGGUNAKAN METODE INDOBERT Abdul Kholik. Muhammad Dzulfikar Fauzi. Hendra Di Kesuma. , . Sistem Informasi. Universitas Indo Global Mandiri Informatika. Telkom University Surabaya Email :abdulkholik@uigm. ,dzulfikarf@telkomuniversity. ,hendra@uigm. ABSTRACT Brand identity transition or rebranding is a strategic maneuver that significantly influences user perception and This study aims to analyze Google Play Store user sentiment regarding the rebranding of the AI assistant application "Cici" to "Dola," utilizing review commentary data from November 2025. Given the complexity of review language, which frequently incorporates non-standard Indonesian and sarcasm, this research employs the IndoBERT (Bidirectional Encoder Representations from Transformers for Indonesia. deep learning model. The dataset consists of 1,869 reviews classified into three categories: positive, neutral, and negative. The methodology encompasses data scraping, text normalization, and fine-tuning of the IndoBERT base-p2 model. The results demonstrate that the IndoBERT model achieved an overall accuracy of 0. 88, with the strongest performance observed in the positive sentiment category (F1-score of 0. However, the model identified challenges within the negative class, where 119 negative reviews were misclassified as positive due to linguistic ambiguity and user nostalgia for the former brand identity. These findings conclude that while the majority of users have accepted Dola's new identity, there remains a degree of brand resistance that necessitates management through improved feature education strategies. Keywords : Sentiment Analysis. Rebranding. IndoBERT. Dola AI. Google Play Store. ABSTRAK Transisi identitas merek atau rebranding merupakan langkah strategis yang dapat mempengaruhi persepsi dan kepuasan pengguna secara signifikan. Penelitian ini bertujuan untuk menganalisis sentimen pengguna Google Play Store terhadap rebranding aplikasi asisten AI "Cici" menjadi "Dola" menggunakan data komentar review aplikasi pada November 2025. Mengingat kompleksitas bahasa ulasan yang seringkali menggunakan bahasa tidak baku dan sarkasme, penelitian ini menerapkan model deep learning IndoBERT (Bidirectional Encoder Representations from Transformers untuk Bahasa Indonesi. Dataset penelitian terdiri dari 1. 869 ulasan yang diklasifikasikan ke dalam tiga kategori: positif, netral, dan Metodologi penelitian meliputi scraping data, normalisasi teks, dan fine-tuning model IndoBERT base-p2. Hasil penelitian menunjukkan bahwa model IndoBERT mencapai tingkat akurasi keseluruhan sebesar 0,88 dengan performa paling dominan pada sentimen positif (F1-score 0,. Namun, model mengidentifikasi tantangan pada kelas negatif, di mana terdapat 119 ulasan negatif yang salah terdeteksi sebagai positif akibat adanya ambiguitas linguistik dan kerinduan pengguna terhadap identitas merek lama. Temuan ini menyimpulkan bahwa meskipun sebagian besar pengguna menerima identitas baru Dola, terdapat resistensi merek yang perlu dikelola melalui strategi edukasi fitur yang lebih baik. Kata Kunci : Analisis Sentimen. Rebranding. IndoBERT. Dola AI. Google Play Store. Pendahuluan merupakan salah satu pemain utama yang berhasil mendominasi pasar asisten AI di Indonesia dan negaraPerkembangan teknologi Kecerdasan Buatan negara berkembang lainnya sejak peluncurannya pada atau Artificial Intelligence (AI) telah mencapai titik Agustus 2023 (Agustina & Suharya, 2. Aplikasi ini kulminasi di mana asisten virtual kini terintegrasi secara melakukan langkah strategis berupa rebranding identitas mendalam ke dalam berbagai aspek kehidupan merek menjadi "Dola," sebuah transisi yang tidak hanya masyarakat Indonesia, mulai dari sektor produktivitas, mengubah nama tetapi juga mencerminkan pergeseran pendidikan, hingga layanan publik yang dikelola strategi global perusahaan untuk bersaing dengan raksasa pemerintah (Fourniawan et al. , 2. Salah satu teknologi lainnya seperti ChatGPT dari OpenAI dan fenomena yang paling menonjol dalam ekosistem digital Gemini dari Google (Oreate AI, 2. kontemporer adalah munculnya aplikasi asisten AI berbasis percakapan yang mampu mensimulasikan Transisi identitas digital atau rebranding dalam interaksi manusia dengan tingkat akurasi yang tinggi. industri teknologi merupakan proses yang kompleks dan Aplikasi "Cici," yang dikembangkan oleh ByteDance, berisiko tinggi. Secara teoritis, rebranding bertujuan JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No. 03 Desember 2025 untuk memperbarui citra merek, menyesuaikan posisi pasar, atau mengintegrasikan fitur-fitur baru yang lebih canggih guna mempertahankan keunggulan kompetitif. Namun, sebagaimana dicatat dalam Jurnal Penelitian Pendidikan Indonesia (JPPI), perubahan identitas seringkali memicu pergeseran persepsi pengguna yang signifikan, di mana kepuasan terhadap fitur baru seringkali berbenturan dengan resistensi emosional terhadap hilangnya identitas lama yang sudah dikenal baik (Nova, 2. Dalam konteks aplikasi Dola, pengguna yang telah lama menggunakan Cici dihadapkan pada perubahan visual dan penamaan yang drastis, yang dalam beberapa kasus dapat menyebabkan penurunan tingkat kepercayaan atau bahkan perpindahan ke aplikasi pesaing jika proses transisi tidak dikelola dengan komunikasi yang efektif (Sugiarti et al. , 2. ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786 token dari berbagai sumber, termasuk berita, media sosial, dan blog. Pelatihan ini dilakukan dalam dua fase utama (Phase 1 dan Phase . , di mana model mempelajari struktur linguistik bahasa Indonesia melalui tugas Masked Language Modeling (MLM) dan Next Sentence Prediction (NSP) (Wilie et al. , 2. keunggulan IndoBERT juga teruji pada analisis ulasan aplikasi layanan publik. Penggunaan IndoBERT untuk mengklasifikasi ulasan aplikasi Mobile JKN menghasilkan performa yang sangat tinggi, dengan ratarata akurasi mencapai 97,28%. Hal ini menunjukkan bahwa model berbasis deep learning ini sangat andal dalam menangani keragaman bahasa ulasan di Google Play Store, baik untuk kategori sentimen positif, negatif, maupun netral. Tingginya efektivitas model ini memberikan landasan kuat bahwa IndoBERT merupakan instrumen yang tepat untuk memahami ekspektasi dan kepuasan pengguna terhadap layanan digital secara akurat (Tarwoto et al. , 2. Untuk mengevaluasi keberhasilan strategi rebranding tersebut, analisis sentimen terhadap ulasan pengguna di platform seperti Google Play Store menjadi instrumen yang sangat krusial. Ulasan digital menyediakan data tekstual yang kaya akan opini jujur, emosi, dan kritik yang dapat digunakan sebagai dasar perbaikan layanan (Zuhdi & Prasetiyo, 2. Namun, pengolahan data teks dalam bahasa Indonesia memiliki tantangan tersendiri. Bahasa Indonesia yang digunakan dalam ulasan aplikasi cenderung bersifat non-formal, penuh dengan singkatan . , penggunaan dialek daerah, serta konteks kalimat yang ambigu dan sarkastis. Metode klasifikasi tradisional seperti Naive Bayes atau Support Vector Machine (SVM) seringkali memiliki keterbatasan dalam menangkap semantik kalimat yang kompleks dan nuansa linguistik yang mendalam (Fahrezi & Solichin, 2. Bahasa Indonesia di media sosial sangat dinamis dengan penggunaan kata gaul atau slang yang terus Berdasarkan penelitian di Journal of Information System Research (JOSH). IndoBERT menunjukkan ketahanan yang luar biasa dalam mengklasifikasikan teks yang mengandung dialek regional dan ekspresi 1 Hal ini sangat penting dalam analisis rebranding Dola, karena ulasan pengguna seringkali menggunakan bahasa yang sarkastis misalnya, memberikan pujian di awal kalimat namun diakhiri dengan kekecewaan terhadap perubahan nama aplikasi. IndoBERT mampu menangkap kontradiksi semantik ini lebih baik daripada model tradisional seperti Naive Bayes bidirectional (Singgalen, 2. Dalam perkembangannya, upaya meningkatkan performa klasifikasi sentimen juga dilakukan dengan menggabungkan berbagai teknik ekstraksi fitur. Penggabungan fitur dari IndoBERT yang memahami makna kontekstual dengan GloVe yang menangkap makna semantik global dapat menghasilkan representasi data yang lebih kaya. Penelitian tersebut membuktikan bahwa metode konkatenasi vektor antara keduanya mampu meningkatkan akurasi klasifikasi hingga mencapai 91% pada ulasan aplikasi, yang menunjukkan bahwa pendekatan hybrid ini merupakan solusi yang efektif dan andal untuk memahami sentimen pengguna secara lebih mendalam (Andhika et al. , 2. Penelitian ini menerapkan model state-of-the-art dalam pemrosesan bahasa alami (Natural Language Processin. , yaitu IndoBERT. IndoBERT adalah varian dari arsitektur Bidirectional Encoder Representations from Transformers (BERT) yang telah dilatih secara khusus menggunakan korpus bahasa Indonesia yang Penggunaan model berbasis transformer ini diharapkan mampu memberikan tingkat akurasi yang lebih tinggi dalam mengklasifikasikan sentimen pengguna terkait transisi Cici menjadi Dola. Berdasarkan latar belakang tersebut, rumusan masalah dalam penelitian ini adalah bagaimana efektivitas model IndoBERT dalam mengklasifikasikan sentimen pengguna dan bagaimana dampak rebranding tersebut terhadap kepuasan pengguna di Google Play Store. Tujuan penelitian ini adalah untuk membangun model klasifikasi sentimen yang akurat dan menganalisis pola resistensi atau penerimaan pengguna terhadap identitas baru Dola. Hasil dari penelitian ini diharapkan dapat memberikan kontribusi ilmiah bagi pengembangan NLP IndoBERT adalah adaptasi dari arsitektur BERT yang dilatih secara khusus pada korpus bahasa Indonesia yang sangat besar, dikenal sebagai Indo4B. Korpus ini mencakup sekitar 23,43 GB teks yang terdiri dari 4 miliar ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786 JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No. 03 Desember 2025 bahasa Indonesia serta menjadi referensi manajerial bagi pengembang aplikasi dalam melakukan transisi identitas merek di masa depan. sebagai netral, dan rating 1-2 sebagai negatif. Distribusi jumlah data untuk setiap kelas dapat dilihat pada Tabel 1. Tabel 1. Hasil Evaluasi Klasifikasi Model IndoBERT Pembahasan Sentimen Positif Negatif Netral Total Penelitian ini mengikuti alur kerja sistematis yang dimulai dari pengumpulan data hingga evaluasi Tahapan ini dirancang untuk memastikan data ulasan yang bersifat non-formal dapat diproses secara akurat oleh arsitektur transformer. Jumlah Ulasan Persentase (%) 76,7% 19,6% 3,7% Berdasarkan Tabel 1, terlihat adanya ketidakseimbangan data . mbalanced dat. di mana kelas positif mendominasi dataset. Hal ini merupakan fenomena yang umum terjadi pada ulasan aplikasi populer, namun menjadi catatan penting dalam proses evaluasi model, terutama pada rendahnya nilai recall untuk kelas netral seperti yang ditunjukkan pada hasil Penjelasan ini memberikan konteks bagi pembaca mengenai mengapa model IndoBERT memiliki performa yang sangat tinggi pada deteksi sentimen positif namun memerlukan perhatian lebih pada kelas minoritas. 1 Pengumpulan Data dan Preprocessing Data dikumpulkan dari Google Play Store menggunakan teknik web scraping pada ID aplikasi Sebanyak 1. 849 ulasan berhasil ditarik dengan fokus pada periode transisi rebranding November 2025. 2 Arsitektur Model IndoBERT Penelitian ini menggunakan model IndoBERT base-p2 yang dikembangkan oleh IndoBenchmark. Model ini dipilih karena telah dilatih pada korpus bahasa Indonesia yang besar, sehingga memiliki pemahaman semantik yang kuat. Arsitektur ini menggunakan mekanisme self-attention untuk memahami konteks dua arah . dalam sebuah kalimat. Gambar 1. Hasil Scraping Mengingat ulasan pengguna cenderung menggunakan bahasa non-formal, dilakukan tahap preprocessing yang meliputi: Proses adaptasi model dilakukan melalui tahapan fine-tuning dengan mengintegrasikan lapisan tambahan di atas arsitektur dasar IndoBERT. Secara spesifik, sebuah lapisan Linear Classifier ditambahkan untuk menangkap informasi semantik yang terkumpul pada token [CLS]. Dalam arsitektur Transformer, token [CLS] berfungsi sebagai representasi representatif dari keseluruhan urutan teks, sehingga output dari token ini pada lapisan terakhir digunakan sebagai masukan utama bagi pemlasifikasi untuk menentukan kategori target. Strategi ini memungkinkan model memanfaatkan pengetahuan bahasa yang luas dari IndoBERT sambil menyesuaikan bobotnya secara spesifik untuk tugas klasifikasi yang dihadapi. Case Folding: Mengubah seluruh teks menjadi huruf kecil. Filtering: Menghapus tanda baca dan karakter non-alfanumerik. Normalisasi Slang: Mengonversi kata-kata tidak baku . ontoh: "gk" menjadi "tidak", "apk" menjadi "aplikasi") menggunakan kamus pemahaman model terhadap teks. 2 Distribusi Dataset Dataset yang digunakan dalam penelitian ini dikategorikan ke dalam tiga kelas sentimen utama: Positif. Netral, dan Negatif. Penentuan label awal dilakukan berdasarkan rating bintang yang diberikan oleh pengguna, di mana rating 4-5 dikategorikan sebagai positif, rating 3 Untuk mencapai konvergensi yang optimal, eksperimen ini menerapkan konfigurasi hiperparameter yang terukur. Pelatihan dilakukan selama 3 epoch, sebuah durasi yang umum digunakan pada model berbasis BERT ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786 JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No. 03 Desember 2025 untuk menghindari risiko overfitting namun tetap memberikan waktu yang cukup bagi model untuk mempelajari pola data baru. Learning rate ditetapkan pada angka 2 O 10 guna memastikan pembaruan bobot terjadi secara bertahap dan halus, menjaga agar pengetahuan umum yang telah dimiliki model tidak hilang begitu saja. Selain itu, penggunaan batch size sebanyak 16 dipilih untuk menyeimbangkan efisiensi komputasi dengan stabilitas estimasi gradien selama proses pencarian nilai minimum fungsi kerugian. ycIyceycaycaycoyco = Tabel 2. Hasil Evaluasi Klasifikasi Model IndoBERT Kelas Negatif Netral Positif Accuracy Macro Avg Weighted Avg Hasil klasifikasi sentimen divisualisasikan menggunakan Confusion Matrix untuk melihat performa model pada setiap kelas (Positif. Netral, dan Negati. Untuk mengukur kinerja model IndoBERT secara kuantitatif, penelitian ini menggunakan matrik evaluasi yang diturunkan dari Confusion Matrix. Metrik tersebut meliputi Accuracy. Precision. Recall, dan F1-Score. Precision Recall F1-Score Support Hal ini mengindikasikan bahwa arsitektur transformer pada IndoBERT mampu menangkap pola kepuasan pengguna terhadap identitas baru aplikasi secara Meskipun demikian, hasil pengujian juga mengungkapkan adanya tantangan pada klasifikasi kelas netral, yang meskipun memiliki nilai precision sempurna . , namun memiliki nilai recall yang rendah sebesar 0,18. Accuracy: Mengukur rasio prediksi benar . ositif dan negati. terhadap keseluruhan data. ycNycE ycNycA ycNycE ycNycA yaycE yaycA Rendahnya nilai recall pada kelas netral ini disebabkan oleh keterbatasan jumlah sampel data netral yang hanya berjumlah 69 ulasan, sehingga model cenderung lebih selektif dalam mengklasifikasikan data ke dalam kategori tersebut untuk menjaga akurasi Precision: Mengukur tingkat keakuratan antara data yang diminta dengan hasil prediksi yang diberikan oleh model. ycEycyceycaycnycycnycuycu = ycEycyceycaycnycycnycuycu O ycIyceycaycaycoyco ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco Implementasi IndoBERT klasifikasi sentimen rebranding aplikasi Dola menunjukkan performa yang sangat baik dengan nilai akurasi keseluruhan sebesar 0,88. Berdasarkan analisis metrik pada Tabel 3, model menunjukkan tingkat keberhasilan yang sangat tinggi dalam mengenali sentimen positif, yang dibuktikan dengan nilai recall mencapai 0,97 dan F1-score sebesar 0,93. 3 Hasil dan Analisis Eksperimen yaycaycaycycycaycayc = F1-Score: Merupakan perbandingan rata-rata presisi dan recall yang telah di bobotkan untuk memberikan gambaran keseimbangan performa ya1 Oe ycIycaycuycyce = 2 O Dalam hal manajemen data, penelitian ini menerapkan skema pembagian dataset yang ketat dengan proporsi 80% untuk data pelatihan dan 20% untuk data pengujian atau validasi. Alokasi 80% data latih memberikan ruang yang cukup bagi model untuk mengekstraksi fitur-fitur linguistik yang kompleks, sementara 20% data uji berfungsi sebagai tolok ukur objektif untuk mengevaluasi kemampuan generalisasi model terhadap data yang belum pernah ditemui Melalui pembagian ini, performa model dapat diukur secara lebih transparan, memastikan bahwa hasil akurasi yang diperoleh mencerminkan kemampuan model dalam menangani variasi data di dunia nyata. ycNycE ycNycE yaycA ycNycE ycNycE yaycE Recall: Mengukur keberhasilan model dalam . JURNAL ILMIAH INFORMATIKA GLOBAL VOLUME 16 No. 03 Desember 2025 ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786 identitas nama lama (Cic. Secara keseluruhan, penggunaan arsitektur transformer terbukti efektif dalam menangkap konteks bahasa Indonesia yang kompleks pada ulasan aplikasi Temuan ini memberikan gambaran bahwa strategi rebranding identitas digital memerlukan pendekatan edukasi fitur yang lebih masif untuk meminimalisir resistensi pengguna lama. Untuk penelitian selanjutnya, disarankan untuk menerapkan teknik penyeimbangan data . ata balancin. seperti SMOTE dan melakukan ekstraksi fitur berbasis aspek . spect-based sentiment analysi. guna mendapatkan wawasan yang lebih detail mengenai fitur spesifik yang paling berpengaruh terhadap kepuasan pengguna. Daftar Pustaka