Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal. id/index. php/malcom Vol. 3 Iss. 2 October 2023, pp: 211-218 ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Sentiment Analysis of Public Opinion on Twitter Toward BSI Bank Using Machine Learning Algorithms Analisis Sentimen Opini Publik pada Twitter Terhadap Bank BSI Menggunakan Algoritma Machine Learning Ratna Andini Husen1*. Rizki Astuti2 . Lili Marlia3 . Rahmaddeni4 . Lusiana Efrizoni5 1,2,3,4,5 Teknik Informatika. STMIK Amik Riau. Indonesia E-Mail: 1201003182011@sar. id, 22010031802007@sar. id, 32010031802008@sar. rahmaddeni@sar. id, 5lusiana. efrizoni@sar. Diterima 30 Agustus 2021. September direvisi 05 2021. Diterima 15 September 2022 2 Penulis Korespondensi: Ratna Andini Husen Abstract Public opinion expressed through social media, especially Twitter, has become an important source of information for companies and financial institutions, including BSI Bank. Sentiment analysis of public opinion can help BSI Bank in understanding the views and perceptions of the public towards their services. This study aims to develop and apply machine learning algorithms, namely SVM, nayve bayes and logistic regression algorithms to analyze public opinion sentiment towards BSI Bank contained in tweets on Twitter. The tweet Data used in this study was taken from kaggle's website with a total of 24,401 data, containing reviews of user comments related to ransomware at BSI Bank. The results of the experiments that have been done obtained that SVM produces 0. 88% accuracy, naive bayes produces 0. 76% accuracy, and logistic regression produces 0. 86% accuracy. Based on the experimental results that SVM get a performance performance that is superior to the naive bayes algorithm and logistic regression . In this context. SVM can be a good choice for sentiment analysis in general. This study revealed that the percentage of negative sentiment towards BSI Bank is higher than positive sentiment. These findings indicate a significant concern and dissatisfaction among the public towards the company's services. While there are some positive sentiments identified, it is important for BSI Bank to take seriously the concerns underlying these negative sentiments. Keyword: Bank of BSI. Logistic Regression. Nayve Bayes. SVM. Twitter Abstrak Opini publik yang terekspresikan melalui media sosial, khususnya Twitter, telah menjadi sumber informasi yang penting bagi perusahaan dan lembaga keuangan, termasuk Bank BSI. Analisis sentimen opini publik dapat membantu Bank BSI dalam memahami pandangan dan persepsi masyarakat terhadap layanan mereka. Penelitian ini bertujuan untuk mengembangkan dan mengimplementasikan algoritma machine learning yaitu algoritma SVM, nayve bayes dan logistic regression untuk menganalisis sentimen opini publik terhadap Bank BSI yang terdapat dalam tweet di Twitter. Data tweet yang digunakan dalam penelitian ini diambil situs dari kaggle dengan jumlah data 24. 401, berisi tentang ulasan komentar pengguna terkait ransomware pada Bank BSI. Hasil dari percobaan yang telah dilakukan diperoleh bahwa SVM menghasilkan akurasi 0,88%, naive bayes menghasilkan akurasi 0,76%, dan logistic regression menghasilkan akurasi 0,86%. Berdasarkan dari hasil percobaan bahwa SVM mendapatkan performa kinerja yang lebih unggul dari pada algoritma naive bayes dan logistic regression . Dalam konteks ini. SVM dapat menjadi pilihan yang baik untuk analisis sentimen secara umum. Penelitian ini mengungkapkan bahwa persentase sentimen negatif terhadap Bank BSI lebih tinggi daripada sentimen positif. Temuan ini menunjukkan adanya keprihatinan dan ketidakpuasan yang signifikan di antara masyarakat terhadap layanan perusahaan. Meskipun ada beberapa sentimen positif yang teridentifikasi, penting bagi Bank BSI untuk secara serius memperhatikan dan menangani masalah-masalah yang mendasari sentimen negatif ini. Kata Kunci: Bank BSI. Logistic Regression. Nayve Bayes. SVM. Twitter PENDAHULUAN Opini publik merupakan aspek penting dalam dunia bisnis, terutama dalam sektor perbankan. Di zaman yang sangat maju ini, hiburan virtual seperti Twitter, telah menjadi platform dasar bagi orang-orang untuk berbagi perspektif, kesimpulan, dan pengalaman mengenai berbagai produk dan layanan, termasuk layanan DOI: https://doi. org/10. 57152/malcom. MALCOM-03. : 211-218 Bank sebagai institusi keuangan juga tidak terkecuali dari eksposur terhadap opini publik yang tergambar dalam media sosial. Medsos atau social media adalah sebuah media yang biasa digunakan untuk memperkenalkan diri, berbagi dalam bentuk informasi, berinteraksi atau berkolaborasi satu sama lain. Media sosial Twitter telah menjadi platform penting bagi penggunanya untuk menyampaikan pendapat, termasuk opini publik tentang berbagai topik, termasuk lembaga keuangan. Di Indonesia. Twitter bukan hanya dipergunakan sebagai sarana untuk mengekspresikan emosi, tetapi juga sebagai sarana untuk memberikan masukan atau kritik terhadap suatu objek, pelayanan atau kebijakan pemerintah . Pada penelitian ini peneliti memanfaatkan dataset publik dari sosial media Twitter yang diunduh dari Kaggle untuk melakukan analisis sentimen terhadap ulasan yang berkaitan dengan Bank BSI (Bank Syariah Indonesi. BSI termasuk bank syariah terbesar yang ada diIndonesia bentuk pengabungan dari tiga bank Syariah dari himpunan bank milik negara (Himbar. , yaitu PT Bank BRI Syariah (BRIS). PT Bank Syariah Mandiri (BSM), dan PT Bank BNI Syariah (BNIS) yang dimana di dalam pelaksanaan kegiatannya dilakukan dengan sistem anti riba atau sistem ekonomi syariah . Topik yang lagi hangat diperbicangkan dalam kurun waktu terakhir ini yaitu dampak serangan ransomware pada Bank BSI. Penelitian yang dilakukan mengulas beberapa penelitian sebelumnya yang dilakukan di bidang analisis Berdasarkan penelitian sebelumnya yang berjudul analisis perbandingan sentimen corona virus diseases-2019 . pada Twitter menggunakan algoritma logistic regresion dan Support Vector Machine (SVM) melakukan suatu analisis sentimen terhadap bahasan yang saat ini sering menjadi trending topic di twitter yaitu AuCoronaVirus Disease 2019 . Ay. Penyebaran virus corona juga ramai diperbincangkan di Twitter, saat ini virus corona sedang menarik pandangan dunia internasional. Pada penelitian ini menghasilkan nilai akurasi tertinggi sebesar 92,13% dalam data pelatihan dan 91,15% dalam data pengujian sedangkan algoritma logistic regresion memperoleh nilai dari hasil akurasi sebesar 87,79% pada data pelatihan dan 87,68% pada data pengujian . Sedangkan pada penelitian berjudul analisis sentimen Gofood berdasarkan twitter mengunakan metode Nayve Bayes dan SVM penelitian ini dilakukan dengan tujuan menganalisa opini masyarakat akan kinerja Gojek (Gofoo. di Indonesia. itu mendapatkan nilai netral sebesar 92,8% , bernilai positif sebesar 5,2% dan bernilai negatif sebsar 2,0%. Perbandingan dari hasil akurasi yang didapat, algoritma SVM memperoleh nilai akurasi yang jauh lebih besar dari algoritma nayve bayes. Adapun hasil akurasi algoritma SVM sebesar 83% dan 98,5% sedangkan algoritma nayve bayes mendapatkan nilai akurasi 74,6% dan 91,5% . Berdasarkan penelitian sebelumnya, pada penelitian ini akan digunakan beberapa algoritma machine learning seperti SVM, nayve bayes, dan logistic regression. SVM adalah teknik machine learning yang didasarkan dari teori struktural pembelajaran statistik . Keunggulan dari naive bayes yaitu seperti kesederhanaan, kecepatan, dan akurasi yang ada pada algoritma ini cenderung lebih tinggi. Telah banyak penelitian yang dilakukan untuk klasifikasi sentimen menggunakan naive bayes . Logstic regression adalah metode yag sering digunakan dalam menganalisis data degan satu atau lebih variabel prediktor yang mengambarkan variabel respon. Variabel respon logistic regression sendiri mempunyai nilai 1 . dan 0 . , sehingga akan menciptakan variable respon Bernoulli . Tujuan penelitian yang akan dilakukan yaitu untuk melakukan klasifikasi atau pengelompokkan ulasan positif dan negatif pengguna Twitter terhadap Bank BSI. Penelitian yang dilakukan dapat digunakan oleh Bank BSI sebagai tolak ukur untuk meningkatkan layanan kepada pengguna berdasarkan ulasan positif dan negatif. METODE PENELITIAN Penelitian ini memiliki beberapa proses. Data dan informasi yang obyektif akan dijadikan acuan dalam penelitian, dengan data tersebut diharapkan penelitian yang dihasilkan akan menjadi penelitian yang Pada Gambar 1 ini berisi tahapan-tahapan pengerjaan seperti data collection, pre-processing data, word embedding, modelling, evaluation model, dan analysis sentiment. Data Collection (Pengumpulan Dat. Pengumpulan data kini menjadi komponen penting dari semua operasi bisnis, baik itu data klien untuk melakukan hal yang sederhana layanan atau data perusahaan untuk memastikan pengoperasian infrastruktur Dalam lingkungan operasional saat ini dan dengan terus berkembangnya ekonomi digital, data adalah aset perusahaan yang penting. Terlepas dari fungsi dan pentingnya data, hal tersebut memang benar adanya sulit untuk mendorong bisnis untuk melindungi data mereka sendiri . Data yang digunakan dalam proses perbandingan algoritma ini tentang komentar nasabah bank BSI yang bersumber dari Kaggle. jumlah data yang digunakan 24. 401 komentar yang tersusun dalam file csv. Analisis Sentimen Opini Publik pada Twitter. (Husen et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Tabel 1. Isi dataset 1,URL,Date,Tweet,ID,Username,Replies,Reetweets,Likes,Quotes,conversationId,Language,Links,Media,Retweeted Tweet,Bookmarks 2,https://twitter. com/SaidRberdaya/status/1658980771284279297,2023-05-17 23:40:12 00:00,"@bankbsi_id Layanan BAYAR ke @TakafulKeluarga sudah bisa blm ya ,kok jadi repot begini yA ",1658980771284279297,SaidRberdaya,0,0,0,0,1658830871812775937,in,0 3,https://twitter. com/ariemayw/status/1658980516857802753,2023-05-17 23:39:12 00:00,@NurmansyahAff @berlianidris @Paltiwest @bankbsi_id Apa mungkin dah ganti vendor?,1658980516857802753,ariemayw,1,0,0,0,1658792156524425218,in,0 4,https://twitter. com/mputhre/status/1658977499853000705,2023-05-17 23:27:12 00:00,@bankbsi_id Udah bisa tarik tunai via ATM atau ke teller gak min?,1658977499853000705,mputhre,5,0,0,0,1658830871812775937,in,0 5,https://twitter. com/rahayushey/status/1658975344765054976,2023-05-17 23:18:39 00:00,@bankbsi_id Jangan lupa perbaiki mbanking untuk topup!!!!,1658975344765054976,rahayushey,4,0,0,0,1658830871812775937,in,0 6,https://twitter. com/ndaalfatih_/status/1658975122894774272,2023-05-17 23:17:46 00:00,"@bankbsi_id Min. BSI udah amann dipake belum minn??",1658975122894774272,ndaalfatih_,0,0,0,0,1658634424966344704,in,0 7,https://twitter. com/bukaniqbaale/status/1658974757671542784,2023-05-17 23:16:19 00:00,"@abcdxyumi Mending di telfon bank BSI, hallo @bankbsi_id",1658974757671542784,bukaniqbaale,0,0,0,0,1658796272202190848,in,0 8,https://twitter. com/sir_usil/status/1658974702591942658,2023-05-17 23:16:06 00:00,"Rekrutmen berdasarkan identitas bukan kualitas bisa merusak tatanan sistem operasi perbankan di Indonesia. Pre-processing Data Pre-processing yaitu langkah untuk menghapus kesalahan atau faktor lain yang dideteksi tidak cocok dan dapat membuat nilai dari hasil proses data yang diolah menurun . Pemeriksaan kembali data dapat dilakukan pada tahap pra-pemrosesan/pembersihan, dalam tahap ini dilakukan proses penghapusan redudansi, outlier dan data kosong agar dapat memastikan data masukan yang diproses sudah benar atau sudah bersih, untuk dapat menetapkan maka hasil perhitugan algoritma juga akan memmberikan hasil yang tepat . Gambar 1. Metode Penelitian MALCOM - Vol. 3 Iss. 2 October 2023, pp: 211-218 MALCOM-03. : 211-218 Word Embedding (Pembobotan Kat. Word Embedding atau pembobotan kata adalah teknik yang mengubah sebuah kata menjadi vektor atau larik yang berada dalam sekumpulan angka. Saat membuat sebuah model machine learning, teks sebagai penerima inputnya, tentunya machine learning tidak bisa langsung menerima teks yang kita miliki, kata harus diubah terlebih dahulu menjadi angka dengan mengacu pada kamus kata. Biasanya, jika tidak menggunakan penyematan kata, setiap kata akan dikonversi menjadi bilangan bulat berdasarkan posisi bilangan tersebut di kamus . Adapun pembobotan kata yang digunakan yaitu TF-IDF. TF-IDF yaitu perhitungan yang digunakan untuk menguji pentingnya kata . dalam document dan corpus . Tahapan ini dilakukan agar dapat menilai term atau bobot kata yang ada pada document pada semua document yang ada di corpus. Rumus untuk menghitung tf-idf yaitu : TF-IDF = TF*IDF = TF*log. /d. Keterangan: = Text frequency IDF = Teks frekuensi dalam document = Jumlah document Splitting Data Setelah tahap word embedding dengan menggunakan tf-idf, tahapan selanjutnya yaitu melakukan splitting data agar dapat menjadi data pelatihan dan data pegujian. Pembagian ini berarti memberdayakan kerangka kerja untuk meninjau kumpulan data terlebih dahulu, kemudian, pada saat itu, pengujian informasi akan diselesaikan untuk memastikan tingkat akurasi. Pada sistem ini spliting data dapat ditetapkan seuai dengan kemauan pengunanya . Dengan menggunakan split data 90:10, 80:20, 70:30, dan 60:40. Data pengujian yaitu data yang sebelumnya tidak pernah digunakan dalam penelitian namun berguna untuk menilai berhasil atau tidaknya penelitian, sedangkan data pelatihan yaitu data yang akan digunakan dalam melakukan Modelling Pada penelitian yang dilakukan adalah melakukan komparasi akurasi dari beberapa algoritma. Adapun algoritma yang digunakan yaitu sebagai berikut: 1 Support Vector Machine (SVM) SVM atau Support Vector Machine disebut sebagai algoritma yang cenderung umum untuk mengklasifikasikan teks dan memberikan kinerja yang baik dibanyak bidang. Keunggulan SVM untuk mengidentifikasikan hyperplane yang berbeda antara dua kelas yang berbeda dimaksimalkan, dan SVM memastikan jarak antara data yang paling dekat dengan hyperplane yang dimaksimalkan . SVM mengklasifikasikan instance pelatihan yang termasuk dalam salah satu dari dua kelas dengan memasang batas pemisah . y-perplan. antar kelas sehingga margin antara batas dan salah satu kelas dimaksimalkan. Kelas dari sebuah instance baru ditentukan tergantung pada sisi hyperplane mana ia berada . Berikut rumus perhitugan svm: Titik data : xi = . 1,x2,A. ,x. A Rn Kelas data : yi A {-1, . Pasangan data dan kelas : cuycn, ycyc. ycA ycn=1 . Maksimalkan fungsi: Menghitung nilai w dan b: Fungsi keputusan klasifikasi sign. ) : Analisis Sentimen Opini Publik pada Twitter. (Husen et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Keterangan : ,x. = Jumlah data = Banyak fitur = Nilai konstanta = Jumlah support vector/titik data yang memiliki i > 0 = Fungsi kernel = Dualitas Lagrange Multipier i : nilai mutu setiap titik data 2 Nayve Bayes Nayve bayes merupakan algoritma machine learning yang masuk pada kategori supervised classification . Nayve bayes adalah bentuk paling sederhana dari pengklasifikasi jaringan Bayesian . Pengklasifikasi Naive Bayes berakar dari teorema Bayes, yang megasumsikan bahwa data tidak berhubungan secara statistik. Berikut merupakan rumus dari algoritma Nayve Bayes. eE| ye. = yc. eo | yeE) yc. eE) yc. Keterangan : | . | . = Probabllitas posterior pada kelas c saat diberikan atribut x = Probabilitas prior pada class c = Probabllitas pada atribut x saat diberikan kelas c = Probabilitas prior pada atribut x 3 Logistic Regression Logistic regression atau regresi logistik termasuk salah satu tipe analisis regresi yang biasa digumakan untuk mendeskripsikan hubungan antara suatu variable terikat dan suatu variabel bebas yang melibatkan satu atau beberapa variabel bebas dengan variabel terikatnya. Algoritma logistic regression terutama digunakan untuk klasifikasi biner . Tipe kategori dapat berupa 0 dan 1, benar atau salah, besar atau kecil. Jenis variabel bebasnya adalah variabel kategori. Hal inilah yang memisahkan logistic regression dengan regresi berganda atau liniar regression lainnya . Model Evaluation Model evaluation dilakukan dengan cara menghitung nilai akurasi yang diperoleh pada sebuah sistem untuk suatu data pengujian tertentu, dimana setiap data pengujian mempunyai dua peluang hasil yaitu positif dan negatif. Jika keluaran data uji tepat degan target yang diinputkan maka data akan diberi label dengan benar, sedagkan data uji yang keliru pada target akan mendapatkan label salah. Oleh karena itu, semua nilai yang dihasilkan dapat direpresentasikan sebagai confusion matrix. Sentiment Analysis Sentiment analysis atau analisis sentimen, juga dikenal sebagai Penambangan Opini, adalah bidang penelitian yang bertujuan untuk meganalisis opini, emosi, opini, sikap, dan sentimen publik terhadap suatu enitas berdasarkan produk, layanan, isu, organisasi, acara, atau fitur tertentu. Analisis sentimen dapat dilakukan dengan berbagai macam algoritma, seperti Naive Bayes (NB). Decision Trees. K-Nearest Neighbor (KNN). Neural Network, dan Support Vector Machine (SVM) . HASIL DAN PEMBAHASAN Hasil yang diperoleh dari analisis sentimen dengan tiga algoritma, yaitu SVM, nayve bayes, dan logistic regression, terhadap komentar-komentar terkait Bank BSI telah berhasil diamati. Pada penelitian ini data yang digunakan yaitu sejumlah komentar yang berkaitan dengan Bank BSI yang diambil dari platform Twitter. Dataset bersumber dari kaggle berjumlah 24. 401 dataset dengan 15 feature sebelum dilakukannya preprocessing data. Dalam dataset terdapat 30% sentimen berlabel positif yaitu 7. 197 sentimen dan 70% berlabel negatif yaitu 16. 796 sentimen, visualisasi data diperlihatkan dalam pie chart dibawah. MALCOM - Vol. 3 Iss. 2 October 2023, pp: 211-218 MALCOM-03. : 211-218 Gambar 2. Visualisasi Pie Chart Sentimen Bank BSI Dapat disimpulkan dari Gambar 2 bahwa pengguna twitter cenderung memberikan ulasan negatif terhadap Bank BSI. Melalui proses pra-pemrosesan, seperti penghilangan tanda baca, tokenisasi, dan pembersihan data. Hasil setiap proses ini dapat dilihat dalam bentuk Tabel 2. Tabel 2. Hasil preprocessing data text_clean id layanan bayar ke sudah bisa blm ya kok jadi repot id apa mungkin dah ganti vendor id udah bisa tarik tunai via atm atau ke teller gak min id jangan lupa perbaiki mbanking untuk topup id min bsi udah amann dipake belum minn mending di telfon bank bsi hallo id rekrutmen berdasarkan identitas bukan kualitas bisa merusak tatanan sistem operasi perbankan di indonesia cc ri indonesia marufamin id text_preprocessed ['id', 'layan', 'bayar', 'blm', 'ya', 'repot', ''] ['id', 'dah', 'ganti', 'vendor'] ['id', 'udah', 'tarik', 'tunai', 'via', 'atm', 'teller', 'gak', 'min'] ['id', 'lupa', 'baik', 'mbanking', 'topup'] ['id', 'min', 'bsi', 'udah', 'amann', 'dipake', 'minn'] ['mending', 'telfon', 'bank', 'bsi', 'hallo', 'id'] ['rekrutmen', 'dasar', 'identitas', 'kualitas', 'rusak', 'tatanan', 'sistem', 'operasi', 'perban', 'indonesia', 'cc', 'ri', 'indonesia', 'marufamin', 'id'] Pada tabel 2 telah dilakukan proses pembersihan data, dimana pada proses ini data yang sebelumnya masih terdapat huruf kapital, simbol, angka, dan kata imbuhan telah menjadi kata dasar dan tidak terdapat lagi huruf kapital, simbol dan angka. Karena pada proses ini akan menentukan tingkat akurasi yang diperoleh nantinya dengan algoritma machine learning. Gambar 3. Word cloud Positif dan Negatif Pada Gambar 3, terdapat hasil visualisasi menggunakan word cloud sehingga terdapat 2 word cloud yaitu word cloud positif dan word cloud negatif. Kedua word cloud tersebut akan menampilkan kata-kata yang paling sering disebutkan oleh pengguna Twitter, membuat analisis lebih mudah daripada harus melihat tweet satu per satu. Pengujian menggunakan algoritma SVM, naive bayes, dan logistic regression menghasilkan akurasi yang berbeda-beda. Dalam percobaan ini, 24. 401 data dengan 15 fitur digunakan sebelum melakukan preprocessing data. Pada tahap pre-processing dilakukan pelabelan data untuk mengetahui sentimen positif atau Analisis Sentimen Opini Publik pada Twitter. (Husen et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Kemudian dilakukan pre-processing data. Langkah selanjutnya adalah memodelkan algoritma SVM, naive bayes dan logistic regression dengan split data 90:10, 80:20, 70:30, dan 60:40. Dengan hasil sebagai Tabel 3. Hasil komparasi splitting data Splitting Data 90:10 80:20 70:30 60:40 Support Vector Machine Nayve Bayes Logistic Regression Berdasarkan tabel 3, dengan beberapa splitting data yang digunakan, akurasi tertinggi terdapat pada splitting data 90:10 yaitu untuk algoritma SVM sebesar 88%. Nayve Bayes sebesar 76%, dan Logistic Regression sebesar 86%. Algoritma pertama SVM mendapatkan akurasi 88%. Algoritma kedua Nayve Bayes mendapatkan akurasi 76%. Algoritma ketiga Logistic Regression medapatkan akurasi 86%. Dapat disimpulkan bahwa nilai akurasi model algoritma SVM memperoleh nilai akurasi yang lebih baik yaitu 88% dengan selisih 2% dibandingkan dengan algoritma Logistic Regression sedangkan dengan algoritma Nayve Bayes mendapatkan selisih 12% dan kinerja akurasi model yang mendapatkan nilai sangat rendah adalah algoritma Nayve Bayes mendapatkan akurasi model yaitu 76%. Hasil komparasi akurasi algoritma SVM, nayve bayes, dan logistic regression divisualisasikan dengan diagram batang yang disajikan pada gambar 4. Akurasi Komparasi Akurasi Algoritma 0,900 0,880 0,860 0,840 0,820 0,800 0,780 0,760 0,740 0,720 0,700 0,680 0,877 0,86 0,758 SVM Nayve Bayes Logistic Regression Gambar 4. Visualisasi komparasi akurasi dengan beberapa algoritma Berdasarkan pada gambar 4, hasil komparasi akurasi dari algoritma SVM mendapatkan nilai akurasi sebesar 88%, nayve bayes sebesar 76%, dan logistic regression sebesar 86%. Hasil komparasi algoritma pada gambar 4 menunjukkan bahwa algoritma SVM jauh lebih baik dalam melakukan analisis sentimen pada penelitian ini. KESIMPULAN Hasil penelitian yang dilakukan dapat menunjukkan persentase opini masyarakat terhadap bank BSI yang tergolong dalam kategori positif dan negatif serta dapat dijadikan acuan untuk meningkatkan pelayanan perusahaan dan memberikan visibilitas kepada masyarakat. Persentase sentimen positif cenderung lebih sedikit dibandingkan dengan sentimen negatif yaitu sebesar 30%, sedangkan sentimen negatif mendapatkan persentase sebesar 70%. Hasil komparasi dengan menggunakan split data 90:10, 80:20, 70:30, dan 60:40 dengan menggunakan algoritma SVM. Nayve Bayes, dan Logistic Regression maka didapatkan hasil akurasi tertinggi yaitu dengan menggunakan algoritma SVM pada split data 90:10 dengan nilai akurasi 88%. Perusahaan dapat mempertimbangkan untuk menguji dan membandingkan kinerja metode lain, seperti algoritma pembelajaran mendalam . isalnya, jaringan sara. atau metode berbasis aturan . isalnya, analisis teks berbasis atura. Dengan mencoba berbagai metode, perusahaan dapat memastikan bahwa mereka menggunakan pendekatan yang paling efektif dalam menganalisis sentimen publik. MALCOM - Vol. 3 Iss. 2 October 2023, pp: 211-218 MALCOM-03. : 211-218 REFERENSI