Progresif: Jurnal Ilmiah Komputer Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat Ae Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 p-ISSN: 0216-3284 Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang Menggunakan Metode Random Forest Rizqi Fachreza1*.
Widiyanto Tri Handoko2 Teknik Informatika.
Universitas Stikubank Semarang.
Semarang.
Indonesia *e-mail Corresponding Author: rizqifachreza@mhs.
Abstract Opinion from the public on the performance of Trans Semarang transportation that has been widely discussed on social media X, resulting in many pros and cons.
Sentiment analysis comes as a way to understand public opinion, examining the opinions and attitudes of individuals towards an object.
individual attitudes towards an object.
By using an algorithm methodology, namely Random Forest in classifying data to determine the accuracy of the data to determine the accuracy of the level of sentiment value of X users towards Trans Semarang performance.
performance of Trans Semarang.
This research uses a dataset taken with keyword "Trans Semarang".
Random Forest algorithm is used to classify the data and then test it with various ratios, where the results of this algorithm can be used for the evaluation stage.
The results of this algorithm can be used for the evaluation stage.
This method produces a confusion matrix value with an accuracy of 81%, an average precission of 80%, average recall 80%, and average fmeasure 80%.
Keyword: Trans Semarang.
Random Forest.
Sentiment Analysis Abstrak Opini dari masyarakat terhadap kinerja transportasi Trans Semarang yang ramai dibicarakan di sosial media X, sehingga menimbulkan banyak pro dan kontra.
Analisis sentimen hadir sebagai cara untuk memahami opini publik, meneliti pendapat dan sikap individu terhadap suatu objek.
Dengan menggunakan metodologi algoritma yaitu Random Forest dalam pengklasifikasian data untuk mengetahui akurasi tingkat nilai sentimen pengguna X terhadap kinerja Trans Semarang.
Penelitian ini menggunakan dataset yang diambil dengan kata kunci AuTrans SemarangAy.
Algoritma Random Forest digunakan untuk mengklasifikasikan data dan kemudian mengujinya dengan berbagai rasio, dimana hasil algoritma ini dapat digunakan untuk tahap evaluasi.
Metode ini menghasilkan nilai confusion matrix dengan accuracy 81%, precission rata-rata 80%, recall rata-rata 80%, dan f-measure rata-rata 80%.
Kata kunci: Trans Semarang.
Random Forest.
Analisis Sentimen Pendahuluan Transportasi merupakan solusi utama untuk mengangkut barang maupun manusia dari suatu tempat ke tempat yang diinginkan .
Untuk meminimalkan kemacetan lalu lintas di Kota Semarang masyarakat memlih Transportasi umum menjadi salah satu pilihan yang banyak diminati oleh warga Semarang saat ini contohnya Trans Semarang.
Kinerja dari transportasi Trans Semarang ramai dibicarakan di dunia nyata maupun di dunia maya.
Penilaian masyarakat terhadap kinerja Trans Semarang juga banyak dilakukan melalui media sosial, khususnya X yang menjadi platform yang paling efektif dan efisien.
Dalam hal ini, tanggapan masyarakat terhadap kinerja Trans Semarang telah memunculkan berbagai hal mulai dari netral, positif, dan negatif.
merupakan salah satu platform media sosial popular yang mengandung berbagai berita, pemikiran, dan pandangan masyarakat secara real time .
Post merupakan ungkapan singkat pengguna dalam bentuk teks dengan batasan maksimal 280 karakter.
Batasan ini mendorong pengguna untuk lebih ringkas dan ekspresif dalam menyampaikan idenya dibandingkan platform Hal ini menjadikan post sebagai sumber data berharga untuk analisis sentimen, karena mengandung nilai emosi dan opini pengguna .
Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza Progresif e-ISSN: 2685-0877 Dengan memahami persepsi publik terhadap Trans Semarang melalui media sosial X, maka diperlukan sebuah metode yang dapat lebih mudah mengidentifikasi area yang perlu diperbaiki dan membuat keputusan yang lebih baik untuk meningkatkan layanan mereka.
Analisis sentimen merupakan ilmu yang berguna untuk mengetahui opini masyarakat mengenai sesuatu yang terjadi, biasanya berbentuk komentar tulisan .
Analisis sentimen berguna untuk memahami opini publik, meneliti pendapat dan sikap individu terhadap suatu objek, seperti peristiwa, produk, ataupun isu tertentu.
Dilakukan dengan menganalisis teks dari berbagai media sosial, seperti blog.
X, dan Facebook, analisis sentimen membantu mengidentifikasi dan mengelompokkan opini publik ke dalam kategori positif, negatif, ataupun Tujuannya untuk memahami persepsi publik terhadap suatu objek dan membantu pengambilan keputusan dalam berbagai bidang .
Dalam melakukan analisis sentimen, disini penulis menggunakan metode Random Forest sebagai algoritmanya.
Random Forest adalah sebuah kumpulan metode pembelajaran yang menggunakan pohon keputusan sebagai base classifier yang dibangun dan Beberapa aspek penting dari metode ini termasuk penggunaan sampling terpandu untuk konstruksi pohon prediksi.
Setiap pohon keputusan menggunakan prediktor acak, dan Random Forest melakukan prediksi dengan menggabungkan hasil dari setiap pohon keputusan melalui majority vote untuk klasifikasi dan rata-rata untuk regresi .
Penelitian ini bertujuan untuk menganalisis apa yang terjadi terhadap kinerja Trans Semarang dengan menggunakan metode Random Forest.
Selain itu penelitian ini memiliki manfaat untuk manajemen Trans Semarang agar dapat mengambil keputusan terhadap masalah yang terjadi dengan hasil yang telah didapat dari analisis sentimen ini.
Tinjauan Pustaka Dalam penelitian yang dilakukan oleh Nur Fitriyah.
Budi Warsito, dan Di Asih I Maruddani pada tahun 2020 .
, penelitian ini membahas mengenai penggunaan metode SVM untuk menganalisis sentimen terhadap Gojek di media sosial Twitter.
Penelitian ini bertujuan untuk mengklasifikasikan respon pengguna Gojek kedalam dua sentimen, yaitu sentimen positif dan sentimen negatif.
Penelitian ini menggunakan algoritma SVM dengan melibatkan dataset berupa postingan di media sosial Twitter.
Penelitian ini berhasil mendapatkan akurasi senilai 79,19%.
Penelitian yang dilakukan oleh Brata Mas Pintoko dan Kemas Muslim 2018 .
, memaparkan tentang sentimen masyarakat terhadap jasa transportasi online dengan penggunaan metode Nayve Bayes Classifier.
Penelitian ini memiliki tujuan untuk mengetahui pandangan masyarakat terhadap penggunaan jasa transportasi online.
Metode yang digunakan oleh peneliti adalah Nayve Bayes dengan melibatkan total 2000 data.
Data yang diambil berasal dari Twitter.
Dengan menggunakan metode Nayve Bayes, peneliti memperoleh hasil akurasi 88,60%.
Penelitian ini membahas mengenai analisis sentimen terhadap pengguna Gojek dan Grab pada media sosial Twitter menggunakan Random Forest yang dilakukan oleh Melia.
Bambang Irawan.
Odi Nurdiawan pada tahun 2023 .
Tujuan dilakukannya penelitian ini yaitu untuk menyelesaikan masalah antara klasifikasi dengan regresi menggunakan metode Random Forest.
Penelitian ini mendapat nilai akurasi sebesar 76,25%.
Berdasarkan beberapa penelitian yang telah dilakukan, secara keseluruhan penelitian tersebut mengarah pada analisis sentimen terhadap jasa transportasi dengan penggunaan beberapa metode untuk mengklasifikasikan sesuatu kedalam beberapa kelompok.
Dalam penelitian ini, yang membedakan antara penulis dengan penelitian sebelumnya yaitu penggunaan algoritma yang berbeda serta objek penelitiannya yaitu berobjek pada media sosial Metodologi Gambar 1.
Desain Penelitian Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza e-ISSN: 2685-0877 Secara keseluruhan penelitian ini memiliki beberapa tahapan yaitu pengumpulan data.
Pre-Processing data, pelabelan data, pelatihan data, pengujian model, evaluasi hasil.
Proses ini dilakukan untuk mengevaluasi hasil dari model Random Forest.
1 Pengumpulan data Menurut .
, crawling data merupakan metode yang digunakan untuk mengumpulkan atau mengunduh informasi dari kumpulan data.
Pada awalnya metode crawler digunakan oleh browser internet untuk mengisi daftar mereka.
Masalah yang dihadapi dalam menyelesaikan prosedur pengumpulan mencakup struktur informasi yang sangat besar dan kurangnya kontrol yang terkonsentrasi terhadap konten .
Data yang digunakan dalam penelitian ini adalah post dari pengguna terhadap kinerja Trans Semarang yang diambil dari media sosial X.
Data ini mencakup teks opini yang diberikan oleh pengguna.
Proses crawling data dilakukan dengan memanfaatkan modul python yang terlah tersedia yaitu Tweet Harvest.
Data yang telah diambil kemudian disimpan dalam format file CSV.
2 Pre-Processing data Pre-Processing merupakan proses menghilangkan permasalahan menjadi data yang bersih agar dapat diproses selanjutnya .
Pre-Processing data merupakan proses dimana dilakukan pembersihan dan pemilihan data untuk mendapat data yang bersih dan siap untuk Pre-Processing dilakukan untuk mengurangi data yang error atau noise.
PreProcessing data terdapat beberapa langkah yaitu ,sebagai berikut :
Cleaning data merupakan proses pembersihan data dari karakter yang diperlukan seperti tanda baca, emoticon, username, hashtag, alamat website, dan sebagainya.
Selain itu, cleaning data juga berguna untuk menghapus data yang kosong maupun data yang duplikat.
Proses cleaning dilakukan agar data lebih mudah dipahami.
Case folding, pada proses ini data yang telah dibersihkan dilakukan penyamaan semua huruf menjadi huruf kecil semua.
Normalisasi merupakan teknik yang digunakan untuk mengubah teks yang sulit dimengerti menjadi teks yang baku agar memenuhi tujuan tertentu .
Tokenisasi, proses menghilangkan tanda baca, seperti simbol ataupun karakter khusus lainnya pada teks .
Pada tahapan ini, dilakukan pemisahan sebuah kalimat menjadi beberapa kata/token.
Pada tahapan ini juga dilakukan pengecekan pada karakter pertama hingga karakter terakhir, apabila karakter pertama bukan karakter pemisah seperti titik, koma, spasi, dan karakter pemisah lainnya.
Stemming, pada tahap ini merupakan tahap terakhir pada Pre-Processing, ini dilakukan untuk mengubah kata berimbuhan menjadi kata dasarnya.
Kata imbuhan yang dihilangkan terdiri dari awalan, akhiran, sisipan, dan gabungan awal-akhiran.
3 Pelabelan data Pelabelan data dilakukan berdasarkan post yang diunggah oleh pengguna di media sosial X.
Pelabelan dilakukan secara manual, dengan cara memberikan polaritas secara logika peneliti terhadap kalimat opini.
Kalimat opini akan diklasifikasikan kedalam 3 polaritas, yaitu positif, negatif, dan netral.
4 Pembentukan fitur Data hasil dari Pre-Processing yang berupa kalimat akan diubah menjadi bentuk angka dengan dilakukan proses pembobotan kata yang bertujuan untuk menghitung bobot pada masing-masing kata yang akan digunakan sebagai fitur.
Salah satu metode yang digunakan untuk pembentukan fitur yaitu dengan menggunakan metode TF-IDF (Term Frequency-Inverse Document Frequenc.
TF-IDF yaitu metode penggabungan dua konsep antara frekuensi kemunculan sebuah kata dalam satu dokumen dan inverse frekuensi dokumen yang mengandung kata tersebut .
5 Pemodelan Random Forest Random Forest merupakan algoritma supervised learning yang menggunakan banyak pohon putusan sebagai base classifier yang dikombinasikan sehingga menghasilkan suatu putusan .
Tidak ada rumus matematika yang dapat digunakan untuk menghitung Random Progresif: Vol.
No.
Agustus 2024: 724-734 Progresif e-ISSN: 2685-0877 Forest secara keseluruhan.
Algoritma ini menghasilkan prediksi yang lebih akurat dan stabil dengan menggabungkan banyak pohon keputusan individual.
Berikut ada beberapa rumus yang digunakan secara mendasar untuk Random Forest:
Menentukan Enthropy Entrophy mengukur ketidakpastian atau keragaman dalam suatu kumpulan data.
Semakin tinggi nilai Entrophy, semakin beragam data tersebut.
Entrophy(S) = Ocycaycn=1 ycyycn log2.
Perhitungan Enthropy untuk subset data Data dibagi menjadi beberapa subset tergantung pemilihan kata kunci.
Entrophy(S.
= Ocycaycn=1 ycyycn log2.
Menentukan Weight Enthropy dari subset Entrophy(T) = ycI1 ycuycycuycycayco Entrophy(S.
ycI2 ycuycycuycycayco Entrophy(S.
Menentukan Gain Information Gain = Entrophy(S) - Entrophy(T) .
Dalam Random Forest, proses ini diulang berkali-kali untuk berbagai subset data dan Setiap pohon keputusan dibuat menggunakan subset acak dari data pelatihan dan subset acak dari fitur.
Keputusan akhir ditentukan oleh agregasi hasil dari semua pohon.
Karena data yang digunakan pada penelitian ini cukup banyak dan rumit, maka digunakan alat bantu pada bahasa pemrograman Python dengan library scikit-learn.
6 Hasil Evaluasi Pada penelitian ini penulis melatih sejumlah 100 buah model Decision Tree dan rasio 90:10 menghasilkan akurasi yang cukup bagus yaitu mencapai 81%.
Dalam pengujian ini digunakan 136 data sebagai data uji.
Hasil klasifikasi divisualisasikan dalam bentuk confusion Pada confusion matrix menghasilkan nilai accuracy, precission, recall.
F-measure.
Confusion matrix disajikan dalam bentuk gambar berikut:
Gambar 2.
Visualisasi confusion matrix Accurracy = Jumlah Prediksi Benar Precission = Jumlah Prediksi Benar .
ositif/netral/negati.
Recall = Total Seluruh Prediksi Jumlah Prediksi .
ositif/netral/negati.
Jumlah Prediksi Benar .
ositif/netral/negati.
Jumlah Asli .
ositif/netral/negati.
Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza
F1 = 2 *
e-ISSN: 2685-0877 ycIyceycaycaycoycoOycEycyceycaycnycycycnycuycu ycIyceycaycaycoyco ycEycyceycaycnycycycnycuycu Hasil dan Pembahasan 1 Pengumpulan data Mengumpulkan data dengan cara crawling data dari platform X adalah langkah pertama dalam melakukan penelitian ini.
Data dikumpulkan menggunakan program python di Google Colabs.
Data dapat dikumpulkan setiap 500 post dalam 20 menit, jadi butuh waktu yang cukup lama untuk mendapatkan data ini.
Penulis dapat mengumpulkan 955 data dalam penelitian ini dalam waktu kurang lebih 40 menit.
Dimulai dengan penginstallan library pandas, node.
js, dan npm pada Google Colab.
Gambar 3.
Dataset Trans Semarang 2 Penginstallan library Sebelum masuk ke tahap Pre-Processing data ,maka perlu adanya penginstallan beberapa library yang dibutuhkan untuk masuk kedalam proses pengolahan data.
Library yang dibutuhkan yaitu emoji.
Sastrawi, tweet-preprocessor, pandas, os, regular expressions, nltk, numpy, seaborn, sklearn dan matplotlib.
3 Pre-Processing Setelah dilakukan membaca data, data tidak dapat diolah secara mentah ,harus ada proses pembersihan terlebih dahulu pada data tersebut.
Yang perlu dilakukan selanjutnya yaitu tahap Pre-Processing data.
Pre-Processing merupakan tahap yang digunakan untuk proses pembersihan sebuah dataset dari kata yang tidak berbobot.
Langkah awal dalam Berikut beberapa tahap Pre-Processing data :
1 Cleaning data Proses untuk membersihkan data dari karakter yang diperlukan seperti tanda baca, emoticon, username, hashtag, alamat website, dan sebagainya.
Selain itu cleaning data juga berguna untuk menghapus data yang sama atau terduplikasi dan juga menghapus data yang Tabel 1.
Contoh hasil cleaning data Sebelum Cleaning Sesudah Cleaning @yexoliny tidak kak karena kagok arah tidak kak karena kagok arah turun halte turun halte transit point kak transit point kak @terasipedas @yusufgunawan Trans trans semarang ok sih pelayanannya semarang ok sih pelayanannya armadanya armadanya juga bnyk even yg di desa jadi juga bnyk even yg di desa2 jadi ga perlu ga perlu nunggu lama minus banyak nunggu lama.
Minus banyak supirnya yg supirnya yg ugalan 2 Case Folding Proses untuk membuat seluruh huruf dalam data menjadi huruf kecil ini bertujuan untuk mempermudah pada proses selanjutnya.
Dengan script pada python yang telah dibuat maka dapat dilihat hasil berikut ini:
Progresif: Vol.
No.
Agustus 2024: 724-734 Progresif e-ISSN: 2685-0877 Tabel 2.
Contoh hasil case folding Sebelum Sesudah Perbandingan sama Trans Jakarta.
perbandingan sama trans jakarta.
Sayangnya saya ga dapet data untuk sayangnya saya ga dapet data untuk trans Trans Semarang soalnya statusnya bukan semarang soalnya statusnya bukan bumd BUMD .
tatus Trans Semarang adalah .
tatus trans semarang adalah blu.
BLUD) Trans semarang ok sih pelayanannya trans semarang ok sih pelayanannya armadanya juga bnyk even yg di desa2 jadi armadanya juga bnyk even yg di desa2 jadi ga perlu nunggu lama.
Minus banyak ga perlu nunggu lama.
supirnya yg ugal2an.
supirnya yg ugal2an.
3 Normalisasi Normalisasi merupakan langkah dimana suatu kata dikembalikan menjadi kata yang menggunakan ejaan yang baik.
Contoh kata AubnykAy setelah di normalisasi menjadi AubanyakAy.
Dan berikut adalah hasil dari setelah proses normalisasi :
Tabel 3.
Contoh hasil normalisasi Sebelum Sesudah Trans semarang ok sih pelayanannya trans semarang ok sih pelayanannya armadanya juga bnyk even yg di desa2 jadi armadanya juga banyak even yg di desa2 ga perlu nunggu lama.
Minus banyak jadi ga perlu nunggu lama.
supirnya yg ugal2an.
supirnya yg ugal2an.
4 Tokenisasi Tahapan untuk memecah sebuah kalimat menjadi beberapa beberapa kata atau token untuk mengetahui kata aslinya.
Ini adalah hasil dari proses tokenisasi :
Gambar 4.
Hasil Tokenisasi Gambar tersebut adalah hasil dari tokenisasi dimana seperti contoh kalimat Audi kagok minAy dipisah per kata atau token menjadi .
i, kagok, mi.
5 Stemming Pada tahap ini dilakukan untuk mencari kata dasar dari sebuah kata dengan menggunakan function stemmer dari library Sastrawi.
Dengan kata lain, kata-kata yang ada dalam dataset dari tahap sebelumnya diubah menjadi kata dasar menurut KBBI.
Gambar 7.
Hasil Stemming Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza e-ISSN: 2685-0877 Gambar diatas hasil perubahan kata-kata yang tidak baku menjadi baku seperti contoh pada tabel berikut ini :
Tabel 4.
Contoh hasil stemming Sebelum di kagok minn Sesudah di kagok min Pelabelan Setelah proses Pre-Processing selesai, akan dilakukan pelabelan manual untuk mengetahui apakah sentimen dari masing-masing post bernilai positif, negatif, atau netral.
Proses ini dilakukan dengan menggunakan Microsoft Excel, kemudian menyimpan file dalam format CSV.
Berikut tampilan pelabelan manual :
Gambar 5.
Pelabelan Manual Terdapat juga distribusi sentimen pada dataset Trans Semarang ,berikut adalah Gambar 6.
Distribusi Sentimen Menggunakan Diagram Lingkara Diagram diatas menjelaskan bahwa terdapat 47,43% pendapat positif Masyarakat terhadap kinerja Trans Semarang, 37,28% untuk pendapat netral, dan 15,29% untuk pendapat Progresif: Vol.
No.
Agustus 2024: 724-734 Progresif e-ISSN: 2685-0877 Ekstraksi Fitur TF-IDF adalah ukuran statistik yang menggabungkan frekuensi kata muncul dalam dokumen dengan kebalikannya dari frekuensi dokumen yang mengandung kata tersebut, dan digunakan untuk mengubah teks menjadi vektor numerik yang menunjukkan pentingnya kata dalam data atau dataset.
Oleh karena itu, kata-kata yang sering muncul dalam satu dataset tetapi jarang muncul dalam dataset lain akan memiliki bobot yang tinggi.
Untuk melakukan ekstraksi fitur TF-IDF, dapat menggunakan library sklearn dan modul TfidfVectorizer beserta TfidfTransformer.
Modul ini berguna untuk menghitung nilai TF-IDF dari setiap kata dalam data dan mengembalikan matriks sparse yang berisi vektor numerik pada setiap dokumen.
Ini merupakan langkah awal dalam melakukan TF-IDF.
Sklearn berfungsi untuk mengolah data dalam analisis sentimen, sedangkan feature_extraction.
text berfungsi untuk ekstraksi fitur.
TfidfVectorizer dan TfidfTransformer berfungsi untuk melakukan perhitungan frekuensi kata yang muncul dan mengubahnya menjadi nilai vektor.
Pada tahap selanjutnya dapat dilakukan perhitungan pembobotan TF-IDF pada dataframe df dan menghasilkan data seperti dibawah ini :
Gambar 7.
Hasil Pembobotan TF-IDF Pada gambar tersebut dapat dijelaskan, pada posisi paling atas terdapat data didalam kurung kurawal yang menandakan bahwa seluruh token yang berada pada dokumen telah menjadi angka.
Angka tersebut adalah hasil dari perhitungan menggunakan modul TfidfVectorizer, lalu terdapat juga angka yang berada dalam kurung telah dibagi menjadi 2 ,dimana kiri mewakili index ke-n pada dokumen dan kanan mewakili features name.
Index 0 disebelah kiri yang berjumlah 9, mengartikan teks pertama dari dokumen, kemudian index 1 yang berjumlah 3 ,mengartikan teks kedua dari dokumen pada penelitian ini, dan seterusnya hingga index ke 954 dimana ini merupakan teks terakhir pada dokumen.
Lalu diluar tanda kurung terdapat angka yang menunjukan hasil dari pembobotan TF-IDF dari program 6 Klasifikasi Random Forest Tidak ada rumus matematika yang dapat digunakan untuk menghitung Random Forest secara keseluruhan.
Algoritma ini menghasilkan prediksi yang lebih akurat dan stabil dengan menggabungkan banyak pohon keputusan individual.
Dalam Random Forest, proses ini diulang berkali-kali untuk berbagai subset data dan Setiap pohon keputusan dibuat menggunakan subset acak dari data pelatihan dan subset acak dari fitur.
Keputusan akhir ditentukan oleh agregasi hasil dari semua pohon.
Karena data yang digunakan pada penelitian ini cukup banyak dan rumit, maka digunakan alat bantu pada bahasa pemrograman Python dengan library scikit-learn.
Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza e-ISSN: 2685-0877 Gambar 8.
Proses membuat arsitektur dengan menggunakan library sklearn Proses ini dimulai dengan membuat arsitektur Random Forest yang dapat diimport dari Kemudian, model yang telah diimport dilatih dengan data latih.
Setelah itu, data latih dapat digunakan untuk mengklasifikasi data uji.
Hasil prediksi dari 136 data uji disimpan dengan nama Aurandom_forest_classifier_predictionAy.
Pada kasus ini penulis melatih sejumlah 100 buah model Decision Tree dan rasio 90:10 ,menghasilkan akurasi yang cukup bagus yaitu mencapai Gambar 9.
Hasil Akurasi metode Random Fores Terdapat juga beberapa hasil akurasi yang dilakukan dengan beberapa rasio yang berbeda ,berikut adalah tabelnya :
Data Latih Tabel 5.
Uji coba beberapa data latih dan uji Data Uji Akurasi 7 Confusion Matrix Setelah melakukan klasifikasi, langkah berikutnya adalah menguji model untuk memastikan efektivitas metode.
Dalam pengujian ini, model klasifikasi data digunakan untuk mengukur perhitungan prediksi positif, negatif, dan netral.
Dalam pengujian ini digunakan 136 data sebagai data uji.
Hasil klasifikasi divisualisasikan dalam bentuk confusion matrix.
Berikut juga terdapat hasil yang menunjukan nilai accuracy, precission, recall.
F-measure.
Algoritma Random Forest Tabel 6.
Hasil report klasifikasi Accuracy Precission Recall F-measure Dapat dilihat table diatas, bahwa hasil akurasi dari pelatihan data training sebanyak 136 data menghasilkan nilai 81%.
Lalu untuk precission yaitu rasio prediksi benar positif dibanding dengan prediksi positif menghasilkan nilai 80%.
Ada juga untuk Recall yang merupakan prediksi benar positif denga keseluruhan data benar positif menghasilkan nilai 80%.
Lalu untuk F-measure perbandingan rata-rata precission dan recall yang dibobotkan menghasilkan nilai 80%.
8 Pembahasan Hasil penelitian ini digunakan untuk mengetahui dan menganalisis kinerja Trans Semarang berdasarkan komentar dari postingan sosial media X.
Berdasarkan akurasi yang dihasilkan melalui metode Random Forest dapat mengukur perhitungan prediksi polaritas yaitu sebesar 81%.
Progresif: Vol.
No.
Agustus 2024: 724-734 Progresif e-ISSN: 2685-0877 Hasil penelitian ini juga didukung oleh Melia.
Budi Irawan, dan Odi Nurdiawan .
, yang menggunakan model Random Forest untuk mengklasifikasikan sentimen di media sosial Twitter terkait Gojek dan Grab menghasilkan akurasi yang cukup tinggi yaitu 76,25%.
Analisis sentimen terhadap aplikasi ruangguru menggunakan algoritma Nayve Bayes.
Random Forest, dan Support Vector Machine yang dilakukan oleh Evita Fitri.
Yuri Yuliani.
Susy Rosyida, dan Windu Gata .
, penggunaan metode Random Forest dalam menganalisis sentimen menghasilkan akurasi yang cuku baik yaitu 97,16%.
Temuan ini memberikan implikasi bahwa penggunaan metode Random Forest untuk menganalisis sentimen menghasilkan akurasi yang Berdasarkan hasil analisis sentimen yang telah dilakukan, penelitian ini menghasilkan sentimen yang positif terhadap kinerja Trans Semarang.
Namun ada beberapa sentimen negatif yang muncul seperti ac bus yang tidak menyala, sopir bus yang mengendarai secara ugal-ugalan, dan juga ada efek asap dari knalpot bus yang dikeluarkan.
Peneliti dapat memberi saran agar beberapa sentimen negatif tersebut dapat ditinjau oleh manajemen Trans Semarang sebagai bentuk perbaikan dimasa mendatang.
Simpulan Penelitian ini menemukan bahwa platform X, yang memungkinkan pengguna untuk berbagi opini dan informasi secara publik, menyediakan data opini yang kaya untuk analisis sentimen.
Dari data yang dianalisis, terdapat 47,43% komentar positif, 37,28% komentar netral, dan 15,29% komentar negatif.
Algoritma Random Forest digunakan untuk mengklasifikasikan data dan menunjukkan performa yang baik dengan akurasi 81%, presisi rata-rata 80%, recall rata-rata 80%, dan f-measure rata-rata 80%.
Hal ini menunjukkan bahwa platform X dan metode analisis sentimen yang digunakan dapat menjadi alat yang berharga untuk memahami opini publik.
Daftar Referensi Suryati.
Ari Aldino.
Penulis Korespondensi, and E.
Suryati Submitted.
AuAnalisis Sentimen Transportasi Online Menggunakan Ekstraksi Fitur Model Word2vec Text Embedding Dan Algoritma Support Vector Machine (SVM),Ay Jurnal Teknologi dan Sistem Informasi, vol.
4, no.
1, pp.
96Ae106, 2023.
DOI: 10.
33365/jtsi.
Faradian.
Rubhasy, and Y.
Wijaya.
AuAnalisis Sentimen Terhadap Penutupan Tiktok Shop Menggunakan Algoritma Nayve Bayes Classifier Pada Media Sosial X,Ay Jurnal Ilmiah Sain dan Teknologi, vol.
2, no.
4, pp.
150Ae163, 2024.
Najib.
Irsyad.
Qandi, and N.
Rakhmawati.
AuPerbandingan Metode Lexicon-based dan SVM untuk Analisis Sentimen Berbasis Ontologi pada Kampanye Pilpres Indonesia Tahun 2019 di Twitter,Ay Fountain of Informatics Journal, vol.
4, no.
2, p.
Nov.
DOI: 10.
21111/fij.
Ramadhani.
Suryono, and K.
Kunci.
AuKomparasi Algoritma Nayve Bayes dan Logistic Regression Untuk Analisis Sentimen Metaverse,Ay Jurnal Media Informatika Budidarma, vol.
8, no.
2, pp.
714-725, 2024.
DOI: 10.
30865/mib.
Mas Pintoko and K.
Muslim.
AuAnalisis Sentimen Jasa Transportasi Online pada Twitter Menggunakan Metode Nayve Bayes Classifier,Ay e-proceeding of engineering, vol.
5, no.
8121-8130, 2018.
Afdhal.
Kurniawan.
Iskandar.
Salambue.
Budianita, and F.
Syafria.
AuPenerapan Algoritma Random Forest Untuk Analisis Sentimen Komentar Di YouTube Tentang Islamofobia,Ay Jurnal Nasional Komputasi dan Teknologi Informasi, vol.
5, no.
122-130, 2022.
Fitriyah.
Warsito.
Asih, and I.
Maruddani.
AuAnalisis Sentimen Gojek pada Media Sosial Twitter dengan Klasifikasi Support Vector Machine (SVM),Ay Jurnal Gaussian, vol.
9, no.
3, pp.
376Ae390, 2020.
Irawan and O.
Nurdiawan.
AuAnalisis Sentimen Terhadap Pengguna Gojek danGrab pada Media Sosial Twitter Menggunakan Random Forest,Ay JATI : Jurnal Mahasiswa Teknik Informatika, vol.
7, no.
5, pp.
3614-3618, 2023.
Eka Sembodo.
Budi Setiawan, and Z.
Abdurahman Baizal.
AuData Crawling Otomatis pada Twitter,Ay in Indonesian Symposium on Computing (Indo-SC).
Bandung, 11Ae16, 24 September, 2016.
Budiarto.
AuIdentifikasi Kebutuhan Masyarakat Nusa Tenggara Barat pada Pandemi Covid-19 di Media Sosial dengan Metode Crawling (Requirements Identification for NTB Analisis Sentimen Masyarakat Terhadap Kinerja Trans Semarang a.
Rizqi Fachreza e-ISSN: 2685-0877 People in pandemic covid-19 at Social Media Using Crawling Metho.
,Ay JTIM : Jurnal Teknologi Informasi dan Multimedia, vol.
2, no.
4, pp.
244Ae250, 2021.
Nurona Cahya et al.
AuKlasifikasi Penyakit Mata Menggunakan Convolutional Neural Network ( CNN),Ay SISTEMASI:Jurnal Sistem Informasi, vol.
10, pp.
618Ae626, 2023.
Riyaddulloh and A.
Romadhony.
AuNormalisasi Teks Bahasa Indonesia Berbasis Kamus Slang Studi Kasus: Tweet Produk Gadget Pada Twitter,Ay e-proceeding of engineering, vol.
8, no.
4, pp.
4216-4228, 2021.
Hermawati.
Berland.
Rahmadiah.
Hutabarat, and D.
Dwi Saputra.
AuKomparasi Metode Text Mining Terhadap Masalah Pengklasifikasian Narasi Informative & Non Informative Pada twitter @PLN_123,Ay Jurnal Sistim Informasi dan Teknologi, vol.
5, no.
109-120, 2023.
DOI: 10.
37034/jsisfotek.
Herwijayanti.
Ratnawati, and L.
Muflikhah.
AuKlasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity,Ay Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol.
2, no.
1, pp.
306Ae312, 2018.
Fitri.
Yuliani.
Rosyida, and W.
Gata.
AuAnalisis Sentimen Terhadap Aplikasi Ruangguru Menggunakan Algoritma Naive Bayes.
Random Forest Dan Support Vector Machine,Ay TRANSFORMTIKA, vol.
18, no.
1, pp.
71Ae80, 2020, [Onlin.
Available:
Progresif: Vol.
No.
Agustus 2024: 724-734