Progresif: Jurnal Ilmiah Komputer Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat Ae Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 p-ISSN: 0216-3284 Analisis Sentimen Media Sosial Youtube Kereta Cepat (Whoos.
Menggunakan Algoritma Bidirectional-LSTM Joy Lawa Rizky1*.
Windu Gata2 Ilmu Komputer.
Universitas Nusa Mandiri.
Depok.
Indonesia *e-mail Corresponding Author: joylawarizky7@gmail.
Abstract This study analyzes social media sentiment on YouTube regarding the high-speed train (Whoos.
using the Bidirectional-LSTM algorithm.
The issue raised is the need for a deeper understanding of public perception of the high-speed train project, which can affect its acceptance and The purpose of this paper is to evaluate the performance of the Bidirectional-LSTM algorithm in sentiment analysis compared to other algorithms.
The method used involves collecting YouTube comment data, text preprocessing, and applying the Bidirectional-LSTM algorithm for sentiment classification.
The parameters analyzed include accuracy, precision, and resilience to data variations.
The research results show that the Bidirectional-LSTM algorithm achieves an accuracy of .
, which is significantly higher compared to the Multinomial Nayve Bayes algorithm .
USE-Transfer learning (Tensorflo.
, and Text Vectorization and Embedding (Tensorflo.
The conclusion of this study is that Bidirectional-LSTM is more effective and reliable in analyzing social media sentiment towards the high-speed train (Whoos.
Keywords: Sentiment Analysis.
YouTube Fast Train (Whoos.
Bidirectional-LSTM.
Abstrak Penelitian ini menganalisis sentimen media sosial YouTube terhadap kereta cepat (Whoos.
menggunakan algoritma Bidirectional-LSTM.
Masalah yang diangkat adalah perlunya pemahaman yang lebih mendalam tentang persepsi publik terhadap proyek kereta cepat, yang dapat mempengaruhi penerimaan dan keberlanjutannya.
Tujuan penulisan ini adalah untuk mengevaluasi performa algoritma Bidirectional-LSTM dalam menganalisis sentimen dibandingkan dengan algoritma lain.
Metode yang digunakan melibatkan pengumpulan data komentar YouTube, preprocessing teks, dan penerapan algoritma Bidirectional-LSTM untuk klasifikasi sentimen.
Parameter-parameter yang dianalisis meliputi akurasi, presisi, dan ketahanan terhadap variasi data.
Hasil penelitian menunjukkan bahwa algoritma BidirectionalLSTM mencapai akurasi .
yang secara signifikan lebih tinggi dibandingkan dengan algoritma Multinomial Nayve Bayes .
USE-Transfer learning .
, dan Text Vactorita-tion and Embedding (Tensorflo.
Simpulan penelitian ini adalah bahwa Bidirectional-LSTM lebih efektif dan andal dalam menganalisis sentimen media sosial YouTube kereta cepat (Whoos.
Kata kunci: Analisis Sentimen.
Youtube Kereta Cepat (Whoos.
Bidirectional-LSTM.
Pendahuluan Kereta berkecepatan tinggi telah lama menjadi simbol kemajuan teknologi di bidang transportasi, membawa visi perjalanan yang cepat, efisien, dan nyaman bagi masyarakat di berbagai belahan dunia.
Namun, di era ini, dengan meningkatnya tuntutan mobilitas dan kebutuhan akan solusi transportasi berkelanjutan yang lebih efisien, lahirlah sebuah inovasi yang menjanjikan revolusi baru dalam dunia kereta cepat: Kereta Cepat (Whoos.
Nama (Whoos.
bukan sekadar nama, tapi juga menggambarkan sensasi perjalanan cepat seolah-olah kita sedang bergerak di udara dengan kecepatan yang mengesankan.
Dengan teknologi mutakhir yang memadukan prinsip levitasi magnetik .
dan desain aerodinamis canggih, kereta cepat (Whoos.
memperkenalkan paradigma baru dalam transportasi berkecepatan tinggi.
Meskipun perkembangan teknologi kereta cepat seperti (Whoos.
membawa banyak manfaat, penerimaan publik terhadap proyek ini masih menjadi tantangan besar.
Sentimen masyarakat terhadap kereta cepat ini sangat bervariasi, dengan adanya pandangan positif maupun negatif yang muncul di berbagai platform media sosial, termasuk YouTube.
Hal ini Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky Progresif e-ISSN: 2685-0877 menunjukkan adanya gap antara kondisi ideal yang diharapkan dengan kondisi realitas yang ada.
Kondisi idealnya adalah proyek ini diterima secara positif oleh seluruh lapisan masyarakat, mendukung keberlanjutannya dan memaksimalkan manfaat ekonomi dan sosial.
Namun, kenyataannya, banyak komentar negatif yang menyoroti berbagai masalah, seperti biaya yang tinggi dan dampak lingkungan, yang dapat menghambat penerimaan dan kesuksesan proyek ini.
Untuk mengatasi masalah tersebut, penelitian ini mengusulkan penggunaan algoritma Bidirectional-LSTM dalam analisis sentimen media sosial YouTube terkait proyek kereta cepat (Whoos.
Algoritma Bidirectional-LSTM dipilih karena kemampuannya dalam menangkap konteks dari kedua arah, sehingga mampu memberikan pemahaman yang lebih baik terhadap struktur dan nuansa kalimat dibandingkan dengan model-model sebelumnya seperti Multinomial Naive Bayes dan USE-Transfer learning (Tensorflo.
Penelitian terdahulu menunjukkan bahwa Bidirectional-LSTM memiliki performa yang lebih baik dalam hal akurasi, presisi, recall, dan F1score dalam berbagai aplikasi analisis sentimen .
Dengan mengadopsi model ini, diharapkan mampu memberikan gambaran yang lebih akurat tentang sentimen publik dan mendukung pengambilan keputusan yang lebih baik dalam pengelolaan proyek kereta cepat (Whoos.
Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma Bidirectional-LSTM dalam menganalisis sentimen dibandingkan dengan algoritma lain, serta untuk memahami persepsi publik terhadap proyek kereta cepat (Whoos.
melalui analisis komentar di YouTube.
Penelitian ini tidak hanya meningkatkan akurasi analisis sentimen, tetapi juga memberikan wawasan untuk lebih mendalam tentang pandangan masyarakat, yang dapat digunakan sebagai dasar untuk strategi komunikasi dan kebijakan yang lebih efektif.
Dengan demikian, penelitian ini berkontribusi pada pengembangan teknologi transportasi yang lebih baik dan berkelanjutan, serta meningkatkan penerimaan publik terhadap inovasi tersebut.
Tinjauan Pustaka Kereta cepat, juga dikenal sebagai high-speed rail (HSR), telah menjadi fokus utama dalam upaya meningkatkan konektivitas transportasi di berbagai negara.
Studi-studi sebelumnya telah menyoroti keuntungan ekonomi, sosial, dan lingkungan dari pengembangan jaringan kereta Dan terkait analisis sentimen, di mana para peneliti telah menggunakan algoritma yang beragam untuk menangani permasalahan ini, berikut merupakan rangkuman dari penelitian .
Penelitian yang dilakukan oleh Johanes Florensius Sianipar.
Yudhi Raymond Ramadhan, dan Irsan Jaelani ini bertujuan sentimen analisis pengguna Twitter terhadap pembangunan kereta cepat menggunakan metode Naive Bayes.
Dari 2.
390 data tentang kereta cepat JakartaBandung yang dikumpulkan, setelah proses pembersihan data, tersisa 2.
007 data yang Hasil analisis menunjukkan bahwa terdapat 673 tweet dengan komentar negatif, 668 tweet dengan komentar positif, dan 665 tweet dengan sentimen netral, dengan akurasi 71%, presisi 73%, dan recall 89%.
Hasil penelitian ini menunjukkan bahwa sentimen publik terhadap pembangunan kereta cepat Jakarta-Bandung cenderung negatif.
Penelitian ini dilakukan oleh Alam Rizki Fitriansyah dan Yuliant Sibaroni, yang menggunakan data berupa tweet dari kata kunci yang telah ditentukan serta menerapkan GloVe word embedding dan metode klasifikasi Support Vector Machine.
penelitian ini, kombinasi parameter GloVe terbaik dengan nilai 200 untuk no_of_component, 0.
001 untuk learning_rate, dan fitur TOP 1 menghasilkan peningkatan akurasi klasifikasi SVM dari 72.
63% menjadi 72%, dibandingkan dengan SVM yang tidak menggunakan fitur ekspansi GloVe.
Penelitian ini dilakukan oleh Tifani Agustiranti.
Aulia Khalfani Izzati Kurdiana.
Bilal Al Ghiffari.
Elza Dwi Juniar, dan Diki Gita Purnama, menganalisis sentimen masyarakat tpenggunaan kereta cepat dengan memanfaatkan data ulasan yang diambil dari media sorhadap sial Twitter.
Perbandingan akurasi antara kedua metode menunjukkan bahwa metode berbasis leksikon menghasilkan akurasi sebesar 67%, sementara metode Naive Bayes Classifier mencapai 78%.
Penelitian yang dilakukan oleh Citra Pricylia Ananda Mulya.
Pramudya Nugraha, dan Imam Santoso ini bertujuan menganalisis kelayakan kebijakan Transportasi Kereta Cepat dalam menciptakan transportasi yang ramah lingkungan.
Hasil penelitian menunjukkan bahwa algoritma KNN menghasilkan akurasi dan AUC dengan tingkat keakuratan 82,70%, yang dikategorikan sebagai klasifikasi yang sangat baik.
Penelitian ini dilakukan oleh Siti Nurwahyuni metode penelitian ini yaitu yang banyak digunakan dalam mengolah data dalam bentuk text mining dengan tingkat akurasi yang cukup Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 tinggi adalah algoritma Naive Bayes Classifier (NBC).
Menggunakan algoritma Naive Bayes Classifier (NBC) dengan hasil sebesar 84.
Kebaruan penelitian ini mengusulkan penggunaan algoritma Bidirectional-LSTM dalam analisis sentimen media sosial YouTube terkait proyek kereta cepat Jakarta-Bandung.
Algoritma Bidirectional-LSTM ini terbukti memberikan hasil yang lebih baik atau lebih akurat dibandingkan dengan metode lain seperti Multinomial Naive Bayes dan USE-Transfer learning (Tensorflo.
Hasil penelitian menunjukkan bahwa Bidirectional-LSTM memiliki performa terbaik dengan akurasi 86, presisi 0.
85, recall 0.
99, dan F1-score 0.
92, yang mengungguli model-model sebelumnya yang telah digunakan dalam penelitian analisis sentimen di konteks serupa.
Penelitian ini tidak hanya meningkatkan akurasi dari analisis sentimen, tetapi juga memperkenalkan penggunaan metode transfer learning dalam pengolahan data teks, yang belum banyak diterapkan dalam penelitian terdahulu Penelitian ini menawarkan peningkatan signifikan dalam analisis sentimen dengan mengadopsi model Bidirectional-LSTM yang mengungguli model-model sebelumnya seperti Multinomial Naive Bayes dan USE-Transfer learning (Tensorflo.
Keunggulan BidirectionalLSTM terletak pada kemampuannya menangkap konteks dari kedua arah, yang menghasilkan pemahaman yang lebih baik terhadap struktur dan nuansa kalimat.
Berbeda dengan penelitian terdahulu yang menggunakan model statistik sederhana atau embedding kata seperti GloVe dan metode klasifikasi dasar seperti SVM dan KNN, penelitian ini memanfaatkan kemampuan transfer learning dan embedding yang lebih kompleks untuk meningkatkan performa analisis sentimen.
Penggunaan parameter-parameter canggih dan teknik pemrosesan data yang lebih mutakhir menempatkan penelitian ini pada garis depan dalam bidang analisis sentimen media sosial, khususnya dalam konteks proyek infrastruktur besar seperti kereta cepat Jakarta-Bandung Metodologi Bab ini menjelaskan langkah-langkah yang diambil selama penelitian berlangsung.
Untuk memudahkan pemahaman mengenai tahapan-tahapan yang digunakan, langkah-langkah tersebut akan digambarkan dalam bentuk diagram di Gambar 1.
Gambar 1.
Metodologi Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 1 Pemahaman Bisnis Kereta cepat whoosh merupakan proyek besar di industri transportasi yang menawarkan layanan Kereta cepat berkecepatan tinggi untuk menghubungkan berbagai tujuan.
Bisnis kereta cepat whoosh dapat dirancang dan dijalankan secara efektif untuk memberikan layanan transportasi yang andal, efisien dan nyaman bagi penumpangnya.
Pemahaman Data Untuk memahami data sebagai bahan penelitian, peneliti melakukan observasi dengan cara melihat melihat komentar dari postingan yang ada di akun media sosial resmi youtube kereta cepat whoosh dan menunjukan beberapa komentar negatif dan positif terhadap pelayanan kereta cepat whoosh.
Oleh karena itu, dilakukan penelitian mendalam untuk menganalisis sentimen publik terhadap kereta cepat whoosh dengan fokus pada akun media sosial resmi youtube kereta cepat whoosh.
3 Persiapan Data 1 Pengumpulan Data dilakukan pada tanggal 22 Maret 2024.
Sumber data berasal dari akun media sosial resmi youtube kereta cepat whoosh.
Sumber data diambil berdasarkan komentar postingan awal pada youtube kereta cepat whoosh.
Peneliti hanya mengambil 1148 komentar di awal postingan youtube kereta cepat whoosh.
Pengambilan data komentar youtube menggunakan crawling dan menggunakan bahasa pemograman python dengan menggunakan API Key Google Colab kemudian data yang dikumpulkan akan disimpan ke pada file ekstensi .
csv proses crawling dapat dilihat di gambar 2 Gambar 2.
Crawling Data Proses ini merupakan mengubah data tidak terstruktur menjadi terstruktur, sehingga dapat disimpan dalam database.
Tujuan utama dari crawling adalah mengumpulkan, menyimpan, dan memvalidasi data agar data tersebut dapat didefinisikan menjadi informasi yang .
2 Persiapan Data Pra-pemrosesan Langkah pertama dalam mempersiapkan data pra-pemrosesan yaitu melakukan perbaikan kata.
Perbaikan kata ini dilakukan dengan cara menerjemahkan komentar yang berbahasa inggris menjadi bahasa indonesia menggunakan library Googletrans pada program python, dan juga memperbaiki kalimat kata-kata singkatan, memperbaiki kata-kata yang mengandung kesalahan penulisan .
Langkah kedua adalah data cleaning, yaitu tahap untuk membersihkan data dan memperbaiki inkonsistensi dengan cara menghapus tanda baca, hashtag.
URL, simbol, angka, dan atribut yang kosong.
Langkah ketiga yaitu melakukan pelabelan Sentiment analysis atau opinion mining merujuk pada area luas dalam pengolahan bahasa alami, komputasi linguistik, dan text mining digunakan untuk menganalisis pendapat, sentimen, evaluasi, sikap, penilaian, dan emosi Analisis sentimen dikategorikan ke dalam kategori positif dan negatif.
Setelah proses pelabelan, data komentar akan dibersihkan secara manual dengan menghapus komentar yang duplikat menggunakan aplikasi microsoft excel.
Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 3 Filtering Data Filtering Data merupakan proses penyeleksian komentar.
Komentar yang sudah terfilter nantinya akan digunakan untuk proses pemodelan.
Filtering data bertujuan untuk menyeleksi komentar yang berbobot, penghapusan duplikasi komentar, dan juga agar data yang disajikan jumlahnya mendekati seimbang antara komentar positif dan negatif.
4 Pra-pemprosesan Proses preprocessing adalah langkah krusial untuk memperbaiki kualitas data mentah sebelum diproses lebih lanjut.
Pada tahap ini, data komentar yang masih tedapat simbol, hashtag, dan kata tidak relevan dapat dibersihkan.
Pra-pemrosesan dalam penelitian ini meliputi cleansing, case folding, tokenisasi, stopword removal, dan stemming.
Proses ini mencakup beberapa kegiatan modifikasi data, yaitu .
Cleansing, proses menghapus karakter, mention, hashtag.
URL, dan karakter lainnya selain huruf.
Case folding, proses mengubah semua teks menjadi huruf kecil.
Tokenizing, proses memotong atau memisahkan kata yang dipisahkan oleh whitespace atau spasi.
Stopword removal, proses menghilangkan kata yang sering muncul dalam teks tetapi tidak memiliki arti penting.
Stemming, proses mengubah semua kata dalam teks menjadi bentuk dasar dengan menghilangkan awalan, sisipan, dan akhiran.
4 Pemodelan 1 Pembobotan TF-IDF, atau Term Frequency-Inverse Document Frequency, yaitu nilai numerik yang digunakan untuk pemrosesan bahasa alami untuk menunjukkan seberapa penting suatu kata dalam satu dokumen dibandingkan dengan sekumpulan dokumen lainnya.
Ada beberapa tahapan klasifikasi yang menggunakan TF-IDF, termasuk menjalankan klasifikasi dengan Naive Bayes.
TF-IDF bertujuan menghitung bobot setiap kata yang digunakan untuk fitur.
Semakin banyak dokumen yang diproses, semakin banyak fitur yang dikumpulkan.
2 Klasifikasi Model Semua proses pemodelan dengan menggunakan program python.
Sebelum melakukan mengklasifikasikan komentar menggunakan model Multinomial Nayve Bayes.
Text Vactoritation and Embedding (Tensorflo.
Bidirectional-LSTM.
USE-Transfer learning (Tensorflo.
harus dilakukan training data TDF IF.
Pada tahap ini bertujuan untuk mencari accuracy, precision, recall.
F1-score pada setiap model.
5 Evaluasi Klasifikasi mencakup tahap evaluasi yang melibatkan confusion matrix yaitu tabel yang membantu menentukan seberapa akurat proses klasifikasi yang telah dilakukan.
Visualisasi dashboard digunakan untuk menampilkan data yang telah diproses dalam bentuk grafik.
Tahap ini mencakup menampilkan dan membandingkan nilai Accuracy.
Precision.
Recall, dan F1-score pada model-model seperti Multinomial Nayve Bayes.
Text Vectorization and Embedding (TensorFlo.
Bidirectional-LSTM, dan USE-Transfer learning (TensorFlo.
, serta memvisualisasikan hasil perbandingan tersebut dengan diagram.
6 Penerapan Penerapan adalah hasil kesimpulan dari proses penelitian.
Pada tahap ini juga memberikan kesimpulan dari perbandingan nilai akurasi, presisi, recall, dan F1-score dari model Multinomial Nayve Bayes.
Text Vactoritation and Embedding (Tensorflo.
Bidirectional-LSTM.
USE-Transfer learning (Tensorflo.
Penulis juga memberikan saran berdasarkan hasil penelitian .
Hasil dan Pembahasan Dalam tahap perbaikan kata, dilakukan perbaikan kata-kata singkatan, kata-kata yang mengandung kesalahan penulisan dan juga menerjemahkan kalimat yang berbahasa inggris ke Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 bahasa indonesia.
Untuk tahap cleansing, penghapusan atribut tidak jelas dan penghapus mention nama orang.
Berikut komentar yang telah diperbaiki dan cleansing dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan dijabarkan pada tabel 1 Tabel 1.
Perbaikan Kata dan Cleansing Youtube No.
Sebelum Keren menuju indonesia maju Mantap Keren menuju indonesia maju Mantap #Semoga berkah buat masyarakat
Semoga berkah buat masyarakat
Perbaikan Kata & Cleansing Ai
KEMAHALAN TIKETNYA !!!
KEMAHALAN TIKETNYA
Mana mungkin @ Proyek ini memajukan ekonomi masyarakat ! Mana mungkin Proyek ini memajukan ekonomi masyarakat Langkah selanjutnya adalah melakukan pelabelan sesuai dengan sifat dari komentar tersebut dan dikategorikan menjadi komentar positif dan negatif.
Namun ada beberapa komentar tidak bisa diidentifikasi sehingga dihapus, sehingga dataset untuk Youtube Kereta Cepat Whoosh .
Berikut komentar yang telah diberi label dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan dijabarkan pada tabel 2.
Tabel 2.
Perbaikan dan Cleansing Komentar Youtube Kereta Cepat Whoosh No.
Perbaikan Kata & Cleansing Label
Keren menuju indonesia maju Mantap Positif
Semoga berkah buat masyarakat indonesia
Positif
KEMAHALAN TIKETNYA
Negatif Mana mungkin Proyek ini memajukan ekonomi masyarakat Negatif Jumlah komentar berdasarkan setiap label akan dijabarkan di tabel 3.
Tabel 3.
Jumlah Komentar Berdasarkan Label Sosial Media Komentar Negatif Komentar Positif Total Youtube .
Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 Gambar 3.
Hasil Labelling Gambar diatas adalah sebuah bar chart yang menunjukkan distribusi label pada dataset.
Sumbu X (Labe.
: Menunjukkan dua kategori label Positive (Positi.
: Menunjukkan jumlah sampel yang diberi label positif.
Negative (Negati.
Menunjukkan jumlah sampel yang diberi label negatif.
Sumbu Y (Coun.
Menunjukkan jumlah atau frekuensi dari setiap label dalam dataset.
Interpretasi Bar Positif Jumlah sampel dengan label positif adalah sekitar 1000.
Bar Negatif Jumlah sampel dengan label negatif adalah sekitar 200.
Dataset ini menunjukkan jumlah sampel positif jauh lebih banyak dibandingkan dengan jumlah sampel negatif.
Ini berarti ada banyak lebih banyak contoh kelas positif dibandingkan dengan kelas negatif.
Implikasi untuk Machine Learning Ketidakseimbangan data seperti ini dapat menyebabkan model machine learning menjadi bias terhadap kelas mayoritas .
elas positi.
, dan kurang mampu mengenali atau memprediksi kelas minoritas .
elas negati.
Perlu adanya teknik penanganan data tidak seimbang seperti oversampling kelas minoritas, undersampling kelas mayoritas, atau menggunakan algoritma yang dirancang untuk menangani data tidak seimbang.
3 Filtering Data Sebelum melakukan pra-pemrosesan, pembobotan dan klasifikasi model, dilakukan filtering data yang akan menjadi sumber data, karena komentar positif dan negatif perbedaanya terlalu jauh dan juga komentar yang seleksi adalah komentar yang berbobot, penghapusan duplikasi komentar.
Data yang digunakan dalam proses pembobotan dan klasifikasi model akan dijelaskan dalam tabel 4.
Tabel 4.
Filtering Data Komentar Sosial Media Komentar Negatif Komentar Positif Total Youtube 4 Pra-pemprosesan 1 Case Folding Proses mengubah data teks menjadi huruf kecil.
Berikut komentar yang telah dilakukan proses case folding dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan dijabarkan pada tabel 5.
Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 Tabel 5.
Case Folding Youtube Kereta Cepat Whoosh No.
Perbaikan Kata & Cleansing Keren menuju indonesia maju Mantap keren menuju indonesia maju mantap Semoga berkah buat masyarakat
Indonesia
semoga berkah buat masyarakat indonesia
Case Folding Ai
KEMAHALAN TIKETNYA
kemahalan tiketnya Mana mungkin Proyek ini memajukan ekonomi masyarakat mana mungkin proyek ini memajukan ekonomi masyarakat 2 Tokenizing Metode membagi teks menjadi komponen lebih kecil, seperti kata, kalimat, atau bigram.
Berikut komentar yang telah dilakukan proses tokenizing dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan ditampilkan pada tabel 6.
Tabel 6.
Tokenizing Youtube Kereta Cepat Whoosh No.
Case Folding keren menuju indonesia maju mantap ['keren', 'menuju', 'indonesia', 'maju', 'mantap'] semoga berkah buat masyarakat ['semoga', 'berkah', 'buat', 'masyarakat', 'indonesia'] Ai Ai Tokenizing Ai kemahalan tiketnya ['kemahalan', 'tiketnya'] mana mungkin proyek ini memajukan ekonomi masyarakat ['mana', 'mungkin', 'proyek', 'ini', 'memajukan', 'ekonomi', 'masyarakat'] 3 Stopword Proses penghapusan kata yang tidak diperlukan dalam pengolahan data, atau kata yang tidak memiliki makna signifikan .
Stopword tahap mengambil kata penting dari hasil membuang kata kurang penting dari proses tokenizing.
Berikut komentar yang telah dilakukan proses stopword dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan dijabarkan pada tabel 7.
Tabel 7.
Stopword Youtube Kereta Cepat Whoosh No.
Tokenizing Stopword ['keren', 'menuju', 'indonesia', 'maju', 'mantap'] ['keren', 'menuju', 'indonesia', 'maju', 'mantap'] ['semoga', 'berkah', 'buat', 'masyarakat', 'indonesia'] ['semoga', 'berkah', 'buat', 'masyarakat', 'indonesia'] Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 No.
Tokenizing Stopword Ai Ai Ai ['kemahalan', 'tiketnya'] ['kemahalan', 'tiketnya'] ['mana', 'mungkin', 'proyek', 'ini', 'memajukan', 'ekonomi', 'masyarakat'] ['mana', 'mungkin', 'proyek', 'ini', 'memajukan', 'ekonomi', 'masyarakat'] 4 Stemming Proses mengubah kata dalam teks menjadi bentuk dasar dengan menghilangkan awalan, sisipan, dan akhiran.
Stemming merupakan proses menghilangkan imbuhan dalam Berikut komentar yang telah dilakukan proses stemming dari akun sosial media resmi Youtube Kereta Cepat Whoosh yang akan ditampilkan pada tabel 8.
Tabel 8.
Stemming Youtube Kereta Cepat Whoosh No.
Stopword Stemming ['keren', 'menuju', 'indonesia', 'maju', 'mantap'] ['keren', 'tuju', 'indonesia', 'maju', 'mantap'] ['semoga', 'berkah', 'buat', 'masyarakat', 'indonesia'] ['moga', 'berkah', 'buat', 'masyarakat', 'indonesia'] Ai Ai ['kemahalan', 'tiketnya'] ['mahal', 'tiket'] ['mana', 'mungkin', 'proyek', 'ini', 'memajukan', 'ekonomi', 'masyarakat'] ['mana', 'mungkin', 'proyek', 'ini', 'maju', 'ekonomi', 'masyarakat'] Ai 5 Pemodelan 1 Pembobotan Pembobotan menggunakan metode TF-IDF.
Hasil dari pembobotan Youtube menggunakan metode TF-IDF akan diuraikan pada tabel 9.
Tabel 9.
TF-IDF Youtube .
, .
, .
, .
Ai 2 Klasifikasi Model Dalam penelitian ini, pengujian akurasi dilakukan menggunakan Multinomial Naive Bayes.
Text Vectorization dan Embedding (TensorFlo.
Bidirectional-LSTM, serta USE-Transfer Learning (TensorFlo.
Pemodelan dilakukan dengan menggunakan library MultinomialNB.
Keras, dan TensorFlow.
Hasil dari pemodelan akan dibahas secara rinci di Bab 4.
Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 6 Evaluasi Pada penelitian ini, dilakukan pengujian Accuracy.
Precision.
Recall.
F1-score menggunakan model klasifikasi Multinomial Naive Bayes.
Text Vactoritation and Embedding (Tensorflo.
Bidirectional-LSTM.
USE-Transfer learning (Tensorflo.
pada data yang berasal dari Youtube yang ditampilkan pada gambar 3.
Gambar 5.
Hasil Klasifikasi Youtube Model yang diuji dari gambar diatas adalah Naive Bayes (MultinomialNB).
BidirectionalLSTM).
USE-Transfer learning (Tensorflo.
Text Vectorization and Embedding (Tensorflo.
Metrik yang digunakan untuk evaluasi.
Accuracy (Akuras.
Mengukur seberapa banyak prediksi yang benar dari total prediksi.
Precision (Presis.
Mengukur proporsi prediksi positif yang benar dari keseluruhan prediksi positif disebut precision.
Recall mengukur proporsi prediksi positif yang benar dari jumlah total data positif yang sebenarnya.
F1-Score adalah rata-rata harmonis dari precision dan recall.
Evaluasi dilakukan untuk setiap model, termasuk Multinomial Naive Bayes (MultinomialNB).
Accuracy .
Precision .
Recall .
F1-Score .
BidirectionalLSTM Accuracy .
Precision .
Recall .
F1-Score .
USE-Transfer learning (Tensorflo.
Accuracy .
Precision .
Recall .
F1-Score .
Text Vectorization and Embedding (Tensorflo.
Accuracy .
Precision .
Recall .
F1-Score .
Dari hasil ini, dapat dilihat bahwa model algoritma Bidirectional-LSTM memiliki performa terbaik dengan akurasi, presisi, dan recall yang tinggi, serta F1-Score yang paling tinggi di antara semua model yang diuji.
Gambar 6.
Hasil Confusion Matrix Confusion Matrix yang digunakan untuk mengevaluasi kinerja model klasifikasi.
Sumbu Y (Tru.
: Menunjukkan kelas sebenarnya dari data.
Class 0 kelas negatif.
Class 1 kelas positif.
Sumbu X (Predicte.
Menunjukkan prediksi kelas yang dibuat oleh model.
Class 0 Kelas negatif Class 1 Kelas positif.
Matriks True Positive (TP) Kotak di baris Class 1 (Tru.
dan kolom Class 1 (Predicte.
, yaitu 186.
Ini berarti model memprediksi 186 sampel sebagai positif .
dan memang benar positif.
True Negative (TN) Kotak di baris Class 0 (Tru.
dan kolom Class 0 (Predicte.
, yaitu 0.
Ini berarti tidak ada sampel yang benar-benar negatif diprediksi sebagai Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 negatif oleh model.
False Positive (FP) Kotak di baris Class 0 (Tru.
dan kolom Class 1 (Predicte.
, yaitu 44.
Ini berarti model memprediksi 44 sampel sebagai positif .
padahal sebenarnya negatif.
False Negative (FN) Kotak di baris Class 1 (Tru.
dan kolom Class 0 (Predicte.
, yaitu 0.
Ini berarti tidak ada sampel yang benar-benar positif .
diprediksi sebagai negatif oleh model.
Interpretasi Model ini memiliki True Positive yang sangat tinggi .
dan False Negative yang sangat rendah .
, menunjukkan bahwa model sangat baik dalam mendeteksi sampel yang benar-benar positif .
Namun, model memiliki True Negative yang sangat rendah .
dan False Positive yang cukup tinggi .
, yang berarti model kurang baik dalam mendeteksi sampel yang benar-benar negatif.
Warna merah yang lebih gelap menunjukkan jumlah yang lebih besar, sedangkan warna merah yang lebih terang menunjukkan jumlah yang lebih kecil.
Secara keseluruhan, model ini sangat efektif dalam mendeteksi kasus positif, tetapi kurang efektif dalam mendeteksi kasus negatif.
Hasil perbandingan klasifikasi pada tiap model berdasarkan dataset Youtube akan digambarkan pada gambar 7, 8, 9, 10 Gambar 7.
Perbandingan Accuracy Tiap Model Pada Youtube Gambar 8.
Perbandingan Precision Tiap Model Pada Youtube Gambar 9.
Perbandingan Recall Tiap Model Pada Youtube Gambar 10.
Perbandingan F1-Score Tiap Model Pada Youtube Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 Gambar 11.
Perbandingan Antara Accuracy Dengan Precision Tiap Model Pada Youtube Gambar 12.
Perbandingan Antara Precision Dengan Recall Tiap Model Pada Youtube Gambar 13.
Perbandingan Antara Recall Dengan F1-score Tiap Model Pada Youtube Gambar 14.
Hasil Word Cloud Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky e-ISSN: 2685-0877 Berdasarkan grafik pada gambar 7, 8, 9, 10 Menunjukan bahwa nilai tertinggi ada pada model Bidirectional-LSTM dengan accuracy .
, precision .
, recall .
F1-score .
sedangkan nilai terkecil ada pada model USE Transfer learning (Tensorflo.
dengan accuracy .
, precision .
, recall .
F1-score .
Simpulan Kesimpulan Hasil penelitian menunjukkan bahwa algoritma berbasis Bidirectional-LSTM .
secara signifikan mengungguli algoritma lainnya seperti MultinomialNB .
USETransfer learning (Tensorflo.
, dan Text Vactoritation and Embedding (Tensorflo.
dalam hal akurasi dan ketahanan terhadap variasi data, dari penelitian ini Ditemukan 179 .
59%) komentar negatif dan 969 .
41%) komentar positif pada Youtube.
Nilai accuracy tertinggi Youtube terdapat pada model Bidirectional-LSTM sedangkan nilai akurasi terkecil ada pada model USE Transfer learning (Tensorflo.
Tingkat akurasi masih dibawah .
Hal ini menunjukan bahwa masih perlu adanya penelitian lebih lanjut agar mendapatkan nilai accuracy yang lebih baik lagi.
Daftar Referensi Sianipar.
Ramadhan, and I.
Jaelani.
AuAnalisis Sentimen Pembangunan Kereta Cepat Jakarta-Bandung di Media Sosial Twitter Menggunakan Metode Naive Bayes,Ay Kajian Ilmiah Informatika dan Komputer, vol.
4, no.
1, pp.
360Ae367, 2023, doi:
30865/klik.
Fitriansyah and Y.
Sibaroni.
AuAnalisis Sentimen Terhadap Pembangunan Kereta Cepat Jakarta-Bandung Pada Media Sosial Twitter Menggunakan Metode SVM dan GloVe Word Embedding,Ay e-Proceeding of Engineering, vol.
10, no.
2, pp.
1713Ae1723.
Apr.
Accessed: Jul.
17, 2024.
[Onlin.
Available: https://openlibrarypublications.
id/index.
php/engineering/article/view/20000 Agustiranti.
Khalfani Izzati Kurdiana.
Al Ghiffari.
Dwi Juniar, and D.
Gita Purnama.
AuPenerapan Naive Bayes Terhadap Sentimen Analisis Media Sosial Twitter Pengguna Kereta Cepat Jakarta-Bandung (Whoos.
,Ay Jurnal Ilmu Komputer dan Sistem Informasi (JIKOMSI, vol.
7, no.
1, pp.
297Ae305, 2024.
Pricylia.
Mulya.
Nugraha, and I.
Santoso.
AuAnalisis Sentimen Masyarakat Terhadap Pembangunan Kereta Cepat Jakarta-Bandung Menggunakan Algoritma KNearest Neighbors (KNN),Ay Jakarta.
Jul.
Accessed: Jul.
17, 2024.
[Onlin.
Available: w.
com/textmining.
Peneliti Singgalen.
AuPemilihan Metode dan Algoritma dalam Analisis Sentimen di Media Sosial : Sistematic Literature Review,Ay Journal of Information Systems and Informatics, 3, no.
2, pp.
56-64, 2021, [Onlin.
Available: http://journal-isi.
org/index.
php/isi Susilo and H.
Harliantara.
AuFraming Analysis of Indonesian Fast Train on detik.
com,Ay Gema Kampus IISIP YAPIS Biak, vol.
18, no.
2, pp.
148Ae162.
Oct.
2023, doi:
52049/gemakampus.
Nurwahyuni.
AuAnalisis Sentimen Aplikasi Transportasi Online Krl Access Menggunakan Metode Naive Bayes,Ay JURNAL SWABUMI, vol.
7, no.
1, pp.
31Ae38.
Mar.
Amaliah and I.
Nuryana.
AuPerbandingan Akurasi Metode Lexicon Based Dan Naive Bayes Classifier Pada Analisis Sentimen Pendapat Masyarakat Terhadap Aplikasi Investasi Pada Media Twitter,Ay Journal of Informatics and Computer Science, vol.
03, no.
03, pp.
384Ae393, 2022.
Permatasari.
Linawati, and L.
Jasa.
AuSurvei Tentang Analisis Sentimen Pada Media Sosial,Ay Majalah Ilmiah Teknologi Elektro, vol.
20, no.
2, pp.
Dec.
doi: 10.
24843/mite.
Wahyu.
AuKonferensi Nasional Ilmu Komputer (KONIK) 2023 Perbandingan Model Algoritma Klasifikasi Pada Analisis Sentimen Opini Masyarakat Terhadap Layanan Kereta Cepat Jakarta Bandung (The Whoos.
,Ay Konferensi Nasional Ilmu Komputer (KONIK) 2023, p.
8, 2023.
Accessed: Jul.
17, 2024.
[Onlin.
Available: https://prosiding.
php/konik/article/view/214 Chohan.
Nugroho.
Maezar Bayu Aji, and W.
Gata.
AuAnalisis Sentimen Aplikasi Duolingo Menggunakan Metode Nayve Bayes dan Synthetic Minority Over Sampling Progresif: Vol.
No.
Agustus 2024: 748-761 Progresif e-ISSN: 2685-0877 Technique,Ay Paradigma Ae Jurnal Informatika dan Komputer, vol.
22, no.
2, pp.
141-150,
Sep.
2020, doi: 10.
31294/p.
Novira and A.
Lattu.
AuAnalisis Sentimen Masyarakat Di Instagram Mengenai Kereta Cepat Jakarta-Bandung Menggunakan Algoritma Nayve Bayes ClassifieR,Ay SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatik.
, pp.
Aug.
Accessed: Jul.
17, 2024.
[Onlin.
Available: https://sismatik.
php/ sismatik/article/view/214 Yusuf and S.
Masripah.
AuSentimen Analisis Chatgpt Dengan Algoritma Nayve Bayes Dan Optimasi PSO,Ay INTI Nusa Mandiri, vol.
18, no.
1, pp.
59Ae64.
Aug.
2023, doi:
33480/inti.
Yanti.
Ginantra.
Wulandari, and N.
Paramita.
AuKomparasi Metode Single Moving Average dan Double Exponential Smoothing untuk Peramalan Penjualan Produk Gerabah pada UD.
Amerta Sedana,Ay JURIKOM (Jurnal Riset Kompute.
, vol.
9, no.
3, pp.
Jun.
2022, doi: 10.
30865/jurikom.
Romadloni.
Santoso, and S.
Budilaksono.
AuPerbandingan Metode Naive Bayes.
Knn Dan Decision Tree Terhadap Analisis Sentimen Transportasi Krl Commuter Line,Ay Jurnal IKRA-ITH Informatika, vol.
3, no.
2, pp.
1Ae9.
Jul.
Accessed: Jul.
17, 2024.
[Onlin.
Available: https://ojs.
upi-yai.
id/index.
php/ikraith-informatika/article/view/311 Analisis Sentimen Media Sosial Youtube Kereta Cepat.
Joy Lawa Rizky