Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal.
id/index.
php/malcom Vol.
5 Iss.
3 July 2025, pp: 1133-1142
ISSN(P): 2797-2313 | ISSN(E): 2775-8575
Comparison of Deep Learning Algorithm in Sentiment Analysis Ecotourism in Bogor Perbandingan Algoritma Deep Learning untuk Analisis Sentimen Ekowisata di Bogor Peni Agustini1*.
Muhammad Iqbal2.
Vicha Amalia Akbar3.
Robert Kurniawan4
1,2,3,4
Statistika.
Politeknik Statistika STIS.
Indonesia E-Mail: 1212212815@stis.
id , 2212212757@stis.
212212909@stis.
id, 4robertk@stis.
Received Jun 20th 2025.
Revised Jul 20th 2025.
Accepted Jul 30th 2025.
Available Online Jul 31th 2025.
Published Aug 15th 2025 Corresponding Author: Peni Agustini Copyright A 2025 by Authors.
Published by Institut Riset dan Publikasi Indonesia (IRPI) Abstract Bogor has a leading ecotourism destination in Indonesia, offering pristine nature and easy access from Jakarta.
However, the increasing number of tourists poses challenges to environmental management, such as waste management and pressure on natural resources.
Social media, particularly Google Maps, plays a crucial role in promoting tourism and understanding tourist behavior through its review features.
This study aims to conduct sentiment analysis on ecotourism reviews in Bogor collected from Google Maps using neural network-based deep learning methods, namely Convolutional Neural Network (CNN).
Recurrent Neural Network (RNN), and Long Short-Term Memory (LSTM).
The performance of these three models is compared to determine the best method for classifying visitor sentiment.
The results of this study indicate that the CNN model has the highest accuracy of 72 percent, outperforming the RNN and LSTM The CNN model can be used as a primary reference in applying sentiment analysis to similar topics.
Keyword: Bogor.
Deep Learning.
Ecotourism.
Scraping.
Sentiment Analysis Abstrak Bogor memiliki destinasi ekowisata unggulan di Indonesia yang menawarkan keasrian alam dan kemudahan akses dari Jakarta.
Namun, peningkatan jumlah wisatawan menimbulkan hambatan terhadap pengelolaan lingkungan, seperti pengelolaan sampah dan tekanan terhadap sumber daya alam.
Media sosial, khususnya Google Maps, berperan penting dalam promosi dan memahami perilaku wisatawan melalui fitur ulasan.
Studi ini bertujuan melakukan analisis sentimen mengenai ulasan ekowisata di Bogor yang diambil dari Google Maps, menggunakan metode Deep Learning berbasis neural network, yaitu Convolutional Neural Network (CNN).
Recurrent Neural Network (RNN), dan Long Short-Term Memory (LSTM), dan membandingkan performa ketiga model tersebut untuk menentukan metode terbaik dalam mengklasifikasikan sentimen pengunjung.
Hasil studi ini menunjukkan, model CNN memiliki akurasi tertinggi yaitu sebesar 72 persen dan lebih unggul dibanding model RNN dan LSTM.
Model CNN dapat digunakan sebagai acuan utama dalam menerapkan analisis sentimen pada topik yang sejenis.
Kata Kunci: Bogor.
Deep Learning.
Ekowisata.
Scraping.
Sentimen
PENDAHULUAN
Bogor merupakan salah satu destinasi wisata yang populer di Indonesia.
Bogor juga dikenal karena sumber daya alamnya yang melimpah, serta kemudahan aksesibilitas dari Jakarta yang menjadikan Bogor sebagai destinasi ekowisata unggulan bagi masyarakat yang mencari keasrian lingkungan alam.
The Internasional Ecotourism Society (TIES) menyatakan, ekowisata sebagai bentuk perjalanan yang bertanggung jawab ke daerah-daerah alami dengan tujuan menjaga kelestarian lingkungan, meningkatkan kesejahteraan sosial ekonomi masyarakat lokal, serta memahami kegiatan dan edukasi bagi semua pihak yang terlibat .
Ekowisata menjadi strategi efektif dalam mengatasi pengabaian lahan melalui pengembangan aktivitas ekonomi yang berkelanjutan dengan tujuan tidak hanya melindungi kelestarian lingkungan, namun juga memperkuat sinergi antara konservasi alam dan pemberdayaan masyarakat .
Kawasan konservasi di DOI: https://doi.
org/10.
57152/malcom.
MALCOM-05.
: 1133-1142
Bogor seperti Taman Nasional Gunung Halimun Salak (TNGHS).
Kebun Raya Bogor, serta destinasi ekowisata alam seperti Curug.
Gunung Mas, dan beberapa ekowisata lain, menarik ribuan wisatawan setiap .
mencatat kunjungan wisata alam ke kawasan konservasi di Indonesia termasuk Bogor, meningkat signifikan, di mana wilayah konservasi TNGHS mengalami peningkatan kunjungan sebesar 15 persen pada tahun 2020 hingga 2022.
Wilayah konservasi TNGHS memiliki daya tarik yang meningkat dan menempati urutan ke-4 dari 41 wisata alam terbaik di Bogor .
Adapun.
Kebun Raya Bogor memiliki lima fungsi yaitu konservasi ex situ tumbuhan langka, ekowisata, riset biodiversitas, pendidikan lingkungan, serta jasa lingkungan .
Pengembangan ekowisata di Bogor memberikan kontribusi signifikan terhadap peningkatan kesejahteraan ekonomi dan sosial masyarakat melalui berbagai peluang kerja, seperti pemandu wisata, pengelola homestay, serta pelaku usaha produk lokal.
Selain itu, ekowisata juga berperan penting dalam pelestarian lingkungan dengan menerapkan prinsip keberlanjutan, edukasi kepada wisatawan, dan pelibatan aktif masyarakat dalam menjaga kelestarian ekosistem.
Namun, seiring bertambahnya jumlah wisatawan, akan muncul tantangan dalam pengelolaan sampah serta tekanan sumber daya alam.
Kurangnya pengelolaan sampah yang efektif di destinasi ekowisata seperti Umbul Brondong, berpotensi menurunkan kualitas pengalaman pengunjung sekaligus mengancam keberlanjutan lingkungan di kawasan tersebut .
Oleh sebab itu, pengelolaan berkelanjutan menjadi kunci dalam memaksimalkan manfaat ekonomi dengan meminimalkan dampak negatif aspek sosial dan lingkungan.
Peran media sosial seperti Instagram.
TikTok, hingga Google Maps, sangat penting dalam membentuk persepsi dan mempromosikan ekowisata.
Dalam kurun waktu beberapa tahun terakhir, media sosial telah mendominasi sebagai sumber informasi terkait wisatawan yang terdokumentasi dan signifikan .
Salah satu aplikasi yang menyediakan fitur dokumentasi para wisatawan ialah Google Maps.
Media ini secara khusus berperan penting dalam pengembangan ekowisata, khususnya dalam hal ini di Bogor, tidak hanya sebagai alat navigasi namun juga menyediakan fitur ulasan berupa teks, foto, dan video.
Google Maps memiliki fitur ulasan yang sangat berguna dalam melakukan analisis sentimen, di mana ulasan tersebut digunakan untuk melihat dan menerjemahkan opini pengunjung suatu objek wisata .
Hal ini menegaskan bahwa media sosial termasuk platform berbasis lokasi seperti Google Maps yang menyediakan ulasan dan informasi dari pengguna, tidak hanya berperan dalam mempromosikan destinasi wisata, tetapi juga penting dalam membentuk kesadaran dan perilaku wisatawan yang bertanggung jawab guna mendukung ekowisata Analisis sentimen terhadap persepsi wisatawan diperlukan untuk memahami pandangan mereka terhadap ekowisata di Bogor, mencakup aspek positif seperti keindahan alam dan fasilitas, serta negatif seperti kerusakan lingkungan dan overcrowding.
Analisis sentimen terhadap ekowisata di China, mengungkap adanya persepsi positif terhadap ekowisata, sehingga analisis ini mendukung manajemen ekowisata yang berkelanjutan dibidang pariwisata .
Namun, analisis sentimen terhadap kunjungan ke beberapa klaster ekowisata di Malaysia menunjukkan bahwa meski wisatawan umumnya puas dengan alam, budaya, dan pelayanan, ada juga sentimen netral atau negatif menandakan perlunya peningkatan infrastruktur, layanan pengunjung, dan keterlibatan komunitas lokal untuk menjaga keberlanjutan dan kepuasan wisatawan .
Beberapa permasalahan seperti overcrowding di Curug atau kerusakan jalur pendakian di Gunung Salak yang sering muncul di media sosial, menunjukkan perlunya strategi lebih lanjut terkait pengelolaan pengunjung.
Oleh karena itu, analisis sentimen pada media sosial khususnya Google Maps, dapat menjadi alat strategis bagi pengelola ekowisata di Bogor untuk meningkatkan pengelolaan lingkungan dan menjaga kelestarian alam.
Analisis sentimen dari ulasan pengunjung menggunakan Deep Learning dan teknik optimasi, menghasilkan peningkatan akurasi model prediktif dalam ekowisata, sehingga memberikan wawasan yang berguna dalam meningkatkan kepuasan wisatawan .
Penerapan Deep Learning berbasis jaringan saraf (Neural Networ.
sangat efektif dalam rekomendasi destinasi ekowisata dengan mengurangi beban komputasi dan meningkatkan fokus pada informasi penting, sehingga meningkatkan akurasi secara optimal .
Metode Deep Learning yang paling banyak digunakan dalam analisis sentimen adalah berbasis Neural Network seperti Deep Neural Network (DNN) dan Convolutional Neural Network (CNN), namun penerapan teknik CNN.
Recurrent Neural Network (RNN), dan Long Short-Term Memory (LSTM) hanya diuji secara terpisah pada berbagai dataset dan belum didapati studi yang melakukan perbandingan komprehensif antar metode .
Sehingga, peneliti tertarik untuk mendalami analisis sentimen masyarakat terkait ekowisata di Bogor menggunakan Deep Learning.
Studi .
, menemukan bahwa penggunaan metode LSTM dalam analisis sentimen di Wuhan.
Tiongkok memberikan akurasi yang lebih baik jika dibandingkan dengan RNN konvensional.
Studi lain oleh .
, menunjukkan bahwa sentimen analisis pariwisata di Indonesia menggunakan beberapa metode seperti CNN.
CNN-LSTM, serta CNN-Gated Recurrent Unit (GRU), menghasilkan metode terbaik yaitu CNN dengan nilai akurasi yang tertinggi.
Studi lain oleh .
, menemukan bahwa analisis sentimen ulasan wisatawan pada lima pantai favorit di Bali menggunakan metode RNN, dapat mengklasifikasikan sentimen positif dan negatif dengan akurasi yang cukup tinggi dan dibuktikan melalu evaluasi confusion matrix.
Perbandingan Metode Deep Learning untuk Analisis Sentimen.
(Agustini et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Adapun studi .
, analisis sentimen ulasan tempat wisata di Yogyakarta menggunakan metode RNN dengan LSTM, mampu menghasilkan nilai akurasi yang tinggi.
Dari beberapa studi terdahulu, belum didapati studi yang membahas perbandingan antara metode Deep Learning berupa RNN.
CNN, dan LSTM secara komprehensif terutama pada ulasan masyarakat terkait ekowisata di Bogor.
Oleh karena itu, tujuan dilakukannya studi ini adalah mengetahui gambaran umum persepsi masyarakat terkait ekowisata di Bogor berdasarkan ulasan Google Maps menggunakan wordcloud, serta membandingkan metode RNN.
CNN, dan LSTM sehingga memperoleh metode terbaik.
Studi ini diharapkan dapat memberikan pemahaman yang lebih baik mengenai persepsi masyarakat terhadap ekowisata di Bogor dan menentukan metode Deep Learning (RNN.
CNN, atau LSTM) yang paling efektif untuk analisis sentimen, sehingga dapat membantu pengambilan keputusan dan pengembangan strategi ekowisata yang lebih baik.
METODE PENELITIAN
Studi ini menggunakan data hasil scraping ulasan beberapa tempat ekowisata di Bogor oleh warganet pada Google Maps.
Perangkat lunak yang digunakan untuk melakukan scraping serta pengolahan data ialah Google Colab dengan bahasa pemrograman Python.
Gambar 1 merupakan diagram alur mengenai urutan metode dari studi ini.
Gambar 1.
Diagram Alur Metode Studi Pengumpulan Data dengan Scraping Dataset yang digunakan dalam studi ini merupakan dataset ulasan Google Maps beberapa ekowisata di Bogor.
Metode pengumpulan dataset tersebut menggunakan scraping.
Scraping merupakan teknik untuk ekstraksi data secara otomatis dari suatu website dengan mensimulasikan interaksi pengguna dan mengurai konten yang dihasilkan oleh HyperText Markup Language atau HTML .
Scraping pada Google Maps dapat mengumpulkan data secara sistematis misalnya informasi detil lokasi, informasi pengguna, serta rating dan ulasan pengguna.
Tahapan scraping pada studi ini diawali dengan meng-import library yang digunakan, antara lain `annotations`, `dataclass`, `asddict`, `field`, `pandas`, `playwright`, dan `argparse`.
Lalu, mendefinisikan kelas data untuk menyimpan data ulasan dengan atribut yang digunakan dalam studi ini, mencakup nomor id pengulas, nama pengulas, teks ulasan, rating, dan waktu.
Selanjutnya, dengan inisialisasi playwright akan membuka halaman Google Maps secara otomatis.
Dilanjutkan proses membuka lokasi ekowisata yang telah ditentukan dan secara otomatis mengambil data ulasan.
Pengambilan ulasan dilakukan berdasarkan indeks yang ditentukan menggunakan loop, serta Xpath untuk mengambil atribut yang telah didefinisikan pada kelas Langkah terakhir, yaitu menyimpan dataset dalam bentuk .
csv dan .
xlsx untuk kemudian dilakukan Preprocessing Tahapan prepocessing adalah proses awal dalam analisis sentimen yang ditujukan untuk membersihkan, menyederhanakan serta mempersiapkan teks agar sesuai dengan model analisis yang akan dilakukan .
Pada studi ini dilakukan beberapa tahapan preprosesing yang sesuai dengan model deep learning yaitu menghapus noise, mengganti singkatan, menghapus tanda baca, menghapus angka, lowercasing serta menghapus karakter non latin seperti emoji.
Beberapa proses preprocessing tidak dilakukan seperti stopword removal, stemming, dan lemmatization karena kurang cocok dengan model deep learning yang akan memahami konteks kalimat .
Labeling Dataset Labeling dataset dapat dilakukan dengan dua pendekatan utama, yaitu secara otomatis dan manual.
Pelabelan otomatis memberikan label secara cepat, namun terkadang kurang akurat dibandingkan pelabelan manual, sedangkan pelabelan manual melibatkan pemeriksaan dan penandaan setiap bagian data secara langsung oleh manusia sehingga memberikan fleksibilitas untuk menyempurnakan taksonomi pelabelan sesuai kebutuhan studi .
Pada studi ini, tahap labeling dilakukan secara manual, labeling pada dataset yang telah diperoleh dilakukan dengan memberikan label sentimen positif, netral, dan negatif.
Proses manual labeling ini bertujuan untuk memperoleh label yang akurat dan valid melalui penilaian langsung oleh MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1133-1142 MALCOM-05.
: 1133-1142
Tokenisasi dan Encode Label Tokenisasi merupakan proses memecah suatu kalimat menjadi token.
Token dapat terbentuk dari katakata yang tertulis dalam kalimat atau bentuk-bentuk berbeda dari kata-kata tersebut .
Tokenisasi pada studi ini diawali dengan import library `Tokenizer` untuk mengonversi teks menjadi urutan angka .
dan library `pad_sequence` untuk memastikan seluruh token memiliki length yang sama dengan menambahkan Selanjutnya, dilakukan pemetaan hasil labeling manual ke dalam format numerik untuk memudahkan analisis data.
Parameter tokenisasi yang diterapkan dalam studi ini meliputi jumlah maksimum kata yang akan dipertimbangkan dalam tokenisasi sebesar 5000 kata serta panjang maksimum urutan token yang dihasilkan yaitu 100.
Selanjutnya mengonversi teks menjadi urutan angka dengan fungsi `sequence`, dimana setiap kata dalam teks akan diganti dengan indeks.
Terakhir, hasil tokenisasi disimpan sebagai variabel x, sementara nilai labeling disimpan ulang sebagai variabel y yang kemudian dimanfaatkan dalam tahapan training dan testing data.
Splitting Data Splitting atau pembagian data merupakan proses membagi kumpulan data menjadi dua bagian, yaitu data latih .
dan data uji .
Data training berfungsi untuk mengajarkan model klasifikasi, sementara data testing untuk mengukur seberapa baik kinerja pengklasifikasi.
Data yang digunakan untuk training dan testing merupakan data yang sudah dilakukan labeling pada tahap sebelumnya .
Dalam studi ini, jumlah data training dan testing memiliki perbandingan 80% : 20%.
Analisis Deskriptif dengan Wordcloud Wordcloud digunakan untuk melihat gambaran persepsi yang sering diutarakan oleh para wisatawan yang telah mengunjungi ekowisata di Bogor.
menjelaskan bahwa wordcloud merupakan metode text mining yang mampu menampilkan grafis berdasarkan frekuensi kata yang sering muncul.
Sejalan dengan .
yang menyatakan bahwa wordcloud memberikan representasi visual yang menarik dari data tekstual dengan tingkat kepentingan setiap kata yang ditunjukkan oleh ukuran font atau warna.
Artinya, analisis deskripsi dengan menggunakan wordcloud dapat mendapatkan insight atau informasi yang sering diungkapkan oleh wisatawan terkait ekowisata, sehingga dapat ditarik kesimpulan kondisi ekowisata.
Lebih jauh, analisis dengan wordcloud dapat memberikan saran untuk memperbaiki ekowisata dari persepsi yang Convolutional Neural Network (CNN) CNN adalah metode deep learning yang berbasis lapisan konvolusi .
onvolutional laye.
yang saling memiliki hubungan dalam pola tertentu untuk memproses suatu data .
Dalam konteks analisis sentimen.
CNN mampu menangkap pola sentimen lokal yang berulang tanpa perlu memahami urutan panjang keseluruhan teks.
CNN bekerja dengan mengekstraksi fitur penting dari urutan kata melalui lapisan konvolusi dan pooling, lalu mengklasifikasikan sentimen melalui lapisan penuh .
Reccurent Neural Network (RNN) RNN adalah salah satu metode deep learning yang digunakan untuk pengklasifikasian sentimen.
RNN
terdiri atas urutan jaringan yang identik dan terdapat dua jenis input dan output yaitu input dan output internal serta input dan output eksternal .
RNN mengolah kata yang sebelumnya telah ditokenisasi dari setiap teks menjadi vektor yang membentuk matriks.
Studi ini memilih RNN karena metode ini mampu mengolah data bersambung .
dan mampu menyimpan informasi dari data training yang dapat diterapkan untuk testing.
Hal ini menunjukkan bahwa metode RNN sangat sesuai untuk analisis sentimen.
Long Short-Term Memory (LSTM) LSTM adalah arsitektur jaringan saraf yang dikembangkan untuk mengatasi kelemahan Recurrent Neural Network (RNN) dalam menangani ketergantungan jangka panjang.
LSTM memiliki unit memori yang dilengkapi dengan tiga gerbang utama input gate, forget gate, dan output gate yang berfungsi mengatur aliran informasi yang disimpan, dilupakan, atau dikeluarkan.
Mekanisme ini memungkinkan LSTM untuk secara efisien mempertahankan informasi kontekstual penting dalam urutan kata, sehingga sangat efektif dalam memproses data teks yang bersifat sekuensial .
Evaluasi Model Klasifikasi Evaluasi diperlukan guna mengukur performa dari model-model klasifikasi yang telah dibuat.
Evaluasi performansi menggunakan confusion matrix dapat dilihat pada Tabel 1.
Mengacu studi .
evaluasi performansi didukung oleh beberapa pengukuran yaitu akurasi, presisi, recall, serta f-1 score.
Akurasi merupakan proporsi total prediksi yang benar, akurasi dikatakan tinggi jika model berhasil memprediksi sebagian besar data dengan benar.
Sementara presisi merupakan proporsi prediksi yang relevan di antara seluruh prediksi positif, presisi dikatakan tinggi jika model menghasilkan sedikit prediksi positif yang salah.
Perbandingan Metode Deep Learning untuk Analisis Sentimen.
(Agustini et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Selanjutnya, recall atau sensitivitas ialah proporsi prediksi positif yang relevan di antara seluruh kejadian positif sebenarnya, recall dikatakan tinggi jika model mampu menemukan Sebagian besar kasus positif.
Terakhir, f-1 score merupakan rata-rata harmonis antara presisi dan recall.
F-1 score berguna saat terjadi ketidakseimbangan antara kelas positif dan negatif.
Tabel 1.
Confusion Matrix
A/ P
Aktual Positive Aktual Neutral Aktual Negative Prediksi Positive True Positive (TP) False Positive (FP) False Positive (FP) Prediksi Neutral False Neutral (FN.
True Neutral (TN.
False Neutral (FN.
Prediksi Negative False Negative (FN) False Negative (FN) True Negative (TN) HASIL DAN PEMBAHASAN Hasil studi ini menjelaskan hasil scraping, labeling, serta preprocessing.
Selain itu, pada tahap ini dipaparkan juga hasil klasifikasi dengan tiga metode deep learning untuk analisis sentimen menggunakan RNN.
CNN, dan LSTM, beserta evaluasi dari ketiga model tersebut.
Scraping Dataset yang dihasilkan dari scraping pada Google Maps yaitu sebanyak 2121 data ulasan dengan 5 Atribut yang diambil yaitu nomor id pengulas, nama pengulas, tanggal, rating, dan ulasan.
Data diambil pada 8 tempat ekowisata di Bogor, antara lain Taman Nasional Gunung Gede Pangrango (Ciboda.
Taman Nasional Gunung Halimun Salak.
Agrowisata Gunung Mas Puncak.
Curug Nangka.
Kebun Raya Bogor.
Situ Gede.
Kampung Tematik Cibuluh, dan Kampung Tematik Katulampa.
Pada setiap tempat tersebut, ulasan yang diambil ialah 500 ulasan pertama dan diambil secara otomatis.
Ulasan pada setiap ekowisata tidak semuanya memiliki minimal 500 ulasan sehingga memengaruhi dataset yang dihasilkan.
Selain itu, saat dilakukan scraping, terjadi bug yang menyebabkan data tidak terambil seluruhnya.
Data yang tidak terambil seluruhnya saat melakukan scraping juga dapat diakibatkan konten web yang tidak stabil, dipersonalisasi, atau tidak diindeks .
Preprocessing Proses pertama dalam preprocessing adalah membuang komentar yang tidak sesuai dengan konteks sentimen pada tempat wisata.
Selain itu, kalimat yang terlalu pendek juga dihapus karena tidak terlalu memberikan dampak pada model sehingga peneliti hanya mengambil komentar dengan minimal 5 kata.
Sebanyak 2121 ulasan yang telah melalui preprocessing, tersisa 1724 ulasan yang siap dianalisis.
Perbandingan ulasan yang sudah dilakukan preprocessing dapat dilihat pada Tabel 2.
Tabel 2.
Hasil Preprocessing Sebelum preprocessing Asri banget.
Bogor luas banget sampai baru tau ada kampung/desa wisata yang seru buat dikunjungin.
Baru bisa berkunjung ke 2 spot wisatanya aja, next time mungkin bakal kesini lagi Tempat nya adem tapi sekarang sepi mungkin imbas dari naiknya harga tiket.
Waktu kunjungan.
Akhir pekanA.
Lainnya Masya Allah.
indahnya ciptaan Allah swt.
Jalurnya mudah, tidak terlalu jauh, banyak kolam kecil, sungai, camping ground, curungnya ada 3, dan banyak yang dijual oI A Setelah preprocessing asri banget bogor luas banget sampai baru tau ada kampung desa wisata yang seru buat dikunjungin baru bisa berkunjung ke spot wisatanya saja next time mungkin bakal kesini lagi tempat nya adem tapi sekarang sepi mungkin imbas dari naiknya harga tiket masya allah indahnya ciptaan allah swt jalurnya mudah tidak terlalu jauh banyak kolam kecil sungai camping ground curungnya ada dan banyak yang Labeling dan Splitting Dataset yang telah dilakukan preprocessing kemudian dilakukan labeling.
Label AusentimenAy dilakukan secara manual oleh peneliti yang juga dilakukan replace value pada proses analisis, yaitu sentimen negatif = 0, sentimen netral = 1, serta sentimen positif = 2.
Sementara itu, splitting data menghasilkan sebanyak 1379 data training dan 345 data testing.
Dari sebanyak 1724 ulasan, didapatkan hasil labeling pada Tabel 4 dan splitting pada Tabel 3.
Tabel 3.
Hasil Splitting Data Jenis Splitting Training Testing Total Negatif MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1133-1142 Netral Positif Total MALCOM-05.
: 1133-1142
Tabel 4.
Hasil Labeling Sentimen Review tempat yang cocok banget untuk wisata keluarga selain tempat makan disini kita juga bisa mancing ikan seru deh pokoknya tempat ter worth itu cukup bayar ke udah bisa kesini tempatnya enak buat santai apalagi yang suka dengan alam kalau cuaca cerah bisa banget duduk sambil liatin keindahan gunung pangrango dari dekat dan hamparan kebun teh fasilitas lengkap seperti toilet dan musholla banyak tempat bermain seperti berkuda flying fox sewa trail atau atv dan masih banyak lagi tiket masuk mahal kebanyakan retribusi jalan nya terlalu jauh dari parkiran tidak worth itu untuk yang bawa anak masih digendong dan lansia naik ojol di berhenti in sama ojek pangkalan harus pindah ke opang naik bayar lagi jadi males coba pengelola curug nangka kasih kenyamanan pengunjung itukan jalan umum naik ojol tidak boleh lewat jadi kapok ke curug nangka enak buat mancing bersama keluarga dimasak langsung atau pesan makanan lain namun pastikan saat pesan menu bandingkan dengan tagihan kami pesan ikan peda porsi ditagihnya porsi ikan bawal hasil pancingan dihargai ribu nya mungkin termasuk harga tambahan untuk menggoreng ikan hasil pancingan pastikan lagi saja harga ikannya berapa bapak dan ibu owner nya ramah dan bersahabat tapi belum tentu mereka secara langsung pantau pekerja yang masak dan kasirnya cek lagi saja tagihan dengan teliti tempat untuk istirahat sejenak bagi pemotor yang menuju puncak jalur alternatif gadog ada masjid yang pom mini pertamax pedagang jajanan tempatnya tidak pernah sepi tepat di bawah bendungan Sentimen Positif Positif Negatif Negatif Netral Netral Gambaran Umum Sentimen Masyarakat Sentimen masyarakat terkait ecotourism di Bogor dapat dibagi menjadi sentimen positif, negatif dan Gambaran umum dari ketiga jenis sentimen dapat dilihat melalui wordcloud seperti pada Gambar 2.
Gambar 2.
Sentimen Masyarakat Terhadap Ecotourism .
Positif, .
Negatif, .
Netral Worldcloud digunakan untuk melihat opini apa saja yang sering diutarakan oleh wisatawan .
, khususnya dalam hal ini ialah wisatawan yang berkunjung ke ekowisata di Bogor.
wordcloud sentimen positif, terlihat kata-kata seperti AubagusAy.
AusejukAy, dan AuindahAy mendominasi, yang menunjukkan bahwa wisatawan secara umum memberikan penilaian yang sangat baik terhadap suasana dan kondisi tempat wisata yang dikunjungi.
Selain itu, kata AucocokAy.
AukeluargaAy, dan AuluasAy mengindikasikan bahwa tempat wisata tersebut dinilai ramah bagi keluarga dan memiliki ruang yang memadai untuk aktivitas bersama.
Kehadiran kata Auair terjunAy.
Aukebun rayaAy, dan AupemandanganAy memperkuat bahwa daya tarik alam dan keindahan visual menjadi faktor penting dalam ulasan positif.
Sementara itu, kata seperti AubersihAy.
AunyamanAy, dan AutoiletAy menandakan bahwa fasilitas umum turut menjadi aspek yang diapresiasi oleh pengunjung.
Secara keseluruhan.
WordCloud ini merepresentasikan bahwa sentimen positif banyak dipengaruhi oleh kombinasi antara keindahan alam, kenyamanan, serta kesesuaian tempat untuk berwisata bersama keluarga.
Pada wordcloud sentimen negatif, tampak jelas dominasi kata-kata seperti AubayarAy.
AuribuAy.
AumahalAy.
AumasukAy, dan AutiketAy, yang mengindikasikan bahwa biaya atau harga yang dikenakan untuk mengakses tempat wisata menjadi keluhan utama pengunjung.
Kehadiran kata AuorangAy.
AupengunjungAy, dan Perbandingan Metode Deep Learning untuk Analisis Sentimen.
(Agustini et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Aumotor/mobilAy juga menunjukkan adanya keluhan terkait keramaian, parkir, atau antrean kendaraan.
Selain itu, munculnya kata AusampahAy menandakan bahwa masalah kebersihan dan pengelolaan lingkungan masih menjadi perhatian negatif, yang bisa menurunkan kenyamanan wisatawan.
Kata-kata seperti AucurugAy.
AujalanAy, dan AutoiletAy juga cukup menonjol, yang dapat diartikan bahwa wisata alam dan fasilitas dasar seperti akses dan sanitasi masih dianggap kurang memadai oleh beberapa pengunjung.
Secara umum, wordcloud ini merefleksikan bahwa ketidakpuasan pengunjung banyak berkaitan dengan biaya, kebersihan, dan fasilitas umum di lokasi wisata.
Pada wordcloud sentimen netral, kata-kata yang paling dominan seperti AuorangAy.
AucurugAy.
AujalanAy.
AumasukAy, dan AuandaAy menunjukkan bahwa ulasan dalam kategori ini lebih bersifat deskriptif dan informatif, bukan menonjolkan ekspresi emosional.
Kehadiran kata AucukupAy.
AulebihAy, dan AumasihAy mengindikasikan bahwa pengguna menyampaikan penilaian yang bernuansa tengah atau tidak terlalu ekstrem, baik positif maupun negatif.
Selain itu, munculnya kata-kata seperti AumobilAy.
AumotorAy.
AujamAy, dan AutiketAy memperkuat bahwa konten ulasan netral cenderung membahas hal-hal teknis seperti akses, durasi, dan fasilitas tanpa menunjukkan kepuasan atau ketidakpuasan secara eksplisit.
Temuan pada wordcloud sentimen positif, negatif, dan netral dalam studi ini menunjukkan konsistensi dengan berbagai studi sebelumnya yang mengangkat analisis ulasan wisatawan berbasis teks.
Kemunculan kata seperti AubagusAy.
AusejukAy, dan AuindahAy dalam ulasan positif mengindikasikan bahwa wisatawan cenderung menilai secara baik destinasi yang menawarkan pengalaman visual dan suasana nyaman, sejalan dengan temuan .
, yang menyebut bahwa keindahan alam dan atmosfer destinasi merupakan faktor utama pembentuk kepuasan wisatawan.
Sementara itu, keluhan terkait harga tiket, kemacetan, dan fasilitas dasar seperti toilet yang dominan dalam sentimen negatif juga mengonfirmasi hasil studi .
, yang menunjukkan bahwa isu harga, aksesibilitas, dan kebersihan merupakan aspek yang paling sering memicu ketidakpuasan.
Ulasan netral yang cenderung berisi deskripsi teknis juga sejalan dengan temuan .
, yang menemukan bahwa ulasan dalam kategori netral umumnya menggunakan nada faktual dan bersifat informatif, dengan muatan emosi yang rendah.
Pemodelan Deep Learning Pemodelan deep learning menggunakan tiga model yaitu CNN.
RNN dan LSTM dapat dilihat berdasarkan confusion matrix guna melihat perbandingan prediksi model dengan data yang sebenarnya.
Hasil pemodelan dari ketiga metode dapat dilihat pada Gambar 3.
Gambar 3.
Confusion Matrix dari Model .
CNN, .
LSTM, .
RNN Berdasarkan Gambar 3 yang menunjukkan confusion matrix dari tiga model klasifikasi sentimen, yaitu CNN .
LSTM .
, dan RNN .
, dapat disimpulkan bahwa model CNN memiliki performa terbaik dalam mengklasifikasikan sentimen positif dengan benar, yaitu sebanyak 196 prediksi benar, serta jumlah MALCOM - Vol.
5 Iss.
3 July 2025, pp: 1133-1142 MALCOM-05.
: 1133-1142
kesalahan klasifikasi yang relatif rendah dibanding dua model lainnya.
Model LSTM menunjukkan kinerja yang lebih seimbang antar kelas, tetapi masih menghasilkan cukup banyak kesalahan dalam memprediksi kelas positif .
anya 136 bena.
dengan banyak prediksi salah pada kelas negatif .
Sementara itu, model RNN memiliki akurasi terendah karena banyak prediksi salah terutama pada kelas negatif .
anya 18 benar dan 45 salah diklasifikasikan sebagai positi.
, serta menunjukkan kecenderungan yang kuat untuk mengklasifikasikan sebagian besar data sebagai positif.
Secara umum, model CNN menunjukkan ketepatan klasifikasi tertinggi dan distribusi prediksi yang paling mendekati label sebenarnya dibandingkan LSTM dan RNN.
Hasil studi ini sejalan dengan studi .
bahwa CNN sangat efektif untuk analisis sentimen, terutama dalam teks pendek, karena kemampuannya untuk fokus pada kata-kata tertentu.
Evaluasi Model Setiap model klasifikasi dilakukan tahap evaluasi untuk mendapatkan nilai performansi model.
Hasil evaluasi model pada studi ini, disajikan dalam Tabel 5.
Tabel 3.
Evaluasi Model Klasifikasi Deep Learning Jenis Model
RNN
CNN
LSTM
Sentimen
Negatif
Netral
Positif
Negatif
Netral
Positif
Negatif
Netral
Positif
Akurasi
0,68
0,72
0,54
Presisi
0,36
0,13
0,76
0,50
0,21
0,94
0,35
0,14
0,86
Recall 0,22 0,06 0,89 0,86 0,25 0,74 0,62 0,31 0,55 F-1 score
0,27
0,06
0,89
0,64
0,23
0,83
0,45
0,19
0,67
Hasil evaluasi ketiga model deep learning yang telah digunakan, terlihat bahwa hasil yang paling unggul ialah pada model CNN.
Model ini memiliki nilai akurasi, presisi, recall, serta F-1 score tertinggi di antara kedua model lainnya.
Akurasi model CNN secara umum 72% sudah menunjukkan bahwa model CNN cukup baik, tetapi masih dapat ditingkatkan.
Pada sentimen negatif model CNN memiliki recall yang tinggi, tetapi presisi rendah, artinya masih banyak prediksi negatif yang salah sehingga perlu diperbaiki.
Hal ini juga ditunjang oleh nilai f-1 score sebesar 64% yang artinya kinerja CNN pada sentimen negatif sudah cukup Sementara itu, pada sentimen netral terlihat nilai recall sekaligus presisi rendah, artinya model masih kurang baik.
Nilai f-1 score yang dihasilkan hanya 23% artinya kinerja CNN pada sentimen netral masih Hal ini terjadi karena jumlah data pada sentimen netral sedikit sehingga kurang representatif.
Selain itu, ulasan dalam sentimen netral cenderung bersifat deskriptif dan tidak memuat kata-kata dengan muatan emosional yang jelas, sehingga sering kali memiliki kemiripan kosakata dengan sentimen positif maupun Kondisi ini menyebabkan ruang fitur antar kelas menjadi tumpang tindih .
Contoh dari sentimen netral dalam penelitian ini adalah Aukalau mau parkir agak susah udah mulai banyak sampah juga tempat sampahnya juga ga ada tapi penjual makanan disini lumayan enak dan murah juga, cocok buat mampir sebentar sambil istirahatAy.
Kalimat tersebut memuat campuran opini positif dan negatif yang saling mengimbangi, tanpa dominasi emosi ke satu arah sehingga model kesulitan dalam membedakan kelas netral secara konsisten.
Pada sentimen positif memiliki nilai presisi yang tinggi menunjukkan prediksi yang akurat.
Nilai ini diperkuat f-1 score sebesar 83% yang artinya memang model CNN sangat akurat dalam mengenali sentimen positif.
Hasil studi ini sejalan dengan studi .
yang menunjukkan bahwa model CNN memiliki akurasi paling tinggi dan proses training yang cepat.
Karena performansi yang tinggi, model CNN lebih kompleks dalam perancangannya dan rentan kehilangan fitur urutan.
Keterbatasan Penelitian Penelitian ini mengidentifikasi variabel target secara manual melalui tiga anotator yang telah dilatih untuk memahami konsep sentimen positif, negatif, dan netral.
Meskipun pendekatan ini diharapkan dapat menghasilkan data yang relevan dengan konteks penelitian, metode manual memiliki keterbatasan yang Subjektivitas anotator menjadi kendala utama dalam proses penentuan variabel target, yang berpotensi memengaruhi validitas hasil.
Oleh karena itu, penelitian di masa depan disarankan untuk mengadopsi metode otomatis guna meningkatkan objektivitas dalam penentuan variabel target.
Selain itu, penetapan hyper-parameter dalam penelitian ini masih mengandalkan nilai default dari paket perangkat lunak yang digunakan.
Skenario eksploratif, pendekatan sederhana dengan parameter default sudah memadai untuk menghasilkan insights yang valid .
Namun, kondisi ini menyiratkan bahwa model yang dihasilkan mungkin belum optimal.
Ketiadaan proses hyper-parameter tuning dalam upaya menemukan model terbaik membuka peluang bagi penelitian selanjutnya untuk mengoptimalkan kinerja model dan mencapai hasil yang lebih akurat.
Perbandingan Metode Deep Learning untuk Analisis Sentimen.
(Agustini et al, 2.
ISSN(P): 2797-2313 | ISSN(E): 2775-8575
KESIMPULAN
Berdasarkan hasil pengujian yang dilakukan pada 2121 ulasan warganet di beberapa ekowisata yang diambil dari Google Maps menggunakan scraping, ditemukan bahwa terdapat 1724 ulasan yang layak diuji.
Ulasan tersebut divisualisasikan secara deskriptif dalam bentuk wordcloud.
Berdasarkan temuan analisis wordcloud tersebut, dapat disimpulkan bahwa ulasan wisatawan pada ekowisata di Bogor pada sentimen positif didominasi oleh aspek keindahan alam dan kenyamanan suasana, sentimen negatif dipicu oleh masalah harga, aksesibilitas, dan kebersihan fasilitas, sedangkan sentimen netral umumnya berisi informasi faktual dengan minim muatan emosional.
Hal ini menegaskan bahwa kualitas pengalaman visual, kenyamanan lingkungan, serta perbaikan fasilitas dasar menjadi faktor kunci dalam membentuk persepsi dan kepuasan wisatawan.
Selanjutnya, berdasarkan hasil perbandingan model klasifikasi menunjukkan bahwa pemodelan dengan model CNN memiliki akurasi tertinggi yaitu sebesar 72%.
Adapun pada model tersebut juga menunjukkan hasil pengukuran evaluasi yang paling unggul dibandingkan model RNN dan LSTM.
Dengan demikian, model CNN dapat dijadikan sebagai acuan dalam menerapkan analisis sentimen pada topik serupa.
Namun.
Berdasarkan keterbatasan penelitian ini, dapat menjadi peluang bagi penelitian kedepan untuk memodifikasi arsitektur dari metode yang digunakan dan melakukan hyper-parameter tuning untuk memperoleh model yang lebih valid dan akurat.
Penerapan metode sentimen dengan Indobert bisa menjadi alternatif untuk memperoleh hasil sentimen yang lebih objektif dibandingkan dengan manual.
Untuk masyarakat dan pemerintah daerah, pengelolaan ekowisata di Bogor perlu diperbaiki khususnya pada penetapan harga tiket yang lebih terjangkau, serta pengelolaan keramaian dan fasilitas parkir dapat ditingkatkan agar wisatawan merasa nyaman.
Pelaksanaannya dapat melibatkan peran aktif dari masyarakat dalam edukasi dan pengelolaannya.
Kebersihan, pengelolaan sampah, disertai edukasi pengunjung untuk menjaga kelestarian alam dan kenyamanan wisata secara berkelanjutan perlu diperhatikan oleh dinas terkait.
REFERENSI