Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: E-ISSN 2460-9552 P-ISSN 2620-3227 Article history Received Jan 11, 2024 Accepted Dec 29, 2024 Published Dec 29, 2024 PENERAPAN ALGORITMA CONVOLUTIONAL NEURAL NETWORK DALAM ANALISIS SENTIMEN PENGARUH BRAND IMAGE DAN LABEL HARGA (STUDI ANALISIS: PRODUK SKINCARE SKINTIFIC) Ekarini Lathifah. Aditya Dwi Putro Wicaksono. Andreas Rony Wijaya. Teknik Informatika. Institut Teknologi Telkom Purwokerto 20102096@ittelkom-pwt. aditya@ittelkom-pwt. id, andreas@ittelkom-pwt. Abstract There are various kinds of products that are included in cosmetic products, namely personal care, make up, fragrance including perfume, hair care, and skincare. Skincare has become one of the primary needs for women in Indonesia today, because skincare can maintain healthy skin. Skincare is a beauty product that is used by users to clean dirt on the face. In deciding to choose skincare products, of course, consumers are influenced by various factors such as skincare quality, brand image, price, and others. In addition, reviews of skincare products are also important as an effort by cosmetic companies to attract consumers' buying interest. One method in deep learning to analyze is the Convolutional Neural Network (CNN). Sentiment analysis is carried out as an effort to evaluate and determine consumer satisfaction with skincare products as well as materials for service improvement. This study uses the CNN method which in this model has several stages such as data scraping, data preprocessing which consists of data cleansing & case folding, stemming, tokenizing, filtering . topword remova. , labeling process, modeling, and model evaluation. In this study, the data used is scraping data on the Tokopedia website about skincare skintific products. The data will be processed with the CNN model to obtain an accuracy value resulting from the performance of the model. Keywords: Analysis. Algorithm. Brand Image. CNN. Sentiment. Skincare. Abstrak Ada berbagai macam produk yang termasuk kedalam produk kosmetik yaitu personal care, make up, pewangi termasuk parfum, hair care, dan skincare. Skincare sudah menjadi salah satu kebutuhan primer bagi perempuan di Indonesia saat ini, karena dengan skincare dapat menjaga kesehatan kulit. Skincare merupakan produk kecantikan yang digunakan oleh penggunanya untuk membersihkan kotoran pada Dalam memutuskan memilih produk skincare, tentunya konsumen dipengaruhi oleh berbagai faktor seperti kualitas skincare, brand image, dan harga. Selain itu, review mengenai produk skincare juga penting sebagai upaya perusahaan kosmetik untuk menarik minat beli konsumen. Salah satu metode dalam deep learning untuk menganalisis adalah Convolutional Neural Network (CNN). Sentimen analisis dilakukan sebagai upaya dalam mengevaluasi dan mengetahui kepuasan konsumen terhadap produk skincare serta sebagai bahan peningkatan pelayanan. Penelitian ini menggunakan metode CNN dimana pada model ini memiliki beberapa tahapan seperti scraping data, preprocessing data yang teridiri dari data cleansing & case folding, stemming, tokenizing, filtering . topword remova. , proses labelling, modelling, dan evaluasi model. Pada penelitian ini data yang digunakan merupakan data hasil scraping pada website tokopedia tentang produk skincare skintific. Data tersebut akan diolah dengan model CNN untuk memperoleh nilai akurasi yang dihasilkan dari kinerja model tersebut. Kata Kunci: Analisis. Algoritma. Brand Image. CNN. Sentimen. Skincare. PENDAHULUAN Perusahaan kosmetik di Indonesia ada lebih dari 760 perusahaan, hal tersebut menunjukkan bahwa Indonesia merupakan pangsa besar bagi perusahaan kosmetik dalam memasarkan produknya . Hal tersebut juga dibuktikan dengan semakin bertumbuhnya pendapatan pasar perawatan kulit Indonesia yang mencapai US$ 1,991,7 juta pada tahun 2020 dan diperkirakan akan meningkat dalam dari 2020 hingga 2025 . Dalam memasarkan produknya, industri kecantikan memerlukan media sosial sebagai sarana dalam mempromosikannya untuk dapat memikat konsumen . Ada berbagai macam produk yang termasuk kedalam produk kosmetik yaitu produk perawatan pribadi, makeup, pewangi seperti parfum, hair care, dan skincare . Skincare menjadi salah satu kebutuhan primer bagi perempuan di Indonesia saat ini, karena dengan skincare dapat menjaga kesehatan kulit . Menurut Nilforoushzadeh dalam . skincare merupakan produk kecantikan yang digunakan oleh penggunanya untuk membersihkan kotoran pada wajah. Penggunaan skincare dapat membantu seseorang untuk merawat wajah mereka agar tidak muncul jerawat, kulit kering, kemerahan, dan lain-lain. Jenis produk skincare yang beredar di pasaran banyak macamnya, seperti scarllett, avoskin, wardah, white lab, skintific, dan sebagainya. Berdasarkan salah satu artikel online yang dimuat oleh compas. Skintific berhasil masuk ke top 7 brand pada ecommerce Tokopedia dan Shopee periode 1 Mei 2023 Ae 5 Mei 2023. Hal tersebut membuktikan bahwa produk skincare Skintific cukup diminati oleh konsumen. Selain itu, dalam artikel compas lainnya juga menyebutkan bahwa Skintific menjadi fenomenal dengan inovasi produk 5x Ceramide-nya. Hasilnya, banyak konsumen yang penasaran dan tergiur untuk mencobanya. Dalam keputusannya untuk membeli sebuah produk skincare, tentunya konsumen dipengaruhi oleh berbagai faktor seperti kualitas skincare, brand image, harga . Kuatnya brand image mampu membuat pelanggan yakin terhadap kualitas dari produk yang mereka beli dan tentunya akan memberikan informasi tersebut melalui review yang mereka tulis di internet . Selain brand image, harga juga menjadi salah satu faktor bagi konsumen untuk memutuskan membeli suatu produk. Pengaruh harga terhadap keputusan pembelian sangat penting, karena tingkat harga yang ditetapkan oleh perusahaan dapat menjadi tolak ukur permintaan suatu produk . Berdasarkan permasalahan tersebut, metode untuk mengatasi permasalahan yang ada yaitu dengan analisis sentimen. Analisis Sentimen dilakukan sebagai upaya dalam meningkatkan kepuasan konsumen terhadap produk skincare serta sebagai bahan evaluasi untuk meningkatkan pelayanan . Klasifikasi sentimen bertujuan untuk mengatasi masalah ini dengan secara otomatis dengan mengelompokkan review pengguna menjadi opini positif, netral, atau negatif . Oleh sebeb itu, diperlukan sebuah program agar dapat melakukan analisis secara otomatis, yaitu dengan menggunakan algoritma Convolutional Neural Network . Penggunaan algoritma ini karena algoritma CNN lebih mendominasi model secara luas dalam pengklasifikasian sebuah teks. Terdapat algoritma Convolutional Neural Network yang sangat populer yaitu algoritma CNN berbasis kata atau berbasis karakter, dimana keduanya menunjukkan hasil dari beberapa klasifikasi teks . Beberapa penelitian terkait penggunaan algoritma CNN untuk analisis juga telah dilakukan oleh beberpa peneliti seperti penelitian tentang review customer pengguna indihome dan first media pada data twitter dengan model CNN yang dilakukan oleh Saleh Hasan Badjrie dkk pada tahun 2021 menyebutkan bahwa hasil analisis pada review terhadap produk IndiHome dan FirstMedia dengan algoritma CNN mendapatkan nilai tertinggi pada akurasi 98% dan 91%, dimana hasil tersebut membuktikan bahwa algoritma ini bekerja dengan efektif . Penelitian lainnya dengan algoritma CNN untuk mengatuhi kebijakan vaksinasi pada masyarakat yang dilakukan oleh Fany Alifian Irawan dan Dwi Anindyani Rochmah pada tahun 2022 memperoleh hasil rata-rata dari akurasi yaitu 98,66%. Sedangkan nilai rata-rata untuk precision 33%, recall 98. 33% dan skor untuk f1score 98. Selain itu, evaluasi dengan K-Fold Cross Validation menambah keakuratan sentimen dengan perolehan nilai akurasi training terbaik yaitu 100% dan nilai akurasi testing terbaik yaitu 61% . Penelitian yang dilakukan oleh Sukma Nindi Listyarini dan Dimas Aryo Anggoro pada tahun 2021 untuk memperoleh hasil sentimen terhadap pilkada yang diadakan di Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: tengah pandemi covid-19 dengan algoritma CNN didapatkan hasil model terbaik yaitu 90% dengan 4-layer convolutional dan 100 epoch . Pada penelitian ini, peneliti bermaksud untuk menyusun Tugas Akhir dengan judul AuPenerapan Algoritma Convolutional Neural Network (CNN) Dalam Analisis Sentimen Pengaruh Brand Image Dan Label Harga (Studi Analisis: Produk Skincare Skintifi. Ay, dimana dalam penelitian ini bermaksud untuk memperoleh hasil analisis terhadap produk skincare skintific dengan faktor brand image dan label harga dengan mengimplementasikannya dengan menggunakan algoritma Convolutional Neural Network (CNN) guna memperoleh hasil akurasi terhadap review pengguna skincare skintific pada website Tokopedia. E-ISSN 2460-9552 P-ISSN 2620-3227 Sistem Operasi : Windows 11 Home Single Language Bahasa Pemrograman : Python Aplikasi : Google Colab Diagram Alir Penelitian Rancangan penelitian dalam Penyusunan Tugas akhir ini dapat dilihat pada diagram alir penelitian yang disajikan pada gambar 1. METODE PENELITIAN Metode yang digunakan dalam penelitian ini yaitu dengan algoritma Convolutional Neural Network (CNN). Rancangan penelitian dapat dilihat pada diagram alir penelitian yang disajikan pada gambar 2. Subjek dan Objek Penelitian Subjek Penelitian Subjek penelitian yang digunakan adalah data ulasan produk skincare skintific yang diperoleh dari website Tokopedia sebanyak 500 data. Objek Penelitian Objek penelitian yang digunakan adalah algoritma CNN yang digunakan untuk analisis sentimen pada produk skincare skintific. Alat dan Bahan Alat dan Bahan yang digunakan dalam penelitian ini diantaranya yaitu : Alat Alat yang digunakan dalam penelitian ini terdiri dari dua jenis yaitu perangkat keras . dan perangkat lunak . , adapun perincianya sebagai berikut : Perangkat Keras (Hardwar. Device : LAPTOP-DTMHT7M3 Processor : AMD Ryzen 5 with Radeon Graphics10 GHz RAM : 8GB Perangkat Lunak (Softwar. Gambar 1. Diagram Alir Penelitian Scraping Data Scraping data diperoleh dari review produk skintific pada website tokopedia. Hasil dari scraping tersebut nantinya disimpan ke dalam file Preprocessing Data Labelling Dataset tersebut kemudian dilakukan proses preprocessing untuk menangani noise yang ada pada data sehingga data yang dihasilkan menjadi Berikut flowchart pada preprocessing data pada gambar 2. Tahap selanjutnya yaitu proses labelling. Labelling dilakukan untuk memperoleh nilai sentimen dari review produk oleh konsumen terhadap produk skincare skintific. Prose labelling dapat dilihat pada gambar 3. Gambar 3. Flowchart Labelling Data Perancangan Model Model yang digunakan pada penelitian ini adalah model Algoritma Convolutional Neural Network. Gambar 2. Flowchart Preprocessing Data Case Folding Pada tahap ini, dilakukan proses mengubah kalimat menjadi huruf kecil pada semua data. Data Cleansing Pada proses ini, dilakukan pembersihan data yang dapat mengganggu hasil analisis seperti karakter berulang. URL, nama pengguna, tagar, simbol, angka, dan spasi tambahan, serta tanda Stemming Stemming merupakan proses menghilangkan afiks seperti prefiks, konfiks, dan sufiks untuk mengubah kata berimbuhan menjadi ke bentuk Tokenizing Tokenisasi merupakan proses pemecahan kalimat menjadi kata-kata sesuai dengan aturan Filtering (Stopword Remova. Prosedur yang dikenal sebagai Stopwords Removal digunakan untuk menghilangkan katakata yang tidak berarti apa-apa. Pelatihan dan Pengujian Model Pengujian model dilakukan dengan matriks konvolusi, seperti precision, recall, f1-score dan Pada confusion matrix terdapat 4 hasil pengukuran, yaitu : True Negative (TN): Merupakan jumlah data review produk skincare skintific yang diklasifikasikan negatif dan terdeteksi dengan benar. False Positive (FP): Merupakan jumlah data review produk skincare skintific yang diklasifikasikan negatif tetapi terdeteksi sebagai data klasifikasi positif. True Positive (TP): Merupakan jumlah data review produk skincare skintific yang diklasifikasikan salah terdeteksi False Negative (FN): Merupakan kebalikan dari True Positive. Akurasi : Menunjukkan hasil analisis data review yang diklasifikasi oleh model dengan . Recall : Menunjukkan banyaknya data review untuk label positif yang terklasifikasi secara benar diantara data yang diprediksi sebagai . Precision : Merupakan nilai rasio antara jumlah data review berlabel positif yang Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: E-ISSN 2460-9552 P-ISSN 2620-3227 terklasifikasi secara benar diantara semua data dengan label positif. F-1 Score : Nilai ini merupakan rata-rata dari precision dan recall HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan adalah data review produk skincare skintific di website Tokopedia melalui proses scraping dengan menggunakan tools Data Scraper. Tampilan tools Data Scraper dapat dilihat pada gambar 4. Gambar 5. Hasil Pengambilan Data Prepocessing Data Data yang telah di scraping masih merupakan data mentah. Oleh karena itu, tahap selanjutnya adalah dengan melakukan pembersihan data untuk mengurangi noise. Tahapan preprocessing ini menggunakan library pada Bahasa pemrograman Python. Beberapa library python yang digunakan antara lain : pandas, numpy, matplotlib, swifter, scikit-learn, seaborn. Berikut penjelasan untuk setiap tahapan preprocessing yang dilakukan: Casefolding Gambar 4. Pengumpulan data dengan tools data Sebelum menggunakan tools Data Scraper, langkah pertama yang dilakukan adalah dengan menginstall tools tersebut ke dalam Google Chrome. Setelah itu, tentukan data mana yang akan diambil untuk di scrape. Pada penelitian ini, data yang diambil adalah data nama dan review Selanjutnya, untuk melakukan scraping data dapat dimulai dengan mengklik tombol start Hasil Pengambilan Data Data dari hasil scraping kemudian disimpan dalam bentuk file csv yang berjumlah 500 data untuk mempermudah penyimpanan dan Pada pengumpulan data ini, data yang digunakan adalah nama reviewers dan ulasan pengguna. Berikut hasil pengambilan data yang dapat dilihat pada gambar 5. Casefolding preprocessing data untuk mengubah karakter pada data menjadi huruf kecil. Dilakukannya casefolding ini karena tidak semua kata dalam teks konsisten menggunakan huruf kapital. Maka dari itu, dilakukan proses penyamarataan huruf Source code proses casefolding dapat dilihat pada gambar 6. Gambar 6. Source code Casefolding Tabel 1. Hasil Casefolding Teks Tipe Kulit Normal. Tidak Iritasi Udah coba dengan adanya serum jadi lebih maksimal soon to be man cepat, sel. Casefolding tipe kulit normal, tidak dengan adanya serum jadi lebih maksimal soon to be man cepat, sel. Pada Tabel 1 dari teks hasil scraping lalu dilakukan casefolding terdapat perubahan, yaitu pada kalimat AoTidak Kulit NormalAo dan AoTidak Iritasi UdahAo yang semula pada awal kata menggunakan huruf kapital, setelah dilakukan case folding menjadi huruf kecil. Data Cleansing Setelah dilakukan casefolding, maka tahap selanjutnya adalah melakukan data cleansing. Tujuan dari data cleansing ini adalah untuk menghapus angka, simbol, karakter berulang, yang dapat menganggu hasil analisis. Source code proses cleansing dapat dilihat pada gambar Tabel 3. Hasil Tokenizing Data Cleansing tipe kulit normal tidak creamnya dan cocok adanya serum jadi hasilnya soon to be glowing pengiriman cepat sel Tokenizing . ipe, kulit, normal, tidak, iritasi, udah, coba, creamnya, dan, cocok, semoga, dengan, adanya, serum, jadi, hasilnya, soon, to, be, glowing, pengiriman, cepat, sel, ] Pada tabel 3 dari hasil data cleansing lalu dilakukan tokenizing, dimana pada tahap ini terdapat perubahan, yaitu yang semula teks tersebut menjadi satu kalimat maka pada tahap ini dilakukan pemisahan per kata. Stopword Removal Gambar 7. Source code data cleansing Tabel 2. Hasil Data Cleansing Casefolding tipe kulit normal, tidak iritasi udah coba dengan adanya serum jadi lebih maksimal soon to be man cepat, sel. Data Cleansing tipe kulit normal tidak creamnya dan cocok adanya serum jadi hasilnya soon to be glowing pengiriman cepat sel Tahapan stopword removal dilakukan untuk meghilangkan kata atau term yang tidak memiliki Tahapan ini bisa menggunakan stoplist yaitu dengan membuang kata yang tidak memiliki arti atau wordlist yaitu menyimpan kata penting. Daftar stoplist dibuat sebelum melakukan proses stopword removal. Apabila kata tersebut termasuk kedalam stoplist maka akan terhapus. Pada download('stopwords'). Source code tahapan stopword removal dapat dilihat pada gambar 9. Pada tabel 2 dari hasil casefolding lalu dilakukan data cleansing terdapat perubahan, yaitu yang semula terdapat tanda baca titik dan emoji maka pada tahap data cleansing dihilangkan. Tokenizing Tahapan setelah dilakukan data cleansing adalah tokenizing, yaitu memecah sebuah kalimat ke dalam kepingan-kepingan kata. Tujuan dilakukannya tokenizing adalah untuk memudahkan dalam memaknai setiap kata. Source code proses tokenizing dapat dilihat pada Gambar 9. Source Code Stopword Removal setelah tahap tokenizing Pada Gambar 9 hasil data masih dalam bentuk tokenizing yang berbentuk per kata akan tetapi sudah di lakukan stopword removal. Untuk mengubahnya agar tidak menjadi bentuk per kata, maka dilakukan proses seperti Gambar 10. Gambar 8. Source Code Tokenizing Gambar 10. Source Code stopword removal Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: E-ISSN 2460-9552 P-ISSN 2620-3227 Pelabelan Data Tabel 4. Hasil Stopword Removal Tokenizing . ipe, kulit, normal, tidak, iritasi, udah, coba, creamnya, dan, dengan, adanya, serum, jadi, lebih, maksimal, hasilnya, soon, to, be, glowing, pengiriman, cepat, sel,] Stopword Removal tipe kulit normal iritasi udah coba creamnya cocok semoga serum maksimal hasilnya soon pengiriman cepat sel Pelabelan data dilakukan dengan menghitung nilai polarity dari kalimat tersebut. Selanjutnya, apabila nilai polarity pada kalimat lebih dari 0. maka dikategorikan ke dalam sentimen positif, lalu jika polarity kalimatnya sama dengan 0. maka dikategorikan dalam sentmen netral, dan apabila nilai polarity kurang dari 0. 0 maka di kategorikan ke dalam sentimen negatif. Berikut source code untuk pelabelan data dapat dilihat pada gambar 12 dan 13. Pada tabel 4 dari hasil tokenizing lalu dilakukan stopword removal terdapat perubahan, yaitu terdapat penghilangan kata AodanAo. AodenganAo. AoadanyaAo. AoAojadiAo. AolebihAo. Stemming Tahapan yang terakhir yaitu stemming. Tahap ini bertujuan untuk mencari kata dasar dari setiap kata hasil filtering sebelumnya. Tahapan ini dilakukan dengan proses pengembalian berbagai bentukan kata menjadi bentukan kata dasar dengan menghilangkan imbuhan baik awalan dan Proses ini dilakukan dengan mengimport StemmerFactory dari library Sastrawi. Source code proses stemming dapat dilihat pada gambar 11. Gambar 12. Source Code Polarity Selanjutnya, dari hasil label tersebut, dilakukan encoding, yaitu proses perubahan data menjadi Gambar 13. Source Code Encoding Gambar 11. Source Code Stemming Tabel 5. Hasil Stopword Removal Stopword Removal tipe kulit normal iritasi udah coba creamnya cocok semoga serum soon to be glowing pengiriman cepat sel Stemming tipe kulit normal iritasi udah coba creamnya cocok moga serum maksimal hasil soon to be glowing kirim cepat Pada tabel 5 dari hasil stopword removal lalu dilakukan stemming terdapat perubahan, yaitu terdapat kata dasar dari kata AosemogaAo menjadi AomogaAo, kata AohasilnyaAo, menjadi AohasilAo, dan kata AopengirimanAo menjadi AokirimAo. Tabel 6. Hasil labelling sebelum encoding Clean Text Polarity Label cobain pakai yg 5x ceramide Netral lg jerawat jd cobain yg panthenol moga cocok sesuai foto packing aman Netral blm coba kirim extra sabar terima kasih langsung ngefek jerawat Positif kaget haha top banget kering kulit dry sensitif 06667 Negatif fast respon kirim cpt brg yg Positif kirim bnr blm coba ya smg cocok kulit muka sy barang kualitas harga promo Positif kemas moga serum cocok wajah bruntusan thanks tekstur ringan bebas white Positif cast respon jual top packaging aman proses pesan cepat cepat resap Tabel 7. Hasil labelling setelah encoding Clean Text Polarity Label cobain pakai yg 5x ceramide lg jerawat jd cobain yg panthenol moga cocok sesuai foto packing aman blm coba kirim extra sabar terima kasih langsung ngefek jerawat kaget haha top banget kering kulit dry sensitif fast respon kirim cpt brg yg kirim bnr blm coba ya smg cocok kulit muka sy barang kualitas harga promo kemas moga serum cocok wajah bruntusan thanks seller tekstur ringan bebas white cast respon jual top packaging aman proses pesan cepat cepat resap Berdasarkan gambar 15 jumlah klasifikasi sentimen tersebut untuk masing Ae masing kelas yaitu 2 data untuk sentiment negatif, 441 untuk sentiment netral, dan 57 data untuk sentiment Perancangan Arsitektur CNN Sebelum melakukan dilakukan tahapan : OverSampling Proses oversampling dilakukan agar tidak terjadi data yang tidak seimbang, jumlah kelas data . yang satu lebih sedikit atau lebih banyak disbanding dengan jumlah kelas yang Gambar 16. Data sebelum oversampling Visualisasi Kata Gambar 17. Data setelah oversampling Gambar 14. Hasil Visualisasi data semua kelas Dari gambar 16 dan 17 terdapat perbedaan data sebelum dan setelah oversampling. Sebelum oversampling data pada masing-masing kelas tidak beraturan. Namun, setelah dilakukan oversampling data pada kelas 1 menjadi 352. Sedangkan untuk data pada kelas 2 menjadi 704. Data-data yang dihasilkan setelah adanya oversampling terbentuk untuk menyeimbangkan kelas minoritas, kemudian di-fit dan diterapkan pada dataset. Sehingga nantinya kelas minoritas memiliki jumlah yang sama dengan kelas Modelling Sebelum ke tahap modelling, dilakukan splitting dataset dengan test_size yaitu 0. artinya data yang digunakan sebagai data testing adalah 20% dari keseluruhan dataset yang ada dengan random state 42. Berikut disajikan experimen modelling yang dapat dilihat pada Gambar 15 Grafik jumlah label tiap kelas Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: E-ISSN 2460-9552 P-ISSN 2620-3227 Tabel 8. Experimen Modelling Learning rate Susunan layer Epoch Embedding () Conv1D. ,3,tan. Dropout. GlobalMaxPooling1D Dense . , softma. Embedding () Conv1D. ,3,tan. Dropout. GlobalMaxPooling1D Dense . , softma. Embedding () Conv1D. ,3,tan. Dropout. GlobalMaxPooling1D Dense . , softma. Hasil dari experimen model dapat disimpulkan bahwa pengaruh perbedaan adanya validation split juga mempengaruhi hasil akurasi. Pada tabel, untuk model 1 dan 2 dengan validation split 2 pada model 1 menghasilkan nilai akurasi 0. %), sedangkan pada model 2 dengan nilai validation split 0. 5 menghasilkan nilai akurasi 89 . %). Selanjutnya, untuk model 3 dengan perbedaan dropout dengan model 1 tidak terlalu mempengaruhi nilai akurasi. Hal tersebut dibuktikan dengan hasil nilai akurasi yang mencapai 94% tidak berbeda jauh dengan nilai akurasi yang dihasilkan oleh model 1, yaitu 97%. Dengan kata lain, nilai akurasi untuk model 1 dan 3 dengan perbedaan dropout masih diatas 90%. Berikut ditampilkan hasil visualisasi akurasi untuk tiap model. Akurasi Validation Split Gambar 19. Gambar accuracy dan loss visualization Pada gambar 19 grafik loss function tidak dapat mendeteksi model dengan baik, hal itu karena grafik menampikan garis datar atau nilai noise yang cukup tinggi. Jadi, bisa dikatakan model mengalami underfitting. Kemudian, untuk grafik accuracy antara train accuracy dan validation accuracy juga menunjukkan model yang belum Gambar 18. Gambar accuracy dan loss visualization Pada gambar 18 grafik loss function rendah ditandai dengan gambar grafik menurun Hal tersebut berarti kinerja model bekerja dengan baik. Kemudian, untuk grafik accuracy antara train accuracy dan validation accuracy juga menunjukkan kinerja model sudah Gambar 20. Gambar accuracy dan loss visualization Pada gambar 20 grafik loss function tidak dapat mendeteksi model dengan baik, karena model mengalami underfitting. Kemudian, untuk grafik accuracy antara train accuracy dan validation accuracy model menunjukkan sudah bekerja secara optimal. Confusion Matrix Berikut confusion matrix pada model 1 dapat dilihat pada gambar 21. Classification Report Tabel 9. Hasil Classification Report Model 1 Precision Gambar 21. Confusion Matrix model 1 Berdasarkan gambar 21 menunjukkan bahwa model mengklasifikasikan secara benar sebanyak 0 data sebagai negatif, 88 data sebagai positif, dan 9 data sebagai netral. Recall Accuracy (%) F1score Berdasarkan tabel 9 dapat disimpulkan bahwa hasil review produk skincare skintific didapatkan hasil precision, recall, dan f1-score untuk kelas kelas 0 atau negatif yaitu 0%. Sedangkan untuk nilai precision kelas 1 . dan kelas 2 . 98 dan 1. Artinya model dalam meprediksi semua ulasan produk skincare skintific yang diklasifikasikan kedalam kelas netral dan positif, 98% dan 100% nya benar diklasifikasikan ke dalam kelas tersebut. Untuk nilai recall kelas 1 . dan kelas 2 . 99 dan 0. Artinya model mampu mengklasifikasikan 99% dan 82% dari seluruh ulasan produk skincare skintific dengan Lalu, untuk nilai f1-score pada kelas netral yaitu 98% dan untuk kelas positif yaitu 90%, kedua kelas tersebut nilainya mendekati 1 berarti bahwa semua prediksi benar. Gambar 22. confusion matrix model 2 Berdasarkan gambar 22 menunjukkan bahwa model mengklasifikasikan secara benar sebanyak 0 data sebagai negatif, 88 data sebagai positif, dan 1 data sebagai netral. Gambar 23. confusion matrix model 3 Berdasarkan gambar 23 menunjukkan bahwa model mengklasifikasikan secara benar sebanyak 0 data sebagai negatif, 87 data sebagai positif, dan 7 data sebagai netral. Tabel 10. Hasil Classification Report Model 2 Precision Recall Accuracy (%) F1score Berdasarkan tabel 10 dapat disimpulkan bahwa hasil review produk skincare skintific didapatkan hasil precision, recall, dan f1-score untuk kelas kelas 0 atau negatif yaitu 0%. Sedangkan untuk nilai precision kelas 1 . dan kelas 2 . 90 dan 1. Artinya model dalam meprediksi semua ulasan produk skincare skintific yang diklasifikasikan kedalam kelas netral dan positif, 90% dan 100% nya memang benar diklasifikasikan ke dalam kelas tersebut. Untuk nilai recall kelas 1 . dan kelas 2 . 99 dan 0. Artinya model mampu mengklasifikasikan 99% dan 9% dari seluruh ulasan produk skincare skintific dengan Positif : Jurnal Sistem dan Teknologi Informasi Volume 10. No 2, 2024. Page: Lalu, untuk nilai f1-score pada kelas netral yaitu 94%, dimana nilainya mendekati 1 berarti bahwa semua prediksi benar. Untuk kelas positif nilai f1-score yaitu 17%, dimana nilai tersebut mendekati 0 maka nilai f1-score pada kelas positif buruk. Tabel 11. Hasil Classification Report Model 3 Precision Recall F1score Accuracy (%) Berdasarkan tabel 11 dapat disimpulkan bahwa hasil review produk skincare skintific didapatkan hasil precision, recall, dan f1-score untuk kelas kelas 0 atau negatif yaitu 0%. Sedangkan untuk nilai precision kelas 1 . dan kelas 2 . 96 dan 0. Artinya model dalam meprediksi semua ulasan produk skincare skintific yang diklasifikasikan kedalam kelas netral dan positif, 96% dan 88% nya memang benar diklasifikasikan ke dalam kelas tersebut. Untuk nilai recall kelas 1 . dan kelas 2 . 98 dan 0. Artinya model dalam mengklasifikasikan ulasan produk skincare skintific yang benar-benar kedalam kelas netral dan positif, 98% dan 64% nya diklasifikasikan dengan benar. Lalu, untuk nilai f1-score pada kelas netral yaitu 97% dan untuk kelas positif yaitu 74%, kedua kelas tersebut nilainya mendekati 1 berarti bahwa semua prediksi benar. PENUTUP Kesimpulan Hasil klasifikasi sentimen menggunakan algoritma CNN pada review produk untuk skincare skintific di website Tokopedia cenderung bersentimen netral. Hasil Akurasi terbaik didapatkan pada percobaan pertama dengan nilai akurasi 97% dan hyperparameter batch size 32, learning rate 0. dan epoch 5 dengan susunan layer yaitu. Embedding(),Conv1D. ,3,tan. Dropout. GlobalMaxPooling1D. Dense. , softma. E-ISSN 2460-9552 P-ISSN 2620-3227 Perbedaan adanya validation split dan dropout mempengaruhi hasil akurasi model. Saran Peneliti memberikan saran untuk penelitian selanjutnya agar dataset yang digunakan dapat diperbanyak dan mencoba alogoritma lain atau membandingkan dengan algoritma yang lainnya. REFERENSI