JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire Volume 5.
No 1.
April 2022
ANALISIS SENTIMEN PEJUALAN JAFRA DALAM PANDEMI COVID-19
DENGAN ALGORITMA KLASIFIKASI
Petrus Damianus Batlayeri1.
Windu Gatta2 1Program Studi Magister Ilmu Komputer, 2,Program Studi Magister Ilmu Komputer.
Universitas Nusa Mandri Jakarta Jl.
Kramat Raya No.
RW.
Kwitang.
Kec.
Senen Kota Jakarta Pusat 1 14002337@nusamandiri.
id, 2windu@nusamandiri.
Abstract At this time in the era of big data, the use of social media often make posts on his social media accounts in the form of opinions on events and goods around him, one of which is making a post that gives an opinion on an item so that we know the impact or public view of a product in this case that is jafra.
The stages in this study began with data collection conducted by collecting tweet data on social media twitter as many as 1,000 tweets related to jafra products, then pre-processing to find the words that often appear in tweets.
This study aims to determine public sentiment on the impact of sales of Jafra products during the covid-19 pandemic, thus helping sales efforts to conduct research on public opinion.
Classification algorithms such as Naive Bayes (NB).
K-Nearest Neighbor .
-NN) and Decision Tree are proposed by many researchers for use in text sentiment analysis.
The three algorithms and methods will be tested with two inputs using positive and negative Tokenize and Transform Case comments, accuracy obtained by Nayve Bayes accuracy algorithm: 74.
92%, k-NN accuracy: 76.
Decision Tree accuracy: 77.
85% The results showed that Decisoin Tree algorithm gets the best and accurate results Keywords : Jafra.
Nayve Bayes.
K-Nearest Neighbour.
Decision Tree Abstrak Pada masa ini di zaman big data , penggunaan media sosial sering kali membuat postingan di akun media social miliknya berupa opini-opini terhadap kejadian dan barang disekitarnya, salah satunya yaitu membuat suatu postingan yang memberikan opini pada suatu barang sehingga kita jadi tahu dampak atau pandangan publik dari suatu produk pada kasus ini yaitu jafra.
Adapun beberapa tahapantahapan dalam penelitian ini diawali dari pengumpulan data yang dilakukan dengan mengcollect data tweet pada media social twitter sebanyak 1.
000 tweet yang berkaitan dengan produk jafra, selanjutnya dilakukan pra-prosesing untuk mencari kata-kata yang sering muncul didalam tweet.
Penelitian ini bertujuan untuk menentukan sentimen publik terhadap dampak dari penjualan produk Jafra dimasa pandemic virus covid-19 ini, sehingga membantu usaha penjualan untuk melakukan riset atas opini Klasifikasi algoritma seperti Naive Bayes (NB).
K-Nearest Neighbor .
-NN) dan Decision Tree yang diusulkan oleh banyak peneliti untuk digunakan dalam analisis sentimen teks.
Ketiga algoritma dan metodenya, akan diuji dengan dua masukan dengan menggunakan komentar Tokenize and Transform Case yang positif dan negatif , akurasi yang didapat algoritma Nayve Bayes accuracy: 74.
92%, k-NN accuracy: 76.
Decision Tree accuracy: 77.
85% Hasil penelitian menunjukkan bahwa algoritma Decisoin Tree mendapatkan hasil terbaik dan akurat Kata kunci : Jafra.
Nayve Bayes.
K-Nearest Neighbour.
Decision Tree ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire PENDAHULUAN Pada masa pandemi covid ini merupakan masa dimana terjadi ketidakstabilan dari berbagai masa aspek kehidupan, mulai dari aspek kesehatan, social, dan juga aspek ekonomi.
Dampak dari adanya pandemi tersebut mempengaruhi segala aspek dan salah satunya adalah penjualan produk kosmetik yang ada di Indonesia, dari dampak permasalahan penjualan tersebut disosial media dengan berbagai sentiment baik maupun positif.
Pada Analisis sentimen yang disertakan dalam data mining untuk membantu menentukan komentar mana yang positif atau negatif di seluruh Analisis sentimen adalah teknologi berbantuan komputer yang dapat mendukung dan menganalisis opini tekstual, metode untuk memahami, mengekstraksi, dan menghasilkan informasi emosional, seperti halnya penambangan teks.
Teknologi media sosial dapat mengambil banyak bentuk, termasuk majalah, forum internet, weblog, podcast, foto, dan foto .
Lainnya menggunakan media sosial sebagai referensi data yang berfungsi sebagai sumber penting opini dan reaksi masyarakat, ukuran kesadaran, dan tolok ukur layanan agensi dan perusahaan.
Saat ini, proses pengambilan data di media sosial Twitter dapat ditangani oleh beberapa algoritma yang sulit untuk media sosial, karena penulis percaya bahwa opini adalah platform yang berharga.
Hambatan untuk mengumpulkan data dari media sosial adalah bahasa formal atau informal, sehingga Anda perlu menafsirkan dan menganalisis pendapat dan pendapat yang Anda terima agar dapat digunakan sebagai pengambil keputusan.
Penulis yang merupakan metode pengolahan data dari opini Twitter saat ini mencoba untuk membandingkan dan menggunakan tiga metode yang lebih akurat dan dapat diproses.
Metode tersebut antara lain KNearest Neighbor.
Decision Tree, dan Naive Bayes menggunakan aplikasi RapidMiner.
Oleh karena itu, pada penelitian ini penulis menyarankan untuk menggunakan pohon keputusan, naive Bayes, dan K-nearest neighbor sebagai pembanding proses klasifikasi yang menyediakan preprocessing untuk pengolahan data tweet.
Hal ini dimaksudkan untuk meningkatkan akurasi pengelompokan tweet.
Berdasarkan jumlah tweet.
ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
Volume 5.
No 1.
April 2022
TINJAUAN PUSTAKA DAN TEORI
Penelitian terkait Pada penelitian Upma Kumari dkk, pada tahun 2017 tentang Analis Sistem Tinjauan Produk Ponsel Pintar Menggunakan Teknik Svm Clasification dengan hasil akurasi yang didapat dari metode svm adalah 90.
99% .
Dari penelitian Pradep Kumar Tiwari dkk, pada tahun 2018 tentang Identifikasi Bot:
Membantu Analis untuk Data yang Tepat di Twitter dengan menggunakan metode nayve bayes dan Bot Clasifier dengan hasil precision pada Bot clasifier 2% dan precision nayve bayes 79.
Berdasarkan penelitian dari Ratih Yulia Ayuningtyas dkk pada tahun 2019 tentang Analisis Sentimen Opini Publik Bahasa Indonesia Terhadap Wisata TMII Menggunakan Nayve Bayes dan yang menggunakan 2 metode yaitu nayve bayes dengan nayve bayes dan PSO, dengan hasil dari penelitian tersebut hasil akurasi dari nayve bayes yaitu 70% sedangkan hasil dari akurasi nayve bayes dan PSO 02%.
Adapun penelitian lain dari Oman Somantri dkk pada tahun 2019 tentang Analisis Sentimen Penilaian Tempat Tujuan Wisata Kota Tegal Berbasis Text Mining, dengan hasil yang telah didapatkan metode dengan menggunakan Nayve Bayes tingkat akurasi yang lebih baik dibandingkan dengan decision tree yaitu mempunyai tingkat akurasi sebesar 73,33%.
Pada penelitian Moh.
Nazrul Adziz tentang Sentiment Analysis and Topic Modelling for Identification of Government Service Satisfaction, dengan hasil yang telah didapatkan bahwa akurasi dengan metode SVM 75%.
Algorima K-Nearest Neighbors K-Nearest Neighbor (K-NN) Untuk proses penyelesaian masalah klasifikasi K-nearest neighbor (KNN) adalah yang paling sederhana dari klasifikasi lainnya.
Teknik yang digunakan dalam JST ini adalah dengan mengklasifikasikan data menggunakan objek-objek dengan nilai-nilai terdekat yang berdekatan.
Hasil yang diperoleh dari proses JST lebih tinggi atau terbaik jika setiap pembobotan kesamaan cosinus digunakan dalam perhitungan setiap suku.
Klasifikasi teks dengan metode KNN memberikan nilai yang lebih baik ketika ekspresi kesamaan cosinus digunakan untuk menimbang setiap kata dalam dokumen teks yang sedang diproses.
Sebelum menghitung nilai cosinus similarity perlu dilakukan langkah-langkah proses JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire pemerataan kata .
f, df, idf, tfid.
yang terdapat pada Persamaan 1 sd 3.
Setelah pembobotan kata selesai, langkah selanjutnya adalah menggunakan rumus cosinus similarity untuk menghitung kemiripan antar dokumen.
Persamaan persamaan cosinus ditunjukkan oleh persamaan berikut:.
yc Ocycycn=1.
yc ocycycn=1 ycycnyc2.
ocycycn=1 ycycnyc2 yaycuycycIycnyco.
c, yccyc ) = .
cc y.
= Volume 5.
No 1.
April 2022 kondisi x .
osteriori prob.
P(H) = Probabilitas hipotesis H .
rior prob.
P(X|H) = Probabilitas X berdasarkan kondisi
P(X) = Probabilitas dari X
P(X|H)P(H)
P(X)
Keterangan : CosSim.
, d ): Nilai kemiripan antara dokumen uji, .
dengan dokumen latih ke j ( d j ) t:
Jumlah term .
d : dokumen q : kata kunci .
wij : Bobot term .
ke i pada dok.
j wiq : Bobot term .
ke i pada dok.
Algoritma Nayve Bayes Pengklasifikasi naif Bayes adalah metode klasifikasi berdasarkan teorema Bayes.
Metode klasifikasi probabilistik dan statistik yang diusulkan oleh ilmuwan Inggris Thomas Bayes, yang memprediksi peluang masa depan berdasarkan pengalaman masa lalu, dikenal sebagai teorema Bayes.
Fitur utama dari pengklasifikasi Bayes naif ini adalah membuat asumsi yang sangat kuat .
tentang independensi semua kondisi dan peristiwa.
Menurut .
NBC merupakan salah satu algoritma dari teknik data mining yang menggunakan teorema Bayes untuk klasifikasinya.
Teorema Bayes adalah pendekatan statistik dasar untuk pengenalan pola.
Naive Bayes didasarkan pada asumsi yang disederhanakan bahwa nilai atribut secara kondisional independen satu sama lain sehubungan dengan nilai output.
Dengan kata lain, mengingat output, probabilitas pengamatan kolektif adalah produk dari probabilitas individu.
Kemudian mengklasifikasikan ke dalam data mining.
Teorema Bayes memiliki bentuk umum berikut:.
P(H|X)=(P(XiCH)P(H))/.
) .
Keterangan :
X = Data dengan class yang belum diketahui H = Hipotesis data X merupakan suatu class P(H|X) = Probabilitas hipotesis H berdasarkan ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
Gambar 1.
Theorema Nayve Bayes Algoritma Decision Tree Decision Tree adalah Pohon keputusan struktur diagram alur seperti pohon, di mana setiap simpul internal mewakili pengujian atribut, setiap cabang mewakili hasil pengujian, dan simpul daun mewakili kelas atau distribusi kelas.
Aliran pohon keputusan berlanjut dari simpul akar ke simpul daun yang berisi ramalan.
Nilai gain adalah information gain yang digunakan untuk mencari variabel/atribut pada dataset (S) yang digunakan sebagai root/node dan node cabang, dan merupakan atribut dengan nilai gain tertinggi.
Anda dapat menggunakan konsep entropi, koefisien Gini, dan kesalahan klasifikasi untuk mencari nilai perolehan .
nformation gai.
Nilai profit maksimum yang diperoleh dari atributatribut dataset .
ata pelatiha.
pertama-tama digunakan untuk mencari atribut yang layak mendapatkan akar .
ohon keputusa.
dari pohon Kemudian proses pencarian atribut yang akan menjadi cabang diulangi sampai menemukan daun yang menjadi label kelasnya.
Entropi yang informasinya diperoleh dengan nilai entropi adalah ekspresi untuk menghitung keseragaman atribut (A) dari data sampel (S).
yaycuycycycuycyEayc.
cI) = Oc ycn=1 ycyycn ycoycuyci2 ycyycn JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire S = Himpunan kasus dalam dataset A = Fitur .
n = jumlah partisi atribut S Pi = proposi dari Si terhadap S Maka :
ycu yaycuycycycuycyEayc.
cI) = Oc ycn=1 ycy.
ycoycuyci2 ycy.
Gain(S.
A) adalah informasi dari attribute A pada koleksi contoh ycu yaycaycnycu.
cI, y.
= yaycuycycycuycy yc.
cI) Oc .
cIyc.
ycn=1 .
cI| .
yaycuycycycuycy yc.
cIycn ) Information Gain dengan Nilai Gini Index ycu yaycnycuycnyc.
= 1 Ocycn=1.
]2 ycu yaycaycnycu.
cI, y.
= yaycuycycycuycyyc.
cI) Oc .
cIyc.
ycn=1 .
cI| .
cIycn ) .
Information Gain dengan classification error, nilai Error diperoleh dari nilai value attribut yang terkecil dari class label ya.
cI) = 1 ycu yaycaycnycu.
cI, y.
= yaycycycuyc.
cI) Oc ycoycaycuycn .
] .
cIyc.
ycn=1 .
cI| yaycycycuyc.
cIycn ) Layaknya sebuah pohon.
Seperti halnya pohon, pohon keputusan memiliki akar .
oot/nod.
, batang/cabang .
ranch nod.
, dan daun .
Strategi yang dapat Anda gunakan untuk membangun pohon keputusan menggunakan pohon keputusan adalah:
Pohon dimulai sebagai simpul tunggal .
yang mewakili semua data.
Setelah root node dibuat, data pada root node diukur menggunakan information gain untuk memilih atribut yang akan digunakan sebagai atribut pembagi.
Cabang dibuat sebagai pembagi dari atribut yang dipilih dan data didistribusikan ke setiap .
Algoritma ini terus menggunakan proses yang sama .
ecara rekursi.
untuk membangun pohon keputusan.
Jika atribut dipilih sebagai simpul split/cabang, atribut ini tidak akan lagi dimasukkan dalam perhitungan nilai perolehan informasi.
Proses pembagian rekursif berakhir ketika ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
Volume 5.
No 1.
April 2022 salah satu kondisi berikut terpenuhi:
A Semua data dari subcabang berada dalam kelas yang sama.
A Semua atribut sudah digunakan, tetapi datanya masih berada di kelas lain.
Dalam hal ini, data yang mewakili sebagian besar kelas akan digunakan sebagai label kelas untuk simpul daun.
A Tidak ada data untuk cabang baru.
Dalam hal ini, simpul daun dari cabang sebelumnya dipilih dan data yang mewakili sebagian besar kelas digunakan sebagai label kelas Pohon keputusan adalah metode klasifikasi dan prediksi yang sangat kuat dan terkenal.
Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mewakili Aturannya mudah dimengerti dalam bahasa alami.
Itu juga dapat direpresentasikan dalam database seperti Structure Query Language (SQL) untuk mengambil catatan untuk data Pohon keputusan adalah struktur yang dapat digunakan untuk membagi kumpulan data besar menjadi kumpulan data yang lebih kecil Di pohon keputusan, setiap simpul daun menandai label kelas.
Sebuah node yang bukan node terakhir terdiri dari root dan node internal yang terdiri dari kondisi pengujian atribut untuk beberapa record dengan properti yang Pohon keputusan adalah struktur diagram alur seperti pohon, di mana setiap simpul internal mewakili pengujian atribut, setiap cabang mewakili hasil pengujian, dan simpul daun mewakili kelas atau distribusi kelas.
Alur pohon keputusan berlanjut dari simpul akar ke simpul daun yang berisi ramalan.
Gambar 1.
Bentuk Dari Decision Tree JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire 5 Term Frequency (TF) Term Frequency merupakan frekuensi kemunculan kata dalam dokumen teks.
Term frekuensi .
ft, .
didefinisikan sebagai banyaknya kemunculan term t dalam dokumen d 6 Document Frequency (DF) Document Frequency merupakan kata yang digunakan dalam banyak dokumen.
Kata ini tidak seinformatif kata tersebut.
7 Invers Documents Frequency (IDF) Volume 5.
No 1.
April 2022 yang sama, menambahkan atribut positif dan negatif, setelah itu mulai pemrosesan data yang berupa komentar dengan mengilangkan tanda baca, atau opini yang dianggap tidak berkaitan dengan objek pelenitian, mengganti huruf besar dengan huruf kecil agar tidak ada eror dalam pemrosesan data, menghilangkan kata https:, dan memfilter komentar dengan bahasa indonesia, setelah itu masuk ke pemodelan algoritma yang ada, penulis menggunakan 3 algoritma pembanding seperti K-Nearest Neighbor.
Naive Bayes, dan Decision Tree, lalu setelah itu diproses dan menghasilkan akurasi, tahapan tersebut dapat ditunjukan pada Gambar 2.
Invers Document Frequency merupakan frekuensi kemunculan istilah di seluruh dokumen Term yang jarang muncul di seluruh dokumen teks memiliki nilai frekuensi dokumen terbalik yang lebih besar dari nilai term yang sering muncul.
8 Term Frequency-Invers Documents Frequency (TF-IDF) Term Frequency merupakan nilai tfidf suatu kata yang merupakan gabungan dari nilai tf dan idf dalam perhitungan pembobotan.
Metode TFIDF merupakan metode pembobotan berupa metode terintegrasi term frequency (TF) dan inverse document frequency (IDF).
Metode TFIDF dapat dirumuskan sebagai berikut dengan persamaan .
sebagai berikut :
Gambar 2.
Alur Penelitian Pre-Processing w.
=tf.
*idf .
ycnyccyce = ycoycuyci .
cA /yccyce ) .
ycnyccyce=ycoycuyci .
cA /yc.
Dimana, tf ( t , d ) adalah kemunculan kata t pada dokumen d.
N adalah jumlah dokumen pada kumpulan dokumen.
Dan df = jumlah dokumen yang mengandung term t .
Tujuan pada tahap ini adalah pengolah kata.
Ini termasuk sensitivitas huruf, sanitasi, terjemahan, rooting, penghapusan stopword, dan tokenization.
Tahap pertama adalah prapemrosesan untuk memproses data yang diterima dan klasifikasi untuk menghilangkan data yang bising.
Case Folding METODOLOGI PENELITIAN Tahapan penelitian Beberapa proses dilakukan di dalam penelitian ini diantaranya pengambilan data yang berasal dari twitter atau Crawling Text dengan query "Penjualan Jafra dan Jafra menggunakan alat bantu rapidminer, lalu dilanjutkan dengan melakukan cleansing dataset yang diantara seperti menghapus data ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
Level ini peka terhadap huruf besar atau kecil dan mengubah huruf besar atau huruf besar menjadi huruf kecil.
Cleaning Tahap keempat adalah pembersihan.
Pada fase ini.
Anda juga dapat menangani penghapusan karakter tertentu, menghapus URL JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire atau tautan, dan bahkan menghapus nama pengguna dan tagar Stopword Removal Pada tahap ini, proses penyaringan katakata yang sering dan jarang terjadi kadangkadang disebut sebagai stopwords.
Metode ini paling baik karena menghilangkan kata-kata yang jarang muncul untuk menjaga efisiensi klasifikasi .
Tokenisasi Tahap keenam adalah tokenization.
Proses ini memisahkan atau memotong semua kata dalam sebuah kalimat.
Tujuan utama dari pemecahan kalimat adalah untuk membentuk sebuah kalimat .
Tokenisasi digunakan untuk mengambil semua istilah unik yang terkandung dalam data sampel dan pada saat yang sama mencoba untuk menyusunnya dengan data input bahasa non-standar .
isalnya, oleh KBBI dan EYD.
HASIL DAN PEMBAHASAN
Volume 5.
No 1.
April 2022 2 Data Cleansing Proses pembersihan data adalah proses menghapus data dari catatan duplikat.
Dari 1000 tweet yang diperoleh dari Twitter, menghapus elemen duplikat, menghapus "RT" di teks, dan diproses, datanya adalah 127 tweet.
3 Pre-Processing Proses prapemrosesan adalah proses yang menggunakan parameter pembuatan vektor TFIDF dari alat RapidMiner.
Proses ini adalah tahap konversi case untuk merubah dari huruf besar ke huruf kecil, proses untuk menghilangkan http untuk menghilangkan data terkait http, proses untuk menghilangkan @ untuk menghilangkan simbol @ pada kalimat, proses untuk menghilangkan karakter teks ## Ini juga melalui proses penghapusan.
Masalahnya adalah tokenize ini untuk menghapus angka dan tanda baca dalam teks, menyaring token .
erdasarkan panjan.
untuk membatasi karakter dalam teks dari minimal 4 karakter hingga maksimal 25 karakter, dan filter Stowords Pada fase ini, penulis akan menggali informasi dari media sosial, yaitu data tweet yang diperoleh dari Twitter, dengan menggali dan memposting tweet ke komunitas sehubungan dengan analisis sentimen penjualan kosmetik dalam kasus Jafra.
Anda perlu .
Klasifikasi Tweet dilakukan untuk mengidentifikasi tweet positif dan negatif.
Negatif.
Berdasarkan hal tersebut, algoritma Knearest Neighbor.
Decision Tree, dan Naive Bayes digunakan sebagai pendekatan model klasifikasi tweet Gambar 4.
Proses Pre-Processing Data Pengumpulan Data Proses pengumpulan data ini dimulai dengan web crawling.
Dalam proses ini.
RapidMiner 9.
6 dapat digunakan untuk mengolah data dari Twitter yang berisi banyak komentar opini publik tentang ekonomi pasar hingga 318 tweet Gambar 3.
Proses Pengumpulan Data ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
4 Cross Validation Langkah selanjutnya adalah melakukan validasi Corss menggunakan tiga algoritma yaitu KNN.
Decision Tree, dan Naive Bayer.
Setiap algoritma melalui proses training dan testing, dan setiap algoritma diberikan cross-validation fold sebesar K = 10.
Langkah selanjutnya adalah mendapatkan nilai akurasi, akurasi, dan brand awareness melalui proses modeling.
Semua hasil ini berasal dari algoritma Knn, pohon keputusan, dan pemrosesan naive Bayer.
JIRE (Jurnal Informatika & Rekayasa Elektronik.
http://e-journal.
id/index.
php/jire Volume 5.
No 1.
April 2022 Tabel 4.
PERBANDINGAN HASIL EVALUASI
ALGORITMA K-NN.
NAyaVE BAYES.
DAN DECISION TREE Gambar 5.
Proses Training Dan Testing Data Algoritma K-Nearest Neighbors Gambar 6.
Proses Training Dan Testing Pada Algoritma Nayve Bayes Gambar 7.
Proses Training Dan Testing Pada Algoritma Decision Tree Tabel 1.
NILAI ACCURACY.
RECALL DAN
PRECISION PADA ALGORITMA K-NN
Akurasi Presisi Recall K-NN Tabel 2.
NILAI ACCURACY.
RECALL.
DAN
PRECISION PADA ALGORITMA NAyaVE BAYES Akurasi Presisi Recall Tabel 3.
NILAI ACCURACY.
RECALL DAN
PRECISION PADA ALGORITMA DECISION
TREE
Akurasi Presisi Recall Perbandingan Hasil Pengujian Dari hasil evaluasi 3 algoritma diatas, maka didapatkan selisij akurasi, dapat dilihat pada tabel berikut ini :
ISSN.
2620-6900 (Onlin.
2620-6897 (Ceta.
K-NN Akurasi Presisi Recall Metode decision tree lebih unggul dikarenakan memiliki integrasi yang mudah ke dalam sistem basis data sehingga memiliki akurasi yang baik dan dapat menemukan kombinasi data yang tidak Area keputusan yang sebelumnya kompleks dan sangat global dapat dibuat lebih sederhana dan lebih spesifik, disamping itu dapat Karena dengan metode ini, sampel hanya diuji berdasarkan kriteria atau kelas tertentu sehingga pemilihan fitur yang fleksibel dari node internal yang berbeda dan fitur yang dipilih membedakan kriteria dari kriteria lain di node yang sama Kesimpulan Dan Saran Dari penelitian diatas dapat disimpulkan Ketiga algoritma dan metodenya, akan diuji dengan dua masukan dengan menggunakan komentar Tokenize and Transform Case yang positif dan negatif , akurasi yang didapat dari algoritma Nayve Bayes yaitu 74.
92%, akurasi untuuk metode K-NN yaitu 76.
22%, dan akurasi yang didapat dari algoritma Decision Tree yaitu Hasil penelitian menunjukkan bahwa algoritma Decision Tree mendapatkan hasil terbaik dan akurat.
Untuk menakikan keakuratan dari penelitian bisa coba dengan menggunakan smote agar bisa memperbesar akurasi dalam penelitian ini.
UCAPAN TERIMA KASIH