JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire Volume 2. No 2. Nopember 2019 KLASIFIKASI TEKS SOSIAL MEDIA TWITTER MENGGUNAKAN SUPPORT VECTOR MACHINE (Studi Kasus Penusukan Wirant. Lalu Mutawalli1. Mohammad Taufan Asri Zaen2. Wire Bagye3 1Pusat Studi Data Sains. STMIK Lombok. Jl. Basuki Rahmat No. 105 Praya Lombok Tengah 2Sistem Informasi. STMIK Lombok. Jl. Basuki Rahmat No. 105 Praya Lombok Tengah 3Teknik Informatika. STMIK Lombok. Jl. Basuki Rahmat No. 105 Praya Lombok Tengah 1laluallistilo@gmail. com, 2opanzain@gmail. com, 3wirestmik@gmail. Abstract In the era of technological disruption of mass communication, social media became a reference in absorbing public opinion. The digitalization of data is very rapidly produced by social media users because it is an attempt to represent the feelings of the audience. Data production in question is the user posts the status and comments on social media. Data production by the public in social media raises a very large set of data or can be referred to as big data. Big data is a collection of data sets in very large numbers, complex, has a relatively fast appearance time, so that makes it difficult to handle. Analysis of big data with data mining methods to get knowledge patterns in it. This study analyzes the sentiments of netizens on Twitter social media on Mr. Wiranto stabbing case. The results of the sentiment analysis showed 41% gave positive comments, 29% commented neutrally, and 29% commented negatively on events. Besides, modeling of the data is carried out using a support vector machine algorithm to create a system capable of classifying positive, neutral, and negative connotations. The classification model that has been made is then tested using the confusion matrix technique with each result is a precision value of 83%, a recall value of 80%, and finally, as much as 80% obtained in testing the accuracy. Keywords: Model. SVM. Classification. Text. Social Media Abstrak Pada era teknologi distrupsi komunikasi masa, sosial media menjadi acuan dalam menyerap opini Digitalisasi data sangat pesat diproduksi oleh pengguna sosial media karena merupakan upaya untuk merepresentasikan perasaan khalayak. Produksi data yang dimaksud adalah pengguna melakukan postingan status dan komentar di sosial media. Produksi data oleh khalayak di sosial media tersebut memunculkan sekumpulan data yang sangat besar atau bisa disebut dengan istilah big data. Big data adalah merupakan kumpulan himpunan data dalam jumlah yang sangat besar, kompleks, memiliki waktu kemunculan relativ cepat, sehingga menjadikanya sulit untuk ditangani. Analisa terhadap data yang besar dengan metode data mining untuk mendapatkan pola pengetahuan di dalamnya. Penelitian ini melakukan analisa terhadap sentimen netizen di media sosial twitter terhadap kasus penusukan Wiranto. Hasil sentimen analisis menujukkan 41% memberikan komentar positif, 29% berkomentar secara netral, dan 29% berkomentar secara negatif terhadap kejadian. Selain itu, pemodelan terhadap data dilakukan dengan menggunakan algoritma support vector machine agar dapat membuat sistem yang mampu melakukan klasifikasi terhadap komentar berkonotasi positif, netral, dan negatif. Model klasifikasi yang telah dibuat kemudian diuji dengan mengunakan teknik confusion matrix dengan masing-masing hasil adalah nilai presisi sebesar 83%, nilai recall sebesar 80%, dan terakhir sebesar 80% yang didapatkan pada pengujian akurasi. Kata kunci: Model. SVM. Klasifikasi. Teks. Media Sosial JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire Pendahuluan Pada era teknologi distrupsi komunikasi masa di sosial media menjadi acuan dalam menyerap opini publik. Digitalisasi data sangat pesat dan masiv di produksi oleh pengguna sosial media, hal tersebut merupakan upaya dalam merepresentasikan perasaan mereka. Produksi data yang dimaksud adalah bilamana pengguna sosial media memposting status dan komentar dalam bentuk text, poto, audio, video dan lain Proses memunculkan sekumpulan data yang sangat besar kemudian disebut dengan istilah big data. Big data adalah istilah umum untuk kumpulan himpunan data dalam jumlah yang sangat besar, kompleks, memiliki waktu kemunculan relativ cepat, sehingga menjadikanya sulit untuk ditangani atau di proses jika hanya menggunakan manajemen basis data atau aplikasi pemeroses data tradisional. Perkembangan data di sosial media setiap menit bahkan dalam hitungan detik mengalami penambahan. Pengolahan dan analisa data sosial media sangat penting dilakukan guna pengetahuan yang termudah dari data-data Sosial media analisis adalah kegiatan untuk mengumpulkan data-data sosial media seperti facebook, twitter, instagram, dan sosial media lainnya kemudaian di analisa untuk keperluan bisnis, selain itu, dapat pula untuk mengukur sentimen terhadap suatu produk atau layanan. Analisa sosial media dalam pada saat ini begitu marak digunakan oleh banyak institusi pemerintah dan perusahaan untuk mendapatkan suatu inputan pengetahuan tentang suatu kebijakan atau produk yang dibuat. Pada penelitian ini bertujuan untuk melakukan pemodelan teks yang didapat melaui postingan pengguna twitter dalam kasus penusukan wiranto yang merupakan menteri kordinator bidang politik hukum dan keamanan republik Indonesia. Wiranto ditusuk pada tanggal 10 Oktober 2019 di Pandegelang Banten. Penusukan pada Wiranto mendapatkan membuat perbincangan netizen khususnya di twitter buming dibicarakan. Pemberitaan dan komentar netizen terkait dengan kasus penusukan tersebut mendapatkan informasi tentang sentimen netizen pada seseorang figur. Pada penelitian terdahulu menerangkan bahwa, analisa sosial media mengembangkan kerangka kerja untuk memfasilitasi pembelajaran organisasi melalui Volume 2. No 2. Nopember 2019 text media sosial untuk meningkatkan kualitas layanan publik oleh pemerintah, melakukan analisa terhadap komentar masyarakat terkait dengan informasi yang di publikasikan oleh pemerintah. Analisis teks media sosial twitter dapat memberikan pemahaman ilmiah tentang sentimen terhadap publik figur. Penelitian terdahulu menunjukkan bahwa analisa text sosial media dapat memberikan secondary opinion terhadap institusi pemerintah dan figur secara Pada penelitian ini juga akan melakukan klasifikasi terhadap khusunya pada teks postingan dan komentar netizen tentang kasus figure wiranto dalam kasus penusukannya. Metode machine learning yang digunakan untuk klasifikasi teks adalah support vector machine. Penelitian terdahulu yang menggunakan support vector machine (SVM) untuk klasifikasi teks, studi perbandingan tentang efektifitas dalam konteks menggunakan SVM, hasil penelitian tingkat akurasi menggunakan SVM sebanyak 86% menunjukkan metode ini cukup baik dalam melakukan klasifikasi pada teks. Pemodelan pendapat pengguna pada sosial media twitter menggunakan metode SVM untuk mendapatkan pengetahuan tentang angka kejahatan yang terjadi di Malaysia. Singapura dan Myanmar. Pada penelitian terdahulu menunjukkan bahwa metode SVM cukup baik dalam melakukan klasifikasi teks sosial media, sehingga pada penelitian ini mengusukan metode SVM sebagai metode memodelkan text komenter netizen di sosial media twitter dalam kasus penusukan Wiranto. Tinjauan Pustaka Dan Teori Tinjauan Pustaka Penelitian yang dilakukan oleh peneliti merujuk dari penelitan-penelian terdahulu yang melakukan penelitian terkait klasifikasi teks. Berikut adalah uraian mengenai penelitian yang telah dilakukan sebelumnnya. Pembuatan model klasifikasi teks dengan menkombinasi metode CNN dan RNN kemdian disebut dengan istilaj CLTSM. Hasil penelitian menunjukkan bahwa model yang dibangun cukup baik dalam melakukan klasifikasi. Pembuatan model klasifikasi dengan metode convolutional network, dengan convolutional network didapatkan hasil klasifikasi yang mutakhir dan kompetetitif. Implementasi latent selection augmented nayve untuk pemilihan fitur yang lebih baik pada data JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire sehingga hasil pemodelan yang dibagun akan lebih baik. Pembuatan model klasifikasi teks dengan hebb rule based feature selection (HRFS). Hasil eksperimen menunjukkan bahwa efektof untuk membuat model dengan kinerja lebih baik dalam melakukan tesk. Beberapa penelitian sebelumnya belum terdapat pengolahan teks dengan Bahasa Indonesia. Penelitian selanjutnya menggunakan algoritma support vector machine dengan memanfaatkan library sastrawi pada python untuk melakukan pembersihan data. Klasifikasi Teks Pengklasifikasian teks sangat dibutuhkan dalam era digitalisasi, jumlah produksi data teks saat ini sangat besar dan pertumbuhanya sangat Data teks yang tersedia saat ini sangat besar khususnya pertumbuhan dalam sosial media, perlunya melakukan analisa untuk melakukan klasifikasi terhadap data teks tersebut untuk mendapatkan pengetahuan yang termuat dalam data. Klasifikasi adalah suatu proses pengklasifikasian dokumen-dokumen kedalam satu atau lebih kategori yang telah didefinisikan sebelumnya atau kedalam kelas-kelas dari dokumen-dokumen yang sama. Gambar 1. menunjukkan pengklasifikasisikasian pada teks. Volume 2. No 2. Nopember 2019 konteks penelitian ini berupa, melakukan data collecting melakukan pengumpulan data melaui sosial media hususnya twitter. Data cleaning adalah fase dimana data-data dibersihkan, data yang telah bersih dan relevan dapat digunakan untuk proses untuk penggalian pengetahuan. Data integration menapatkan data dari berbagai macam postingan dan komentar di sosial media. Selection atau pemilihan data yang relevan dapat diterima dari koleksi data yang ada. Transformasi data kedalam bentuk yang cocok dengan cara melakukan normalisasi. Data mining merupakan inti pada penlitian ini adalah menerapkan salah satu algoritma data mining yaitu support vector machine (SVM) untuk mengekstrak pola-pola potensial yang berguna. Pattern evaluation melakukan evaluasi terhadap model yang telah dibuat dengan SVM dengan metode evaluasi seperti pengujian confusion matrix. Knowledge representation berupa melakukan visualisasi pada data untuk membatu user dalam mengerti dan mengitepretasi hasil data mining. Support vector machine Support vector machine (SVM) merupakan salah satu metode regresi atau pengklasifikasi data berdasarkan data-data sebelumnya dan pemodelanya disupervisi terlebih dahulu. SVM termasuk kedalam jenis klasifikator yang biner, probabilisik. Svm . atas keputusa. yang akan menentukan klasifikasi dari data-data pelatihan, sehingga dapat dibentuk sebuah model linier atau hyperplane yang paling optimal untuk mengkasifikasi data. Gambar 2. Merupakan menggunakan SVM dengan model linier. Gambar 1. Ilustrasi klasifikasi teks Data Mining Data mining adalah sebuah proses pencarian secara automatis informasi yang berguna dalam tempat penyimpanan berukuran Fungsi mengidentifikasi fakta-fakta atau kesimpulan yang disarankan berdasarkan penyaringan data untuk menemukan pola yang terdapat pada data. Proses dalam data mining dalam Gambar 2. SVM Model linier JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire . Dimana adalah vector input, parameter bobot, adalah fungsi basis, dan adalah suatu bias. Sehingga, sebuah hyperplane dengan maksismumkan margin didapatkan Apabila data terklasifikasi secara linier maka data ke dapat dicari jaraknya dengan. Margin jarak decision bondary dengan data terdekat oleh karena itu maksimumkan margin dapat menggunakan: Pada dunia nyata data-data pengukuran umumnya tidak dapat diklasifikasi dengan menggunakan metode SVM linier, khususnya dalam konteks penelitian ini adalah klasifikasi teks yang memiliki kompleksitas pada data yang digunakan yaitu berupa teks, namun dapat diklasifikasi dengan lebih baik dengan menggunakan SVM non linier. Oleh karena itu SVM dimodifikasi dengan memasukkan fungsi Fungsi kernel adalah fungsi yang mana untuk semua vektor input memenuhi kondisi: Dimana adalah fungsi pemetaan dari ruang input ke ruang fitur. Gambar 3. Menunjukkan ilustrasi transformasi data ruang input ke ruang Dalam SVM, kernel trick saat learning model sangat membantu dalam mengatasi masalah feature space. Pemilihan kernel berpengaruh terhadap akurasi yang dihasilkan. Pada tabel 1. Merupakan Kernel-kernel yang dapat dipakai pada SVM. Tabel 1. Kernel yang umum dipakai dalam SVM Jenis Kernel Polynominal Definisis Gausian Sigmoid Pengujian Dengan Confusion Matrix Confusion matrix adalah suatu metode yang biasanya digunakan untuk melakukan perhitungan akurasi pada konsep data mining. Terdapat empat istilah sebagai representasi hasil Keempat istilah tersebut adalah True Positif (TP) merupakan nilai positif yang dideteksi dengan benar. True Negatif (TN) merupakan jumlah data negatif yang dideteksi dengan benar. False Postif (FP) merupakan data negatif namun terdeteksi secara positif dan False Negatif (FN) merupakan data negatif terdeteksi sebagai data negatif. PREDICTION SVM menggunakan model linier sebagai dicison bondary dalam bentuk, persamaan dapat dijelaskan sebagai berikut: Volume 2. No 2. Nopember 2019 Tabel 2. Confusion Matrix TRUE VALUES TRUE FALSE TRUE Correct Unexpected Result Result FALSE Missing Correct absence of Result Presisi adalah data yang diambil berdasarkan informasi yang kurang. Presisi dapat dibuat dengan nilai prediksi positif. Berikut adalah aturan presisi: Recall adalah data penghapusan yang berhasil diambil dari data yang relevan dengan kueri. Recall juga dikenal sebagai sensitifitas. Munculnya data relevan dapat dilihat dengan recall, berikut adalah persamaan recall: Gambar 3. Transformasi data ruang input ke ruang fitur JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire Akurasi adalah presentase dari total data yang diidentifikasi dan dinilai. Berikut ini adalah aturan akurasi: Metodologi Pengumpulan Data Pengumpulan data dengan memanfaatkan Application Programming Interface (API) yang telah disediakan oleh twitter. Data yang terkumpul merupakan data teks berdasarkan postingan dan komentar pengguna twitter. Data dikumpulkan mulai dari tanggal 10 Oktober 2019 sampai dengan tanggal 12 Oktober 2019, jumlah data yang terkumul selama tiga hari sebanyak 148 baris, pada tabel 1 adalah contoh 5 baris dataset yang dikumpulkan. Variabel yang digunakan pada penelitian ini, teks adalah tweets atau status maupun komentar pengguna sosial media twitter. Score adalah nilai klasifikasi yang Volume 2. No 2. Nopember 2019 sudah disaring berdasarkan kamus positif, netral, dan negatif. Klasifikasi adalah setiap tweet yang dibagi menjadi tiga kategori yaitu, sentimen positif, netral dan sentimen negatif. Sentimen positif adalah tweet yang memuat konotasi kebaikan dan rasa empati terhadap peristiwa. Sentimen netral tidak memiliki tweets yang tidak memberikan opini berkonotasi positif dan Sentimen negatif adalah memuat opini Data Preprocessing Preprocessing merupakan langkah untuk menghasilkan data yang siap untuk dilakukan pelebelan dan pemodelan data. Tujuan dari tahap ini adalah untuk membersihkan kata-kata yang tidak perlu atau kata-kata yang tidak memiliki Pada gambar 1. merupakan tahapan yang dilakukan dalam pembersihan data. START Menghapus Bilangan Angka Casefolding Normalisasi Kata Tidak Baku Menghapus Karakter Yang Berulang > 2 Menghapus Tanda Baca Steaming Menghapus Kata < 4 Karakter Menggabung Kata Negasi FINISH Menghapus Stop Word Normalisasi Beberapa Kata Menjadi Satu Makna Gambar 4. Tahapan-tahapan preprocessing data Menghapus bilangan angka Munculnya postingan status maupun komentar seperti nomor AuhpAy dan AutanggalAy dan lain-lain tidak memiliki konotasi yang merepresentasikan suatu pesan yang akan dianalisa, sehingga perlu untuk melakukan penghapusan. Case folding Case folding adalah proses untuk menyaamaratakan bentuk semua text menjadi huruf kecil semua atau besar Menghapus tanta baca atau simbol Menghapus tanda baca atau simbol seperti Au/Ao@#$^&*()Ay, dan lain-lain. Menghapus karakter berulang lebih dari dua kali JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire Dalam Bahasa menemukan adanya kata yang memiliki karakter berulang lebih dari 2 karakter, oleh sebab itu pada tahap ini dilakukan penghapusan pada karakter yang berulang lebih dari dua kali. Normalisasi kata tidak baku Perkataan yang tidak baku seperti penyingkatan kata seperti. AunmaAy. AuulngAy,AyjhtAy, dan lain lain-lain pada tahapan ini dikumpukan kata-kata tidak baku secara manusal untuk kemudian diubah menjadi kata baku. Nma menjadi nama, ulng menjadi ulang, jht menjadi Steaming Tahapan menggunakan tokenization terlebih Tokenization adalah tahap memecah kalimat menjadi bagian-bagian Sebuah dianggap sebagai suatu bentuk kata, frasa, atau suatu elemen yang berarti. Setelah dilanjutkan dengan proses steaming. Steamming adalah tahap mengubah sebuah kata ke dalam bentuk kata dasarnya dengan menghapus kata imbuhan AudiAy maupun imbuhan di belakang kata Menghapus kata kurang dari empat Kata yang kurang dari empat karakter biasanya merupakan kata yang tidak memiliki makna sangat berarti. Oleh Contohnya seperti: ya, ok, iya, dan sebagainnyaya. Menggabung kata negasi Tahapan menggabungkan kalimat yang terdapat kata AutidakAy dengan kalimat setelanya. Karena AutidakAy merupakan kalimat negasi yang bermaknsa berlawanan dengan makna sebenarnya. Normalisasi beberapa kata menjadi satu Volume 2. No 2. Nopember 2019 Banyak terdapat kaya yang berbeda namun memiliki makna yang sama. Agar kata tersebut dianggap berbeda maka diperlukan normalisasi beberapa kata menjadi satu maknsa. Oleh karena itu, perlu dilakukan pengumpulan kata yang sama untuk digunakan sebagai base Pelabelan Data Data yang didapatkan belum memiliki kelas, oleh karena itu pada tahap ini pemberian label untuk mengetahui kelas dari setiap teks. Label memiliki tiga kelas antara lain, positif, netral, dan negatif. Analisa Data Analisa data dilakukan dengan tiga tahapan Pendeskripsian data dilakukan untuk mengetahui pola yang terdapat didalam kumpulan data. Melakukan scoring dengan visualisasi untuk mengetahui dari teks berapa presentase yang memiliki komentar maupun status yang berkonotasi postif, netral, dan negatif. Klasifikasi teks dilakukan dengan menerapkan metode support vector machine (SVM) dengan tahapan sebagai berikut, melakukan indexing, weigting, traing, dan testing. Melakukan pengujian kinerja Pengukuran terhadap kinerja sustu sistem klasifikasi merupakan hal yang penting, kinerja sistem klasifikasi menggambarkan seberapa baik sistem dalam mengklasifikasi data. Confusion matrix mengandung informasi yang membandingkan hasil klasifikasi yang dilakukan seharusnya. Analisa Hasil Dan Pembahasan Pada penelitian ini dilakukan pengujian analisa deskriptif, pengujian klasifikasi, dan pengujian terhadap hasil klasifikasi. Penegujian deskriptif dengan cara visualisasi sentimen yang terbagi menjadi tiga kelompok yaitu, sentimen positif, sentimen netral, dan sentimen negatif. Selanjutnya, melakukan uji klasifikasi dengan support vector machine untuk mendapatkan model learning. Pada tahap terakhir melakukan pengujian terhadap model klasifikasi yang telah JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire 1 Skenario Pengujian Data yang digunakan pada penelitian ini adalah bersumber dari sosial media twitter dengan melakukan proses ekstraksi data melalui twitter API. Gambar 5. source code untuk melakukan data collecting. Volume 2. No 2. Nopember 2019 netral, dan negatif. Tabel 4. Merupakan hasil data yang sudah dibersihkan dan kategorisasi. Gambar 5. Pengumpulan Data Didapatkan data sebanyak 10000 baris postingan dan komentar. Tabel 3. Data Sebelum melakukan pembersihan adalah merupakan menampikan lima baris data ditampilkan. Tabel 3. Dataset Text 2019-10-12 01:06:45 Kalau takmir masjid ditusuk, penyerang disebut orang \n\nKalau pejabat negara ditusuk, apkh penyerang disebut orang\xe2\x80\xa6'" 2019-10-11 17:20:42 Entah apa yang merasuki mu\nInnalilahi, kuyang. Wiranto\n#Innalillahi #Wiranto #kuyang Menkopolhukam Pak Wiranto https://t. c\xe2\x80\xa6'" 2019-10-11 17:04:00 Semoga Wiranto tidak menjadi beban ""negara"". Seperti kata dia ke Saudara saudara di Ambon. \n\n#Wiranto \n#WirantoDitusuk https://\xe2\x80\xa6'" 2019-10-11 16:49:41 Tidak suka pada Wiranto, scr pribadi maupun kebijakannya, ya terserah saja. \n\nMembela teroris, menutupinya dg segala dalih\xe2\x80\xa6'" 2019-10-11 14:33:00Selebgram Karin Novilda alias Awkarin turut bersimpati atas musibah yang menimpa Wiranto. #KAMUHARUSTAU #awkarin\xe2\x80\xa6 https://t. co/OT1tHbB11D' Dataset dibersihkan dengan teknik preprosesing agar data lebih mudah untuk diberikan kategorisasi. Kategori dibagi menjadi tiga kelas yaitu, positif. Tabel 4. Dataset setelah dibersihkan Text Label kalau takmir masjid ditusuk Negatif penyerang disebut orang gila kalau pejabat negara ditusuk, apkh penyerang disebut orang entah apa yang merasuki mu Negatif inalilah kuyang wiranto inalilah wiranto kuyang menkopolhukam pak wiranto semoga wiranto tidak menjadi Negatif beban negara seperti kata dia kepada saudara saudara ambon tidak suka pada wiranto pribadi Negatif maupun kebijakannya terserah saja membela teroris menutupi segala seleb karin novilda alias awkarin Positif turut bersimpati atas musibah menimpa wiranto Dataset preprosesing kemudian divisualisasi dengan melakukan scoring pada atribut label. Hasil visualisasi pada gambar 4. Visualisasi sentimen analisis pada teks yang di dapatkan. Dari hasil ini menunjukkan bahwa 41% merasa simpati komentar-komentar berkonotasi positif. Berdasarkan hasil pengujian sentimen netral sebanyak 29% dengan komentar berkonotasi netral dan 29% sentimen masa berkonotasi negatif. Gambar 6. Visualisasi sentimen netizen JIRE (Jurnal Informatika & Rekayasa Elektronik. http://e-journal. id/index. php/jire Volume 2. No 2. Nopember 2019 2 Skenario pemodelan Pada tahapan ini menjelaskan pemodelan pelatihan data untuk membuat model klasifikasi. Data dibagi menjadi dua bagian yaitu, data training dan data testing. Dari total jumlah data yaitu 10000 data sebanyak 70% atau sebanyak 7000 digunakan sebagai data latih atau data Kemudian 30% sisanya atau sebanyak 3000 data yang digunakan sebagai data pengujian atau data testing. Kesimpulan Pada penelitian ini, telah berhasil dibangun model untuk melakukan klasifikasi pada text. Model dibangun dengan menggunakan algoritma support vector machine dengan metode nonlinier. Model yang telah dibuat kemudian diuji dengan cara menghitung nilai presisi, recall, dan nilai Hasil evaluasi menujukkan bahwa model yang dibangun cukup baik dalam melakukan klasifikasi dengan masing-masing diperoleh nilai presisi sebesar 83%, nilai recall sebesar 80%, dan didapatkan nilai uji presisi sebesar 80%. 3 Pengujian model Model yang telah dibuat menggunakan algoritma svm kemudian dilakukan tahap evaluasi untuk mengetahui hasil seberapa baik metodologi, algoritma dan teknik yang digunakan pada penelitian ini. Pengujian model dilakukan dengan menggunakan teknik pengujian dengan confusion matrix dengan melihat nilai presisi, recall, dan nilai akrusai. Hasil pengujian pada model yang telah dibuat dengan algoritma SVM adalah sebagai berikut, nilai presisi 83%, nilai recall sebanyak 80%, dan nilai akurasi 80%, menujukkan visualisasi hasil pengujian Gambar 7. Hasil pengujian model klasifikasi Gambar 8. Bar Chart Hasil pengujian model Kesimpulan Dan Saran Saran Pada penelitian ini masih perlu untuk dilanjutkan agar mendapatkan model yang lebih baik. Penelitian selanjutnya agar mempertimbangkan jenis kernel yang digunakan. Selain itu, data preprosesing diperlukan untuk membuat dataset yang digunakan lebih baik agar terhindar dari kalimat-kalimat yang ambigu. Pada penelitian selanjutnya dapat menerapkan metode-metode klasifikasi yang lebih baik dalam melakukan klasifikasi pada data yang berukuran besar. Daftar Pustaka