Jurnal TRANSFORMATIKA Vol. No. Januari 2026, pp. 202 - 212 P-ISSN: 1693-3656. E-ISSN: 2460-6731 https://journals. id/index. php/transformatika/ npage 202 Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cosplay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour (KNN) Hafidz Mufrodi. Kom. Nur Wakhidah. Kom. Cs. Prind Triajeng Pungkasanti. Kom. Kom. 1Fakultas Teknologi Informasi dan Komunikasi. Universitas Semarang Jl. Soekarno Hatta. RT. 7/RW. Tlogosari Kulon. Kec. Pedurungan. Kota Semarang. Jawa Tengah 50196, e-mail: hafidzmufrodi@gmail. 2Fakultas Teknologi Informasi dan Komunikasi. Universitas Semarang Jl. Soekarno Hatta. RT. 7/RW. Tlogosari Kulon. Kec. Pedurungan. Kota Semarang. Jawa Tengah 50196, e-mail: ida@usm. Fakultas Teknologi Informasi dan Komunikasi. Universitas Semarang Jl. Soekarno Hatta. RT. 7/RW. Tlogosari Kulon. Kec. Pedurungan. Kota Semarang. Jawa Tengah 50196, e-mail: prind@usm. ARTICLE INFO History of the article : Received 24 Oktober 2025 Received in revised form 14 November 2025 Accepted 21 Januari 2026 Available online 30 Januari 2026 Keywords: Social Media. K-Nearest Neighbor Algorithm. Fake Account Analysis * Correspondece: Telepon: E-mail: ida@usm. (KNN) ABSTRACT Technological advances have given business people several options to develop their business. One of them is using Instagram social media as a promotional tool. However, using social media as a promotional medium has its own problems. Fake accounts spread on Instagram can reduce the reach of business accounts. Until now, there are more than millions of fake accounts. Instagram continues to increase its efforts to detect and delete these fake accounts. This study was conducted to be able to classify accounts suspected of being fake accounts on the followers of the averentcos account using the k-NN method. The data used were 500 follower accounts with various backgrounds. This study used several variables, namely Profile Photo. Username Length. Number of Name Words. Similarity of Name to Username. Bio Length. External Links. Public Accounts. Number of Posts. Number of Followers. Number of Followed so that accuracy of 86,666% can be achieved. INTRODUCTION Platform media sosial online beberapa tahun terakhir telah menjadi elemen utama dalam perubahan ini. Latar belakang puncak dari fenomena ini adalah pertumbuhan eksponensial pengguna internet di Indonesia. Pada saat yang sama, populasi pemuda yang besar di Indonesia, yang sangat terhubung dengan teknologi dan media sosial, telah memperkuat peran penting platform-platform ini dalam kehidupan sehari-hari . Manfaat platform media sosial online di Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cospay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour KNN (Hafidz Mufrod. Indonesia sangat bervariasi dan mencakup berbagai aspek kehidupan. Salah satu manfaat utamanya adalah kemudahan dalam berkomunikasi dan berinteraksi dengan orang lain . Media sosial memungkinkan individu untuk tetap terhubung dengan teman, keluarga, dan rekan bisnis mereka, terlepas dari jarak geografis. Terutama ketika keluarga atau teman berada di luar kota atau bahkan luar negeri. Oleh karena itu, platform media sosial juga memberikan peluang bisnis yang besar di Indonesia . Dalam era digital yang terus berkembang, media sosial dan platform online Instagram telah menjadi sarana komunikasi dan pertukaran informasi yang sangat vital dalam kehidupan sehari-hari. Banyak orang bergantung pada platform ini untuk berinteraksi, berbagi gagasan, bisnis, dan mendapatkan informasi . Akun palsu di media sosial yang mengincar pelaku usaha bisa menjadi ancaman yang cukup serius. Akun palsu sering digunakan untuk tujuan penipuan dan penggelapan . Jasa sewa rental kostum cosplay saat ini sedang berkembang pesat melalui media sosial. Seluruh transaksi yang dilakukan hanya melalui media online sehingga pelaku usaha rentan mendapatkan orderan dari pihak yang tidak bertanggung jawab. Akun palsu tanpa kredibilitas yang sangat banyak kerap kali digunakan untuk mendapatkan kepercayaan kepada pihak rental kostum dengan cara order sampling melalui banyak akun palsu supaya pemilik rental cosplay lengah dan memberikan orderan jasa sewa kostumnya. Oleh karena itu, deteksi dan identifikasi akun palsu menjadi sangat penting dalam menjaga integritas dan keamanan platform online . Pemanfaatan teknik machine learning, terutama algoritma K-Nearest Neighbour . NN), telah terbukti efektif dalam mengatasi masalah klasifikasi dan deteksi, banyak penelitian menggunakan algoritma ini untuk menyelesaikan berbagai macam masalah dari data yang mudah hingga data yang kompleks . termasuk dalam mengidentifikasi akun palsu di media sosial. kNN adalah algoritma yang mampu menghasilkan model yang baik dalam memisahkan dua kelas berbeda dalam data, dalam hal ini, antara akun yang asli dan akun palsu . Penelitian ini bertujuan untuk mengembangkan dan meningkatkan metode deteksi akun palsu pada akun Instagram Averentcos dengan menggunakan kNN. Dengan fokus pada aplikasi yang relevan dalam platform media sosial tertentu. Penelitian ini akan menyelidiki fitur-fitur yang relevan untuk deteksi akun palsu, seperti jenis nama pengguna, status pengguna, pola posting, dan Dengan demikian, penelitian ini diharapkan akan memberikan kontribusi dalam upaya menjaga keamanan dan integritas platform online serta membantu pengguna untuk mengidentifikasi akun palsu dengan lebih efektif. Penelitian ini memiliki potensi untuk memberikan manfaat nyata dalam melindungi pengguna media sosial dari potensi ancaman yang ditimbulkan oleh akun palsu, serta meningkatkan kepercayaan dan keamanan dalam berpartisipasi dalam platform- platform online yang semakin penting dalam kehidupan saat ini. RESEARCH METHODS Metodologi penelitian digunakan untuk mendapatkan data dengan tujuan tertentu. Metode ini mencakup langkah-langkah sistematis dan logis yang dapat diikuti oleh peneliti untuk mengumpulkan dan menganalisis data guna mencapai kesimpulan yang valid. Penelitian ini menggunakan algoritma k-NN. k-Nearest neighbor atau k-NN adalah metode yang bekerja dengan mencari sejumlah k objek data atau pola yang paling dekat dengan pola masukan, kemudian memilih class dengan jumlah terbanyak diantara k pola tersebut . Langkah-langkah yang dilakukan adalah sebagai berikut: Gambar 1. Tahapan Penelitian DOI : https://doi. org/10. 26623/transformatika. TRANSFORMATIKA. Vol. No. Januari 2026, pp. 202 - 212 Studi Literature Algoritma K-Nearest Neighbor . NN) adalah salah satu metode machine learning yang digunakan untuk mengklasifikasikan suatu data baru berdasarkan data-data yang sudah ada . rain se. Algoritma ini akan mencari k data terdekat dari data baru tersebut, lalu melihat kelas dari k data terdekat itu. Kemudian data baru akan diklasifikasikan ke dalam kelas yang paling banyak muncul diantara k data terdekat tersebut. Gambar 2. Gambaran Algoritma k-NN Gambar 2. a sebagai contoh akan dicari apakah data tes AE akan akan dicari apakah data tes masuk * atau AE atau o? Gambar 2. Metode kNN menghitung jarak antara data tes dengan semua data latih. Pada gambar terlihat perhitungan yang menghasilkan jarak 2. 6, 2. 8, 3. 0, 3. Gambar 2. pada contoh ini digunakan nilai k=4 sehingga diurutkan empat jarak yang dekat sesuai rankingnya. Terlihat bahwa jarak paling dekat adalah 2. Gambar 2. Pada langkah ini dihitung berapa jumlah label yang dekat pada kelas-kelas tersebut. Terlihat ada 2 label pada kelas *, 1 label pada kelas AE , dan 1 label pada kelas o. Dari sini terlihat bahwa data tes diklasifikasikan ke kelas bintang *. Demikian gambaran metode kNN. Penentuan nilai k dalam algoritma klasifikasi K-Nearest Neighbor dapat dicari berdasarkan nilai sampel k terdekat k1, k2, ks. Semakin banyak data yang ada semakin kecil jumlah k yang dipilih, sedangkan jika ukuran dimensi data yang ada lebih besar, jumlah k yang dipilih harus lebih tinggi. Dalam menentukan nilai k, lebih baik menggunakan angka ganjil seperti k = 1, 3, 5. A, dst. Nilai k harus memenuhi syarat yaitu k < N dimana N merupakan jumlah dari dataset latih, karena nilai k digunakan untuk mencari jumlah mayoritas dari kelas/label pada data latih maka nilai k tidak boleh lebih dari jumlah dataset latih. Mencari tetangga terdekat atau jarak pada algoritma k-NN terdapat 3 cara umum yaitu Jarak Euclidean. Jarak Manhattan, dan Jarak Minkowski . Data Collection Data yang digunakan dalam penelitian ini bersumber dari website opensource Kaggle https://w. com/datasets/free4ever1/instagram-fake-spammer-genuine-accounts untuk digunakan sebagai data training. Kemudian bersumber dari pengikut akun Instagram https://w. com/averentcos/ yang digunakan untuk data test pada model KNN di google collab. Data tersebut menggunakan berbagai variable yang mencerminkan sebuah akun di Instagram. Data training yang digunakan sebanyak 576 data, sedangkan data test yang digunakan sebanyak 120 yang dikumpulkan melalui proses scraping menggunakan tool extension chrome IG Exporter. Variabel data yang digunakan adalah berikut: Profile pic = gambar profil atau tidak? . = tidak punya. nums/lenght username = jumlah karakter numerik dalam nama pengguna . fullname words = jumlah kata dalam nama lengkap . num/lenght fullname = jumlah karakter numerik dalam nama lengkap Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cospay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour KNN (Hafidz Mufrod. name==username 0 = sala. description length . external URL tidak ad. #posts . #followers . #follows . fake = nama pengguna sama dengan nama lengkap . = = jumlah karakter dalam Bio = memiliki URL eksternal dalam Bio . = ada. = profil bersifat pribadi . = ya. 0 = tida. = jumlah publikasi jumlah pengikut = jumlah profil yang diikuti pengguna = variabel target . = tidak palsu. 1 = pals. Data Preprocessing Sebelum data bisa digunakan, dilakukan beberapa preprocessing data. Tujuan utama dari tahap ini adalah untuk memastikan bahwa data memiliki sifat yang akurat, lengkap, dan terstruktur dengan baik . Data yang tidak dilakukan preprocessing akan menghasilkan kinerja yang kurang akurat . Pemilihan metode preprocessing yang akan digunakan dapat berpengaruh pada kualitas data keluaran proses. Pada penelitian ini, tahapan yang dilakukan dalam data preprocessing adalah melakukan tokenizing, cleaning, dan adding data. Tokenizing adalah penghitungan beberapa variabel pada data sehingga data menjadi lebih akurat . Tokenizing dilakukan dengan cara menggunakan tools tokenizer yang cukup popular yaitu website openai tokenizer platform. Kemudian cleaning dan adding data adalah pembersihan data duplikat serta penambahan data yang kosong. Transforming Data Pada tahapan data transform, data yang didapatkan akan diubah terlebih dahulu untuk menyesuaikan dengan penggunaan algoritma atau metode yang digunakan, sehingga pola pada data dapat ditemukan dengan cepat. Pada tahapan ini, teknik transform yang digunakan adalah Min-Max Normalization. x - min. - min. ] Z adalah hasil normalisasi, x adalah nilai x asli, min. adalah nilai minimal untuk variabel x, dan max. adalah nilai maksimal untuk variabel x. Kemudian data diubah kedalam bentuk format csv sehingga data bisa dibaca oleh program yang sudah dibuat sebelumnya terutama library pandas pada google collab. Perhitungan kNN Perhitungan kNN dilakukan dengan menggunakan Google Collab. Program di rancang untuk mempelajari pola data dari data-data yang sudah tersedia, sehingga hasil pada program tersebut menghasilkan pengeluaran sesuai dengan yang diharapkan. Library yang digunakan dalam program adalah Pandas. NumPy, dan Scikit-learn. Library Pandas adalah salah satu library populer di python yang digunakan untuk analisis dan manipulasi data, terutama data yang berbentuk tabel seperti spreadsheet atau database. Library NumPy digunakan untuk komputasi numerik di python. Sedangkan library Scikit-learn digunakan untuk komputasi algoritma kNN sekaligus evaluasi model. Evaluasi Model Evaluasi model yang digunakan adalah metode Euclidean Distance. Metode Euclidean Distance dipillih karena memiliki beberapa keunggulan yaitu perhitungan jarak menggunakan Eucidean Distance lebih umum digunakan dalam metode kNN dan Euclidean Distance mempunyai hasil yang lebih optimal dibanding metode yang lain. RESULTS Pengumpulan data dilakukan dengan mengambil data training dari website opensource Kaggle https://w. com/datasets/free4ever1/instagram-fake-spammer-genuine-accounts DOI : https://doi. org/10. 26623/transformatika. TRANSFORMATIKA. Vol. No. Januari 2026, pp. 202 - 212 serta scrapping dari instagram menggunakan tools IG Exporter untuk digunakan sebagai data test. Kemudian diperoleh data sebagai berikut ini: Tabel 1. Hasil Data Scrapping https://w. com/ceii_1088 https://w. com/morisa_uwu https://w. com/gw_ardhi2 https://w. com/dear. https://w. com/wanapwiu_ https://w. com/cia. https://w. com/noyspace_ https://w. com/el. https://w. com/rafif_0_0 https://w. com/vaniaadnv_ https://w. com/the_smollghost full_name Ceinaa Hailey Ur daphy Rere Cia CC NOYiAuAi biasa dipanggil om Rafif0_0 OyisEeyi O U SmollymollyRiley ceii_1088 morisa_uwu gw_ardhi2 rafif_0_0 the_smollghost Peneliti masuk satu persatu dalam instagram masing-masing follower untuk menganalisis lebih lanjut apakah akun follower tersebut masih aktif atau tidak, mengetahui jumlah postingan, gambar profile, follower, following, private, dan link bio. Peneliti menggunakan 120 follower untuk data Data yang sudah siap untuk dianalisis selanjutnya disimpan dalam format csv yaitu csv dan test. csv dan diupload ke http://w. File train. csv dan test. csv yang sudah diupload tersebut sudah siap digunakan dan dinalisis menggunakan Metode kNN. Berikut data training yang diperoleh dari website Kaggle: Tabel 2. Data Training profile nums/length fullname nums/length username description external private #posts #followers #follows fake URL 0,27 0,27 Selanjutnya dilakukan data processing pada hasil scrapping yang tertera pada tabel 1. , maka diperoleh hasil sebagai berikut: Tabel 3. Data Test profile nums/length fullname nums/length description external username words fullname username length URL private #posts #followers #follows fake 0,54 0,27 0,85 0,27 0,41 Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cospay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour KNN (Hafidz Mufrod. profile nums/length fullname nums/length description external No pic username words fullname username length URL private #posts #followers #follows fake 0,27 0,16 0,13 0,15 0,09 Kemudian dilakukan perhitungan manual menggunakan metode Euclidean Distance. Data nomor 1 sampai nomor 120 dari test. csv akan diprediksi apakah akun instagram tersebut palsu atau tidak dengan menggunakan rumus: Dist (X,Y) = Eu (X Oe Y )2 Keterangan: Dist (X,Y) = jarak antar objek (Euclidean Distancin. = sampel data = data uji = dimensi data = variabel data Obyek nomor 1 dari test. Nomor 1 dari test. csv dengan nomor 1 dari train. Ed 1-1 = {. - . 27 - 0. - . - 0. - . - . - . - . - . 0 - . - . 1/2 = 1156. Nomor 1 dari test. csv dengan nomor 2 dari train. Ed 1-2 = {. - . 27 - 0. - . - 0. - . - . - . - . - . 0 - . - . 1/2 = 2684. dengan cara yang sama sampai nomor 576 dari train. Nomor 1 dari test. csv dengan nomor 576 dari train. Ed 1-576 = {. - . 27 - 0. - . - . - . - . - . - . - . - . - . 1/2 = 260. Obyek nomor 2 dari test. Nomor 2 dari test. csv dengan nomor 1 dari train. Ed 2-1 = {. - . 27 - 0. - . - 0. - . - . - . - . - . 0 - 2. - . 1/2 = 1614. Nomor 2 dari test. csv dengan nomor 2 dari train. Ed 2-2 = {. - . 27 - 0. - . - 0. - . - . - . - . - . 0 - 2. - . 1/2 = 324. dengan cara yang sama sampai nomor 576 dari train. Nomor 2 dari test. csv dengan nomor 576 dari train. Ed 2-576 ={. - . 30 - 0. - . 20 - 1. - . 09 - 0. - . - . - . - . 1/2 = 2428. DOI : https://doi. org/10. 26623/transformatika. TRANSFORMATIKA. Vol. No. Januari 2026, pp. 202 - 212 Obyek nomor 120 dari test. Nomor 120 dari test. csv dengan nomor 1 dari train. Ed 120-1 = {. - . 27 - 0. - . - 0. - . - . - . - . 0 - . - . 1/2 = 1351. Nomor 120 dari test. csv dengan nomor 2 dari train. Ed 120-2 = {. - . 27 - 0. - . - 0. - . - . - . - . - . 0 - . - . 1/2 = 2786. dengan cara yang sama sampai nomor 576 dari train. Nomor 120 dari test. csv dengan nomor 576 dari train. Ed 120-576 = {. - . 27 - 0. - . - . - . - . - . - . - . - . - . 1/2 = 471. Dari perhitungan Euclidean Distance secara manual, maka diperoleh hasil sebagai berikut: Tabel 4. Hasil Euclidean Distance A. Data 1 A. Sort A. Data 2 A. Sort A. Data 120 A. Sort A. Kemudian hasil data tersebut diurutkan secara Ascending . ata terkecil ke data terbesa. Dan diperoleh hasil sebagai berikut: Tabel 5. Hasil Sortir Euclidean Distance Ascending Sort Data 1 Fake Data 2 Fake Data A A A A Data 120 Fake Menggunakan nilai K = 3 dengan menggunakan tabel 5. ata yang diambil adalah 3 data teratas, maka diperoleh hasil sebagai berikut: Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cospay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour KNN (Hafidz Mufrod. Tabel 6. Hasil Kategorisasi KNN, dengan K = 3 Data test Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 Data 7 Data 8 Data 9 Data 10 Data 120 Fake Prediksi Menggunakan nilai K = 4 dengan menggunakan tabel 5. ata yang diambil adalah 4 data teratas, maka diperoleh hasil sebagai berikut: Tabel 7. Hasil Kategorisasi kNN, dengan K = 4 Data test Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 Data 7 Data 8 Data 9 Data 10 Data 120 Fake Prediksi Menggunakan nilai K = 5 dengan menggunakan tabel 5. ata yang diambil adalah 5 data teratas, maka diperoleh hasil sebagai berikut: Tabel 8. Hasil Kategorisasi kNN, dengan K = 5 Data test Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 Data 7 Data 8 Data 9 Data 10 Data 120 Fake DOI : https://doi. org/10. 26623/transformatika. Prediksi TRANSFORMATIKA. Vol. No. Januari 2026, pp. 202 - 212 Untuk perhitungan menggunakan program pada google collab, dilakukan pada link berikut: https://colab. com/drive/1iPMQCSEdBeMiqsDQmV3vCZvypgJDtgGp?usp=sha model = KNeighborsClassifier. _neighbors=K , weights="distance") fit(X_train,y_trai. predicting = model. predict(X_tes. print("The average accuracy of the model was:" , accuracy_score. _test , predictin. ) print. lassification_report. _test , predictin. ) Dan menghasilkan nilai akurasi yang berbeda-beda untuk tiap nilai K: K = 2. The average accuracy of the model was: 0. K = 3. The average accuracy of the model was: 0. K = 4. The average accuracy of the model was: 0. K = 5. The average accuracy of the model was: 0. Dari hasil pengujian diatas dapat disimpulkan bahwa akurasi tertinggi pada K = 4 yaitu sebesar Hasil akurasi selanjutnya akan di evaluasi dengan menggunakan metode Confusion Matrix. Akurasi merupakan rasio prediksi benar dari positif dan negatif dengan keseluruhan data. Pengukuran akurasi dapat menggunakan rumus: Accuracy = ycNycA ycNycE ycNycE ycNycA yaycE yaycA = True positives = True negatives = False positives = False negatives Perhitungan K=3: True Positives (TP): 52 (Prediksi kelas 1 dan benar kelas . False Positives (FP): 8 (Prediksi kelas 1, tetapi sebenarnya kelas . False Negatives (FN): 10 (Prediksi kelas 0, tetapi sebenarnya kelas . True Negatives (TN): 50 (Prediksi kelas 0 dan benar kelas . Akurasi dihitung dengan rumus: ycNycA ycNycE = 0,85 ycNycE ycNycA yaycE yaycA 120 Perhitungan K=4: True Positives (TP): 54 (Prediksi kelas 1 dan benar kelas . False Positives (FP): 6 (Prediksi kelas 1, tetapi sebenarnya kelas . False Negatives (FN): 10 (Prediksi kelas 0, tetapi sebenarnya kelas . True Negatives (TN): 50 (Prediksi kelas 0 dan benar kelas . Akurasi dihitung dengan rumus: Perhitungan K=5: ycNycA ycNycE = 0,8666 ycNycE ycNycA yaycE yaycA 120 Klasifikasi Akun Palsu Pada Pengikut Akun Rental Cospay Averentcos Di Instagram Menggunakan Metode K-Nearest Neighbour KNN (Hafidz Mufrod. True Positives (TP): 51 (Prediksi kelas 1 dan benar kelas . False Positives (FP): 9 (Prediksi kelas 1, tetapi sebenarnya kelas . False Negatives (FN): 9 (Prediksi kelas 0, tetapi sebenarnya kelas . True Negatives (TN): 51 (Prediksi kelas 0 dan benar kelas . Akurasi dihitung dengan rumus: ycNycA ycNycE = 0,85 ycNycE ycNycA yaycE yaycA 120 Perhitungan menggunakan program: from sklearn. metrics import confusion_matrix cm = confusion_matrix. _test, predictin. print('Confusion matrix\n\n', c. print('\nTrue Positives(TP) = ', cm. ) print('\nTrue Negatives(TN) = ', cm. ) print('\nFalse Positives(FP) = ', cm. ) print('\nFalse Negatives(FN) = ', cm. ) Hasil evaluasi model menggunakan metode Confusion Matrix menyatakan bahwa K=4 memiliki akurasi terbaik dengan nilai sebesar 0,8666 CONCLUSIONS AND RECOMMENDATIONS Metode klasifikasi dengan algoritma K-Nearest Neighbour . NN) dalam mengidentifikasi Instagram dengan akun palsu di media sosial Instagram sangat bergantung pada kemiripan suatu akun dengan akun-akun lain yang sudah diklasifikasikan. Jika akun palsu memiliki pola yang berbeda dari akun asli, kNN dapat mengidentifikasi akun tersebut dengan akurasi yang cukup K-Nearest Neighbour . NN) cukup efektif untuk klasifikasi Instagram dengan akun palsu di media sosial Instagram dengan tingkat akurasi 86,666%. Kualitas Dataset yang sudah dibuat terhadap proses klasifikasi K-Nearest Neighbour . NN) dalam memprediksi akun palsu mempunyai pengaruh yang cukup besar bergantung pada pemilihan fitur yang tepat. Berdasarkan penelitian yang telah dilakukan maka dapat dikemukakan saran untuk penelitian selanjutnya tidak hanya sebatas klasifikasi, tetapi dapat merekomendasi akun instagram mana yang dicurigai sebagai akun palsu dan digunakan untuk tindakan yang melanggar hukum atau berkemungkinan melakukan penipuan. Penelitian selanjutnya diharapkan dapat menggunakan metode lain seperti korelasi. N-gram, atau SVM sebagai pembandingnya, karena pada penelitian ini akurasi tertinggi yang diperoleh hanya sebesar 86,666 %. REFERENCES