Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Meningkatkan Akurasi KNN Menggunakan Metode Particle Swarm Optimization pada Klasifikasi Kualitas Buah Apel KNN Accuracy Improvement Using Particle Swarm Optimization Method on Apple Fruit Quaity Classification Mutiara Mega Amelia1. Hani Harafani*2. Muhammad Rafa Maarif3. Bintang Maulana Fazrin 1,2,3,4Fakultas Teknologi Informasi Universitas Nusa Mandiri E-mail: 2hani. hhf@nusamandiri. Abstrak Kualitas apel merupakan aspek krusial dalam industry pertanian dan pengolahan makanan. Penilaian kualitas ini sangat penting untuk memenuhi standar konsumen dan memastikan kepuasan pelanggan. Penelitian ini mengeksplorasi penggunaan algoritma K-nearest Neighbor (KNN) yang dioptimalkan dengan Particle Swarm Optimization (PSO) untuk klasifikasi kualitas apel berdasarkan atribut ukutan, berat, rasa manis, kerenyahan. Kelembapan, kematangan, dan keasaman. Dataset yang digunakan mencakup 4000 sampel apel yang telah diukur dan diealuasi berdasarkan atribut-atribut tersebut. Hasil penelitian menunjukkan bahwa pengaturan ukuran populasi dan bobot inertia pada algoritma PSO berhasil mengoptimalkan kinerja KNN dalam klasifikasi kualitas buah apel. Kombinasi ukuran populasi dan beban inertia pada algoritma PSO dapat meningkatkan akurasi KNN hingga mencapai nilai akurasi sebesar 91. 15% dengan nilai recall 89. 53% dan precision Penelitian ini juga memiliki nilai akurasi yang lebih baik dibandingkan penelitian sebelumnya terhadap klasifikasi kualitas buah apel. Kata kunci: Kualitas. Apel. Klasifikasi. KNN. PSO Abstract Apple quality is a crucial aspect in the agriculture and food processing industry, quality assessment is essential to meet consumer standards and ensure customer satisfaction. This research explores the use of K-nearest Neighbor (KNN) algorithm optimized with Particle Swarm Optimization (PSO) for apple quality classification based on the attributes of size, weight, sweetness, crispness, juiciness, ripeness, and acidity. The dataset used contains 4000 apple samples that have been measured and evaluated based on these attributes. The results showed that setting the population size and inertia weights in the PSO algorithm successfully optimized the performance of KNN in apple quality classification. The combination of population size and inertia weight in the PSO algorithm can increase KNN's accuracy to 15% with a recall value of 89. 53% and precision of 92. This research also has a better accuracy value than previous research on apple quality classification. Keywords: Quality. Apel. Classification. KNN. PSO PENDAHULUAN Apel (Malus Domestic. adalah buah yang sangat disukai dan banyak dikonsumsi oleh masyarakat. Buah apel digemari karena memiliki variasi rasa yang A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Apel juga kaya akan nutrisi dan mengandung berbagai vitamin, termasuk lemak baik, karbohidrat, protein, vitamin C, vitamin A, vitamin B1, vitamin B2, dan masih banyak lagi . Penilaian kualitas apel merupakan isu penting dalam industry pertanian dan perdagangan buah, karena kualitas apel yang baik tidak hanya meningkatkan nilai jual tetapi juga mempengaruhi kepuasan konsumen. Namun, penilaian kualitas apel menghadapi beberapa permasalahan yang kompleks dan Salah satu masalah utama dalam penilaian kualitas apel adalah subjektivitas. Penilaian kualitas yang dilakukan secara manual oleh pekerja di lapangan sangat bergantung pada pengalaman dan persepsi individu. Hal ini menyebabkan inkonsistensi dalam penilaian, di mana apel yang sama bisa mendapatkan penilaian yang berbeda dari pekerja yang berbeda. Inkonsistensi ini tidak hanya mempengaruhi keandalan produk tetapi juga dapat mengakibatkan ketidakpuasan konsumen dan penurunan reputasi merek. Faktor lainnya adalah variasi dalam standar kualitas. Standar penilaian kualitas apel dapat bervariasi antara satu daerah dengan daerah lainnya, bahkan antara satu pasar dengan pasar lainnya. Variasi ini menciptakan tantangan tambahan dalam memastikan bahwa apel yang diekspor atau dijual di pasar yang berbeda memenuhi ekspektasi dan standar kualitas yang Kebutuhan akan metode yang lebih objektif, efisien, dan akurat dalam penilaian kualitas apel menjadi semakin mendesak. Oleh karena itu, pendekatan otomatis berbasis teknologi seperti algoritma pembelajaran mesin menjadi solusi yang menjanjikan untuk mengatasi berbagai permasalahan dalam penilaian kualitas Dalam penilaian kualitas apel, beberapa macam data yang penulis gunakan untuk menentukan kualitas adalah ukuran (Siz. , berat (Weigh. , rasa manis (Sweetnes. , kerenyahan (Crunchines. Kelembapan (Juicines. , tingkat kematangan (Ripenes. , keasaman (Acidit. , dan kualitas keseluruhan (Qualit. Metode machine learning banyak digunakan untuk mengklasifikasi buah, seperti mengklasifikasi buah yang segar dan busuk . , klasifikasi buah zaitun . , dan klasifikasi buah apel . , . , . , . Penerapan pembelajaran mesin dapat mengurangi subjektivitas . yang sering terjadi pada penilaian manual, karena algoritma dapat memberikan hasil yang lebih objektif berdasarkan data yang terukur. Algoritma ini dapat mengolah dan menganalisis data atribut secara efisien dan konsisten, sehingga mampu mengatasi berbagai permasalahan dalam penilaian kualitas apel. Namun begitu kebanyakan dataset klasifikasi kualitas buah apel yang digunakan berupa citra. Selain dataset berupa citra, dataset klasifikasi kematangan buah apel berupa fitur juga diteliti oleh . Namun, metode KNN yang digunakan terkenal dengan metode yang sederhana . Kelebihan metode ini adalah mampu untuk diterapkan secara efektif pada data yang besar dengan hasil yang akurat. Namun, kekurangannya adalah memerlukan biaya komputasi yang cukup tinggi karena perlu melakukan perhitungan jarak pada setiap instance query secara bersamaan . Algoritma PSO banyak diimplementasikan untuk mengatasi kelemahan pada KNN . , . , . , . Particle Swarm Optimization (PSO) digunakan sebagai A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 metode optimasi untuk meningkatkan akurasi klasifikasi dari KNN. Algoritma PSO akan belajar dari data atribut yang diberikan untuk mengenali pola dan hubungan antar atribut, sehingga dapat membuat prediksi yang lebih tepat mengenai kualitas Namun, ukuran populasi dan bobot inersia sangat mempengaruhi kinerja metode metaheuristic . dikarenakan PSO sering terjebak pada local optima. , sehingga penting untuk menemukan ukuran populasi dan bobot inersia yang tepat. Penelitian ini bertujuan untuk meningkatkan klasifikasi kualitas apel yang objektif dan akurat menggunakan algoritma K-Nearest Neighbor (KNN) yang dioptimalkan dengan Particle Swarm Optimization (PSO). METODOLOGI PENELITIAN Penelitian ini melibatkan serangkaian tahap yang mengikuti alur sebagaimana tergambar dalam Gambar 1. Setiap tahap memiliki perannya masingmasing dalam memastikan integritas dan kehandalan hasil akhir. Gambar 1. Tahapan Penelitian Dalam penelitian ini data akan diproses dengan melakukan beberapa tahapan 1 Pengumpulan Data Langkah pertama adalah pengumpulan data. Data yang relevan dikumpulkan dari berbagai sumber dan disiapkan untuk analisis lebih lanjut. Pengumpulan data ini dilakukan untuk mengidentifikasi dan mendapatkan data yang penting dan akurat tentang klien. Pada penelitian ini data yang digunakan adalah Apple Quality yang diambil dari Kaggle pada laman Apple Quality | Kaggle, data ini berisi 4000 entri yang mengevaluasi kualitas apel berdasarkan atribut Size . kuran ape. Weight . erat ape. Sweetness . ingkat kemanisa. Crunchiness . A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Juiciness (Kelembapa. Ripeness . Acidity . , dan Quality . enilaian keseluruhan kualita. Tampilan data dapat dilihat pada Gambar 2. Setiap atribut diukur dalam satuan yang relevan atau menggunakan skala penilaian tertentu untuk memberikan gambaran lengkap tentang kualitas dan karakteristik setiap apel Gambar 2. Tampilan data apple quality Preprocessing Data Preprocessing merupakan langkah yang penting dalam mengatasi masalah yang dapat mengganggu hasil dari proses klasifikasi data. Dataset "Apple Quality" tidak memiliki missing value, oleh karena itu, langkah-langkah yang dilakukan sebagai awal pemrosesan meliputi pemilihan label dan penentuan tipe data untuk setiap atribut. Pemilihan label bertujuan untuk memastikan atribut yang relevan digunakan dalam analisis lebih lanjut. Kemudian, tipe data setiap atribut ditentukan untuk memastikan data siap untuk dianalisis dan dimodelkan. Misalnya, atribut Size dan Weight ditentukan sebagai tipe real, sementara atribut Quality ditetapkan sebagai tipe binominal berdasarkan skala penilaian. Setelah itu metode k-fold cross validation diterapkan untuk membagi data training dan data testing. Dari 4000 data, 90% dijadikan sebagai data training, dan 10% dijadikan sebagai data testing. 3 Pembangunan Model dengan K-NN Model K-NN dibangun menggunakan data yang telah dipreproses. Algoritma K-Nearest Neighbor adalah metode untuk mengklasifikasikan dataset dengan menggunakan data pembelajaran terdekat berdasarkan jarak Euclidean, baik yang jauh maupun dekat . Algoritma K-NN bekerja dengan mengklasifikasikan data baru berdasarkan kedekatan jarak dengan data yang ada dalam dataset. Pada tahap ini, data training digunakan untuk melatih model dalam mengenali pola dan karakteristik kualitas buah apel. 4 Optimasi Model dengan PSO A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Setelah model K-NN dibangun, optimasi dilakukan menggunakan Particle Swarm Optimization (PSO). PSO adalah algoritma optimasi berbasis populasi yang terinspirasi oleh perilaku sosial dari kawanan burung atau ikan. Implementasi Particle Swarm Optimization (PSO) pada K-Nearest Neighbor bertujuan untuk meningkatkan kinerja machine learning sehingga meningkatkan nilai akurasinya. Pemilihan metode ini didasarkan pada kemudahan implementasi konsep PSO yang sederhana, serta fleksibilitasnya dalam mengatur keseimbangan antara pencarian lokal dan global dalam ruang pencarian. Keputusan ini didukung oleh kemampuan PSO dalam menyelesaikan masalah optimisasi dan seleksi fitur . 5 Analisis Hasil Model Analisis hasil model ini fokus pada perbandingan antara hasil akurasi menggunakan algoritma K-Nearest Neighbor (KNN) dengan KNN yang ditingkatkan menggunakan Particle Swarm Optimization (PSO). Pertama, evaluasi dilakukan terhadap akurasi KNN konvensional yang menggunakan pendekatan sederhana berdasarkan jarak terdekat antara data. Selanjutnya, hasil implementasi KNN dengan bantuan PSO dievaluasi untuk menilai apakah optimisasi parameter dengan PSO berhasil meningkatkan performa model. Hasil dari analisis ini memberikan gambaran yang jelas mengenai keunggulan dan potensi keuntungan dari penggunaan PSO dalam meningkatkan akurasi dan efisiensi algoritma KNN dalam konteks spesifik aplikasi klasifikasi kualitas apel. Hasil ini juga memberikan wawasan tentang kekuatan dan kelemahan model yang dikembangkan. 6 Evaluasi Model Tahap evaluasi bertujuan untuk menilai seberapa baik model yang telah dikembangkan dalam tahap sebelumnya. Evaluasi model dilakukan untuk memastikan kemampuan generalisasi model dan untuk menghindari overfitting. Evaluasi dilakukan menggunakan metode confusion matrix, dimana confusion matrix menggunakan tabel perbandingan antara kelas prediksi dengan kelas asli. Nilai-nilai yang digunakan pada confusion matrix diantaranya accuracy, precision, dan recall. Akurasi dalam klasifikasi menghitung presentasi ketepatan model yang dapat diklaifikasikan dengan benar, sedangkan precision merupakan nilai presentase prediksi positif yang juga benar positif secara aktual, sedangkan recall menentukan seberapa baik model dapat menemukan semua kasus yang positif. Selain menggunakan confusion matrix, uji t-berpasangan juga digunakan untuk menguji apakah ada perbedaan akurasi sebelum dan sesudah optimasi, kemudian uji t-berpasangan juga digunakan untuk mengetahui seberapa besar signifikansi optimasi PSO terhadap model klasifikasi K-NN. Hipotesis dapat dibagi menjadi dua . yaitu H0 dan H1 diamana H0 diterima apabila nilai t hitung lebih besar dari t tabel yang mana menunjukkan tidak adanya perbedaan antara A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 percobaan pertama dengan percobaan kedua, sementara H1 diterima apabila nilai t hitung lebih kecil dari pada t tabel yang mana hal ini menunjukkan adanya perbedaan antara percobaan pertama dengan percobaan kedua. Kemudian nilai alpha () yang menunjukkan signifikansi dari hasil uji beda tersebut. Jikai nilai H 1 diterima dengan nilai < 0,05 maka hasil percobaannya adalah terdapat perbedaan yang signifikan antara percobaan petama dengan percobaan kedua, sementara jika H1 diterima dengan nilai > 0,05 maka hasil percobaannya adalah terdapat perbedaan yang tidak signifikan antara percobaan pertama dengan percobaan HASIL DAN PEMBAHASAN Tahap pemodelan diawali dengan mencoba nilai K secara manual pada metode K-Nearest Neighbor. Dilakukan percobaan nilai K sebanyak 10 kali percobaan dengan nilai k diatur dari 1-10. Tabel Uji coba nilai K dapat dilihat pada Tabel 1. Tabel 1. Uji Coba nilai k secara manual Accuracy 52,65% 52,65% 54,10% 55,10% 54,68% 55,50% 55,50% 55,53% 54,50% 55,60% Pada Tabel 1. Dapat dilihat bahwa setelah dilakukan percobaan sebanyak 10 kali, nilai akurasi paling tinggi di dapat pada nilai K sebesar 10. Grafik akurasi dapat dilihat pada Gambar 3. Tahap kedua, dengan nilai K yang telah didapatkan pada percobaan, selanjutnya dilakukan eksperimen menggunakan PSO yaitu dengan mengubah nilai population size sebanyak 10 kali percobaan dengan memasukan nilai populasi dari 1 sampai dengan 10 dengan inertia weight adalah nilai default yaitu 1. Percobaan kedua dapat dilihat pada Tabel 2. Akurasi tertinggi sebesar 90. 90% didapat pada population size 4 dan population size 7, namun hasil precision dan recall menunjukkan angka yang Precision pada population size = 4 lebih tinggi dibandingkan precision A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 dengan population size = 7,ini artinya population size = 4 mengklasifikasi nilai data benar yang lebih banyak dibandingkan population size =7, sedangkan berdasarkan recall population size 7 lebih tinggi dibandingkan population size = 4 Nilai K 56,00% 55,50% 55,00% 54,50% 54,00% 53,50% 53,00% 52,50% 52,00% 51,50% 51,00% KNN Gambar 3. Grafik Akurasi K-NN dengan K yang berbeda Hal ini berarti population size = 7 menghasilkan model klasifikasi yang lebih baik dibandingkan population size = 4, namun selisih perbedaan recall sebesar 0,7% lebih besar dibandingkan dengan selisih perbandingan precision yaitu sebesar 0,6. Tabel 2. Percobaan Pencarian Population size pada k=10 Population Inertia Weight Nilai K KNN PSO Accuracy Precision Recall A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Percobaan selanjutnya dilakukan percobaan inertia weight pada K=10, dan population size = 4 dan population size = 7. Tabel percobaan inertia Weight dapat dilihat pada Tabel 3 dan Tabel 4. Tabel 3. Percobaan Inertia Weight pada K=10 dan Population size = 4 Population Inertia Weight Nilai K KNN PSO Accuracy Precision Recall Pada percobaan population size = 4 nilai akurasi tertinggi didapat pada nilai bobot inersia = 0. 3 yaitu 91. 10% dengan nilai precision 92,46% dan recall 89. dimana dengan mengatur ulang population size = 4 meningkatkan akurasi model klasifikasi sebesar 0,20% dibandingkan dengan nilai bobot inersia = 0. Selanjutnya akan dilakukan percobaan population size = 7. Hasil percobaan dapat dilihat pada Tabel 4. Tabel 5. Percobaan inertia weight pada K=10 dan population size = 7 Population Inertia Weight Nilai K KNN PSO Accuracy Precision 83% 91. 07% 92. 10% 92. 72% 91. 70% 92. 15% 92. 90% 91. 90% 91. 90% 91. 90% 91. Recall A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Pada Tabel 5. Dapat dilihat bahwa nilai akurasi tertinggi didapat melalui kombinasi K=10, inertia weight = 0,6, dan population size = 7 yaitu sebesar 91,15% dengan nilai precision 92,51% dan recall 89,53%. Nilai akurasi mengalami peningkatan jika dibandingkan dengan inertia weight = 0. 1 pada Tabel 3. Selisih akurasinya sebesar 0,25%, sedangkan selisih akurasi antara penggunaan population size = 4 dengan population size = 7 adalah 0,05%. Perbandingan nilai Akurasi KNN dengan KNN-PSO dapat dilihat pada Gambar 4. 100,00% 90,00% 80,00% 70,00% 60,00% 50,00% 40,00% 30,00% 20,00% 10,00% 0,00% 91,10% 91,15% KNN-PSO POPSIZE=4 Inertia Weight =0,3 KNN-PSO POPSIZE=7 Inertia Weight =0,6 55,60% KNN Gambar 4. Perbandingan Akurasi KNN dengan KNN-PSO Pada Gambar 4. Jelas terlihat bahwa terdapat peningkatan pada akurasi KNN setelah diterapkan PSO. Namun kombinasi parameter PSO memiliki perbedaan akurasi yang sedikit. Perbandingan akurasi KNN-PSO pada 2 percobaan population size dapat dilihat pada Gambar 5. 91,15% 91,10% 91,07% 91,07% 91,05% 91,20% 91,10% 91,00% 90,93% 90,90% 90,83% 90,75% 90,80% 91,03% 90,90% 90,90% 90,90% 90,90% 90,85% 90,80% 90,78% 90,72% 90,70% 90,70% 90,60% KNN-PSO POPSIZE=4 KNN-PSO POPSIZE=7 Gambar 5. Perbandingan Akurasi KNN-PSO dengan Perbedaan Population Size A 2025 The Author. Published by UNITY ACADEMY . This is an open access article under the CC BY-SA license . ttp://creativecommons. org/licenses/by-sa/4. Jurnal Ilmu Komputer dan Sistem Informasi (JIRSI) Volume: 4. Nomor: 1. Januari 2025: 23-38 https://jurnal. unity-academy. id/index. php/jirsi/index e-ISSN 2830-3954 p-ISSN 2830-6031 Walaupun terdapat peningkatan akurasi pada population size =7 tetap diperlukan uji t-berpasangan pada kedua percobaan dengan population size yang Hal ini dilakukan dengan tujuan mengetahui signifikansi perbedaan antara Tabel uji t-berpasangan terhadap akurasi KNN dengan KNN-PSO dengan kombinasi Population size = 4 dan inertia weight = 0,3 dapat dilihat pada Tabel 6. Tabel 6. Hasil Uji T-Berpasangan dari kombinasi KNN-PSO t-Test: Paired Two Sample for Means Mean Variance Observations Pearson Correlation Hypothesized Mean Difference t Stat P(T<=. one-tail t Critical one-tail P(T<=. two-tail t Critical two-tail 0,9083 0,9093 0,909266667 0,909256 2,4675E-06 1,9E-06 0,477324829 0,013144248 0,494917297 1,859548038 0,989834594 2,306004135 Berdasarkan uji t-berpasangan dapat dilihat bahwa nilai t hitung yang diwakili oleh t stat sebesar 0,013144248 lebih kecil dibandingkan nilai t tabel yang diwakili oleh t critical two tail yaitu 2,306004135 yang mana thitung