Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. No. April 2026, hlm. p-ISSN: 2355-7699 e-ISSN: 2528-6579 GREY WOLF OPTIMIZER UNTUK SELEKSI FITUR PADA DETEKSI KECACATAN PERANGKAT LUNAK Muhammad Zain Fawwaz Nuruddin Siswantoro*,1. Darlis Herumurti 2 Universitas Internasional Semen Indonesia. Gresik, 2 Institut Teknologi Sepuluh Nopember. Surabaya Email: 1muhammad. siswantoro@uisi. id, 2darlis@its. Penulis Korespondensi (Naskah masuk: 09 Januari 2024, diterima untuk diterbitkan: 17 November 2. Abstrak Deteksi kecacatan perangkat lunak berperan penting dalam mengidentifikasi komponen yang berpotensi bermasalah sebelum kegagalan terjadi. Meskipun prediksi kecacatan dapat mengoptimalkan waktu pengembangan, menurunkan biaya, dan meningkatkan kepuasan pelanggan, efektivitasnya sangat bergantung pada pemilihan fitur yang relevan untuk model klasifikasi. Penelitian ini mengevaluasi penerapan Grey Wolf Optimizer (GWO) untuk seleksi fitur pada deteksi kecacatan perangkat lunak menggunakan Support Vector Machine (SVM), serta membandingkan kinerjanya dengan Genetic Algorithm (GA). Particle Swarm Optimization (PSO), dan Firefly Algorithm (FFA). Evaluasi dilakukan pada 12 dataset dari NASA Metrics Data Program (NASA MDP) dengan penerapan Synthetic Minority Oversampling Technique (SMOTE) untuk menangani ketidakseimbangan Hasil menunjukkan bahwa seleksi fitur berbasis GWO secara konsisten meningkatkan performa SVM dibandingkan penggunaan semua fitur, serta secara signifikan mengungguli metode berbasis GA. PSO, dan FFA pada seluruh dataset. Kata kunci: seleksi fitur, deteksi kecacatan perangkat lunak. GWO. SVM GRAY WOLF OPTIMIZER FOR FEATURE SELECTION IN SOFTWARE DEFECT DETECTION Abstract Software defect detection plays a crucial role in identifying potentially faulty components before failures occur. While defect prediction can optimize development time, reduce costs, and enhance customer satisfaction, its effectiveness largely depends on selecting the most relevant features for classification models. This study evaluates the application of the Grey Wolf Optimizer (GWO) for feature selection in software defect detection using a Support Vector Machine (SVM) and compares its performance with Genetic Algorithm (GA). Particle Swarm Optimization (PSO), and Firefly Algorithm (FFA). The evaluation, conducted on 12 datasets from the NASA Metrics Data Program (NASA MDP), incorporates the Synthetic Minority Oversampling Technique (SMOTE) to address class imbalance. Results show that GWO-based feature selection consistently improves SVM performance over using all features and significantly outperforms GA-. PSO-, and FFA-based approaches across all datasets. Keywords: feature selection, software defect detection. GWO. SVM menghasilkan perangkat lunak yang lebih konsisten dan dapat diandalkan. Oleh karena itu, prediksi kecacatan memiliki peran krusial dalam mencapai kualitas perangkat lunak dengan mengambil pembelajaran dari kesalahan-kesalahan sebelumnya (Rawat & Dubey, 2. Selama dekade terakhir, model klasifikasi telah banyak digunakan untuk mendeteksi kecacatan perangkat lunak secara otomatis. Hal ini karena model klasifikasi dapat secara otomatis mempelajari pola dari data kecacatan dalam perangkat lunak yang pernah terjadi sebelumnya. Pola ini kemudian akan digunakan oleh model untuk mendeteksi kecacatan PENDAHULUAN Deteksi kecacatan perangkat lunak merupakan proses untuk mengidentifikasi kecacatan dalam perangkat lunak sebelum memasuki tahap pengujian. Dalam penelitian ini, cacat perangkat lunak didefinisikan sebagai ketidaksesuaian antara perilaku aktual perangkat lunak dengan spesifikasi atau menyebabkan kegagalan fungsi atau hasil yang salah (Ie, 2. Deteksi kecacatan berkontribusi pada optimalisasi waktu pengembangan, pengurangan biaya, penurunan pekerjaan ulang, serta peningkatan kepuasan pelanggan, yang pada akhirnya 274 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2026, hlm. perangkat lunak yang lain (Siswantoro & Yuhana. Beberapa model klasifikasi telah berhasil digunakan dalam mendeteksi kecacatan perangkat lunak secara efektif pada penelitian sebelumnya, seperti k-Nearest Neighbors . -NN) (Hammad dkk. Nayve Bayes (NB) (Ji dkk. , 2. Support Vector Machine (SVM) (Rong dkk. , 2. Artificial Neural Network (ANN) (Jayanthi & Florence, 2. dan Decision Tree (DT) (Marian dkk. , 2. Salah satu faktor penting yang menentukan performa model klasifikasi dalam mendeteksi kecacatan perangkat lunak adalah pemilihan fitur Dataset yang digunakan untuk melatih model klasifikasi pendeteksi kecacatan perangkat lunak biasanya memiliki banyak fitur. Namun, tidak semua fitur tersebut berkontribusi secara signifikan terhadap identifikasi kecacatan perangkat lunak. Proses seleksi fitur akan membantu mengidentifikasi subset fitur yang paling relevan dan informati serta mengurangi dimensi data. Dengan mengeliminasi fitur yang kurang relevan, seleksi fitur dapat meningkatkan akurasi deteksi dan mengoptimalkan waktu pelatihan model (Balogun dkk. , 2. Beberapa peneliti menggunakan metode optimisasi metaheuristik yang terispirasi dari perilaku alam untuk mencari subset fitur yang paling berpengaruh terhadap pendeteksian kecacatan perangkat lunak. Metode optimisasi yang umum digunakan untuk seleksi fitur diantaranya Genetic Algorithms (GA) (Kumar & Das, 2023. Wahono & Herman, 2. Particle Swarm Optimization (PSO) (Malhotra dkk. , 2. , dan Firefly algorithm (FFA) (Anbu & Anandha Mala, 2. Metode tersebut mencari kombinasi fitur terbaik dengan berevolusi mengikuti pola tertentu untuk meaksimumkan performa model klasifikasi. Wahono, dkk . mengusulkan kombinasi GA dan teknik bagging untuk meningkatkan akurasi prediksi kecacatan perangkat lunak. GA digunakan untuk pemilihan fitur, sedangkan teknik bagging ketidakseimbangan jumlah observasi pada kelas positif dan kelas negatif. Sepuluh model klasifikasi, diantaranya Logistic Regression (LR). Linear Discriminant Analysis (LDA). NB, k-NN. K*. ANN. SVM. DT. C4. CART, dan Random Forest (RF), digunakan dalam penenlitian ini untuk mendeteksi kecacatan perangkat lunak pada sembilan datset dari projek NASA Metrict Data Program (NASA MDP). Fungsi objektif yang digunakan dalam penelitian ini adalah kombinasi linier antara akurasi dan invers dari feature cost. Hasil eksperimen menunjukkan bahwa pemilihan fitur menggunakan GA dan teknik bagging dapat meningkatkan UAC-ROC model klasifikasi pada sebagian dataset saja. Kumar, dkk . juga mengusulkan metode pemilihan fitur berbasis GA untuk mendeteksi kecacatan perangkat lunak. Tiga model klasifikasi, yaitu k-NN. DT, dan NB, digunakan untuk mendeteksi kecacatan perangkat lunak pada 12 dataset dari NASA MDP. Dalam penelitian ini prediction error digunakan sebagai fungsi objektif yang dicari nilai minimumnya oleh GA. Hasil eksperimen menunjukkan bahwa metode pemilihan fitur yang diusulkan berhasil mengingkatan akurasi ketiga model pada semua dataset. Malhotra, dkk . mengusulkan metode pemilihan fitur menggunakan PSO biner untuk memprediksi kecacatan perangkat lunak. Pada penelitian Binary Cross-Entropy digunakan sebagai fungsi obejektif yang diminimumkan oleh PSO biner. Hasil eksperimen pada model ANN menunjukkan bahwa metode yang diusulkan dapat meningkatkan UAC-ROC model ANN dalam memprediksi kecacatan perangkat lunak. Namun demikian metode ini hanya digunakan pada empat dataset NASA MDP. Anbu dan Mala . menggunakan FFA untuk mencari subset fitur terbaik dalam memprediksi kecacatan perangkat lunak. SVM. dan k-NN digunakan untuk mengklasifikasikan fitur terpilih dalam penelitian ini. Fungsi objektif yang digunakan dalam penelitian ini adalah jumlahan terboboti dari proporsi fitur terpilih dan invers F Meskipun metode yang diusulkan dapat meningkatkan performa ketiga model, namun metode ini hanya dievaluasi menggunakan satu dataset dari NASA MDP. Grey Wolf Optimizer (GWO) adalah algoritma optimisasi yang terinspirasi oleh perilaku kelompok serigala abu-abu dalam mencari mangsa (Mirjalili , 2. Kemampuan GWO terletak pada ketangkasannya dalam menyesuaikan parameter dan mencapai solusi optimum dalam berbagai jenis masalah optimisasi. Algoritma ini memanfaatkan langkah-langkah pencarian serigala yang cerdas dan koordinatif, seperti pemilihan serigala alpha, beta, dan delta yang menggambarkan peran pemimpin dalam kelompok. Dengan pendekatan ini. GWO mampu menyelesaikan masalah kompleks dengan cepat dan efisien, membuatnya menjadi pilihan yang menarik untuk berbagai aplikasi, termasuk dalam konteks pemilihan fitur dalam deteksi kecacatan perangkat lunak. GWO telah terbukti efektif dalam menangani berbagai tantangan optimisasi, dan daya adaptasinya membuatnya menjadi alat yang handal untuk mencapai solusi optimal dalam berbagai Penelitian ini bertujuan untuk mengusulkan penggunaan GWO dalam seleksi fitur untuk model SVM pada deteksi kecacatan perangkat lunak. Penelitian ini akan menilai sejauh mana GWO dapat meningkatkan akurasi klasifikasi SVM dan seberapa efisien algoritma ini dalam memilih subset fitur yang relevan dari dataset. Penelitian ini berfokus pada perbandingan kinerja empat metode optimisasi metaheuristik populer (GWO. GA. PSO, dan FFA) dalam seleksi fitur untuk deteksi kecacatan perangkat lunak berbasis SVM. Siswanto & Herumurti, dkk. Grey Wolf Optimizer A 275 Gambar 1. Alur Penelitian Meskipun masing-masing metode telah digunakan secara terpisah dalam literatur, belum ada studi yang membandingkan kinerjanya secara sistematis pada seluruh dataset NASA MDP dengan penanganan ketidakseimbangan kelas menggunakan SMOTE. Perbandingan ini penting untuk memberikan panduan berbasis bukti bagi peneliti dan praktisi dalam memilih metode seleksi fitur yang optimal untuk konteks data serupa. METODE PENELTIAN Metode yang digunakan dalam penelitian ini mencakup pemilihan dataset, penyeimbangan kelas, seleksi fitur dengan Grey Wolf Optimizer (GWO), penggunaan Support Vector Machine (SVM) sebagai model klasifikasi, serta evaluasi model yang telah dilatih menggunakan fitur terpilih. Gambaran alur penelitian ini dapat dilihat pada Gambar 1. 1 Pengumpulan Data Untuk mengevaluasi metode pemilihan fitur yang diusulkan, penelitian ini menggunakan 12 dataset dari projek NASA Metrict Data Program (NASA MDP) yang terdiri dari CM1. JM1. KC1. KC3. MC1. MC2. MW1. PC1. PC2. PC3. PC4, dan PC5 (Gray dkk. , 2. Dataset ini dipilih karena banyak digunakan dalam penelitian sebelumnya sehingga memungkinkan perbandingan kinerja dengan studi terdahulu serta memastikan replikasi penelitian oleh pihak lain. Selain itu, dataset NASA MDP memiliki keragaman karakteristik . umlah fitur, jumlah instance, dan distribusi kela. yang memadai untuk menguji ketahanan metode yang diusulkan. Dataset ini difokuskan pada pengumpulan data empiris terkait dengan kecacatan perangkat lunak di berbagai proyek yang dilakukan oleh NASA. Informasi yang tercakup meliputi jumlah cacat yang teridentifikasi dalam setiap projek, ukuran kode sumber, dan upaya yang dilakukan dalam pengembangan perangkat lunak. Para peneliti seringkali memanfaatkan dataset NASA MDP ini untuk menyelidiki bagaimana berbagai metrik perangkat lunak berhubungan dengan kemunculan cacat perangkat lunak. Tabel 1 menampilkan ringkasan 12 dataset NASA MDP yang digunakan dalam penelitian ini. Penelitian ini menggunakan dataset yang telah melalui pemrosesan awal seperti dilaporkan dalam (Shepperd dkk. , 2. Pemrosesan pertama dilakukan untuk menghilangkan data yang bermasalah seperti data dengan nilai fitur yang bertentangan atau tidak masuk akal. Kemudian dilanjutkan dengan menghilangkan data yang tidak meningkatkan akurasi prediksi kecacatan perangkat lunak, seperti fitur yang nilainya kostan, dan data yang berulang atau tidak konsisten. Setiap dataset memiliki jumlah fitur dan jumlah observasi yang bervariasi dengan dua jenis output catat dan tidak Tabel 1. Ringkasan 12 Dataset NASA MDP Dataset Fitur CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Total Observasi Cacat Tidak Cacat 2 Penyeimbangan Kelas Berdasarkan data yang diberikan pada Tabel I, terlihat adanya ketidakseimbangan yang signifikan antara jumlah observasi pada kelas cacat dan tidak cacat pada dataset NASA MDP. Jumlah observasi pada kelas tidak cacat jauh lebih dominan dibandingkan dengan kelas cacat. Untuk mengatasi ketidakseimbangan ini, diperlukan strategi khusus dalam pengolahan data sebelum digunakan dalam Penelitian Synthetic Minority Oversampling Technique (SMOTE) (Chawla dkk. untuk mengatasi masalah kelas yang tidak SMOTE adalah metode oversampling yang digunakan untuk menangani ketidakseimbangan kelas pada dataset, khususnya pada tugas klasifikasi di mana kelas minoritas . alam penelitian ini, kelas caca. memiliki jumlah observasi yang lebih sedikit. SMOTE bekerja dengan membuat sampel-sampel sintetis baru pada kelas minoritas dengan tahapan sebagai berikut: 276 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2026, hlm. Pilih observasi pada kelas minoritas sebagai titik awal untuk membuat observasi sintetis. Pilih tetangga-tetangga dari observasi tersebut dalam ruang fitur. Jumlah tetangga yang dipilih adalah parameter yang dapat diatur sebelumnya. Untuk setiap tetangga yang dipilih, observasi sintetis baru dibuat dengan menggunakan perbedaan antara fitur pada observasi minoritas awal dan tetangga tersebut. Perbedaan ini kemudian dikalikan dengan bilangan random dalam interval . dan hasilnya ditambahkan ke observasi awal. Observasi sintetis yang baru dibuat kemudian digabungkan dengan dataset asli. Proses ini diulang sebanyak yang diperlukan untuk mencapai tingkat oversampling yang diinginkan. 3 Seleksi Fitur dengan Grey Wolf Optimizer Grey Wolf Optimizer (GWO) merupakan algoritma optimasi yang terinspirasi dari perilaku sosial serigala abu-abu (Canis lupu. dalam mencari Dikembangkan pada tahun 2014 oleh Mirjalili et al. (Mirjalili dkk. , 2. GWO dirancang untuk menyelesaikan masalah optimasi dengan cara mensimulasikan tiga tingkatan hierarki dalam kelompok serigala abu-abu, yaitu serigala alpha (), beta (), dan delta (). Serigala sebagai pemimpin tertinggi, sebagai pemimpin kedua, dan sebagai pemimpin ketiga. Selain itu, terdapat serigala omega (O) yang pergerakannya dalam mencari mangsa mengikuti serigala , , dan . Posisi setiap serigala diwakili oleh solusi kandidat dalam ruang pencarian. Cara kerja GWO melibatkan pembaruan secara iteratif posisi serigala berdasarkan formula matematika yang memodelkan interaksi sosial dalam Misalkan Y. dan Ym. masing-masing adalah posisi serigala dan mangsa pada iterasi ke-i, maka posisi serigala pada iterasi selanjutnya dapat dimodelkan menggunakan . , . , . , dan . , . yaA = 2ycaya1 Oe yca yaC = 2ya2 yaE = . Oe yao. cn )| . = yaoyco . cn ) Oe yaA. yaE dengan a adalah konstanta yang nilainya berkurang secara linier dari 2 ke 0 selama proses iterasi, serta r1 dan r2 adalah vektor random yang elemennya berasal dari interval . Pada kenyataannya posisi mangsa yang merupakan solusi terbaik tidak diketahui. Oleh karena itu, pergerakan serigala pada setiap iterasi akan mengikuti pergerakan serigala , , dan . Hal ini didasarkan pada asumsi bahwa posisi serigala , , dan berada paling dekat ke mangsa. Sehingga pergerakan serigala pada setiap iterasi dapat dimodelkan menggunakan . , . , dan . , yaEyc = . aCyc . cn ) Oe yao. cn )| Cyc = yaoyc . cn ) Oe yaAyc . yaEyc C yao Cyu yao Cyu ) yao. = . ao 3 yu dengan s = , , . As dan Cs masing-masing adalah vektor koefsien yang dibangkitkan menggunakan . Ys. adalah posisi dari serigala , , dan pada iterasi ke-i. Misalkan terdapat N fitur dalam dataset, maka posisi serigala dapat dinyatakan sebagai vektor yao = . c1 , yc2 . A , ycycA ) dengan ycyc OO . , yc = 0,1,2. A , ycA. Setiap elemen Y mewakili kehadiran atau ketidakhadiran fitur tertentu dalam subset fitur yang Jika ycyc Ou 0. 5, maka fitur ke-j terpilih masuk ke dalam subset yang dipertimbangkan, selain itu maka fitur ke-j tidak termasuk ke dalam subset yang Pada setiap iterasi, serigala , , dan dipilih dari populasi yang posisinya paling dekat ke mangsa, yaitu vektor Y yang nilai fungsi objektifnya paling kecil pertama, kedua, dan ketiga. Pada penelitian ini, nilai fungsi objektif Y didefinisikan sebagai negatif dari akurasi klasifikasi model yang dilatih menggunakan subset fitur terpilih berdasarkan posisi Y. Jumlah populasi serigala yang digunakan pada setiap iterasi adalah 10 dan maksimum iterasi adalah 20. Penelitian ini menggunakan implementasi GWO dari pustaka MEALPY (Van Thieu & Mirjalili, 2. , sebuah Pustaka metaheuristik dalam bahasa Python. 4 Support Vector Machine Penelitian ini menggunakan Support Vector Machine (SVM) untuk mendeteksi kecacatan perangkat lunak berdasarkan subset fitur yang terpilih menggunakan GWO. SVM adalah suatu metode klasifikasi dalam pembelajaran mesin yang sangat efektif, terutama dalam menangani masalah klasifikasi biner. SVM bertujuan untuk menemukan hyperplane terbaik yang memisahkan dua kelas dalam ruang fitur. Hyperplane ini dipilih sedemikian rupa sehingga memiliki margin maksimum, yaitu jarak terdekat antara titik-titik pelatihan dan Persamaan hyperplane dari SVM untuk kasus klasifikasi biner linear dinyatakan seperti pada . , ycA yc. = Oc yuycn ycycn ya. a, ya ycn ) yca ycn=1 . ) dengan x adalah fitur dari observasi, i dan b masingmasing adalah bobot dan bias yang dihitung selama proses pelatihan, yi dan xi masing-masing adalah label kelas dan fitur pada data pelatihan. ,x. adalah fungsi kernel yang menghitung produk skalar antara fitur dari observasi dan fitur pada data pelatihan, dan N adalah jumlah data pelatihan. Sebuah observasi akan diklasifikasikan sebagai kelas postif jika y. > 0, jika tidak maka sebagai kelas negatif (Bishop, 2. Dalam penelitian ini, digunakan fungsi kernel radial basis function (RBF) sebagai salah satu elemen kunci dalam SVM, seperti pada . Fungsi kernel RBF, juga dikenal sebagai Gaussian kernel, memungkinkan SVM untuk menangani kasus-kasus Siswanto & Herumurti, dkk. Grey Wolf Optimizer A 277 non-linear dan dapat memetakan data ke dalam dimensi yang lebih tinggi. Fungsi RBF mengukur sejauh apa suatu observasi dari observasi-observasi lainnya dalam ruang fitur, dengan memperhitungkan hyperparameter . Penggunaan kernel RBF memungkinkan SVM untuk bekerja efektif dengan data yang memiliki distribusi yang kompleks, memungkinkan model untuk menyesuaikan dengan pola-pola non-linear dan meningkatkan kemampuan prediksi pada dataset yang lebih kompleks. Penelitian ini menggunakan implementasi SVM dari pustaka Scikit-learn (Pedregosa dkk. , 2. dengan standar hyperparameter. a, ya A ) = exp(OeyuAnya Oe ya A A. 5 Evaluasi Model Setiap dataset NASA MDP dibagi menjadi dua subset yang saling lepas yaitu data pelatihan . %) dan data pengujian . %) menggunakan sampling random terstratifikasi (Alpaydin, 2. Data pelatihan kemudian digunakan untuk melatih model SVM menggunakan fitur terpilih, sedangkan data pengujian digunakan untuk mengevaluasi model yang terlah dilatih. Evaluasi model SVM dilakukan dengan menggunakan beberapa metrik kinerja menunjukkan seberapa baik metode fitur seleksi yang diusulkan dapat meningkatkan kinerja model klasifikasi secara holistik. Pertama-tama, akurasi klasifikasi digunakan sebagai indikator keseluruhan sejauh mana model mampu mengklasifikasikan data dengan benar. Misalkan TP adalah banyak observasi dalam data pengujian dari kelas positif . yang diklasifikasikan sebagai positif oleh model. TN adalah banyak observasi dalam data pengujian dari kelas negatif . idak caca. yang diklasifikasikan sebagai negatif oleh model. FP adalah banyak observasi dalam data pengujian dari kelas negatif yang diklasifikasikan sebagai positif oleh model, dan FN adalah banyak observasi dalam data pengujian dari kelas positif yang diklasifikasikan sebagai negatif oleh model, maka akurasi klasifikasi . dapat dihitung menggunakan . ycaycayca = ycNycE ycNycA ycNycE ycNycA yaycE yaycA Selanjutnya, precision dan recall digunakan sebagai ukuran tambahan tentang kemampuan model dalam mengidentifikasi kelas tertentu. Precision mengukur proporsi observasi yang benar-benar positif dari total observasi yang diprediksi positif oleh model dan dihitung menggunakan . ycyycyceycaycnycycnycuycu = ycNycE ycNycE yaycE Kemudian, recall mengukur proporsi observasi yang benar-benar positif dari total observasi yang seharusnya positif dan dihitung menggunakan . ycyceycaycaycoyco = ycNycE ycNycE yaycA Terakhir. F1 score adalah metrik mengkombinasikan precision dan recall untuk memberikan ukuran komprehensif tentang kinerja model dan dihitung menggunakan . ya1 = 2 y ycEycyceycaycnycycnycuycu y ycIyceycaycaycoyco ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco HASIL DAN PEMBAHASAN Pada penelitian ini telah dilakukan beberapa eksperimen untuk menguji performa model SVM dilatih menggunakan fitur terseleksi berbasis GWO pada 12 dataset NASA MDP. Selain itu model SVM juga dilatih menggunakan semua fitur asal dari setiap Sebagai perbandingan model SVM juga dilatih menggunakan fitur terseleksi berbasis genetic algorithm (GA) (Whitley, 1. , particle swarm optimization (PSO) (Kennedy & Eberhart, 1. , firefly algorithm (FFA) (Arora & Singh, 2. Hasil eksperimen yang telah dilakukan disajikan pada Tabel 2 sampai dengan Tabel 5. Tabel 2 menyajikan akurasi model SVM yang dilatih menggunakan semua fitur dan fitur terseleksi dalam mendeteksi kecacatan perangkat lunak. Dengan menggunakan semua fitur, akurasi model SVM berkisar antara 61. 22% hingga 92. 69% pada 12 dataset NASA MDO. Di lain pihak, pendekatan seleksi fitur berbasis GWO menonjol sebagai metode yang efektif, dengan akurasi yang secara konsisten lebih tinggi, yaitu antara 65. 06% hingga 96. Lebih lanjut akurasi model SVM yang dilatih menggunakan fitur terseleksi berbasis GWO juga lebih unggul daripada menggunakan fitur terseleksi berbasis GA. PSO, dan FFA. Secara rata-rata. SVM yang dilatih dengan fitur terseleksi menggunakan GWO mencapai akurasi 40%, melampaui akurasi dengan semua fitur . 08%) dan melampaui hasil dari algoritma GA . 33%). PSO . 45%), dan FFA . 08%). Hasil ini menunjukkan bahwa GWO memiliki potensi yang kuat dalam meningkatkan kinerja SVM pada deteksi kecacatan perangkat lunak, memberikan kontribusi signifikan terhadap peningkatan akurasi model klasifikasi. Tabel 3 menyajikan precision model SVM yang dilatih dengan semua fitur dan fitur terseleksi berbasis GWO. GA. PSO, dan FFA. Precision mengukur sejauh mana hasil positif dari model SVM benarbenar relevan. Dalam konteks ini, precision menyatakan persentase dari prediksi positif yang benar terhadap total prediksi positif. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. No. April 2026, hlm. p-ISSN: 2355-7699 e-ISSN: 2528-6579 Tabel 2. Akrurasi Model SVM Yang Dilatih Menggunakan Semua Fitur dan Fitur Terseleksi Berbasis GWO. GA. PSO. Dan FFA Dataset CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Rata-rata Semua 81,29 64,27 65,13 76,84 88,59 61,22 78,68 85,79 92,69 84,81 87,39 70,30 78,08 Akurasi (%) 90,64 64,78 66,09 83,16 89,11 79,59 82,35 86,56 95,89 87,10 90,09 72,58 82,33 GWO 91,23 65,06 66,28 84,21 89,62 81,63 84,56 89,92 96,80 87,10 91,29 73,12 83,40 PSO 90,06 64,76 66,09 82,11 89,02 71,43 81,62 88,11 94,52 86,40 90,69 72,58 81,45 FFA 90,64 64,73 65,90 82,11 89,28 73,47 82,35 88,89 96,35 87,10 90,99 73,12 82,08 Tabel 3. Precision Model SVM yang Dilatih Menggunakan Semua Fitur Dan Fitur Terseleksi Berbasis GWO. GA. PSO. Dan FFA Dataset CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Rata-rata Semua 83,12 65,16 67,16 78,11 88,60 61,03 79,17 86,39 93,68 85,25 88,03 70,35 78,84 Precision (%) 91,49 65,89 67,97 84,21 89,20 79,52 82,45 87,23 96,23 87,48 90,73 73,16 82,96 GWO 91,52 66,03 68,33 84,64 89,64 81,94 85,13 90,63 97,02 87,60 91,77 73,12 83,95 Dengan menggunakan semua fitur, precision model SVM berkisar antara 61. 03% hingga 93. untuk 12 dataset NASA MDP. Seperti halnya pada akurasi, model SVM yang dilatih dengan fitur terseleksi menggunakan GWO menghasilkan precision yang lebih tinggi dari pada dilatih semua dengan semua fitur, yaitu berkisar antara 66. Secara konsisten, metode seleksi fitur berbasis GWO menunjukkan precision yang lebih baik dengan rata-rata 83. 95%, dibandingkan dengan GA . 96%). PSO . 18%), dan FFA . 67%). Temuan ini menunjukkan bahwa GWO tidak hanya efektif dalam meningkatkan akurasi, tetapi juga memberikan kontribusi positif dalam meningkatkan presisi model SVM, memperkuat validitas pendekatan seleksi fitur ini untuk meningkatkan kualitas deteksi kecacatan perangkat lunak. Tabel 4 menggambarkan hasil recall model SVM yang dilatih dengan semua fitur dan fitur terseleksi menggunakan GWO. GA. PSO, dan FFA. Recall, atau juga dikenal sebagai sensitivity, mengukur kemampuan model untuk mengidentifikasi instan positif. Dengan kata lain, recall mengukur sejauh mana model dapat mengidentifikasi dan mengingat kembali instan positif yang sebenarnya. Seperti tampak pada Tabel 4. SVM dengan fitur terseleksi menggunakan GWO menghasilkan recall yang konsisten lebih tinggi, antara 65. 06% hingga 80%, dibandingkan dengan SVM yang dilatih PSO 91,36 65,65 68,07 83,39 89,04 71,97 81,62 89,36 94,85 87,09 91,16 72,58 82,18 FFA 90,74 65,83 67,81 83,39 89,30 73,75 82,78 89,94 96,51 87,25 91,59 73,13 82,67 dengan semua fitur maupun menggunakan metode seleksi fitur lainnya. Rata-rata recall SVM dengan GWO mencapai 83. 40%, melebihi recall dengan semua fitur . 08%) dan melampaui recall dari algoritma seleksi fitur lainnya, yaitu GA . 33%), PSO . 45%), dan FFA . 08%). Hasil ini mengindikasikan bahwa GWO efektif dalam meningkatkan kemampuan model untuk mengenali instan positif, yang penting untuk mengukur kesanggupan model dalam mendeteksi kecacatan perangkat lunak. Tabel 5 menampilkan hasil F1 score dari model SVM yang dilatih dengan semua fitur dan fitur terseleksi menggunakan GWO. GA. PSO, dan FFA. F1 Score menggabungkan informasi tentang precision dan recall untuk memberikan evaluasi yang holistik terhadap performa model klasifikasi. Dalam konteks ini. F1 score memberikan nilai yang seimbang antara kemampuan model dalam memberikan prediksi yang tepat dan kemampuan model dalam mengidentifikasi instance positif yang Hasil eksperimen menunjukkan bahwa SVM dengan fitur terseleksi menggunakan GWO memberikan F1 score yang lebih tinggi secara konsisten dibandingkan dengan SVM yang dilatih dengan semua fitur atau menggunakan metode seleksi fitur lainnya. Rata-rata F1 score SVM dengan GWO 25%, melebihi rata-rata dengan semua fitur . 83%) dan melampaui rata-rata dari algoritma seleksi fitur lainnya. Hasil ini menegaskan bahwa Siswanto & Herumurti, dkk. Grey Wolf Optimizer A 279 GWO memiliki kontribusi signifikan dalam meningkatkan keseimbangan antara precision dan recall pada deteksi kecacatan perangkat lunak, yang esensial dalam evaluasi kinerja model klasifikasi. Tabel 4. Recall Model SVM yang Dilatih Menggunakan Semua Fitur Dan Fitur Terseleksi Berbasis GWO. GA. PSO. Dan FFA Dataset CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Rata-rata Semua 81,29 64,27 65,13 76,84 88,59 61,22 78,68 85,79 92,69 84,81 87,39 70,30 78,08 GWO 91,23 65,06 66,28 84,21 89,62 81,63 84,56 89,92 96,80 87,10 91,29 73,12 83,40 Precision (%) 90,64 64,78 66,09 83,16 89,11 79,59 82,35 86,56 95,89 87,10 90,09 72,58 82,33 PSO 90,06 64,76 66,09 82,11 89,02 71,43 81,62 88,11 94,52 86,40 90,69 72,58 81,45 FFA 90,64 64,73 65,90 82,11 89,28 73,47 82,35 88,89 96,35 87,10 90,99 73,12 82,08 Tabel 5. F1 Score Model SVM yang Dilatih Menggunakan Semua Fitur Dan Fitur Terseleksi Berbasis GWO. GA. PSO. Dan FFA Dataset CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Rata-rata Precision (%) Semua GWO PSO FFA 81,00 63,51 64,30 76,40 88,59 60,96 78,62 85,65 92,64 84,80 87,28 70,22 77,83 91,21 64,31 65,51 84,10 89,62 81,63 84,52 89,82 96,80 87,09 91,23 73,12 83,25 90,59 63,93 65,38 82,93 89,10 79,52 82,30 86,43 95,88 87,10 90,01 72,31 82,12 89,97 64,04 65,34 81,82 89,02 71,42 81,62 87,94 94,51 86,38 90,63 72,55 81,27 90,64 63,88 65,16 81,82 89,28 73,47 82,32 88,74 96,34 87,10 90,92 73,09 81,90 Untuk memastikan bahwa perbedaan performa antar metode berbeda secara signifikan, dilakukan uji Friedman dengan yu = 0,05 pada seluruh metrik yang digunakan dalam evaluasi . kurasi, presisi, recall, dan F1-scor. Hasil uji Friedman dapat dilihat pada Tabel 6. Dari Tabel 6 dapat dilihat bahwa semua metrik memiliki p-value < 0,05, hal ini menunjukkan bahwa terdapat perbedaan signifikan di antara metode yang diuji. Tabel 6. Hasil uji Friedman untuk semua metrik evaluasi Metrik Chi-square p-value Akurasi Precision Recall F1-score 45,6190 44,3809 45,6190 43,9048 3,76y10AA 1,05y10AA 3,76y10AA 1,16y10AA Untuk mengetahui hasil seleksi fitur menggunakan GWO berbeda secara signifikan dengan metode lain, dilakukan uji post-hoc Wilcoxon berpasangan dengan koreksi Holm yang hasilnya dapat dilihat pada Tabel 7. Dari Tabel 7 dapat dilihat bahwa hasil perbandingan GWO dengan metode lain memiliki p-value kurang dari 0,05 pada semua Hasil ini menunjukkan bahwa hasil pemilihan fitur menggunakan GWO terbukti lebih baik secara signifikan dibanding menggunakan semua fitur, serta hasil seleksi fitur menggunakan GA. PSO, dan FFA pada seluruh metrik evaluasi. Tabel 8 menyajikan jumlah fitur yang terseleksi oleh GWO. GA. PSO, dan FFA untuk berbagai Hasil eksperimen menunjukkan variasi yang signifikan dalam jumlah fitur yang terseleksi untuk setiap metode. Secara rata-rata. GWO menghasilkan subset fitur yang lebih kompak dengan rata-rata Dengan demikian, secara rata-rata GWO berhasil mereduksi lebih dari 50% fitur yang ada di dataset asal. Di lain pihak, rata-rata jumlah fitur yang terpilih dengan menggunakan GA. PSO, dan FFA masing-masing mencapai 18. 17, 18. 25, dan 17. Hasil ini mencerminkan keunggulan GWO dalam mengidentifikasi subset fitur yang lebih kecil namun tetap informatif untuk meningkatkan kinerja model SVM pada deteksi kecacatan perangkat lunak. Efisiensi pengurangan dimensi ini dapat membantu mengoptimalkan waktu komputasi dan memperjelas interpretabilitas model tanpa mengorbankan kualitas 280 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. No. April 2026, hlm. Tabel 7. Hasil uji post-hoc Wilcoxon dengan koreksi Holm untuk semua metrik evaluasi Metode 1 Metode 2 GWO GWO GWO GWO Semua fitur PSO FFA p-value Akurasi Precision Recall F1-score 0,0049 0,0167 0,0029 0,0202 Tabel 8. Jumlah Fitur Terseleksi Berbasis GWO. GA. PSO. Dan FFA Dataset CM1 JM1 KC1 KC3 MC1 MC2 MW1 PC1 PC2 PC3 PC4 PC5 Rata-rata Semua 34,75 GWO 14,75 KESIMPULAN Artikel ini menyajika penggunaan Grey Wolf Optimizer (GWO) dalam seleksi fitur pada model Support Vector Machine (SVM) untuk deteksi kecacatan perangkat lunak. Dalam eksperimen menggunakan 12 dataset dari projek NASA MDP diperoleh hasil bahwa model SVM yang dilatih menggunakan fitur yang diseleksi oleh GWO memiliki performa yang lebih baik, dalam hal akurasi, precision, recall, dan F1 score daripada yang dilatih dengan semua fitur pada dataset dalam mendeteksi kecacatan perangkat lunak. Secara ratarata fitur yang diseleksi menggunakan GWO dapat meningkatkan performa model SVM lebih dari 5%. Selain itu GWO juga menghasilkan fitur terpilih yang lebih baik jika dibandingkan dengan metode seleksi fitur berbasis Genetic Algorithms (GA). Particle Swarm Optimization (PSO), dan Firefly algorithm (FFA) secara signifikan. Namun demikian hasil penelitian ini berlaku pada dataset NASA MDP dengan karakteristik tertentu. Untuk memastikan generalisasi hasil, penelitian lanjutan pada domain dan dataset berbeda sangat disarankan. Selanjutnya untuk lebih meningkatkan performa model SVM dalam mendetksi kecacatan perangkat lunak. GWO SVM DAFTAR PUSTAKA