ISSN: 1979-7656 e-ISSN: 3031-0865 DOI: https://doi. org/10. 30989/teknomatika. Vol. No. Juni 2025, pp. Perbandingan Model CNN dan SVM untuk Klasifikasi Jenis Footwear pada Dataset Alas Kaki Berbasis Citra Gina Annisaa,1. Ninuk Wilianib,2 Program Studi Teknik Informatika Universitas Pancasila Jl. Lenteng Agung Raya No. Jagakarsa. Jakarta Selatan 4522210154@univpancasila. id, 2ninuk. wiliani@univpancasila. Penulis koresponden Diterima Direvisi Disetujui Dipublikasikan 05/1/2025 24/6/2025 26/6/2025 27/6/2025 ABSTRACT The classification of footwear types, such as boots, sandals, and shoes, is a significant challenge in the development of image recognition systems powered by artificial intelligence. This study aims to compare the performance of two popular classification models, namely Convolutional Neural Network (CNN) and Support Vector Machine (SVM), in recognizing footwear types. The dataset used is the Footwear-Shoe vs Sandal vs Boot Image Dataset, consisting of 3000 images for each category with a resolution of 136x102 pixels in RGB format. The methodology includes training and testing both models using optimized parameters to measure accuracy, precision, and computational efficiency. The results show that CNN achieves an accuracy of 98%, while SVM reaches an accuracy of 96%. The findings indicate that CNN is more suitable for applications requiring high accuracy, while SVM is an effective alternative in resource-constrained scenarios. This study offers significant contributions to understanding model performance in image-based footwear classification using machine learning. https://ejournal. id/index. php/teknomatika KEYWORDS Convolutional Neural Network (CNN) Support Vector Machine (SVM) Image Footwear dataset Machine ISSN: 1979-7656 e-ISSN: 3031-0865 ABSTRAK Klasifikasi jenis alas kaki, seperti boot, sandal, dan shoe, merupakan tantangan penting dalam pengembangan sistem pengenalan citra berbasis kecerdasan buatan. Penelitian ini bertujuan untuk membandingkan kinerja dua model klasifikasi populer, yaitu Convolutional Neural Network (CNN) dan Support Vector Machine (SVM), dalam mengenali jenis alas kaki. Dataset yang digunakan adalah Footwear-Shoe vs Sandal vs Boot Image Dataset, yang terdiri dari 3000 gambar untuk setiap kategori dengan resolusi 136x102 piksel dalam format RGB. Metodologi melibatkan pelatihan dan pengujian kedua model menggunakan parameter yang dioptimalkan untuk mengukur akurasi, presisi, dan efisiensi komputasi. Hasil penelitian menunjukkan bahwa CNN mencapai akurasi sebesar 98%, sementara SVM mencapai akurasi 96%. Hasil penelitian ini menunjukkan bahwa CNN lebih unggul dalam akurasi untuk aplikasi yang membutuhkan ketepatan tinggi, sedangkan SVM menjadi alternatif yang efektif dalam situasi dengan keterbatasan komputasi. Penelitian ini memberikan kontribusi signifikan terhadap pemahaman kinerja model dalam klasifikasi citra alas kaki berbasis machine learning. KATA KUNCI Convolutional Neural Network (CNN) Support Vector Machine (SVM) Klasifikasi Dataset alas kaki Machine This is an open access article under the CCAeBY-SA license. PENDAHULUAN Kemajuan teknologi dalam pengolahan citra dan kecerdasan buatan telah memberikan dampak yang signifikan di berbagai bidang, salah satunya adalah klasifikasi berbasis gambar . Salah satu tantangan yang dihadapi adalah bagaimana mengklasifikasikan objek dengan tingkat keakuratan yang tinggi, termasuk jenis alas kaki seperti boots, sandals, dan shoes . Klasifikasi jenis alas kaki memiliki manfaat luas, mulai dari mendukung aplikasi e-commerce hingga membantu sistem manajemen inventaris produk . Kebutuhan akan sistem klasifikasi yang andal dan efisien menjadi sangat penting seiring dengan meningkatnya penggunaan teknologi berbasis citra dalam berbagai sektor . Meskipun terdapat banyak pendekatan dalam klasifikasi citra, memilih metode yang paling sesuai untuk tugas spesifik tetap menjadi tantangan. Dua metode yang sering digunakan adalah Convolutional Neural Network (CNN) dan Support Vector Machine (SVM). Kedua metode ini memiliki karakteristik unik . , . , . CNN dikenal dengan kemampuannya dalam memahami fitur kompleks dalam citra melalui jaringan berlapis, sementara SVM sering diapresiasi karena efisiensinya dalam situasi dengan keterbatasan Namun, studi yang secara langsung membandingkan kedua model dalam konteks tertentu, seperti klasifikasi jenis alas kaki, masih terbatas dan memerlukan analisis lebih . , . Penelitian-penelitian sebelumnya telah menunjukkan potensi besar dari CNN dalam tugas klasifikasi objek berbasis citra. CNN mampu mengolah informasi fitur visual secara otomatis melalui lapisan konvolusi yang sangat efektif dalam menangkap pola kompleks . Di sisi lain. SVM banyak digunakan dalam berbagai aplikasi karena pendekatannya yang berbasis hiperplane, memungkinkan pengklasifikasian objek dengan efisiensi tinggi . , . Namun, belum banyak penelitian yang membandingkan kedua pendekatan ini secara langsung pada dataset alas kaki, sehingga terdapat kebutuhan mendesak untuk mengevaluasi performa kedua model ini dalam konteks yang sama. https://ejournal. id/index. php/teknomatika ISSN: 1979-7656 e-ISSN: 3031-0865 Penelitian ini menggunakan dataset Footwear-Shoe vs Sandal vs Boot Image Dataset, yang terdiri dari ribuan citra beresolusi 136x102 piksel dalam format RGB. Dataset ini dipilih karena keragamannya dalam menggambarkan tiga jenis alas kaki utama, yaitu boots, sandals, dan shoes, sehingga memungkinkan evaluasi yang komprehensif terhadap performa kedua model. Dalam penelitian ini, parameter setiap model dioptimalkan untuk memaksimalkan kinerjanya, dan pengujian dilakukan untuk mengukur aspek-aspek penting seperti akurasi, efisiensi, dan kemampuan generalisasi model. Penelitian ini bertujuan untuk memberikan wawasan yang mendalam tentang keunggulan dan kekurangan CNN dan SVM dalam konteks klasifikasi alas kaki. Hasil yang diperoleh diharapkan dapat membantu pengembang aplikasi dan peneliti dalam memilih metode yang sesuai berdasarkan kebutuhan spesifik, baik untuk aplikasi yang membutuhkan akurasi tinggi maupun untuk lingkungan dengan keterbatasan sumber daya. Dengan demikian, penelitian ini tidak hanya berkontribusi pada pengembangan teknologi pengenalan citra, tetapi juga mendukung implementasi praktisnya dalam berbagai aplikasi komersial dan industri. Hasil dari penelitian menunjukkan bahwa kedua model memiliki keunggulan yang CNN mampu memberikan performa yang lebih unggul dalam situasi di mana akurasi tinggi sangat diperlukan, seperti pada sistem e-commerce yang memerlukan identifikasi produk secara presisi. Di sisi lain. SVM menunjukkan keunggulan dalam efisiensi komputasi, membuatnya lebih ideal untuk aplikasi dengan keterbatasan perangkat keras atau sumber daya. Analisis lebih lanjut mengungkapkan bahwa pemilihan model harus didasarkan pada kebutuhan spesifik aplikasi, baik dari segi performa maupun efisiensi, sehingga hasil penelitian ini memberikan rekomendasi yang relevan untuk penggunaan metode klasifikasi dalam skala luas. METODE PENELITIAN Penelitian ini menggunakan pendekatan Knowledge Discovery in Databases (KDD) sebagai kerangka kerja. KDD merupakan proses sistematis yang terdiri dari beberapa tahapan, mulai dari seleksi data hingga presentasi pengetahuan . Pendekatan ini dipilih karena fleksibilitasnya dalam mengakomodasi model berbasis jaringan saraf menggunakan CNN dan metode berbasis statistik menggunakan SVM untuk tugas klasifikasi berbasis citra . Tahapan Penelitian Pendekatan KDD yang digunakan mencakup lima tahap utama: Data Selection Dataset Footwear-Shoe vs Sandal vs Boot Image Dataset dipilih karena relevansinya dalam klasifikasi alas kaki. Data ini terdiri dari tiga kategori utama, yaitu boots, sandals, dan shoes, dengan total 3000 gambar untuk setiap kategori. Data Preprocessing Proses ini melibatkan normalisasi nilai piksel gambar ke rentang . untuk mempercepat pelatihan model. Teknik augmentasi data, seperti rotasi, flipping, zooming, dan translasi, diterapkan untuk meningkatkan variasi data pelatihan. Data Transformation Pada tahap ini, data diubah menjadi format tensor untuk CNN dan vektor fitur untuk SVM. Fitur yang diekstraksi mencakup pola warna, tekstur, dan tepi gambar untuk memastikan kompatibilitas data dengan masing-masing model. Data Mining Perbandingan Model CNN dan SVM untuk Klasifikasi Jenis Footwear pada Dataset Alas Kaki Berbasis Citra (Gina Annisa dk. Teknomatika Vol. No. Juni 2025 ISSN: 1979-7656 e-ISSN: 3031-0865 Dua model diterapkan, yaitu Convolutional Neural Network (CNN) dan Support Vector Machine (SVM). CNN menggunakan arsitektur dengan beberapa lapisan konvolusi, pooling, dan fully connected, sementara SVM menggunakan kernel RBF (Radial Basis Functio. Pattern Evaluation Evaluasi dilakukan untuk membandingkan kinerja CNN dan SVM berdasarkan akurasi, presisi, recall, dan efisiensi waktu komputasi. Berikut adalah gambar Proses Knowledge Discovery in Database Process (KDD): Gambar 1. Proses Knowledge Discovery in Database Process (KDD) . Sumber Data Data yang digunakan dalam penelitian ini diambil dari Footwear-Shoe vs Sandal vs Boot Image Dataset, yang tersedia di Kaggle. Dataset ini memiliki total 9000 gambar dengan resolusi 136x102 piksel dalam format RGB. Dataset mencakup tiga kategori utama . oots, sandals, dan shoe. , yang masing-masing memiliki 3000 gambar. Populasi dan Sampel Populasi dalam penelitian ini mencakup seluruh gambar dalam dataset Footwear-Shoe vs Sandal vs Boot Image Dataset. Sampel yang digunakan terdiri dari data pelatihan . %), validasi . %), dan pengujian . %). Proses pembagian data dilakukan secara acak untuk memastikan distribusi yang seimbang di antara kategori. Teknik Pengumpulan Data Data dikumpulkan . dengan mengunduh dataset dari Kaggle. Data kemudian diolah menggunakan Python Notebook, yang memanfaatkan pustaka NumPy. Pandas, dan OpenCV untuk memproses gambar. Teknik augmentasi data diterapkan untuk meningkatkan variasi dan jumlah data pelatihan . Teknik Analisis Data Analisis data dilakukan menggunakan Python Notebook dengan pustaka TensorFlow. Keras, dan scikit-learn. Berikut rincian teknik analisis yang digunakan: Analisis Model CNN Pelatihan model CNN dilakukan dengan menggunakan algoritma optimasi Adam optimizer, yang dikenal karena efisiensinya dalam mempercepat konvergensi model melalui kombinasi momentum dan adaptive learning rate. Fungsi loss yang digunakan adalah categorical cross-entropy, yang ideal untuk tugas klasifikasi multikategori, seperti pada dataset alas kaki ini . https://ejournal. id/index. php/teknomatika ISSN: 1979-7656 e-ISSN: 3031-0865 Arsitektur CNN mencakup beberapa lapisan konvolusi untuk mengekstraksi fitur visual dari gambar, diikuti dengan lapisan pooling untuk mereduksi dimensi data, serta lapisan fully connected untuk pengambilan keputusan akhir. Model dilatih selama sejumlah epoch tertentu dengan memonitor metrik akurasi dan loss pada data validasi . Hasil pelatihan dievaluasi menggunakan tiga metrik utama: Akurasi Ae Mengukur sejauh mana model berhasil memprediksi kategori yang benar. Loss Ae Menggambarkan seberapa baik model mempelajari pola data selama pelatihan dan Matriks Kebingungan (Confusion Matri. Ae Memberikan gambaran mendalam tentang performa model dalam mengklasifikasi setiap kategori . oot, sandal, dan sho. , termasuk jumlah prediksi yang benar dan salah untuk setiap kelas. Matriks ini juga digunakan untuk menghitung metrik presisi, recall, dan F1-score untuk analisis lebih lanjut . Analisis Model SVM Model SVM dilatih menggunakan kernel RBF (Radial Basis Functio. , yang cocok untuk menangani dataset dengan distribusi non-linear seperti pada gambar alas kaki. Fitur utama dari dataset, seperti pola warna, tekstur, dan tepi, diekstraksi menggunakan teknik pemrosesan citra sebelum diterapkan pada SVM. Proses pelatihan mencakup optimasi parameter C . ang mengontrol margin kesalaha. dan gamma . ang menentukan pengaruh masing-masing titik dat. menggunakan teknik grid search. Optimasi ini bertujuan untuk menemukan kombinasi parameter yang menghasilkan performa terbaik pada data validasi. Hasil evaluasi dilakukan berdasarkan: Akurasi Ae Mengukur tingkat kesesuaian prediksi model dengan label sebenarnya. Matriks Kebingungan (Confusion Matri. Ae Menganalisis performa model dalam mengklasifikasi setiap kategori dengan lebih detail. Matriks ini juga digunakan untuk menghitung presisi, recall, dan F1-score, yang memberikan wawasan lebih mendalam tentang kemampuan model dalam menangani kategori tertentu. Perbandingan Kinerja Hasil kinerja CNN dan SVM dibandingkan berdasarkan metrik evaluasi utama: Akurasi Ae Metrik ini digunakan untuk mengukur keseluruhan performa model dalam mengenali kategori alas kaki. Presisi Ae Mengukur seberapa tepat prediksi model untuk setiap kategori. Presisi tinggi menunjukkan bahwa model tidak banyak menghasilkan false positives. Recall Ae Mengukur kemampuan model dalam menangkap semua instansi dari kategori tertentu . rue positive. Recall tinggi menunjukkan bahwa model tidak banyak menghasilkan false negatives. F1-Score Ae Metrik ini adalah rata-rata harmonik dari presisi dan recall, memberikan keseimbangan antara kedua metrik. Efisiensi Komputasi Ae Membandingkan waktu yang dibutuhkan untuk melatih model dan melakukan inferensi pada data pengujian. SVM biasanya lebih cepat dalam proses pelatihan pada dataset kecil, sementara CNN membutuhkan waktu lebih lama karena kompleksitas Perbandingan ini bertujuan untuk memberikan wawasan tentang keunggulan relatif masingmasing model. Misalnya. CNN mungkin lebih unggul dalam akurasi dan kemampuan generalisasi, tetapi SVM dapat lebih efisien dalam hal waktu komputasi . , . Temuan ini membantu dalam Perbandingan Model CNN dan SVM untuk Klasifikasi Jenis Footwear pada Dataset Alas Kaki Berbasis Citra (Gina Annisa dk. Teknomatika Vol. No. Juni 2025 ISSN: 1979-7656 e-ISSN: 3031-0865 menentukan model yang paling sesuai untuk kebutuhan spesifik, baik untuk aplikasi yang memprioritaskan akurasi tinggi maupun efisiensi . HASIL DAN PEMBAHASAN Hasil Penelitian Hasil evaluasi kinerja model CNN dan SVM ditampilkan dalam Tabel 1. Berdasarkan metrik akurasi, presisi, recall, dan F1-Score. CNN menunjukkan performa yang lebih baik dibandingkan SVM. Model CNN mampu mencapai akurasi 98. 17%, sedangkan SVM mencapai akurasi 96. Selain itu, presisi, recall, dan F1-Score CNN juga konsisten lebih tinggi daripada SVM. Hal ini menunjukkan bahwa CNN lebih efektif dalam menangkap pola-pola visual kompleks pada dataset Table 1. Perbandingan Performa Model CNN dan SVM Akurasi Presisi Recall F1-Score Model (%) (%) (%) (%) CNN SVM Dataset yang digunakan dalam penelitian ini mencakup tiga kategori utama: Boot. Sandal, dan Shoe. Gambar 2 menunjukkan contoh gambar dari setiap kategori dengan resolusi 136x102 piksel. Gambar-gambar ini memiliki variasi dalam hal pencahayaan, sudut pandang, dan latar belakang, sehingga memberikan tantangan yang realistis bagi model untuk mengklasifikasinya. Gambar 2. Contoh Gambar Footwear Hasil prediksi model CNN ditampilkan pada Gambar 3. Model ini mampu mengklasifikasikan sebagian besar gambar dengan benar. Kesalahan prediksi yang terjadi bersifat minor dan disebabkan oleh kemiripan fitur visual antar kategori, seperti bentuk sandal yang menyerupai sepatu atau sepatu yang terlihat seperti boot. Meskipun demikian. CNN secara konsisten menunjukkan performa yang unggul, terutama dalam mengenali pola tekstur dan bentuk yang kompleks. Gambar 3. Prediksi Model CNN Hasil prediksi model SVM ditampilkan pada Gambar 4. SVM menunjukkan performa yang cukup kompetitif, meskipun terdapat lebih banyak kesalahan prediksi dibandingkan CNN. Kesalahan umumnya terjadi pada kategori Sandal dan Shoe, yang memiliki overlap fitur visual seperti bentuk https://ejournal. id/index. php/teknomatika ISSN: 1979-7656 e-ISSN: 3031-0865 ujung atau sol alas kaki. Namun, performa SVM pada kategori Boot sangat baik dengan tingkat kesalahan yang minimal. Gambar 4. Prediksi Model SVM Pembahasan Performa Model CNN Model CNN menunjukkan performa unggul dengan akurasi 98. Keunggulan ini didukung oleh kemampuan CNN dalam mengekstraksi fitur visual kompleks, seperti pola tekstur, bentuk, dan tepi, melalui lapisan konvolusi. Proses augmentasi data yang dilakukan sebelumnya juga membantu meningkatkan kemampuan generalisasi model, sehingga mampu mengenali gambar dengan variasi pencahayaan dan sudut pandang. Hasil ini menunjukkan bahwa CNN sangat cocok untuk tugas klasifikasi berbasis citra dengan tingkat kompleksitas tinggi. Presisi, recall, dan F1-Score yang tinggi menunjukkan bahwa model ini tidak hanya akurat, tetapi juga andal dalam mengurangi kesalahan prediksi, baik false positives maupun false negatives. Kemampuan generalisasi CNN terlihat pada performanya yang konsisten di semua kategori, bahkan dalam situasi di mana gambar memiliki kemiripan antar kelas. Performa Model SVM SVM memberikan akurasi sebesar 96%, yang menunjukkan performa cukup baik untuk tugas klasifikasi alas kaki. SVM memiliki keunggulan dalam efisiensi waktu pelatihan dibandingkan CNN, terutama karena pendekatan berbasis vektor yang lebih ringan secara komputasi. Namun, keterbatasan SVM terlihat dalam menangani fitur visual yang sangat kompleks, seperti variasi bentuk atau tekstur pada kategori Sandal dan Shoe. Matriks kebingungan untuk SVM menunjukkan bahwa kategori Boot memiliki tingkat akurasi terbaik dibandingkan kategori lainnya. Hal ini dapat dijelaskan oleh sifat unik dari Boot yang memiliki bentuk dan tekstur yang lebih mudah dibedakan. Di sisi lain, kesalahan prediksi lebih sering terjadi pada kategori Sandal dan Shoe, yang memiliki overlap fitur visual. Analisis Matriks Kebingungan Hasil matriks kebingungan menunjukkan bahwa CNN memiliki distribusi prediksi yang lebih merata di semua kategori. Model ini mampu meminimalkan kesalahan, bahkan pada kategori yang sulit dibedakan. Sebaliknya. SVM memiliki performa yang lebih rendah pada kategori dengan overlap fitur visual. Matriks kebingungan ini memberikan wawasan tentang bagaimana setiap model menangani tantangan klasifikasi alas kaki. Berdasarkan hasil penelitian. CNN lebih disarankan untuk aplikasi yang membutuhkan akurasi tinggi, seperti e-commerce atau katalog produk digital. Dengan presisi dan recall yang tinggi. CNN mampu memberikan hasil yang lebih andal dalam situasi dengan variasi gambar yang kompleks. sisi lain. SVM menjadi pilihan yang baik untuk aplikasi dengan keterbatasan sumber daya komputasi, karena efisiensi waktu pelatihannya. Gambar hasil prediksi dari kedua model menunjukkan bahwa CNN lebih stabil dalam menangani semua kategori, sementara SVM cenderung mengalami kesalahan pada kategori dengan fitur yang mirip. Hal ini menegaskan bahwa arsitektur berbasis jaringan saraf memiliki keunggulan dalam menangani data visual dengan variasi yang tinggi. Perbandingan Model CNN dan SVM untuk Klasifikasi Jenis Footwear pada Dataset Alas Kaki Berbasis Citra (Gina Annisa dk. Teknomatika Vol. No. Juni 2025 ISSN: 1979-7656 e-ISSN: 3031-0865 KESIMPULAN Penelitian ini berhasil membandingkan kinerja model Convolutional Neural Network (CNN) dan Support Vector Machine (SVM) dalam tugas klasifikasi alas kaki berbasis citra. Model CNN menunjukkan performa yang lebih unggul dengan akurasi 98. 17%, presisi 98. 17%, recall 98. dan F1-Score 98. Kemampuan CNN dalam menangkap fitur visual kompleks melalui lapisan konvolusi memungkinkan model ini mengenali pola-pola spesifik pada gambar Boot. Sandal, dan Shoe dengan lebih akurat. Sebaliknya, model SVM mencapai akurasi sebesar 96%. Kelebihan penelitian ini terletak pada penggunaan dataset yang beragam dan representatif, serta penerapan dua metode yang berbeda untuk mendapatkan wawasan yang komprehensif mengenai performa masing-masing model. Selain itu, proses pra-pemrosesan seperti augmentasi data berhasil meningkatkan kemampuan generalisasi model, khususnya CNN. Namun, penelitian ini juga memiliki kekurangan, seperti kurangnya eksplorasi terhadap arsitektur CNN yang lebih kompleks dan optimalisasi parameter SVM yang lebih mendalam. Hal ini dapat memengaruhi potensi performa maksimal dari masing-masing model. Pengembangan lebih lanjut dari penelitian ini dapat difokuskan pada eksplorasi arsitektur CNN yang lebih canggih, seperti ResNet atau EfficientNet, untuk meningkatkan akurasi dan efisiensi. Selain itu, penggunaan teknik ensembel yang mengombinasikan kekuatan CNN dan SVM dapat menjadi langkah strategis untuk mencapai hasil yang lebih optimal. Penelitian juga dapat diperluas dengan menguji model pada dataset dengan resolusi lebih tinggi atau dengan kategori alas kaki yang lebih beragam, untuk mengevaluasi kemampuan model dalam skenario dunia nyata yang lebih KONTRIBUSI PENELITIAN Penelitian ini memberikan kontribusi penting dalam bidang pengolahan citra dan pembelajaran mesin dengan membandingkan kinerja Convolutional Neural Network (CNN) dan Support Vector Machine (SVM) pada klasifikasi alas kaki berbasis citra. Hasil penelitian ini menunjukkan keunggulan CNN dalam menangkap pola visual kompleks dengan akurasi tinggi, sementara SVM menawarkan efisiensi komputasi pada tugas yang serupa. Penelitian ini juga memberikan panduan praktis bagi pengembang dalam memilih model yang sesuai berdasarkan kebutuhan spesifik, seperti akurasi atau efisiensi. Selain itu, penelitian ini memperkaya literatur akademik dengan menggunakan dataset yang beragam dan representatif, yang dapat menjadi referensi untuk studi lanjutan, termasuk pengembangan teknik ensembel atau penerapan model pada skenario dunia nyata dengan kategori yang lebih luas. DAFTAR PUSTAKA