Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Analisis Perbandingan Evaluasi Metode Deep Learning pada Klasifikasi Jenis Kendaraan Anggay Luri Pramana Program StudiTeknik Informatika.
Fakultas Ilmu Komputer.
Universitas Nahdlatul Ulama Sidoarjo Jln.
Mongonsidi Kav.
DPR Sidoklumpuk Sidoarjo tif@unusida.
Abstrak Pengenalan kendaraan memiliki kompleksitas yang tinggi, permasalahan yang dihadapi saat melakukan penelitian kendaraan seperti variasi jenis kendaraan, kondisi pencahayaan, perspektif, resolusi, kualitas gambar serta warna dan tekstur menjadi faktor utama.
Permasalahan ini memerlukan pendekatan multidisiplin ilmu dengan kombinasi teknologi pengolahan citra, machine learning, dan pengenalan pola.
Pendekatan inovatif dan penelitian secara konsisten penting untuk meningkatkan kinerja sistem serta mencoba segala model arsitektur deep learning yang telah dikembangkan.
Penelitian ini bertujuan untuk membandingkan Model Neural Network untuk klasifikasi kendaraan kelas 1 hingga kelas 5 berdasarkan jenis klasifikasi pada jalan tol.
Model yang dibandingkan dalam penelitian ini adalah Convolutional Neural Network.
ResNet50, dan VGG16.
Model akan diuji dengan gambar masukan seluruh bagian kendaraan setelah itu gambar masukan diubah ukurannya menjadi 224x224 untuk setiap gambar masukan.
Skenario dilakukan dengan menggunakan 75 epoch pada setiap model dengan total 500 data untuk setiap kelompok dan setiap kelompok.
Persentase data latih dengan data uji adalah 80% data latih dan 20% data Jumlah kelompok kelas ada 5 yaitu Kelompok 1.
Kelompok 2.
Kelompok 3.
Kelompok 4, dan Kelompok 5.
Model VGG16 mendapatkan akurasi tertinggi dengan akurasi 91%.
Convolutional Neural Network 84% dan ResNet50 mendapatkan akurasi 74%.
Hasil yang diperoleh menunjukkan efektivitas model VGG16 lebih tinggi terhadap CNN dan ResNet50.
Dengan demikian penelitian ini dapat memberikan persepsi yang berguna untuk penelitian selanjutnya guna meningkatkan pengambilan gambar dengan kamera yang lebih berkualitas guna meningkatkan sistem transportasi cerdas.
Kata kunciAi Convolutional Neural Network.
Deep learning.
ResNet50.
VG16.
Smart Transportation System Abstract Vehicle recognition has high complexity, and problems that arise when conducting vehicle research such as variations in vehicle type, lighting conditions, perspective, resolution, image quality, and color and texture are the main factors.
This problem requires a multidisciplinary approach with a combination of image processing technology, machine learning, and pattern recognition.
Innovative approaches and research are consistently important to improve system performance as well as trying out all the deep learning architecture models that have been developed.
This research aims to compare Neural Network Models for class 1 to class 5 vehicle classification based on the type of classification on toll roads.
The models compared in this research are Convolutional Neural Network.
ResNet50, and VGG16.
The model will be tested with input images of all parts of the vehicle after which the input images are resized to 224x224 for each input image.
The scenario was carried out using 75 epochs in each model with a total of Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 500 data for each group and each group.
The percentage of training data and test data is 80% training data and 20% test data.
There are 5 class groups, namely Group 1.
Group 2.
Group 3.
Group 4.
Group 5.
The VGG16 model got the highest accuracy with 91% accuracy.
Convolutional Neural Network 84% and ResNet50 got 74% accuracy.
The results obtained show that the effectiveness of the VGG16 model is higher against CNN and ResNet50.
Thus, this research can provide useful perceptions for further research to improve image capture with higher-quality cameras to improve intelligent transportation systems.
KeywordsAi Convolutional Neural Network.
Deep learning.
ResNet50.
VG16.
Smart
Transportation System
PENDAHULUAN
Transportasi adalah perpindahan orang atau barang dari suatu tempat ke tempat lain dengan menggunakan kendaraan yang digerakkan oleh manusia atau mesin.
Transportasi digunakan untuk memudahkan masyarakat dalam melakukan aktivitas sehari-hari.
Transportasi sendiri terbagi menjadi 3 yaitu, darat, udara dan air.
Transportasi di Indonesia pada sektor darat mempunyai jenis kelas kendaraan yang beragam khususnya pada jalan tol (Pramana et al.
, 2.
berdasarkan informasi yang dikutip dari situs Kementerian Pekerjaan Umum dan Perumahan Rakyat.
Jenis kendaraan dibagi menjadi 5 kategori yaitu golongan 1 hingga golongan 5.
Di era teknologi saat ini, banyak inovasi di bidang teknologi yang dikembangkan dalam bidang sistem transportasi.
Klasifikasi kendaraan menggunakan pemrosesan gambar dan visi komputer memberikan kemudahan transportasi.
Perasaan nyaman di jalan padat sehingga dapat menghitung kendaraan masuk dan keluar (Aug et al.
, 2.
Intelligent Vehicles Symposium Ie adalah forum teknis tahunan besar yang disponsori oleh Ie Intelligent Transportation Systems Society (ITSS), yang mempertemukan para peneliti dan praktisi di seluruh dunia untuk berbagi kemajuan terkini dalam teori dan teknologi terkait smart transportation.
Pada penelitian tahun 2017 dilakukan dengan menggunakan metode CNN untuk klasifikasi kendaraan (Chen et al.
, 2.
dan juga dilakukan klasifikasi kendaraan dengan menggunakan metode CNN (Huang et al.
, 2.
Penelitian tentang pengenalan kendaraan mendorong inovasi dalam bidang teknologi pengolahan citra, artificial intelligence, dan machine learning.
Data yang telah di kumpulkan dari pengenalan kendaraan dapat digunakan untuk berbagai analisa data dan identifikasi.
Identifikasi kendaraan yang dilakukan manual atau semi-otomatis menggunakan cara konvensional dengan teknik pengolahan citra, ekstraksi fitur, deteksi atau segmentasi citra.
Pada penelitian ini mekanisme identifikasi kendaraan di lakukan dengan dengan cara otomatis dengan memanfaatkan metode deep learning.
Dalam metode deep learning terdapat feature learning dan fine tuning yang dapat mempelajari pola dari kendaraan secara bertahap dari low-level feature hingga high-level feature.
Dengan munculnya deep learning representasi fitur yang kompleks dari data mentah dapat di pelajari tanpa perlu ekstraksi fitur manual.
Convolutional Neural Network (CNN) merupakan metode yang digunakan untuk data berupa gambar.
CNN dapat digunakan untuk mendeteksi dan mengenali objek Arsitektur Neural Network memiliki kemampuan jaringan multilayer dengan penurunan gradien untuk mempelajari pemetaan nonlinier berdimensi tinggi yang kompleks (Le Callet et al.
, 2.
CNN memiliki neuron yang memiliki bobot, bias, dan fungsi aktivasi.
Secara garis besar CNN memiliki dua tahapan yaitu: Feature Learning Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 dan Classification.
Convolutional Neural Network (CNN) merupakan pengembangan dari multilayer perceptron (MLP) dirancang untuk mengolah data dua dimensi dalam bentuk gambar (Le Callet et al.
, 2.
CNN termasuk dalam jenis Deep Neural Network karena kedalaman jaringannya tinggi dan banyak diterapkan pada data gambar.
Klasifikasi gambar dasar dapat digunakan dengan MLP, namun metode MLP kurang cocok karena tidak cocok untuk menyimpan informasi spasial dari data gambar, dan menganggap setiap piksel merupakan fitur independen memberikan hasil yang buruk.
Klasifikasi jenis kendaraan adalah tugas visi komputer umum yang melibatkan penentuan kategori atau jenis kendaraan berdasarkan gambar masukan.
Tugas ini memiliki berbagai penerapan praktis, termasuk pemantauan lalu lintas, pengawasan, dan mengemudi otonom.
Convolutional Neural Network (CNN) telah terbukti sangat efektif untuk tugas klasifikasi gambar, dan arsitektur seperti ResNet50 dan VGG16 adalah pilihan populer karena kemampuannya mengekstrak fitur kompleks dari gambar.
Dalam pendahuluan ini, peneliti akan mendalami konsep klasifikasi jenis kendaraan menggunakan CNN.
ResNet50, dan VGG16.
CNN adalah kelas deep neural networks yang dirancang khusus untuk memproses data grid terstruktur, seperti gambar.
Mereka terdiri dari beberapa lapisan, termasuk convolutional layers, pooling layers, dan fully connected layers.
CNN sangat cocok untuk tugas-tugas seperti klasifikasi gambar karena mereka dapat secara otomatis mempelajari dan mengekstrak fitur yang relevan dari gambar, sehingga mengurangi kebutuhan rekayasa fitur manual.
ResNet (Residual Networ.
adalah arsitektur jaringan saraf dalam yang dikenal karena kemampuannya untuk melatih deep neural network secara efektif.
ResNet50 adalah varian spesifik yang mencakup 50 lapisan, menggunakan residual connections .
kip connection.
untuk mengatasi masalah gradien yang hilang.
Arsitektur ini telah menunjukkan performa luar biasa dalam berbagai tugas klasifikasi gambar, termasuk klasifikasi jenis kendaraan.
VGG (Visual Geometry Grou.
adalah arsitektur jaringan saraf konvolusional dalam lainnya yang menjadi runner-up dalam ImageNet Large Scale Visual Recognition Challenge (ILSVRC) pada tahun 2014.
VGG16 adalah varian dari arsitektur VGG yang terdiri dari 16 lapisan bobot, termasuk 13 convolutional layers dan 3 fully connected layers.
VGG16 dikenal karena kesederhanaan dan kemudahan pemahamannya (Naveen & Diwan, 2.
METODE PENELITIAN
1 Pengambilan Data Pengambilan data dilakukan dengan membagi menjadi kategori data yang berisikan pengelompokkan setiap kelasnya.
Teknik pengambilan sampel dijelaskan mengenai pemisahan presentase data training, data validasi, dan data testing.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Gambar 1.
Daftar kelas setiap golongan 1 Kategori Data Jumlah dataset sebanyak 500 data dengan masing-masing kelas 100 data.
Kelas atau labelnya terbagi menjadi 5 yaitu golongan 1, golongan 2, golongan 3, golongan 4 dan golongan 5.
Pembagian setiap kelas dapat dilihat pada gambar 1.
2 Teknik Pengambilan Sampel Pemisahan kumpulan data yang terdiri dari 500 gambar menjadi kumpulan pelatihan 80% dan kumpulan pengujian 20% untuk pra pemrosesan gambar melibatkan pembagian data menjadi dua sub kumpulan.
Proses dimulai dengan mengacak urutan 500 gambar secara acak.
Langkah ini memastikan bahwa gambar berada dalam urutan acak.
Setelah itu besar kecilnya set pelatihan dan pengujian ditentukan berdasarkan rasio 80 Ae Pada 80% set pelatihan dan 20% :
Training set size: 0,80 x 500 = 400 gambar Testing set size: 0,20 x 500 = 100 gambar Setelah itu ambil 400 gambar pertama dari data set secara acak sebagai training Ini akan digunakan untuk preprocessing dan training model.
Kemudian mengambil 100 gambar sisanya sebagai testing set, yang akan digunakan untuk mengetahui performa model setelah pra pemrosesan dan pelatihan.
2 Convolutional Neural Network Pertama, gambar masukan direpresentasikan sebagai nilai piksel.
Pada gambar grayscale, setiap piksel memiliki satu nilai intensitas.
Sedangkan pada gambar berwarna (RGB), setiap piksel biasanya memiliki tiga nilai (Merah.
Hijau, dan Bir.
Kemudian filter atau kernel berupa kotak kecil berisi bobot-bobot yang bisa dipelajari serta direpresentasikan sebagai grid.
Selama operasi konvolusi, filter ini melintasi gambar masukan (Khagi & Kwon, 2.
Selanjutnya dilakukan langkah konvolusi pada setiap posisi penempatan filter pada gambar masukan, dilakukan operasi konvolusi.
Operasi ini melibatkan mengalikan nilai filter berdasarkan elemen dengan nilai yang sesuai di patch gambar masukan(Pang et al.
, 2.
Kemudian dilakukan perkalian setiap elemen piksel, hasilnya dijumlahkan hingga menghasilkan nilai tunggal.
Nilai ini mewakili keluaran konvolusi pada posisi tersebut.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Setelah dilakukan perhitungan konvolusi maka dilakukan langkah Stride.
Filter bergerak melintasi gambar dengan ukuran langkah tertentu yang dikenal dengan stride (Wani et , 2.
Langkah tersebut menentukan seberapa banyak filter menggeser posisi pada setiap langkah.
Langkah yang lebih besar mengurangi dimensi spasial dari keluaran feature map.
Convolutional Layer.
Konvolusi berbentuk kernel 3x3 atau 5x5 yang akan bergeser ke seluruh matriks dengan operasi dot product.
Rumus umum proses konvolusi sebagai berikut :
a O y.
cu, y.
= Ocycn = Oe2yco2ycoOcyc = Oe2ycu2ycuya.
cu ycn UI ycI, yc yc UI ycI) UI ya.
cn, y.
Keterangan :
(I).
, .
= Nilai piksel pada posisi .
pada citra input .
nput imag.
, .
= Nilai kernel atau filter pada posisi .
, .
= Posisi piksel pada citra output.
i dan j = Indeks yang mengiterasi elemen-elemen kernel.
= Langkah .
, yang menentukan seberapa jauh langkah konvolusi m dan n = Parameter yang menentukan jangkauan indeks kernel Berikutnya adalah langkah padding yang mengacu pada penambahan baris dan kolom tambahan nol .
tau nilai lai.
di sekitar gambar masukan.
Padding dapat membantu mengontrol dimensi spasial dari peta fitur keluaran (Alrasheedi et al.
, 2.
Setelah padding selesai, langkah selanjutnya adalah activation function, sebuah fungsi aktivasi ReLu atau bisa juga fungsi lain seperti sigmoid atau tanh diterapkan untuk data yang bersifat non-linier.
Gambar 2 menunjukkan arsitektur Neural Network yang diusulkan.
Ukuran masukannya adalah 224 x 224 x 1 dan gambar memiliki satu channel yaitu skala abu-abu.
Lapisan konvolusi pertama menggunakan 32 kernel 3x3.
Lapisan konvolusi kedua menggunakan 64 kernel 3x3.
Setelah konvolusi akan dilanjutkan ke layer max pooling ukuran 2x2.
Setelah menemukan nilai tertinggi menggunakan max pooling, dilanjutkan dengan dropout.
Langkah ini dilakukan agar dataset pelatihan tidak mengalami Proses terakhir fully connected dengan 5, karena output yang digunakan adalah 5 kelas.
Pada setiap layar konvolusi terdapat hidden layer dan activation function ReLu.
Aktifasi ReLu berfungsi dapat juga mengurangi overfitting yang terjadi.
ReLu mengubah semua nilai negative menjadi nol sehingga meningkatkan efisiensi kinerja model untuk Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 menangani informasi.
Serta ReLu dapat mengatasi masalah vanishing gradient karena gradient dari ReLu adalah konstan 1 untuk nilai positif.
Vanishing gradient bisa terjadi karena saat inisialisasi bobot awal sangat kecil atau sangat besar.
Gambar 2.
Arsitektur CNN 3 Pre processing Tahap preprocessing dilakukan untuk mendapatkan objek kendaraan agar mempermudah pada saat training CNN.
Tahapan deteksi dilakukan antara lain deteksi kendaraan, cropping, dan merubah gambar ke dalam 1 channel warna grayscale.
Alur preprocessing dapat dilihat pada gambar 3.
Gambar kendaraan dikumpulkan dari kelompok 1 hingga kelompok 5 dengan ukuran dan pola yang beragam dan representatif.
Setiap kelompok akan diberikan label kelas yang sesuai untuk dijadikan data latih.
Setelah dataset diberi label, format gambar standar yang digunakan adalah JPG.
Setelah itu akan dilakukan normalisasi pada dataset dengan mengubah rentang nilai piksel dari 0 Ae 255 menjadi 1 saluran sehingga dapat membantu meningkatkan stabilitas pelatihan dan konvergensi model.
dilakukan langkah resize menjadi 224 x 224 untuk kebutuhan training dan testing dengan ukuran urut tersebut.
Setelah itu dilakukan Image Generator dengan tujuan untuk membuat versi varian gambar pada dataset.
Ini dapat mencakup perubahan seperti rotasi, pergeseran, flip, zoom, dan perubahan warna.
dan juga menggunakan augmentasi data dapat membantu model untuk lebih memahami variasi dalam kumpulan data dan meningkatkan generalisasi.
Pada generator gambar.
Image Augmented digunakan di perpustakaan keras seperti Sequential RandomFlip='horizontal'.
RandomRotation=0,1.
RandomZoom=0,1.
Rescalling=1.
/255 (Kumar et al.
, 2.
Gambar 3.
Tahap Preprocessing 4 Model CNN adalah kelas deep neural networks yang dirancang khusus untuk memproses data grid terstruktur, seperti gambar.
Mereka terdiri dari beberapa lapisan, termasuk convolutional layers, pooling layers, dan fully connected layers.
CNN sangat cocok untuk tugas-tugas seperti klasifikasi gambar karena mereka dapat secara otomatis mempelajari dan mengekstrak fitur yang relevan dari gambar, sehingga mengurangi kebutuhan rekayasa fitur manual.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 ResNet (Residual Networ.
adalah arsitektur jaringan saraf dalam yang dikenal karena kemampuannya untuk melatih deep neural network secara efektif.
ResNet50 adalah varian spesifik yang mencakup 50 lapisan, menggunakan residual connections .
kip connection.
untuk mengatasi masalah gradien yang hilang.
Arsitektur ini telah menunjukkan performa luar biasa dalam berbagai tugas klasifikasi gambar, termasuk klasifikasi jenis kendaraan.
VGG (Visual Geometry Grou.
adalah arsitektur jaringan saraf konvolusional dalam lainnya yang menjadi runner-up dalam ImageNet Large Scale Visual Recognition Challenge (ILSVRC) pada tahun 2014.
VGG16 adalah varian dari arsitektur VGG yang terdiri dari 16 lapisan bobot, termasuk 13 convolutional layers dan 3 fully connected VGG16 dikenal karena kesederhanaan dan kemudahan pemahamannya (Naveen & Diwan, 2.
Konfigurasi model mengacu pada pilihan dan pengaturan yang dibuat saat merancang dan menyiapkan arsitektur jaringan saraf.
Konfigurasi model yang tepat sangat penting karena berdampak langsung pada performa, perilaku, dan efisiensi model pembelajaran mendalam.
1 Adam Optimizer Adam optimizer digunakan pada model yang dilatih sehingga pengoptimal bertanggung jawab untuk mengelola bagaimana bobot model diperbarui selama pelatihan berdasarkan loss function.
Adapun Rumus adam optimizer sebagai berikut :
ycoyc = yu1 UI ycoyc Oe 1 .
Oe yu.
UI yciyc Keterangan :
= Nilai momentum pada iterasi ke-t 1 = Koefisien untuk momentum, sering kali memiliki nilai yang mendekati mt Oe 1 = Nilai momentum pada iterasi sebelumnya = Gradien dari loss function terhadap parameter yang dioptimalkan 2 Adaptive Moment Estimation Adalah pengoptimal yang umum digunakan dan sering kali bekerja dengan baik secara empiris.
Ini menggabungkan beberapa konsep dari optimasi SGD (Stochastic Gradient Descen.
dengan momentum (Kumar et al.
, 2.
Langkah pembaruan pengoptimal Adam untuk setiap parameter pada langkah waktu t.
Adapun rumus adaptive moment estimation sebagai berikut.
ycyc = yu2 UI ycyc Oe 1 .
Oe yu.
UI .
Keterangan :
= Nilai momentum kuadrat gradien pada iterasi ke-t.
= Koefisien untuk momentum kuadrat gradien vt Oe 1 =Nilai momentum kuadrat gradien pada iterasi sebelumnya = Kuadrat dari gradien pada iterasi ke-t.
3 Loss Function Loss function digunakan dalam masalah klasifikasi multiple class dengan mengukur perbedaan antara probabilitas kelas yang diprediksi dan label kelas sebenarnya.
Rumus perhitungan loss function sebagai berikut:
yayaya = OeOc.
cycn UI ycoycuyci.
c^yc.
)) .
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Keterangan :
ycycn = Nilai sebenarnya .
rue valu.
dari kelas ke-i.
yc^ycn = Probabilitas prediksi untuk kelas ke-i yang dihasilkan oleh model.
Oc = Simbol penjumlahan, yang menjumlahkan nilai untuk semua kelas.
Loss Function, juga dikenal sebagai a cost function or objective function, adalah fungsi matematika yang mengukur perbedaan antara keluaran yang diprediksi dan target sebenarnya untuk masukan tertentu dalam tugas machine learning (Yessou et al.
, 2.
Tujuan selama pelatihan adalah untuk meminimalkan loss function ini, karena fungsi ini sebagai ukuran seberapa baik performa model yang dilatih.
Evaluation metrics adalah metrik yang digunakan dalam deep learning, terutama untuk tugas klasifikasi.
Tugasnya mengukur proporsi instance yang diklasifikasikan dengan benar dalam kumpulan data, memberikan cara mudah untuk menilai kinerja model secara keseluruhan (Hicham et al.
, 2.
HASIL DAN PEMBAHASAN
Dataset yang digunakan dibagi menjadi 2 bagian sebelum dilakukan pelatihan, yaitu dataset pelatihan dan dataset pengujian untuk prediksi tipe grup.
Dataset sebanyak 500 dibagi menjadi 80% sebagai pelatihan dan 20% sebagai pengujian.
Proses pelatihan dan pengujian dilakukan menggunakan CNN.
VGG16 dan Resnet50 dalam 75 epoch Skenario dilakukan dengan tujuan untuk mendapatkan nilai akurasi pada masingmasing metode.
1 Model CNN Pada tabel 1 proses pelatihan model CNN pada epoch ke-75 dengan batch 13 per epoch membutuhkan waktu 9s 663ms/langkah untuk menyelesaikan setiap batch selama proses pelatihan.
Hasil pengujian kinerja model CNN adalah Training Loss 0,099.
Training Accuracy 0,9575.
Validation Loss 0,52 dan Validation Accuracy 0,82.
Hal ini menunjukkan Model CNN mencapai akurasi pelatihan yang tinggi sebesar 0,9575, bahwa model tersebut belajar mengklasifikasikan jenis kendaraan secara efektif pada kumpulan data pelatihan.
Training Loss 0,0999 menunjukkan bahwa prediksi model sebenarnya sangat cocok dengan jenis kendaraan dalam kumpulan data pelatihan.
Accuracy Validation 0,82 mewakili kemampuan model untuk menggeneralisasi data baru yang belum terlihat.
Accuracy 0,82 pada set Tabel 1.
Akurasi pada epoch ke 75
Epoch
batch/epoch CNN
Resnet50
VGG16
16s 1s
29s 2s
Loss
(%)
Accuracy (%) val_loss (%) val_accuracy (%) 0,09 0,95 0,52 0,82 0,73 0,14 0,71 0,93 0,25 0,74 0,91 Validasi merupakan tanda positif, yang menunjukkan bahwa model memiliki performa cukup baik pada data yang tidak ditemukan selama pelatihan.
Loss Validation 0,5278 memberikan wawasan tentang performa generalisasi model.
Loss Validation yang lebih rendah menunjukkan generalisasi yang lebih baik.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Secara keseluruhan, hasil yang dibagikan menunjukkan bahwa model CNN bekerja secara efektif dan menunjukkan kinerja yang wajar untuk tugas klasifikasi jenis kendaraan (Padilla et al.
, 2.
Model CNN menganalisis kesalahan klasifikasi, menyelidiki potensi sumber kesalahan, dan mempertimbangkan teknik interpretasi model untuk mendapatkan lebih banyak wawasan tentang perilaku model yang digunakan.
2 Model ResNet50 Pada tabel 1, proses pelatihan model ResNet50 pada epoch ke-75 dengan 13 batch per epoch membutuhkan waktu 16s 1s/langkah untuk menyelesaikan setiap batch selama proses pelatihan.
Hasil pengujian kinerja model CNN adalah Training Loss 0,7317.
Training Accuracy 0.
Validation Loss 0,7074 dan Validation Accuracy 0,74.
Hal ini menunjukkan Model ResNet50 belajar dari data pelatihan, namun mungkin masih ada ruang untuk perbaikan.
Akurasi validasi sebesar 0,74 menunjukkan bahwa model melakukan generalisasi dengan cukup baik terhadap validasi data yang tidak terlihat, namun akurasi yang diperoleh ResNet50 pada epoch ke-75 tidak sebaik CNN dengan akurasi 0,9575.
Ukuran kumpulan data sebesar 500 relatif kecil untuk model ResNet50, sehingga melatih jaringan neural dalam secara efektif dapat menjadi tantangan tersendiri.
Perbaikan yang berpotensi meningkatkan performa model seperti Hyperparameter Tuning dengan cara menentukan kecepatan pembelajaran, batchsize, dan jumlah epoch untuk menemukan pengaturan optimal pada kumpulan data serta Menerapkan teknik augmentasi data untuk meningkatkan ukuran dan keragaman kumpulan data pelatihan.
3 Model VGG16 Pada tabel 1, proses pelatihan model VGG16 pada epoch ke-75 dengan 13 batch per epoch membutuhkan waktu 29s 2s/langkah untuk menyelesaikan setiap batch selama proses pelatihan.
Hasil pengujian kinerja model CNN adalah Training Loss 0,1482.
Training Accuracy 0,9300.
Validation Loss 0,2523 dan Validation Accuracy 0,9100.
Model VGG16 tampaknya bekerja dengan baik dalam tugas klasifikasi jenis Akurasi pelatihan sebesar 93,00% menunjukkan bahwa model telah belajar secara efektif dari data pelatihan, dan Training Loss sebesar 0,1482 menunjukkan bahwa model meminimalkan kesalahan prediksi.
Akurasi VGG16 pada epoch ke-75 menunjukkan hasil sebesar 0,93, sehingga hampir menyamai akurasi CNN yang sebesar 0,9 akurasi VGG16 terbaik dari CNN dan ResNet50 untuk mengenali jenis kendaraan.
Akurasi validasi sebesar 91,00% dan kerugian validasi sebesar 0,2523 menunjukkan bahwa model dapat menggeneralisasi dengan baik terhadap data yang tidak terlihat, karena model ini mempertahankan akurasi yang tinggi pada kumpulan data Ukuran kumpulan data sebanyak 500 sampel relatif kecil dibandingkan model VGG16, namun model mencapai hasil yang baik, yang menunjukkan efektivitas VGG16 sebagai classifier jenis kendaraan.
Untuk meningkatkan performa model VGG16 tentunya terdapat banyak variasi teknik yaitu hyperparameter, data augmented, atau penggunaan dataset yang lebih besar jika tersedia.
Selain itu, penting untuk mempertimbangkan potensi overfitting dan mempertimbangkan trade-off antara kompleksitas model dan ukuran kumpulan data.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 4 Model Validation Gambar 4 menunjukkan grafik train dan validation loss sebagai model terbaik.
Grafik training loss sebagai model terbaik karena menunjukkan tren penurunan yang stabil seiring dengan meningkatnya akurasi selama proses pelatihan.
Hal ini menunjukkan bahwa model yang diusulkan secara konsisten mempelajari pola dalam data pelatihan dan meminimalkan kesalahan prediksi.
grafik loss validation juga menunjukkan tren penurunan yang stabil atau konsisten selama pelatihan pada data pelatihan.
Hal ini menunjukkan bahwa model dapat menggeneralisasi dengan data validation yang baik, yang belum pernah di training sebelumnya.
Di CNN, grafik loss validation mengalami penurunan drastis setelah epoch 6, namun tetap konstan mendekati grafik train loss.
Perbedaan kecil antara grafik train loss dan grafik validation loss menunjukkan bahwa model tidak mengalami overfitting pada data pelatihan dan dapat melakukan generalisasi dengan baik pada data baru.
Grafik yang ideal akan menunjukkan tren penurunan yang stabil baik untuk training loss maupun loss value, dengan perbedaan nilai yang kecil di antara keduanya.
Hal ini menunjukkan bahwa model telah belajar secara efektif, tidak overfitting, dan dapat melakukan generalisasi dengan baik pada data baru.
Akurasi model CNN.
ResNet50.
VGG16 dapat dilihat pada tabel 2.
Dimana akurasi pelatihan VGG16 mendapatkan hasil tertinggi dengan 0.
91 antara CNN 0.
82 dan ResNet50 0.
74, serta validation loss sebesar 0.
25 antara ResNet50 0.
7 dan CNN 0.
saat validation loss.
VGG16 mendapat hasil terkecil antara CNN 0.
52 dan ResNet16 0.
serta Validation Accuracy VGG16 mendapat nilai lebih tinggi dibandingkan CNN 0.
dan ResNet 0.
Jadi pada penelitian ini dengan objek berupa bentuk atau pola kendaraan CNN mendapat hasil 0,95, disusul VGG16 dengan hasil 0,93 dan ResNet50 dengan hasil 0,71.
Tabel 2.
Akurasi pada 3 model
Loss Accuracy (%) (%) CNN
Resnet50
VGG16
0,73
0,14
0,95
0,71
0,93
Validation Loss
(%)
0,52
Validation Accuracy (%) 0,82 0,74 0,91 5 Best Prediction Model Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 .
Gambar 4.
Train and Validation Loss Model Validation.
CNN Accuracy, .
CNN Validation Loss, .
ResNet50 Accuracy, .
ResNet50 Validation Loss, .
VGG16 Accuracy, .
VGG16 Validation Loss Gambar 4a menampilkan akurasi model training CNN lebih tinggi dari akurasi test pada epoch 75.
Gambar 4b menunjukkan model loss training CNN lebih rendah dari model loss test pada epoch 75, sehingga untuk model CNN lebih baik akurasi dan loss pada saat training untuk objek kendaraan.
Gambar 4c menampilkan akurasi model test ResNet50 lebih tinggi dari akurasi tarin pada epoch 75.
Gambar 4d menunjukkan model loss test ResNet50 lebih rendah dari model loss train pada epoch 75, sehingga untuk model ResNet50 lebih baik akurasi dan loss pada saat test untuk objek kendaraan.
Gambar 4e menampilkan akurasi model training VGG16 lebih tinggi dari akurasi test pada epoch Gambar 4f menunjukkan model loss training VGG16 lebih rendah dari model loss test pada epoch 75, sehingga untuk model VGG16 lebih baik akurasi dan loss pada saat training untuk objek kendaraan.
Pada gambar 4a, 4c dan 4e model usulan CNN.
ResNet50 dan VGG16, grafik model validation accuracy menunjukkan bahwa VGG16 dari epoch 1 memiliki akurasi yang lebih tinggi dibandingkan CNN dan ResNet50, pada validation loss grafik menunjukkan bahwa dari epoch 1 CNN mendapatkan error yang lebih kecil dibandingkan VGG16 dan ResNet50.
VGG16 memiliki peningkatan validation accuracy yang lebih stabil dibandingkan CNN dan ResNet50, untuk val loss, penurunan stabil pada grafik ditunjukkan oleh ResNet50.
Kedalaman dan kompleksitas arsitektur VGG16 memainkan peran penting dalam kemampuannya menangkap dan mempelajari fitur dari gambar 4 atau data spasial Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Jaringan yang lebih dalam mempunyai potensi untuk mempelajari fitur yang lebih kompleks dan abstrak (Aydin et al.
, 2.
, tetapi mungkin juga lebih mahal secara komputasi dan lebih sulit untuk dilatih.
terdiri dari 16 lapisan konvolusional dan terhubung sepenuhnya.
Hal ini dapat mempermudah pelatihan pada kumpulan data yang lebih kecil atau dengan sumber daya komputasi yang terbatas.
Namun, hal ini mungkin lebih rentan terhadap overfitting pada kumpulan data yang sangat besar.
ResNet50, bagian dari ResNet50 (Jaringan Resid.
, lebih dalam dan kompleks.
menggunakan skip connection untuk mengurangi masalah gradient loss, membuatnya lebih mudah untuk melatih jaringan yang sangat dalam (Nagpal et al.
, 2.
Hal ini membuatnya lebih cocok untuk kumpulan data yang sangat besar dan tugas yang memerlukan ekstraksi fitur kompleks.
Arsitektur jaringan CNN lebih sederhana daripada ResNet50 dan VGG16 dan VGG16 dan ResNet50 memiliki kemampuan untuk melatih data yang besar (Chilakalapudi et al.
, 2.
namun dalam evaluasinya model CNN mendapatkan overfitting karena gap antara validation accuracy dan accuracy sebesar mungkin inilah alasan mengapa VGG16 mendapatkan akurasi lebih tinggi dibandingkan ResNet50 dan CNN.
Gambar 5 menunjukkan prediksi jenis kendaraan dengan 3 model.
Pada validasi training di epoch 75 grafik menunjukkan validasi CNN lebih tinggi dari ResNet50 dan VGG16.
Gambar 5.
Prediksi Terbaik model CNN.
ResNet50.
VGG16 Gambar 6.
Validation Loss untuk model CNN.
ResNet50 and VGG16 Gambar 6 menunjukkan grafik CNN lebih rendah dari ResNet50 dan VGG16 untuk validasi loss training di epoch 75.
Banyak factor yang menentukan CNN lebih tinggi dari 2 metode yang lain.
Factor yang terjadi dikarenakan CNN dapat melakukan training pada dataset yang sedikit.
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Attribution 4.
0 International License Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 9.
Nomor 1.
Juli 2024 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585
KESIMPULAN
VGG16 bisa lebih baik daripada Convolutional Neural Network (CNN) atau ResNet50 untuk klasifikasi jenis kendaraan bergantung pada berbagai faktor, termasuk kumpulan data, kompleksitas tugas, dan sumber daya komputasi yang Domain-Specific Features, untuk klasifikasi jenis kendaraan sering kali melibatkan pengenalan fitur spesifik seperti bentuk mobil, lampu depan dan lampu belakang.
Kemudian dapat membuat VGG16 khusus yang dirancang dengan arsitektur jaringan yang mempertimbangkan Domain-Specific Features.
Model Size, model pelatihan seperti VGG16 dan ResNet50 memiliki jumlah parameter yang relatif besar.
Dalam beberapa kasus.
CNN khusus dirancang agar lebih ringkas dengan tetap menjaga atau bahkan meningkatkan akurasi klasifikasi.
Hal ini sangat penting untuk penerapan pada perangkat atau aplikasi dengan sumber daya terbatas yang mengutamakan ukuran model.
Mitigating Overfitting, tugas klasifikasi jenis kendaraan mungkin memerlukan perbedaan yang sangat jelas antar jenis kendaraan, yang dapat menyebabkan overfitting saat menggunakan model berukuran besar.
Dengan merancang CNN khusus.
VGG16, dan ResNet50, kompleksitas model dapat dikontrol dan menggunakan teknik seperti regularisasi dan dropout untuk mengurangi overfitting pada kumpulan data tertentu.
Transfer Learning, meskipun VGG16 dan ResNet50 dapat disesuaikan untuk tugas tertentu, melatih CNN atau VGG16 khusus dari awal memungkinkan inisialisasi jaringan dengan bobot acak.
Pada klasifikasi jenis kendaraan, hal ini dapat menghasilkan model yang lebih disesuaikan dengan tugas klasifikasi jenis kendaraan.
SARAN
Arsitektur VGG16 perlu disesuaikan agar berfokus pada karakteristik kendaraan yang paling relevan, sehingga berpotensi menghasilkan performa yang lebih baik.
klasifikasi jenis kendaraan mungkin memerlukan perbedaan yang sangat jelas antar jenis kendaraan untuk menghindari overfitting serta dapat menerapkan Teknik dropout atau regularization pada dataset yang dilatih.
Lalu perlu menentukan bobot dengan acak pada saat inisialisasi jaringan dengan menyesuaikan tugas untuk klasifikasi kendaraan.
UCAPAN TERIMA KASIH