PROCESSOR AeVOL. No. Oktober 2025 Laman web jurnal: https://ejournal. id/index. php/processor Jurnal Processor P-ISSN: 1907-6738 | E-ISSN: 2528-0082 Penerapan Metode YOLOv5 untuk Klasifikasi dan Deteksi Objek Menggunakan Video Non-Real-Time Yovi Apridiansyah1. Zeko Padli2. Yuza Reswan3. Harsry Witriyono4 Program Studi Teknik Informatika. Fakultas Teknik. Universitas Muhammadiyah Bengkulu. Jl. Bali. Kampung Bali. Teluk Segara. Kota Bengkulu, 38119. Indonesia . Email: yovi. apridiansyah@umb. id1, zekobkl09@gmail. com2, yuzareswan@umb. id3, harrywitriyono@umb. AbstrakOe Deteksi objek merupakan salah satu penerapan utama dari teknologi computer vision dalam bidang kecerdasan Salah satu algoritma deteksi objek yang banyak digunakan karena efisiensinya adalah YOLOv5. Penelitian ini bertujuan untuk menerapkan metode YOLOv5 dalam mendeteksi dan mengklasifikasikan objek kendaraan dan manusia pada rekaman video non-real-time di kawasan Simpang Tugu Pena Kota Bengkulu. Dataset yang digunakan merupakan video hasil dokumentasi lapangan, yang kemudian dianalisis menggunakan model YOLOv5 dengan pelatihan berbasis transfer Untuk menjaga identitas objek antar-frame, sistem dikombinasikan dengan metode Kalman Filter dan SORT sebagai pelacak objek. Hasil pengujian menunjukkan bahwa model yang dibangun mampu melakukan deteksi objek dengan baik pada kondisi visual yang bervariasi, serta mencapai nilai akurasi yang tinggi berdasarkan pengukuran menggunakan matriks konfusi. Penelitian ini menunjukkan bahwa penerapan YOLOv5 efektif digunakan dalam sistem dokumentasi visual berbasis AI di lingkungan ruang publik yang dinamis. Kata kunci: YOLOv5. deteksi obje. Kalman Filter. SORT. Simpang Tugu Pena. computer vision. AbstractOe Object detection is one of the main applications of computer vision technology in the field of artificial One object detection algorithm widely used due to its efficiency is YOLOv5. This study aims to apply the YOLOv5 method to detect and classify vehicle and human objects in non-real-time video recordings in the Tugu Pena Intersection area of Bengkulu City. The dataset used is field documentation videos, which are then analyzed using the YOLOv5 model with transfer learning-based training. To maintain object identity between frames, the system is combined with the Kalman Filter and SORT methods as object trackers. Test results show that the developed model is capable of good object detection under varying visual conditions and achieves high accuracy based on measurements using a confusion This study demonstrates the effectiveness of YOLOv5 in an AI-based visual documentation system in dynamic public space environments. Keywords: YOLOv5. object detection. Kalman Filter. SORT. Tugu Pena Intersection. computer vision. PENDAHULUAN Tugu Pena adalah ikon bersejarah sekaligus simpang lalu lintas utama di Kota Bengkulu. Kawasan ini ramai oleh kendaraan dan aktivitas masyarakat setiap hari. Kondisi tersebut membuat lalu lintas di sekitar Tugu Pena padat dan dinamis. Situasi ini berpotensi menimbulkan kemacetan dan kecelakaan. Oleh karena itu, dibutuhkan sistem pemantauan visual yang cerdas, otomatis, dan efisien. Sistem ini bermanfaat untuk dokumentasi, perencanaan lalu lintas, serta keamanan. Teknologi computer vision dan kecerdasan buatan (AI) menjadi solusi potensial. Metode deteksi objek seperti YOLOv5 mampu mengidentifikasi kendaraan dan manusia secara cepat dan akurat pada rekaman video non-real-time. Salah satu algoritma deteksi objek paling populer adalah YOLO ( You Only Look Once ). YOLOv4 dikenal karena menyeimbangkan kecepatan dan akurasi dalam pemrosesan data visual . Versi selanjutnya. YOLOv5, hadir dengan peningkatan efisiensi dan arsitektur yang lebih ringan. Menurut Alhassan dan Ylmaz. YOLOv5 terbukti lebih unggul dari YOLOv4 dalam hal presisi dan kecepatan pada sistem pengawasan berbasis UAV . Dalam konteks lalu lintas padat. Rahman dkk. menggunakan YOLOv5 untuk mendeteksi kendaraan di area perkotaan dan memperoleh akurasi tinggi meskipun dalam kondisi visual kompleks . Di bidang industri. Simeth dkk. menerapkan YOLOv5 dalam lini produksi manufaktur dan mendapatkan hasil deteksi yang konsisten dan andal . Selain itu. Rahayu membuktikan efektivitas YOLOv5 dalam klasifikasi ras kucing berdasarkan metadata dari gambar dataset . Agar sistem deteksi antar-frame lebih stabil, algoritma pelacakan seperti Kalman Filter dan SORT Kalman Filter berguna untuk mencerminkan posisi objek pada frame berikutnya secara matematis . , sedangkan SORT memungkinkan pelacakan multi-objek secara efisien dan real-time menggunakan prediksi https://doi. org/10. 33998/processor. Submitted: 09 Agustus 2025. Reviewed: 17 Agustus 2025. Accepted. 02 September 2025. Published: 31 Oktober 2025 Kalman dan metode asosiasi . Lu dkk. meningkatkan performa YOLOv5 dengan mengintegrasikan SwinTransformer dalam mendeteksi buah anggur, yang terbukti meningkatkan akurasi terutama dalam pencahayaan bervariasi . Sementara itu. Mulyana dkk. menggunakan YOLOv5 dalam pendeteksian bahasa isyarat huruf hijaiyah, menunjukkan model yang pendek dalam mengenali pola gerakan tangan . Dalam studi berbasis UAV. Zhang et al. menerapkan YOLOv5 untuk mendeteksi objek dari citra udara dan memperoleh hasil yang memuaskan dalam klasifikasi objek kecil di ketinggian . Untuk penerapan protokol kesehatan. Ashar dan Suarna memanfaatkan YOLOv5 dalam mendeteksi penggunaan masker di lingkungan kantor sebagai bentuk kepatuhan secara otomatis . Sebagai penguatan teoritis. Terven dkk. menyusun ulasan komprehensif tentang seluruh evolusi arsitektur YOLO, dari YOLOv1 hingga YOLOv8, dan menyebut YOLOv5 sebagai model yang sangat seimbang antara efisiensi dan kecepatan . Melalui beragam penelitian tersebut. YOLOv5 terbukti fleksibel, ringan, dan akurat untuk berbagai skenario deteksi objek, baik dalam konteks transportasi, industri, citra udara, maupun kebutuhan sosial . , . , . Oleh karena itu, penelitian ini bertujuan menerapkan YOLOv5 dalam mendeteksi dan mengklasifikasikan objek di kawasan Simpang Tugu Pena Kota Bengkulu, serta mengombinasikannya dengan metode Kalman Filter dan SORT untuk menjaga konsistensi identitas objek antar-frame dalam video non-realtime. METODOLOGI PENELITIAN Metode yang digunakan dalam penelitian ini disusun berdasarkan pertimbangan efektivitas dalam pemrosesan visual berbasis AI. Framework PyTorch dipilih karena memiliki dokumentasi luas, mendukung GPU acceleration, serta kompatibel dengan model YOLOv5 yang dikembangkan oleh Ultralytics. Penggunaan Kalman Filter dan SORT dalam pelacakan objek bertujuan untuk mempertahankan identitas objek secara konsisten antar-frame, mengingat video yang digunakan bersifat non-real-time dan memiliki potensi gerakan objek yang kompleks. Alur proses penelitian ini ditunjukkan pada diagram kerangka kerja yang menggambarkan tahapan utama mulai dari pengumpulan data hingga evaluasi sistem. Gambar 1. Diagram Kerangka Kerja Penelitian https://doi. org/10. 33998/processor. Submitted: 09 Agustus 2025. Reviewed: 17 Agustus 2025. Accepted. 02 September 2025. Published: 31 Oktober 2025 1 Desain Penelitian Penelitian ini menggunakan pendekatan eksperimen dengan pengujian sistem deteksi objek berbasis video statis. Penelitian dilakukan dalam beberapa tahap mulai dari pengumpulan data, pemrosesan data, pelatihan model, hingga evaluasi hasil. 2 Pengumpulan Data Data uji dalam penelitian ini berupa 30 video yang direkam di kawasan Simpang Tugu Pena. Video tersebut memiliki durasi rata-rata 10 detik dengan variasi kondisi pencahayaan . iang dan sor. serta tingkat keramaian lalu lintas. Setiap video kemudian diekstrak menjadi frame untuk dijadikan dataset anotasi. Data ini berfungsi sebagai input utama dalam proses pelatihan dan pengujian model YOLOv5. Jumlah serta variasi video uji ditampilkan pada Gambar 2. Gambar 2. 30 Video Data Uji 3 Pra-Pemrosesan Data Pra-pemrosesan data bertujuan untuk menyiapkan input yang sesuai dengan kebutuhan arsitektur YOLOv5. Tahapan ini mencakup transformasi gambar dari video menjadi bentuk data yang siap dilatih oleh model. Proses ini penting untuk memastikan bahwa kualitas data tetap terjaga dan model dapat belajar secara optimal dari setiap frame yang dianotasi. Alur tahapan pra-pemrosesan tersebut dapat dilihat pada Gambar 3 yang menampilkan proses mulai dari pemuatan data, konversi, normalisasi, hingga data siap digunakan untuk pelatihan model. Gambar 3. Diagram tahapan pra-pemrosesan data https://doi. org/10. 33998/processor. Submitted: 09 Agustus 2025. Reviewed: 17 Agustus 2025. Accepted. 02 September 2025. Published: 31 Oktober 2025 Frame yang diperoleh dari video diproses melalui beberapa tahapan: konversi format gambar ke tensor PyTorch, normalisasi nilai piksel, resizing ke dimensi input YOLOv5 . , serta augmentasi data . otasi, flipping, penyesuaian brightness dan kontra. Frame juga diberi anotasi manual menggunakan tool labelimg untuk membentuk ground truth. 4 Pelatihan Model Model dibor menggunakan framework PyTorch dengan modul pelatihan dari Ultralytics YOLOv5. Dataset dibagi menjadi dua bagian, yaitu data latih ( data pelatihan ) dan validasi data ( validation data ). Data latih digunakan agar model dapat mempelajari pola objek, sedangkan validasi data digunakan untuk menguji kinerja model pada data yang belum pernah dilihat sehingga menghindari overfitting . Selama proses pelatihan, beberapa metrik evaluasi digunakan. Presisi mengukur tepat prediksi positif, yaitu perbandingan antara jumlah deteksi benar dengan seluruh deteksi positif yang dihasilkan. Ingat model ukuran kemampuan menemukan semua objek yang relevan. Kedua metrik umum digunakan dalam menilai kinerja sistem klasifikasi . Selain itu, akurasi juga digunakan untuk mengukur proporsi prediksi benar terhadap keseluruhan data, sehingga menggambarkan kinerja model secara umum . Proses pelatihan dilakukan secara iteratif ( epoch ) hingga model mencapai stabilitas pada nilai presisi , recall , dan akurasi yang optimal. 5 Pelacakan dan Evaluasi Untuk pelacakan objek, digunakan algoritma Kalman Filter dan SORT agar sistem dapat menjaga konsistensi identitas objek antar frame. Visualisasi hasil dilakukan dengan menampilkan bounding box dan label pada tiap Evaluasi sistem dilakukan menggunakan confusion matrix serta menghitung precision, recall, dan akurasi. HASIL DAN PEMBAHASAN 1 Hasil Evaluasi Confusion matrix atau matriks kebingungan adalah metode evaluasi yang digunakan untuk menilai performa model klasifikasi dengan cara membandingkan hasil prediksi model terhadap data aktual. Matriks ini berbentuk tabel dua dimensi yang memuat informasi jumlah prediksi yang benar maupun salah pada setiap kelas . Dalam confusion matrix terdapat empat komponen utama, yaitu True Positive (TP). True Negative (TN). False Positive (FP), dan False Negative (FN). Keempat komponen tersebut menjadi dasar dalam menghitung ukuran performa model. Beberapa ukuran yang umum digunakan adalah akurasi, presisi, dan recall . Akurasi Akurasi mengukur proporsi data yang diprediksi dengan benar dibandingkan dengan keseluruhan data Presisi Presisi menunjukkan tingkat ketepatan model dalam memprediksi data positif. Recall (Sensitivita. Recall menggambarkan kemampuan model dalam menemukan seluruh data positif yang sebenarnya https://doi. org/10. 33998/processor. Submitted: 09 Agustus 2025. Reviewed: 17 Agustus 2025. Accepted. 02 September 2025. Published: 31 Oktober 2025 POSITIF NEGATIF POSITIF TP = 17 FP = 3 NEGATIF FN = 5 TN = 5 Gambar 4. Confusion Matrix Model YOLOv5 Pada Gambar 4 terlihat bahwa diagonal utama matriks mewakili jumlah data yang diklasifikasikan dengan benar (TP dan TN), sementara bagian di luar diagonal menunjukkan kesalahan klasifikasi (FP dan FN). Dengan demikian, confusion matrix dapat memberikan gambaran detail mengenai distribusi hasil prediksi. Tabel 3. 1 Hasil Perhitungan Confusion Matrix Metrik Nilai Akurasi 73,3 % Presisi Recall 77,3 % Berdasarkan hasil pada Tabel 3. 1, diperoleh akurasi sebesar 73,3%, yang berarti model mampu mengklasifikasikan data dengan benar pada 73,3% dari total data uji. Nilai presisi sebesar 85% menunjukkan bahwa sebagian besar prediksi positif yang dihasilkan model sesuai dengan kondisi aktual, sehingga tingkat kesalahan prediksi positif (False Positiv. relatif rendah. Selanjutnya, nilai recall sebesar 77,3% menandakan bahwa model cukup baik dalam menemukan data positif yang sebenarnya ada, meskipun masih terdapat beberapa data positif yang terlewat (False Negativ. Secara keseluruhan, kombinasi nilai akurasi, presisi, dan recall tersebut menunjukkan bahwa model memiliki performa yang cukup baik, dengan kecenderungan lebih kuat pada ketepatan prediksi . dibandingkan kelengkapan deteksi . Evaluasi menggunakan confusion matrix membantu memberikan gambaran yang lebih rinci dibandingkan hanya mengandalkan akurasi semata . 2 Analisis Sistem Gambar 5. Contoh Hasil Deteksi Objek https://doi. org/10. 33998/processor. Submitted: 09 Agustus 2025. Reviewed: 17 Agustus 2025. Accepted. 02 September 2025. Published: 31 Oktober 2025 Berdasarkan Gambar 5 bahwa Sistem mampu mendeteksi dan melacak objek secara simultan. Kombinasi antara YOLOv5 dan SORT memungkinkan identifikasi pergerakan objek dan klasifikasi kelas secara konsisten, sedangkan Kalman Filter digunakan untuk prediksi posisi objek antar frame. dan klasifikasi kelas secara Penerapan Non-Maximum Suppression (NMS) membantu menyaring prediksi yang tumpang tindih. Model menunjukkan ketahanan terhadap variasi pencahayaan dan latar belakang dinamis. Namun, masih ditemukan kesalahan deteksi pada beberapa objek kecil atau terhalang. Peningkatan kualitas dataset dan augmentasi lanjutan dapat mengatasi kendala tersebut. KESIMPULAN Penelitian ini menunjukkan bahwa penerapan metode YOLOv5 pada video non-real-time di kawasan Simpang Tugu Pena Kota Bengkulu mampu melakukan deteksi dan klasifikasi objek kendaraan serta manusia dengan performa yang cukup baik, ditunjukkan oleh nilai akurasi sebesar 73,3%, presisi 85%, dan recall 77,3%. Integrasi metode pelacakan Kalman Filter dan SORT membantu menjaga konsistensi identitas objek antar-frame, sehingga sistem mampu melacak pergerakan secara simultan meskipun kondisi visual dinamis. Hasil ini membuktikan bahwa YOLOv5 efektif digunakan sebagai sistem pemantauan visual berbasis AI di ruang publik, meskipun masih terdapat keterbatasan dalam mendeteksi objek kecil atau tertutup sebagian, yang dapat diatasi melalui peningkatan kualitas dataset dan pengembangan model lebih lanjut untuk aplikasi real-time maupun integrasi dengan perangkat pemantauan seperti CCTV dan drone. UCAPAN TERIMAKASIH Penulis mengucapkan terima kasih kepada Universitas Muhammadiyah Bengkulu dan dosen pembimbing atas dukungan selama penelitian ini berlangsung. REFERENCES