Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Implementasi Metode Faster Region Convolutional Neural Network (Faster R-CNN) Untuk Pengenalan Jenis Burung Lovebird Fino Charli1.
Hadi Syaputra*2 .
Muhammad AkbarA.
Siti Sauda4.
Febriyanti Panjaitan5 1,2,3,4,5Informatics Departement .
Bina Darma University.
Palembang.
Indonesia Email: 1finocharli77@gmail.
com, 2hadisyaputra@binadarma.
3muhammadakbar@binadarma.
id, 4sitisauda@binadarma.
5febriyantipanjaitan@binadarma.
Abstrak Lovebird merupakan burung sosial yang hidup berkelompok di alam bebas.
Burung dari genus Agapornis ini ukuran tubuhnya relative mungil bila dibanding burung berparuh bengkok lainnya.
Panjangnya sekitar 13-17 cm dengan bobot 30-60 gram.
Ragam dan jenis burung lovebird sangat banyak namun bila dilihat dengan pendeketan taksonomi, hanya terdapat 9 spesies burung lovebird.
Penelitian metode Faster Region Convolutional Neural Network ini digunakan untuk mengenali jenis burung lovebird guna mencari tahu motif atau warna asli dari jenis burung lovebird tertentu berdasarkan tingkat akurasi dari hasil deteksi objek.
Faster R-CNN merupakan pengembangan Convolutional Neural Network (CNN) yang ditemukan oleh Ross Girshick.
Sampai saat ini metode ini masih terus dikembangkan dan digunakan untuk pengenalan objek atau objek recognition.
Penelitian ini menggunakan data set burung lovebird dengan total 808 gambar dan 8 .
yaitu Agapornis Personata.
Agapornis Fischeri.
Agapornis Lilianae.
Agapornis Nigrigenis.
Agapornis Roseicollis.
Agapornis Taranta.
Agapornis Pullarius.
Agapornis Canus.
Hasil dari proses learning didapatkan akurasi sebesar 96% dengan loss sebesar 0,2% .
sehingga dapat disimpulkan bahwa metode Faster R-CNN dapat diterapkan pada pengenalan jenis burung lovebird.
Keta Kunci: Faster Regional Neural Network, object detection, convolutional neural network, image, deep learning.
PENDAHULUAN
Deep learning merupakan suatu kelas dari teknik pembelajaran mesin yang memanfaatkan banyak lapisan dalam pemrosesan informasi untuk ekstraksi dan Deep learning lahir pada tahun 2006 diperkenalkan oleh geoffrey hinton untuk menjelaskan algoritma baru yang dapat membuat komputer melihat(Purnama.
Deep learning mulai dikenal pada kompetisi pengenalan citra ImageNet Large Scale Visual Recognition Competition (ILSVRC) tahun 2012(Suyanto.
Kurniawan Nur Ramadhani.
Satria Mandala, 2.
, teknik ini menjadi pemenang pertama di This work is licensed under a Creative Commons Attribution 4.
0 International License.
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index (ILSVRC) dengan akurasi yang jauh lebih tinggi dibanding shallow learning .
achine learnin.
Ada banyak Teknik pengenalan objek dengan deep learning.
,diantaranya Region based Convolutional Neural Network (R-CNN).
Fast R-CNN.
Faster R-CNN, dan You Only Look Once (YOLO)(Gandhi, 2.
Faster R-CNN merupakan Teknik pengenalan objek oleh mesin yang dikembangkan oleh Ross Girshick dkk pada tahun 2015 (Gandhi, 2.
Faster R-CNN memiliki 3 modul utama yang pertama deep fully convolutional network yang mengusulkan region, modul kedua adalah detector Fast R-CNN yang menggunakan region yang diusulkan dan RPN yang berfungsi mengarahkan Fast R-CNN untuk melihat(Ren et al.
, 2.
Untuk melakukan pengenalan objek terlebih dahulu kita mengumpulkan dataset, dataset merupakan kumpulan citra yang kita kumpulkan dan diberi label oleh manusia yang kemudian di proses oleh mesin untuk sebagai pembelajaran sebelum melakukan klasifikasi(Purnama, 2.
burung lovebird merupakan hewan asli daratan Afrika dan memiliki 9 .
jenis diantaranya : Agapornis personata.
Agapornis fischeri.
Agapornis lilianae.
Agapornis nigrigenis.
Agapornis roseicolis.
Agapornis taranta.
Agapornis pullarius.
Agapornis canus, dan Agapornis canus.
Lovebird merupakan burung social berparuh bengkok asli daratan Afrika.
Dialam bebas burung lovebird dapat terdiri dari 5 hingga 20 ekor per kelompok.
Sedangkan burung dewasa akan hidup berpasangan dengan sangkar tak jauh dari koloninya, burung dari genus Agapornis ini ukuran tubuhnya relative mungil dengan bobot 30- 60 gram.
Mutasi warna yang banayak terjadi pada burung Lovebird yang ada di Indonesia adalah sebuah hasil rekayas genetik dengan mengawin silangkan burung Lovebird yang tidak sejenis sehingga banyak dijumpai warna yang berbeda dalam satu jenis burung.
Pada penelitian ini penulis akan menggunakan Algoritma Faster Region Convolutional Neural
Network (Faster R-CNN) untuk mengenali jenis burung Lovebird pada sebuah citra
METODOLOGI PENELITIAN
Tahapan Penelitian .
Pengumpulan Gambar Data yang diambil dan dikumpulkan hanyalah 8 .
jenis dari 9 (Sembila.
jenis lovebird yang ada.
Masing- masing kelas berjumlah 100 gambar berformat .
hal ini dilakukan agar data uji dan data latih mendapat bobot training yang sama sehingga menghasilkan bias rendah pada data latih dan data uji.
Mengingat jenis Lovebird jenis Agapornis swindernianus susah 186 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index untuk ditangkarkan dan sangat Langkah sehingga sulit untuk mendapatkan 100 buah gambar jenis burung ini.
Gambar 2.
folder per serratus gambar .
Pelabelan data Pemberian label pada gambar atau anotasi ini bertujuan untuk mendapatkan ciri khusus yang merepresentasikan masing-masing objek yang terdapat dalam Ciri khusus tersebut nantinya akan dijadikan learning dalam proses Gambar 3.
Pelabelan data Fino Charli.
Hadi Syaputra, at all | 187 Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Gambar 4.
Hasil Anotasi Hasil anotasi akan berupa koordinat objek dalam bentuk file xml seperti gambar .
Membagi Dataset Pada tahap ini dataset dibagi menjadi dua bagian yaitu data train dan data tes.
Sesuai dengan konsep split dataset, data train harus lebih banyak dari data test.
Pada penelitian ini pembagian dataset merujuk pada penelitian yang pernah dilakukan sebelumnya (Susanto et al.
, 2.
Dataset dibagi menjadi 80% untuk data train dan 20% untuk data test.
Konversi file xml ke .
Konversi file xml menjadi file .
csv bertujuan untuk membuat himpunan data yang semula tidak rapi menjadi bentuk tabel yang berisi fitur yang akan dipelajari dalam proses konvolusi.
Berikut hasil konversi file xml hasil anotasi yang sudah dikonversi kedalam bentuk .
Gambar 5.
Hasil konversi file xml 188 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Mengenerate file ke bentuk TFRecord Setelah mengumpulkan semua fitur dalam bentuk csv maka Langkah selanjutnya ialah mengubah file .
csv yang berisi fitur2 tadi kedalam bentuk biner agar dapat diolah menggunak tensorflow Training Data Training data adalah proses yang memakan waktu lama.
Training data dilakukan dengan cara menjalankan sebuah script yang berisi source code dan konfigurasi yang telah kita setting pada komputer kita.
Training dilakukan sebanyak 2000000 step yang mana setiap step ditampilkan hasil dari pembelajaran .
earning() sistem.
Setiap step akan menampilkan sebuah variabel yang disebut Loss menunjukkan apakah model berlatih dengan baik atau tidak.
Untuk lebih jelasnya kita dapat melihatnya dalam Inference graph yang merupakan catatan atau rekaman selama kita melakukan training.
Gambar 6.
Proses training Menyimpan Hasil frozen graph selama proses training, tensorboard akan merekam semua proses yang terjadi pada saat proses berlangsung, file terekam dalam bentuk .
dalam folder training.
File yang tersimpan dam merekam step terakhir akan dikonversi menjadi sebuah model hasil pelatihan dengan format protobuf dengan ekstensi file Au.
pbAy Fino Charli.
Hadi Syaputra, at all | 189 Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Gambar 7.
model training tensorflow dan checkpoint Testing Setelah menghasilkan model yang dilatih berdasarkan chechkpoint terakhir dan frozen graph.
Maka model sudah siap untuk diuji untuk menunjukkan keakuratan model dalam pengklasikiasian jenis burung Lovebird.
Pengujian dilakukan dengan menjalankan test_video.
py di Pycharm yang sudah dimasukkan video berisi gambar burung Lovebird.
Hasilnya adalah video yang sama namun dengan bounding box dan nama jenis burung lovebird dan tingkat akurasinya 2 Burung Lovebird Burung Lovebird yang nama latinnya Agapornis, masih satu family dengan burung kaka tua.
Dari 9 (Sembila.
jenis spesies 8 diantaranya berasal dari daratan afrika.
Hanya 1 Agapornis Canus yang berasal dari pulau madagaskar sebuah pulau dekat didekat benua Afrika (Tim Karya Tani Mandiri, 2.
Burung Lovebird bereproduksi dengan bertelur.
Dalam setiap kelahiran menghasilkan 3-6 telur dengan lama pengeraman 22 hari.
Seiring berjalannya waktu, lovebird sering disilangkan untuk menghasilkan warna mutasi baru.
Kondisi alam yang disukai burung lovebird adalah lahan kering dan iklim yang Pada dfasarnya lovebird hanya terdiri dari sembilan jenis saja, namun seiring berjalannya waktu, lovebird sering disilangkan untuk menghasilkan warna mutasi bulu.
Dapatkah metode Faster Region Convolutional Neural Network .
aster R-CNN) dapat memprediksi jenis burung Lovebird dalam kasus ini.
190 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index 3 Deep Learning Deep learning adalah suatu teknik pada machine learning yang memanfaatkan banyak layer pada pengolahan informasi non-linier yang digunakan untuk melakukan ekstaksi fitur pengenalan pola dan klasifikasi (Deng dan Yu, 2.
Gambar 8.
Deep Neural Network 4 Convolutional Neural Network Convolutional Neural Network merupakan salah satu jenis neural network yang biasanya digunakan dalam pengolahan data image (Santoso & Ariyanto, 2.
Arsitektur CNN terdiri atas satu lapisan .
nput laye.
, satu lapis keluaran .
utput laye.
, dan lapis tersembunyi .
idden laye.
Lapis tersembunyi umumnya berisi convolutional layer, pooling layer, normalization layer.
ReLu layer, fully connected layer, dan loss layer(Suyanto.
Kurniawan Nur Ramadhani.
Satria Mandala.
Pada proses training terdapat 3 tahapan yaitu convolutional layer, pooling layer, dan fully connected layer(Santoso & Ariyanto, 2.
Berikut ulasan 3 layer tersebut:
Convolutional layer, terdiri dari neuron yang tersusun sedemikian rupa sehingga membentuk sebuah filter dengan tinggi dan panjang .
Tiap filter memiliki nilai dan nilai dari filter inilah yang menjadi parameter yang akan di-update dalam proses learning.
Gambar 9.
Convolutional Layer Fino Charli.
Hadi Syaputra, at all | 191 Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index .
Pooling layer, pooling layer berfungsi menjaga ukuran data Ketika convolution dilakukan, yaitu dengan melakukan reduksi sampel .
own samplin.
contoh gambar 2.
2 dengan pooling, kita dapat merepresentasikan data menjadi lebih kecil, mudah dikelola, dan mudah mengontrol overfitting.
Gambar 10.
proses pooling untuk mereduksi data Pada umumnya proses pooling dilakukan menggunakan max pooling atau average pooling.
Caranya adalah dengan memilih nilai maksimum atau nilai rata-rata dalam suatu area tertentu contoh gambar 10.
Gambar 2.
4 Teknik Max pooling .
Fully Connected layer, pada lapisan yang terhubung secara penuh .
ully connected laye.
, setiap neurons memiliki koneksi penuh ke semua aktivasi dalam lapisan sebelunya.
Hal ini sama persis dengan MLP, yaitu komputasi menggunakan suatu perkalian matriks yang diikuti dengan bias offset 192 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Gambar 11.
Fully Connected Layer 4 Faster Region Convolutional Neural Network Faster R-CNN merupakan pengembangan dari Fast R-CNN.
Sebagai generasi terbaru dari metode objek setection menunjukan hasil yang mengesankan pada objek deteksi Gambar 12.
Arsitektur dari Faster R-CNN (Le, 2.
Gambar 12.
menunjukkan arsitektur dari faster R-CNN.
Faster R-CNN memiliki Langkah-langkah sebagai berikut :
Region Proposal Network (RPN) yaitu tugas cepat yang berguna untuk mencari pada input gambar kemungkinan lokasi dari objek.
Posisi dari objek yang ada pada gambar memiliki kemungkinan objek dibatasi dari wilayah yang diketahui sebagai region of interest (ROI).
RPN
mengambil gambar dari berbagai ukuran sebagai input dan ouput sekumpulan proposal objek persegi panjang, masing -masing dengan skor objektivitas.
Fino Charli.
Hadi Syaputra, at all | 193 Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index Gambar 13 Region Proposal Network (RPN) Pada Region Proposal Network awalnya gambar dimasukkan ke dalam jaringan Convolutional Neural Network.
Gambar input diteruskan ke jaringan convolutional layer terakhir yang menampilkan feature map(Gilbert, 2.
Sliding window ditempatkan pada setiap bagian dari feature map.
Sliding window mask biasanya diambil dari ukuran mask n*n.
Sesuai dengan setiap sliding window, secara bersamaan memprediksi beberapa region proposal, dimana jumlah proposal maksimum yang mungkin untuk setiap lokasi dilambangkan sebagai k.
Layer reg memiliki output 4k yang mengkodekan koordinat kortak k, dan layer cls menghasilkan 2k yang memperkirakan probabilitas objek atau tidak objek untuk setiap proposal.
Setiap anchor diposisikan di tengah dari sliding windows.
Secara standar menggunakan 3 skala dan 3 rasio aspek yang menghasilkan k=9 anchor pada setiap sliding windows (Gilbert, 2.
Klasifikasi menunjukkan probabilitas 0 atau 1 yang menunjukkan apakah wilayah tersebut berisi objek atau tidak dengan p*= 1 jika IoU >0,7, p* = .
1 jika IoU <o,3, p* = 0 jika selain itu(Gilbert, 2.
Gambar 14 Tiga Anchor dengan Aspect ratio dan Scaling 194 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index HASIL DAN PEMBAHASAN Setelah melakukan proses training menggunakan algoritma deep learning dengan model Faster R-CNN dapat kita ketahui bahwa training dilakukan hingga nilai loss konsisten dibawah 0,05.
Sehingga mampu menghasilkan akurasi yang cukup tinggi, hal tersebut dapat dilihat dari gambar berikut Gambar 15 Agapornis Personata Gambar diatas merupakan hasil capture dari video yang dijalankan dengan test_video.
py menggunakan pycharm.
Hasil prediksi bertujuan untuk menentukan dua hal, apakah ada burung Lovebird dalam suatu citra yang diberikan ? jika ada jenis burung Lovebird apa yang ada pada citra ?.
Gambar 16.
Agapornis Roseicollis Dari gambar 15 dan 16, dapat dilihat bounding box mengenali jenis burung lovebird hingga mampu memberikan persentase dari deteksi objek dari video Fino Charli.
Hadi Syaputra, at all | 195 Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index yang diberikan.
Terlihat hasil akurasi sebesar 97% pada Agapornis personata dan 99% untuk video yang bergambar lovebird jenis Agapornis Roseicollis.
1 Inference graph Seperti yang telah kita bahas sebelumnya proses training dapat diamati jika kita menggunakan framework tensorflow.
Hal ini dikarenakan tools tensorboard yang memuat inference graph.
Adapun beberapa grafik utama yang menjadi acuan penulis dalam mengamati proses training diantaranya grafix box classifier loss dan grafik RPN loss.
Gambar 17.
Grafix box classifier loss/classification Grafik ini menunjukkan kesalahan yang dilakukan model dalam mengklasifikasi objek yang terdeteksi menjadi berbagai macam kelas lain.
Dengan demikian model mendapatkan nilai kesalahan rata-rata dibawah 0,03 dalam mendeteksi objek menjadi kelas yang seharusnya selama proses training Gambar 18 Grafik RPN loss/objectness loss Pada grafiki ini tensorboard menginformasikan kesalahan classifier dalam mengklasifikasikan sebuah objek atau sebuah latar belakang.
Selama proses trainig tensorboard akan merekam semua proses yang terjadi pada saat proses File terekam dalam dile berekstensi .
dalam folder File yang tersimpan dan merekam step step terakhir akan dikonversi menjadi sebuah model hasil pelatihan dengan format protobuf dengan ekstensi 196 | Implementasi Metode Faster Region Convolutional Neural Network .
Journal of Information Technology Ampera Vol.
No.
December 2020 e-ISSN: 2774-2121 https://journal-computing.
org/index.
php/journal-ita/index KESIMPULAN Berdasarkan hasil analisis yang telah dilakukan, maka dapat diperoleh beberapa kesimpulan sebgai berikut :
Ragam warna yang terdapat pada jenis burung Lovebird sudah dapat menjadi bahan poembeda antara satu jennies ke jenis lainnya.
Metode Faster Region Convolutional Neural Network dapat memprediksi jenis burung lovebird.
Tingkat akurasi model yang didapatkan dari hasil pendeteksian jenis burung lovebird pada suatu citra digital menggunakan Faster region convolutional Neural Network berkisar 78% hingga 99%.
DAFTAR PUSTAKA