Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage: https://journal. id/index. php/malcom Vol. 4 Iss. 1 January 2024, pp: 350-358 ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Using Xception. Transfer Learning, and Permutation to Improve the Classification of Steel Surface Imperfections Menggunakan Xception. Transfer Learning, dan Permutasi untuk Meningkatkan Klasifikasi Ketidaksempurnaan Permukaan Baja Popong Setiawati1. Adhitio Satyo Bayangkari Karno2. Widi Hastomo3. Iwan Setiawan4 1Program Studi Sistem Informasi. Fakultas Ilmu Komputer. Universitas Esa Unggul. Indonesia 2Program Studi Sistem Informasi. Fakultas Teknik. Universitas Gunadarma. Depok. Indoensia 3Program Studi Teknologi Informasi. Institut Teknologi dan Bisnis Ahmad Dahlan. Indonesia 4Program Studi Teknik Informatika. Fakultas Teknik. Komputer dan Desain. Universitas Nusa Putra. Indonesia E-Mail: 1popong. setiawati@esaunggul. id, 2adh1t10. 2@gmail. has@gmail. com, 4iwan. setiawan@nusaputra. Received Dec 02nd 2023. Revised Jan 15th 2024. Accepted Jan 29th 2024 Corresponding Author: Popong Setiawati Abstract The surface quality of manufactured steel is critical for increasing competitiveness in the steel industry. The high degree of flaws on the steel surface is a serious issue impacting the quality of the output. Controls that are still performed manually and visually at this time can only be performed by people with specific talents and expertise. Observations in this conventional method take a long time, are sluggish, and have little precision. Nowadays, the development of deep learning techniques allows for the automatic detection of steel surface flaws with a high degree of accuracy. The Xception architecture is used in this work to implement a deep learning strategy. Permutation and augmentation techniques are used to overcome data imbalances. The developed model can discriminate between four types of flaws on the steel surface. collection of 7,095 steel surface photos is used in the training procedure. When compared to not employing transfer learning, the results of performance measurement for the training process using transfer learning (Imagene. indicate better outcomes. Transfer learning training yielded accuracy scores of 94. 9% and 97. 7% for training data and validation. Whereas the results of the loss value assessment for training data and validation are 19. 4% and 14. Keyword: Augmentation Permutate. Deep Learning. Steel Defect. Transfer Learning. Xception Abstrak Kualitas permukaan baja yang diproduksi sangat penting untuk meningkatkan daya saing dalam industri baja. Tingginya tingkat cacat pada permukaan baja merupakan masalah serius yang berdampak pada kualitas keluaran. Pengendalian yang masih dilakukan secara manual dan visual saat ini hanya dapat dilakukan oleh orang-orang dengan bakat dan keahlian Pengamatan dengan metode konvensional ini memerlukan waktu yang lama, lamban, dan presisi yang rendah. Saat ini, perkembangan teknik pembelajaran mendalam memungkinkan deteksi cacat permukaan baja secara otomatis dengan tingkat akurasi yang tinggi. Arsitektur Xception digunakan dalam pekerjaan ini untuk menerapkan strategi pembelajaran mendalam. Teknik permutasi dan augmentasi digunakan untuk mengatasi ketidakseimbangan data. Model yang dikembangkan dapat membedakan empat jenis cacat pada permukaan baja. Koleksi 7. 095 foto permukaan baja digunakan dalam prosedur pelatihan. Jika dibandingkan dengan tidak menggunakan transfer learning, hasil pengukuran kinerja proses pelatihan dengan menggunakan transfer learning (Imagene. menunjukkan hasil yang lebih baik. Pelatihan pembelajaran transfer menghasilkan skor akurasi masing-masing sebesar 94,9% dan 97,7% untuk data pelatihan dan Sedangkan hasil penilaian nilai kerugian untuk data latih dan validasi masing-masing sebesar 19,4% dan 14,4%. Kata Kunci: Permutasi Augmentasi. Pembelajaran Mendalam. Cacat Baja. Pembelajaran Transfer. Xception DOI: https://doi. org/10. 57152/malcom. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 PENDAHULUAN Baja telah banyak digunakan di berbagai sektor untuk memproduksi berbagai jenis kebutuhan manusia, termasuk mobil, perkapalan, persenjataan, elektronik, dan lain-lain . Cacat permukaan baja merupakan masalah yang harus dihindari jika ingin mencapai kualitas yang baik. Bagian kendali produksi merupakan komponen penting yang menentukan kualitas baja yang bebas dari kesalahan pada permukaan baja. Cacat dapat menyebabkan baja cepat berkarat . , sehingga menurunkan ketahanan aus baja . Kemampuan untuk mendeteksi cacat permukaan baja secara otomatis sangat penting untuk membantu penyelesaian permasalahan dalam industri baja dan menghindari kerugian ekonomi jangka panjang . Beberapa penelitian saat ini sedang dilakukan yang menggunakan pendekatan pembelajaran mesin untuk mengidentifikasi berbagai jenis kesalahan tidak hanya di sektor baja tetapi juga di industri lain seperti . , kesehatan . , persenjataan, dan pendeteksi keabsahan berbagai kartu identitas, uang, dan lainlain. Pendekatan ini memerlukan prosedur pelatihan yang menggunakan data pelatihan dalam jumlah besar untuk membuat model yang dapat digunakan dalam visi mesin. Ekspansi pembelajaran mesin ke desain jaringan saraf yang berbeda cenderung mencakup lapisan yang lebih dalam dan lebih besar . Penggunaan arsitektur pembelajaran mendalam dengan data pelatihan dalam jumlah besar memerlukan pemanfaatan teknologi komputer berkinerja tinggi. Penelitian ini menggunakan teknik pembelajaran mendalam dengan arsitektur Xception . untuk mempersingkat waktu pelatihan digunakan metode transfer learning . , yaitu model yang telah menyelesaikan tahap pelatihan pertama dengan menggunakan kumpulan data yang sangat besar. Penelitian ini menggunakan pendekatan pelatihan dengan dan tanpa transfer learning untuk menguji apakah terdapat perbedaan hasil . Ae. Untuk mengatasi distribusi data yang tidak seimbang, selain pendekatan augmentasi data-generator, dilakukan augmentasi lebih lanjut dengan membagi gambar menjadi beberapa bagian kemudian disusun kembali menggunakan teknik permutasi . , . Autoencoder bertingkat dan klasifikasi CNN untuk lokasi cacat logam telah dilakukan . Jaringan feed-forward digunakan untuk mengidentifikasi enam jenis patahan pada permukaan baja dalam klasifikasi cacat baja canai panas . Penelitian ini mengklasifikasikan area disabilitas dan disabilitas menggunakan YOLO . Menggunakan model FRCNN dan SSD untuk mendeteksi cacat baja . Klasifikasi cacat dari gambar permukaan baja menggunakan algoritma Siam dan CNN . , . Dengan menggunakan pendekatan pembelajaran beberapa langkah, latih jaringan dengan beberapa kumpulan data dan gambar beranotasi . Ae. Berdasarkan berbagai penelitian, metode deep learning telah banyak digunakan untuk mengidentifikasi patahan baja, namun untuk mendapatkan hasil terbaik tetap dilakukan dengan menggunakan berbagai pendekatan dan teknik yang berbeda-beda. Rumitnya gambar, banyaknya data, dan ketidakseimbangan data membuat sulit untuk menghasilkan hasil model dengan akurasi METODE PENELITIAN Penelitian ini menggunakan dataset Severstal dari Kaggle . Distribusi jenis cacat yang tidak seimbang memerlukan pemrosesan data awal sebelum prosedur pemisahan dapat dimulai . Prosedur augmentasi yang umum digunakan . eperti rotasi, skala ulang, flip, dan gese. digabungkan dengan proses augmentasi lain yang menggunakan prinsip permutasi dalam proses pemrosesan data. Untuk menghasilkan sampel pelatihan, pendekatan permutasi pemisahan data digunakan dalam klasifikasi cacat permukaan baja. Ini memerlukan penggunaan permutasi untuk memilih dan mengatur data gambar sambil membiarkan labelnya Metode ini membantu model dalam mempelajari karakteristik yang lebih kuat dan meningkatkan kemampuan generalisasinya. Model ini dapat belajar mengenali kesalahan dari berbagai sudut dengan menerapkan permutasi pada set pelatihan, sehingga lebih berhasil dalam mengenali cacat permukaan baja. Data tersebut kemudian dipisahkan menjadi data pelatihan dan validasi data . Selanjutnya, arsitektur Xception digunakan untuk menjalankan proses pelatihan, yang menggunakan data gambar sebagai data pelatihan dan empat jenis klasifikasi berbeda sebagai tujuan pelatihan. Konsekuensi akhir dari prosedur pelatihan ini adalah model yang dapat digunakan untuk memperkirakan foto tambahan dengan kekurangan yang tidak diketahui. Data akurasi dan kerugian, yang ditampilkan secara grafis, digunakan untuk menilai performa model. Untuk membandingkan keluaran model, dilakukan prosedur pelatihan dengan dan tanpa pembelajaran transfer. Pendekatan studi ini dibagi menjadi beberapa langkah, dimulai dengan analisis kumpulan data dan berlanjut melalui persiapan kumpulan data, pemisahan, pelatihan, dan hasil pengukuran grafis (Gambar . MALCOM - Vol. 4 Iss. 1 January 2024, pp: 350-358 MALCOM-04. : 350-358 Gambar. 1 Metode yang diusulkan Analisis Kumpulan Data Data Severstal yang digunakan dalam penyelidikan ini terdiri dari satu file CSV dan satu folder berisi foto permukaan baja. File berformat CSV memiliki 1. 095 baris dengan tiga kolom: ImageId. ClassId, dan EncodedPixels. Kolom ImageId memberikan informasi tentang identifikasi gambar jpg. ClassId menentukan kategori cacat untuk setiap permukaan baja, dan EncodedPixels menentukan masker atau lokasi cacat untuk setiap gambar dalam bentuk urutan piksel. Grafik data sebaran jenis cacat (Gambar . menunjukkan bahwa tipe 3 memiliki cacat paling banyak . 150 fot. dan tipe 2 memiliki cacat paling sedikit . Pada setiap gambar permukaan baja, grafik distribusi cacat menunjukkan bahwa 6. 239 gambar memiliki satu jenis cacat, 425 gambar memiliki dua jenis kesalahan, dan hanya 2 gambar yang memiliki tiga jenis cacat (Gambar Tabel 1. Ekstraksi file kumpulan data Imageld Classid Encoded Pixels 29102 12 29346 24 29602 24 29858 24 30114 24 3. 18661 28 18863 82 19091 110 19347 110 19603 11. 37607 3 37858 8 38108 14 38359 20 38610 25 388. 105929 5 106177 14 106424 24 106672 33 106923. 16899 7 17155 20 17411 34 17667 47 17923 60 18. 30931 43 31103 127 31275 211 31489 253 31745 2. Gambar 3. Distribusi jenis cacat, . Distribusi cacat Kumpulan Data Pra-pemrosesan Angka akurasi yang buruk akan disebabkan oleh distribusi data yang tidak seimbang . Dua prosedur augmentasi digunakan untuk mengatasi hal ini. Penyempurnaan awalnya adalah dengan membagi foto menjadi beberapa bagian berdasarkan nilai pembagi yang telah ditentukan, lalu menyusunnya kembali agar tetap mempertahankan ukuran aslinya. Fragmen gambar disusun ulang menggunakan pendekatan permutasi. Apabila datanya tidak seimbang, nilai pembaginya disesuaikan dengan banyaknya data awal. untuk jenis sesar baja 1, 2, 3, dan 4 kita menggunakan nilai pembagi 2, 3, 1, dan 2 yang sesuai. Menggunakan Xception. Transfer Learning, dan Permutasi. (Setiawati et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Kita buat ketentuan nilai pembaginya lebih besar untuk jenis cacat yang angkanya lebih kecil dan lebih kecil untuk jenis cacat yang angkanya lebih tinggi. Sehingga besarnya ketidakseimbangan jumlah data untuk setiap jenis kesalahan berkurang dan selisihnya tidak berlebihan. Gambar 5 menunjukkan contoh gambar dengan nilai pembagi 4 yang akan menghasilkan tambahan 23 titik data. Agar jumlah data lebih seimbang dan sesuai untuk proses pelatihan pembelajaran mesin, akan diperoleh 1. 000 foto dari setiap kategori data, sehingga 000 gambar akan digunakan pada prosedur selanjutnya. Peningkatan kedua menggunakan paket Keras . Image Data Generator, dengan skala ulang = 1/255, rentang geser = 0,1, rentang zoom = 0,1, pembalikan horizontal= benar, pembalikan vertikal= benar, dan rentang rotasi = 60. Prosedur pemisahan datanya adalah langkah terakhir sebelum data digunakan dalam proses pelatihan. data dipisahkan menjadi data pelatihan . %) dan validasi data . %). Permutasi dengan pembagi 4, dimana P. adalah banyaknya permutasi dari n elemen, n adalah banyaknya elemen dalam himpunan, dan n! . adalah hasil kali semua bilangan bulat positif dari 1 sampai n . ycEycycu = . Oe. Permutasi dengan pembagi 4 adalah istilah yang mengacu pada permutasi yang banyaknya permutasinya habis dibagi 4. Bagi 4 artinya hasil perhitungan permutasi harus berupa bilangan bulat yang habis dibagi 4 tanpa sisa. adalah banyaknya permutasi dengan pembagi 4 dari n elemen. n adalah jumlah elemen dalam himpunan. N! adalah hasil kali semua bilangan bulat positif dari 1 sampai n. Oe. ! adalah hasil kali semua bilangan bulat positif dari 1 sampai . 4! adalah hasil kali semua bilangan bulat positif 1 sampai 4. ycE44 = = 24 . Oe . ! Gambar 4. Augmentasi fermentasi untuk nilai pembagi 4 Gambar 5. Distribusi data setelah augmentasi permutasi Arsitektur Xception Arsitektur Xception , pengembangan dari desain sebelumnya . rsitektur Inceptio. , digunakan dalam penelitian ini untuk mengklasifikasikan empat kategori cacat pada permukaan baja . Xception menghasilkan array 36 lapisan konvolusi yang disarangkan dalam 14 modul dan dipisahkan oleh blok sisa yang terhubung untuk mengurangi komputasi dan pemanfaatan memori . Tautan blok sisa ini digunakan untuk MALCOM - Vol. 4 Iss. 1 January 2024, pp: 350-358 MALCOM-04. : 350-358 mengkompensasi hilangnya gradien dengan membentuk rute yang menembus jaringan sekuensial . Dengan tidak membuat konvolusi melalui semua saluran, jumlah koneksi antar saluran di Xception lebih sedikit dan lebih ringan jika dibandingkan dengan konvolusi pada arsitektur lain. Gambar 7 menggambarkan arsitektur Xception, yang akan berisi 5 konvolusi berukuran nxn. Gambar 6. Arsitektur Xception HASIL DAN PEMBAHASAN Prosedur pelatihan menggunakan arsitektur Xception untuk mengkategorikan jenis cacat permukaan baja, yang ditampilkan sebagai grafik akurasi dan kerugian menggunakan data pelatihan dan validasi. Nilai akurasi data latih dan validasi prosedur pelatihan yang tidak melibatkan pembelajaran transfer (Imagene. masing-masing sebesar 81,3% dan 84,3%. Sedangkan temuan pengukuran tingkat kehilangan data pelatihan dan validasi masing-masing sebesar 13,4% dan 27,3% (Gambar . Nilai akurasi data latih dan validasi metode pelatihan transfer learning masing-masing sebesar 94,9% dan 97,7%. Sedangkan nilai kerugian yang diukur untuk data pelatihan dan validasi masing-masing sebesar 19,4% dan 14,4% (Gambar . Hasil pengukuran numerik dari prosedur pelatihan dengan dan tanpa pembelajaran transfer ditunjukkan pada Tabel 1. Akurasi sebesar 97,7% menunjukkan bahwa model yang dilatih mampu mengidentifikasi dan mengklasifikasikan ketidaksempurnaan pada permukaan baja dengan tingkat keberhasilan yang sangat tinggi. Hal ini menunjukkan bahwa pendekatan transfer learning yang digunakan untuk melatih model sangat efektif. Penggunaan transfer learning dalam konteks ini merupakan pendekatan yang bijaksana. Pembelajaran transfer memungkinkan model untuk memanfaatkan pengetahuan yang ada dari model yang dilatih sebelumnya . isalnya, model yang dilatih pada kumpulan data besar seperti ImageNe. untuk meningkatkan performa pada tugas klasifikasi permukaan baja. Hal ini dapat menghemat waktu dan sumber daya pelatihan. Klasifikasi ketidaksempurnaan permukaan baja merupakan tugas penting dalam industri baja karena permukaan baja yang cacat dapat mengakibatkan masalah kualitas produk dan bahkan masalah keselamatan. Oleh karena itu, memiliki model klasifikasi yang kuat merupakan aset yang berharga. Gambar 7. Akurasi dan kerugian grafik tanpa pembelajaran transfer Menggunakan Xception. Transfer Learning, dan Permutasi. (Setiawati et al, 2. ISSN(P): 2797-2313 | ISSN(E): 2775-8575 Gambar 8. Grafik akurasi dan kerugian dengan pembelajaran transfer Tabel 2. Nilai akurasi dan kerugian terbaik Mentransfer Tidak Kereta / Validasi Ketepatan Kehilangan Kereta Validasi Kereta Validasi 0,81263 0,84278 0,94901 0,97727 0,13381 0,27314 0,19438 0,14413 Tabel 3. Studi Kinerja Model Saat Ini Referensi Model yang Metode - Mentransfer pembelajaran dengan MobileNet-V2. Xception. DenseNet121. ResNet-50 - Model dasar dilatih dari awal dengan ResNet - Pembelajaran transfer dan segmentasi - Augmentasi data dan EfficientNet sebagai tulang punggung - Konvolusional klasik metode jaringan saraf - Model pembelajaran transfer - Mentransfer pembelajaran - Validasi silang bertingkat Pembelajaran semi-supervisi berbasis CNN Xsepsi. Pembelajaran Transfer, dan Permutasi Hasil mencapai 92% skor F1 tertimbang mencapai koefisien dadu rata-rata 0,912. akurasi 98%. InceptionV3 memiliki akurasi tinggi dan skor F1 . ebih dari 95%) akurasi 99,15 akurasi 0,977 _ Tabel 2 adalah studi kinerja model saat ini , studi sebelumnya oleh . Dalam artikel ini, algoritma klasifikasi multi-label berdasarkan metode pembelajaran mendalam diusulkan untuk deteksi cacat pada permukaan baja, di mana model dasar dilatih dari awal berdasarkan lapisan konvolusional seperti ResNet. Pembelajaran Xception, permutasi, dan transfer digunakan untuk meningkatkan kategorisasi patahan permukaan baja. Wang dkk. , seperti yang dibahas oleh penulis, menggunakan EfficientNet sebagai tulang punggung untuk mendapatkan peta fitur, dekonvolusi digunakan untuk menggabungkan lima peta fitur, dan lapisan konvolusi digunakan untuk mendapatkan peta topeng dari berbagai cacat. Metode yang diusulkan berdasarkan pembelajaran transfer dan segmentasi gambar mencapai koefisien rata-rata dadu sebesar 0,912, yang menunjukkan akurasi tinggi dalam deteksi cacat permukaan baja. Penelitian yang dilakukan oleh . Dalam artikel ini, model pembelajaran transfer berdasarkan jaringan saraf konvolusional penuh (FCN) diusulkan untuk mensegmentasi area strip baja yang rusak, yang mencapai akurasi 98%. Teks yang diberikan tidak memberikan informasi tentang pembelajaran mesin dan metode berbasis algoritma genetika untuk memprediksi deviasi lebar strip canai panas dalam sistem produksi baja. Penelitian sebelumnya oleh . Hasil eksperimen menunjukkan bahwa InceptionV3 mampu mengklasifikasikan cacat permukaan dengan akurasi yang relatif tinggi dan skor F1 lebih dari 95% sekaligus memiliki arsitektur hemat memori yang cocok untuk aplikasi dunia nyata. Makalah ini mengusulkan penggunaan pembelajaran transfer untuk mengklasifikasikan cacat permukaan pada strip baja canai panas, mencapai akurasi tinggi dan skor F1 dengan model InceptionV3. Li dkk. , sebagaimana dibahas oleh MALCOM - Vol. 4 Iss. 1 January 2024, pp: 350-358 MALCOM-04. : 350-358 penulis, mengusulkan pendekatan pembelajaran semi-supervisi untuk inspeksi permukaan otomatis (ASI) untuk mengidentifikasi cacat pada barang-barang manufaktur, yang mencapai kinerja canggih pada kumpulan data deteksi permukaan baja publik. Kesimpulan dari penelitian ini adalah bahwa sebagian besar pendekatan untuk inspeksi permukaan otomatis dalam metalografi menggunakan pembelajaran yang diawasi, yang memerlukan data berlabel untuk pelatihan. KESIMPULAN Pengumpulan data, pra-pemrosesan data, pemisahan data, prosedur pelatihan, dan analisis penilaian kinerja model yang dihasilkan merupakan proses yang dilakukan dalam penelitian ini untuk mengklasifikasikan empat kategori cacat pada permukaan baja. Prosedur augmentasi ekstra . ugmentasi permutas. dilakukan pada tahap pra-pemrosesan. augmentasi ini dilakukan sebagai strategi tambahan untuk mengatasi ketidakseimbangan data dan memperkuat teknik augmentasi yang biasanya digunakan dengan paket Keras . ibrary Image Data Generato. Untuk membandingkan hasil yang diperoleh, kami melakukan dua prosedur pelatihan dalam penelitian ini: satu dengan pembelajaran transfer dan satu lagi tanpa pembelajaran transfer menghasilkan skor akurasi masing-masing sebesar 94,9% dan 97,7% untuk data pelatihan dan validasi. Sedangkan hasil penilaian nilai kerugian untuk data latih dan validadi masing-masing sebesar 19,4% dan 14,4%. Hasil ini dapat menjadi dasar untuk pengembangan lebih lanjut, seperti integrasi model ke dalam proses produksi baja atau pengembangan antarmuka yang memungkinkan pengguna mengunggah gambar permukaan baja dan menerima prediksi klasifikasi. Secara keseluruhan, pencapaian akurasi sebesar 97,7% dalam klasifikasi ketidaksempurnaan permukaan baja menggunakan pembelajaran transfer merupakan pencapaian yang mengesankan dan berpotensi memberikan manfaat yang signifikan dalam industri baja. Namun, penting untuk terus memantau kinerja model dan melakukan evaluasi secara cermat untuk memastikan keandalan dan kesesuaian model dalam lingkungan produksi nyata. REFERENSI