Seminar Nasional Rekayasa. Sains dan Teknologi Vol 3 No 1 Tahun 2023 Penerapan Metode Fuzzy Q-Learning Pada Robot Berkaki Enam Pemadam Api Dalam Pencarian Jalur Tercepat Menuju Titik Api Richa Watiasih1. Pangki Dwi Pradana2 Prodi Teknik Elektro Fakultas Teknik Universitas Bhayangkara Surabaya,1,2 richa@ubhara. AbstrakAiRobot pemadam api merupakana alternatif pengganti petugas pemadam kebakaran dalam skala kecil. Waktu yang cepat dalam pencarian titik api sangat diperlukan agar api cepat dapat dipadamkan. Penelitian ini telah menghasilkan sebuah robot berkaki enam pemadam api menggunakan metode Fuzzy Q-Learning (FQL) yang bertujuan untuk memaksimalkan pencarian jalur tercepat menuju titik api sehingga dapat meminimalkan waktu tempuh robot dalam menyelesaikan misinya. Dimana penggunaan sensor Ultrasonik sebagai pendeteksi jarak robot terhadap halangan, sedangkan sensor UVTron dan TPA81 digunakan untuk mendeteksi keberadaan dan merasakan adanya api. Data dari ketiga sensor tersebut digunakan sebagai input pada FQL. Fuzzy logic digunakan untuk mempercepat pengambilan keputusan pergerakan robot, sedangkan Q-learning memberikan suatu reward dan punishment pada setiap pergerakan. Data dari Q-learning disimpan pada MicroSD supaya dapat cepat diproses untuk pertimbangan pada pergerakan selanjutnya. Robot berkaki enam pemadam api ini telah diuji coba beberapa kali sampai mendapatkan reward Berdasarkan pengujian yang telah dilakukan sebanyak 10 kali diketahui waktu tercepat menemukan titik api ketika tanpa menggunakan metode FQL adalah 218 detik, sedangkan ketika menggunakan metode FQL diperoleh keberhasilan menemukan titik api dengan waktu tercepat 154 detik. Jika dibandingkan dengan tanpa menggunakan metode diketahui bahwa penggunaan metode FQL dapat meminimalkan waktu tempuh menuju titik Kata kunciAirobot berkaki enam, pemadam api. Ultrasonik. UVtron. TPA81. Fuzzy Q-learning (FQL) AbstractAiFire extinguishing robots are an alternative replacement for firefighters on a small Fast time searching for fire points is necessary so the fire can be extinguished quickly. This research has produced a six-legged fire extinguishing robot using the Fuzzy Q-Learning (FQL) method which aims to maximize the search for the fastest path to the fire point so that it can minimize the robot's travel time in completing its mission. The Ultrasonic sensor detects the robot's distance from obstacles, while the UVTron and TPA81 sensors are used to detect the presence and sense of fire. Data from the three sensors is used as input for FQL. Fuzzy logic speeds up decision-making for robot movements, while Q-learning provides reward and punishment for every movement. Data from Q-learning is stored on Micro SD to be processed for consideration for the next move quickly. Based on tests that have been carried out 10 times, it is known that the fastest time to find hotspots without using the FQL method is 218 seconds, whereas if you use the FQL method, success in finding hotspots is achieved with the fastest 154 seconds. Compared to not using this method, it is known that using the FQL method can minimize travel time to the fire Keywords Ai six-legged robot, fire extinguisher. Ultrasonic. UVtron. TPA81, fuzzy Q-learning (FQL) yang terbakar ataupun gangguan sesak nafas dapat terjadi . Oleh karena itu tugas pemadam kebakaran dapat digantikan dengan robot pemadam api. Robot harus mampu menemukan PENDAHULUAN Kinerja petugas pemadam api dalam melakukan tugasnya dapat dibilang berbahaya. Resiko kecelakaan dan terjebak dalam bangunan Richa Watiasih1. Pangki Dwi Pradana2 titik api pada suatu ruangan kemudian Robot pemadam api didesain secara autonomous tanpa adanya campur tangan manusia ketika di jalankan, mulai dari posisi awal robot dan berakhir pada tujuan ruang api . Karena kondisi lingkungan yang tidak diketahui maka harus ada perencanaan jalur menuju titik api. Dimana robot bergerak memerlukan algoritma perencanaan jalur agar dapat menemukan jalur yang aman dalam menghindari tabrakan dan optimal dalam mencapai target . Dalam beberapa kasus robot pemadam api berkaki masih belum bisa bermanuver dengan baik, seperti tidak menemukan titik api, robot tersangkut di ujung dinding, maupun tidak dapat kembali ke home setelah menyelesaikan misi, sehingga diperlukan sebuah sistem perencanaan jalur dan kontrol pergerakan robot. Penelitian tentang robot berkaki pemadam api dengan menggunakan metode Proporsional Integral Derivative (PID) telah dihasilkan . , sedangkan . dari penelitian yang telah dilakukan dapat diketahui bahwa robot mampu menjejak dinding namun sulit untuk mempertahankan posisi terhadap referensi ini disebabkan karena kontroler Derivative mempengaruhi respon sistem sehingga dibutuhkan pengembangan metode kontrol cerdas. Beberapa penelitian kecerdasan buatan yang diterapkan pada perencanaan jalur bagi robot berkaki telah dilakukan seperti penerapan fuzzy logic . , neural network . Ant Colony . dan penggunaan metode hybrid seperti antara neural network dengan fuzzy logic . Namun belum optimal karena tidak mempertimbangkan faktor pengenalan lingkungan yang dilalui robot. Pada area kebakaran yang tidak terduga, robot harus mampu melakukan manuver secara kompleks dan sulit diprediksi . , dimana robot diberikan sebuah metode pembelajaran untuk mengekplorasi lingkungan yang tidak diketahui sebelumnya . Selain metode navigasi yang tepat, juga diperlukan mekanisme pembelajaran pada robot untuk mengatasi halAehal yang tak terduga baik berupa halangan statis maupun Reinforcement learning adalah metode pembelajaran untuk memetakan setiap keadaan terhadap aksi yang dipilih untuk memaksimalkan reward yang diterima secara langsung dari lingkungan . Ada berbagai metode untuk penyelesaian masalah reinforcement learning, salah satunya adalah Q-Learning. Kelebihan dari Q Learning adalah memiliki sifat off policy . apat mengikuti policy apapu. , algoritma ini sederhana dan konvergen terhadap optimal policy . Penelitian ini mengusulkan sebuah sistem pencarian jalur tercepat bagi robot berkaki enam yang memiliki tugas untuk mencari sumber/titik api dan memadamkan api dengan menerapkan metode Fuzzy Q-Learning sebagai mekanisme pembelajaran robot terhadap lingkungan yang ditemui, sehingga robot dapat meminimalkan waktu pencarian sumber/titik api. II. METODE PENELITIAN Perancangan Hardware Perancangan hardware robot berkaki enam pemadam api pada penelitian ini seperti yang ditunjukkan blok diagram pada gambar 1. Blok diagram robot ini terdiri dari bagian Slave dan Master. Pada bagian slave hanya mengontrol output pergerakan robot yang berupa motor servo dengan menggunakan mikrokontroler Arduino Due II. Untuk bagian master merupakan sistem kendali pusat dari robot berkaki enam pemadam api yang langsung terhubung dengan sensor, antara lain sensor Ultrasonik berfungsi untuk mendeteksi dinding pada lingkungan robot, dimana Pengambilan data pada sensor ultrasonik dilakukan secara kontinyu. Sensor thermal TPA81 berfungsi untuk mendeteksi radiasi panas pada benda . Sensor line tracer berfungsi sebagai pendeteksi koridor dengan pintu di setiap Sensor UV-Tron berfungsi mendeteksi adanya cahaya ultraviolet yang dipancarkan api . Sensor Magnetic Kompas berfungsi untuk memberikan referensi robot untuk mengetahui arah pada saat keluar ruangan. Pada bagian master juga terhubung dengan output Water pump. LCD dan SD Card. Komunikasi data dari kedua mikrokontroller menggunakan komunikasi serial. Gambar 1. Hardware robot berkaki enam. Blok diagram. Fisik robot berkaki enam Penulis 1. Penulis 2. Penulis 3,AA Desain Mekanik Desain mekanik kaki-kaki robot berkaki enam ini ditunjukkan pada gambar 2. Dimana aktuator pada robot berkaki menggunakan motor servo. Robot Berkaki didesain 6 buah kaki dengan masing-masing sisi kanan dan sisi kiri berjumlah 3 kaki seperti ditunjukkan pada gambar 2. Setiap kaki robot memiliki sistem mekanik yang sama dan tiga derajat kebebasan (DOF) . Setiap kaki terdapat 3 bagian yaitu Coxa. Femur, dan Tibia. Untuk setiap bagian memiliki fungsi tersendiri, coxa berfungsi sebagai pergerakan maju atau mundur, femur berfungsi untuk mengangkat atau menurunkan kaki, dan tibia digunakan untuk melebarkan kaki. Gambar 2. menunjukkan sumbu pergerakan dari setiap kaki Dimana yca menyatakan learning rate, 0 < yca O 1 menentukan ukuran laju dimana nilai yang lama digantikan dengan nilai yang baru. Untuk yu menyatakan Discount rate, 0