Vol. (Desember 2. 16-25 Information Science and Library eISSN:2723-2778 http://journals. id/index. php/jils Implementasi Algoritma Backpropagation Untuk Memprediksi Jumlah Jiwa Terdampak Banjir Di DKI Jakarta Mira Kartika1. Kemal Ade Sekarwati2 1,2. Departemen Sistem Informasi. Fakultas Ilmu Komputer dan Teknologi Informasi. Universitas Gunadarma 1,2Jl. Margonda Raya No. Depok 16424. Jawa Barat 1 mirakrtika08@gmail. com, 2 ade@staff. DOI: Info Artikel ___________________ Sejarah Artikel: Disubmit 2 Desember 2024 Direvisi 9 Desember 2024 Disetujui 17 Agustus 2024 ___________________ Keywords: Backpropagation. DKI Jakarta. Flood. Forecasting. Number of Souls Affected. _______________________ Abstrak Banjir merupakan bencana alam yang sering terjadi di wilayah DKI Jakarta. Pemerintah DKI Jakarta perlu mengantisipasi dampak bencana banjir dengan melakukan estimasi jumlah penduduk yang terkena banjir. Jumlah penduduk yang terkena banjir yang tidak menentu setiap bulannya dapat diprediksi untuk masa yang akan datang. Ada banyak cara yang dapat dilakukan untuk memprediksi jumlah penduduk yang terkena banjir, salah satunya adalah dengan metode jaringan syaraf tiruan. Salah satu algoritma pembelajaran pada jaringan syaraf tiruan adalah algoritma backpropagation. Penelitian ini menerapkan metode jaringan syaraf tiruan dengan algoritma backpropagation untuk memprediksi jumlah penduduk yang terkena banjir di DKI Jakarta. Pada penelitian ini, proses pelatihan dilakukan sebanyak 100 kali pada masing-masing arsitektur jaringan . -10-1, 12-12-1, 12-14-. dengan beberapa parameter seperti epoch, konstanta momentum, dan learning Hasil terbaik pada proses pelatihan dilakukan pada proses pengujian untuk menguji Pada proses pengujian, hasil terbaik adalah arsitektur 12-10-1 dengan tingkat akurasi 98,704%. Berdasarkan hasil tersebut dapat dikatakan bahwa jaringan ini dapat melakukan prediksi dengan baik dan dapat diimplementasikan untuk peramalan jumlah jiwa yang terkena dampak banjir di DKI Jakarta. Kata kunci: Backpropagation. DKI Jakarta. Banjir. Peramalan. Jumlah Jiwa yang Terdampak. Abstract Floods are natural disasters that often occur in the DKI Jakarta area. DKI Jakarta government needs to anticipate the impact of the flood disaster by estimating the number of people affected by the flood. The number of people affected by floods that are uncertain every month can be predicted for the future. There are many ways that can be predict the number of people affected by floods, one of them is artificial neural network method. One of learning algorithms in artificial neural networks is backpropagation algorithm. This research applies an artificial neural network method with backpropagation algorithm to predict the number of people affected by floods in DKI Jakarta. In this research, training process was carried out 100 times on each network architecture . -10-1, 12-12-1, 1214-. with several parameters such as epoch, momentum constant, and learning rate. The best results in the training process are carried out to testing process to test the network. In the testing process, the best results are 12-10-1 architecture with an accuracy rate Based on these results, it can be said that this network can predict well and can be implemented for forecasting the number of people affected by floods in DKI Jakarta. Keywords: Backpropagation. DKI Jakarta. Flood. Forecasting. Number of Souls Affected. Alamat Korespondensi: E-mail: alyyahaliza@gmail. e-ISSN: 2723-2778 Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. Pendahuluan Banjir adalah suatu peristiwa akibat air yang jatuh ke tanah bertumpuk dan tidak dapat ditampung oleh tanah . Peristiwa ini terjadi karena air jatuh ke dataran yang tidak memiliki daerah tangkapan atau tanah-tanah diperkotaan jenuh air. Banjir sering melanda perkotaan seperti di wilayah DKI Jakarta. Badan Nasional Penanggulangan Bencana (BNBP) menyatakan bahwa banjir menjadi bencana alam yang paling mematikan dari awal Januari 2020 sampai Agustus 2020. BNBP mencatat lebih dari 100 jiwa meninggal akibat banjir dan 17 jiwa Banjir juga menyebabkan kelumpuhan ekonomi, sektor perumahan, dan DKI Jakarta merupakan wilayah yang sering terjadi Faktor-faktor yang menyebabkan wilayah DKI Jakarta sering mengalami banjir adalah wilayah DKI Jakarta memiliki ketinggian kurang dari 10 mdpl, dinamika dan pembangunan perkotaan, demografi perkotaan, dan tata guna lahan serta alih fungsi lahan. Backpropagation merupakan salah satu algoritma pembelajaran pada jaringan saraf Backpropagation melakukan proses pembelajaran dengan menyesuaikan bobotbobot yang ada di jaringan saraf tiruan dengan arah mundur dan berdasarkan nilai error selama proses pembelajaran . MATLAB merupakan program komputer dengan lingkungan yang nyaman untuk mengerjakan banyak perhitungan dan mengimplementasikan berbagai metode numeris . Beberapa penelitian telah membuktikan bahwa algoritma backpropagation berhasil melakukan peramalan. Pada tahun 2016. Triyono. Santoso, dan Pranowo melakukan penelitian untuk meramalkan harga saham (IHSG) menggunakan metode jaringan syaraf tiruan backpropagation . Hasil penelitian ini menunjukkan backpropagation berhasil melakukan peramalan dengan menghasilkan tingkat keakuratan sebesar 99,98% dan MSE sebesar 0,9915%. Pada tahun 2017. Eko Riyanto juga melakukan penelitian yang bertujuan untuk meramalkan harga saham backpropagation . Penelitian ini berhasil dilakukan dan menunjukkan tingkat keakuratan sebesar 98%. Musli. Eka. Dewi, dan Yuhandri juga melakukan penelitian pada tahun 2018 yang berjudul Peramalan Penjualan pada Toko Retail Menggunakan Algoritma Backpropagation Neural Network . Hasil prediksi yang didapat pada penelitian ini memiliki total kesalahan error sebesar 3,57%. Berdasarkan uraian tersebut, penelitian ini bertujuan untuk membuat sebuah model prediksi jumlah jiwa yang terdampak banjir di wilayah DKI Jakarta dengan menggunakan algoritma Backpropagation pada metode Jaringan Saraf Tiruan (JST). Metodologi Metode penelitian yang digunakan untuk menyelesaikan masalah adalah Knowledge Discovery in Databases (KDD). Proses KDD dibagi dalam beberapa tahap, yaitu : Data Selection. Tahap data selection merupakan tahap pencarian data yang dibutuhkan selama Data didapatkan melalui website resmi pemerintah DKI Jakarta seperti pada Gambar 3. Alamat website tersebut adalah https://data. Data yang diambil dimulai dari Januari 2016 sampai dengan Desember 2020. Kolom-kolom yang terpilih untuk digunakan adalah tahun, bulan, dan jiwa terdampak. Kolom tahun dan bulan digunakan untuk keterangan waktu dari setiap data, sedangkan kolom jiwa terdampak Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. merupakan data jumlah jiwa terdampak banjir di wilayah DKI Jakarta. Setelah dilakukan seleksi data, maka data dapat dilihat pada Tabel 1 Tabel 1. Data Asli Jumlah Jiwa Terdampak Banjir di DKI Jakarta Data Jiwa yang Terdampak Banjir di DKI Jakarta Bln/ Thn Jan Feb Mar Apr Mei Juli Agust Sept Okt 6271 6025 8068 3420 4547 705 3840 8209 n. a 6505 404 1001 7597 877 2 Pre-processing Pengolahan Missing Value Data mentah yang hilang pada tabel 1 digambarkan dengan huruf Aun. aAy. tersebut perlu diubah dengan rata-rata dari keseluruhan data atau biasa disebut mean. Rumus mean dapat dilihat pada persamaan . Oc yceycn . Oc ycuycn ycuI = Oc yceycn Keterangan : ycuI : nilai rata-rata fi : nilai tengah kelompok data ke-i xi : frekuensi kelompok data ke-i Rumus mean pada persamaan 1 diaplikasikan pada tabel 1, maka hasil perhitungan adalah : 3853 70218 51234 27607 U 827 ycuI = ycuI = 7974,65 Rata-rata dari Tabel 1 adalah 7974,65. Selanjutnya, nilai tersebut dibulatkan menjadi 7975 dan dimasukkan ke dalam tabel untuk menggantikan data atau nilai yang hilang. Juni Nov Des Normalisasi Data Seluruh data dinormalisasi dengan cara diubah menjadi fungsi aktivasi. Fungsi aktivasi yang digunakan yaitu fungsi aktivasi Sigmoid Biner. Fungsi aktivasi Sigmoid Biner akan mengubah data menjadi nilai dengan interval 0,1 sampai 0,9. Interval tersebut didapat dari persamaan 2. ycuA = 0,8 . cuOeyc. caOeyc. 0,1 . Keterangan : xAo = data hasil normalisasi x = data asli / data awal a = nilai maksimum data asli b = nilai minimum data asli Sebagai contoh data asli jumlah jiwa terdampak banjir pada bulan November Rincian perhitungan dari normalisasi tersebut dapat dilihat sebagai berikut. Diketahui : x = 7597 a = 83406 Ditanyakan : xAo Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. Jawab : 0,8 . cuOeyc. ycu A = . caOeyc. 0,1 xAo = 0,8 ( 7597Oe. 06Oe. Agust Sept Okt Nov Des xAo = 0,17287 Seluruh data yang sudah dinormalisasikan dapat dilihat pada Tabel 2. Tabel 2. Data Jumlah Jiwa Terdampak Banjir Hasil Normalisasi Bulan Jan Feb Mar Apr Mei Juni Juli Jumlah Jiwa Terdampak 2016 2017 2018 2019 2020 0,137 0,176 0,1 0,104 0,774 0,285 0,287 0,111 0,517 0,591 0,198 0,11 0,11 0,193 0,365 0,12 0,109 0,185 0,128 0,16 0,133 0,107 0,103 0,13 0,158 0,144 0,11 0,1 0,103 0,177 0,107 0,406 0,247 0,137 0,179 0,176 0,176 0,176 0,176 0,11 0,112 0,162 0,173 0,104 0,108 0,115 0,112 0,16 0,108 Pembentukan Data Latih Data yang sudah dinormalisasi digunakan sebagai data latih dan data uji. Data latih digunakan untuk proses training. Data latih berisi data dari bulan Januari 2016 sampai dengan Desember 2018. Data latih disajikan dalam bentuk 24 pola. Masing-masing pola memiliki 13 data. Data tersebut terdiri dari x1 sampai dengan x12 dan target. Contoh pola ke-1 yaitu Januari 2016 sampai dengan Desember 2016 . 1 sampai x. dan bulan ke-13 yaitu Januari 2017 sebagai data Hasil pembentukan data latih dapat dilihat pada tabel 3. Tabel 3. Data Latih Pola 0,137 0,774 0,591 0,365 0,16 0,158 0,177 0,406 0,247 0,137 0,179 0,176 Target 0,176 0,774 0,591 0,365 0,16 0,158 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,591 0,365 0,16 0,158 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,365 0,16 0,158 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,16 0,158 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,158 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,177 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,406 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,247 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,137 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,179 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,176 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,176 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,285 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,198 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,12 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,133 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,144 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,11 Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. 0,107 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,11 0,176 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,11 0,176 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,11 0,176 0,162 0,104 0,287 0,11 0,109 0,107 0,11 0,11 0,162 0,104 0,287 0,11 0,109 0,107 0,11 0,11 0,173 0,104 0,287 0,11 0,109 0,107 0,11 0,11 0,173 0,108 Pembentukan Data Uji Data yang sudah dinormalisasi digunakan sebagai data latih dan data uji. Data latih digunakan untuk proses training. Data latih berisi data dari bulan Januari 2019 sampai dengan Desember 2020. Data latih disajikan dalam bentuk 12 pola. Masing-masing pola memiliki 13 data. Data tersebut terdiri dari x1 sampai dengan x12 dan target. Contoh pola ke-1 yaitu Januari 2019 sampai dengan Desember 2019 . 1 sampai x. dan bulan ke-13 yaitu Januari 2020 sebagai data Hasil pembentukan data latih dapat dilihat pada tabel 4. Tabel 4. Data Uji Pola Target 0,104 0,111 0,11 0,185 0,103 0,112 0,115 0,111 0,11 0,185 0,103 0,112 0,115 0,517 0,11 0,185 0,103 0,112 0,115 0,517 0,193 0,185 0,103 0,112 0,115 0,517 0,193 0,128 0,103 0,112 0,115 0,517 0,193 0,128 0,13 0,112 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,112 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,16 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,16 0,115 0,517 0,193 0,128 0,13 0,103 0,112 0,16 0,108 3 Transformation Tahap transformation adalah tahapan mengubah langkah-langkah dalam mengolah data menjadi bentuk script dalam aplikasi MATLAB. Langkah-langkah transformation Membuat folder bernama AuSKRIPSIAy. Folder ini berisi file AuData Banjir. xlsAy. Membuka folder SKRIPSI pada aplikasi MATLAB. Membuat Script MATLAB. Script pertama yang dibuat adalah script training. Script ini berisi kode-kode untuk tahapan training pada data mining. Script kedua yang perlu dibuat adalah script testing. 4 Data Mining Data mining terdiri dari 2 tahapan yaitu tahapan training dan testing. Tahap data mining ini mencari pola atau informasi dalam Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. data yang telah dipilih. Pencarian pola dibantu menggunakan aplikasi MATLAB. Pencarian pola dilakukan dengan dengan cara mengolah data masukan dan nilai target. Penentuan pola dilakukan dengan cara menentukan jumlah neuron, epoch, goal, show, momentum constant . , dan learning rate . Tahap ini dinamakan proses Alur dari proses training dapat dilihat pada Gambar 1. Gambar 2 Flowchart Proses Testing Setelah didapat akurasi dari pola tersebut, maka data ditransformasikan balik. Hasil peramalan yang telah dilakukan masih dalam bentuk Sigmoid Biner. Hasil tersebut ditransformasikan ke bentuk semula menggunakan rumus fungsi aktivasi. Gambar 1 Flowchart Proses Training Setelah pola didapat, langkah selanjutnya adalah menguji kembali pola tersebut dengan data yang lain. Tahap ini dinamakan proses Alur dari proses testing dapat dilihat pada Gambar 2. 5 Interpretation Tahap ini menjelaskan hasil peramalan. Hasil peramalan ditampilkan berupa grafik. Grafik tersebut dapat memudahkan pemerintah DKI Jakarta dalam melihat hasil peramalan. Selain grafik, tahap ini juga akan menghitung error dari data hasil peramalan dengan target. Nilai error akan ditampilkan dalam bentuk Hasil dan Analisa Training Proses pelatihan data dilakukan sebanyak 100 kali pada tiga macam arsitektur jaringan. Arsitektur jaringan yang digunakan yaitu 1210-1 . input, 10 hidden layer, dan 1 outpu. , 12-12-1 . input, 12 hidden layer, dan 1 outpu. , dan 12-14-1 . input, 14 Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. hidden layer, dan 1 outpu. Tujuan proses training dilakukan secara berulang-ulang Proses training menghasilkan 70 data yang adalah untuk mendapatkan performa terbaik memiliki nilai MSE lebih kecil dari nilai goal dari jaringan saraf tiruan backpropagation yaitu 0,001. Data tersebut dipilih kembali dengan nilai Mean Square Error (MSE) sehingga menghasilkan 6 data dengan nilai Setiap percobaan menggunakan nilai MSE terkecil. Keenam data tersebut dapat parameter yang berbeda-beda. Parameter dilihat pada Tabel 5. tersebut adalah parameter epoch, momentum constant . , dan learning rate . Tabel 5. Hasil Training Jaringan Saraf Tiruan Peramalan Jumlah Jiwa Terdampak Banjir di Wilayah DKI Jakarta dengan Nilai MSE Lebih Kecil dari Goal Arsitektur 12-10-1 12-12-1 12-14-1 Epoch Goal Testing Proses training telah menghasilkan arsitektur jaringan yang memiliki nilai MSE lebih kecil dari goal yaitu 0,001. Jaringan tersebut disimpan dan digunakan kembali pada proses testing. Proses ini bertujuan Mse 0,00099744 0,0009999 0,00099991 0,00099662 0,0009999 0,00099999 Regression 0,80938 0,80225 0,80304 0,80447 0,80467 0,80232 Time untuk mengetahui tingkat keakuratan nilai peramalan dengan nilai aktual pada arsitektur jaringan yang telah dilatih. Keenam data pada Tabel 5 diuji kembali dan menghasilkan performansi seperti Tabel 6. Tabel 6. Hasil Testing dari Keenam Arsitektur Jaringan Arsitektur 12-10-1 12-12-1 12-14-1 Epoch Hasil terbaik dari proses testing terdapat pada arsitektur jaringan 12-10-1 dengan nilai parameter epoch 3100, mc 0,8, dan lr 1,6. Model jaringan ini menghasilkan nilai MSE sebesar 0,075822 dan nilai regresi sebesar 0,0065456. Grafik regresi dapat dilihat pada Gambar 3 dan grafik perbandingan keluaran JST dengan target pada Gambar 4. Goal MSE 0,075822 0,067757 0,076353 0,069719 0,06427 0,074528 Regression -0,0065456 0,14798 -0,040319 0,19338 0,2207 0,23477 Information Science and Library e-ISSN: 2723-2778 vol. (Desember 2. Gambar 4 Grafik Perbandingan Keluaran JST dengan Target Testing Pertama Gambar 3 Grafik Regresi Testing Pertama Hasil persentase error dari peramalan yang telah dilakukan dapat dilihat pada Tabel 7. Nilai error terkecil berada pada Pola ke-10 yaitu 1,296%. Hal ini menunjukkan bahwa hasil peramalan memiliki keakuratan sebesar 98,704%. Tabel 7. Hasil Peramalan Jumlah Jiwa Terdampak Banjir Pola Hasil Peramalan Target |Target-Peramala. Pola Hasil Peramalan Target |Target-Peramala. -146,4 Kesimpulan Model prediksi jumlah jiwa yang terdampak banjir di wilayah DKI Jakarta dengan menggunakan algoritma Backpropagation telah berhasil dibuat. Model memiliki arsitektur jaringan 12-10-1 . input, 10 hidden layer, dan 1 outpu. dengan parameter epoch sebesar 3100, mc sebesar 0,8, dan lr sebesar 1,6. Model ini menghasilkan nilai MSE sebesar 0,075822. Nilai MSE yang Persentasi Error (|Target-Peramala. )/Target * 100 97,970% Persentase Error (|Target-Peramala. )/Target * 100 108,653% 122,546% 688,604% 82,599% 3412,500% 117,703% dihasilkan lebih kecil dibandingkan arsitektur jaringan lainnya. Model menghasilkan nilai regresi sebesar -0,0065456 yang mendekati Hal ini membuktikan bahwa model tersebut berhasil memprediksi data target dan model ini memiliki tingkat keakuratan sebesar 98,704%. Daftar Pustaka