JURNAL ILMIAH TEKNOLOGI INFORMASI DAN KOMUNIKASI (JTIK) VOL 14. No. Maret 2023, 144 - 152 p-ISSN : 2087-0868 . edia ceta. e-ISSN : 2598-9707 . edia onlin. C page 144 http://ejurnal. id/index. php/JTIKP WEATHER FORECAST FROM TIME SERIES DATA USING LSTM ALGORITHM Yoga Estu Nugraha1. Ishak Ariawan2. Willdan Aprizal Arifin3 Sistem Informasi Kelautan. Universitas Pendidikan Indonesia e-mail:yogaestun26@upi. edu1, ishak_ariawan@upi. edu2, willdanarifin@upi. ARTICLE INFO Article history: Received : 13 Ae Desember - 2022 Received in revised form : 19 Ae Desember - 2022 Accepted : 1Ae Februari - 2023 Available online : 1 Ae Maret - 2023 ABSTRACT Accurate weather forecasts play an important role in today's world as various sectors such as marine, navigation, agriculture and industry are basically dependent on weather conditions. Weather forecasts are also used to predict the occurrence of natural disasters. Weather forecasting determines the exact value of weather parameters and then predicts future weather conditions. this study the parameters used are. Different weather parameters were collected from the Serang Maritime Meteorological Station and then analyzed using a neural network-based algorithm, namely Long-short term memory (LSTM). In predicting future weather conditions using LSTM neural networks are trained using a combination of different weather parameters, the weather parameters used are temperature, humidity, rainfall, and wind speed. After training the LSTM model using these parameters, future weather predictions are performed. The prediction results are then evaluated using RMSE. Prediction results show that the model is more accurate when predicting temperature data with RMSE 0. 37, then RMSE wind speed 72. RMSE sunlight 2. 79, and RMSE humidity 5. This means that the model is very good at studying weather data, inversely proportional to humidity data. Keyword: LSTM. Neutral. Weather forecasting. RMSE PENDAHULUAN Prakiraan cuaca adalah proses dari pengumpulan data dari kondisi atmosfer, yang terdiri dari temperatur, kelembaban, penyinaran matahari, dan kecepatan angin . Cuaca mempengaruhi kehidupan manusia di berbagai aspek . , . Faktor-faktor tersebut kemudian diteliti dan dicocokkan dengan cuaca hari, bulan, bahkan tahun sebelumnya sehingga mendapatkan perkiraan cuaca yang paling akurat . Proses meneliti dan mencocokkan data dalam jumlah yang besar ini termasuk dalam cabang ilmu komputer yaitu data mining . Data mining sebagai salah satu trend analisa data berperan melakukan pengenalan pola data dari sebuah data warehouse. Peran teknologi informasi pada dunia klimatologi sangat penting terutama pada sarana informasi lebih awal dalam mamprakiraan faktor alam yang terburuk . , dengan begitu teknologi informasi membutuhkan perencanaan dan implementasi yang optimal. Dikarenakan banyaknya tuntutan dari berbagai pihak yang membutuhkan informasi kondisi atmosfer yang lebih cepat, lengkap dan akurat maka keandalan akurasi prakiraan cuaca selama ini menjadi permasalahan utama . Pencarian metode untuk memprediksi cuaca adalah kegiatan yang belakangan ini banyak dilakukan oleh para peneliti terhadap atmosfer atau cuaca. Diperlukan suatu metode baik matematika, statistika atau komputer Received : 13 Ae Desember - 2022. Received in revised form : 19 Ae Desember - 2022. Accepted : 1 Februari - 2023. Available online : 1 Ae Maret - 2023 p-ISSN : 2087-0868 e-ISSN : 2598-9707 yang mampu dengan tepat memberikan informasi prakiraan hujan. Hal ini disebabkan sangat kompleksnya sistem atmosfer terutama di wilayah Indonesia sebagai bagian dari wilayah tropis. Banyak parameter dan proses yang terlibat dan saling berkaitan satu sama lain . Long Short Term Memory Neural Network (LSTM) merupakan salah satu jenis RNN . LSTM menyimpan informasi terhadap pola-pola pada data. LSTM dapat mempelajari data mana saja yang akan disimpan dan data mana saja yang akan dibuang, karena pada setiap neuron LSTM memiliki beberapa gates yang mengatur memori pada setiap neuron itu sendiri . LSTM banyak digunakan untuk pemprosesan teks, video, dan data time series. Beberapa penelitian sebelumnya menyatakan data kualitas udara adalah data runtun waktu atau stochastic time series sehingga proses peramalan dapat didasarkan pada data historis . Analisis time series adalah bagian dari prosedur statistik yang digunakan untuk peramalan struktur probabilitas situasi mendatang yang dapat dimanfaatkan dalam pengambilan keputusan. Beberapa penelitian tentang prediksi dengan menggunakan metode LSTM diantaranya prediksi polusi udara perkotaan di Surabaya . , menghasilkan nilai RMSE sebesar 1,880. Peramalan beban listrik di smart grid oleh Zhang . , yang membandingkan metode SVR. NNETAR. RMSE. NARX, dan SARIMA didapatkan hasil terbaik yakni metode LSTM dengan nilai RMSE sebesar 0,0702. Selain itu, pada dunia finance juga digunakan dalam case prediksi harga bitcoin dan harga saham . Dari masing-masing prediksi tersebut didapatkan nilai akurasi sebesar 93,5% pada bitcoin dan Berdasarkan hasil penelitian-peneitian tersebut, dapat diperoleh hasil yang memuaskan menggunakan LSTM pada beberapa case tertentu. Oleh karena itu penelitian ini bertujuan untuk memprediksi menggunakan algoritma LSTM. Data yang akan diuji adalah pendapatan dari Badan Meteorologi Klimatologi dan Geofisika (BMKG) Stamar Kelas 1 Serang. Data klimatologi terkait adalah data temperatur, kelembaban, penyinaran matahari, dan kecepatan angin. Data akan melewati tahapan preprocessing terlebih dahulu agar data yang digunakan dalam kondisi baik dan siap digunakan. Pengujian LSTM dilakukan beberapa kali untuk mendapatkan hasil yang optimal. LSTM digunakan karena data yang akan diolah adalah data rentang waktu dan LSTM sangat cocok untuk memprediksi rentang waktu ketika ada langkah-langkah waktu dengan ukuran yang bebas dengan menggunakan LSTM diharapkan dapat melakukan prediksi cuaca dengan mendapatkan hasil yang akurat. TINJAUAN PUSTAKA Proses terjadinya hujan dikaitkan dengan proses fisis dan dinamika atmosfer diketahui melalui parameter-parameternya seperti adanya massa udara, gaya vertikal dan energi. Untuk memprkirakan cuaca tidak cukup memperhatikan parameter cuaca dalam skala regional, melainkan diperlukan juga parameter dalam skala lokal. Pada skala lokal ini dipakai untuk mengetahui faktor konvektivitas suatu daerah, dimana dimanfaatkan untuk mengetahui daerah pertumbuhan awan vertikal. Peran teknologi informasi pada dunia klimatologi sangat penting terutama pada sarana informasi lebih awal dalam mamprakiraan faktor alam yang terburuk . , dengan begitu teknologi informasi membutuhkan perencanaan dan implementasi yang Prediksi Proses perkiraan terhadap hal yang terjadi di masa mendatang dengan pemikiran yang pragmatis dan sistematis berdasarkan data terkait di masa lalu dengan proses pengerjaan yang terarah dan dengan menggunakan teknik analisa serta menggunakan metode ilmiah, sehingga diharapkan dapat memberi objektivitas yang lebih baik. Lonk-short term memory (LSTM) LSTM adalah algoritma yang efisien untuk membangun model sekuensial time series. Komponen dasar jaringan LSTM adalah blok memori, yang diciptakan untuk mengatasi gradien yang hilang dengan menghafal parameter jaringan untuk jangka waktu yang lama. Blok memori dalam arsitektur LSTM mirip dengan sistem penyimpanan diferensial dari sistem digital. Input Gate di LSTM membantu dalam memproses informasi dengan bantuan fungsi aktivasi . dengan output berada di antara 0 atau 1. METODOLOGI PENELITIAN Pendekatan yang dilakukan dalam penelitian ini dilakukan dalam beberapa tahapanan yang terdiri dari pengumpulan data dari Stasiun Metereologi Maritim Serang, data preprocessing dan processing, pendefinisian model neural network, training model, testing model, dan evaluasi model. Tahapan penelitian tersebut dapat dilihat pada gambar 1. WEATHER FORECAST FROM TIME SERIES DATA USING LSTM ALGORITHM (Yoga Estu Nugrah. p-ISSN : 2087-0868 e-ISSN : 2598-9707 Gambar 1. Tahapan penelitian Data collection Penelitian ini dilakukan di beberapa tempat berbeda, yaitu di Stasiun Meteorologi Maritim Serang dengan ID World Meteorological Organization (IMO) yaitu 96737 dan di Laboratorium Komputer UPI Kampus Serang. Secara spesifik lokasi penelitian dapat dilihat pada Table 1. Table 1. Lokasi penelitian ID WMO Nama Stasiun Litang Bujur Elevasi Keterangan Stasiun Meteorologi Maritim Serang Data diperoleh dan dikumpulkan dari Stasiun Meteorologi Maritim Serang adalah data yang berisikan catatan terkait cuaca seperti data temperatur, kelembaban, penyinaran matahari, dan kecepatan angin. Data yang dikumpulkan yaitu dalam rentang waktu dari 1 January 2018 Ae 28 Oktober 2022. Data yang dikumpulkan adalah data harian. Data preprocessing Data pre-processing yang dilakukan dalam penelitian ini adalah dengan metode data cleaning di mana proses ini bertujuan untuk mengatasi data dengan cara menambahkan data yang hilang, memperbaiki, mengoreksi, atau menghapus data yang salah dan tidak relevan dari kumpulan data. Data cleansing merupakan salah satu teknik pre-processing data yang paling penting karena pada teknik ini data akan dipastikan siap untuk digunakan. Dalam penelitian ini metode yang digunakan untuk data pre-processing adalah dengan cara men-drop NaN value yang terdapat dalam data. Modelling Neural Networks Pada proses pengolahan data, data diolah adalah data time series yang berbentuk matriks 1 dimensi untuk salah satu parameter dengan ukuran Nx1 yang berarti terdapat jumlah N baris dan 1 kolom. Learning model yang digunakan adalah supervised learning yang neural network memerlukan data inputan untuk model serta output data sebagai target untuk melakukan proses modelling atau learning. Data input yang digunakan adalah data dari data harian sebelumnya sebelumnya yaitu t-1, t-2, t-3, . , t-11, t-12 dan data output yang digunakan adalah data dari hari setelahnya yaitu t, t 1, t 2, . , t 11. Hal ini dilakukan dalam satu baris akan menghasilkan data sebagai input dan data sebagai output. Data input digunakan sepanjang data harian agar model mampu mempelajari pola variasi cuaca tahunan yang ada di daerah yang menjadi area penelitian. Jenis neural network yang digunakan dalam penelitian ini adalah Long Short-Term Memory (LSTM). LSTM ditemukan oleh Hochreiter dan Schmidhuber pada tahun 1997. Untuk mengatasi masalah "long-term dependencies". Hochreiter dan Schmidhuber pada 1997 mengusulkan sel LSTM. Mereka meningkatkan kapasitas mengingat sel berulang standar dengan memperkenalkan "gate" ke dalam sel. Sejak saat itu. LSTM telah dimodifikasi dan dipopulerkan oleh banyak peneliti . Variasi termasuk LSTM tanpa forget gate. LSTM dengan forget gate, dan LSTM dengan peephole. Biasanya istilah sel LSTM menunjukkan LSTM dengan forget gate . Pada penelitian ini juga menggunakan LSTM dengan menggunakan variasi forget Gambaran arsitektur yang digunakan dalam penelitian ini dapat dilihat pada Gambar 1. JURNAL ILMIAH TEKNOLOGI INFORMASI DAN KOMUNIKASI (JTIK) VOL 14. No. Maret 2023, 144 - 152 p-ISSN : 2087-0868 e-ISSN : 2598-9707 Gambar 2. Arsitektur LSTM menggunakan forget gate . Berdasarkan koneksi yang ditunjukkan pada Gambar 2, sel LSTM dapat dinyatakan secara matematis sebagai berikut: yceyc = yua. cOyceEa Eayc Oe 1 ycOyceEa ycuyc ycayce ycnyc = yua. cOycnEa Eayc Oe 1 ycOycnycu ycuyc ycaycn ycaEyc = ycycaycuEa. cOycaEEa Eayc Oe 1 ycOycaEycu ycuyc ycaycaE . ycayc = yceyc . ycayc Oe 1 ycnyc . ycaEyc ycuyc = yua. cOycuEa Eayc Oe 1 ycOycuycu ycuyc ycaycu Eayc = ycuyc . cayc ) Di mana ycaEyc menunjukkan status sel LSTM. ycOycn , ycOycaE , dan ycOycu adalah bobot, dan operator 'A' menunjukkan perkalian titik dua vektor. Saat memperbarui status sel, input gate dapat memutuskan informasi baru apa yang dapat disimpan dalam status sel, dan gerbang keluaran memutuskan informasi apa yang dapat dikeluarkan berdasarkan status sel. Training dan Testing Proses training model dalam penelitiana ini dapat dilihat pada Gambar 2. Data input yang digunakan adalah data yang berisikan catatan terkait cuaca seperti data temperatur, kelembaban, penyinaran matahari, dan kecepatan angin. Kemudian data dibagi menjadi input (X) dan output (Y) set. Data yang diinputkan akan diproses ke dalam model LSTM. Model tersebut akan menghasilkan data output. Lalu, data output, kemudian di-compare dengan data target yang telah ditentukan. Jika ada terjadinya ketidaksesuaian dengan data maka target akan dilakukan perubahan bobot pada masing-masing neuron yang ada agar output yang dihasilkan sesuai dengan target yang dituju. Ketika data output tidak sesuai dengan data target maka muncul nilai kesalahan, nilai kesalahan ini dihitung meggunakan Mean Square Error. Hasil kesalahan ini digunakan untuk memperbarui nilai bobot yang ada. Diperlukan sebuah algoritma optimasi untuk mengubah dan memperbaiki bobot yang ada. Algoritma optimasi yang digunakan adalah Adam Optimizer. Proses ini berlangsung sebanyak iterasi yang diinginkan. Gambar 3. Skema training model WEATHER FORECAST FROM TIME SERIES DATA USING LSTM ALGORITHM (Yoga Estu Nugrah. p-ISSN : 2087-0868 e-ISSN : 2598-9707 Dalam proses training, data yang digunakan dipartisi menjadi dua macam, yaitu data training dan data validation, 90% data digunakan untuk training dan 10% data digunakan untuk validation. Pembagian data ini bertujuan untuk memastikan model yang telah dilatih mendapatkan performa prediksi yang optimal. Kemudian proses testing dilakukan pengujian model untuk memprediksi data temperatur, kelembaban, penyinaran matahari, dan kecepatan angin pada periode wajtu yang sama namun dilakukan pengujian menggunakan variasi data input yang berbeda-beda. Model Evaluation Pada tahap ini, untuk menguji performa dari model yang diusulkan. Metode matriks evaluasi digunakan untuk mengukur besaran kesalahan rata-rata dari model adalah Root Mean Squared Error (RMSE) atau disebut juga dengan aturan penskoran kuadrat. RMSE mewakili deviasi standar sampel dari perbedaan antara nilai yang diprediksi dan nilai yang diamati . RMSE adalah ukuran akurasi, untuk membandingkan kesalahan peramalan model yang berbeda untuk kumpulan data tertentu dan bukan antar kumpulan data, karena bergantung pada skala . Pengaruh setiap kesalahan pada RMSE sebanding dengan ukuran kesalahan kuadrat. sehingga kesalahan yang lebih besar memiliki efek besar yang tidak proporsional pada RMSE. Akibatnya. RMSE sensitif terhadap outlier . RMSE adalah ukuran akurasi yang paling umum digunakan . dan didefinisikan sebagai berikut: ycIycAycIya = Oo OcycA ycn=1. yceycn didefinisikan sebagai error. Dimana N adalah jumlah sampel yang diteliti HASIL DAN PEMBAHASAN Langkah awal yang dilakukan untuk menganalisis data sebelum dicocokan ke dalam model adalah menganalisa data. Analisis statistik deskriptif dilakukan terlebih dahulu sebelum melakukan pemodelan menggunakan model LSTM. Hal ini bertujuan untuk memiliki pengetahuan awal tentang variabel yang Hasil analisis statistik deskriptif dari data yang data klimatologi terkait adalah data temperatur, kelembaban, penyinaran matahari, dan kecepatan angin dapat dilihat pada Table 2. Selain itu visualisasi data yang digunakan dapat dilihat pada Gambar 4. Table 2. Hasil analisis statistik data Statistics Mean Standard Deviation Minimum Maximum Temperature (AC) Humidity (%) Sunshine (Hour. Wind Speed Max. Hasil analisis deskriptif menunjukkan data cuaca di Kota Serang rata-rata di 27. 4 AC dengan suhu minimum di 24. 6 AC dan suhu maksimum di 29. 9 AC. Kelembaban rata-rata di 80. 3%, dengan kelembaban minimum 68% dan maksimum di 95%. Lama penyinaran matahari rata-rata adalah 4. 7 jam, dengan penyinaran minimum di 1 jam dan penyinaran maksimum 11. 5 jam. Kecepatan angin rata-rata di 3 m/s, dengan kecepatan angin minimum 1 m/s dan kecepatan angin maksimum di 10 m/s JURNAL ILMIAH TEKNOLOGI INFORMASI DAN KOMUNIKASI (JTIK) VOL 14. No. Maret 2023, 144 - 152 p-ISSN : 2087-0868 e-ISSN : 2598-9707 Gambar 4. Visualization of temperature, humidity, sunshine, and wind speed data Modelling neural networks Pada tahap ini model didefinisikan terlebih dahulu, penyesuaian model didasarkan pada data yang digunakan yaitu univariate time series. Model yang digunakan adalah Sequential, dengan optimizer Adam, activation function yang digunakan adalah ReLu. Secara detail summary model yang digunakan dapat dilihat pada Gambar 5. Gambar 5. Model summary Prediction and Model Evaluation Model yang sudah didefinisikan kemudian dilakukan prediksi. Model LSTM digunakan untuk memprediksi data cuaca harian dari parameter klimatologi. Plot visualisasi data aktual dan prediksi serta data forecasting untuk 10 hari ke depan dengan model LSTM dapat dilihat pada Gambar 6. WEATHER FORECAST FROM TIME SERIES DATA USING LSTM ALGORITHM (Yoga Estu Nugrah. p-ISSN : 2087-0868 e-ISSN : 2598-9707 Gambar 6. Forecasting results Hasil prediksi dapat dilihat pada Gambar 6 garis warna orange menandakan actual data, garis biru adalah data predicted dari data training dan testing, pola pada data biru merepresentasikan pola forecasted dari data sebelumnya yang menandakan kesamaan pola pada data predicted. Pada Gambar 6 menunjukkan tren yang meningkat namun tidak signifikan pada data suhu. Pada data kelembaban hasil prediksi menunjukkan tren peningkatan sebesar 74% - 78%. Hasil prediksi data penyinaran matahari mengalami tren peningkatan selama 2 jam. Pada data kecepatan angin hasil prediksi menunjukkan fluktuasi di sekitar ratarata. Secara detail data hasil forecasting 10 hari ke depan dapat dilihat pada Table 3. Table 3. Forecasting results Date 2022-11-01 2022-11-02 2022-11-03 2022-11-04 2022-11-05 2022-11-06 2022-11-07 2022-11-08 2022-11-09 2022-11-10 RMSE Temperature (AC) Humidity (%) Sunshine (Hou. Wind Speed Max. KESIMPULAN DAN SARAN Berdasarkan analisis yang telah dilakukan untuk memprediksi hasil cuaca di Kota Serang, dapat disimpulkan bahwa model LSTM memiliki kinerja yang berbeda antar parameternya. Hal tersebut dapat dilihat pada hasil hasil prediksi yang menunjukkan bahwa model lebih akurat ketika memprediksi deng urutan data suhu dengan RMSE 0. 37, kemudian RMSE kecepatan angin 0. RMSE sinar matahari yaitu 2. 79, dan RMSE kelembaban 5. Artinya model sangat baik mempelajari data suhu, berbanding terbalik dengan data Hal ini mengindikasikan model LSTM memiliki tingkat akurasi yang tinggi karena tingkat kesalahan prediksi yang cukup kecil. Hasil analisis menunjukkan bahwa prediksi suhu di Kota Serang mengalami tren peningkatan yang tidak signifikan sama halnya dengan hasil prediksi kelembaban dan hasil JURNAL ILMIAH TEKNOLOGI INFORMASI DAN KOMUNIKASI (JTIK) VOL 14. No. Maret 2023, 144 - 152 p-ISSN : 2087-0868 e-ISSN : 2598-9707 prediksi penyinaran matahari. Namun hasil prediksi kecepatan angin berfluktiasi di sekitar rata-rata. Kesimpulan dari penelitian ini adalah model LSTM cocok digunakan untuk memprediksi data suhu, namun kurang cocok untuk digunakan dalam memprediksi data kelembaban. DAFTAR PUSTAKA