Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol.
No.
April 2025, hlm.
Akreditasi KEMENRISTEKDIKTI.
No.
36/E/KPT/2019
DOI: 10.
25126/jtiik.
p-ISSN: 2355-7699
e-ISSN: 2528-6579
PREDIKSI SINGLE-STEP DAN MULTI-STEP DATA CUACA MENGGUNAKAN
MODEL LONG SHORT-TERM MEMORY DAN SARIMA
Humasak Tommy Argo Simanjuntak*1.
Amelia Lumbanraja2.
Gabriel Samosir3.
Regita4
1,2,3,4
Institut Teknologi Del.
Kabupaten Toba Email: humasak@gmail.
com, 2ameliajal08@gmail.
com, 3gafrizsam@gmail.
regitapakpahan123@gmail.
Penulis Korespondensi (Naskah masuk: 24 November 2024, diterima untuk diterbitkan: 13 April 2.
Abstrak Prediksi deret waktu pada parameter data cuaca adalah proses memprediksi nilai masa depan berdasarkan pola data historis cuaca.
Penelitian ini mengatasi kelemahan penelitian sebelumnya seperti data yang terbatas, jangka waktu prediksi, keterbatasan parameter yang digunakan dalam penelitian serta tidak menggunakan parameter eksternal yang tentunya dapat membantu proses prediksi model menjadi lebih akurat.
Penelitian ini menggunakan metode Long Short-Term Memory (LSTM) dan Seasonal AutoRegressive Integrated Moving Average (SARIMA) untuk memprediksi parameter cuaca, seperti tekanan udara, suhu, dan kelembaban relatif, dengan pendekatan single-step dan multi-step ahead.
Data bersumber dari BMKG Stasiun Meteorologi Pinangsori.
Sibolga, selama 8 tahun, dengan granularity per jam dan per hari.
Hasil eksperimen menunjukkan bahwa LSTM dan SARIMA, memiliki keunggulan dalam konteks tertentu.
Untuk pendekatan single-step, model SARIMA lebih baik 49% dari model LSTM untuk prediksi dengan granularity data per jam.
Namun, untuk granularity data per hari, performansi LSTM lebih baik 27% dari model SARIMA.
Kemudian untuk pendekatan multi-step.
SARIMA memberikan performansi yang lebih baik 30% daripada model LSTM untuk data per jam (< =.
Sedangkan untuk granularity data harian, model LSTM lebih baik 30% pada step 30 hari dan lebih baik 27% pada step 60 hari.
Dan untuk data ekstrem.
LSTM lebih baik 47% daripada SARIMA.
Kata kunci: prediksi deret waktu, prediksi cuaca.
LSTM.
SARIMA.
PRECISION IN FORECASTING: SINGLE-STEP AND MULTI-STEP WEATHER
PREDICTIONS WITH LSTM AND SARIMA MODELS
Abstract Time series prediction of weather data parameters involves forecasting future values based on historical weather This study addresses the limitations of previous research, such as constrained datasets, short prediction periods, restricted parameters, and the neglect of external factors that could enhance model accuracy.
Utilizing Long Short-Term Memory (LSTM) networks and Seasonal AutoRegressive Integrated Moving Average (SARIMA) methods, the research focuses on predicting weather parameters like air pressure, temperature, and relative humidity using both single-step and multi-step approaches.
The data is sourced from the BMKG Pinangsori Meteorological Station in Sibolga, covering an 8-year period with both hourly and daily granularity.
The experimental findings reveal that LSTM and SARIMA each have their advantages depending on the context.
In the single-step approach, the SARIMA model outperforms the LSTM model by 49% for predictions based on hourly Conversely, for daily data granularity, the LSTM model surpasses SARIMA by 27%.
In the multi-step analysis.
SARIMA demonstrates a 30% improvement over LSTM for hourly predictions .
p to 24 hour.
However, for daily granularity, the LSTM model excels, showing a 30% advantage at the 30-day prediction step and a 27% advantage at the 60-day step.
Additionally.
LSTM significantly outperforms SARIMA by 47% when dealing with extreme data.
Keywords: time series prediction, weather prediction.
LSTM.
SARIMA PENDAHULUAN .
uruf besar, 10pt, teba.
(Suleman & Shridevi, 2.
Informasi mengenai parameter cuaca memainkan peran penting dalam kehidupan manusia terutama untuk keperluan pengambilan keputusan (Torres, et al.
, 2.
Data Kebutuhan masyarakat terhadap informasi mengenai parameter cuaca seperti tekanan, suhu, dan kelembapan semakin hari semakin meningkat 400 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
April 2025, hlm.
cuaca memiliki dampak yang signifikan dalam berbagai bidang, termasuk pertanian, transportasi, penanggulangan bencana, dan analisis pola iklim (Chandra, et al.
, 2.
Parameter data cuaca adalah jenis data deret waktu .
ime serie.
yang mewakili kumpulan data berurutan yang diperoleh selama interval waktu tertentu, menggambarkan bagaimana data berubah seiring waktu, seperti deret suhu, tekanan, dan Prediksi deret waktu .
ime series forecastin.
merupakan komponen krusial dalam analisis data, terutama dalam konteks meteorologi.
Memprediksi parameter data cuaca melibatkan analisis data historis untuk membuat prediksi kondisi di masa depan, yang membantu dalam pengambilan Kemampuan untuk memprediksi parameter cuaca seperti suhu, tekanan udara, dan kelembapan relatif dengan akurasi tinggi sangat penting bagi berbagai sektor.
Pada sektor pertanian, prakiraan iklim yang akurat 3Ae6 bulan sebelumnya berpotensi memungkinkan petani dan stakeholder lain di bidang pertanian membuat keputusan yang dapat mengurangi dampak yang tidak diinginkan atau memanfaatkan iklim sehingga meningkatkan produktivitas dan mata pencarian petani serta potensi keuntungan lebih besar dan ketahanan pangan global (Guido, et al.
, 2.
(Fathi, et al.
, 2.
(Pujahari, et , 2.
Pada sektor lain seperti kesehatan masyarakat .
ublic healt.
, prediksi cuaca yang memperkirakan wabah penyakit terkait, seperti malaria, demam berdarah, penyakit pernapasan untuk menyiapkan peringatan dini dan respons perawatan kesehatan (Nguyen, et al.
, 2.
Dalam beberapa tahun terakhir, metode prediksi berbasis data deret waktu telah berkembang pesat, dengan fokus pada peningkatan akurasi dan Model statistik tradisional seperti autoregressive integrated moving average atau ARIMA (Geetha & Nasira, 2.
(Murat, et al.
, seasonal autoregressive integrated moving average atau SARIMA (Chen, et al.
, 2.
(Ray, et , 2.
(Parasyris, et al.
, 2.
, telah lama digunakan untuk prediksi deret waktu dan terbukti efektif dalam menangani data dengan pola musiman.
Namun, dengan meningkatnya kompleksitas dan volume data cuaca, metode berbasis pembelajaran mesin dan deep learning, khususnya recurrent neural networks (Hewamalage, et al.
, 2.
, long short-term memory (Han, et al.
, 2.
(Chen, et al.
, 2.
(Teixeira, et al.
, 2.
, telah mendapatkan perhatian lebih karena kemampuannya dalam menangani data non-linier dan menangkap dependensi data jangka Kemudian, model SFA-LSTM juga diperkenalkan untuk melakukan prakiraan cuaca jangka pendek dengan memodelkan hubungan spasial dan temporal yang kompleks untuk meningkatkan akurasi prediksi yang secara efektif menangkap ketergantungan spasial dalam data meteorologi (Suleman & Shridevi, 2.
Pada beberapa penelitian sebelumnya, terdapat beberapa kelemahan seperti keterbatasan parameter yang digunakan dalam penelitian, data yang terbatas, dan jangka waktu prediksi yang mencakup hanya 30 hari, serta tidak menggunakan parameter eksternal yang tentunya dapat membantu proses model menjadi lebih baik, dikarenakan pola yang diperoleh akan lebih beragam (Suradhaniwar, et al.
, 2.
Parameter eksternal yang dimaksud adalah turunan dari parameter tanggal atau representasi periodik dari waktu seperti, penggunaan hari .
ay sin, day co.
, bulan .
onth sin, month co.
dan juga parameter lain yang memiliki hubungan terhadap parameter Pendekatan konvensional sering kali menggunakan format waktu dalam bentuk kategori atau numerik, misalnya: hari dalam sebulan .
atau bulan dalam setahun .
tanpa mengubahnya menjadi representasi sirkular.
Dengan tidak memasukkan parameter eksternal dalam model, maka terdapat ketergantungan hanya pada nilai data parameter sebelumnya.
Hal ini dapat menyebabkan model kesulitan dalam menangkap sifat periodik secara alami, pola musiman tidak terekspoitasi secara optimal, potensi overfitting pada model machine learning, dan sulit diterapkan pada model yang memerlukan data numerik berkelanjutan.
Untuk mengatasi gap tersebut, penggunaan transformasi sinusoidal terhadap waktu dapat meningkatkan kinerja model melalui beberapa cara seperti memperkenalkan representasi sirkular yang konsisten .
erepresentasikan waktu sebagai koordinat dalam lingkara.
, meningkatkan kemampuan model dalam mendeteksi pola musiman .
odel dapat lebih mudah mengidentifikasi pola berulang dalam dat.
, mengurangi ketidakseimbangan data numerik dan kategorikal, menghindari overfitting .
elajar mengenali pola dalam representasi sinusoidal yang lebih generalisas.
, peningkatan kinerja model pada Algoritma non-linier .
odel seperti jaringan saraf tiruan (ANN) dapat lebih mudah menangkap hubungan non-linier dalam data berkat representasi sirkular ini.
Oleh karena itu, dengan mengadopsi representasi day sin, day cos, month sin, dan month cos, model dapat lebih memahami hubungan temporal yang kompleks, menghasilkan prediksi yang lebih akurat, dan meningkatkan generalisasi ke data baru.
Dalam prediksi deret waktu .
ime series forecastin.
, terdapat dua pendekatan utama: singlestep ahead dan multi-step ahead.
Pendekatan singlestep ahead memprediksi nilai pada satu langkah waktu berikutnya berdasarkan data historis hingga saat ini (Koutroumbas & Belehaki, 2.
Model dilatih untuk menghasilkan prediksi satu langkah ke depan, dan proses ini diulang untuk setiap langkah waktu berikutnya.
Metode ini sering digunakan karena kesederhanaannya dan kemampuannya untuk menghasilkan prediksi yang akurat dalam jangka Tommy Argo, dkk.
Prediksi Single-StepA 401 Gambar 1.
Metode Penelitian Sedangkan, pendekatan multi-step ahead memprediksi nilai untuk beberapa langkah waktu ke depan secara simultan melalui strategi recursive, direct, maupun multiple output (Cheng, et al.
, 2.
(Bahrpeyma, 2.
(Zhang, et al.
, 2.
Pemilihan antara pendekatan single-step dan multi-step bergantung pada kebutuhan spesifik, kompleksitas data, dan tujuan prediksi.
Berdasarkan penjelasan di atas, penelitian ini melakukan prediksi parameter data cuaca yaitu:
tekanan, suhu, dan kelembaban dengan menggunakan pendekatan single-step dan multi-step pada algoritma LSTM dan SARIMA.
Penelitian ini membandingkan performa model LSTM dan SARIMA dalam melakukan prediksi parameter cuaca menggunakan data yang yang diperoleh dari Badan Meteorologi dan Klimatologi Sibolga.
Oleh karena itu, beberapa kontribusi yang dihasilkan melalui penelitian ini Penggunaan algoritma LSTM dan SARIMA untuk menemukan model prediksi yang paling efektif untuk variabel suhu, tekanan, dan kelembaban, dalam memahami pola dan tren yang paling krusial untuk meramalkan perubahan iklim dan cuaca.
Penelitian ini memberikan wawasan dan panduan yang lebih baik tentang efektivitas metode single-step ahead dan multi-step ahead dalam analisis data time series.
Penelitian ini berpotensi untuk memberikan kontribusi penting tidak hanya dalam bidang ilmu komputer dan analisis data, tetapi juga dalam berbagai bidang lainnya yang terpengaruh oleh perubahan iklim dan cuaca, seperti pertanian dan penerbangan.
Dengan memahami dan meramalkan perubahan dalam variabel cuaca, para peneliti dan praktisi dalam bidang ini dapat membuat keputusan yang lebih tepat dan efisien.
Oleh karena itu, penelitian ini diharapkan dapat berkontribusi pada literatur peramalan cuaca, khususnya dalam memahami efektivitas model SARIMA dan LSTM untuk peramalan dengan granularitas per jam maupun per hari serta memberikan panduan bagi praktisi dalam memilih metode yang sesuai berdasarkan kebutuhan spesifik dan karakteristik data yang tersedia.
METODE PENELITIAN
Dalam penelitian ini metodologi yang dilakukan terdiri atas 3 bagian besar, yaitu Persiapan Data (Data Preparatio.
Pembangunan Model (Modellin.
, dan Evaluasi (Model Evaluatio.
Selain itu, prediksi dilakukan dengan cara single-step dan multi-step pada model LSTM dan SARIMA.
Detail rancangan penelitian yang dilakukan dapat dilihat pada Gambar Dataset Penelitian ini menggunakan dataset yang diperoleh dari Badan Meteorologi.
Klimatologi, dan Geofisika (BMKG).
Stasiun Meteorologi Klas i Pinangsori.
Sibolga, mulai dari data Januari 2015 sampai dengan November 2021.
Granularity dataset yang digunakan adalah per jam dan untuk data granularity per hari diperoleh melalui nilai rataAerata harian yang diperoleh dari dataset granularity per Pemilihan granularity ini bergantung pada kebutuhan analisis, pola musiman, serta tujuan Granularity per jam digunakan untuk menangkap fluktuasi atau variabilitas data cuaca dalam rentang waktu yang lebih detail.
Selain itu, granularity per jam juga penting untuk aplikasi realtime dan pengambilan keputusan cepat, serta mampu memperbaiki akurasi model dalam jangka pendek.
Sementara itu, granularity per hari digunakan untuk melihat tren global dari data atau analisis perubahan 402 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
April 2025, hlm.
data cuaca jangka panjang.
Selain itu, penggunaan granularity per hari juga dapat mengurangi noise dalam data, serta mengurangi ukuran dataset sehingga beban komputasi lebih rendah.
Gambar 3.
Visualisasi dataset untuk parameter tekanan setelah normalisasi data Modelling (Pembangunan Mode.
Gambar 2.
Visualisasi dataset untuk parameter tekanan Dataset mencakup atribut seperti WMO ID.
Tahun (UTC).
Bulan (UTC).
Tanggal (UTC).
Jam (UTC).
Arah Angin.
Kecepatan Angin.
Tekanan.
Suhu, dan Kelembaban.
Penelitian ini hanya fokus menggunakan tiga parameter data cuaca, yaitu: suhu, tekanan, dan kelembaban.
Tekanan diukur dalam hPa .
Suhu diukur dalam Celsius, dan Kelembaban merujuk pada jumlah uap air dalam Gambar 2 menunjukkan visualisasi dataset untuk data tekanan.
Data Preparation Data preparation merupakan tahapan yang bertujuan untuk memastikan data siap untuk digunakan dalam analisis.
Pada tahapan ini, data parameter cuaca dibersihkan, ditransformasi menjadi bentuk yang lebih mudah dipahami dan siap untuk digunakan ke dalam model.
Beberapa tahapan persiapan data yang dilakukan pada penelitian ini adalah pemeriksaan nilai yang hilang .
heck missing valu.
, mengubah format data, penghapusan atribut yang tidak relevan, dan normalisasi data.
Format data parameter cuaca menggunakan format datetime, yang memungkinkan representasi waktu yang lebih tepat dan analisis yang lebih akurat terkait data berbasis Sehingga beberapa atribut seperti atribut WMO ID.
Tahun (UTC).
Bulan (UTC).
Tanggal (UTC), dan Jam (UTC), digabungkan dengan membuat atribut baru yang merepresentasikan Pada tahapan ini, normalisasi data menggunakan teknik skala MinMax karena terdapat variasi nilai yang beragam, termasuk terdapatnya nilai yang sangat tinggi dan rendah.
Normalisasi data dilakukan dengan menggunakan Persamaan .
, sehingga nilai parameter cuaca berada pada rentang 0 Normalisasi data dengan MinMax scaling ini juga dilakukan untuk menangani outlier dan data tidak lengkap.
ycUyc = ycUOeycUycoycnycu ycUycoycaycu OeycUycoycnycu Gambar 3 berikut ini menunjukkan visualisasi parameter data tekanan (Gambar .
setelah dilakukan normalisasi data.
Pada tahap pembangunan model, langkah awal yang dilakukan adalah dengan membagi data.
Data dibagi menjadi dua bagian yaitu: pelatihan .
dan pengujian .
dengan proporsi yang berbeda, yaitu 60:40, 70:30, 80:20, dan 90:10.
Tiga fitur yang yang digunakan terdiri atas suhu, tekanan, dan kelembaban.
Model LSTM dan SARIMA baik dengan pendekatan single-step dan multi-step yang akan dibahas pada subbab berikut.
Long Short Term Memory (LSTM) Long Short-Term Memory (LSTM) adalah arsitektur jaringan saraf yang termasuk dalam keluarga Recurrent Neural Networks (RNN).
LSTM
dirancang khusus untuk menangani masalah longterm dependencies dalam data sekuensial, seperti teks, audio, atau time series, yang sering gagal diatasi oleh RNN tradisional akibat masalah vanishing gradient (Hochreiter & Schmidhuber, 1.
Arsitektur LSTM memiliki beberapa karakteristik utama, yaitu: Gates (Pintu Kontro.
Cell State .
ayc ), dan Hidden State (Eayc ).
Gates terdiri atas 3, yaitu:
Forget Gate .
engontrol informasi yang dilupaka.
Input Gate .
emutuskan informasi baru yang akan disimpa.
, dan Output Gate .
emutuskan bagian dari memori yang digunakan sebagai luara.
Forget Gate memungkinkan model untuk secara selektif melupakan informasi yang tidak relevan, termasuk outlier atau nilai ekstrem.
Sementara Cell State merupakan jalur memori utama yang memungkinkan informasi mengalir tanpa banyak modifikasi dari waktu ke waktu, serta menyimpan pola waktu yang lebih stabil.
Ketika terjadi lonjakan nilai ekstrem, cell mempertahankan tren jangka panjang dan mengabaikan perubahan mendadak yang tidak Kemudian.
Hidden State adalah luaran sementara pada setiap langkah waktu yang digunakan untuk keputusan prediktif atau diteruskan ke layer Ketika nilai ekstrem terjadi, gradien dalam model bisa menjadi tidak stabil, sehingga menyebabkan masalah exploding gradient.
Namun.
LSTM mampu menangani masalah exploding gradients dengan teknik yang disebut gradient clipping, dengan membatasi nilai maksimum gradien.
Tommy Argo, dkk.
Prediksi Single-StepA 403 Gambar 4 berikut ini menunjukkan arsitektur LSTM model yang diterapkan pada data suhu.
berikut ini menampilkan rancangan parameter yang digunakan untuk melakukan prediksi suhu, tekanan, dan kelembaban dengan cara single-step dan multistep.
Setiap parameter tersebut digunakan pada langkah 6 yang terdapat pada Gambar 1, baik untuk LSTM maupun SARIMA model.
Evaluasi Penelitian ini menggunakan dua metrik evaluasi, yaitu Root Mean Square Error (RMSE) dan Mean Absolute Error (MAE), untuk mengevaluasi kinerja LSTM dan SARIMA.
RMSE dihitung dengan mengambil akar kuadrat dari rata-rata selisih kuadrat antara nilai yang diharapkan dan nilai yang diperoleh dari model.
MAE adalah rata-rata kerugian kesalahan absolut dalam satu set prediksi.
Persamaan .
dan Persamaan .
menunjukkan kedua metrik kinerja yang digunakan.
Gambar 4.
Arsitektur Model LSTM pada data suhu Hyperparameter model LSTM meliputi lag, n_ahead, epochs, ukuran batch, learning rate, n_layer, dan optimizer.
Berdasarkan kajian pada beberapa referensi dan peneliti menggunakan metode random search dalam memilih kombinasi hyperparameter secara acak dan mencari konfigurasi terbaik, maka pada penelitian ini model LSTM menggunakan algoritma optimizer Adam untuk memperbarui bobot atau parameter model pada setiap iterasi selama proses pelatihan.
Model LSTM dilatih dengan menggunakan learning rate 0,001.
n_head = .
, 6, .
untuk data per jam, dan n_head = .
, .
untuk data per hari.
Sementara itu, ukuran batch .
atch siz.
yang digunakan adalah 512.
Seasonal Auto-Regressive Integrated Moving Average (SARIMA) SARIMA adalah perpanjangan dari model ARIMA (Auto-Regressive Integrated Moving Averag.
yang dirancang untuk menangani data time series musiman.
Model ini mengintegrasikan komponen musiman ke dalam struktur ARIMA, sehingga cocok untuk data yang memiliki pola berulang pada interval waktu tertentu (Ray, et al.
(Chen, et al.
, 2.
Parameter SARIMA terbagi atas 2 yaitu komponen ARIMA .
,d,.
, yang merupakan order dari komponen auto-regressive .
, order differencing .
, dan order moving average .
dan komponen musiman (P,D,Q,.
yang merupakan order dari komponen musiman auto-regressive (P), order differencing musiman untuk menjadikan data musiman stasioner (D), order komponen musiman moving average (Q), dan musim atau panjang periode musiman .
Pada penelitian ini, metode Grid Search (Auto-ARIMA) digunakan untuk mencoba berbagai kombinasi .
, d, .
dan (P.
Q, .
, lalu memilih kombinasi terbaik dengan menggunakan Bayesian Information Criterion (BIC) yang paling rendah.
Mempertimbangkan parameter yang dimiliki oleh model LSTM dan SARIMA, maka Tabel 1 ycIycAycIya = Oo Ocycuycn=1.
cycn Oe ycC) ycn ycAyaya = Ocycuycn=.
ycycn Oe ycC| ycn dimana ycycn dan yc Cycn adalah data yang diamati .
ata aktua.
dan data hasil prediksi.
n adalah panjang data yang diamati.
HASIL DAN PEMBAHASAN
Pada bab ini, hasil prediksi tekanan, suhu, dan kelembaban menggunakan metode LSTM dan SARIMA dalam pendekatan single-step dan multiste.
untuk granularitas harian dan per jam.
Pada pendekatan single-step untuk setiap parameter dengan granularitas per jam, algoritma SARIMA berhasil memprediksi masing-masing parameter dengan tingkat indeks kesalahan yang lebih rendah.
Performansi RMSE SARIMA dalam granularity per jam baik 49% lebih baik dari LSTM.
Arsitektur LSTM memberikan prediksi yang cukup akurat, meskipun dengan tingkat kesalahan sedikit lebih tinggi dibandingkan dengan SARIMA.
Namun, ini berbeda dalam pendekatan satu langkah .
ingle ste.
untuk setiap parameter dengan granularitas per hari, dimana algoritma LSTM lebih unggul dibandingkan SARIMA dengan tingkat indeks kesalahan yang lebih rendah.
Performansi RMSE LSTM 27% lebih baik dari SARIMA.
Pada pendekatan multi-step dengan interval 6 jam dan 12 jam.
SARIMA juga menunjukkan performa model yang lebih baik, ditandai dengan nilai indeks kesalahan yang lebih rendah dibandingkan dengan LSTM, dengan performansi RMSE SARIMA dalam granularity per jam adalah 28% lebih baik dari LSTM, dikarenakan SARIMA mampu mendeteksi pola musiman dengan baik menggunakan variabel S (Seasona.
yang memiliki peran penting dalam mendeteksi pola musiman.
404 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
April 2025, hlm.
Tabel 1.
Hyperparameter LSTM dan SARIMA untuk prediksi parameter cuaca
HYPERPARAMETERS DETAILS
Hyper
LSTM
Hourly Daily Multi
Single Multi step
Single Hyper
SARIMA
n_ahead 6,12 30,60 n_ahead 6,12 30,60 Epochs p,d,q Batch Size
P,D,Q,S
Learning rate 1 0 1.
1 1 1.
1 0 1 24.
1 1 12.
1 0 1.
1 1 1.
1 0 1 24.
1 1 12.
1 0 1.
1 1 1.
1 0 1 24.
1 1 1 12.
1 0 1.
1, 2 0 1
1 0 1 24.
1 1 12.
Namun, berbeda pada multi-step granularitas per hari, di mana LSTM mengungguli SARIMA dalam memprediksi nilai-nilai untuk 30 hari dan 60 hari ke depan dengan performansi RMSE LSTM 22,5% lebih baik dari SARIMA.
Hal ini dikarenakan algoritma LSTM memiliki kemampuan untuk mengingat dan mempelajari pola jangka panjang dalam data waktu tertentu.
Hasil Training Pada subbab ini, visualisasi grafik pelatihan model Long Short-Term Memory (LSTM) pada data BMKG Sibolga disajikan, yang bertujuan untuk memberikan pemahaman bagaimana model LSTM belajar selama proses pelatihan dan memperlihatkan peningkatan kenaikan atau penurunan performa pada setiap epoch.
Visualisasi ini memberikan pemahaman visual yang jelas tentang bagaimana model LSTM mengalami pembelajaran untuk setiap epoch dan dapat menjadi landasan untuk menganalisis dan mengevaluasi kinerja model secara lebih rinci dalam penelitian ini.
Pada Gambar 5, jumlah epoch yang digunakan untuk granurality per jam adalah 100, dan untuk granurality per hari sebanyak 200.
Namun faktanya pada saat melakukan training, hasil menunjukkan bahwa training tidak sampai pada nilai epoch yang diinisialisasi.
Hal ini dikarenakan proses training menggunakan fungsi early stopping yang bertujuan untuk mencegah overfitting dan meningkatkan kemampuan generalisasi model, sehingga proses training akan terhenti otomatis jika model sudah berada pada titik terbaik.
Gambar 5 menunjukkan nilai hasil pelatihan dan validasi RMSE dan MAE semakin menurun seiring dengan peningkatan jumlah epoch.
Khususnya hasil pelatihan pada data tekanan, suhu, dan kelembaban untuk granularity jam .
, c, .
, model semakin konvergen mendekati 0, yang berarti bahwa model secara bertahap mempelajari pola yang ada dalam data latih dan mampu memberikan prediksi pada data Pada data tekanan dan kelembaban, model cukup stabil, tetapi ada indikasi overfitting karena garis validasi tidak sejajar dengan garis pelatihan setelah titik tertentu.
Khusus untuk data suhu, pelatihan menunjukkan konvergensi model lebih Hourly Daily Single step Multi step Single step Multi step cepat, tetapi error akhir lebih tinggi.
Pelatihan model LSTM pada data suhu kurang optimal karena tidak memiliki cukup epoch untuk belajar dengan baik, sehingga menunjukkan hasil underfitting, dan perlu lebih banyak epoch agar model lebih akurat.
Kemudian, hasil pelatihan pada data tekanan, suhu, dan kelembaban untuk granularity hari .
, d, .
, menunjukkan pola penurunan error serupa dengan grafik per jam tetapi lebih bertahap.
Hal ini menunjukkan pelatihan model terhadap data dengan granularity per hari lebih optimal.
Hasil pelatihan dan validasi lebih sejajar, menunjukkan model lebih baik dalam generalisasi .
onvergensi lebih stabi.
dan tidak ada indikasi overfitting yang signifikan, menjadikannya lebih baik dibandingkan pelatihan untuk granularity per jam.
Hasil Testing untuk Pendekatan Single-Step Setelah melakukan pelatihan, model LSTM yang terbaik dilatih untuk melakukan prediksi.
Gambar 6 menampilkan hasil prediksi single-step untuk parameter tekanan, suhu dan kelembaban dengan granularitas per jam dan per hari pada model LSTM dan SARIMA.
Pada prediksi dengan granularitas per jam, model SARIMA menunjukkan performansi yang lebih baik dalam memprediksi semua parameter, baik suhu, tekanan dan kelembaban.
Pada parameter suhu, nilai RMSE model SARIMA sebesar 0,0937 dibanding LSTM dengan nilai RMSE sebesar 0,2099.
Kemudian untuk parameter tekanan, performansi SARIMA memperoleh RMSE sebesar 0,1030, sedangkan LSTM menghasilkan RMSE sebesar 0,2044.
Dan untuk parameter kelembaban.
SARIMA menghasilkan RMSE sebesar 0,1190, dan LSTM dengan RMSE sebesar 0,2095.
Secara keseluruhan, performansi model SARIMA lebih baik 49% dari model LSTM untuk single-step dan granularitas data per jam.
SARIMA dengan nilai parameter p=1, d=0, q=1, dan s=24 memberikan hasil yang paling optimal dibandingkan dengan parameter lain.
Hal ini terjadi dikarenakan pada data suhu, tekanan dan kelembaban per jam, terdapat pola harian yang berulang setiap 24 jam.
Dengan menggunakan hyperparameter s=24, model SARIMA dapat mengidentifikasi dan memodelkan pola harian ini Tommy Argo, dkk.
Prediksi Single-StepA 405 dengan baik, sehingga memberikan hasil prediksi yang lebih akurat dan menghasilkan RMSE terkecil dibandingkan dengan variasi parameter SARIMA lainnya dan algoritma LSTM.
Gambar 5.
Hasil training data untuk Tekanan.
Suhu, dan Kelembaban untuk granularity Jam .
dan Harian .
Gambar 5a dan Gambar 5b menampilkan Tekanan.
Gambar 5c dan 5d menampilkan Suhu, dan Gambar 5e dan Gambar 5f menampilkan kelembaban.
Sementara untuk data dengan granularitas per hari.
LSTM menunjukkan performansi yang lebih baik 27% dibandingkan dengan model SARIMA untuk semua parameter cuaca.
Dataset per hari yang digunakan merupakan nilai rata-rata dari pengukuran suhu per jam selama 24 jam.
Pada data suhu.
LSTM memperoleh nilai RMSE sebesar 0,0455, sedangkan SARIMA sebesar 0,1477.
Kemudian, untuk data tekanan, nilai RMSE LSTM adalah 0,0368, sedangkan RMSE SARIMA adalah 0,1680.
Dan pada parameter kelembaban.
RMSE LSTM adalah 0,0437, sedangkan SARIMA adalah 0,1473.
Hal ini dikarenakan model LSTM memiliki kemampuan memungkinkan LSTM untuk mengenali dan mempelajari hubungan yang kompleks antara data yang tersebar dalam jangka waktu yang lebih luas.
Suhu, tekanan, dan kelembaban memiliki pola jangka panjang yang kompleks yang dapat lebih baik dipelajari oleh model LSTM daripada model SARIMA yang lebih terfokus pada komponen musiman dan fluktuasi jangka pendek.
406 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
April 2025, hlm.
Gambar 6.
Hasil Prediksi Suhu .
Tekanan .
, dan Kelembaban .
model LSTM dan SARIMA pada periode Jam dan Hari untuk SingleStep Hasil Testing untuk Pendekatan Multi-Step Untuk mendapatkan hasil prediksi yang lebih akurat, model LSTM dan SARIMA juga diuji dengan cara prediksi multi-step, dimana prediksi dilakukan untuk beberapa langkah kedepan.
Artinya model memperkirakan nilai parameter cuaca pada beberapa waktu ke depan, misalnya pada waktu t 1, t 2, t 3, dan seterusnya berdasarkan nilai cuaca pada waktu Gambar 7 berikut menunjukkan hasil pengujian untuk prediksi parameter cuaca dengan pendekatan multi-step.
Sama dengan pengujian untuk single-step, model terbaik dari SARIMA adalah model dengan parameter p=1, d=0, q=1, dan s=24.
Pengujian SARIMA memberikan performansi yang lebih baik daripada model LSTM untuk data per jam (< =24 ja.
pada semua parameter cuaca, dengan peningkatan sebesar 30% untuk step 6 jam dan peningkatan sebesar 26% untuk step 12 jam.
Hal ini berbanding terbalik untuk step data harian, dimana model LSTM lebih baik dibandingkan SARIMA.
Pada step 30 hari, performansi model LSTM lebih baik 18% dan demikian juga pada step 60 hari, performansi LSTM lebih baik sebesar 27% jika dibandingkan dengan model SARIMA.
Hal ini menunjukkan bahwa model LSTM merupakan model yang mampu mempelajari hubungan yang kompleks dan pola jangka panjang dalam data.
LSTM memiliki kemampuan untuk menangkap dependensi jarak jauh antar data.
Sedangkan, model SARIMA adalah model statistik yang biasanya digunakan untuk memprediksi deret waktu yang memiliki komponen musiman.
Model SARIMA mempertimbangkan pola musiman dan fluktuasi jangka pendek dalam data.
Secara detail, perbandingan hasil pengujian antara model LSTM dan SARIMA ditunjukkan lebih jelas pada Gambar 8 berikut ini.
Tommy Argo, dkk.
Prediksi Single-StepA 407 Gambar 7.
Hasil Prediksi Suhu .
Tekanan .
, dan Kelembaban .
model LSTM dan SARIMA pada periode Jam dan Hari untuk Multi-Step Gambar 8.
Perbandingan hasil prediksi LSTM dan SARIMA untuk data suhu .
, tekanan .
, dan kelembaban .
untuk granularity jam dan Pada Gambar 8 ditunjukkan bahwa garis biru untuk nilai evaluasi RMSE pada LSTM dan garis biru terputus nilai evaluasi MAE pada LSTM, garis merah untuk nilai evaluasi RMSE pada SARIMA, dan untuk garis merah terputus untuk nilai evaluasi MAE pada SARIMA.
Secara keseluruhan, disimpulkan bahwa pada granularitas per jam nilai RMSE dan MAE pada model SARIMA lebih rendah yang ditunjukkan oleh garis berwarna merah dibandingkan dengan model LSTM yang memiliki nilai RMSE dan MAE lebih tinggi yang ditunjukkan oleh garis berwarna biru.
Performansi RMSE SARIMA sebesar 0,0919 untuk 6 jam kedepan, dibanding RMSE LSTM sebesar 0,3519.
Demikian juga untuk data yang lain, dapat dilihat pada Gambar 8.
Prediksi Parameter Cuaca untuk data Data ekstrem mengacu pada nilai-nilai data yang secara signifikan berbeda dari sebagian besar data dalam sebuah deret waktu.
Data ini biasanya terletak jauh dari rentang normal atau pola yang biasa ditemukan dalam dataset, dan dapat mempengaruhi hasil analisis atau prediksi jika tidak ditangani dengan Ketika prediksi dilakukan pada data ekstrem dengan ukuran data test yang sama dan rentang waktu yang serupa, model LSTM dan SARIMA memberikan hasil yang berbeda.
Hal ini disebabkan oleh kebergantungan SARIMA pada data musiman yang menunjukkan pola yang jelas pada interval yang Selain itu.
SARIMA membutuhkan data yang lebih stasioner untuk mencapai hasil yang optimal.
408 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
April 2025, hlm.
Sebaliknya.
LSTM mampu menangani nilai-nilai ekstrem dengan efektif, seperti yang ditunjukkan hyperparameter seperti nilai epoch dan jumlah layer Parameter-parameter ini secara tidak langsung berkontribusi pada kemampuan model LSTM untuk memprediksi pola-pola ekstrem dengan lebih baik.
Gambar 6 Hasil Prediksi LSTM dan SARIMA untuk Tekanan pada kasus data ekstrem Gambar 7 Hasil Prediksi LSTM dan SARIMA untuk Kelembaban pada kasus data ekstrem Perbandingan antara LSTM dan SARIMA dalam menangani nilai-nilai ekstrem, ditunjukkan pada Gambar 6 dan Gambar 7.
Pada kasus data ekstrem, model LSTM menghasilkan prediksi yang lebih baik pada parameter tekanan dan kelembaban.
Pada parameter tekanan, nilai prediksi LSTM 64,17% lebih baik dari SARIMA.
Kemudian, pada parameter kelembaban nilai prediksi LSTM 30,65% lebih baik dari SARIMA.
Pada hasil eksperimen menggunakan data per hari.
LSTM mampu menggunguli SARIMA dalam Data per hari diturunkan dari data ratarata per hari untuk granuality per jam.
Hal ini juga membuat dataset memiliki nilai ekstrem dan outlier yang banyak, sehingga pola sulit ditemukan karena variasi dari nilai rata-rata yang di hasilkan perharinya.
Ini yang menjadi salah satu keunggulan dari hyperparameter LSTM dibanding dengan SARIMA.
Hyperparameter LSTM yang berdampak pada nilai ekstrem adalah jumlah Epoch dan lapisan neuron, yang membuat LSTM berulang kali mencoba memahami pola data yang ada.
Lapisan Neuron pada LSTM adalah representatif terhadap seberapa kompleks model mempelajari pola dalam data.
Dan Epoch menunjukkan seberapa sering model dilatih.
Sedangkan hyperparameter SARIMA, dimana nilai p pada SARIMA bergantung pada seberapa banyak ketergantungan pola pada data masa lalu, dan variable d mengacu pada order differencing yang menunjukkan jumlah kali differencing, untuk membuat data menjadi stasioner, dan variabel q menunjukkan seberapa banyak residu dari hasil prediksi dan aktual yang digunakan dalam KESIMPULAN Penelitian ini melakukan analisis perbandingan antara prediksi dengan pendekatan single-step dan multi-step menggunakan model deep learning LSTM dan SARIMA.
Hasil analisis menunjukkan bahwa dalam menangani nilai-nilai ekstrem dan pencilan.
LSTM memiliki keunggulan yang signifikan SARIMA, dipengaruhi oleh jumlah epoch dan lapisan neuron dalam LSTM.
Jumlah epoch yang optimal tergantung pada granularitas data, karena menentukan seberapa baik model belajar pola dalam dataset.
Lebih banyak epoch diperlukan karena data per jam memiliki lebih banyak variasi dan fluktuasi jangka pendek.
Jika jumlah epoch terlalu rendah, model mungkin gagal mengenali pola jangka panjang dalam data.
Namun, terlalu banyak epoch dapat menyebabkan overfitting, di mana model belajar terlalu detail pada data pelatihan dan tidak dapat digeneralisasi dengan baik ke data baru.
Kemudian.
Neuron dalam hidden layer menentukan kapasitas model dalam mempelajari fitur kompleks dari data.
Pemilihan jumlah neuron yang optimal bergantung pada granularitas data karena mempengaruhi kompleksitas pola yang harus dipelajari oleh LSTM.
Namun, dalam konteks granularitas per jam.
SARIMA dengan parameter pdq dan pdqs 1,0,1,1,0,1,24 mampu memberikan prediksi yang lebih baik, seperti yang terlihat dari nilai RMSE dan MAE terendah.
Di sisi lain, untuk prediksi pada granularitas per hari.
LSTM menunjukkan hasil yang lebih baik.
Berdasarkan SARIMA menunjukkan konsistensi yang lebih baik dalam skor RMSE dan MAE, baik pada basis per jam maupun per Namun.
SARIMA memiliki keterbatasan dalam menangani data yang mengandung banyak pencilan .
dan pola non-linier, yang disebabkan oleh ketergantungannya yang kuat pada faktor musiman.
Sebaliknya.
LSTM memiliki kemampuan untuk memahami pola non-linier dan menghasilkan prediksi yang lebih baik dalam kondisi tersebut.
Secara umum, penelitian ini masih memiliki keterbatasn dikarenakan model yang digunakan sangat tergantung pada data historis dan kualitas data.
Semakin banyak data historis, maka semakin baik model melakukan prediksi.
Kedua model hanya memprediksi berdasarkan pola historis dan tidak dapat menangani perubahan mendadak akibat faktor eksternal yang tidak tersedia dalam data.
Misalnya, prediksi suhu menggunakan LSTM atau SARIMA tidak akan memperhitungkan bencana alam Tommy Argo, dkk.
Prediksi Single-StepA 409 mendadak atau perubahan kebijakan lingkungan.
Kemudiaan, model time series sangat bergantung pada kualitas data yang digunakan.
Data yang hilang .
issing value.
, outlier, atau noise dapat menyebabkan hasil prediksi yang tidak akurat.
Jika data tidak memiliki pola musiman yang kuat, model SARIMA mungkin tidak bekerja dengan baik.
Oleh karena itu, pemilihan algoritma harus disesuaikan dengan spesifikasi dan kondisi data yang Penelitian lebih lanjut dapat dilakukan untuk mengeksplorasi modifikasi dan optimisasi kedua metode ini dalam berbagai situasi dan kondisi data yang berbeda.
Peneliti juga merekomendasikan melakukan analisis lebih mendalam tentang pengaruh ukuran dataset terhadap kinerja kedua model.
Evaluasi dengan menggunakan dataset yang lebih besar atau lebih kecil dapat memberikan wawasan yang lebih jelas tentang kecenderungan dan batasan kinerja dari masing-masing model.
DAFTAR PUSTAKA