Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Klasifikasi Status Erupsi Gunung Berapi dengan menggunakan Analisa Template Matching dan Algoritma K-Nearest Neighbors Fridy Mandita1.
Lintang Ragadanu Arizona2 Program Studi Teknik Informatika.
Fakultas Teknik.
Universitas 17 Agustus 1945 Surabaya Jln.
Semolawaru No.
Surabaya fridymandita@untag-sby.
id, 2lintangarizona1212@gmail.
Abstrak Salah satu jenis bencana alam yang terjadi di Indonesia adalah erupsi gunung vulkanik.
Hal ini disebabkan Indonesia mempunyai ratusan gunung yang aktif dengan tipe erupsi dan status yang berbeda-beda untuk setiap gunung berapinya, dimana Indoesia merupakan negara yang dianggap sebagai pulau dengan jumlah gunung berapi aktif paling banyak di dunia.
Meskipun seismograf digunakan untuk mencatat aktivitas gunung berapi, alat tersebut masih belum dapat mengklasifikasikan jenis tipe gempa dan status erupsi gunung berapi.
Untuk mengatasi hal ini, peneliti mengusulkan penggunaan Machine Learning dalam mengklasifikasikan status erupsi gunung berapi.
Machine Learning adalah salah satu cabang Artificial Intelligence (AI) yang memudahkan kinerja manusia.
Terdapat tujuh cabang AI, termasuk machine learning Dalam penelitian ini, digunakan metode Machine Learning berupa Template Matching dan K-Nearest Neighbor (KNN) untuk mengklasifikasikan tipe dan status erupsi gunung berapi.
Hasil pengujian berupa akurasi matriks kebingungan, recall, presisi, dan score F1 dimana untuk menemukan K terbaik dalam model KNN dibagi menjadi K=1, 3, 5, 7, 11.
Hasil yang didapat K terbaik pada rasio data 90:10 yaitu K=1 dimana akurasi pada data besar .
sebesar 91% dan akurasi pada all data .
ata keseluruha.
sebesar 87%.
Hasil pengujian juga berupa bagaimana model KNN memprediksi data baru menggunakan KNN.
Kata kunciAiErupsi gunung berapi, klasifikasi citra seismograf, machine learning, template matching.
KNN Abstract One type of natural disaster that occurs in Indonesia is a volcanic eruption.
This is because Indonesia has hundreds of active volcanoes with different types of eruptions and status for each volcano.
Indonesia is a country that is considered to be the island with the largest number of active volcanoes in the world.
Even though seismographs are used to record volcanic activity, these tools can still not classify the type of earthquake and the status of volcanic eruptions.
To overcome this, researchers propose using Machine Learning to classify volcanic eruption status.
Machine Learning is a branch of Artificial Intelligence (AI) that facilitates human performance.
There are seven branches of AI, including machine learning.
In this research.
Machine Learning methods were used as Template Matching and K-Nearest Neighbor (KNN) to classify the type and status of volcanic eruptions.
The test results are in the form of confusion matrix accuracy, recall, precision, and F1 score where to find the best K in the KNN model is divided into K=1, 3, 5, 7, 11.
The results obtained are the best K at a data ratio of 90:10, namely K=1 where accuracy on big data .
is 91% and accuracy on all data .
otal dat.
is 87%.
The test results also include how the KNN model predicts new data using KNN.
Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585
KeywordsAiVolcanic eruptions, seismograph image classification, machine learning, template matching.
KNN
PENDAHULUAN
Erupsi gunung api merupakan bentuk bencana geologis yang sering terjadi di Indonesia, dimana magma keluar dari gunung menuju permukaan bumi melalui erupsi efusif atau eksplosif.
Erupsi efusif terjadi ketika lava keluar secara perlahan dan mengalir tanpa ledakan, sedangkan erupsi eksplosif terjadi ketika lava keluar melalui ledakan dan diikuti oleh gempa.
Indonesia adalah negara dengan jumlah gunung berapi aktif terbanyak di dunia, dan gunung-gunung tersebut termasuk dalam rangkaian gunung api aktif yang disebut sebagai Auring of fireAy (Pratama, 2.
Indonesia terletak di antara cincin api, sehingga terdapat banyak gunung berapi.
Banyaknya gunung berapi aktif di Indonesia membuat Indonesia sebagai negara dengan gunung berapi teraktif terbanyak di dunia (Adri et al.
, 2.
Gunung berapi biasanya meledak dalam periode pendek ada yang di setiap antara 1 - 6 tahun, sedangkan periode tengah tiap 6 Ae 8 tahun dan periode terpanjang sudah terjadi di beberapa gunung berapi yaitu 30 tahun (Rahayu et al.
, 2.
Pusat Vulkano dan Mitigas Bencana Geologi (PMVBG) di Indonesia sering memberikan masukan terkait kondisi gunung api.
PVMBG membuat rekomendasi tentang keadaan aktivitas gunung berapi berdasarkan data pemantauan aktivitas masingmasing gunung berapi.
Ada dua jenis pengamatan berdasarkan pengamatan visual dan faktor seismik.
Adapun terkait lembaga yang salah satu tugasnya mengawasi aktivitas gunung api di negara yaitu Badan Meteorologi.
Klimatologi, dan Geofisik (BMKG) (Firman et al.
, 2.
(Hafida, 2.
Machine Learning (ML) telah digunakan secara luas dalam banyak penelitian untuk mengklasifikasikan letusan gunung berapi, tetapi terdapat masalah dalam mengklasifikasikan letusan gunung berapi menggunakan ML karena peneliti tidak mengetahui algoritma mana yang terbaik untuk mendeteksi sinyal seismik.
Dalam upaya mengantisipasi situasi letusan gunung berapi vulkanik dan algoritma apapun memiliki akurasi yang tinggi dalam mengklasifikasikan sinyal seismik, pengujian dengan seismograf masih belum memberikan klasifikasi menurut jenis gempa dan jenis bahayanya, dan beberapa peneliti selalu menerapkan metode ini dengan menggunakan metode perhitungan manual atau ML tidak membantu mereka (Kom et al.
, 2.
Penelitian yang dilakukan oleh (Firman et al.
, 2.
dalam hal klasifikasi penentuan status erupsi berapi dengan algoritma Nayve Bayes dan KNN, mendapat akurasi 79,71% pada algoritma Nayve Bayes dan 63,68% pada algoritma KNN.
Penelitian ini menggunakan deviasi K-Fold Cross Validation dimana jarak akurasi data training status gunung api setiap eksperimen diungguli oleh algoritma Nayve Bayes.
Penelitian lain terkait eksperimen klasifikasi status gunung api juga pernah dilakukan oleh (Wijaya et al.
, 2.
Eksperimen ini menggunakan metode template matching dimana akurasi klasifikasi peneliti didapat tajuk akurasi sebesar 92.
33% hanya saja dalam penelitian ini Sebagian besar tahap perhitungan dilakukan dengan cara manual, dengan demikian banyak algoritma yang bisa digunakan dalam klasifikasi status erupsi gunung api ini.
Berdasarkan permasalahan yang telah dijabarkan dari penelitian sebelumnya, penelitian ini bertujuan untuk mengklasifikasikan sinyal seismik dengan menggunaan metode template matching dan KNN.
Peneliti menggunakan model fitting analysis dan Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 metode K-Nearest Neighbor (KNN) yang dipilih untuk klasifikasikan objek yang berbeda dan mendeteksi sinyal seismik.
KNN sendiri merupakan metode klasifikasi data berbasis kelas yang tujuannya untuk mengklasifikasikan fitur baru berdasarkan atribut dan bahan ajar (Suwirmayanti et al.
, 2.
Template matching adalah teknik pengenalan pola yang kuno dan berguna dalam klasifikasi sinyal seismik.
Algoritma ini bekerja dengan cara mengevaluasi model pola terhadap model citra dalam database.
Kelemahan algoritma ini terletak pada terbatasnya model yang digunakan sebagai model acuan dalam basis data, menurut ukuran, bentuk dan kedudukannya (Bahri & Maliki, 2.
Dalam penelitian ini peneliti merumuskan masalahnya yaitu proses klasifikasi dari sebuah sinyal seismik untuk mengetahui tingkat akurasinya.
METODE PENELITIAN
Tahapan Penelitian Adapun keseluruhan tahapan penelitian dapat dijabarkan pada gambar 1.
Gambar 1.
Tahapan Penelitian Terkait detail tahapan penelitian dijabarkan dalam subbab dalam artikel ini.
1 Dataset Gambar 2.
Diagram Dataset Gambar 2 dijelaskan bahwa dataset untuk saat ini yang digunakan dalam penelitian ini diambil dari citra seismograf dari Juli 2019 - Januari 2021 .
ataset bisa bertamba.
Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 dimana dataset yang digunakan dibagi atau diklasifikasi secara manual menjadi 8 kelas dimana masing-masing kelas berjumlah 2023 data mseed yaitu.
AP berjumlah 3 data.
DG berjumlah 278 data.
Low-Frequency berjumlah 42 data.
Multi Phase berjumlah 1101.
Rockfall berjumlah 319 data.
Tremor berjumlah 7 data.
VT-A berjumlah 24 data.
VT-B berjumlah 249 data.
Dataset yang digunakan tersedia secara online dari website https://w.
org/networks/?search=Merapi untuk gunung Merapi.
Penelitian akan dibagi menjadi dua eksperimen yaitu menggunakan data keseluruhan dan menggunakan data besar atau mayoritas .
g, multiple phase, rockfall, vt-.
Gambar 3 merupakan visualisasi data seismograf yang digunakan dalam penelitian ini dari Juli tahun 2019 sampai januari tahun 2021.
Gambar 3.
Plot dataset keseluruhan penelitian 2 Preprocessing Data Gambar 4.
Preprocessing Data Gambar 4 menampilkan beberapa tahap preprocessing data yang akan dijabarkan sebagai berikut:
Original Data Original data merupakan data yang belum melalui proses atau manipulasi apa pun.
Menurut Garno et al.
, original data dalam penelitian ini merupakan data mseed yang tidak bisa langsung digunakan dalam proses penelitian karena harus dilakukan pembacaan terlebih dahulu, kemudian dilakukan preprocessing agar data tersebut bisa terbaca dan dapat digunakan dalam proses selanjutnya.
Original data berbentuk binary file sehingga tidak bisa langsung dilakukan eksperimen terhadap data tersebut ke dalam google collab.
Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 .
Read dan plot data Agar original data dapat terbaca, dilakukan proses membaca atau mengimpor data dari sumber data .
oogle driv.
ke dalam collab peneliti untuk kemudian diproses dan dianalisis lebih lanjut.
Menurut Arrais et al.
, sumber data ini berbentuk mseed yaitu format standar untuk data seismik digital yang dikompresi secara efisien.
Format Mseed dikompresi menjadi ukuran yang lebih kecil dari format SEED yang lebih lama, dan memungkinkan transfer data yang lebih cepat dan efisien melalui jaringan seismik.
Setelah itu baru data mseed tersebut diplot berdasarkan masing-masing kelas dan diolah di google collab.
Deklarasi Variabel Tahap ini merupakan proses untuk menamai variabel sesuai dengan jenis dan tipenya yang nantinya bertujuan agar memudahkan dalam proses penelitian yang akan dilakukan.
Template Data Tahap selanjutnya yaitu melakukan pembuatan pola pada masing-masing kelas yang digunakan untuk mencari kemiripan atau pengenalan pola pada data match.
Detrend Data Selanjutnya yaitu proses untuk menghapus atau mengurangi tren atau kecenderungan yang ada pada suatu rangkaian data.
Menurut Rogers et al.
, detrend data dilakukan untuk menghilangkan atau mengurangi trend yang tidak relevan atau tidak berkontribusi terhadap informasi seismik yang ingin dicari.
Metode yang digunakan yaitu regresi linier (Linear regressio.
: Metode ini dilakukan dengan memperkirakan persamaan garis trend dari data dan mengurangi pengaruh trend tersebut dari data.
Setelah detrend data dilakukan, data yang dihasilkan menjadi lebih stabil dan dapat memberikan informasi yang lebih akurat pada analisis seismik.
Detrend data merupakan langkah awal yang penting dalam pengolahan data seismik dan diperlukan untuk memperoleh hasil analisis seismik yang lebih baik.
Template Matching Setelah proses detrend selesai dilakukan, maka rumus template matching dapat diterapkan dimana data yang sudah template sebelumnya dimatch sesuai dengan pola target sesuai dengan kecocokan serta kemiripan data.
Convert data to spektrogram Tahap selanjutnya merupakan proses untuk mengubah sinyal data dari domain waktu menjadi domain frekuensi dengan tujuan untuk memvisualisasikan informasi frekuensi dari sinyal tersebut.
Spektogram adalah gambar dua dimensi yang menunjukkan bagaimana intensitas sinyal bervariasi pada berbagai frekuensi dalam suatu rentang waktu .
Labeling data Tahap ini merupakan proses memberikan label atau kategori pada setiap data atau informasi yang ada dalam dataset.
Proses labelling dilakukan secara otomatis dengan mengubah jenis seismik menjadi angka.
Dimana jenis seismik yang akan digunakan dalam penelitian ini berjumlah 8 jenis atau tipe seismik.
Save to mat.
Setelah semua data telah diproses menjadi data bersih maka hasil data tersebut disimpan bentuk file MATLAB.
File matlab adalah format file yang digunakan oleh program matlab untuk menyimpan data numerik dalam bentuk matriks atau array.
Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 3 Klasifikasi Template Matching Gambar 5.
Klasifikasi Template Matching (Bahri et al.
, 2.
Gambar 5 menampilkan beberapa tahap klasifikasi template matching yang akan dijabarkan sebagai berikut:
Import Dataset Tahap pertama dalam klasifikasi menggunakan template matching adalah mengimport dataset berbentuk Mseed terlebih dahulu.
Preprocessing Tahap ini akan dilakukan pembuatan deklarasi variabel, template data, detrend data, dan labelling data.
Mode Template Matching Terakhir yaitu penerapan template matching yang digunakan untuk mencocokkan suatu sinyal dengan sebuah pola referensi atau template matching yang digunakan untuk membandingkan setiap bagian sinyal dengan template dan menghitung kesamaan atau perbedaan antara keduanya.
Kemudian, teknik ini akan menghitung korelasi antara template dan sinyal yang sedang dianalisis untuk menentukan sejauh mana pola referensi cocok dengan sinyal.
4 Klasifikasi KNN Gambar 6.
Klasifikasi KNN (Firman et al.
, 2.
Gambar 6 menampilkan beberapa tahapan Klasifikasi KNN yang akan dijabarkan sebagai berikut:
Load Data Tahap pertama dalam klasifikasi menggunakan KNN adalah load data yang sudah selesai dilakukan pada tahap preprocessing menggunakan template matching.
Dimana data yang akan digunakan yaitu data yang sudah tersimpan didalam file matlab yang telah diolah sebelumnya.
Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Undersampling Dikutip dari Magnolia et al.
, tahap selanjutnya yaitu teknik pengolahan data yang digunakan untuk mengurangi jumlah data pada kelas mayoritas atau yang lebih banyak dalam sebuah dataset, sehingga dapat menyamakan jumlah data antara kelas mayoritas dan minoritas atau yang lebih sedikit.
Undersampling digunakan karena dalam klasifikasi data, terdapat data yang tidak seimbang .
mbalanced dat.
Pada dataset yang tidak seimbang, kelas mayoritas cenderung memiliki lebih banyak data dibandingkan kelas minoritas.
Hal ini dapat mengakibatkan performa model klasifikasi menurun, karena model cenderung akan memperhatikan kelas mayoritas dan mengabaikan kelas minoritas.
Oleh karena itu, dengan menggunakan teknik undersampling, data pada kelas mayoritas dapat dikurangi hingga jumlah data pada kelas mayoritas dan minoritas menjadi seimbang, sehingga model klasifikasi dapat lebih fokus pada kelas minoritas.
Split data training dan data testing Tahap selanjutnya yaitu dilakukan untuk membagi data menjadi dua bagian yaitu data training dan data testing.
Data training digunakan untuk melatih model KNN, sedangkan data testing digunakan untuk mengevaluasi performa model yang telah dilatih.
Proporsi masing-masing yaitu data training sebesar 90% sedangkan data testing sebesar .
Find best K? Pada penelitian ini, nilai k merupakan parameter yang menentukan jumlah tetangga terdekat yang digunakan untuk membuat prediksi.
Nilai K yang akan digunakan dalam penelitian ini yaitu 1,3,5,7,dan 11.
Training Model Setelah proses mencari best k selanjutnya dilakukan melatih model knn menggunakan data yang telah diproses dan siap digunakan.
Pada tahap ini, model akan belajar dari data yang telah diberikan dan menghasilkan parameter atau bobot yang dapat digunakan untuk membuat prediksi serta optimasi pada data baru.
Training model adalah tahap kritis dalam penelitian ini karena keakuratan dan efektivitas model bergantung pada kualitas data, dan parameter yang dioptimalkan dengan baik.
Oleh karena itu, perlu melakukan evaluasi model secara terus-menerus dan memperbarui model saat diperlukan untuk memastikan model yang dihasilkan dapat menghasilkan prediksi yang akurat.
Test Model Pada tahap ini proses pengujian kinerja model KNN pada data yang belum pernah dilihat sebelumnya.
Tujuannya adalah untuk mengetahui sejauh mana model dapat menggeneralisasi dan melakukan prediksi yang akurat pada data baru yang belum pernah Proses test model dilakukan setelah model dilatih dengan data training untuk memprediksi tipe seismik yang baru yang ada pada label.
Evaluasi Akurasi Terakhir yaitu evaluasi akurasi merupakan proses mengukur seberapa baik model knn dapat memprediksi kelas atau label pada data yang belum dilihat sebelumnya .
ata Akurasi adalah salah satu metrik evaluasi yang umum digunakan untuk mengukur performa model, khususnya pada masalah klasifikasi.
Akurasi dihitung dengan membandingkan jumlah prediksi yang benar .
rue positive.
dengan jumlah total data yang diuji .
rue positives false positive.
Secara matematis, akurasi dapat dinyatakan sebagai: akurasi = .
rue positives true negative.
/ total data Nilai akurasi berkisar Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 antara 0 hingga 1, dengan nilai 1 menunjukkan bahwa model melakukan prediksi dengan sempurna dan nilai 0 menunjukkan bahwa model tidak dapat membedakan antara kelas yang berbeda sama sekali.
Namun, penggunaan akurasi sebagai satu-satunya matrik evaluasi memiliki kelemahan pada kasus-kasus di mana data tidak seimbang .
mbalanced dat.
Sebagai contoh, jika kelas minoritas memiliki jumlah data yang sedikit dibandingkan kelas mayoritas, akurasi yang tinggi dapat diperoleh hanya dengan memprediksi semua data sebagai kelas mayoritas.
Oleh karena itu, pada kasus seismik ini data yang digunakan imbalance maka peneliti akan membandingkan hasil akurasi data besar .
ata mayorita.
dengan data keseluruhan menggunakan K yang berbeda-beda, sehingga bisa diketahui performa model dalam melakukan klasifikasi seismik.
Gambar 7.
confusion matrix (Santra & Christy, 2.
True Positive (TP) Negative (TN) Positive (FP) Negative (FN) Hasil yang diperoleh jika kelas 1 bertemu dengan kelas 1 Hasil yang diperoleh jika kelas 0 bertemu dengan kelas 0 Hasil yang diperoleh jika kelas 0 bertemu dengan kelas 1 Hasil yang diperoleh jika kelas 0 bertemu dengan kelas 0 Jumlah data dari kelas 1 yang benar diklasifikasikan sebagai kelas 1 Jumlah data dari kelas 0 yang benar diklasifikasikan sebagai kelas 0 Jumlah data dari kelas 0 yang salah diklasifikasikan sebagai kelas 1 Jumlah data dari kelas 1 yang salah diklasifikasikan sebagai kelas 0 Rumus dari confusion matrix untuk menghitung accuracy, precision, recall, dan f1score seperti berikut:
Accuracy Rasio prediksi yang benar dengan keseluruhan data.
Adapun rumus untuk menghitung nilai akurasi adalah sebagai berikut:
ycNycE ycNycA Akurasi = ycNycE yaycA yaycE ycNycA ycu 100% .
Precision Rasio dari prediksi benar positif dengan keseluruhan data yang diprediksi sebagai Adapun rumus untuk menghitung nilai precision adalah sebagai berikut:
ycNycE Precision = ycNycE yaycE Recall Rasio dari prediksi benar positif dengan keseluruhan data yang benar positif.
Adapun rumus untuk menghitung nilai recall adalah sebagai berikut:
ycNycE Recall = ycNycE yaycA Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 F1-score Pembobotan dari perbandingan rata Ae rata sebuah precision dan recall.
Adapun rumus untuk menghitung nilai f1-score adalah sebagai berikut:
ycyceycaycaycoycoOycyycyceycaycnycycnycuycu
F1-score = 2 O
ycyceycaycaycoyco ycyycyceycaycnycycnycuycu
HASIL DAN PEMBAHASAN
Data Penelitian Dataset untuk saat ini yang digunakan dalam riset ini diambil dari citra seismograf .
ataset bisa bertamba.
Dimana dataset yang digunakan dibagi atau diklasifikasi secara manual menjadi 8 kelas yang mana tiap - tiap kelas sebanyak 2023 data mseed yaitu.
AP berjumlah 3 data.
DG berjumlah 278 data.
Low-Frequency berjumlah 42 data.
Multi Phase berjumlah 1101.
Rockfall berjumlah 319 data.
Tremor berjumlah 7 data.
VT-A berjumlah 24 data.
VT-B berjumlah 249 data.
Dataset yang digunakan tersedia secara online dari website yang tersedia dan dapat diakses kapanpun di https://w.
org/networks/?search=Merapi untuk gunung Merapi.
Penelitian akan dibagi menjadi dua eksperimen yaitu menggunakan data keseluruhan lalu menggunakan data besar atau mayoritas .
g, multiple phase, rockfall, vt-.
No.
Tabel 1.
Jumlah Data Seismic Events Kategori Semua Kelas Jumlah File
Low Frequency Multi Phase
Rockfall Tremor
VT-A
VT-B
Hasil Template Matching Gambar 8.
Hasil template matching Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Gambar 8 merupakan hasil visualisasi template matching dimana gambar pertama paling atas merupakan data time series yang akan dicocokkan pada data di bawahnya yang merupakan template dari DG dan Multi-Phase data tersebut di plot berdasarkan panjang amplitudo, selanjutnya dari hasil pencocokkan data time series tersebut akan muncul template matchng result dari hasil pencocokan data match dan data template.
Gambar bawah sendiri yang berwarna hijau merupakan hasil spectrogram dimana jika terdapat warna kuning atau merah pada data itu merupakan noise dan indikasi adanya gelombang gempa yang terjadi pada hasil data, yang dihitung setiap 10 detik per-data.
Tabel 2.
Hasil Pengujian Data besar (Mayorita.
Accuracy Precision Recall F1 Score
K=1
K=3
K=5
K=7
K = 11
Tabel 2 menampilkan hasil pengujian klasifikasi pada data mayoritas dalam lima perhitungan KNN dengan k=1, k=3, k=5, k=7, dan k=11, semakin besar nilai k maka performa model akan semakin menurun.
Pada kasus ini, nilai K=1 memberikan performa yang paling baik dengan accuracy sebesar 91%, precision sebesar 91%, recall sebesar 91%, dan f1-score sebesar 91%.
Namun, pada kasus kedua dan seterusnya akurasi model terlihat menurun, sehingga model menjadi kurang baik untuk mengklasifikasikan data Oleh karena itu, dapat disimpulkan bahwa nilai k yang optimal untuk model KNN pada data mayoritas adalah k=1.
Namun, hal ini dapat berbeda-beda tergantung pada dataset yang digunakan dan perlu dilakukan evaluasi untuk menentukan nilai k yang Tabel 3.
Hasil Pengujian All Data
Accuracy Precision Recall F1 Score
K=1
K=3
K=5
K=7
K = 11
Tabel 3 menampilkan hasil pengujian klasifikasi pada all data dalam lima perhitungan KNN dengan k=1, k=3, k=5, k=7, dan k=11, sama seperti pada pengujian data mayoritas semakin besar nilai k maka performa model akan semakin menurun.
Pada kasus ini, nilai K=1 memberikan performa yang paling baik dengan accuracy sebesar 87%, precision sebesar 88, recall sebesar 87%, dan f1-score sebesar 87%.
Namun, pada Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 kasus kedua dan seterusnya akurasi model terlihat menurun, sehingga model menjadi kurang baik untuk mengklasifikasikan data baru.
Oleh karena itu, dapat disimpulkan bahwa nilai k yang optimal untuk model KNN pada data all adalah K=1.
Namun, hal ini dapat berbeda-beda tergantung pada dataset yang digunakan dan perlu dilakukan evaluasi untuk menentukan nilai k yang optimal.
5 Fold
Test
K=1
K=3
K=5
K=7
K=11
Tabel 4.
Hasil Pengujian cross-validation data mayoritas Score test Score test Score test Score test Score test
Ratarata
5 Fold
Test
K=1
K=3
K=5
K=7
K=11
Tabel 5 Hasil Pengujian cross-validation keseluruhan data Score test Score test Score test Score test Score test Ratarata Tabel 4 dan 5 dapat dilihat bahwa akurasi performa model tiap lipatan dan tiap K mengalami penurunan ketika diterapkan cross validation pada data sebanyak 5 fold .
, meskipun begitu dapat disimpulkan dalam penelitian ini model KNN mampu dalam melakukan klasifikasi sinyal gempa baik menggunakan cross validation maupun tidak dengan akurasi rata-rata diatas 0.
75 yang menandakan model KNN mampu digunakan dalam klasifikasi pada dataset sinyal seismik.
Gambar 9.
Hasil perbandingan akurasi antar K Jurnal Ilmu Komputer dan Desain Komunikasi Visual Volume 8.
Nomor 2.
Desember 2023 ISSN (Ceta.
: 2541-4550 ISSN (Onlin.
: 2541-4585 Gambar 9 dapat disimpulkan bahwa baik pada data mayoritas maupun data all, model KNN mampu melakukan klasifikasi data seismik dengan baik meskipun ketika penambahan jumlah K, akurasi model dalam memprediksi data baru semakin menurun.
KESIMPULAN
Dari penelitian yang telah dilakukan dan juga pembahasan sebelumnya dihasilkan beberapa kesimpulan sebagai berikut:
Berdasarkan penelitian yang telah dilakukan, hasil menunjukkan bahwa template matching dan model KNN cocok digunakan dalam klasifikasi sinyal seismik karena memiliki akurasi tinggi dengan dataset yang digunakan berjumlah 2023 dengan tipe Mseed.
Dari percobaan terhadap 5 K pada model KNN didapat hasil akurasi pada data mayoritas K1=0.
K3=0.
K5=0.
K7=0.
K11=0.
81 sedangkan pada keseluruhan data di dapat akurasi masing-masing K1=0.
K3=0.
K5=0.
K7=0.
K11=0.
Didapatkan bahwa hasil akurasi terbaik terletak pada K=1 pada masing-masing dataset, meskipun terjadi penurunan Ketika K yang di uji semakin besar tetapi kecenderungan penurunan masih stabil dan tidak ada lonjakan akurasi yang signifikan.
Hal ini juga dapat memberikan kesimpulan bahwa model KNN lebih baik dalam mengklasifikasikan sinyal ketika dataset yang dipakai balance pada setiap kelas daripada data yang imbalance.
Setelah melakukan pengujian terhadap rasio data 90:10 pada masing-masing dataset, parameter K=1 memberikan akurasi tertinggi dibandingkan dengan K lainnya.
Hal ini dikarenakan pada rasio data 90:10, didapatkan data training yang lebih besar sehingga model dapat mengenali pola data lebih baik.
Hal ini juga terjadi karena model KNN bekerja dengan mengenali tetangga terdekatnya, sehingga pada dataset yang terpisah relatif jelas dan terpisah secara baik pada saat preprocessing, tetangga terdekat secara efektif mewakili kelas yang sesuai.
Penggunaan cross-validation dengan 5 fold .
secara konsisten menghasilkan akurasi yang lebih rendah dibandingkan dengan pengujian tanpa menggunakan crossvalidation pada model KNN dalam kasus klasifikasi sinyal seismik.
Dari beberapa poin diatas dapat disimpulkan bahwa analisa Template Matching dan model KNN cocok digunakan pada kasus klasifikasi sinyal seismik terutama pada data yang balance.
SARAN