184
Progresif: Jurnal Ilmiah Komputer Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat Ae Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 p-ISSN: 0216-3284 Analisis Kinerja Model Machine learning dalam Prediksi Gagal Panen Gabah Taufik Nizami1.
Muhammad Atillah Mustaqiim2.
Wahyudi Ariannor3* Teknik Informatika.
STMIK Banjarbaru.
Banjarbaru.
Indonesia *e-mail Corresponding Author: wahyu.
arian@gmail.
Abstract In Banjar Regency, rice production faces significant challenges, including high crop failure rates and production variability across regions, which impact equitable food availability.
This study aims to analyze the performance of various machine learning algorithms in predicting rice crop failures, a critical issue in food security.
The research variables include factors such as weather, air humidity, soil conditions, agricultural variables, and tungro disease infestations.
Several algorithms were tested, including Naive Bayes.
Logistic Regression.
Decision Tree.
Random Forest.
XGBoost, and others.
Evaluation was conducted using cross-validation techniques with metrics such as accuracy, precision, recall.
F1-Score, and ROC AUC.
The results indicate that the Random Forest and XGBoost algorithms achieved the best performance, with accuracies of 77% and 70%, respectively.
The study concludes that machine learning-based models can support better decision-making to mitigate crop failure risks.
Furthermore, this research provides a foundation for the development of predictive models in the agricultural sector.
Keywords: Harvest failure.
Rice.
Machine learning.
Prediction.
Food security Abstrak Di Kabupaten Banjar, produksi gabah menghadapi kendala signifikan, termasuk gagal panen yang tinggi dan variasi produksi antar wilayah, yang memengaruhi ketersediaan pangan merata.
Penelitian ini bertujuan untuk menganalisis kinerja berbagai algoritma machine learning dalam memprediksi gagal panen gabah, yang merupakan permasalahan penting dalam ketahanan Variabel penelitian mencakup faktor-faktor seperti cuaca, kelembapan udara, kondisi tanah, variabel pertanian, dan serangan tungro.
Beberapa algoritma yang diuji meliputi Naive Bayes.
Logistic Regression.
Decision Tree.
Random Forest.
XGBoost, dan lainnya.
Evaluasi dilakukan menggunakan teknik cross-validation dengan metrik akurasi, precision, recall.
F1Score, dan ROC AUC.
Hasil menunjukkan bahwa algoritma Random Forest dan XGBoost memberikan performa terbaik, dengan akurasi masing-masing sebesar 77% dan 70%.
Kesimpulan penelitian ini menunjukkan bahwa model berbasis machine learning dapat digunakan untuk mendukung pengambilan keputusan yang lebih baik dalam mengurangi risiko gagal panen.
Penelitian ini juga memberikan dasar untuk pengembangan model prediksi di sektor agrikultur.
Kata kunci: Gagal panen.
Gabah.
Machine learning.
Prediksi.
Ketahanan pangan Pendahuluan Prediksi gagal panen gabah sangat penting untuk pertanian dan ketahanan pangan, mengingat gagal panen adalah risiko utama bagi petani akibat faktor seperti perubahan iklim, hama, dan penyakit tanaman.
Prediksi adalah metode memperkirakan nilai masa depan berdasarkan data masa lalu dan kini.
Meskipun hasil prediksi tidak selalu tepat, tujuannya adalah mendekati keakuratan untuk dijadikan acuan dalam pengambilan Keputusan .
Kabupaten Banjar, produksi gabah menghadapi kendala signifikan, termasuk gagal panen yang tinggi dan variasi produksi antar wilayah, yang memengaruhi ketersediaan pangan merata.
Selain itu, keterbatasan data terkait cuaca, kualitas tanah, dan penyakit tanaman menyulitkan pemahaman penyebab gagal panen.
Oleh karena itu, penerapan metode prediksi, terutama menggunakan teknik komputasi di era teknologi seperti sekarang menjadi langkah strategis untuk mendukung pengambilan keputusan yang lebih cerdas dalam mengurangi risiko gagal panen di Analisis Kinerja Model Machine learning a.
Taufik Nizami Progresif e-ISSN: 2685-0877 sektor pertanian gabah.
Salah satu teknik komputasi yang dapat diterapkan yaitu teknik machine Machine learning adalah proses untuk mendapatkan pengetahuan dari data.
Bidang ini merupakan gabungan antara statistik, kecerdasan buatan, dan ilmu komputer.
Pembelajaran mesin juga sering disebut sebagai analitik prediktif atau pembelajaran statistik .
Teknik machine learning digunakan di berbagai bidang, termasuk pertanian, deteksi penipuan, dan media sosial .
Teknik machine learning dapat diterapkan untuk melakukan prediksi berbagai hal persoalan, seperti pada kasus prediksi panen gabah.
Pada penelitian ini dilakukan analisis kinerja model machine learning Regresi Logistik.
Extra Tree.
Decision Tree C4.
Support Vector Machine (SVM).
Random Forest.
XGBoost.
Gradient Boosting dan Naive Bayes untuk memprediksi hasil panen gabah sehingga dapat digunakan untuk mendukung pengambilan keputusan yang lebih baik dalam mengurangi risiko gagal panen.
Tinjauan Pustaka Beberapa riset terdahulu yang relevan seperti penelitian .
, menggunakan algoritma regresi linier untuk memprediksi produksi tanaman padi di Kabupaten Grobogan.
Jawa Tengah.
Penurunan produksi padi yang terjadi pada tahun 2022 sebesar 4,62%, serta meningkatnya jumlah penduduk dan alih fungsi lahan menjadi faktor utama masalah produksi.
Penelitian ini bertujuan untuk mengatasi ketidakpastian hasil panen dengan membangun model prediksi berdasarkan data dari Badan Pusat Statistik dan BMKG, yang mencakup variabel luas lahan, curah hujan, kelembapan, dan suhu selama sepuluh tahun terakhir.
Hasil model regresi linier menunjukkan nilai MSE 6.
550,24 dan MAE 121.
657,98, dengan tingkat akurasi prediksi yang cukup baik.
Model ini diharapkan dapat membantu merencanakan produksi yang lebih efisien dan mempertahankan ketahanan pangan di masa depan.
Penelitian .
, membandingkan algoritma machine learning untuk memprediksi hasil panen tanaman pangan di Sumatera, meliputi padi, jagung, kacang tanah, kedelai, ubi kayu, dan ubi jalar.
Data dari Badan Pusat Statistik (BPS) dan Badan Meteorologi.
Klimatologi, dan Geofisika (BMKG) digunakan untuk membangun model prediksi menggunakan algoritma Random Forest.
Decision Tree.
Gradient Boosting.
Extra Tree.
Support Vector Machine (SVM), dan Artificial Neural Network (ANN).
Hasil evaluasi menunjukkan algoritma Extra Tree memiliki performa terbaik, dengan nilai koefisien determinasi (R.
tertinggi sebesar 0,968 untuk prediksi padi dan 0,913 untuk tanaman pangan lainnya.
Penelitian ini menyimpulkan bahwa luas panen merupakan variabel yang paling memengaruhi hasil prediksi.
Algoritma Extra Tree direkomendasikan untuk memprediksi hasil pertanian di wilayah Sumatera, mengingat akurasinya yang lebih tinggi dibandingkan model lainnya.
Penelitian .
, menggunakan teknik data mining dengan algoritma Decision Tree C4.
untuk memprediksi hasil produksi karet di PT.
Perkebunan Nusantara VII.
Lampung Selatan.
Faktor-faktor yang digunakan dalam prediksi meliputi luas areal, jenis pohon karet, sistem sadap, tahun tanam, dan jumlah pohon.
Data produksi dari tahun 2010-2015 dikumpulkan melalui wawancara, observasi, dan dokumentasi.
Pengujian prediksi dilakukan menggunakan aplikasi Weka dengan data training sebanyak 1003 record dan diuji menggunakan 10-fold crossvalidation.
Hasil penelitian menunjukkan tingkat akurasi 99,90%, dengan klasifikasi data yang mencapai 709 produksi tercapai dan 192 produksi tidak tercapai.
Penelitian ini memberikan solusi prediksi yang akurat dan mudah diinterpretasikan, yang dapat digunakan untuk perencanaan produksi karet di masa depan.
Kemudian penelitian oleh .
mengembangkan sistem prediksi hasil produksi jagung menggunakan algoritma Decision Tree C4.
5, bertujuan untuk membantu petani dan pemangku kepentingan dalam perencanaan produksi yang lebih efisien.
Data yang digunakan berasal dari Kaggle, terdiri dari 4.
121 data dari berbagai negara.
Proses pengembangan melibatkan tahap preprocessing, normalisasi, serta pembagian data latih .
%) dan data uji .
%).
Algoritma C4.
dipilih karena mampu menangani atribut kontinu dan kategorikal, menghasilkan model pohon keputusan yang mudah dipahami.
Hasil pengujian menunjukkan akurasi prediksi sebesar 92,82% dibandingkan dengan algoritma Random Forest dan KNN, di mana C4.
5 memberikan akurasi Penggunaan algoritma ini dinilai efektif dalam menangani kompleksitas data dan meningkatkan kecepatan proses prediksi, dengan variabel seperti kondisi cuaca dan jenis tanah yang memberikan kontribusi signifikan terhadap akurasi.
Analisis Kinerja Model Machine learning a.
Taufik Nizami 186 e-ISSN: 2685-0877 Peneltian oleh .
mengaplikasikan algoritma Support Vector Machine (SVM) untuk memprediksi hasil panen pertanian salak di Tapanuli Selatan, menggunakan data dari Dinas Pertanian setempat untuk tahun 2019-2020.
Dataset terdiri dari atribut kecamatan, luas lahan, dan hasil panen yang diolah melalui preprocessing, termasuk cleaning dan normalisasi data.
Setelah diterapkan algoritma SVM, hasil prediksi menunjukkan akurasi sebesar 44% dan Root Mean Square Error (RMSE) sebesar 1,49.
Penelitian ini memberikan wawasan penting bagi perencanaan produksi pertanian salak, meskipun akurasinya masih dapat ditingkatkan dengan pengembangan lebih lanjut.
Sistem ini diharapkan dapat membantu petani dalam memprediksi hasil panen secara lebih efektif, khususnya dalam menghadapi perubahan variabel seperti luas lahan dan jumlah tanaman.
Penelitian relevan lainnya seperti yang dilakukan oleh .
Penelitian ini membandingkan algoritma XGBoost dan Random Forest untuk klasifikasi data kesehatan mental, menggunakan dataset dari Kaggle dengan 292.
364 baris dan 17 fitur.
Tahapan preprocessing meliputi penanganan missing values, encoding, balancing data dengan SMOTE, dan normalisasi dengan MinMaxScaler.
Kedua model diuji 30 kali, menghasilkan rata-rata akurasi, presisi, recall, dan F1-Score sebesar 99.
82% untuk XGBoost dan 99.
04% untuk Random Forest.
XGBoost menunjukkan performa lebih unggul, terutama dalam hal akurasi dan efisiensi, berkat penggunaan teknik regularisasi yang efektif mengurangi overfitting.
Kesimpulannya.
XGBoost lebih baik dalam klasifikasi data kesehatan mental dibandingkan Random Forest, dan disarankan untuk digunakan pada aplikasi klasifikasi lainnya yang membutuhkan akurasi tinggi dengan data yang kompleks.
Kemudian penelitian oleh .
Penelitian ini mengeksplorasi optimasi klusterisasi untuk lama tempo pekerjaan menggunakan Gradient Boosting Algorithm (GBA).
Data yang digunakan mencakup variabel seperti job title, kategori pekerjaan, dan jenis kontrak.
GBA diterapkan untuk mengelompokkan data dengan akurasi 96%, terutama berhasil dalam mengklasifikasikan jenis pekerjaan Full-time dan Part-time, namun kesulitan pada kelas Contract/Temp.
Penelitian ini juga menggunakan teknik preprocessing, seperti Label Encoding dan pembagian data untuk melatih Hasil evaluasi dengan confusion matrix menunjukkan bahwa model mampu mengidentifikasi pola yang baik pada sebagian besar kelas, meskipun masih terdapat tantangan dalam beberapa area.
Penelitian ini berkontribusi pada pengembangan manajemen sumber daya manusia dengan menawarkan model yang dapat membantu organisasi membuat keputusan yang lebih baik terkait perencanaan tenaga kerja berdasarkan lama masa kerja.
Penelitian lain yang revelan yaitu pada riset .
yang membandingkan kinerja berbagai algoritma machine learning, seperti Support Vector Machine (SVM).
Logistic Regression, dan Naive Bayes, dalam analisis sentimen publik terhadap isu sosial-politik.
Hasil penelitian menunjukkan bahwa SVM dan Logistic Regression unggul dalam hal precision dan F1-Score, menjadikannya pilihan yang efektif untuk analisis prediktif berbasis teks.
Teknik serupa dapat diadopsi dalam konteks agrikultur untuk memprediksi gagal panen, mengingat kemampuannya dalam menangani data kompleks dan menghasilkan prediksi yang andal.
Penelitian sebelumnya menunjukkan bahwa algoritma C4.
5 efektif dalam manajemen persediaan obat di apotek dengan tingkat akurasi mencapai 0,7190.
Temuan ini menunjukkan bahwa algoritma ini tidak hanya membantu dalam pengelolaan inventaris, tetapi juga mengurangi risiko kehabisan stok atau overstock .
Efektivitas algoritma ini menjadi dasar untuk menerapkannya pada sektor lain, termasuk agrikultur.
Berdasarkan beberapa penelitian sebelumnya, model machine learning telah banyak diterapkan untuk memprediksi hasil panen guna mengatasi tantangan ketidakpastian produksi akibat perubahan iklim dan faktor agrikultural.
Model-model seperti Regresi Logistik.
Random Forest.
Extra Tree.
SVM.
XGBoost.
Gradient Boosting.
Decision Tree C4.
5, dan Naive Bayes telah menunjukkan performa yang baik dalam berbagai penelitian prediksi hasil pertanian, seperti produksi padi, karet, jagung, dan tanaman pangan lainnya .
Studi-studi tersebut menunjukkan bahwa model berbasis pohon (Extra Tree.
Random Fores.
dan algoritma Boosting (XGBoost.
Gradient Boostin.
umumnya unggul dalam menangani data kompleks, sementara Decision Tree C4.
5 dan SVM juga efektif untuk kasus spesifik .
Penelitian ini mengkomparasi model-model tersebut untuk menentukan pendekatan terbaik dalam prediksi gagal panen gabah, menggunakan evaluasi metrik seperti akurasi.
F1-Score.
ROC AUC, precision dan recall.
State of art penelitian ini adalah penggunaan variabel yang berbeda dan teknik pengujian menggunakan 5-fold cross-validation.
Progresif: Vol.
No.
Februari: 184-192 Progresif e-ISSN: 2685-0877 Metodologi 1 Desain Penelitian Penelitian ini menggunakan pendekatan kuantitatif dengan metode eksperimental untuk menganalisis kinerja model machine learning dalam memprediksi gagal panen gabah.
Beberapa algoritma machine learning digunakan untuk membandingkan performa prediksi, yaitu: Naive Bayes.
Logistic Regression.
Decision Tree.
Extra Tree.
SVM.
Random Forest.
XGBoost dan Gradient Boosting.
Kinerja model diukur dengan teknik evaluasi cross-validation dengan berbagai metrik evaluasi.
2 Tahapan Penelitian Penelitian ini dilakukan dengan tahapan-tahapan sebagai berikut:
Pengumpulan Data Pra-processing Data Pengujian Model Evaluasi Model Gambar 1.
Tahapan Penelitian 3 Data Penelitian Data yang digunakan dalam penelitian ini berasal dari data simulasi terkait faktor-faktor yang mempengaruhi gagal panen gabah di beberapa wilayah.
Tabel berikut merangkum variabelvariabel yang digunakan dalam penelitian ini:
Variabel Cuaca Kelembapan Udara Kondisi Tanah Variabel Pertanian Tungro Gagal Panen Tabel 1.
Variabel Penelitian Deskripsi Kondisi cuaca (Bagus.
Sedang.
Buru.
Kualitas kelembapan udara (Bagus.
Sedang.
Buru.
Kualitas kondisi tanah (Bagus.
Sedang.
Buru.
Faktor-faktor pertanian (Bagus.
Sedang.
Buru.
Tingkat serangan penyakit Tungro (Bagus.
Sedang.
Buru.
Hasil panen (Y untuk gagal.
T untuk berhasi.
Total ada 18 sampel data yang dikategorikan ke dalam dua kelas, yaitu gagal panen (Y) dan tidak gagal panen (T).
Sample data sebagai berikut:
Variabel Pertanian Buruk Buruk Tungro Bagus Sedang Tabel 2.
Data Penelitian Kelembapan Kondisi Udara Tanah Sedang Bagus Buruk Bagus Sedang Buruk Gagal Panen Buruk Sedang Buruk Sedang Buruk Buruk Buruk Buruk Bagus Sedang Sedang Buruk Buruk Sedang Sedang Bagus Bagus Bagus Bagus Sedang Bagus Bagus Sedang Bagus Bagus Bagus Sedang Bagus Bagus Buruk Wilayah Cuaca Aluh-aluh Beruntung Baru Gambut Kertak Hanyar Tatah Makmur Sungai Tabuk Martapura Martapura Timur Analisis Kinerja Model Machine learning a.
Taufik Nizami 188 e-ISSN: 2685-0877 Wilayah Cuaca Martapura Barat Astambul Karang Intan Sungai Pinang Pengaron Sambung Makmur Mataraman Simpang Empat Telaga Bauntung Cintapuri Darussalam Kondisi Tanah Bagus Variabel Pertanian Bagus Tungro Bagus Kelembapan Udara Sedang Bagus Gagal Panen Bagus Bagus Bagus Sedang Bagus Bagus Sedang Bagus Bagus Bagus Bagus Bagus Bagus Sedang Bagus Bagus Bagus Bagus Bagus Bagus Bagus Sedang Sedang Bagus Sedang Bagus Buruk Bagus Bagus Bagus Bagus Sedang Buruk Sedang Buruk Bagus Bagus Sedang Bagus Bagus Sedang Bagus Sedang Bagus Bagus 4 Preprocessing Data Sebelum melakukan proses pelatihan model, dilakukan label encoding pada variabelvariabel kategorikal untuk mengubah nilai kategorikal menjadi numerik agar dapat diproses oleh algoritma machine learning.
Setiap variabel seperti "Wilayah", "Cuaca", "Kelembaban Udara", "Kondisi Tanah", "Variabel Pertanian", dan "Tungro" diubah menjadi nilai numerik.
Data dibagi menjadi dua komponen utama:
Oe Fitur (X): Variabel bebas yang digunakan untuk memprediksi gagal panen .
elain variabel "Gagal Panen") Oe Target .
: Variabel dependen yaitu "Gagal Panen", yang merupakan hasil klasifikasi dengan dua kelas (Y: Gagal.
T: Tidak Gaga.
Oe 6 Pengujian Model Machine learning Model-model machine learning yang digunakan dalam penelitian ini meliputi:
Oe Naive Bayes (GaussianNB) Oe Logistic Regression Oe Decision Tree Oe Extra Tree Oe Support Vector Machine (SVM) dengan prediksi probabilitas Oe Random Forest Oe XGBoost Oe Gradient Boosting Setiap model dipilih berdasarkan kemampuannya dalam menangani masalah klasifikasi biner, dengan fokus pada interpretasi dan performa prediktif dalam konteks agrikultur.
Proses pengujian model dilakukan dalam langkah-langkah berikut:
Inisialisasi model: Setiap model diinisialisasi dengan parameter default dan kemudian dilatih menggunakan data yang telah disiapkan .
Cross-validation: Model dievaluasi menggunakan 5-fold cross-validation.
Pada setiap iterasi, data dibagi menjadi set pelatihan dan set pengujian.
Cross-validation digunakan untuk memilih model terbaik dari beberapa kandidat dengan mengukur kesalahan prediksi ratarata pada data yang tidak terlihat.
Ini memberikan alternatif yang lebih mudah digunakan dibandingkan dengan pengujian hipotesis nol dan tidak memerlukan banyak asumsi .
Prediksi dan Perhitungan Metrik: Pada setiap fold, model melakukan prediksi pada set pengujian, dan metrik evaluasi dihitung untuk akurasi, precision, recall.
F1-Score, dan ROC AUC .
ika memungkinka.
Progresif: Vol.
No.
Februari: 184-192 Progresif e-ISSN: 2685-0877 .
Penggabungan Hasil: Hasil dari setiap fold digabungkan untuk menghitung nilai rata-rata dari setiap metrik, serta confusion matrix total untuk setiap model .
Visualisasi: Hasil confusion matrix divisualisasikan menggunakan heatmap, dan akurasi model dibandingkan dalam diagram batang untuk memberikan gambaran performa setiap 7 Evaluasi Model Untuk mengevaluasi kinerja model, digunakan teknik Stratified K-Fold Cross-validation dengan 5 lipatan .
Teknik ini memastikan bahwa distribusi kelas dalam setiap fold seimbang, mengurangi potensi bias dalam proses evaluasi.
Metrik-metrik evaluasi yang digunakan adalah sebagai berikut:
Oe Accuracy: Mengukur proporsi prediksi yang benar dibandingkan total data.
Oe Precision: Mengukur akurasi prediksi positif model .
okus pada prediksi gagal panen yang Oe Recall: Mengukur sensitivitas model dalam mendeteksi kasus gagal panen.
Oe F1-Score: Harmonik rata-rata antara precision dan recall.
Oe ROC AUC: Area di bawah kurva ROC yang menunjukkan kemampuan model untuk memisahkan dua kelas .
agal panen vs tidak gagal pane.
Oe Confusion matrix: Menggambarkan hasil klasifikasi dengan menunjukkan jumlah true positive, true negative, false positive, dan false negative.
Setiap model dievaluasi menggunakan metrik-metrik di atas.
Confusion matrix divisualisasikan menggunakan heatmap untuk melihat seberapa baik model memprediksi kedua kelas .
agal panen dan tidak gagal pane.
Selain itu, perbandingan akurasi antar model divisualisasikan dalam bentuk diagram batang .
ar plo.
Hasil dan Pembahasan 1 Hasil Pengujian Model Algoritma Dalam penelitian ini, beberapa algoritma telah diterapkan untuk memprediksi gagal panen gabah berdasarkan data cuaca, kelembapan udara, kondisi tanah, variabel pertanian, dan serangan tungro.
Algoritma yang diuji meliputi Naive Bayes.
Logistic Regression.
Decision Tree.
Extra Tree.
Support Vector Machine (SVM).
Random Forest.
XGBoost, dan Gradient Boosting.
Pengujian dilakukan dengan menggunakan teknik cross-validation dan beberapa metrik evaluasi, seperti accuracy, precision, recall.
F1 score, dan ROC AUC.
Tabel di bawah ini menunjukkan hasil evaluasi dari setiap algoritma:
Model
Naive Bayes Logistic Regression Decision Tree
Extra Tree
SVM
Random Forest XGBoost Gradient Boosting Tabel 3.
Hasil Evaluasi Model
Accuracy Precision Recall F1 Score
ROC AUC
2 Analisis Performa Model Hasil analisis performa model adalah sebagai berikut:
Naive Bayes memiliki akurasi sebesar 0.
70, dengan precision tinggi .
, namun recallnya hanya 0.
F1 score sebesar 0.
33 menunjukkan bahwa model ini kurang seimbang dalam menangani prediksi positif dan negatif, meskipun AUC ROC menunjukkan hasil yang cukup baik .
Logistic Regression memberikan akurasi yang lebih rendah .
dibandingkan Naive Bayes, namun memiliki precision dan recall yang seimbang dengan F1 score 0.
Nilai ROC AUC .
menunjukkan bahwa model ini cukup baik dalam mengklasifikasikan secara umum, meski akurasi kurang optimal Analisis Kinerja Model Machine learning a.
Taufik Nizami 190 e-ISSN: 2685-0877 .
Decision Tree menghasilkan akurasi 0.
65 dengan precision dan recall yang rendah, masingmasing 0.
70 dan 0.
F1 score yang rendah .
mengindikasikan bahwa model ini memiliki ketidakseimbangan dalam memprediksi hasil positif dan negatif, serta ROC AUC yang relatif rendah .
Extra Tree memberikan akurasi 0.
67 dengan precision dan recall yang cukup seimbang.
Model ini memiliki F1 score sebesar 0.
47, menunjukkan performa yang lebih baik dibandingkan Decision Tree, dengan ROC AUC yang lebih tinggi .
SVM menunjukkan hasil yang kurang baik dengan akurasi 0.
60 dan recall 0.
00, yang menyebabkan F1 score 0.
Hal ini menunjukkan bahwa model ini gagal memprediksi kasus gagal panen dengan benar.
ROC AUC yang rendah .
mendukung temuan ini .
Random Forest memberikan hasil terbaik dengan akurasi 0.
77, precision 0.
80, dan recall 50, dengan F1 score sebesar 0.
ROC AUC juga menunjukkan hasil yang cukup baik .
, menandakan bahwa model ini mampu menangani prediksi gagal panen dengan cukup akurat .
XGBoost memberikan performa yang seimbang dengan akurasi 0.
70, precision 0.
73, dan 80, serta F1 score yang cukup tinggi .
Model ini memiliki ROC AUC sebesar 83, menunjukkan bahwa XGBoost adalah salah satu model terbaik dalam klasifikasi ini .
Gradient Boosting memiliki akurasi 0.
70, precision yang tinggi .
, namun recall yang rendah .
Dengan F1 score 0.
33 dan ROC AUC 0.
58, model ini menunjukkan performa yang serupa dengan Naive Bayes dalam hal prediksi gagal panen.
3 Pembahasan Berdasarkan hasil pengujian.
Random Forest dan XGBoost terbukti sebagai algoritma yang paling efektif dalam memprediksi gagal panen, hasil ini menguatkan temuan penelitian .
Kedua model ini mampu memberikan akurasi yang tinggi, precision yang seimbang, serta performa yang kuat berdasarkan nilai F1 score dan ROC AUC.
Random Forest lebih unggul dalam memberikan prediksi yang akurat secara keseluruhan, sementara XGBoost unggul dalam mendeteksi kasus gagal panen yang lebih jarang terjadi .
ilai recall yang tingg.
Model SVM tidak mampu memberikan performa yang baik dalam memprediksi gagal panen, mungkin disebabkan oleh kesulitan model dalam menangani dataset yang mungkin memiliki distribusi kelas yang tidak seimbang, serupa dengan hasil penelitian .
yang hanya menghasilkan akurasi 44%.
Untuk model Naive Bayes dan Logistic Regression, hasil menunjukkan bahwa meskipun keduanya memiliki nilai precision yang tinggi, recall dan F1 scorenya lebih rendah, menunjukkan kelemahan dalam menangani kelas minoritas.
Meskipun demikian, algoritma jenis regresi seperti Logistic Regression dapat dijadikan model untuk melakukan prediksi gagal panen sebagaimana temuan pada penelitian .
Penggunaan metode ensemble seperti Random Forest dan Gradient Boosting memberikan peningkatan performa yang signifikan dibandingkan dengan metode single Decision Tree, seperti yang terlihat pada perbandingan dengan model Decision Tree dan Extra Tree.
Hasil ini berbeda dengan hasil penelitian .
yang menyimpulkan Decision Tree C4.
5 lebih akurat dalam melakukan prediksi.
4 Visualisasi Hasil Berikut adalah perbandingan akurasi dari berbagai model yang divisualisasikan dalam bentu diagram batang berikut:
Progresif: Vol.
No.
Februari: 184-192 Progresif e-ISSN: 2685-0877 Gambar 2.
Visualisasi Akurasi Simpulan Penelitian ini menyimpulkan bahwa algoritma Random Forest dan XGBoost memiliki kinerja terbaik dalam memprediksi gagal panen gabah berdasarkan data cuaca, kelembapan udara, kondisi tanah, variabel agrikultur, dan tingkat serangan penyakit tungro.
Random Forest unggul dalam memberikan akurasi keseluruhan sebesar 77%, sementara XGBoost menunjukkan performa yang kuat dengan recall tinggi, menjadikannya lebih efektif dalam mendeteksi kasus gagal panen.
Hasil penelitian ini menunjukkan bahwa penerapan machine learning dapat menjadi solusi yang andal dalam mendukung pengambilan keputusan di sektor pertanian, khususnya untuk mengurangi risiko gagal panen.
Namun, keterbatasan jumlah data dalam penelitian ini menjadi tantangan yang perlu diperhatikan untuk meningkatkan generalisasi model.
Penelitian lanjutan disarankan untuk menggunakan dataset yang lebih besar dan mempertimbangkan variabel tambahan, seperti perubahan iklim jangka panjang dan praktik agrikultur lokal, guna menghasilkan prediksi yang lebih akurat dan aplikatif dalam skala yang lebih luas.
Dengan pengembangan lebih lanjut, model ini dapat memberikan kontribusi signifikan dalam menciptakan sistem pertanian yang lebih tangguh dan berkelanjutan.
Daftar Referensi .
Siregar.
Faisal.
Cahyana dan B.
Priyatna.
AuPerbandingan Algoritme Klasifikasi Untuk Prediksi Cuaca,Ay Jurnal Accounting Information System (AIMS, vol.
3, no.
1, pp.
1524, 2020.
Mulyana.
Aryanto dan M.
Aprilia.
AuPenerapan Metode Single Exponential Smoothing Untuk Prediksi Kasus Positif COVID 10 di Kabupaten Bengkalis,Ay Jurnal Computer Science and Information Technology (CoSciTec.
, vol.
3, no.
3, pp.
415-421, 2022.
Bukit dan R.
AuPrediksi Harga Tandan Buah Segar dengan Algoritma KNearest Neighbor,Ay Jurnal Sistem Komputer dan Informatika (JSON), vol.
5, no.
1, pp.
92101, 2023.
Raharjo.
Pembelajaran Mesin (Machine Learnin.
Semarang: Yayasan Prima Agus Teknik, 2021.
Karthikeyan.
Velswamy.
Harshavardhanan.
Rajagopal.
Jeyakrishnan dan S.
Velliangiri.
Machine Learning Techniques Application.
Pennsylvania: IGI Global, 2021.
Musababa.
AuImpelementasi Algoritma Linear Regression untuk Prediksi Produksi Tanaman Padi di Kabupaten Grobogan,Ay Data Science Indonesia (DSI), vol.
3, no.
2, pp.
68-78, 2023.
Analisis Kinerja Model Machine learning a.
Taufik Nizami 192 e-ISSN: 2685-0877 .
Satria.
Badri dan I.
Safitri.
AuPrediksi Hasil Panen Tanaman Pangan Sumatera dengan Metode Machine Learning,Ay Digital Transformation Technology (Digitec.
, vol.
2, pp.
389-398, 2023.
Setyadi.
AuPenerapan Data Mining Untuk Prediksi Hasil Produksi Karet Menggunakan Algoritma Decision Tree C4.
5,Ay Teknologipintar.
org, vol.
2, no.
7, pp.
1-11, 2022.
Kurnia.
Witanti dan A.
Komarudin.
AuSistem Prediksi Hasil Produksi Jagung Menggunakan Algoritma Decision Tree C.
45,Ay Journal Of Informatics And Busisnes, vol.
02, pp.
266-271, 2024.
Kurniawan.
Halim dan H.
Melisa.
AuPrediksi Hasil Panen Pertanian Salak di Daerah Tapanuli Selatan Menggunakan Algoritma SVM (Support Vector Machin.
,Ay KLIK: Kajian Ilmiah Informatika dan Komputer, vol.
4, no.
2, pp.
903-912, 2023.
Wardana dan A.
Rahim.
AuAnalisis Perbandingan Algoritma XGBoost dan Random Forest untuk Klasifikasi Data Kesehatan Mental,Ay LOGIC: Jurnal Ilmu Komputer dan Pendidikan, vol.
2, no.
5, 2024.
Septian.
AuOptimasi Klusterisasi pada Lama Tempo Pekerjaan Berbasis Gradient Boost Algorithm,Ay Indonesian Journal Of Information Technology (IJITECH), vol.
2, no.
1, pp.
1-5,
Ariannor.
Alshalwi dan B.
Susarianto.
AuSentiment Analysis of Netizens on Constitutional Court Rulings in the 2024 Presidential Election,Ay Indonesian Journal of Informatics Education (IJIE), vol.
8, no.
2, pp.
90-100, 2024.
Aziz dan D.
Abdullah.
AuPrediksi Persediaan Obat Menggunakan Algoritma Decision Tree (C4.
Pada Apotek Az-Zikra Bengkulu,Ay Progresif: Jurnal Ilmiah Komputer, vol.
2, pp.
784-792, 2024.
Rooij and W.
Weeda.
AuCross-Validation: A Method Every Psychologist Should Know,Ay Advances in Methods and Practices in Psychological Science, vol.
3, no.
2, pp.
248263, 2020.
RafaCo.
AuCross validation methods: Analysis based on diagnostics of thyroid cancer metastasis,Ay ICT Express, vol.
8, no.
2, pp.
183-188, 2022.
Progresif: Vol.
No.
Februari: 184-192