MUSTEK ANIM HA Vol. No. April 2026, pp. ISSN: 2089-6697, e-ISSN: 2354-7707 DOI:https://doi. org/10. 35724/mustek. Klasifikasi Penyakit Daun Jagung Menggunakan MobileNetV2 dan TensorFlow Lite untuk Deployment Mobile di Distrik Semangga Merauke Corn Leaf Disease Classification Using MobileNetV2 and TensorFlow Lite for Mobile Deployment in Semangga District Merauke Jarot Budiasto*1. Hasanudin Jayawardana1. Tri Kustanti Rahayu1. Nasra Pratama Putra1 Info Artikel Diserahkan: 25 April 2026 Direvisi: 29 April 2026 Diterima: 30 April 2026 Diterbitkan: 30 April 2026 Sistem Informasi. Fakultas Teknik. Universitas Musamus. Merauke. Indonesia ABSTRAK Studi deteksi penyakit daun jagung berbasis deep learning pada dataset PlantVillage umumnya melaporkan akurasi tinggi namun jarang mengevaluasi efisiensi model untuk deployment mobile secara komprehensif lintas format konversi. Penelitian ini mengimplementasikan transfer learning dengan arsitektur MobileNetV2 untuk klasifikasi empat kelas kondisi daun jagung menggunakan dataset PlantVillage . 188 citr. , dilanjutkan konversi ke TensorFlow Lite sebagai persiapan deployment pada aplikasi Android. Model dilatih dengan pendekatan duafase . eature extraction dan fine-tunin. Hasil evaluasi menunjukkan akurasi 91,69% dengan F1-score macro average 90,18%. Analisis confusion matrix mengungkap tiga temuan: . precision sempurna 100% pada kelas Healthy tanpa false negative, menjamin model tidak salah mengklasifikasi daun sakit sebagai sehat. kelas Common Rust menjadi confuser utama akibat ketidakseimbangan data pelatihan. pertukaran klasifikasi antara Northern Leaf Blight dan Gray Leaf Spot sesuai kemiripan gejala visual. Konversi TFLite terkuantisasi menghasilkan reduksi ukuran 89,93% . ,26 MB ke 2,55 MB) tanpa kehilangan akurasi yang signifikan. Studi ini berfungsi sebagai baseline metodologi sebelum pengumpulan dataset lokal di Distrik Semangga. Merauke. Kata Kunci : Deep learning. MobileNetV2, transfer learning, penyakit daun jagung. TensorFlow Lite ABSTRACT Deep learning-based corn leaf disease detection studies on the PlantVillage dataset commonly report high accuracy but rarely evaluate comprehensive model efficiency for mobile deployment across conversion formats. This study implements transfer learning with MobileNetV2 architecture for classifying four corn leaf conditions using the PlantVillage dataset . ,188 image. , followed by TensorFlow Lite conversion as preparation for Android application The model was trained using a two-phase approach . eature extraction and finetunin. Evaluation results show 91. 69% accuracy with a macro F1-score of 90. Confusion matrix analysis reveals three findings: . perfect 100% precision on the Healthy class with zero false negatives, guaranteeing the model does not misclassify diseased leaves as healthy. Common Rust as the main confuser due to training data imbalance. classification confusion between Northern Leaf Blight and Gray Leaf Spot, consistent with their visual symptom Quantized TFLite conversion yields 89. 93% size reduction . 26 MB to 2. 55 MB) without significant accuracy loss. This study serves as a methodological baseline before local dataset collection in Semangga District. Merauke. Keywords : Deep learning. MobileNetV2, transfer learning, corn leaf disease. TensorFlow Lite Corresponding author email: jarot@unmus. This is an open access article under the CC BY-SA license. PENDAHULUAN Jagung (Zea mays L. ) merupakan komoditas pangan strategis nasional yang berperan penting dalam ketahanan pangan Indonesia, menjadi sumber karbohidrat utama setelah padi dan bahan baku industri pakan ternak, pangan olahan, serta bioenergi . Di wilayah timur Indonesia, khususnya Kabupaten Merauke. Provinsi Papua Selatan, jagung berpotensi menjadi komoditas andalan baru dengan dukungan lahan luas di sentra pertanian MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 seperti Distrik Semangga. Namun, produktivitas masih menghadapi tantangan serius akibat tiga penyakit daun utama: hawar daun utara (Northern Leaf Bligh. , karat daun (Common Rus. , dan bercak kelabu (Gray Leaf Spo. , yang dapat menurunkan kualitas dan kuantitas hasil panen signifikan . Pengamatan visual manual oleh petani bersifat subjektif, rentan kesalahan, dan tidak efektif untuk pemantauan lahan yang luas, terutama bagi petani skala kecil dengan akses teknologi terbatas . Perkembangan deep learning berbasis Convolutional Neural Network (CNN) menawarkan solusi otomatis untuk identifikasi penyakit tanaman dengan akurasi tinggi . , . Berbagai studi telah mendemonstrasikan efektivitas CNN untuk klasifikasi penyakit daun jagung dengan akurasi tinggi: VGG16 mencapai 94,67% . ResNet34 dengan F1-score 0,93 . MobileNetV2 dengan fitur augmentasi 96,6% . , hybrid CNN-Vision Transformer 98% . , dan MobileNetV2 pada citra lapangan 97% . Meskipun demikian, arsitektur CNN berskala besar seperti VGG16 . juta paramete. memiliki kebutuhan komputasi yang tinggi sehingga kurang sesuai untuk deployment mobile, sementara penelitian yang melaporkan pipeline lengkap dari pelatihan hingga evaluasi efisiensi konversi model untuk deployment Android masih relatif terbatas . Arsitektur MobileNetV2 dirancang khusus untuk perangkat mobile dengan teknik inverted residuals dan linear bottlenecks yang memberikan keseimbangan antara akurasi dan efisiensi komputasi . Kombinasi transfer learning dengan MobileNetV2 memungkinkan pengembangan model akurat dengan dataset terbatas sekaligus cukup ringan untuk dijalankan pada Android . Beberapa studi terkini bahkan melakukan modifikasi MobileNetV2 untuk meningkatkan performa, seperti integrasi Squeeze-and-Excitation module . dan finetuning arsitektur dengan konfigurasi yang dioptimalkan . Untuk deployment praktis. TensorFlow Lite (TFLit. menyediakan framework on-device inference dengan optimasi seperti post-training quantization untuk mereduksi ukuran model . Aspek ini krusial untuk penerapan di wilayah 3T . ertinggal, terdepan, terlua. seperti Distrik Semangga dengan konektivitas internet terbatas. Pendekatan deployment TFLite untuk aplikasi Android pada klasifikasi penyakit tanaman telah dieksplorasi pada beberapa studi . , namun pelaporan komparatif antar format konversi masih terbatas. Dari kajian literatur, dapat diidentifikasi tiga celah riset yang ingin diisi penelitian ini. Pertama, sebagian besar studi terdahulu fokus pada pencapaian akurasi tanpa pelaporan komprehensif tentang efisiensi model hasil konversi lintas format (Keras. TFLite standar. TFLite terkuantisas. Kedua, analisis mendalam pola kesalahan klasifikasi per kelas yang dapat memberikan wawasan praktis untuk pengembangan lanjutan masih terbatas. Ketiga, studi baseline yang jujur tentang performa model pada dataset publik sebagai fondasi pengembangan dataset lokal untuk wilayah spesifik Indonesia, khususnya Papua, belum tersedia. Penelitian ini mengimplementasikan transfer learning dengan MobileNetV2 untuk klasifikasi penyakit daun jagung yang dikonversi ke TensorFlow Lite sebagai persiapan deployment Android, menggunakan dataset PlantVillage subset Corn/Maize. Kontribusi penelitian mencakup tiga aspek. Pertama, implementasi lengkap pipeline transfer learning dua-fase pada MobileNetV2 dengan pelaporan hyperparameter lengkap untuk Kedua, evaluasi efisiensi model lintas format (Keras. TFLite standar. TFLite terkuantisas. dengan fokus pada ukuran file dan konsistensi akurasi. Ketiga, analisis mendalam pola kesalahan klasifikasi per kelas yang menjadi landasan pengembangan dataset lokal Distrik Semangga pada penelitian tahap lanjutan. Penelitian ini secara eksplisit diposisikan sebagai studi baseline metodologis, bukan klaim state-of-the-art pada PlantVillage. METODE PENELITIAN Penelitian menggunakan pendekatan eksperimental dengan transfer learning untuk membangun model klasifikasi penyakit daun jagung. Seluruh proses pelatihan dan evaluasi dilakukan pada platform Google Colab dengan akselerasi GPU NVIDIA T4. Alur pipeline penelitian disajikan pada Gbr. Gbr. Pipeline penelitian klasifikasi penyakit daun jagung dengan transfer learning MobileNetV2 Klasifikasi Penyakit Daun Jagung Menggunakan MobileNetV2 dan TensorFlow Lite untuk Deployment Mobile di Distrik Semangga Merauke MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 Gbr. Lanjutan Dataset Dataset yang digunakan adalah subset citra daun jagung dari PlantVillage Dataset . , sebuah dataset benchmark yang banyak digunakan pada studi klasifikasi penyakit tanaman berbasis deep learning . , . Dataset terdiri dari 4. 188 citra dalam empat kelas: Healthy. Common Rust. Gray Leaf Spot, dan Northern Leaf Blight. Gbr. 2 menyajikan distribusi jumlah citra per kelas, di mana Gray Leaf Spot memiliki sampel paling sedikit . citra atau 13,71%). Contoh citra per kelas ditampilkan pada Gbr. 3, dengan urutan baris pertama Northern Leaf Blight, kedua Common Rust, ketiga Gray Leaf Spot, dan keempat Healthy. Gbr. Distribusi jumlah citra per kelas pada dataset PlantVillage (Corn/Maiz. Vol. No. April 2026, pp. https://ejournal. MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 Gbr. Contoh citra per kelas . ari atas ke bawa. : Northern Leaf Blight. Common Rust. Gray Leaf Spot. Healthy Dataset dibagi menjadi tiga subset dengan proporsi 70% training, 20% validation, dan 10% testing secara stratifikasi per kelas. Pembagian menggunakan random seed tetap . untuk reproducibility. Rincian pembagian disajikan pada Tabel 1. Tabel 1. Pembagian dataset pada setiap kelas Kelas Northern Leaf Blight Common Rust Gray Leaf Spot Healthy Total Training Validation Testing Total Pra-pemrosesan dan Augmentasi Data Seluruh citra melalui pra-pemrosesan: resize ke 224y224 piksel, normalisasi nilai piksel ke rentang [-1, . menggunakan fungsi preprocess_input MobileNetV2, dan augmentasi khusus data pelatihan. Teknik augmentasi meliputi rotasi acak A20A, pergeseran horizontal dan vertikal 15%, flip horizontal, zoom A15%, dan penyesuaian kecerahan . ,85, 1,. Augmentasi hanya pada data training. Arsitektur Model Arsitektur menggunakan MobileNetV2 . pre-trained pada ImageNet tanpa top layer, ditambah classifier head kustom: GlobalAveragePooling2D. Dropout rate 0,3. Dense layer 128 unit dengan aktivasi ReLU. Dropout kedua rate 0,3, dan Dense output 4 unit dengan aktivasi softmax. Pemilihan 128 unit pada hidden Dense layer didasarkan pada rekomendasi lapisan bottleneck kompak untuk transfer learning MobileNet. Nilai dropout rate 0,3 dipilih sebagai kompromi antara regularisasi dan kapasitas model, konsisten dengan praktik umum pada studi klasifikasi citra tanaman . Total parameter model adalah 2. ase MobileNetV2 2. 984 parameter dan classifier head 164. 484 paramete. Strategi Pelatihan dan Hyperparameter Pelatihan dilakukan dalam dua fase. Fase pertama . eature extractio. membekukan seluruh lapisan base model dan hanya melatih classifier head dengan optimizer Adam (CA=0,9. CC=0,999. A=10AA), learning rate 0,001, selama maksimal 20 epoch. Fase kedua . ine-tunin. melepas freeze pada lapisan ke-100 ke atas dari base model Klasifikasi Penyakit Daun Jagung Menggunakan MobileNetV2 dan TensorFlow Lite untuk Deployment Mobile di Distrik Semangga Merauke MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 dan melatihnya bersama classifier head dengan learning rate 1y10a selama maksimal 10 epoch. Penurunan learning rate signifikan pada fase kedua menghindari degradasi bobot pre-trained. Tiga callback diterapkan: EarlyStopping dengan patience 5 epoch berdasarkan validation loss. ReduceLROnPlateau dengan faktor 0,5 pada patience 3 epoch, dan ModelCheckpoint yang menyimpan bobot terbaik berdasarkan validation accuracy. Loss function menggunakan categorical crossentropy dengan batch size Random seed ditetapkan konstan (SEED=. pada NumPy dan TensorFlow untuk reproducibility. Lingkungan pelatihan: Python 3. TensorFlow 2. GPU NVIDIA Tesla T4 16GB. Metrik Evaluasi Evaluasi menggunakan metrik standar untuk klasifikasi multi-kelas: accuracy, precision, recall, dan F1score. Accuracy mengukur proporsi prediksi benar terhadap seluruh sampel . Precision mengukur proporsi prediksi positif yang benar-benar positif . , sedangkan recall mengukur proporsi sampel positif yang berhasil terdeteksi . F1-score merupakan harmonic mean dari precision dan recall . , memberikan ukuran seimbang terutama pada kondisi data tidak seimbang. Accuracy = ycNycE ycNycA ycNycE ycNycA yaycE yaycA Precision = ycNycE ycNycE yaycE ycNycE Recall = ycNycE yaycA F1 Oe Score = 2 y ycEycyceycaycnycycnycuycu y ycIyceycaycaycoyco ycEycyceycaycnycycnycuycu ycIyceycaycaycoyco TP (True Positiv. adalah jumlah sampel positif yang diprediksi positif. TN (True Negativ. adalah jumlah sampel negatif yang diprediksi negatif. FP (False Positiv. adalah jumlah sampel negatif yang salah diprediksi dan FN (False Negativ. adalah jumlah sampel positif yang salah diprediksi negatif. Ketiga metrik precision, recall, dan F1-score dihitung per kelas, kemudian diagregasi menjadi nilai keseluruhan melalui dua pendekatan: macro average dan weighted average. Macro average . adalah rata-rata aritmetik sederhana dari nilai metrik setiap kelas, memberikan bobot yang sama untuk setiap kelas terlepas dari jumlah sampelnya. Sebaliknya, weighted average . memberikan bobot proporsional berdasarkan jumlah sampel . pada setiap kelas, sehingga kelas dengan sampel lebih banyak memberikan kontribusi yang lebih besar terhadap nilai Weighted Avg = Oc ycAyceycycycnycaycn Oc . cIycycyycyycuycycycn y ycAyceycycycnycaycn ) . Macro Avg = ycA Oc ycIycycyycyycuycycycn Pada persamaan . N adalah jumlah kelas . alam penelitian ini N=. , indeks i merujuk pada setiap kelas . = 1, 2, 3, 4 untuk Northern Leaf Blight. Common Rust. Gray Leaf Spot, dan Health. MetricA adalah nilai precision, recall, atau F1-score kelas ke-i, dan SupportA adalah jumlah sampel aktual kelas ke-i pada data uji. Dalam konteks dataset yang tidak seimbang seperti pada penelitian ini, perbedaan antara macro average dan weighted average memberikan informasi penting: macro average menyoroti performa pada kelas minoritas, sedangkan weighted average mencerminkan performa keseluruhan yang didominasi kelas mayoritas. Selain metrik di atas, confusion matrix digunakan untuk menganalisis pola kesalahan klasifikasi antar kelas secara visual. Konversi Model ke TensorFlow Lite Model Keras dikonversi ke TensorFlow Lite dalam dua varian menggunakan TFLiteConverter: TFLite standar mempertahankan bobot float32, sedangkan TFLite terkuantisasi mengubah bobot ke int8 melalui posttraining quantization default . Optimize. DEFAULT) . Kedua varian dievaluasi dari segi ukuran file dan konsistensi akurasi klasifikasi pada data uji menggunakan interpreter TFLite. HASIL DAN PEMBAHASAN Hasil Pelatihan Model Pelatihan berlangsung dalam dua fase dengan total waktu 22,3 menit pada GPU NVIDIA T4 . ase pertama 16,7 menit, fase kedua 5,5 meni. Pada fase pertama, validation accuracy puncak 93,67% tercapai di epoch ke15, dengan validation loss terbaik 0,1775 di epoch ke-16 yang di-restore oleh mekanisme restore_best_weights. Fase kedua berjalan 6 epoch sebelum dihentikan EarlyStopping, mencapai validation accuracy tertinggi 91,88% pada epoch ke-26. Pada transisi ke fase fine-tuning, training accuracy sempat menurun tajam dari 92,8% menjadi 83,0% pada epoch pertama fine-tuning . poch ke-. Fenomena ini terjadi karena saat sebagian lapisan base model diunfreeze, gradien mulai berpropagasi melalui lapisan yang sebelumnya beku, menggeser nilai bobot yang sebelumnya teroptimasi pada tugas ImageNet. Meskipun learning rate sudah kecil . , pergeseran bobot Vol. No. April 2026, pp. https://ejournal. MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 pada sejumlah besar parameter . % layer MobileNetV. berinteraksi dengan augmentasi data yang diterapkan, menyebabkan loss sementara meningkat. Training accuracy cepat pulih dalam beberapa epoch berikutnya seiring model beradaptasi dengan konfigurasi baru. Pola ini konsisten dengan dinamika fine-tuning yang umum dilaporkan pada literatur transfer learning . Fine-tuning tidak memberikan peningkatan signifikan pada validation accuracy puncak, mengindikasikan bahwa representasi fitur dari feature extraction sudah cukup optimal untuk domain citra daun jagung pada dataset PlantVillage. Gbr. 4 menyajikan kurva training dan validation accuracy serta loss untuk kedua fase, menunjukkan konvergensi stabil tanpa tanda overfitting signifikan. Gbr. Kurva training dan validation accuracy . dan loss . untuk kedua fase pelatihan Evaluasi pada Data Uji Evaluasi pada test set menunjukkan test accuracy sebesar 91,69% dengan test loss 0,2075. Konsistensi antara validation accuracy . ,88%) dan test accuracy . ,69%) dengan selisih yang sangat kecil . ,19%) mengindikasikan bahwa model memiliki kemampuan generalisasi yang baik tanpa indikasi overfitting maupun data leakage. Ringkasan metrik evaluasi disajikan pada Tabel 2. Tabel 2. Ringkasan metrik evaluasi model pada data uji Metrik Accuracy Precision . acro av. Recall . acro av. F1-Score . acro av. Precision . eighted av. Recall . eighted av. F1-Score . eighted av. Nilai 91,69% 90,70% 90,07% 90,18% 91,95% 91,69% 91,57% Analisis lebih lanjut pada tingkat kelas (Tabel . menunjukkan variasi performa model. Kelas Healthy memiliki kinerja tertinggi (F1-score 99,57%), diikuti Common Rust . ,19%). Kelas Northern Leaf Blight menunjukkan precision tinggi . ,94%) namun recall lebih rendah . ,87%), mengindikasikan masih adanya data yang tidak terdeteksi . alse negativ. Sementara itu. Gray Leaf Spot memiliki performa terendah dan seimbang (F1-score 81,03%), yang menunjukkan tantangan dalam pemisahan fitur antar kelas. Tabel 3. Metrik evaluasi per kelas pada data uji Kelas Northern Leaf Blight Common Rust Gray Leaf Spot Healthy Precision 93,94% 87,84% 81,03% 100,00% Recall 80,87% 99,24% 81,03% 99,15% F1-Score 86,92% 93,19% 81,03% 99,57% Support Secara keseluruhan, meskipun performa global model tinggi, terdapat perbedaan kemampuan klasifikasi antar kelas yang dipengaruhi oleh kompleksitas pola dan distribusi data. Analisis Confusion Matrix Gbr. 5 menyajikan confusion matrix yang mengungkap tiga temuan penting terhadap karakteristik model. Klasifikasi Penyakit Daun Jagung Menggunakan MobileNetV2 dan TensorFlow Lite untuk Deployment Mobile di Distrik Semangga Merauke MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 Gbr. Confusion matrix klasifikasi penyakit daun jagung pada data uji . iri: jumlah, kanan: ternormalisas. Temuan 1: Pembedaan Daun Sakit dan Sehat Hampir Sempurna Dari 304 sampel daun sakit pada data uji . abungan Northern Leaf Blight. Common Rust, dan Gray Leaf Spo. , tidak ada satu pun . yang salah diklasifikasikan sebagai Healthy. Sebaliknya, dari 117 sampel daun sehat, hanya satu . ,85%) salah diprediksi sebagai Common Rust. Hasilnya adalah precision sempurna 100% dan F1-score 99,57% pada kelas Healthy. Implikasi praktisnya, dalam konteks pemanfaatan oleh petani melalui sistem mobile-based untuk deteksi penyakit tanaman . , kesalahan mengklasifikasikan daun sakit sebagai sehat . alse negative pada Health. merupakan jenis kesalahan paling merugikan karena menyebabkan keterlambatan Model tidak pernah melakukan kesalahan jenis ini pada data uji. Temuan 2: Common Rust sebagai Confuser Utama Meskipun kelas Common Rust mencatat recall sebesar 99,24% . dari 131 sampel terklasifikasi dengan bena. , kelas ini juga menerima jumlah kesalahan klasifikasi terbanyak. Sebanyak 11 sampel Northern Leaf Blight, 6 sampel Gray Leaf Spot, dan 1 sampel Healthy salah diprediksi sebagai Common Rust, sehingga precision menurun menjadi 87,84%. Pola ini mengindikasikan adanya kecenderungan model untuk memprediksi Common Rust pada kasus yang ambigu. Salah satu penyebab utama adalah ketidakseimbangan data pelatihan, di mana Common Rust memiliki jumlah sampel terbanyak . , sehingga model memperoleh eksposur yang lebih besar terhadap variasi visual kelas tersebut. Fenomena class imbalance pada dataset PlantVillage juga dilaporkan pada studi hybrid CNN-ViT . sebagai faktor yang memengaruhi bias klasifikasi. Temuan 3: Pertukaran Blight dan Gray Leaf Spot Pertukaran klasifikasi antara Northern Leaf Blight dan Gray Leaf Spot yang dilaporkan dalam literatur patologi tanaman . juga teramati: 11 sampel Blight diprediksi sebagai Gray Leaf Spot dan 5 sampel Gray Leaf Spot diprediksi sebagai Blight. Kedua penyakit memiliki gejala visual serupa berupa bercak memanjang berwarna kecoklatan hingga keabu-abuan, sehingga kemiripan ini menjadi tantangan umum dalam studi transfer learning untuk penyakit jagung . Kelas Gray Leaf Spot menjadi kelas dengan performa terendah (F1-score 81,03%) karena jumlah sampel pelatihan terbatas . dan kemiripan visual dengan Blight. Temuan ini memberikan arah jelas untuk pengembangan penelitian lanjutan di Distrik Semangga: pengumpulan data lokal yang seimbang antar kelas, terutama untuk Gray Leaf Spot. Efisiensi Konversi Model Model Keras terlatih dikonversi ke TensorFlow Lite dalam dua varian. Perbandingan ukuran ketiga format disajikan pada Tabel 4. Tabel 4. Perbandingan ukuran model pada berbagai format Format Model Keras (. TFLite Standar TFLite Terkuantisasi Ukuran (MB) 25,26 9,08 2,55 Reduksi (%) 0,00% 64,07% 89,93% Reduksi ukuran sebesar 89,93% . ari 25,26 MB ke 2,55 MB) memungkinkan deployment ringan pada aplikasi Android dengan beban penyimpanan minimal. Ukuran 2,55 MB ini berimplikasi praktis penting untuk wilayah dengan infrastruktur terbatas seperti Distrik Semangga, memungkinkan aplikasi berjalan sepenuhnya offline tanpa ketergantungan pada server eksternal. Validasi Akurasi Model TFLite Untuk memastikan konversi TFLite tidak merusak performa klasifikasi, model dievaluasi ulang pada data uji dengan interpreter TFLite. Hasilnya: akurasi TFLite standar 92,64% dan TFLite terkuantisasi 93,11%, dibanding Keras asli 91,69%. Menariknya, kedua model TFLite mencatat akurasi sedikit lebih tinggi dari Keras asli, yakni dengan selisih 0,951,43% atau setara 4Ae6 sampel dari total 421 sampel uji. Vol. No. April 2026, pp. https://ejournal. MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 Fenomena ini memerlukan penjelasan yang cermat. Meskipun quantization secara teori umumnya menurunkan akurasi . , selisih kecil dalam dua arah . aik atau turu. dapat terjadi karena tiga faktor. Pertama, perbedaan engine inference: interpreter Keras dan TFLite menggunakan implementasi operasi aritmetika yang berbeda, terutama pada tahap akumulasi bobot dan aktivasi. perbedaan urutan operasi floating-point dapat menghasilkan akumulasi error numerik yang sedikit berbeda, yang dapat mengubah prediksi pada sampel dengan probabilitas mendekati ambang batas kelas. Kedua, prosedur inference: evaluasi Keras menggunakan batch-wise inference . sampel sekaligu. sedangkan evaluasi TFLite pada penelitian ini menggunakan sample-wise inference . atu per sat. , yang dapat memengaruhi operasi normalisasi batch. Ketiga, pada model dengan akurasi 91-93%, selisih 4-6 sampel berada dalam margin variasi yang kecil dan dapat dianggap bukan perbedaan signifikan secara statistik. Dalam konteks penelitian ini, temuan utama yang relevan adalah bahwa quantization tidak menurunkan akurasi secara signifikan, sehingga model TFLite terkuantisasi dapat direkomendasikan sebagai kandidat deployment dari perspektif ukuran. Benchmark Waktu Inferensi Pengukuran waktu inferensi dilakukan pada CPU Google Colab (Intel Xeon, arsitektur x86-. dengan hasil: TFLite standar 9,67A5,03 ms dan TFLite terkuantisasi 25,61A1,84 ms. Hasil ini tidak dapat diekstrapolasi langsung ke perangkat Android yang menggunakan prosesor ARM karena perbedaan arsitektur fundamental. x8664 memiliki optimasi instruction set AVX2 untuk operasi float32, sementara ARM memiliki NEON untuk operasi int8 . Oleh karena itu, hasil benchmark di atas tidak dapat digunakan untuk menyimpulkan performa inferensi pada perangkat Android target. Benchmark representatif pada perangkat smartphone nyata menjadi bagian dari rencana penelitian lanjutan. Pembahasan dan Implikasi Akurasi 91,69% pada penelitian ini lebih rendah dibanding beberapa studi serupa pada dataset PlantVillage yang melaporkan akurasi 94Ae99% . , . , . Perlu dipahami bahwa penelitian ini menggunakan dataset dan setup eksperimen yang serupa dengan studi-studi tersebut, sehingga perbedaan akurasi tidak dapat sepenuhnya dijustifikasi dengan argumen kondisi pengujian. Kemungkinan penyebab akurasi relatif lebih rendah mencakup: struktur classifier head yang lebih sederhana dibanding modifikasi pada beberapa studi, dimana . menambahkan fitur augmentasi dan . menggunakan hybrid architecture. tidak dilakukan hyperparameter tuning ekstensif. penggunaan konfigurasi MobileNetV2 standar tanpa modifikasi arsitektur seperti yang dilakukan . , . Dengan demikian, akurasi 91,69% merupakan baseline yang jujur dari pipeline transfer learning dua-fase konvensional pada MobileNetV2, bukan state-of-the-art pada PlantVillage. Arsitektur alternatif seperti EfficientNet . atau pendekatan komparatif lintas arsitektur . dapat menjadi bahan perbandingan untuk penelitian lanjutan. Meskipun akurasinya relatif lebih rendah, penelitian ini memberikan kontribusi yang tidak dibahas eksplisit pada studi-studi terdahulu: pelaporan komprehensif efisiensi konversi model lintas format dengan validasi akurasi pada setiap format. Kebanyakan studi hanya melaporkan akurasi pada model asli. perbandingan akurasi antara Keras. TFLite standar, dan TFLite terkuantisasi pada set uji yang sama memberikan informasi praktis untuk praktisi yang merancang deployment mobile. Sebagai contoh, studi-studi terkini pada deteksi penyakit jagung berbasis CNN seperti . , . , . berfokus pada pencapaian akurasi tanpa analisis komparatif antar format hasil Kesenjangan inilah yang berupaya diisi oleh penelitian ini. Keterbatasan utama dataset PlantVillage adalah kondisi pengambilan citra yang terkontrol, seperti latar belakang yang seragam dan pencahayaan yang optimal, sehingga berbeda dari kondisi lapangan nyata. Performa model pada kondisi lapangan berpotensi lebih rendah. Fenomena ini dikonfirmasi oleh studi terdahulu . yang menguji MobileNetV2 pada citra lapangan dari empat negara di Afrika. Oleh karena itu, penelitian ini diposisikan sebagai studi baseline metodologis sebelum pengumpulan dataset lokal dari Distrik Semangga, yang bertujuan untuk memvalidasi model pada kondisi nyata. KESIMPULAN Penelitian ini berhasil mengimplementasikan transfer learning dengan arsitektur MobileNetV2 untuk klasifikasi empat kelas kondisi daun jagung menggunakan dataset PlantVillage, sebagai studi baseline menuju deployment Android. Model mencapai akurasi 91,69% dengan F1-score macro 90,18% pada data uji. Analisis per kelas menunjukkan kelas Healthy mencapai precision sempurna 100% tanpa false negative, sementara Gray Leaf Spot menjadi kelas dengan performa terendah akibat ketidakseimbangan sampel dan kemiripan gejala visual. Konversi ke TensorFlow Lite terkuantisasi menghasilkan reduksi ukuran 89,93% . ,55 MB) tanpa menurunkan akurasi klasifikasi. Penelitian ini memiliki beberapa keterbatasan yang perlu diperhatikan. Pertama, tidak dilakukan perbandingan internal dengan arsitektur alternatif seperti MobileNetV3 dan EfficientNet-Lite, sehingga klaim relatif terkait pemilihan arsitektur belum tervalidasi secara empiris dalam setup eksperimen yang sama. Kedua, akurasi yang dicapai lebih rendah dibandingkan beberapa studi terdahulu pada dataset serupa, yang kemungkinan disebabkan oleh tidak dilakukannya hyperparameter tuning secara ekstensif maupun modifikasi arsitektur. Ketiga, benchmark waktu inferensi dilakukan pada CPU dengan arsitektur x86-64, sehingga tidak merepresentasikan Klasifikasi Penyakit Daun Jagung Menggunakan MobileNetV2 dan TensorFlow Lite untuk Deployment Mobile di Distrik Semangga Merauke MUSTEK ANIM HA ISSN: 2089-6697, e-ISSN: 2354-7707 performa pada prosesor ARM yang umum digunakan pada perangkat Android. Keempat, aplikasi Android terintegrasi belum dikembangkan pada tahap penelitian ini karena fokus utama masih pada persiapan dan evaluasi Arah pengembangan untuk penelitian lanjutan meliputi: . pengumpulan dataset lokal dari lahan pertanian Distrik Semangga. Kabupaten Merauke, dengan perhatian khusus pada keseimbangan antar kelas, terutama Gray Leaf Spot. perbandingan MobileNetV2 dengan arsitektur mobile-friendly alternatif dalam setup eksperimen yang sama untuk justifikasi pemilihan arsitektur. hyperparameter tuning sistematis dan eksplorasi modifikasi classifier head. pengembangan aplikasi Android terintegrasi dengan antarmuka ramah petani, dilanjutkan benchmark waktu inferensi pada perangkat smartphone nyata lintas spesifikasi. uji penerimaan . ser acceptance testin. bersama petani di Distrik Semangga sebagai validasi akhir sistem. UCAPAN TERIMA KASIH Penelitian ini didanai oleh DIPA Universitas Musamus Tahun Anggaran 2025 melalui skema Penelitian Dosen Pemula. Penulis mengucapkan terima kasih kepada Fakultas Teknik dan Jurusan Sistem Informasi Universitas Musamus atas dukungan fasilitas dan infrastruktur penelitian. DAFTAR PUSTAKA