JURNAL ILMU KOMPUTER (JUIK) - VOL. 5 NO. 3 OCTOBER 2025 PREDIKSI TINGKAT KEKERASAN PADA PEREMPUAN DAN ANAK DI KABUPATEN GORONTALO MENGGUNAKAN MACHINE LEARNING 1,2,3 Citra Ayu1*. Alter Lasarudin2. Wahyudin Hasyim3 Sistem Informasi. Universitas Muhammadiyah Gorontalo. Jl. Prof. Mansoer Pateda. Kab. Gorontalo. Indonesia Coresponding: alterlasarudin@umgo. Submitted: 08-05-2025. Accepted: 22-07-2025. Published: 30-10-2025 ABSTRACT Violence against women and children remains a social issue that requires special attention, especially in Gorontalo Regency, which had the highest case numbers in Gorontalo Province. This study aims to predict the level of violence against women and children using machine learning methods with the Nayve Bayes and Multiple Linear Regression The data used were obtained from the Department of Women Empowerment and Child Protection of Gorontalo Regency, with variables including physical violence, sexual violence, neglect, and psychological abuse. The results showed that the Nayve Bayes algorithm produced an RMSE of 0. 174 for women cases and 0. 254 for child cases. Meanwhile, the Multiple Linear Regression algorithm generated a very small RMSE of 0. 000 for both cases. This value appeared nearly perfect, prompting a re-evaluation using Google Colab to ensure its accuracy. The repeated test showed consistent results, indicating that the regression model provided reliable outcomes and did not experience overfitting. Therefore, the Multiple Linear Regression algorithm is considered more effective in predicting the level of violence. The findings of this study are expected to assist the government and related institutions in taking quicker and more targeted preventive actions so that violence against women and children in Gorontalo Regency can be reduced. Keywords: Prediction. Violence. Women and Children. Machine Learning. Nayve Bayes. Multiple Linear Regression. ABSTRAK Kekerasan terhadap perempuan dan anak merupakan isu sosial yang masih perlu mendapatkan perhatian khusus, terutama di Kabupaten Gorontalo yang memiliki angka kasus tertinggi di Provinsi Gorontalo. Penelitian ini bertujuan untuk memprediksi tingkat kekerasan terhadap perempuan dan anak menggunakan metode Machine Learning dengan algoritma Nayve Bayes dan Regresi Linier Berganda. Data yang digunakan berasal dari Dinas Pemberdayaan Perempuan dan Perlindungan Anak Kabupaten Gorontalo, dengan variabel meliputi kekerasan fisik, seksual, penelantaran, dan psikis. Hasil penelitian menunjukkan bahwa algoritma Nayve Bayes menghasilkan RMSE sebesar 0. 174 untuk kasus perempuan dan 254 untuk kasus anak. Sementara itu, algoritma Regresi Linier Berganda menghasilkan nilai RMSE yang sangat kecil 000 untuk kedua kasus. Nilai tersebut terlihat sempurna, sehingga dilakukan pengujian ulang menggunakan Google Colab untuk memastikan keakuratannya. Hasil pengujian ulang menunjukkan konsistensi, yang menandakan bahwa model Regresi Linier memberikan hasil yang andal dan tidak mengalami overfitting. Dengan demikian, algoritma Regresi Linier Berganda dinilai lebih unggul dalam memprediksi tingkat kekerasan. Hasil penelitian ini diharapkan dapat membantu pemerintah dan lembaga terkait dalam mengambil langkah pencegahan serta tindakan yang lebih cepat, sehingga kasus kekerasan terhadap perempuan dan anak di Kabupaten Gorontalo dapat dicegah. Kata Kunci: Prediksi. Kekerasan. Perempuan dan Anak. Machine Learning. Nayve Bayes. Regresi Linier Berganda PENDAHULUAN Di Indonesia, kekerasan terhadap perempuan dan anak masih menjadi permasalahan sosial yang serius dan masih memerlukan perhatian khusus. Dari tahun ke tahun jumlah kasus kekerasan terus mengalami peningkatan . , yang menandakan bahwa penanganan terhadap masalah ini belum berjalan secara efektif. Adapun kekerasan yang sering terjadi umumnya terbagi dalam beberapa bentuk, seperti kekerasan fisik, psikis, seksual, eksploitasi dan lain sebagainya . Tingginya angka kekerasan ini disebabkan oleh berbagai faktor seperti psikologis yang terganggu, lingkungan keluarga, lingkungan sosial, kemiskinan, serta norma-norma budaya yang patriakis menjadi penyebab utama tingginya angkat kekerasan. Bentuk pelanggaran yang satu ini tidak hanya terjadi di wilayah perkotaan, kasus-kasus serupa juga banyak ditemukan di daerah-daerah kecil, termasuk di Kabupaten Gorontalo. https://journal. id/index. php/juik/index e-ISSN:2774-924004 Berdasarkan informasi yang tercatat dalam Sistem Informasi Online Perlindungan Perempuan dan Anak (SIMFONI PPA) pada tahun 2023. Kabupaten Gorontalo mencatat jumlah kasus kekerasan tertinggi di Provinsi Gorontalo, yaitu sebanyak 101 kasus. Angka ini lebih tinggi dibandingkan kabupaten atau kota lain di provinsi tersebut, seperti Kabupaten Bone Bolango dengan 83 kasus. Kabupaten Boalemo 69 kasus. Kabupaten Pohuwato 64 kasus. Kota Gorontalo 42 kasus. dan Kabupaten Gorontalo Utara menjadi wilayah dengan jumlah kasus paling sedikit, yakni sebanyak 28 kasus. Sementara itu data dari Dinas Pemberdayaan Perempuan dan Anak Kabupaten Gorontalo menunjukkan bahwa pada tahun 2024 dari bulan januari hingga bulan juni sudah tercatat sebanyak 27 kasus kekerasan yang terjadi di wilayah ini. Dengan kasus kekerasan yang terlapor yaitu kasus seksual, kasus fisik, kasus psikis, dan kasus penelantaran. Angka kelerasan yang terjadi diwilayah ini menunjukkan tingkat kekerasan yang mengkhawatirkan dan memerlukan perhatian yang mendalam. Untuk mengatasi hal tersebut diperlukan langkah-langkah pencegahan yang lebih efektif. Salah satu cara yang efektif untuk menangani masalah ini adalah dengan melakukan prediksi. Prediksi data sudah banyak digunakan dalam berbagai bidang, termasuk untuk memprediksi kasus kriminalitas seperti kekerasan . Untuk menghasilkan prediksi yang akurat dan dapat diandalkan, diperlukan metode yang mampu mengolah dan menganalisis data secara menyeluruh, sehingga langkah pencegahan bisa diambil sebelum hal buruk terjadi. Dalam hal ini, metode yang cukup andal yang dapat digunakan dalam melakukan prediksi adalah machine learning . Machine learning merupakan cabang dari kecerdasan buatan yang didefinisikan sebagai metode yang belajar dari pengalaman dan menyesuaikan diri dengan informasi baru. Dengan cara ini, machine learning dapat mengambil keputusan secara otomatis dan tepat. Teknologi ini mendukung manusia dalam proses pengambilan keputusan dengan menganalisis data, mengenali pola, dan memberikan rekomendasi yang akurat . Salah satu algoritma machine learning yang digunakan untuk memprediksi tingkat kekerasan pada penelitian ini yaitu algoritma nayve bayes, yang memiliki keunggulan pada modelnya yang sederhana, kecepatan dalam pemrosesan data, serta kemampuannya dalam mengolah data yang jumlahnya kecil atau tidak seimbang . Selain keunggulan tersebut. Naive Bayes juga dapat menentukan variabel mana yang paling berpengaruh dengan melihat peluang . Dengan menggunakan metode Nayve Bayes, akurasi informasi yang dihasilkan menjadi lebih tepat . Selain itu, penelitian ini juga menggunakan algoritma Regresi Linier Berganda yang sangat sesuai untuk digunaka, karena mampu melibatkan beberapa variabel dalam menganalisis tingkat kekerasan di Kabupaten Gorontalo. Dengan menggunakan hubungan antara variabel bebas (X) dan variabel tidak bebas (Y), regresi linier berganda memiliki kemampuan untuk memprediksi kondisi di masa yang akan datang . Pada penelitian sebelumnya menunjukkan bahwa Nayve Bayes dapat digunakan secara efektif dalam prediksi penerimaan karyawan, terutama dalam proses seleksi yang membutuhkan efisiensi dan akurasi tinggi, di mana hasil terbaik diperoleh pada pembagian data 90:10 dengan akurasi 97,14%. MSE 2,86. RMSE 16,90, dan RA 1,00 . Sementara itu penelitian . menunjukkan bahwa metode regresi linier berganda efektif dalam memprediksi nilai akhir mahasiswa berdasarkan 1 nilai tugas, 2 nilai praktikum, dan 1 nilai UTS. Dari 4 model yang diuji, model 3 yang menggunakan kombinasi ketiga jenis nilai tersebut memberikan hasil prediksi paling akurat dengan nilai RMSE terendah sebesar 1. Dengan demikian, ketiga komponen penilaian tersebut terbukti sangat berpengaruh terhadap kinerja akhir mahasiswa dalam mata kuliah Pemrograman Dasar. Dan penelitian . menggunakan regresi linier berganda untuk memprediksi jumlah penduduk di Jakarta Selatan berdasarkan data historis tahun 2010 hingga 2018. Dengan menggunakan dua variabel independen, yaitu jumlah penduduk laki-laki dan perempuan, model ini berhasil memperkirakan adanya peningkatan sebesar 195 jiwa pada tahun 2019, evaluasi model menggunakan RMSE dengan nilai 0,43 yang menunjukkan bahwa model memiliki tingkat akurasi yang baik. Berdasarkan penjabaran di atas algoritma Nayve Bayes dan Regresi Linier Berganda terbukti memiliki performa yang baik dalam menghasilkan prediksi. Maka dari itu, penelitian ini menerapkan kedua algoritma machine learning tersebut untuk memprediksi tingkat kekerasan terhadap perempuan dan anak di Kabupaten Gorontalo. https://journal. id/index. php/juik/index METODE PENELITIAN Objek Penelitian Objek penelitian ini berfokus pada data perbulan kasus kekerasan terhadap perempuan dan anak yang tercatat dari Januari 2018 hingga Desember 2024. Dengan lokasi penelitian yaitu Kantor Dinas Pemberdayaan Perempuan dan Anak (DPP-PA) Kabupaten Gorontalo. Pengumpulan Data Pada tahap pengumpulan data, peneliti menggunakan metode observasi dan wawancara. Observasi dilakukan dengan mengunjungi langsung Kantor Dinas Pemberdayaan Perempuan dan Anak (DPP-PA) Kabupaten Gorontalo. Sementara itu, wawancara dilakukan dengan pihak terkait di bidang penanganan kasus kekerasan untuk mendapatkan informasi yang relevan dengan kebutuhan penelitian. Tahapan Penelitian Gambar 1 Tahapan Penelitian HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan dalam penelitian ini merupakan data bulanan yang diperoleh dari Dinas Pemberdayaan Perempuan dan Anak Kabupaten Gorontalo. Data tersebut mencatat kejadian kekerasan terhadap perempuan dan anak dari Januari 2018 hingga Desamber 2024. https://journal. id/index. php/juik/index Preprocessing Pada tahap preprocessing, data mentah yang sudah dikumpulkan akan disiapkan menjadi data yang bisa digunakan dengan baik pada saat pengolahan data. Salah satu langkah yang dilakukan adalah mengubah kolom tahun dan bulan menjadi format tanggal yang mencakup keduanya. Selain itu, beberapa kolom atribut yang tidak relevan untuk prediksi, seperti Kasus Penelantaran Anak. Kasus Psikis Anak. Kasus Penelantaran Perempuan, dan Kasus Psikis Perempuan, dihapus karena memiliki frekuensi sangat rendah dan banyak berisi angka nol yang dapat mengganggu model prediksi. Dengan menghapus kolom-kolom tersebut, diharapkan kemampuan prediksi dapat berjalan dengan baik. Tabel 1. Data Setelah Preprocessing Training dan Testing Setelah proses preprocessing, langkah berikutnya adalah membagi dataset menjadi dua bagian yaitu data training dan data testing. Data training adalah kumpulan data yang digunakan untuk melatih model agar dapat mengenali pola. Sementara itu, data testing digunakan untuk menguji sejauh mana kemampuan model dalam menghasilkan prediksi yang akurat setelah dilatih. Dalam penelitian ini, data training yang digunakan 80% dan data testing sebanyak 20% dari 84 baris data. Hasil Evaluasi Menggunakan RapidMiner . Algoritma Nayve Bayes Setelah proses preprocessing, langkah berikutnya adalah membagi dataset menjadi dua bagian yaitu data training dan data testing. Data training adalah kumpulan data yang digunakan untuk melatih model agar dapat mengenali pola. Sementara itu, data testing digunakan untuk menguji sejauh mana kemampuan model dalam menghasilkan prediksi yang akurat setelah dilatih. Dalam penelitian ini, data training yang digunakan 80% dan data testing sebanyak 20% dari 84 baris data. Tabel 2. Hasil Cross Validation Naive Bayes XValidation Kasus Perempuan Kasus Anak https://journal. id/index. php/juik/index Hasil pengujian menggunakan X-Validation menunjukkan bahwa untuk atribut kasus perempuan, nilai RMSE terbaik diperoleh pada parameter ke-6, dengan hasil RMSE sebesar 0. Sementara itu, untuk atribut kasus anak, hasil cross-validation terbaik ditemukan pada parameter ke-3, dengan nilai RMSE 0. Ini menunjukkan bahwa pada parameter ini, model memberikan prediksi yang lebih akurat dengan kesalahan yang lebih kecil. Algoritma Regresi Linier Berganda Selanjutnya hasil yang diperoleh dari proses cross-validation menggunakan algoritma Regresi Linier Berganda dapat dilihat pada tabel berikut. Tabel 3. Hasil Cross Validation Regresi Kasus Perempuan Kasus Anak Tabel di atas menunjukkan bahwa hasil evaluasi dari kasus perempuan dan anak mendapatkan hasil RMSE yang sangat kecil yaitu 0. Hasil Evaluasi Evaluasi Menggunakan Colab . Algoritma Nayve Bayes Saat dilakukan pengujian menggunakan algoritma Nayve Bayes di Google Colab, diperoleh nilai RMSE sebagai berikut: Tabel 4. Hasil Evaluasi Naive Bayes di Colab Kasus Perempuan Kasus Anak Berdasarkan tabel 4, hasil evaluasi model Nayve Bayes di Google Colab menunjukkan bahwa model memiliki tingkat akurasi yang berbeda untuk dua jenis kasus. Untuk kasus perempuan, model mencapai skor evaluasi sebesar 0. 766, sedangkan untuk kasus anak, skornya lebih rendah, yaitu 0. Algoritma Regresi Linier Berganda Hasil evaluasi algoritma Regresi Linier Berganda setelah dilakukan pengujian menggunakan Colab disajikan pada tabel berikut. Tabel 5. Hasil Evaluasi Regresi di Colab Kasus Perempuan Kasus Anak Berdasarkan tabel hasil evaluasi model Regresi di Google Colab menunjukkan nilai RMSE sebesar 0. untuk kasus perempuan dan kasus anak. Hasil ini mengindikasikan bahwa model memiliki tingkat kesalahan yang sangat rendah. Hasil Prediksi Pada penelitian ini, hasil prediksi diperoleh dengan menggunakan RapidMiner sebagai tools utama dalam pengolahan data. Selain itu. Google Colab digunakan sebagai tools tambahan untuk memeriksa apakah hasil prediksi yang diperoleh dari RapidMiner tetap konsisten. Berikut ini disajikan tabel yang menunjukkan hasil prediksi kasus perempuan yang diperoleh dari tools tersebut. https://journal. id/index. php/juik/index Tabel 6. Hasil Prediksi Kasus Perempuan Algoritma Nayve Bayes Regresi Linier Berganda Colab RapidMiner Tabel 6 di atas menunjukkan bahwa model Naive Bayes di Google Colab menghasilkan nilai RMSE 0. sedangkan di RapidMiner. RMSE-nya lebih rendah, yaitu 0. Ini berarti model Naive Bayes di RapidMiner lebih akurat dibandingkan dengan yang dihasilkan di Google Colab. Sementara itu, model Regresi Linier menunjukkan nilai RMSE yang sangat rendah di kedua tools. Di Google Colab. RMSE untuk regresi linier 000, begitu juga di RapidMiner, yang menghasilkan nilai RMSE 0. Hal ini menunjukkan bahwa model regresi linier sangat akurat di kedua tools. Berikut adalah diagram mengenai gambaran perbandingan kedua model prediksi. Kasus Perempuan Nayve Bayes Regresi Linier Berganda 0,766 0,174 0,000 Colab 0,000 RapidMiner Gambar 2. Diagram Hasil Prediksi Kasus Perempuan Untuk mendapatkan gambaran lebih jelas mengenai bagaimana perubahan tingkat kekerasan terhadap perempuan dalam enam bulan ke depan, hasil prediksi divisualisasikan dalam bentuk grafik berikut ini. Gambar 3. Grafik Hasil Prediksi Ke Depan Kasus Perempuan Menggunakan Naive Bayes Grafik untuk kasus perempuan di atas menunjukkan bahwa selama enam bulan ke depan, kelas prediksi tetap berada pada nilai 0, yang berarti model memperkirakan bahwa kasus kekerasan terhadap perempuan tidak mengalami peningkatan. https://journal. id/index. php/juik/index Gambar 4. Grafik Hasil Prediksi Ke Depan Kasus Perempuan Menggunakan Regresi Linier Kemudian hasil prediksi menggunakan algoritma Regresi Linier Berganda menunjukkan bahwa jumlah kasus kekerasan terhadap perempuan diperkirakan tetap nol dari Januari hingga Maret 2025. Namun, mulai April 2025, kasus mulai meningkat, mencapai puncaknya pada Mei 2025 dengan empat kasus, sebelum kembali menurun pada Juni 2025. Selanjutnya adalah tabel hasil prediksi kasus anak, yang membandingkan kinerja model Naive Bayes dan Regresi Linear di Google Colab dan RapidMiner. Tabel 7. Hasil Prediksi Kasus Anak Algoritma Nayve Bayes Regresi Linier Berganda Colab RapidMiner Tabel di atas menunjukkan hasil prediksi kasus anak menggunakan model Naive Bayes dan Regresi Linier Berganda di Google Colab dan RapidMiner. Naive Bayes di Google Colab memiliki nilai RMSE 0. sedangkan di RapidMiner lebih rendah, yaitu 0. 254, yang menunjukkan prediksi lebih akurat di RapidMiner. Untuk Regresi Linier Berganda, baik di Google Colab maupun RapidMiner, nilai RMSE yang dihasilkan adalah 000, hal ini menandakan hasil yang sangat akurat di kedua tools. Berikut adalah diagram hasil prediksi kasus anak menggunakan algoritma Naive Bayes dan Regresi Linier Berganda. Kasus Anak Nayve Bayes Regresi Linier Berganda 0,342 0,254 0,000 Colab 0,000 RapidMiner Gambar 5. Diagram Hasil Prediksi Kasus Anak Berdasarkan hasil prediksi yang telah dijelaskan sebelumnya, algoritma Naive Bayes dan Regresi Linier diuji menggunakan dua tools, yaitu RapidMiner dan Google Colab. Penggunaan dua tools ini bertujuan untuk memastikan hasil prediksi benar-benar akurat dan konsisten. Pengujian ulang di Google Colab dilakukan karena hasil Regresi Linier di RapidMiner menunjukkan nilai RMSE sebesar 0. yang terkesan terlalu sempurna. https://journal. id/index. php/juik/index Untuk memastikan hasil tersebut valid dan bukan akibat overfitting atau kesalahan sistem, dilakukan pengujian kembali di Colab. Hasilnya tetap konsisten, menunjukkan bahwa model memang akurat dan stabil. Sementara itu. Naive Bayes menunjukkan performa lebih baik di RapidMiner dibandingkan di Colab. Hal ini menunjukkan bahwa hasil prediksi dapat bervariasi tergantung pada tools yang digunakan, meskipun secara umum Regresi Linier menunjukkan performa yang lebih baik di kedua tools. Untuk melihat lebih jelas bagaimana perubahan tingkat kekerasan terhadap anak dalam enam bulan ke depan, hasil prediksi ditampilkan dalam grafik berikut Gambar 6. Grafik Hasil Prediksi Ke Depan Kasus Anak Menggunakan Naive Bayes Grafik untuk kasus anak di atas menunjukkan bahwa selama enam bulan ke depan, kelas prediksi tetap berada pada nilai 0, yang berarti model memperkirakan bahwa tingkat kekerasan terhadap anak tidak mengalami Gambar 7. Grafik Hasil Prediksi Ke Depan Kasus Anak Menggunakan Regresi Linier Sementara itu grafik di atas, menunjukkan jumlah kasus anak dalam enam bulan ke depan yang diprediksi mengalami naik turun. Pada Januari 2025, kasus diperkirakan sebanyak 4 kasus, lalu menurun menjadi 3 kasus pada Februari, kemudian jumlah kasus kembali meningkat menjadi 5 kasus di Maret, namun kembali turun ke 4 kasus pada April. KESIMPULAN Berdasarkan penelitian yang telah dilakukan, hasil prediksi metode Machine Learning menggunakan algoritma Nayve Bayes dan Regresi Linier Berganda untuk memprediksi tingkat kekerasan di Kabupaten Gorontalo, ditemukan bahwa algoritma Regresi Linier Berganda menghasilkan performa prediksi yang lebih baik dibandingkan dengan Nayve Bayes. Hal ini tercermin dari nilai Root Mean Square Error (RMSE) yang sangat kecil, yang telah diuji menggunakan tools RapidMiner dan Google Colab. Regresi Linier Berganda menunjukkan nilai Root Mean Square Error (RMSE) yang sangat kecil, yaitu 0. 000, baik untuk kasus https://journal. id/index. php/juik/index perempuan maupun kasus anak. Sementara itu. Nayve Bayes menghasilkan nilai RMSE sebesar 0. 174 untuk kasus perempuan dan 0. 254 untuk kasus anak. Hasil ini menunjukkan bahwa performa prediksi yang dihasilkan Nayve Bayes cukup baik namun masih kurang akurat dibandingkan dengan Regresi Linier Berganda. Dengan demikian. Regresi Linier Berganda lebih efektif dan dapat diandalkan untuk memprediksi tingkat kekerasan pada perempuan dan anak di Kabupaten Gorontalo. DAFTAR PUSTAKA