JISKA: Jurnal Sistem Informasi Dan Informatika Vol 3 No 2 . : Juli 2025 Hal. http://jurnal. id/index. php/jiska Deteksi Serangan Siber Menggunakan Machine Learning: Studi Pada Sistem Informasi Akademik Cantika Chandraa. Dio Prima Mulyab. Faradikac Program Studi Sistem Informasi. Universitas Dharma Andalas, cantikachandra27@gmail. Abstract Cybersecurity is a critical issue in academic information systems, which store sensitive data such as student grades, identities, and administrative documents. Attacks such as SQL injection, brute force login attempts, and unauthorized access can lead to significant losses and operational disruptions. This study aims to develop a cyberattack detection system using machine learning algorithms capable of identifying abnormal . activities within the system. The algorithms applied are Decision Tree and Random Forest due to their strengths in classification and result interpretation. The research was conducted by collecting user activity log data, performing data cleaning, labeling the data, and training machine learning Evaluation results show that Random Forest outperforms Decision Tree with an accuracy of 92% in detecting attacks, compared to 87% achieved by Decision Tree. The implementation of this system can assist campus IT departments in improving the speed and effectiveness of cyber threat prevention and response. Keywords: Cybersecurity. Academic Information System. Machine Learning. Attack Detection. Random Forest Abstrak Keamanan siber menjadi isu krusial dalam sistem informasi akademik yang menyimpan data sensitif seperti nilai, identitas mahasiswa, dan dokumen administrasi. Serangan seperti SQL injection, brute force login, hingga akses ilegal dapat menyebabkan kerugian besar dan gangguan operasional. Penelitian ini bertujuan mengembangkan sistem deteksi serangan siber menggunakan algoritma machine learning yang mampu mengenali aktivitas tidak normal . dalam sistem. Algoritma yang digunakan adalah Decision Tree dan Random Forest karena kemampuannya dalam klasifikasi dan interpretasi hasil. Penelitian dilakukan dengan mengumpulkan data log aktivitas pengguna, membersihkannya, melabeli data, kemudian melatih model ML. Hasil evaluasi menunjukkan bahwa Random Forest lebih unggul dengan akurasi 92% dalam mendeteksi serangan dibandingkan Decision Tree yang mencapai 87%. Penerapan sistem ini mampu membantu pihak IT kampus melakukan pencegahan dan respons lebih cepat terhadap ancaman siber. Kata kunci: Keamanan Siber. Sistem Informasi Akademik. Machine Learning. Deteksi Serangan. Random Forest This work is licensed under Creative Commons Attribution License 4. 0 CC-BY International license PENDAHULUAN Latar Belakang Perkembangan teknologi informasi yang pesat telah mendorong berbagai institusi pendidikan untuk mengadopsi sistem informasi akademik berbasis digital. Sistem ini tidak hanya mempermudah proses administrasi dan manajemen data, tetapi juga menjadi tulang punggung dalam penyelenggaraan layanan akademik, seperti pengisian KRS, penilaian, absensi, hingga pengelolaan data pribadi mahasiswa dan dosen. Dengan semakin meningkatnya ketergantungan terhadap sistem ini, aspek keamanan data . menjadi sangat penting untuk diperhatikan. Salah satu tantangan utama dalam pengelolaan sistem informasi akademik adalah ancaman serangan siber, seperti SQL injection, brute force login, phishing, dan akses ilegal oleh pihak yang tidak berwenang. Seranganserangan ini dapat mengakibatkan kebocoran data, manipulasi informasi, bahkan kerusakan sistem secara Sayangnya, banyak institusi pendidikan belum memiliki sistem deteksi dini yang handal untuk mengenali dan merespon serangan secara real-time. Untuk mengatasi hal tersebut, teknologi Machine Learning (ML) menawarkan solusi inovatif. Dengan kemampuannya dalam menganalisis data dalam jumlah besar dan mengenali pola yang tidak lazim . , machine learning dapat digunakan sebagai alat bantu dalam mendeteksi aktivitas mencurigakan yang mengindikasikan potensi serangan siber. Model seperti Decision Tree dan Random Forest terbukti efektif dalam klasifikasi data dan mampu membedakan antara aktivitas normal dan aktivitas anomali secara otomatis. Melalui penelitian ini, akan dikembangkan model deteksi serangan siber menggunakan machine learning yang diterapkan pada data log aktivitas sistem informasi akademik. Harapannya, sistem ini dapat membantu pihak pengelola IT kampus dalam meningkatkan kewaspadaan terhadap ancaman siber dan mempercepat respons terhadap insiden keamanan, sehingga integritas dan kerahasiaan data akademik tetap terjaga. Jurnal Sistem Informasi Dan InformatikaAe JISKA Vol 3 No 2 . : Juli 2025 JISKA: Jurnal Sistem Informasi Dan Informatika Vol 3 No 2 . : Juli 2025 Hal. http://jurnal. id/index. php/jiska Perumusan Masalah Berdasarkan latar belakang diatas, maka perumusan masalah dalam penelitian ini yaitu: AuBagaimana cara mendeteksi serangan siber melalui data log aktivitas sistem informasi akademik? Au Tujuan Penelitian Tujuan dari penelitian ini adalah untuk merancang dan menguji sistem deteksi serangan siber berbasis machine learning agar mampu mendeteksi ancaman secara dini dan otomatis, sehingga sistem akademik dapat berjalan lebih aman dan stabil. METODE PENELITIAN Jenis dan Pendekatan Penelitian Penelitian ini merupakan penelitian kuantitatif dengan pendekatan eksperimental. Fokus utama adalah menerapkan dan mengevaluasi algoritma machine learning dalam mendeteksi serangan siber berbasis data log pada sistem informasi akademik. Tujuan penelitian ini adalah untuk mengetahui efektivitas algoritma dalam mendeteksi anomali atau aktivitas mencurigakan yang mengindikasikan serangan siber. Objek Penelitian Objek dalam penelitian ini adalah log aktivitas dari sistem informasi akademik (SIAKAD) yang mencatat interaksi pengguna, login, pengubahan data, pengaksesan modul, dan aktivitas administrasi lainnya. Sumber Data dan Teknik Pengumpulan Data Data yang digunakan merupakan data sekunder berupa file log yang diambil dari sistem informasi Data log tersebut mencakup informasi seperti alamat IP, waktu akses, user-agent, jenis permintaan . , status respon, dan halaman yang diakses. Teknik pengumpulan data dilakukan melalui: - Ekstraksi log dari sistem informasi akademik . engan izin pihak pengelola siste. - Labeling data: serangan . dan normal . , menggunakan referensi dari database serangan seperti CICIDS. UNSW-NB15, dan pengalaman admin sistem. Tahapan Penelitian Penelitian ini dilakukan melalui beberapa tahap sebagai berikut: Preprocessing Data - Pembersihan data . andling missing value. - Normalisasi dan encoding fitur numerik dan kategorikal. - Pembagian dataset menjadi data latih . dan data uji . dengan perbandingan 80:20. Pemilihan Algoritma - Algoritma machine learning yang digunakan antara lain: A Decision Tree A Random Forest A Support Vector Machine (SVM) A Logistic Regression - Pemilihan berdasarkan keandalan masing-masing algoritma dalam mendeteksi serangan berbasis log Pelatihan Model - Melatih model menggunakan data latih. - Menggunakan teknik cross-validation untuk menghindari overfitting. Evaluasi Model - Evaluasi dilakukan pada data uji menggunakan metrik: A Accuracy A Precision A Recall A F1-Score A ROC-AUC Jurnal Sistem Informasi Dan InformatikaAe JISKA Vol 3 No 2 . : Juli 2025 JISKA: Jurnal Sistem Informasi Dan Informatika Vol 3 No 2 . : Juli 2025 Hal. http://jurnal. id/index. php/jiska Alat dan Bahan Penelitian Penelitian dilakukan menggunakan perangkat lunak dan alat bantu sebagai berikut: - Bahasa Pemrograman: Python - Library: Scikit-learn. Pandas. NumPy. Matplotlib. Seaborn - Tools: Jupyter Notebook. Wireshark . ntuk analisis paket jika diperluka. , dan log server Skema Penelitian Berikut skema proses penelitian: Akuisisi Data Log Preprocessing dan Labeling Pemodelan Machine Learning Evaluasi dan Interpretasi Kesimpulan dan Rekomendasi HASIL DAN PEMBAHASAN Penelitian ini dilakukan dengan mengumpulkan data log aktivitas pengguna dari sistem informasi akademik, kemudian dilakukan tahapan preprocessing berupa pembersihan data, normalisasi, dan pelabelan data menjadi dua kelas: normal dan serangan. Dataset yang digunakan terdiri dari 3000 record, dengan proporsi 80% data latih dan 20% data uji. Dua algoritma machine learning yang digunakan dalam eksperimen adalah Decision Tree dan Random Forest. Masing-masing algoritma dievaluasi menggunakan metrik akurasi, presisi, recall, dan F1-score. Berikut adalah hasil pengujian: Algoritma Decision Tree Random Forest Akurasi Presisi Recall F1-Score Hasil menunjukkan bahwa Random Forest lebih unggul dalam mendeteksi serangan dibandingkan Decision Tree. Hal ini disebabkan oleh mekanisme ensemble-nya yang mampu mengurangi overfitting dan menangani data yang kompleks secara lebih efektif. Selain itu, model Random Forest juga memberikan hasil klasifikasi yang lebih stabil dalam pengujian berulang. Temuan lainnya adalah bahwa aktivitas login yang tidak biasa, percobaan akses ke endpoint sensitif, serta query database abnormal merupakan pola umum dalam data serangan. Dengan memanfaatkan polapola ini, model dapat memberikan peringatan dini terhadap potensi serangan secara otomatis. Adapun Model Ensemble Menggabungkan RF. SVM, dan LSTM dengan mayoritas voting meningkatkan akurasi menjadi 96 %, mengurangi false positive secara signifikan Ai sesuai temuan riset LSTM ML bahwa ensemble memberikan kestabilan performa dan meringkas kesalahan. Dan Saran Pengembangan: