Joined Journal (Journal of Informatics Educatio. Perancangan Sistem Rekomendasi Pembelajaran Berbasis Data untuk Mahasiswa Berdasarkan Kinerja Akademik menggunakan Machine Learning Kasmawaru*1. Rachmat2. Ahmad3. Herlinda4 Teknik Informatika. Universitas Dipa Makassar13 Teknik Informatika. Universitas Pejuang Republik Indonesia2 Sistem Informasi. Universitas Dipa Makassar4 Info Articles Abstrak ___________________ Keywords: Algoritma machine Kinerja akademik siswa. KNearest Neighbors (KNN). Support Vector Machine (SVM). Budaya Aplikabilitas lintas ____________________ ____________________________________________________________ Penelitian ini bertujuan untuk merancang sistem rekomendasi pembelajaran berbasis data yang dapat memberikan rekomendasi materi pembelajaran yang relevan bagi siswa berdasarkan kinerja akademik mereka menggunakan algoritma machine learning. Sistem rekomendasi ini bergantung pada data akademik seperti nilai ujian, kehadiran, partisipasi kelas, dan interaksi dengan materi pembelajaran untuk memberikan saran yang disesuaikan dengan kebutuhan siswa. Selain itu, penelitian ini mengadopsi perspektif budaya transnasional, mempertimbangkan perbedaan budaya dan kurikulum di berbagai wilayah untuk memastikan rekomendasi tetap kontekstual bagi pembelajar dari latar belakang yang Dalam penelitian ini, berbagai model machine learning, seperti KNearest Neighbors (KNN). Support Vector Machine (SVM), dan Neural Networks, dievaluasi untuk menentukan efektivitasnya dalam menganalisis kinerja akademik dan memberikan rekomendasi yang sesuai. Hasil evaluasi menunjukkan bahwa model Neural Networks memberikan akurasi terbaik, diikuti oleh Decision Tree dan SVM. Sistem rekomendasi yang dikembangkan ini dapat membantu pendidik dalam menyampaikan materi yang lebih sesuai berdasarkan kebutuhan dan kekuatan individu siswa, yang diharapkan dapat meningkatkan kualitas pembelajaran dan hasil akademik. Abstract ____________________________________________________________ This research aims to design a data-driven learning recommendation system that can provide relevant learning material recommendations for students based on their academic performance using machine learning This recommendation system relies on academic data such as exam scores, attendance, class participation, and interactions with learning materials to provide suggestions tailored to the students' needs. In this study, various machine learning models, such as K-Nearest Neighbors (KNN). Support Vector Machine (SVM), and Neural Networks, are evaluated to determine their effectiveness in analyzing academic performance and providing appropriate recommendations. The evaluation Joined Journal (Journal of Informatics Educatio. nC Alamat Korespondensi: Universita Dipa Makassar E-mail: kasmawaru@undipa. results show that the Neural Networks model provides the best accuracy, followed by Decision Tree and SVM. The developed recommendation system can assist educators in delivering more suitable material based on individual students' needs and strengths, which is expected to improve the quality of learning and academic outcomes. p-ISSN 2621-9484 e-ISSN 2620-8415 PENDAHULUAN Perkembangan teknologi informasi dan komunikasi (TIK) dalam pendidikan telah membawa perubahan signifikan dalam bagaimana manajemen pembelajaran dilakukan. Salah satu inovasi yang berkembang adalah penerapan sistem berbasis data, yang memungkinkan personalisasi pengalaman belajar bagi siswa. Dengan memanfaatkan data akademik, pendidik dapat lebih mudah memahami kekuatan dan kelemahan siswa, serta memberikan materi pembelajaran yang lebih relevan dan sesuai dengan kebutuhan (Wang & Liu, 2. Sistem rekomendasi berbasis data, yang umumnya digunakan di platform digital seperti e-commerce dan media sosial, kini juga diterapkan dalam konteks pendidikan. Sistem rekomendasi ini menggunakan algoritma machine learning untuk menganalisis kinerja akademik siswa dan memberikan rekomendasi materi yang paling sesuai. (Liu & Yang, 2. Hal ini memungkinkan setiap siswa untuk menerima pengalaman belajar yang lebih individual dan adaptif, berdasarkan data kinerja akademik yang tercatat. Untuk memastikan aplikabilitas lintas konteks, penelitian ini mengadopsi perspektif budaya transnasional yang memperhitungkan norma budaya lintas batas, perbedaan bahasa, dan variasi kurikulum agar rekomendasi tetap relevan bagi populasi siswa yang (Peng & Zhang, 2. Namun, tantangan besar dalam menerapkan sistem rekomendasi dalam pendidikan adalah memilih model machine learning yang paling efektif untuk menganalisis data kinerja akademik siswa. (Garcya & Martynez, 2. Kinerja siswa dapat dipengaruhi oleh berbagai faktor, termasuk nilai ujian, kehadiran, partisipasi kelas, dan interaksi dengan materi pembelajaran. Oleh karena itu, penting untuk memahami model machine learning mana yang dapat memproses data ini secara optimal untuk menghasilkan rekomendasi yang akurat. (Bansal & Bhagat, 2. Penelitian tentang sistem rekomendasi berbasis data untuk pendidikan telah banyak dilakukan dalam beberapa tahun terakhir. Beberapa penelitian menunjukkan bahwa machine learning dapat menjadi alat yang sangat efektif dalam menganalisis kinerja siswa dan memberikan rekomendasi materi pembelajaran yang sesuai. (Gama & Rodrigues, 2. Algoritma seperti k-nearest neighbors (KNN), decision trees, dan support vector machines (SVM) telah digunakan dalam berbagai studi untuk memprediksi kinerja akademik siswa berdasarkan data yang ada. Namun, meskipun ada berbagai algoritma yang digunakan, belum ada konsensus yang jelas mengenai model mana yang paling efektif digunakan dalam pendidikan. (Vysquez & Alonso, 2. Joined Journal (Journal of Informatics Educatio. Sebagai contoh, beberapa penelitian menunjukkan bahwa k-nearest neighbors (KNN) dapat memberikan rekomendasi yang baik berdasarkan kesamaan antar siswa, sementara random forest dan gradient boosting machines (GBM) menawarkan prediksi yang lebih akurat dengan menggabungkan berbagai fitur dari data kinerja siswa. (Chen & Tsai, 2. Di sisi lain, metode berbasis neural network, seperti deep learning, semakin digunakan dalam penelitian pendidikan karena kemampuannya untuk menangani dataset yang sangat besar dan kompleks serta mengenali pola tersembunyi yang mungkin tidak terdeteksi oleh model yang lebih sederhana. Namun, penggunaan model ini dalam sistem rekomendasi untuk pendidikan masih memerlukan banyak penelitian lebih lanjut, terutama dalam hal pemilihan fitur yang relevan dan evaluasi efektivitas rekomendasi yang diberikan oleh sistem ini. (Myndez & Garcya, 2. Penelitian ini memberikan kontribusi yang signifikan dalam bidang pendidikan dengan mengidentifikasi model machine learning yang paling efektif untuk menganalisis kinerja akademik siswa dan memberikan rekomendasi materi pembelajaran yang relevan. Salah satu kontribusinya adalah eksplorasi berbagai model machine learning yang dapat digunakan untuk menganalisis data kinerja akademik siswa, serta menentukan model yang menghasilkan prediksi dan rekomendasi yang paling akurat. (Tariq & Aslam, 2. Selain itu, penelitian ini berfokus pada pengembangan sistem rekomendasi berbasis data yang dapat membantu pendidik dalam menyampaikan materi pembelajaran yang lebih terarah dan disesuaikan dengan kebutuhan siswa. (Zhou & Zhang, 2. Sistem ini mengintegrasikan teknik machine learning yang optimal untuk berbagai jenis data Akhirnya, penelitian ini akan mengevaluasi efektivitas sistem rekomendasi yang diusulkan dengan melakukan uji coba di berbagai konteks pendidikan untuk mengukur dampaknya dalam meningkatkan kualitas pembelajaran dan hasil akademik (Baker & Inventado, 2. METODOLOGI 1 Pendekatan Penelitian Penelitian ini menggunakan pendekatan kuantitatif eksperimen yang memanfaatkan analitik pembelajaran berbasis data. Pendekatan ini dipilih karena dapat menggambarkan hubungan antara variabel kinerja akademik siswa dan efektivitas rekomendasi materi pembelajaran melalui analisis data dan algoritma machine learning. Untuk memastikan validitas lintas konteks, penelitian ini mengadopsi perspektif budaya transnasional yang memperhitungkan norma budaya lintas batas, keberagaman bahasa, dan perbedaan kurikulum agar interpretasi model dan materi yang direkomendasikan tetap sesuai di berbagai negara dan institusi. 2 Sumber Data dan Jenisnya Data penelitian diperoleh dari Sistem Manajemen Pembelajaran (LMS) dan database akademik sekolah. 3 Tahapan Penelitian Proses penelitian dilakukan melalui tujuh tahapan utama sebagai berikut: Joined Journal (Journal of Informatics Educatio. Pengumpulan Data Tahap ini bertujuan untuk memperoleh dataset yang lengkap dan representatif mengenai kinerja akademik siswa. Data dikumpulkan melalui LMS, sistem informasi akademik, dan survei pendukung jika diperlukan. Semua data akan disimpan dalam format terstruktur (CSV/SQL databas. untuk memudahkan analisis. Praktik Pengolahan Data Data yang diperoleh sering mengandung noise atau informasi yang tidak relevan. Oleh karena itu, proses berikut dilakukan: Pembersihan data: Menghapus duplikat dan menangani nilai yang hilang. Transformasi data: Mengonversi format nilai ke dalam skala numerik yang Normalisasi: Menyelaraskan skala variabel agar tidak ada fitur tertentu yang Pengkodean kategori: Mengonversi variabel non-numerik menjadi bentuk numerik menggunakan one-hot encoding atau label encoding. Pemilihan Fitur Pemilihan fitur dilakukan untuk mengidentifikasi variabel yang paling mempengaruhi hasil pembelajaran siswa. Teknik seperti Recursive Feature Elimination (RFE) dan Principal Component Analysis (PCA) digunakan untuk mengurangi dimensi data tanpa kehilangan informasi penting. Pemilihan Model Machine Learning Beberapa algoritma machine learning diuji untuk menemukan model yang memberikan performa terbaik, antara lain: K-Nearest Neighbors (KNN) untuk mengukur kesamaan pola antar siswa. Support Vector Machine (SVM) untuk mengklasifikasikan hasil pembelajaran. Random Forest untuk menangani data yang kompleks dan non-linear. Artificial Neural Network (ANN) untuk mendeteksi hubungan non-linear dan menghasilkan rekomendasi yang adaptif. Setiap model akan dilatih menggunakan data pelatihan dan diuji melalui teknik crossvalidation untuk memastikan hasil yang stabil. Evaluasi Model Tahap ini mengevaluasi performa setiap model menggunakan metrik seperti: Akurasi . eakuratan prediks. Precision. Recall, dan F1-Score untuk menilai keseimbangan prediksi. Mean Squared Error (MSE) jika model berbasis regresi. Joined Journal (Journal of Informatics Educatio. Alur Penelitian Alur penelitian secara garis besar terdiri dari: Pengumpulan data akademik siswa. Pengolahan dan pembersihan data. Pemilihan fitur yang relevan. Pelatihan dan evaluasi model machine learning. Implementasi model ke dalam sistem rekomendasi. Uji coba sistem dan analisis hasil. 2 Pengolahan Data Proses pengolahan data mencakup beberapa langkah: Penanganan Nilai yang Hilang: Jika ada data yang hilang, dilakukan imputasi atau penghapusan data yang tidak lengkap. Normalisasi Data: Nilai ujian, kehadiran, dan partisipasi dinormalisasi untuk memastikan bahwa mereka berada dalam rentang yang sama. Kategorisasi Data: Kinerja akademik dikategorikan ke dalam beberapa kelas: "Sangat Baik", "Baik", "Cukup", dan "Buruk". Tabel 1. Hasil Pengolahan Data (Normalisasi Nilai ke Rentang 0-. Siswa Nilai Ujian 1 (Nor. Nilai Ujian 2 (Nor. Kehadiran (Nor. S10 Partisipasi (Nor. Usia (Nor. Jenis Kelamin Kinerja Akademik (Targe. Baik Cukup Sangat Baik Buruk Baik Buruk Sangat Baik Cukup Baik Buruk 3 Pembagian Data Data dibagi menjadi dua set: Set Pelatihan: 70% dari data akan digunakan untuk melatih model. Set Uji: 30% dari data akan digunakan untuk menguji performa model. 4 Aplikasi Model Machine Learning Beberapa model machine learning akan diterapkan pada data untuk menganalisis kinerja akademik siswa. Berikut adalah contoh penerapan model: Regresi Linear: Digunakan untuk memprediksi nilai kontinu dari kinerja Joined Journal (Journal of Informatics Educatio. Decision Tree: Digunakan untuk klasifikasi berdasarkan berbagai fitur . ilai ujian, kehadiran, partisipas. SVM: Digunakan untuk klasifikasi dengan margin maksimum antara kelas. Neural Networks: Digunakan untuk menangkap pola yang lebih kompleks dalam HASIL DAN PEMBAHASAN 1 Data Uji Data yang digunakan dalam penelitian ini adalah data kinerja akademik siswa, yang mencakup nilai ujian, kehadiran, partisipasi kelas, dan interaksi dengan materi pembelajaran yang diperoleh melalui platform pembelajaran digital. Data ini dikumpulkan dari Sistem Manajemen Pembelajaran (LMS) yang digunakan oleh institusi pendidikan selama satu semester. Dataset ini terdiri dari informasi tentang lebih dari 500 siswa dengan 10 fitur utama, yang mencakup: Nilai Ujian: Rata-rata nilai ujian yang diambil oleh siswa dalam berbagai mata Kehadiran: Persentase kehadiran siswa dalam pertemuan kelas. Tugas yang Diselesaikan: Jumlah dan kualitas tugas yang diselesaikan oleh Interaksi dengan Materi Pembelajaran: Waktu yang dihabiskan siswa untuk belajar melalui platform digital, termasuk kuis, video, dan materi lainnya. Waktu Belajar: Durasi waktu yang dihabiskan siswa mengakses materi pembelajaran atau latihan. Partisipasi dalam Diskusi: Jumlah komentar atau kontribusi yang dibuat siswa dalam forum kelas atau sesi diskusi. Indeks Kemampuan Siswa: Indeks yang dihitung berdasarkan kombinasi nilai ujian, kehadiran, dan tugas yang diselesaikan. Data ini telah diproses sebelumnya untuk menangani masalah data yang hilang dan dinormalisasi sehingga nilai fitur dapat dibandingkan secara setara di seluruh fitur. Tabel 2. Data Uji Siswa S10 Nilai Ujian 1 Nilai Ujian 2 Kehadiran (%) Partisipasi Kelas (%) Usia Jenis Kelamin Kinerja Akademik (Targe. Baik Cukup Sangat Baik Buruk Baik Buruk Sangat Baik Cukup Baik Buruk Joined Journal (Journal of Informatics Educatio. Jika Kinerja Akademik dikategorikan sebagai "Baik", "Cukup", "Buruk", atau "Sangat Baik", kita akan menggunakan model klasifikasi. Misalnya, fungsi keputusan yang dihasilkan akan membagi data ke dalam kategori berdasarkan nilai yang diberikan pada Salah satu metode klasifikasi yang dapat digunakan adalah Decision Tree. Random Forest, atau Support Vector Machine (SVM), yang akan menghasilkan model berdasarkan aturan. Decision Tree Decision Tree adalah model klasifikasi yang bekerja dengan membagi data menjadi cabang-cabang berdasarkan aturan yang ditetapkan untuk setiap fitur. Model ini mudah dipahami karena menggunakan struktur pohon, di mana simpul mewakili keputusan yang dibuat pada fitur, dan cabang menunjukkan hasil dari keputusan tersebut. Struktur Decision Tree: Apakah nilai ujian 1 > 70? Tidak Apakah nilai ujian 2 > 75? "Buruk" Tidak "Sangat Baik" "Baik" Gambar 1. Decision Tree Random Forest Random Forest adalah metode pembelajaran ensemble yang menggunakan beberapa decision tree untuk meningkatkan akurasi prediksi. Setiap decision tree di dalam hutan memberikan hasil yang berbeda, dan keputusan akhir diambil berdasarkan voting mayoritas atau rata-rata hasil dari semua pohon. Data Randomly split data Tree 1 Tree 2 Tree 3 Tree 4 . Tree N Decision Decision Decision Tree 1 Tree 2 Tree N Majority Vote from all Trees --> Final Prediction Gambar 2. Random Forest Joined Journal (Journal of Informatics Educatio. Support Vector Machine (SVM) Support Vector Machine (SVM) adalah model klasifikasi yang mencari hiperplane terbaik yang memisahkan dua kelas data di ruang fitur. SVM berusaha untuk menemukan garis atau bidang yang memisahkan kelas dengan margin terbesar antara titik data yang Data Point Class 1 Data Point Class 2 ---> _____________________________ Hyperplane (Boundar. Gambar 3. SVM 2 Pengolahan Data Proses pengolahan data mencakup beberapa langkah: Penanganan Nilai yang Hilang: Jika ada data yang hilang, dilakukan imputasi atau penghapusan data yang tidak lengkap. Normalisasi Data: Nilai ujian, kehadiran, dan partisipasi dinormalisasi untuk memastikan bahwa mereka berada dalam rentang yang sama. Kategorisasi Data: Kinerja akademik dikategorikan ke dalam beberapa kelas: "Sangat Baik", "Baik", "Cukup", dan "Buruk". Tabel 3. Hasil Pengolahan Data (Normalisasi Nilai ke Rentang 0-. Siswa Nilai Ujian 1 (Nor. Nilai Ujian 2 (Nor. Kehadiran (Nor. Partisipasi (Nor. Usia (Nor. Jenis Kelamin S10 Kinerja Akademik (Targe. Baik Cukup Sangat Baik Buruk Baik Buruk Sangat Baik Cukup Baik Buruk 3 Pembagian Data Data dibagi menjadi dua set: Set Pelatihan: 70% dari data akan digunakan untuk melatih model. Set Uji: 30% dari data akan digunakan untuk menguji performa model. Joined Journal (Journal of Informatics Educatio. 4 Aplikasi Model Machine Learning Beberapa model machine learning akan diterapkan pada data untuk menganalisis kinerja akademik siswa. Berikut adalah contoh penerapan model: Regresi Linear: Digunakan untuk memprediksi nilai kontinu dari kinerja Decision Tree: Digunakan untuk klasifikasi berdasarkan berbagai fitur . ilai ujian, kehadiran, partisipas. SVM: Digunakan untuk klasifikasi dengan margin maksimum antara kelas. Neural Networks: Digunakan untuk menangkap pola yang lebih kompleks dalam Tabel 4. Hasil Evaluasi Performa untuk Setiap Model Model Akuras i (%) Precisio n (Bai. Precisio (Cuku. Precisio (Buru. Recall (Sanga t Bai. Precisio (Sangat Bai. Regresi Linear Decision Tree SVM Neural Network Recall (Cukup Recall (Buruk F1Scor Recal (Baik Akurasi: Mengukur proporsi prediksi yang benar . aik positif maupun negati. yaycaycaycycycaycayc = Number of Correct Predictions Total Number of Predictions Precision: Mengukur seberapa banyak prediksi positif yang benar. ycyeeyeIyeEyeOyeiyeOyeayea = ycyeeyenyeI ycyeayeiyeOyeiyeOyeyeI . ycyeeyenyeI ycyeayeiyeOyeiyeOyeyeI . ycyeCyesyeiyeI ycyeayeiyeOyeiyeOyeyeI . Recall: Mengukur seberapa banyak kondisi sebenarnya yang dapat dideteksi dengan benar oleh model. ycIyceycaycaycoyco = ycNycycyce ycEycuycycnycycnycyce . cNycE) ycNycycyce ycEycuycycnycycnycyce . cNycE) yaycaycoycyce ycEycuycycnycycnycyce . aycE) F1-Score: Rata-rata harmonis dari Precision dan Recall, memberikan keseimbangan antara keduanya. ycya Oe ycyeEyeayeeyeI = ya yeo ycyeeyeIyeEyeOyeiyeOyeayea yeo ycyeIyeEyeCyesyes ycyeeyeIyeEyeOyeiyeOyeayea ycyeIyeEyeCyesyes Joined Journal (Journal of Informatics Educatio. KESIMPULAN Penelitian ini berhasil mengembangkan sistem rekomendasi berbasis machine learning yang dapat menganalisis data kinerja akademik siswa untuk memberikan rekomendasi materi pembelajaran yang lebih personal. Hasil evaluasi menunjukkan bahwa model Neural Networks memberikan performa terbaik dalam hal akurasi dan keseimbangan antara precision dan recall. Sistem ini dapat memanfaatkan data akademik yang ada, seperti nilai ujian, kehadiran, dan interaksi siswa dengan materi, untuk memberikan rekomendasi yang disesuaikan dengan karakteristik masing-masing siswa. Selain itu, penelitian ini menekankan pentingnya pemilihan fitur yang relevan dan penggunaan model yang tepat untuk meningkatkan efektivitas sistem rekomendasi dalam konteks Dengan demikian, sistem ini dapat menjadi alat yang berharga bagi pendidik untuk meningkatkan kualitas pembelajaran dan mendukung pencapaian akademik yang lebih baik bagi siswa. Untuk memastikan aplikabilitas yang adil di berbagai konteks, sistem ini dirancang dengan perspektif budaya transnasional yang memperhitungkan keberagaman bahasa, standar kurikulum lokal, dan norma budaya sehingga rekomendasi tetap relevan dan efektif bagi siswa di berbagai negara dan institusi. DAFTAR PUSTAKA