v4i1.
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X Analisis Model Algoritma K-Means Clustering untuk Pengelompokan Prestasi berdasarkan Nilai Pengetahuan Siswa (Studi Kasus : SMP Negeri 2 Mekar Bar.
Fajar Widianto1.
Alfaiko Janita2 1 Universitas Pamulang Jl.
Raya Puspitek.
Buaran.
Kec.
Pamulang.
Kota Tangerang Selatan.
Banten 15310 2Sekolah Tinggi Keguruan dan Ilmu Pendidikan (STKIP) Banten Jl Raya.
Ciruas - Walantaka KM.
1 Kota Serang.
Banten Email : 1fajarwidianto95@gmail.
com 2alfaikojanita@gmail.
DOI : https://doi.
org/10.
52620/sainsdata.
Abstrak Perkembangan teknologi memberikan dampak nyata hari ini.
Khususnya dunia pendidikan dalam melakukan penilaian siswa, mengevaluasi keberhasilan proses pembelajaran di sekolah.
Namun, pengelompokan prestasi berdasarkan nilai pengetahuan seringkali masih dilakukan secara manual sehingga kurang efektif dan kurang mampu memberikan gambaran pola akademik secara menyeluruh.
Tujuan dari penelitian ini untuk menganalisis penerapan model algoritma K-Means clustering dalam mengelompokkan prestasi siswa berdasarkan nilai pengetahuan di SMP Negeri 2 Mekar Baru.
Metode penelitian yang digunakan adalah pendekatan kuantitatif dengan teknik data mining.
Data nilai pengetahuan siswa diolah melalui tahapan preprocessing, penentuan jumlah cluster .
, proses iterasi K-Means, serta mengevaluasi hasil pengelompokan.
Hasil yang didapat menunjukkan bahwa algoritma K-Means mampu melakukan pengelompokan siswa ke dalam beberapa kategori prestasi, seperti tinggi, sedang maupun rendah, secara objektif berdasarkan kedekatan nilai centroid.
Kesimpulannya, penerapan K-Means efektif membantu pihak sekolah dalam memetakan prestasi siswa sebagai dasar pengambilan keputusan adapun kebaruan dalam penelitian ini terletak pada penerapan model clustering sebagai sistem pendukung evaluasi prestasi berbasis data di tingkat SMP.
Kata Kunci: K-Means Clustering.
Data Mining.
Prestasi Siswa.
Nilai Pengetahuan Abstract Student Technological developments have a real impact today.
Especially in the world of education in conducting student assessments, evaluating the success of the learning process in schools.
However, grouping achievements based on knowledge scores is often still done manually so it is less effective and less able to provide a comprehensive picture of academic patterns.
The purpose of this study is to analyze the application of the K-Means clustering algorithm model in grouping student achievements based on knowledge scores at SMP Negeri 2 Mekar Baru.
The research method used is a quantitative approach with data mining techniques.
Student knowledge score data is processed through preprocessing stages, determining the number of clusters .
, the K-Means iteration process, and evaluating the clustering results.
The results obtained show that the KMeans algorithm is able to group students into several achievement categories, such as high, medium, and low, objectively based on the proximity of the centroid value.
In conclusion, the application of K-Means effectively helps schools in mapping student achievement as a basis for decision making.
The novelty in this study lies in the application of the clustering model as a data-based achievement evaluation support system at the junior high school level.
Keywords: K-Means Clustering.
Data Mining.
Student Achievement.
Knowledge Score This work is licensed under a Creative Commons Attribution 4.
0 International License AAuthor .
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X
PENDAHULUAN
Perkembangnya transformasi digital dalam bidang pendidikan, maka muncul kebutuhan untuk menggunakan data akademik sebagai landasan pengambilan keputusan berbasis bukti .
vidence-based decision makin.
Dalam konteks di sekolah, data nilai pengetahuan siswa merupakan sumber informasi yang sangat berharga dan dapat dianalisis untuk memahami pola prestasi dan distribusi kemampuan Namun, dalam kenyataannya, pengolahan nilai masih cenderung bersifat deskriptif dan administratif, sehingga belum sepenuhnya dimanfaatkan untuk analisis pola berbasis data.
Kondisi ini juga terlihat dalam pengelolaan data akademik di SMP Negeri 2 Mekar Baru, dimana pengelompokan prestasi siswa belum menggunakan pendekatan komputasional yang sistematis.
Dengan berkembangnya teknik data mining, maka metode clustering menjadi salah satu pendekatan yang efektif dalam mengelompokkan data tanpa label .
nsupervised learnin.
Penelitian terbaru menunjukkan bahwa algoritma K-Means masih menjadi metode yang banyak digunakan dalam analisis data pendidikan karena efisiensi komputasi dan kemampuannya mengelompokkan data numerik secara objektif (Zhang & Wu, 2023.
Kumar et al.
, 2.
Dalam konteks pendidikan menengah, maka penerapan clustering telah terbukti membantu sekolah dalam mengidentifikasi kelompok siswa berdasarkan capaian akademik untuk mendukung intervensi pembelajaran yang lebih tepat sasaran (Rahman & Pratama, 2.
Namun demikian, sebagian besar penelitian lebih terkonsentrasi pada tingkat pendidikan tingkat tinggi atau menerapkan analisis berbasis platform e-learning.
Penelitian ini menerapkan K-Means pada pengelompokan prestasi siswa berdasarkan nilai pengetahuan siswa tingkat SMP di sekolah daerah masih tergolong terbatas.
Penelitian ini memiliki urgensi karena dapat mengisi kekosongan tersebut dengan menerapkan model analisis clustering sebagai sistem pendukung dalam evaluasi akademik di SMP Negeri 2 Mekar Baru.
Penelitian ini bertujuan menganalisis penerapan algoritma K-Means Clustering dalam mengelompokkan prestasi siswa di sekolah berdasarkan nilai pengetahuan siswa, menganalisis pola prestasi yang terbentuk, serta memberikan rekomendasi strategis bagi sekolah dalam menyusun kebijakan pembinaan akademik.
Kebaruan ilmiah pada penelitian ini terletak pada implementasi model clustering sebagai pendekatan analitik dalam bentuk praktis di tingkat SMP, dengan fokus pada optimalisasi pengelompokan siswa.
TINJAUAN PUSTAKA
Prestasi Siswa Prestasi siswa dalam konteks penelitian berbasis data ini tidak hanya dimaknai sebagai hasil belajar secara umum, tetapi lebih spesifik sebagai capaian akademik yang terukur melalui indikator kuantitatif, seperti nilai pengetahuan pada mata pelajaran tertentu.
Menurut Rahman dan Pratama .
, hasil belajar siswa dapat diartikan sebagai angka-angka yang menggambarkan tingkat ketercapaian kompetensi kognitif yang telah diperoleh melalui proses evaluasi pembelajaran yang dapat dianalisis .
Sedangkan Zhang dan Wu .
mengatakan bahwa dalam educational data mining, nilai akademik siswa dipandang sebagai atribut numerik yang dapat digunakan untuk mengidentifikasi pola performa belajar melalui teknik clustering.
Dalam konteks ini, prestasi siswa tidak hanya dilihat dari rata-rata nilai, tetapi dari pola distribusi dan kemiripan karakteristik capaian akademik antar siswa.
Jadi, definisi dari prestasi siswa dalam penelitian ini adalah capaian kompetensi kognitif siswa yang dinyatakan melalui nilai pengetahuan dan dianalisis menggunakan model algoritma K-Means Clustering v4i1.
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X dalam mengidentifikasi pola untuk mengklasterisasikan prestasi siswa secara objektif dan berbasis data.
Definisi ini juga menegaskan hubungan antara konsep prestasi belajar.
Algoritma K-Means Clustering Algoritma K-Means Clastering adalah suatu metode yang termasuk dalam data mining yang digunakan untuk mengelompokkan data ke dalam sejumlah klaster berdasarkan kesamaan karakteristiknya atau kedekatan.
(Yuni Franata Sinurat.
Masrizal, 2.
Sedangkan Metode K-Means Claustering merupakan metode yang banyak digunakan untuk mengklasterisasi data Dimana dibagi ke dalam sejumlah klaster yang telah ditetapkan sebelumnya.
Setiap titik data ditetapkan ke klaster dengan centroid .
itik tenga.
Centroid diupdate hingga tujuannya Data Mining Konsep data mining dapat diartikan sebuah proses pencarian informasi dan pola yang bermanfaat dari suatu data dalam jumlah besar.
Proses data mining yaitu dilakukan dari pengumpulan data, ekstraksi, analisa data, dan juga statistik data.
Data mining juga merupakan metode yang banyak digunakan dalam mencari pola penggambaran dan kecenderungan pada sejumlah data.
Deskripsi dari pola dan kecenderungan data.
(Wahidin & Syukrilla, 2.
METODE Metode penelitian ini melibatkan beberapa proses tahapan dan pendekatan kuantitatif dalam menganalisis data.
K-means clustering sala satu algoritma yang digunakan dalam data mining.
Metode ini bertujuan untuk mengeklasterisasi data nilai siswa SMP berdasarkan tingkat kemiripan karakteristik akademik tanpa label kelas sebelumnya .
nsupervised learnin.
Jenis dan Desain Penelitian Jenis penelitian ini yaitu penelitian kuantitatif deskriptif-analitik.
Penelitian berfokus pada analisis pola pengelompokan prestasi siswa berdasarkan data numerik berupa nilai pengetahuan.
Desain penelitian mengikuti tahapan proses data mining yang meliputi: pengumpulan data, preprocessing, pemodelan .
, evaluasi, dan interpretasi hasil.
Sumber nya di dapat data sekunder, yaitu data nilai pengetahuan siswa yang diperoleh dari pihak sekolah.
Tahap Analisis data Data Preprocessing Tahap ini meliputi:
A Proses seleksi data nilai yang relevan A Pembersihan data .
ata cleanin.
dari nilai kosong atau duplikasi A Normalisasi data .
ika diperluka.
untuk menyamakan skala nilai Penentuan Jumlah Cluster .
Jumlah cluster ditentukan berdasarkan kebutuhan analisis, misalnya 3 cluster .
inggi, sedang.
Penentuan nilai k dapat menggunakan metode Elbow Method untuk memperoleh jumlah cluster optimal.
Proses Algoritma K-Means Adapun Langkah-langkah algoritma K-Means adalah sebagai berikut:
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X Menentukan jumlah cluster .
Menetapkan sejumlah centroid awal secara acak.
Memperhitungkan sejumlah jarak masing-masing centroid serta merumuskan euclidean distance :
A Mengelompokkan sejumlah data dalam ke cluster dengan jarak terdekat.
A Menghitung ulang centroid kedalam rata-rata anggota cluster :
A Mengulangi tahapan hingga centroid tidak berubah .
Evaluasi Model Evaluasi dilakukan untuk melihat stabilitas cluster dan interpretasi karakteristik masing-masing kelompok berdasarkan nilai rata-rata tiap cluster.
Interpretasi Hasil Hasil clustering diinterpretasikan menjadi kategori prestasi siswa .
inggi, sedang, renda.
Interpretasi ini digunakan sebagai dasar rekomendasi akademik bagi sekolah, seperti program remedial atau pengayaan.
HASIL DAN PEMBAHASAN
Implementasi K-Means Orange Data Mining Alur ini dirancang untuk melakukan pengelompokan data .
menggunakan algoritma kMeans.
Berikut adalah penjelasan langkah demi langkah dari setiap komponen .
yang ada :
Gambar 1.
Alur kerja .
File : merupakan titik awal di mana data mentah .
eperti file .
csv atau .
dimasukkan ke dalam sistem.
Preprocess : Data mentah jarang sekali langsung siap pakai.
Widget ini biasanya digunakan untuk membersihkan data, seperti menangani nilai yang hilang .
issing value.
, melakukan normalisasi .
enskalaan angka agar setar.
, atau memilih fitur tertentu agar hasil clustering lebih akurat.
K-Means: merupakan "otak" dari alur ini.
Algoritma ini memilah data nilai ke sejumlah klaster .
berdasarkan kesamaan karakteristiknya.
Data yang berada di dalam satu kelompok akan memiliki kesamaan yang tinggi satu sama lain.
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X Bar Plot & Distributions: Digunakan untuk melihat perbandingan frekuensi atau distribusi data di setiap cluster yang terbentuk.
Silhouette Plot: Ini adalah alat evaluasi yang sangat penting.
Widget ini menunjukkan seberapa baik sebuah data "pas" berada di clusternya dibandingkan dengan cluster lain.
Semakin tinggi nilainya, semakin baik Scatter Plot: Memvisualisasikan data dalam bentuk titik-titik pada koordinat 2D untuk melihat secara langsung bagaimana pengelompokan terjadi secara spasial Data Table: Menampilkan data dalam bentuk tabel baris dan kolom, biasanya sekarang sudah menyertakan label "Cluster" yang dihasilkan oleh k-Means.
Predictions: Berdasarkan tabel data tersebut, widget ini digunakan untuk melihat hasil klasifikasi atau memprediksi kategori data baru berdasarkan model clustering yang sudah dibuat.
Gambar 2.
K-Means Orange Berdasarkan tampilan parameter K-Means pada software Orange, jumlah cluster diuji dari K = 2 hingga K = 11 dengan evaluasi menggunakan Silhouette Score.
Kemudian mengelompokkan data ke dalam kategori tinggi, sedang, dan rendah.
Proses clustering juga telah menggunakan normalisasi data serta metode inisialisasi K-Means untuk meningkatkan stabilitas hasil.
Analisis Sebaran Data Berdasarkan hasil proses clustering di orange, diperoleh distribusi siswa sebagai berikut : Grafik Distributions menunjukkan bagaimana 24 data siswa tersebut terbagi ke dalam 3 kelompok (K=.
Gambar 3.
Grafik Distribusi v4i1.
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X Cluster C2 (Mera.
Cluster C3 (Hija.
Cluster C1 (Bir.
: Merupakan kelompok mayoritas dengan jumlah sekitar 13 siswa.
: Berisi sekitar 9 siswa.
: Merupakan kelompok terkecil yang hanya berisi 2 siswa Gambar 4.
Silhouette Plot Interpretasi :
Cluster C2 .
memiliki nilai silhouette tertinggi, sehingga dapat dikatakan sebagai cluster dengan kualitas pemisahan terbaik dibandingkan cluster lainnya.
data pada cluster ini relatif lebih kompak dan cukup terpisah dari cluster lain.
Cluster C3 .
memiliki kualitas sedang.
Beberapa data sudah cukup baik dalam pengelompokan, namun masih ada kemungkinan kedekatan dengan cluster lain.
Cluster C1 .
memiliki nilai paling rendah, menunjukkan bahwa pemisahan cluster ini kurang kuat dan kemungkinan terdapat data yang cukup dekat dengan cluster lain.
Maka, seluruh nilai silhouette masih berada di bawah 0,5 dan bahkan mendekati 0, sehingga dapat disimpulkan bahwa struktur cluster dalam data belum terlalu kuat atau masih terdapat tumpang tindih antar Predictions dan visualisasi Gambar 5.
Predictions dan visualisasi v4i1.
https://pub.
id/sainsdata Sains Data Jurnal Studi Matematika dan Teknologi ISSN 2986-903X Dari tabel data siswa, kita dapat melihat pola yang membedakan ketiga kelompok ini:
A Cluster C2 (Merah - Kelompok Terbesa.
: Kelompok ini umumnya memiliki nilai yang sangat stabil dan tinggi di mata pelajaran eksakta dan bahasa.
Sebagai contoh.
Arif dan Deden memiliki nilai MTK .
& .
IPA .
& .
, serta BING .
Kelompok ini mewakili siswa dengan performa akademik yang konsisten di atas rata-rata.
A Cluster C3 (Hijau - Kelompok Menenga.
: Siswa di kelompok ini, seperti Asmariyah dan Hambali, menonjol di mata pelajaran seperti PAI .
dan SBK .
Nilai mereka cukup bersaing dengan C2, namun sering kali memiliki sedikit penurunan di nilai UAS .
ata-rata di angka .
dibandingkan nilai harian mereka.
A Cluster C1 (Biru - Kelompok Uni.
: Kelompok ini hanya berisi 2 siswa, yaitu Muslik dan Riyan.
Perbedaan mencolok mereka terlihat pada nilai PAI .
dan SBK .
yang lebih rendah secara signifikan dibanding kelompok lain, serta nilai IPS .
yang berada di bawah rata-rata kelas.
Inilah yang menyebabkan mereka terpisah menjadi kelompok kecil sendiri.
Secara keseluruhan, pembeda utama di siswa adalah konsistensi nilai mata pelajaran pendukung (PAI.
SBK.
IPS).
Kelompok C2 adalah kelompok unggul di hampir semua bidang.
C3 unggul di bidang keagamaan dan seni, sementara C1 adalah kelompok yang membutuhkan perhatian khusus karena memiliki nilai yang paling rendah di beberapa mata pelajaran kunci tersebut.
KESIMPULAN
Kesimpulan dari hasil penelitian ini yang menggunakan perangkat lunak aplikasi Orange Data Mining dengan alur kerja yaitu dimulai dari pengambilan data mentah (Fil.
, proses pembersihan (Preproces.
, hingga tahap inti yaitu algoritma k-Means untuk mengelompokkan siswa berdasarkan kemiripan nilai Berdasarkan pengujian otomatis terhadap 2 hingga 11 kelompok, ditemukan bahwa jumlah pengelompokan yang paling optimal secara statistik adalah 3 cluster dengan skor Silhouette sebesar 0,127.
Hasil pemrosesan terhadap 24 data siswa menunjukkan sebaran prestasi yang tidak merata.
Cluster C2 (Mera.
menjadi kelompok prestasi dominan yang mencakup 13 siswa dengan karakteristik nilai akademik yang cenderung stabil di atas rata-rata.
Di sisi lain.
Cluster C3 (Hija.
terdiri dari 9 siswa dengan performa menengah, sementara Cluster C1 (Bir.
hanya terdiri dari 2 siswa.
Dengan demikian, model ini memberikan landasan bagi SMP Negeri 2 Mekar Baru untuk melakukan pemetaan prestasi guna memberikan bimbingan belajar yang lebih terarah sesuai dengan kekuatan dan kelemahan masing-masing kelompok siswa.
DAFTAR PUSTAKA