Jurnal Janitra Informatika dan Sistem Informasi Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Klasterisasi Nilai Ujian Sekolah Menggunakan Metode Algoritma KMeans Clasterization of School Exam Value Using K-Means Algorithm Method Adi Zulkarnaen Saputra*1.
Nana Suarna2.
Gifthera Dwi Lestari3
1,2,3
Teknik Informatika.
STMIK IKMI Cirebon *e-mail: adyfun1@gmail.
com1, st_nana@yahoo.
com2, gifthera.
ikmi@gmail.
Received:
Revised:
Accepted:
Available online:
Abstrak: Ujian Nasional merupakan salah satu penunjang keputusan untuk menyatakan lulus atau tidaknya siswa menurut Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2015 Pasal 66 menyebutkan bahwa Penilaian hasil belajar sebagaimana dimaksud dalam Pasal 63 ayat .
huruf c bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dan dilakukan dalam bentuk Ujian Nasional, juga berpengaruh untuk dapat melanjutkan ke jenjang pendidikan selanjutnya, selain itu juga dapat meningkatkan mutu pendidikan sekolah tersebut sebagaimana tercantum pada Pasal Berdasarkan latar belakang masalah yang telah dipaparkan, maka penelitian ini adanya beberapa masalah yaitu bagaimana menerapkan Algoritma Clustering K-Means untuk mengelompokan Nilai ujian nasional berdasarkan Kabupaten Kota di Indonesia berdasarkan Nilai UN tingkat Sekolah Menengah Pertama dan bagaimana hasil pengelompokan Kabupaten dan Kota di Indonesia berdasarkan Nilai UN tingkat Sekolah Menengah Atas dengan Algoritma Clustering K-Means.
Tujuan penelitian ini yaitu untuk mengelompokan nilai ujian tingkat Sekolah Menengah Atas.
Metode yang digunakan yaitu Algoritma Clustering K-Means.
Hasil dari penelitian ini yaitu untuk mengetahui pengelompokan nilai ujian sekolah siswa terbaik dengan tingkat akurasi Jumlah anggota atribut Kelas pada Cluster 0: IPS:943.
Bahasa: 909.
IPA: 549.
Jemaah angora attribute Kolas pada Cluster 1: IPS: 422.
Bahasa: 456.
IPA: 276.
Kata kunci: Klasterisasi.
Algoritma K-Means.
Nilai.
Ujian Sekolah.
Abstract: The National Examination is one of the supporting decisions to declare whether students pass or not according to the Government Regulation of the Republic of Indonesia Number 13 of 2015 Article 66 states that the assessment of learning outcomes as referred to in Article 63 paragraph .
letter c aims to assess the achievement of graduate competencies nationally in certain subjects and carried out in the form of the National Examination, also has an effect on being able to continue to the next level of education, besides that it can also improve the quality of school education as stated in Article 68.
Based on the background of the problems that have been described, this research has several problems namely how to apply the K-Means Clustering Algorithm to group national exam scores based on District Cities in Indonesia based on UN scores at the junior high school level and how are the results of grouping districts and cities in Indonesia based on school level UN scores.
Senior High School with the K-Means Clustering Algorithm.
The purpose of this study is to group the test scores at the High School level.
The method used is the K-Means Clustering Algorithm.
The results of this study are to determine the grouping of the best students' school test scores with accuracy.
Number of class attribute members in Cluster 0: IPS: 943.
Language: 909.
IPA: 549.
Number of class attribute members in Cluster 1: IPS: 422.
Language: 456.
IPA:276 Keywords: Clustering.
K-Means Algorithm.
Grades.
School Exams.
PENDAHULUAN
Menurut Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2015 Pasal 66 menyebutkan bahwa Penilaian hasil belajar sebagaimana dimaksud dalam Pasal 63 ayat .
huruf c bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dan dilakukan dalam bentuk UN.
UN dilakukan secara obyektif, berkeadilan, dan akuntabel.
diadakan paling sedikit 1 .
kali dalam 1 .
tahun pelajaran.
Hasil UN digunakan sebagai salah satu dasar untuk pemetaan mutu program dan/atau satuan pendidikan, pertimbangan seleksi masuk jenjang pendidikan berikutnya pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upayanya untuk meningkatkan mutu pendidikan Pasal 68 .
Pengelompokan Siswa berdasarkan nilai Ujian Sekolah dan IPK menggunakan Metode KMeans penting untuk dilakukan penelitian yaitu untuk membuktikan bahwa metode K-Means dapat digunakan untuk melakukan pengelompokan siswa berdasarkan Kelas.
Nilai dan Pelajaran pada pelaksanaan ujian sekolah siswa tersebut ketika lulus sekolah.
E-ISSN: 2775-9490
Jurnal Janitra Informatika dan Sistem Informasi Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Penelitian terdahulu yang dilakukan oleh Abarca.
Roberto Maldonado dalam jurnalnya yang berjudul: AuAplikasi K-Means Untuk Pengelompokan Sekolah Dasar (SD) Dan Sederajat Berdasarkan Rata-Rata Hasil Ujian Nasional Sekabupaten JemberAy mengatakan bahwa algoritma K-Means merupakan algoritma yang umum digunakan untuk clustering dokumen.
Prinsip utama K-Means adalah menyusun k prototype atau pusat massa .
dari sekumpulan data berdimensi nAy.
Sebelum diterapkan proses algoritma K-means, dokumen akan di preprocessing terlebih dahulu.
Kemudian data direpresentasikan sebagai vektor yang memiliki term dengan nilai tertentu.
Munzir Umran menyatakan bahwa K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok.
Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik sama dikelompokan ke dalam satu cluster yang sama .
Usulan penelitian ini yaitu menggunakan klasterisasi yang digunakan pada penelitian ini adalah algoritma K-Means yaitu sebuah algoritma yang dapat mendefinisikan objek dalam suatu pusat kelompok data yang biasanya menjadi titik-tengah dari kelompok data tersebut.
Algoritma ini akan melakukan perulangan untuk mendapatkan titik-tengah yang optimal.
Algoritma K-Means ini akan membagi klaster sesuai dengan jumlah klaster yang telah ditentukan atau diinisiasi diawal saat menjalankan algoritma ini.
Dengan algoritma klastering konstribusinya terhadap sekolah yaitu dapat mengetahui pembagian klaster berdasarkan kelas, nilai dan pelajaran pada jurusan Bahasa.
Kajian yang disulkan yaitu klasterisasi nilai ujian sekolah menggunakan algoritma k-means, dengan mengikuti alur: 1.
Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk, 2.
Inisiasi k sebagai centroid yang dapat dibangkitkan secara random, 3.
Hitung jarak setiap data ke masingmasing centroid menggunakan persamaan Euclidean Distance, 4.
Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya,5.
Tentukan posisi centroid baru .
, 6.
Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama Penghitungan jarak antara data dengan centroid.
Tujuan dari penelitian ini adalah untuk mengetahui bagaimana cara menganalisa pengelompokan nilai ujian sekolah menggunakan algoritma k-means.
Untuk mengimplementasikan pengelompokan data nilai ujian sekolah menggunakan algoritma k-means clustering dapat mengetahui cluster kelas, nilai dan pelajaran, dan menentukan cluster sedang dan rendahnya nilai ujian sekolah pada jurusan bahasa.
Metode yang digunakan mengunakan metode.
Hasil penelitian ini pelajaran yang terdapat pada nilai max dan rata-rata adalah rata rata Pelajaran Bahasa dan Kelas Mipa, berdasarkan Pelajaran Kelas dan Nilai maka dapat menghasilkan nilai akurasi data terbaik Davies Boudi Indeks (Db.
yaitu pada kluster ke 5 sebesar -1.
001 dbi.
TINJAUAN PUSTAKA
Algoritma K-means Algoritma K-Means adalah algoritma clustering yang paling sederhana dibandingkan dengan algoritma yang lain.
Algoritma ini mempunyai kelebihan yaitu mudah diterapkan dan dijalankan, relative cepat, mudah untuk diadaptasi, dan paling banyak dipraktekkan dalam tugas data mining.
Algoritma ini termasuk salah satu algoritma paling penting dalam data mining .
Klasterisasi Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan Obyeknya ialah untuk kasus pendistribusian .
rang-orang, objek, peristiwa dan lainny.
ke dalam kelompok, sedemikian hingga derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan lemah antar anggota dari cluster yang berbeda.
Dengan cara ini masingmasing cluster menguraikan, dalam kaitan dengan kumpulan atau koleksi data, class dimana milik anggota-anggotanya.
Cluster disebut juga data item dikelompokkan menurut pilihan konsumen atau hubungan logis .
Data mining Menurut Hermawati .
AyData Mining merupakan suatu proses yang memproses satu atau lebih teknik pembelajaran komputer .
achine learnin.
untuk menganalisis dan mengekstraksi pengetahuan .
secara otomatis.
AyData mining dapat berisi pencarian trend atau pola yang E-ISSN: 2775-9490 Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Jurnal Janitra Informatika dan Sistem Informasi diinginkan dalam suatu database yang sangat besar untuk membantu pegambilan keputusan di waktu yang akan datang .
Pengelompokan Pengelompokan dalam penelitian yang dilakukan oleh Syam .
dengan judul Implementasi metode klastering k-means untuk mengelompokkan hasil evaluasi mahasiswa hasil penelitian ini berupa pengelompokkan mahasiswa berdasarkan cluster mahasiswa yang berprestasi, cluster mahasiswa berpotensi berprestasi, cluster mahasiswa berpotensi bermasalah.
Selanjutnya setelah dilakukan pengujian dengan aplikasi RapidMiner dan hasilnya sama dengan perhitungan Analisa Algoritma K-Means yang dilakukan, dan hasilnya cukup efisien dan efektif .
METODE
Metode penelitian Metode penelitiannya sendiri menggunakan algoritma k-means sebagai berikut: Algoritma klasterisasi yang digunakan pada artikel ini adalah K- Means yaitu sebuah algoritma yang dapat mendefinisikan objek dalam suatu pusat kelompok data yang biasanya menjadi titik-tengah dari kelompok data tersebut (Wahyudi & Jananto, 2.
Algoritma ini akan melakukan perulangan untuk mendapatkan titik-tengah yang optimal.
Dan K-Means ini akan membagi klaster sesuai dengan jumlah klaster yang telah ditentukan atau diinisiasi diawal saat menjalankan algoritma ini.
Algoritma K-Means mengikuti alur sbb:
Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk Inisiasi k sebagai centroid yang dapat dibangkitkan secara random Hitung jarak setiap data ke masing- masing centroid menggunakan persamaan Euclidean Distance Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya Tentukan posisi centroid baru .
Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama Penghitungan jarak antara data dengan centroid menggunakan euclidean distance dengan persamaan sebagai berikut:
cE, ycE) = () = 1 ycu" .
cE) Oe ycu" .
cE).
Kemudian untuk menentukan centroid berikutnya pada langkah 5 yaiu dengan persamaan:
ycu$ ycu# ycu% U ycu& .
Ocycu Dengan C adalah centroid baru yang dihasilkan berdasarkan data pada klaster yang terbentuk.
= HASIL DAN PEMBAHASAN Penerapan metode klasifikasi Setelah data dipilih dan diseleksi sesuai dengan atribut yang akan digunakan maka dilakukan cleaning atau pembersihan data.
Pembersihan data merupakan proses dimana data-data yang tidak lengkap dan mengandung error akan dibuang dari koleksi data.
Selanjutnya bagaimana tahapan penerapan metode klasterisasi dengan metode k-means terhadap pengujian Nilai ujian sekolah.
Pada bagian model analisis berisi diagram block yang terdiri dari preprocessing data.
K-Means clustering.
Berikut ini penjelasannya, penerapan metode K-Means clustering terhadap pengujian algoritma tersebut disajikan pada Gambar 1:
E-ISSN: 2775-9490
Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Jurnal Janitra Informatika dan Sistem Informasi
START
DATA
MENTAH
CLEANING
SUBPROSES
STOP
KMEANS
CLUSTERING
SETROLE
Gambar 1: Penereapan Metode K-Means Clustering Penjelasan pada Gambar 1 merupakan proses tahapan klastering di mulai dari:
Tahap kesatu input data mentah yang berupa data nilai ujian sekolah yang berupa format dataset excel akan melakukan representasi dari data.
Tahap Cleaning: yaitu tahap data pembersihan .
untuk membuang data yang tidak konsisten.
Apabila sudah selesai maka didapatkan data yang sudah diproses atau data matang siap untuk ke tahap selanjutnya.
Tahap ke tiga Subproses: Memisahkan data dari label: Sebelum diklasifikasikan data terlebih dahulu dipisahkan dari label masing-masing data agar kolom label data tidak ikut serta terhitung dalam pengklasifikasian dan memberikan hasil yang maksimal.
Tahap keempat Set Role: Klasifikasi langkah pertama melakukan pembagian dari keseluruhan menjadi dua atau empat kelompok sesuai dengan data agar lebih mudah.
untuk menentukan tiap data akan masuk ke dalam kategori yang mana.
yaitu tranformasi data, data yang berjenis alphabet seperti nilai ujian sekolah harus dilakukan proses inisialisasi data terlebih dahulu ke dalam bentuk angka/numerikal.
Tahap keLima klasifikasi data: data diklasifikasikan menggunakan algoritma k-means sesuai dengan spesifikasi yang telah ditentukan.
setiap data yang ada terbagi menjadi beberapa baris.
data prediksi sesuai posisi pada saat diambilnya data tersebut, masingmasing data prediksi juga memiliki kolom atribut koordinat sesuai dengan kasus.
Data Mining Proses mencari atau menggali informasi menarik dalam sebuah data dengan jumlah besar yang terpilih dengan menggunakan teknik atau metode tertentu.
Penelitian ini menggunakan algoritma K-means untuk mengklasifikasikan nilai ujian.
Dalam penelitian ini pengolahan data sekolah menggunakan bantuan software RapidMiner dengan menggunakan algoritma K-Means, adapun tahapannya adalah sebagai berikut:
Gambar 2: Tampilan Utama RapidMiner Operator Read Excel Menampilkan halaman utama Rapidminer utuk membuat halaman kerja pada rapidminer.
Import data dilakukan untuk memasukan data yang akan diuji dalam bentuk format .
xls atau .
Adapun langkah untuk manual dan cara mudah menuju import data sebagai berikut:
E-ISSN: 2775-9490
Jurnal Janitra Informatika dan Sistem Informasi Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Langkah langkah menuju Read Excel.
Manual Gambar 3: Langkah - Langkan menampilkan Read Excel.
Pada gambar 3 langkah - langkan menampilkan read excel manual yaitu Klik kanan pada layar y Insert Operator y Data Access y Files y Read y Read Excel.
Cara Gampang Gambar 4: Tampilan Operators Halaman Utama.
Pada gambar 4 langkah - langkan menampilkan Read Excel, dengan cara mudah yaitu dibawah pojok kiri ada bagian Operators y kemudian ketik Read Excel.
Operator Importing Data
Gambar 5: Operator Read Excel
E-ISSN: 2775-9490
Jurnal Janitra Informatika dan Sistem Informasi Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Setelah operator read excel telah dipanggil, langkah selanjutnya yaitu import data untuk diproses dengan cara klik Import Configurations Wizard y klik file yang akan digunakan.
Jika data telah berhasil di import dan tidak ada yang error maka klik finish untuk melanjutkan ke langkah Data Statistik Gambar 6: Data Statistik Keterangan:
Data statistic adalah data yang diolah untuk menentukan nama kluster, type data, keterangan missing dan klasterisasi 1 dan kluster 0, menurut pelajaran, kelas dan Nilai.
Model Proses Gambar 7: Model proses Keterangan:
Model Proses Klasifikasi langkah pertama melakukan pembagian.
dari keseluruhan menjadi dua atau empat kelompok sesuai dengan data agar lebih mudah untuk menentukan tiap data akan masuk ke dalam kategori yang mana.
Model Set Role Model set role yaitu untuk merubah bagian dari type colom No menjadi type bagian dari ID, seperti tampilan pada gambar 8.
Gambar 8: Model set role Select Attributes Select attributes dipergunakan untuk memfilter data apa saja yang akan dipergunakan dalam pemprosesan data.
Data dari nilai ujian sekolah difilter dari 6 atribut menjadi 4 atribut yang Data yang digunakan yaitu: Atribut No.
Atribut pelajaran, atribut kelas dan atribut nilai.
Berikut adalah parameter yang dipergunakan pada select attributes.
E-ISSN: 2775-9490
Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Jurnal Janitra Informatika dan Sistem Informasi Gambar 9: Select Attributes Statistik:
Gambar 10: Hasil Select Attributes Keterangan:
Hasil yang diperoleh dari statistic table 1 adalah sebagai berikut:
Table 1: Hasil Data Statistic Atribut Pelajaran Kelas Nilai Min Matmin 55 Mipa 825 Rata-Rata Agama 237 Bahasa 1365 Model Proses Numerical Model proses ini adalah tahapan dari operator subproses yang terdiri dari operator set role, operator select attribute dan operator nominal to numerical, sehingga menghasilkan statistic data numerical 0 dan 1 seperti pada gambar 11.
Gambar 11: Model Proses Numerical Model Proses Performance Operator Ini Dapat Digunakan Untuk Semua Jenis Tugas Belajar.
Operator Ini Secara Otomatis Menentukan Jenis Tugas Pemmbelajaran Dan Mengitung Kriteria yang Paling Umum Untuk Jenis Itu.
Setiap Operator Dihubungkan Sesuai Dengan Kebutihan Yang Kita Inginkan Mulai Dari:
Set Role .
, dihubungkan Select Atribut .
, dengan Operator (Ex.
, dihubungkan dengan Nominal to Numerical (Ex.
, dihubungkan dengan Clastering .
, dihubungkan dengan Operator .
Clustering dengan Performance .
E-ISSN: 2775-9490
Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
Jurnal Janitra Informatika dan Sistem Informasi Gambar 12: Model Proses Performance Keterangan:
Model proses adalah hasil proses dari tahapan keseluruhan mulai dari read excel, preprocessing, clasterisasi dan performance.
Gambar 13: Hasil Proses Performance Keterangan:
Model proses adalah hasil proses dari tahapan keseluruhan mulai dari Read Excel.
Preprocessing.
Clasterisasi dan Performance.
Davies Bouldin Indeks (DBI) Gambar 14: Davies Bouldin Index Keterangan:
Table 2: Clustering Paling Bagus.
Kluster DBi Keterangan K-5 Max 10 Keterangan:
Setelah melakukan klasifikasi data menggunakan metode k-means ternyata menghasilkan nilai akurasi data terbaik berdasarkan data Davies Boudi Indeks (Db.
yaitu pada langkah kluster ke 5 sebesar -1.
001 dbi.
KESIMPULAN
Hasil penelitian pengelompokkan nilai ujian sekolah menggunakan algoritma K-Means, maka dapat disimpulkan sebagai berikut: Pelajaran yang terdapat pada nilai max dan rata - rata adalah Rata rata Pelajaran Bahasa dan kelas mipa berdasarkan pelajaran kelas dan nilai maka dapat E-ISSN: 2775-9490 Jurnal Janitra Informatika dan Sistem Informasi Vol.
No.
1 - April 2023.
Hal.
DOI: 10.
25008/janitra.
menghasilkan nilai akurasi data terbaik berdasarkan data Davies Boudi Indeks (Db.
yaitu pada langkah kluster ke 5 sebesar -1.
001 dbi.
DAFTAR PUSTAKA