JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means 1,2,3 Nia Dwi Rahayu1.
Abdul Halim Anshor2.
Irfan Afriantoro3 Universitas Pelita Bangsa.
Jl.
Inspeksi Kalimalang No.
Cibatu.
Cikarang Selatan.
Bekasi.
Indonesia Email: rahayunia811@gmail.
Abstrak.
Pendidikan memiliki peranan penting sebagai modal utama membangun kararkter bangsa.
Keberhasilan murid dievaluasi berdasarkan pelajaran teoritis dan praktis, serta kehadiran murid selama di dalam kelas.
Jumlah pemrosesan data yang terus meningkat mengharuskan penggunaan strategi dan metode sehingga dapat ditransformasikan menjadi informasi dan pengetahuan yang dapat dimanfaatkan oleh pendidik dalam proses pembuatan kebijakan.
Tujuan penelitian ini yaitu mengelompokan prestasi siswa berdasarkan nilai siswa menggunakan data mining dengan menerapkan algoritma K-Means.
Dalam penelitian ini data yang digunakan adalah nilai raport PAS Ganjil SMK TONAoS periode tahun 2023/2024.
Perhitungan klasterisasi dengan algoritma K-Means berhasil mengelompokkan 24 siswa menjadi 3 cluster.
Dimana siswa dengan kategori tinggi sebanyak 6 siswa, siswa dengan kategori cukup sebanyak 8 siswa, dan siswa dengan kategori rendah sebanyak 10 siswa.
Berdasarkan hasil evaluasi, didapat nilai Davies Bouldin Index (DBI) 144 atau mendekati dengan 0 sehingga dapat disimpulkan bahwa hasil cluster yang dihasilkan cukup baik.
Dengan hasil clustering yang telah diterapkan diharapkan bisa membantu dalam mengambil keputusan dengan tepat untuk menentukan siswa berprestasi.
Kata Kunci : Data Mining.
Prestasi.
Nilai Siswa.
Clustering.
K-Means Abstract.
Education plays an important role as the main capital in building the nation's character.
Student success is evaluated based on theoretical and practical lessons, as well as student attendance during class.
The increasing volume of data processing necessitates the use of strategies and methods to transform it into information and knowledge that educators can utilize in the policy-making process.
The purpose of this research is to group student achievements based on student grades using data mining by applying the K-Means In this study, the data used are the odd semester report card of TONAoS Vocational High School for the 2023/2024 period.
The clustering calculation with the K-Means algorithm successfully grouped 24 students into 3 clusters, with 6 students in the high category, 8 students in the fair category, and 10 students in the low Based on the evaluation results, a Davies Bouldin Index (DBI) value of 0.
144 was obtained, which is close to 0, so it can be concluded that the resulting cluster results are quite good.
With the clustering results that have been applied, it is hoped that they can help in making precise decisions to determine high-achieving Keyword : Data Mining.
Achievement.
Student Grades.
Clustering.
K-Means PENDAHULUAN Pendidikan memiliki peranan penting sebagai modal utama membangun kararkter bangsa.
Pendidikan merupakan suatu cara pembelajaran untuk meningkatkan pengetahuan, sikap dan keterampilan seseorang.
Sekolah menjadi sarana berlangsungnya pendidikan secara langsung, dengan bertemunya guru dan siswa.
Tingginya prestasi murid dan minimnya angka murid yang tidak berprestasi mencerminkan keunggulan sektor Secara umum, keberhasilan murid dievaluasi berdasarkan pelajaran teoritis dan praktis, serta kehadiran murid selama di dalam kelas.
Penilaian dibagi menjadi tiga kategori yaitu pengetahuan, bakat, dan Pengajar menilai semua murid yang mengikuti pelajaran yang diberikan guna mengevaluasi dan menganalisis prestasi belajar murid.
Proses penggalian informasi berdasarkan data siswa terus bertambah setiap tahunnya dan diiringi dengan bertambahnya jumlah siswa, sehingga terjadi penumpukan data yang sangat besar dari data yang belum diolah secara optimal oleh pihak sekolah.
Jumlah pemrosesan data yang terus meningkat mengharuskan penggunaan strategi dan metode sehingga dapat ditransformasikan menjadi informasi dan pengetahuan yang dapat dimanfaatkan oleh pendidik dalam proses pembuatan kebijakan.
Hal ini menjadi permasalahan bagi guru maupun wali kelas yaitu bagaimana cara menentukan tingkat prestasi murid yang rendah, cukup, dan tinggi Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 serta menemukan top rank murid unggulan dalam kelas, agar dapat membentuk kelas yang ideal untuk meningkatkan prestasi maupun memotivasi murid.
Di bidang pendidikan, pemetaan siswa berprestasi adalah langkah penting dalam meningkatkan kualitas pendidikan dan memberikan dukungan yang tepat kepada siswa.
Identifikasi siswa berprestasi dan pemahaman terhadap faktor-faktor yang memengaruhi keberhasilan mereka dapat membantu sekolah dan lembaga pendidikan dalam merancang program-program pendukung yang lebih efektif.
Data Mining sebagai cabang dari ilmu komputer yang berkaitan dengan penemuan pola dalam dataset besar, telah menjadi alat yang penting dalam menganalisis data pendidikan.
Metode clustering, khususnya K-Means, adalah salah satu teknik yang umum digunakan dalam data mining untuk mengelompokkan data ke dalam beberapa kelompok berdasarkan kesamaan fitur.
Adapun beberapa referensi penelitian yang berkaitan dengan pengelompokkan menggunakan algoritma K-Means sebagai berikut:
Penelitian yang dilakukan Sri Dewi.
Sarjon Defit.
Yuhandri Yunus .
dengan judul Akurasi Pemetaan Kelompok Belajar Siswa Menuju Prestasi Menggunakan Metode K-Means.
Kesimpulan dari penelitian yang telah dilakukan adalah sampel data yang diolah dalam penelitian ini berjumlah 25 data siswa dan 10 mata pelajaran yang disajikan.
Setelah mendapatkan hasil pengelompokan pada iterasi keenam dan dilanjutkan dengan iterasi ke tujuh tidak ada perubahan, maka proses pencarian dihentikan.
Hasil cluster yang didapatkan pada Cluster1 (K.
terdapat 3 siswa yang Sangat Berprestasi, pada Cluster2 (K.
terdapat 10 siswa yang Berprestasi dan Cluster3 (K.
terdapat 12 siswa yang Kurang Berprestasi.
Penelitian yang dilakukan Salim Kurniawan.
Amril Mutoi Siregar.
Hilda Yulia Novita .
dengan judul Penerapan Algoritma K-Means dan Fuzzy C-Means Dalam Mengelompokan Prestasi Siswa Berdasarkan Nilai Akademik.
Berdasarkan hasil perhitungan secara manual menggunakan Microsoft Excel 2019 dan Program Python.
Cluster yang dihasilkan sama yaitu baik menggunakan algoritma K-Means maupun algoritma Fuzzy C-Means.
Akan tetapi pada perhitungan menggunakan tools Rapidminer menghasilkan cluster yang Dan kesimpulan hasil penelitian dari pengelompokan prestasi siswa berdasarkan nilai akademik menggunakan algoritma K-Means dan Fuzzy C-Means adalah perhitungan manual dan program python pada algoritma K-Means menghasilkan 52 siswa berprestasi, 25 siswa dengan prestasi sedang serta 28 siswa tidak berprestasi, adapun pada algoritma Fuzzy C-Means menunjukan 48 siswa berprestasi, 29 siswa dengan prestasi sedang dan 28 siswa tidak berprestasi.
Perhitungan menggunakan rapidminer studio dengan algoritma KMeans menghasilkan 49 siswa berprestasi, 27 siswa dengan prestasi sedang serta 29 siswa tidak berprestasi, adapun algoritma Fuzzy C-Means tidak dapat diproses pada rapidminer studio karena tidak adanya algoritma tersebut dalam rapidminer studio.
Hasil evaluasi cluster dalam mengelompokan prestasi siswa berdasarkan nilai akademik menggunakan algoritma K-Means dan Fuzzy C-Means dengan metode Davies Bouldien Index (DBI) dari setiap jenis perhitungan menunjukan algoritma K-Means merupakan algoritma terbaik karena memiliki nilai DBI yang mendekati 0 dan tidak negatif.
Penelitian yang dilakukan Diwa Oktario Dacwanda.
Yessica Natalian .
dengan judul Implementasi K-Means Clustering untuk Analisis Nilai Akademik Siswa Berdasarkan Nilai Pengetahuan dan Keterampilan.
Kesimpulan dari penelitian ini penerapan algoritma k-means membagi dataset penilaian siswa yang meliputi nilai pengetahuan dan keterampilan menjadi tiga kelompok berdasarkan indeks DB, yaitu cluster pintar, sedang, dan cukup.
Berdasarkan perhitungan clustering dengan nilai pengetahuan dan keterampilan didapatkan kelompok pintar dengan jumlah 72 siswa, sedang dengan jumlah 92 siswa, dan cukup dengan jumlah 103 siswa.
Sementara itu, perhitungan clustering dengan nilai pengetahuan saja didapatkan kelompok pintar dengan jumlah 71 siswa, sedang dengan jumlah 87 siswa, dan cukup dengan jumlah 107 Dari perbandingan pengelompokan dengan nilai pengetahuan dan keterampilan dan pengelompokan dengan nilai pengetahuan saja didapatkan hasil bahwa terjadi perpindahan cluster siswa yang tidak terlalu signifikan, yaitu sebesar 10.
15% dari keseluruhan siswa, dimana pengelompokan dengan nilai pengetahuan dan keterampilan lebih baik dibandingkan pengelompokan dengan nilai pengetahuan saja.
Penelitian yang dilakukan Yusma Elda.
Sarjon Defit.
Yuhandri Yunus.
Raemon Syaljumairi .
dengan judul Klasterisasi Penempatan Siswa yang Optimal untuk Meningkatkan Nilai Rata-Rata Kelas Menggunakan K-Means.
Hasil perhitungan dengan menggunakan fungsi SQRT pada Ms.
Excel, pada iterasi ke empat didapatkan nilai yang sama dengan perhitungan pada iterasi ketiga.
Berdasarkan nilai yang sama tersebut, maka proses perhitungan dihentikan cukup sampai dengan iterasi ketiga.
Data hasil pengelompokan pada iterasi ketiga menghasilkan 3 cluster yang dimana Cluster1 (C.
berjumlah 47 siswa.
Cluster2 (C.
berjumlah 10 siswa, dan Cluster3 (C.
berjumlah 33 siswa.
Pengujian yang dilakukan dengan menggunakan Software RapidMiner Studio Versi 9.
2 mendapatkan hasil klasterisasi yang sama dengan pengujian secara Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 manual dengan Ms.
Excel yang dimana Cluster0 (C.
berjumlah 33 siswa.
Cluster1 (C.
berjumlah 47 siswa, dan Cluster2 (C.
berjumlah 10 siswa.
Berdasarkan hasil pengujian dengan menggunakan Software RapidMiner memiliki perbedaan penamaan dengan perhitungan menggunakan Ms.
Excel.
Didapatkan hasil berupa cluster0, cluster1, dan cluster2.
Sedangkan anggota masing-masing cluster sama dengan hasil pengujian dengan menggunakan Ms.
Excel.
Data cluster0 pada RapidMiner sama dengan data pada cluster3 Ms.
Excel.
Sedangkan untuk cluster1 dan cluster2 tidak terdapat perbedaan.
Hasil klasterisasi data 90 siswa dikelompokkan menjadi 3 cluster dengan jumlah data siswa untuk cluster 1 dengan bobot sikap dan hasil belajar tinggi berjumlah 47 siswa, cluster 2 dengan bobot sikap dan hasil belajar sedang berjumlah 10 siswa dan cluster 3 dengan bobot sikap dan hasil belajar rendah berjumlah 33 siswa.
Penelitian yang dilakukan Melissa Triandini.
Sarjon Defit.
Gunadi Widi Nurcahyo .
dengan judul Data Mining dalam Mengukur Tingkat Keaktifan Siswa dalam Mengikuti Proses Belajar pada SMP IT Andalas Cendekia dengan Menggunakan Metode K-Means Clustering.
Dari hasil perhitungan manual dan pengujian dengan menggunakan software rapidminer maka diperolah hasil kelompok yang terdiri 3 Cluster yang jumlah anggotanya sama dengan hasil perhitungan manual.
Berdasarkan hasil performance vector diatas untuk mengukur tingkat keaktifan cluster menggunakan Operator Cluster Distance Performance mengambil model cluster centroid dan mengatur cluster sebagai input dan mengukur tingkat keaktifan berdasarkan centroid cluster.
Adapun jarak yang terdekat dengan Avg.
within centroid distance merupakan nilai yang sangat aktif dan itu terdapat pada cluster2, serta yang jarak yang terjauh dengan Avg.
within centroid distance bernilai kurang aktif dan itu terdapat pada cluster1.
Dan untuk cluster0 bernilai aktif.
Semakin kecil nilai davies bouldin index yang diperoleh .
on-negatif >= .
, maka semakin baik cluster yang diperoleh dari pengelompokan menggunakan metode clustering.
Hasil perhitungan menggunakan metode k-means menunjukan nilai -0.
Angka tersebut memiliki arti masing-masing objek dalam cluster tersebut memiliki kesamaan yang cukup baik karena mendekati angka 0.
Dari hasil dan pembahasan dapat disimpulkan bahwa data dapat dikelompokkan menjadi 3 cluster yaitu, cluster 1 yang bernilai kurang aktif sebanyak 12 siswa, cluster 0 yang bernilai Aktif sebanyak 10 siswa, dan cluster 2 yang bernilai sangat aktif sebanyak 17 siswa.
METODOLOGI PENELITIAN
Kerangka Berfikir Berikut kerangka berfikir dibuat untuk mempermudah dalam memahami arah penelitian dari proses hingga hasil yang akan didapatkan.
Gambar 1.
Kerangka Berfikir Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Berdasarkan gambar diatas didapat permasalah yang ada sebagai latar belakang penelitian dan tujuan yang akan dicapai.
Algoritma yang akan digunakan adalah K-Means dengan bantuan tools RapidMiner Studio.
Hasil yang didapatkan dari penelitian ini adalah mengetahui kelompok Siswa Berprestasi pada SMK TON'S.
Objek Penelitian Objek penelitian ini yaitu berupa data nilai siswa tahun ajaran 2023/2024 yang didapatkan dari SMK TONAoS.
Dimana peneliti bertujuan untuk mengetahui hasil dari pengelompokkan nilai siswa berdasarkan cluster yang sudah ditentukan.
Data Yang Digunakan Dalam penelitian ini, jenis data yang digunakan adalah data primer, karena data tersebut diambil dari SMK TONAoS.
Data primer berasal dari data yang didapat sendiri oleh perorangan atau suatu organisai secara langsung dari objek yang diteliti dan untuk kepentingan studi yang bersangkutan dapat berupa wawancara langsung dengan pimpinan serta pada bagian yang menangani langsung permasalahan di lapangan serta observasi kegiatan sehari-hari suatu objek yang diteliti.
Data yang digunakan dalam penelitian ini merupakan data nilai siswa kelas XII Ae Multimedia semester ganjil tahun ajaran 2023/2024 yang terdiri dari 24 record data.
Variabel data yang digunakan dalam penelitian ini adalah nama siswa dan nilai dari tiap pelajaran yang diikuti oleh siswa.
Metode Yang Digunakan Metode yang digunakan pada penelitian ini adalah menggunakan metode K- Means Clustering.
KMeans adalah metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster.
Algoritma KMeans termasuk portitioning clustering yang memisahkan data ke k daerah bagian yang terpisah.
Langkah-langkah melakukan clustering dengan algoritma K-Means sebagai berikut:
Gambar 2.
Metode Yang Digunakan Berikut uraian diagram diatas:
Menentukan jumlah cluster.
Menentukan centroid awal secara acak.
Menghitung jarak setiap data yang ada terhadap setiap pusat cluster.
Mengelompokan data hasil perhitungan jarak data pada centroid.
Menentukan centroid baru dari hasil pengklasteran.
Menghitung kembali jarak setiap data menggunkan pusat cluster yang baru.
Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro
JUKI : Jurnal Komputer dan Informatika
Volume 6 Nomor 1 Mei 2024
e-ISSN : 2722-4368
HASIL DAN PEMBAHASAN
Hasil Pengujian Persiapan Dataset Penelitian ini menggunakan data nilai siswa SMK TONAoS kelas XII Ae Multimedia semester ganjil tahun ajaran 2023/2024.
Dataset terdari dari atribut yang telah disederhanakan berupa nama siswa dan nilai siswa untuk 8 mata pelajaran yang telah ditempuh selama satu semester.
Dataset sampel terdiri dari 24 record Berikut adalah data siswa yang akan digunakan untuk proses perhitungan dengan algoritma K-Means:
NAMA
Agnes Oktariani Aji Sunarya
Alia Alkhansa
Arphan Chaerul
Arya Maulana Syarif
Farell Joan Susanto
Fauzan Zahy Zulfahmi Hapsah
Iin Inayah Lutfia
Kerin Aprillia
Maulana Yusuf Ibrahim
Maydera Putri Amelia
Melany Putri
Muhamad Dafa Alfaritzi Naisa Tiarani Niken Aptasari Rafli Alif Fikri
Ratna Damayanti Reiza Firjatullah Ridwan Nugraha
Sela Mita Ramjani Sri Wahyuni Suci
Tamimah Pajriyah
PAI
Tabel 1.
Dataset
PPKN IND
MTK
ENG
TAV
DMI
PKK
Menentukan Jumlah Cluster Pada penelitian ini, jumlah cluster yang akan dibentuk adalah tiga cluster, sehingga nilai k = 3.
Cluster yang akan dibentuk yaitu cluster_1 (C.
diartikan sebagai tinggi, cluster_2 (C.
diartikan sebagai cukup, dan cluster_0 (C.
diartikan sebagai rendah.
Menentukan Centroid Menentukan centroid awal secara acak yang diperoleh dari data sampel.
Pada penelitian ini, penulis memilih secara acak dari data nilai siswa untuk dijadikan titik pusat cluster pertama.
Centroid
PAI
Tabel 2.
Titik Pusat Awal Cluster
PPKN
IND
MTK
ENG
TAV
DMI
PKK
Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Menghitung Jarak Data ke Pusat Cluster Langkah selanjutnya adalah menghitung jarak terdekat masing-masing record data dengan nilai awal cluster dengan menggunakan rumus Euclidean Distance sebagai berikut:
, .
= oc .
i Oe yi )2 Data Pertama Jarak dengan pusat cluster 1:
Oe .
Oe .
Oe .
Oe .
Oe .
2 d1 = Oo .
Oe .
Oe .
Oe .
2 Jarak dengan pusat cluster 2:
Oe .
Oe .
Oe .
Oe .
Oe .
2 d1 = Oo .
Oe .
Oe .
Oe .
2 = 6,557438524 Jarak dengan pusat cluster 3:
Oe .
Oe .
Oe .
Oe .
Oe .
2 d1 = Oo .
Oe .
Oe .
Oe .
2 = 9,110433579 Perhitungan dilakukan hingga data terakhir.
Hasil perhitungan jarak data terhadap masing-masing cluster pada iterasi ke-1 dapat di lihat sebagai berikut:
Tabel 3.
Hasil Perhitungan Terhadap Cluster Pada Iterasi ke-1
Jarak
Nama Terdekat Agnes
6,5574385 9,1104335
Oktariani 5,4772255 3,3166247 4,1231056 3,3166247 Aji Sunarya
Alia
11,313708 6,2449979 3,8729833 3,8729833
Alkhansa
Arphan
10,099504 4,5825756 3,3166247 3,3166247
Chaerul
Arya
7,9372539 3,1622776 3,4641016 3,1622776
Maulana
Syarif
Farell Joan
8,6602540 4,8989794 3,7416573 3,7416573
Susanto
Fauzan Zahy 6,5574385 4,8989794 Zulfahmi 6,1644140 2,2360679 3,8729833 2,2360679 Hapsah
Iin Inayah
9,7467943 5,4772255 3,1622776 3,1622776
Lutfia
Kerin
7,2111025 2,6457513 4,7958315 2,6457513
Aprillia Cluster Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro
JUKI : Jurnal Komputer dan Informatika
Volume 6 Nomor 1 Mei 2024
e-ISSN : 2722-4368
Nama Maulana
Yusuf
Ibrahim
Maydera
Putri Amelia
Melany Putri
Muhamad
Dafa
Alfaritzi Naisa
Tiarani Niken
Aptasari Rafli Alif
Fikri
Ratna
Damayanti Reiza
Firjatullah Ridwan
Nugraha
Sela Mita
Ramjani Sri Wahyuni Suci
Tamimah
Pajriyah
Jarak
Terdekat Cluster
9,8994949
3,8729833
4,7958315
3,8729833
1,4142135
9,1104335
7,5498344
4,8989794
9,9498743
1,4142135
11,489125
5,3851648
4,5825756
4,5825756
12,369316
4,6904157
7,0710678
4,1231056
8,7177978
4,8989794
5,6568542
4,7958315
7,1414284
5,0990195
5,4772255
5,1961524
10,677078
5,6568542
6,6332495
3,8729833
7,2801098
2,8284271
3,8729833
5,4772255
4,1231056
4,5825756
4,1231056
10,488088
5,4772255
8,8881944
7,7459666
6,7823299
3,8729833
4,5825756
4,1231056
3,8729833
5,4772255
2,8284271
3,8729833
Jarak hasil perhitungan akan dilakukan perbandingan diantara 3 cluster data terdekat dengan pusat cluster dan mengambil nilai terkecil.
Jarak ini menunjukkan bahwa data tersebut berada dalam 1 kelompok dengan pusat cluster terdekat.
Berikut adalah anggota cluster yang terjadi pada iterasi ke-1 dilambangkan dengan simbol AuTAy.
Tabel 4.
Anggota Cluster Iterasi ke-1 Nama Agnes Oktariani Aji Sunarya Alia Alkhansa Arphan Chaerul Arya Maulana Syarif Farell Joan Susanto Fauzan Zahy Zulfahmi Hapsah Iin Inayah Lutfia Kerin Aprillia Maulana Yusuf Ibrahim Maydera Putri Amelia Melany Putri Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Nama Muhamad Dafa Alfaritzi Naisa Tiarani Niken Aptasari Rafli Alif Fikri Ratna Damayanti Reiza Firjatullah Ridwan Nugraha Sela Mita Ramjani Sri Wahyuni Suci Tamimah Pajriyah Setelah semua data ditempatkan ke dalam cluster yang terdekat, kemudian hitung kembali pusat cluster yang baru berdasarkan rata-rata anggota yang ada pada cluster tersebut sehingga mendapatkan hasil perhitungan centroid baru yang akan digunakan untuk iterasi berikutnya.
Pada cluster 1 terdapat 6 data, cluster 2 sebanyak 9 data, dan cluster 3 sebanyak 9 data.
Dimana nilai rata-ratanya dapat dilihat pada dibawah ini:
82 84 79 79 .
C1 =
= 80,66666667
78 80 79 81 80 80 81 .
C2 =
= 79,55555556
79 78 78 78 78 78 78 .
C3 =
= 78,11111111
Berikut adalah nilai untuk centroid baru:
Centroid
PAI
80,666
79,555
78,111
Tabel 5.
Nilai Centroid Baru Iterasi ke-2
PPKN
IND
MTK
ENG
TAV
83,833 87,833 80,166
33333 33333 66667
80,555 83,333 82,333 79,555 81,777
55556 33333 33333 55556 77778
80,333 83,111 79,888 79,777
33333 11111 88889 77778
DMI
82,166
81,333
80,666
PKK
82,666
82,666
80,555
Selanjutnya menghitung kembali jarak euclidean distance seperti pada langkah sebelumnya dan membandingkan hasil cluster dan diambil jarak minimum seperti langkah sebelumnya.
Langkah tersebut dilakukan hingga tidak ada cluster yang berpindah.
Berikut hasil perhitungan untuk iterasi ke-2 dapat dilihat pada tabel dibawah:
Tabel 6.
Hasil Perhitungan Terhadap Cluster Pada Iterasi ke-2
Jarak
Nama Terdekat Agnes
2,1408720 6,5977923 10,025276 2,1408720
Oktariani 4,2720018 2,2054925 4,8825716 2,2054925 Aji Sunarya
Alia
10,242883 5,1183523 1,6517854 1,6517854
Alkhansa
Arphan
9,2511260 3,9126259 2,1744873 2,1744873
Chaerul Cluster Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro
JUKI : Jurnal Komputer dan Informatika
Volume 6 Nomor 1 Mei 2024
e-ISSN : 2722-4368
Nama Arya
Maulana
Syarif
Farell Joan
Susanto
Fauzan Zahy Zulfahmi Hapsah
Iin Inayah
Lutfia
Kerin
Aprillia
Maulana
Yusuf
Ibrahim
Maydera
Putri Amelia
Melany Putri
Muhamad
Dafa
Alfaritzi Naisa
Tiarani Niken
Aptasari Rafli Alif
Fikri
Ratna
Damayanti Reiza
Firjatullah Ridwan
Nugraha
Sela Mita
Ramjani Sri Wahyuni Suci
Tamimah
Pajriyah
Jarak
Terdekat Cluster
6,8007352
1,9657562
2,8974232
1,9657562
7,3654599
6,2115483
5,2201532
8,5195852
7,0651727
3,3793125
1,7881641
1,8189672
4,0930534
2,8631330
2,5288459
4,8711800
4,7674306
1,8724777
4,7205879
2,5288459
1,7881641
1,8189672
1,8724777
2,8631330
9,3050165
3,7383564
3,5364067
3,5364067
2,4324199
7,8898669
7,5702471
3,6632981
10,987647
2,8196838
2,4324199
2,8196838
10,594810
4,9190985
2,7999118
2,7999118
11,441882
3,4034296
3,9475730
2,8722813
2,2173557
9,5524865
6,2073234
2,9772802
8,5814902
3,8984010
4,9975302
4,1869874
6,1624109
3,5398960
2,3517789
2,9016810
3,0102704
5,8171733
11,773584
6,5281914
7,7284147
2,1227747
8,2229729
2,3934065
3,5048467
4,9052755
3,0102704
2,9772802
3,9475730
2,8722813
2,2173557
2,1227747
7,4777447
7,1821538
5,6494837
2,3934065
2,3517789
2,9016810
Diketahui bahwa ada perubahan pada data yang menghasilkan kelompok cluster yang baru dimana cluster 1 berjumlah 6 siswa, cluster 2 berjumlah 8 siswa, dan cluster 3 berjumlah 10 siswa.
Berikut anggota kelompok cluster yang baru:
Tabel 7.
Anggota Cluster Iterasi ke-2 Nama Agnes Oktariani Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Nama Aji Sunarya Alia Alkhansa Arphan Chaerul Arya Maulana Syarif Farell Joan Susanto Fauzan Zahy Zulfahmi Hapsah Iin Inayah Lutfia Kerin Aprillia Maulana Yusuf Ibrahim Maydera Putri Amelia Melany Putri Muhamad Dafa Alfaritzi Naisa Tiarani Niken Aptasari Rafli Alif Fikri Ratna Damayanti Reiza Firjatullah Ridwan Nugraha Sela Mita Ramjani Sri Wahyuni Suci Tamimah Pajriyah Karena masih terdapat hasil clustering yang bergerak pada iterasi ke-2, maka perhitungan dilanjutkan pada iterasi ke-3, dan titik pusat cluster ditentukan kembali sesuai dengan rata-rata anggota pada cluster untuk mendapatkan hasil perhitungan centroid baru.
Berikut merupakan nilai untuk centroid baru:
Centroid
PAI
80,666
Tabel 8.
Nilai Centroid Baru Iterasi ke-3
PPKN
IND
MTK
ENG
TAV
83,833 87,833 80,166
33333 33333 66667
80,625 83,375 82,75 79,625 81,75
DMI
82,166
PKK
82,666
82,625
Selanjutnya menghitung kembali jarak euclidean distance seperti pada langkah sebelumnya dan membandingkan hasil cluster dan diambil jarak minimum seperti langkah sebelumnya.
Berikut hasil perhitungan untuk iterasi ke-3 dapat dilihat pada tabel dibawah:
Tabel 9.
Hasil Perhitungan Terhadap Cluster Pada Iterasi ke-3
Nama Jarak Terdekat Agnes Oktariani 2,140872096 6,219927652 9,956404974 2,140872096 Aji Sunarya
4,272001873 1,785357107 4,871344784
1,785357107
Alia Alkhansa
10,24288371 5,402545696 1,769180601
1,769180601
Arphan Chaerul
9,251126058 4,235268587 2,032240143
2,032240143
Arya Maulana
6,800735254 2,106537443 2,816025568
2,106537443
Syarif
Farell Joan
7,365459931 3,418698583 2,670205985
2,670205985
Susanto
Fauzan Zahy 6,211548385 1,920286437 4,661544808 1,920286437 Zulfahmi Hapsah
5,220153254 1,639359631 4,661544808
1,639359631
Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro
Cluster
JUKI : Jurnal Komputer dan Informatika
Volume 6 Nomor 1 Mei 2024
e-ISSN : 2722-4368
Nama Iin Inayah Lutfia
Kerin Aprillia
Maulana Yusuf
Ibrahim
Maydera Putri
Amelia
Melany Putri
Muhamad Dafa
Alfaritzi Naisa Tiarani Niken Aptasari Rafli Alif Fikri
Ratna Damayanti Reiza Firjatullah Ridwan Nugraha
Sela Mita Ramjani Sri Wahyuni Suci
Tamimah Pajriyah
8,519585279
7,065172798
4,235268587
2,989565186
2,080865205
4,553020975
Jarak Terdekat 2,080865205 2,989565186 Cluster
9,305016568
4,20565096
3,182766093
3,182766093
2,43241992
7,189401922
10,92382717
2,43241992
7,889866919
3,766629793
2,886173938
2,886173938
10,59481005
5,332682252
2,555386468
2,555386468
11,44188213
3,403429643
3,947573094
2,872281323
2,217355783
9,552486587
7,477744758
7,182153809
5,649483752
6,51440711
2,633913438
8,242420761
3,491060011
4,575751304
4,493050189
5,760859311
3,596873642
2,633913438
2,772634127
3,05450487
5,77321401
11,71025192
6,536818798
7,741446893
2,032240143
8,302409289
2,555386468
3,306055051
4,850773134
3,05450487
2,633913438
3,947573094
2,872281323
2,217355783
2,032240143
2,555386468
2,633913438
2,772634127
Diketahui bahwa tidak ada perubahan pada data yang menghasilkan kelompok cluster yang dimana cluster 1 berjumlah 6 siswa, cluster 2 berjumlah 8 siswa, dan cluster 3 berjumlah 10 siswa.
Berikut anggota kelompok cluster yang baru:
Tabel 10.
Anggota Cluster Iterasi ke-3 Nama Agnes Oktariani Aji Sunarya Alia Alkhansa Arphan Chaerul Arya Maulana Syarif Farell Joan Susanto Fauzan Zahy Zulfahmi Hapsah Iin Inayah Lutfia Kerin Aprillia Maulana Yusuf Ibrahim Maydera Putri Amelia Melany Putri Muhamad Dafa Alfaritzi Naisa Tiarani Niken Aptasari Rafli Alif Fikri Ratna Damayanti Reiza Firjatullah Ridwan Nugraha Sela Mita Ramjani Sri Wahyuni Suci Tamimah Pajriyah Pada perhitungan ini iterasi berhenti di iterasi ke-3 karena tidak ada cluster yang berpindah lagi.
Hal ini menunjukkan bahwa hasil cluster telah mencapai stabil dan konvergen.
Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 Pembahasan Proses Pengujian Menggunakan RapidMiner Pada proses ini, metode klasterisasi dengan algoritma K-Means diterapkan untuk pembentukan kelompok cluster dengan akurat.
Dalam penelitian ini menggunakan pengujian dengan tools RapidMiner Studio versi 10.
Adapun langkah-langkahnya sebagai berikut:
Sebelum melakukan pengolahan data menggunakan RapidMiner, perlu mengunggah dataset yang akan digunakan.
Operator yang digunakan adalah Read Excel karena format data yang digunakan adalah *xlsx (Microsoft Excel Workshee.
Kemudian pada kolom AuNamaAy ubah type role datanya menjadi id karena kolom ini bersifat nonnumeric sehingga algoritma K-Means tidak akan bekerja jika type role kolom AuNamaAy masih Lalu pada Operator Modeling Ae Segmentation Ae drag Operator k-Means.
Ubah jumlah k sesuai dengan jumlah cluster yang sudah ditentukan adalah sebanyak 3 cluster.
Atur Measure Types menjadi BregmanDivergences karena data yang akan diuji hanya atribut nilai siswa saja yang memiliki type data integer.
Untuk Divergence pilih SquaredEuclideanDistance karena perhitungan clustering menggunakan rumus EuclideanDistance untuk menghitung jarak objek ke pusat cluster.
Terakhir, drag Operator Performance (Cluster Distance Performanc.
Tahapan performance ini bertujuan untuk mencari nilai DBI (Davies Bouldin Inde.
Gambar 3.
Proses Pengujian RapidMiner Hasil Pengujian Algotima K-Means Dari hasil pengujian dengan 3 cluster maka selanjutnya akan dicari nilai DBI (Davies Bouldin Inde.
Nilai DBI digunakan untuk mengukur kedekatan antar data dalam satu kelompok data.
Berikut nilai Davies Bouldin Index yang dihasilkan adalah:
Gambar 4.
Hasil Nilai Davies Bouldin Index Dari gambar diatas dapat dilihat hasil yang diperoleh mendekati 0 yang berarti semakin kecil nilai Davies Bouldin Index yang diperoleh maka semakin baik cluster yang dihasilkan.
KESIMPULAN
Berdasarkan hasil penelitian yang sudah dilakukan.
dapat diambil kesimpulan bahwa penerapan algoritma K-Means dalam mengelompokkan siswa berprestasi berdasarkan nilai siswa dapat diterapkan dengan baik.
Dari proses pengujian yang dilakukan mendapatkan hasil cluster_1 (C.
kategori tinggi sebanyak 25% dengan jumlah 6 siswa, hasil cluster_2 (C.
kategori cukup sebanyak 35% dengan jumlah 8 siswa, dan hasil cluster_0 (C.
kategori rendah sebanyak 40% dengan jumlah 10 siswa.
Berdasarkan hasil pencarian nilai Davies Bouldin Index (DBI), hasil dari perhitungan yang telah dilakukan menghasilkan nilai DBI 0.
144 atau Penerapan Data Mining untuk Pemetaan Siswa Berprestasi menggunakan Metode Clustering K-Means Oleh : Nia Dwi Rahayu.
Abdul Halim Anshor.
Irfan Afriantoro JUKI : Jurnal Komputer dan Informatika Volume 6 Nomor 1 Mei 2024 e-ISSN : 2722-4368 mendekati dengan 0 sehingga dapat disimpulkan bahwa hasil cluster yang dihasilkan cukup baik.
Dengan hasil clustering yang telah diterapkan diharapkan bisa membantu dalam mengambil keputusan dengan tepat untuk menentukan siswa berprestasi.
DAFTAR PUSTAKA