Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Penerapan Data Mining Dengan Menggunakan Algoritma Clustering K-Means Untuk Pembagian Jurusan Pada Sekolah Menengah Atas Ikbal Danu Setiawan. Agung Triayudi* Prodi Magister Teknologi Informasi. Fakultas Teknologi Komunikasi dan Informatika. Universitas Nasional. Jakarta. Indonesia Email: 1ikbaldanusetiawan2017@student. id, 2,*agungtriayudi@civitas. Email Penulis Korespondensi: agungtriayudi@civitas. Submitted: 23/02/2024. Accepted: 27/02/2024. Published: 28/02/2024 AbstrakOeSekolah Menangah Atas merupakan jenjang terakhir yang wajib ditempuh sebelum melanjutkan pendidikan pada tingkat lebih tinggi seperti Diploma ataupun Sarjana. Dimana pada umumnya Sekolah Menengah Atas terdapat penjurusan kelas untuk siswa/I yang akan naik ke kelas XI dari kelas X. Pembagian jurusan terhadap siswa/I bertujuan untuk meningkatkan mutu pendidikan dari para siswa/I keberlangusngan proses belajar mengajar yang terjadi didalam kelas. Peningkatan kualitas pendidikan yang dilakukan pada proses penjurusan kelas terdapat dimana para siswa nantinya akan lebih fokus sesuai dengan bidang minat jurusan yang seharusnya diambil oleh pata siswa/I. Proses yang terjadi dalam penentuan jurusan hanya berdasarkan dengan keinginan yang disampaikan oleh para siswa/I tanpa memperhitungkan nilai Ae nilai akademik dari mata pelajaran yang telah dilalui ataupun diselesaikan para siswa/I di kelas X. Permasalahan tersebut bukanlah sebuah masalah kecil yang harus diabaikan, hal tersebut merupakan sebuah permasalahan penting yang harus segera diselesaikan dikarenakan jika permasalahan tersebut tidak diselesaikan dengan segera maka akan menimbulkan dampak yang berkelanjutan nantinya. Proses penentuan dari pembagian jurusan para siswa/I dapat dilihat berdasarkan dengan pola atau nilai Ae nilai dari para siswa/I sebelumnya. Data mining merupakan sebuah proses yang dipergunakan untuk menyelesaikan proses terhadap data yang besar. Data yang diproses merupakan kumpulan Ae kumpulan data yang menjadi sebuah Big Data dari data dimasa lampau yang tersimpan pada sebuah wadah penyimpanan dan kemudian dapat dipergunakan kembali dengan melakukan proses pengolahan. Clustering merupakan cara yang sesuai untuk menyelesaikan Dimana pada clustering dilakukan pengelompokan berdasarkan dengan jarak terhadap setiap objek data. Algoritma K-Means merupakan bagian dari Clustering Data Mining, dimana pada algoritma tersebut dapat digunakan untuk melakukan pengelompokan baru berdasarkan dengan cara pembentukan cluster. Dari hasil yang didapatkan bahwasannya terdapat 2 . cluster pembentukan baru. Pada cluster 1 terdapat 9 . siswa dan pada cluster 2 terdapat 6 . Kata Kunci: Sekolah Menengah Atas. Penjurusan. Kelas. Data Mining. Algoritma K-Means AbstractOeSenior High School is the last level that must be taken before continuing education at a higher level such as a Diploma or Bachelor's degree. Where in general high schools have class majors for students who will move up to class XI from class Improving the quality of education carried out in the class majoring process means that students will be more focused in accordance with the field of interest of the major that the student/I should take. The process that occurs in determining majors is only based on the wishes expressed by the students without taking into account the academic grades of the subjects that the students have passed or completed in class X. This problem is not a small problem that should be ignored, it This is an important problem that must be resolved immediately because if the problem is not resolved immediately it will have lasting impacts later. The process of determining the division of majors for students can be seen based on the patterns or values of previous students. Data mining is a process used to complete processing of large data. The data that is processed is a collection of data that becomes Big Data from past data that is stored in a storage container and can then be reused by processing it. Clustering is an appropriate way to solve problems. Where in clustering grouping is carried out based on the distance to each data object. The K-Means algorithm is part of Clustering Data Mining, where this algorithm can be used to carry out new groupings based on how clusters are formed. From the results obtained, there are 2 . new formation clusters. In cluster 1 there are 9 . students and in cluster 2 there are 6 . Keywords: Senior High School. Majoring. Class. Data Mining. K-Means Algorithm PENDAHULUAN Sekolah menengah atas merupakan pendidikan tingkat atas yang wajib ditempuh oleh anak Ae anak di Indonesia sesuai dengan program kerja yang di instruksikan dari pemerintah yaitu wajib belajar 12 . ua bela. Sekolah Menangah Atas merupakan jenjang terakhir yang wajib ditempuh sebelum melanjutkan pendidikan pada tingkat lebih tinggi seperti Diploma ataupun Sarjana. , . Pada Sekolah Menengah Atas ditempuh pada kelas X. XI dan XII. Dimana pada umumnya Sekolah Menengah Atas terdapat penjurusan kelas untuk siswa/I yang akan naik ke kelas XI dari kelas X. Penjurusan kelas bertujuan untuk mengelompokan para siswa/I untuk masuk dalam kelas Ilmu Pengetahuan Alam (IPA) ataupun Ilmu Pengetahuan Sosial (IPS). , . Pembagian jurusan terhadap siswa/I bertujuan untuk meningkatkan mutu pendidikan dari para siswa/I keberlangusngan proses belajar mengajar yang terjadi didalam kelas. Dimana proses pembagian jurusan kelas terhadap siswa/I berkenaan langsung ataupun berkaitan langsung dengan para siswa/I yang akan naik tingkat menjadi kelas XI. Penjurusan kelas pada Sekolah Menengah Atas biasanya dilakukan oleh bagian kesiswaan berkolaborasi dengan para wali kelas. , . Copyright A 2024 the auhor. Page 380 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Peningkatan kualitas pendidikan yang dilakukan pada proses penjurusan kelas terdapat dimana para siswa nantinya akan lebih fokus sesuai dengan bidang minat jurusan yang seharusnya diambil oleh pata siswa/I. Pembagian jurusan yang tidak sesuai dengan kemampuan dari para siswa/I tentu akan sangat merugikan bagi para siswa/I dimana hasil nilai akademik yang didapatkan pada keberlanjutan kelas akan berantakan dan juga tidak sesuai dengan studi lanjut pada perguruan tinggi nantinya. , . Proses yang terjadi dalam penentuan jurusan hanya berdasarkan dengan keinginan yang disampaikan oleh para siswa/I tanpa memperhitungkan nilai Ae nilai akademik dari mata pelajaran yang telah dilalui ataupun diselesaikan para siswa/I di kelas X. Penentuan pembagian jurusan tersebut yang memiliki banyak kelemahan dan juga kerugian bukan saja bagi siswa/I tetapi juga bagi para guru yang mengajar nantinya. Dimana seharusnya proses penjurusan kelas berdasarkan dengan nilai akademik yang didapatkan dari para siswa/I. Permasalahan tersebut bukanlah sebuah masalah kecil yang harus diabaikan, hal tersebut merupakan sebuah permasalahan penting yang harus segera diselesaikan dikarenakan jika permasalahan tersebut tidak diselesaikan dengan segera maka akan menimbulkan dampak yang berkelanjutan nantinya. Dampak yang dihadapi bagi sekolah adalah tidak dapat mengeluarkan potensi akademik secara keseluruhan yang dimilik oleh para siswa/I. Proses penentuan dari pembagian jurusan para siswa/I dapat dilihat berdasarkan dengan pola atau nilai Ae nilai dari para siswa/I sebelumnya. Dari pola tersebut nantinya akan membantu dan memudahkan bagi pihak sekolah untuk melakukan proses penentuan jurusan berdasarkan dengan nilai yang didapatkan dari para siswa/I Maka dari itu penyelesaian terhadap permasalahan sudah seharusnya mempertimbangkan terhadap sebuah cara. Salah satu cara yang mungkin dapat dipergunakan untuk menyelesaikan permasalahan tersebut dengan menggunakan data mining. Data mining merupakan sebuah proses yang dipergunakan untuk menyelesaikan proses terhadap data yang besar. Data yang diproses merupakan kumpulan Ae kumpulan data yang menjadi sebuah Big Data dari data dimasa lampau yang tersimpan pada sebuah wadah penyimpanan dan kemudian dapat dipergunakan kembali dengan melakukan proses pengolahan. Proses pengolahan terhadap data pada data mining bertujuan untuk menemukan sebuah informasi kembali ataupun informasi yang penting tersimpan dari data dan nantinya dapat dipergunakan dalam proses pengambilan keputusan. Pada data mining sendiri hasil informasi yang didapatkan dapat divisualisasi dalam berbagai macam bentuk sesuai dengan informasi seperti apa yang akan diinginkan. Dalam data mining sendiri, proses penyelesaian terbagi atas beberapa kelompok cara dan pada penelitian ini proses penyelesaian berdasarkan dengan clustering. Ae. Pada data mining clustering merupakan sebuah cara yang merupakan bagian dari pada unsupervised learning dimana data yang dilakukan pengolahan merupakan data yang masih belum memiliki tujuan kelasnya. Clustering merupakan cara yang sesuai untuk menyelesaikan permasalahan. Dimana pada clustering dilakukan pengelompokan berdasarkan dengan jarak terhadap setiap objek data. , . Pengelompokan yang dilakukan pada clustering juga berdasarkan dengan kesamaan karakteristik yang dimiliki oleh setiap data. Maka dari itu, pada penelitian ini clustering lebih tepat untuk menyelesaikan permasalahan tersebut. Clustering pada data mining sendiri terdapat beberapa algoritma yang dapat dipergunakan untuk menyelesaikan permasalahan, salah satunya adalah algoritma K-Means. , . Algoritma K-Means merupakan bagian dari Clustering Data Mining, dimana pada algoritma tersebut dapat digunakan untuk melakukan pengelompokan baru berdasarkan dengan cara pembentukan cluster. Pada algoritma K-Means proses pembentukan cluster berdasarkan dengan karaktersitik dari setiap objek yang terdapt pada data. Karakteristik tersebut dapat dilihat berdasarkan dengan nilai jarak terdekat yang dimiliki pada data. Proses yang dilakukan pada algoritma K-Means berdasarkan dengan proses iterasi yang dilakukan, dimana proses iterasi dilakukan untuk menghitung kedekatan dari setiap jarak antar objek data. , . Pada proses iterasi yang dilakukan terlebih dahulu ditentukan nilai titik pusat . sebagai dasar penentuan kelompok. Dari nilai tersebut nantinya akan dilakukan proses pengolahan data secara keseluruhan. Proses iterasi yang dilakukan pada algoritma K-Means dilakukan berulang dimana akan berhenti jika cluster yang terbentuk sudah tidak terdapat perubahan lagi. , . Untuk membantu dalam pelaksanaan penelitian, diperlukan beberapa penguat berdasarkan dengan penelitian terdahulu yang telah dilakukan seperti penelitian dari Preddy Marpaung, dkk pada tahun 2023 dengan judul penelitian yang dilakukan Penerapan Data Mining Untuk Pengelompokan Kepadatan Penduduk Kabupaten Deli Serdang Menggunakan Algoritma K-Means dan hasil yang diapatkan dari penelitian bahwa Dengan hasil penggunaan algoritma K-Means dapat menghasilkan, bahwa dari 22 kecamatan yang ada, terdapat 3 kecamatan Sangat Padat . , 4 kecamatan padat . , dan 15 kecamatan sedang . Penelitian lainnya yang juga telah dilakukan oleh Suharmanto, dkk pada tahun 2023 dengan judul penelitian Penerapan Data Mining Menggunakan Algoritma K-Means Untuk Clustering Perokok Usia Lebih dari 15 Tahun hasil yang didapatkan dengan menggunakan Clustering K-Means untuk mengetahui pengelompokkan perokok dengan usia lebih dari 15 tahun di setiap daerah pengelompokkan perokok dengan rentan usia lebih dari 15 tahun dapat dilihat melalui 3 cluster. Selain itu, juga terdapat penelitian yang dilakukan oleh Davit Ariyanto pada tahun 2022 dimana judul penelitian yaitu Data Mining Menggunakan Algoritma K-Means untuk Klasifikasi Penyakit Infeksi Saluran Copyright A 2024 the auhor. Page 381 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Pernafasan Akut serta hasil dari proses penelitian berupa hasil terdapat proses pembentukan cluster yaitu terdapat 3 . cluster terhadap penyakit ISPA. Penelitian terakhir yang digunakan sebagai acuan penelitian yang dilakukan oleh Rafki Mauliadi pada tahun 2022 dengan judul penelitian Data Mining Menggunakan Algoritma K-Means Clustering dalam Analisis Tingkat Potongan Harga Terhadap Harga Jual Sepeda Motor Honda dan hasil dari penelitian hasil dari pengujian terhadap algoritma ini adalah 3 cluster dengan 42 data uji, pada cluster 1 terdapat 34 tipe kendaraan mendapat potongan harga, kemudian cluster 2 sebanyak 7 tipe kendaraan boleh dapat potongan harga dan cluster 3 sebanyak 1 tipe kendaraan tidak dapat potongan harga. Berdasarkan dengan penjabaran diatas, maka dari itu pada penelitian ini akan dilakukan sebuah proses penelitian untuk melakukan proses penjurusan terhadap para siswa/I pada Sekolah Menengah Atas. Penjurusan kelas dilakukan dengan mempertimbangkan nilai akademik yang didapatkan dari para siswa/I di kelas X. Tujuan dari penelitian agar kiranya tidak lagi terdapat kekeliruan terhadap proses penjurusan para siswa/I yang memiliki dampak cukup panjang bagi keberlangsungan masa depan dari para siswa/I METODOLOGI PENELITIAN 1 Tahapan Penelitian Penelitian merupakan suatu kegiatan ilmiah yang bertujuan untuk memperoleh data yang kemudian digunakan untuk kepentingan tertentu. Seseorang yang melakukan penelitian disebut juga dengan istilah peneliti. Penelitian yang termasuk kegiatan ilmiah, maka dalam melakukan kegiatan ini, harus dilakukan dengan cara-cara yang sistematis, rasional atau masuk akal, dan data-data yang valid atau sesuai dengan fakta. Supaya penelitian tidak dilakukan secara asal-asalan, maka bagi peneliti harus menggunakan yang namanya metodologi penelitian. Metodologi penelitian adalah suatu cara atau teknik untuk mendapatkan informasi dan sumber data yang akan digunakan dalam penelitian. Dengan adanya tahapan penelitian ini penelitian yang dilakukan dapat terstruktur dengan baik dan tidak ada proses yang dilakukan berulang. Informasi atau data ini bisa dalam bentuk apa saja, literatur, seperti jurnal, artikel, tesis, buku, koran, dan sebagainya. Bahkan sumber data bisa juga diperoleh dari survei atau wawancara. Dalam melakukan penelitian ini,ada beberapa tahap yang dipakai agar mendapatkan data yang sangat diperlukan sebagai berikut: Gambar 1. Tahapan Penelitian Berdasarkan dengan gambar 1, maka dapat diketahui terhadap penjelasan secara ringkas dari setiap tahapan penelitian yang dilakukan: Analisa Masalah Analisa masalah digunakan untuk memecahkan suatu masalah penelitian serta menganalisa data dalam melakukan suatu kejadian sebelum melakukan perancangan ataupun perhitungan. Pengumpulan data Pada tahap ini dilakukan pengumpulan data-data yang diperlukan sebagai bahan untuk memcahkan masalah yang telah dirumuskan. Pengumpulan data dilakukan dengan observasi secara langsung dan wawancara Studi Literatur Digunakan untuk mempelajari serta menambah pemahaman penelitian tentang dalam menganalisa secara khusus serta membaca jurnal-jurnal ataupun referensi lainnya yang terkait dengan Analisa dan Penerapan Metode dalam penelitian ini yaitu dimulai dengan menganalisa permasalahan yang terjadi dalam proses pemilihan jurusan siswa/I pada Sekolah Menengah Atas. Dimulai dari menganalisa Copyright A 2024 the auhor. Page 382 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. sistem lama, setelah itu dilanjutkan dengan menganalisa dengan menggunakan cara baru dan menerapkan algoritma K-Means. Laporan Penelitian Pada tahap ini membuat laporan dari keseluruhan penelitian ini, untuk melihat apakah hasil dari penelitian ini sudah sesuai dengan yang diharapkan, dan dilanjut dengan membuat suatu kesimpulan dari penelitian tersebut. 2 Data Mining Data mining merupakan prose pengolahan data yang banyak digunakan pada saat ini. Dimasa sekarang ini peran data mining sangatlah krusial, hal tersebut dikarenakan perannya yang cukup penting dalam proses pengambilan Peran data mining dalam pengambilan keputusan berdasarkan dengan pengolahan data yang dilakukan. , . Pengolahan data yang dilakukan pada data mining merupakan data yang besar dari kumpulan Ae kumpulan data sebelumnya. Kumpulan data tersebut nantinya dilakukan penggalian kembali untuk mendapatkan informasi yang berharga dari kumpulan data tersebut. Informasi tersebut nantinya dapat membantu dalam proses pengambilan keputusan yang dilakukan. Pada data mining sendiri tidak berjalan dengan sendirian, dimana pada data mining terdapat berbagai macam cara penyelesaian seperti Asosiasi. Estimasi. Prediksi. Klasifikasi dan Klasterisasi. Ae. 3 Algoritma K-Means K-Means adalah salah satu algoritma clustering yang sangat popular karenakesederhanaan dan kemampuannya dalam menangani data dengan skala besar. Namun demikian algoritma ini sangat sensitif terhadap centroid awal. Perbedaan centroid awal akan memberikan perbedaan hasil clustering dan apabila centroid awal yang diberikan adalah centroid yang tidak baik maka dapat dipastikan hasil clusteringnya juga tidak baik . Dengan metode pengelompokan berdasarkan jarak, teknik K-means yang dianggap sebagai metode pengelompokan klasik. Salah satu fitur utama yang membuat K-means berguna dalam penelitian ini adalah kemungkinan menentukan terlebih dahulu berapa banyak cluster yang sedang dicari. Jumlah ini mengacu pada parameter K. Dari jumlah ini, poin K dipilih dalam cluster random sebagai pusat cluster. Semua variabel ditugaskan ke pusat cluster terdekat mereka sesuai dengan metrik jarak Euclidean. Dengan rumus jarak Eucludean Distance sebagai berikut. Ae. HASIL DAN PEMBAHASAN Penjuruan kelas bagi siswa kelas XI Sekolah Menangah Atas sangatlah penting, hal tersebut dikarenakan proses penjurusan kelas merupakan salah satu bagian cara untuk meningkatkan kualitas pendidikan. Dimana dengan penjurusan kelas bagi para siswa/I akan sangat membantu untuk meningkatkan minat belajar yang dimiliki oleh siswa hingga dapat memaksimalkan proses pembelajaran yang dilakukan. Selama ini proses penjurusan kelas berdasarkan dengan keingingan dari para siswa/I tanpa mempertimbangkan kemampuan ataupun nilai akademik mata pelajaran yang didapat oleh para siswa/I. Kesalahan dalam penjurusan kelas tentu akan memiliki dampak yang cukup besar bukan saja bagi para siswa/I tetapi juga bagi para guru. Dampak yang paling nyata dihadapi adalah ketidaksesuaian jurusan dengan kemampuan siswa/I maka tidak dapat memaksimalkan kemampuan yang dimiliki ataupun juga proses kelanjutan studi pada tingkat perguruan tinggi. Permasalahan tersebut dapat diselesaikan dengan menemukan pola berdasarkan dengan data Ae data sebelumnya. Maka dari itu, data mining merupakan sebuah cara yang tepat dipergunakan untuk menylesaikan permasalahan tersebut. Dimana data mining merupakan sebuah cara yang dilakukan untuk melakukan penggalian data hingga didapatkan informasi Ae informasi baru. Salah satu cara pada data mining yang dapat dipergunakan yaitu clustering. Clustering pada data mining berutujuan untuk membentuk kelompok baru berdasarkan dengan karakteristik data ataupun kedekatan dari setiap objek data. Salah satu algoritma yang dapat dipergunakan untuk menyelesaikan permasalahan adalah algoritma K-Means. Algoirtma K-Means bagian clustering data mining yang bertujuan untuk membentuk data baru berdarsarkan dengan euclidean distance, pada algoritma K-Means dilakukan perhitungan jarak terdekat berdasarkan dengan nilai centeroid awal dan juga data yang tersedia sebagai dataset. 1 Penerapan Algoritma K-Means Setelah dilakukan proses pendahuluan secara matang, maka selanjutnya dilakukan proses penyelesaian permasalahan dengan menggunakan algoritma K-Means. Sebelum dilakukan proses penyelesaian tersebut terlebih dahulu diketahui terhadap data yang akan digunakan dalam proses penyelesaian. Data yang digunakan dapat dilihat pada tabel 1 berikut. Tabel 1. Data Nilai Siswa/I Siswa Siswa 1 NMP1 NMP2 NMP3 NMP4 NMP5 Copyright A 2024 the auhor. Page 383 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Siswa Siswa 2 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 8 Siswa 9 Siswa 10 Siswa 11 Siswa 12 Siswa 13 Siswa 14 Siswa 15 NMP1 NMP2 NMP3 NMP4 NMP5 Pada tabel 1 tersebut dapat dilihat bahwasannya terdapat 15 . ima bela. nilai data siswa/I selain itu juga terdapat masing Ae masing nilai mata pelajaran dari siswa, dimana pada data tersebut terdapt 5 . nilai mata pelajaran siswa. Selanjutnya setelah diketahui terhadap data yang akan digunakan pada penelitian maka selanjutnya sudah dapat dilakukan proses penyelesaian permasalahan dengan menggunakan algoritma K-Means. Adapun proses penyelesaian algoritma K-Means dapat dilihat berikut: Iterasi Ae 1 Menentukan jumlah clusters. Dalam hal ini jumlah cluster yang ditentukan dalam penelitian yaitu 2 . dimana cluster tersebut merupakan pembagian terhadap kelas Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Langkah selanjutnya yaitu menentukan nilai centeroid awal. Nilai centeroid awal berdasarkan dengan data set awal nilai siswa. Dimana pada hal ini ditentukan 2 . nilai centeroid awal untuk mewakili Cluster 1 dan Cluster 2. Disini untuk nilai centeroid awal diambil data Siswa 7 sebagai Cluster 1 dan Siswa 11 sebagai Cluster 11. Adapun untuk nilai centeroid awal dapat dilihat pada tabel 2 berikut: Tabel 2. Nilai Centeroid Awal Siswa Siswa 7 Siswa 11 NMP1 NMP2 NMP3 NMP4 NMP5 Langkah ketiga setelah diketahui nilai centeroid awal yaitu menghitung nilai kedekatan jarak dari centeroid awal terhadap jarak yang terdapat pada data. Dimana perhitungan tersebut dilakukan dengan menggunakan rumus euclidean distance: oc d. 1, c. = Oo( = Oo( d. 2, c. = Oo( = Oo( d. 3, c. = Oo( = Oo( d. 4, c. = Oo( = Oo( d. 5, c. = Oo( = Oo( d. 6, c. = Oo( = Oo( Cluster Ae 1 Copyright A 2024 the auhor. Page 384 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. 7, c. = Oo( = Oo( d. 8, c. = Oo( = Oo( d. 9, c. = Oo( = Oo( d. 10, c. = Oo( = Oo( d. 11, c. = Oo( = Oo( d. 12, c. = Oo( = Oo( d. 13, c. = Oo( = Oo( d. 14, c. = Oo( = Oo( d. 15, c. = Oo( = Oo( d. 1, c. = Oo( = Oo( d. 2, c. = Oo( = Oo( d. 3, c. = Oo( = Oo( d. 4, c. = Oo( = Oo( d. 5, c. = Oo( = Oo( d. 6, c. = Oo( = Oo( d. 7, c. = Oo( = Oo( d. 8, c. = Oo( = Oo( Cluster Ae 2 Copyright A 2024 the auhor. Page 385 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. 9, c. = Oo( = Oo( d. 10, c. = Oo( = Oo( d. 11, c. = Oo( = Oo( d. 12, c. = Oo( = Oo( d. 13, c. = Oo( = Oo( d. 14, c. = Oo( = Oo( d. 15, c. = Oo( = Oo( Setelah proses perhitungan jarak terdekat dengan menggunakan ecluidean distance, selanjutnya maka hasil perthitungan disusun kembali dan kemudian memilih untuk jarak terdekat terdapat pada cluster mana. Adapun hasil tersebut dapat dilihat pada tabel 3 berikut: Tabel 3. Hasil Perhitungan Jarak Iterasi 1 Siswa Siswa 1 Siswa 2 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 8 Siswa 9 Siswa 10 Siswa 11 Siswa 12 Siswa 13 Siswa 14 Siswa 15 NMP1 NMP2 NMP3 NMP4 NMP5 DC1 23,96 21,00 27,09 7,94 19,00 13,38 0,00 41,46 28,79 20,30 23,62 20,15 37,40 34,70 32,03 DC2 32,71 15,97 29,50 24,06 25,51 29,61 23,62 34,74 24,06 29,70 0,00 23,02 21,24 36,91 22,32 Hasil Cluster Iterasi Ae 2 Proses selanjutnya yang dilakukan yaitu melakukan proses perhitungan pada iterasi Ae 2, samal halnya dengan iterasi Ae 1 tetapi pada iterasi Ae 2 nilai centeroid didapati berdasarkan dengan nilai rata Ae rata yang didapatkan dari hasil pembentukan cluster sebelumnya. Nilai centeroid cluster 1 terlihat pada tabel 4 berikut ini. Tabel 4. Nilai Rata Ae Rata Cluster 1 Siswa Siswa 1 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 10 NMP1 NMP2 NMP3 NMP4 NMP5 Copyright A 2024 the auhor. Page 386 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Siswa Siswa 12 Siswa 14 Nilai Rata - Rata NMP1 85,89 NMP2 91,00 NMP3 85,56 NMP4 74,56 NMP5 79,11 Selanjutnya, setelah didapatkan nilai rata Ae rata cluster 1 maka juga dilakukan perhitungan nilai rata Ae rata Adapun nilai rata Ae rata dapat dilihat pada tabel 5 berikut. Tabel 5. Nilai Rata Ae Rata Cluster 2 Siswa Nilai Rata - Rata NMP1 92,33 NMP2 86,83 NMP3 87,33 NMP4 92,50 NMP5 83,67 Pada tabel 5 dapat dilihat nilai rata Ae rata untuk cluster 2, setelah didapatkan nilai rata untuk cluster 1 dan cluster 2 maka nilai rata Ae rata tersebut dipergunakan sebagai nilai centeroid baru pada iterasi 2. Adapun nilai centeroid baru dapat dilihat pada tabel 6 berikut. Tabel 6. Nilai Centeroid Baru Cluster NMP1 85,89 92,33 NMP2 91,00 86,83 NMP3 85,56 87,33 NMP4 74,56 92,50 NMP5 79,11 83,67 Setelah didapatkan nilai centeroid baru seperti pada tabel 6 diatas, maka selanjut dilakukan proses yang sama dengan menghitunga kembali jarak antara objek dengan nilai centeroid. Adapun proses tersebut dapat dilihat berikut ini: Menghitung jarak objek berdasarkan dengan rumus euclidean distance Cluster Ae 1 d. 1, c. = Oo( = Oo( d. 2, c. = Oo( d. 5, c. = Oo( d. 6, c. = Oo( d. 8, c. = Oo( d. 9, c. = Oo( = Oo( = Oo( = Oo( d. 7, c. = Oo( = Oo( = Oo( = Oo( d. 4, c. = Oo( = Oo( d. 3, c. = Oo( Copyright A 2024 the auhor. Page 387 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. = Oo( d. 10, c. = Oo( = Oo( d. 11, c. = Oo( d. 13, c. = Oo( d. 15, c. = Oo( =Oo( =Oo( = Oo( d. 7, c. = Oo( d. 8, c. = Oo( =Oo( d. 10, c. = Oo( = Oo( d. 11, c. = Oo( =Oo( d. 9, c. = Oo( =Oo( =Oo( =Oo( =Oo( d. 6, c. = Oo( = Oo( d. 5, c. = Oo( = Oo( d. 4, c. = Oo( d. 14, c. = Oo( = Oo( d. 3, c. = Oo( = Oo( d. 2, c. = Oo( d. 12, c. = Oo( = Oo( Cluster Ae 2 d. 1, c. = Oo( Copyright A 2024 the auhor. Page 388 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. = Oo( d. 12, c. = Oo( = Oo( d. 13, c. = Oo( = Oo( d. 14, c. = Oo( = Oo( d. 15, c. = Oo( = Oo( Setelah proses perhitungan jarak terdekat dengan menggunakan ecluidean distance, selanjutnya maka hasil perthitungan disusun kembali dan kemudian memilih untuk jarak terdekat terdapat pada cluster mana. Adapun hasil tersebut dapat dilihat pada tabel 7 berikut. Tabel 7. Hasil Perhitungan Jarak Iterasi 2 Siswa Siswa 1 Siswa 2 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 8 Siswa 9 Siswa 10 Siswa 11 Siswa 12 Siswa 13 Siswa 14 Siswa 15 NMP1 NMP2 NMP3 NMP4 NMP5 DC1 20,05 22,97 18,26 9,94 16,86 11,47 13,10 30,11 18,78 12,37 23,55 17,53 30,89 22,50 27,95 DC2 25,26 20,02 25,73 24,34 24,62 28,52 26,84 21,18 11,03 27,92 14,95 22,92 16,03 26,34 14,03 Hasil Cluster Setelah dilakukan proses hasil perhitungan jarak pada iterasi 2, selanjutnya melakukan perbandingan hasil antara iterasi 1 dan hasil pada iterasi 2. Apakah terdapat perubahan hasil cluster atau tidak. Adapun perbandingan hasil dapat dilihat berikut pada tabel 8. Tabel 8. Hasil Perbandingan Cluster Iterasi 1 dan Iterasi 2 Siswa Siswa 1 Siswa 2 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 8 Siswa 9 Siswa 10 Siswa 11 Siswa 12 Siswa 13 Siswa 14 Siswa 15 NMP1 NMP2 NMP3 NMP4 NMP5 Hasil Iterasi 1 Hasil Iterasi 2 Copyright A 2024 the auhor. Page 389 This Journal is licensed under a Creative Commons Attribution 4. 0 International License Journal of Computer System and Informatics (JoSYC) ISSN 2714-8912 . edia onlin. ISSN 2714-7150 . edia ceta. Volume 5. No. February 2024. Page 380-392 https://ejurnal. seminar-id. com/index. php/josyc DOI 10. 47065/josyc. Pada tabel 8 diatas dapat dilihat hasil perbandingan iterasi, dapat dilihat dari hasil tersebut bahwasannya tidak terdapat perubahan hasil cluster. Maka dari itu proses iterasi dihentikan dan hasil cluster dapat dibagi menjadi kelompok berikut: Tabel 9. Hasil Pengelompokan Cluster Siswa Hasil Cluster 1 Siswa 1 Siswa 3 Siswa 4 Siswa 5 Siswa 6 Siswa 7 Siswa 10 Siswa 12 Siswa 14 Hasil Cluster 2 Siswa 2 Siswa 8 Siswa 9 Siswa 11 Siswa 13 Siswa 15 Pada tabel 9 dapat dilihat hasil terhadap pembentukan cluster dimana pada cluster 1 terdapat 9 . siswa yaitu Siswa 1. Siswa 3. Siswa 4. Siswa 5. Siswa 6. Siswa 7. Siswa 10. Siswa 12 dan Siswa 14. Pada cluster 2 terdapat 6 . siswa yaitu Siswa 2. Siswa 8. Siswa 9. Siswa 11. Siswa 13 dan Siswa 15. KESIMPULAN Tahapan akhir dari sebuah penelitian adalah sebuah penarikan sebuah kesimpulan. Adapun yang menjadi kesimpulan dari penelitian bahwa data mining dapat dipergunakan untuk membantu penyelesaian terhadap pengolahan data dimasa lampau hingga didapatkan informasi baru. Dalam proses pembagian penjurusan siswa/I di Sekolah Menengah Atas dilakukan proses pengelompokan baru berdasarkan dengan porses clustering. Hasil yang didapatkan dari pengelompokan baru yaitu algoritma K-Means berhasil melakukan pembentukan cluster dimana pada cluster 1 terdapat 9 . siswa yaitu Siswa 1. Siswa 3. Siswa 4. Siswa 5. Siswa 6. Siswa 7. Siswa 10. Siswa 12 dan Siswa 14. Pada cluster 2 terdapat 6 . siswa yaitu Siswa 2. Siswa 8. Siswa 9. Siswa 11. Siswa 13 dan Siswa 15. REFERENCES