JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. Analisis Data Mahasiswa Menggunakan Algoritma K-Means Clustering Untuk Menunjang Strategi Promosi Pada Program Studi Manajemen Informatika Politeknik Negeri Sambas Helen Septriani1*. Fathushahib2. Theresia Widji Astuti3. Erifa Syahnaz4 Manajemen Informatika. Jurusan Manajemen Informatika. Politeknik Negeri Sambas. Sambas, 79400. Indonesia. E-mail: politekniksambas@gmail. Abstract. Data from Sambas State Polytectic Informatics Management Study Program student every year produces abundant data, resulting in a buildup of data. Abundant data requires data processing to explore the information contained in the data. The aim of this research is to cluster student data in the Sambas State Polytechnic Informatics Management Study Program through a data mining process using the K-Means algoritma to form clusters. The data attributes that will be used are student data from the 2020-2023 class with 219 data items and the data source comes from the staff of the Sambas State Polytechnic Informatics Management Study Program. Keywords: Data Mining. Algorithm. K-Means. Clustering. Promotion Strategy. Abstrak. Data mahasiswa Program Studi Manajemen Informatika Politeknik Negeri Sambas setiap tahunnya dan menghasilkan data yang berlimpah sehingga terjadi penumpukan data. Data yang berlimpah perlu dilakukan pengolahan data untuk menggali informasi yang terdapat didalam data tersebut. Tujuan penelitian ini untuk mengcluster data mahasiswa di Program Studi Manajemen Informatika Politeknik Negeri Sambas melalui proses data mining dengan menggunakan algoritma K-Means untuk pembentukan cluster. Atribut data yang akan digunakan adalah nama mahasiswa, alamat, jenis kelamin, jalur pendaftaran, dan kecamatan. Data yang digunakan adalah data mahasiswa angkatan 2020-2023 dengan data 219 items dan sumber data berasal dari bagian staff Prodi Manajemen Informatika Politeknik Negeri Sambas. Kata Kunci: Data Mining. Algoritma. K-Means. Clustering. Strategi Promosi. PENDAHULUAN Latar Belakang Politeknik Negeri Sambas merupakan salah satu perguruan tinggi negeri yang ada di Kalimantan Barat dan satu-satunya Politeknik Negeri Sambas di Kabupaten Sambas. Politeknik Negeri Sambas merupakan politeknik tingkat negeri yang lebih banyak menerapkan muatan pembelajaran praktikum dibandingkan muatan teori. Penerimaan mahasiswa baru yang dilakukan setiap tahun menghasilkan data yang berlimpah berupa profil mahasiswa baru. Berdasarkan berlimpahnya data mahasiswa, terdapat informasi yang dapat di ketahui dengan cara melakukan pengolahan data. Pengolahan data mahasiswa perlu dilakukan untuk mengetahui informasi penting berupa pengetahuan baru. Informasi tersebut dapat digunakan sebagai penunjang dalam pengambilan keputusan bagi kampus. Pengolahan data berukuran besar yang mempunyai jumlah record dan jumlah atribut yang cukup banyak tidak dapat dilakukan dengan mudah. Salah satu cara yang dapat diterapkan untuk mengolah data yang berukuran besar adalah dengan menerapkan penggunaan data mining. Teknologi data mining merupakan salah satu alat bantu untuk penggalian data pada basis data berukuran besar dengan spesifikasi kerumitan tinggi. Karena di dalam data mining informasi yang luas, dan dari informasi yang kita dapat bisa kita gunakan sebagai suatu keputusan atau menentukan sebuah kualitas dalam menentukan suatu keputusan. Adapun kumpulan dari sebuah data atau 35 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. informasi memiliki banyak potensi untuk dijadikan suatu informasi yang terdapat di dalam sebuah data. Tujuan pengolahan data mahasiswa Program Studi Manajemen Informatika Politeknik Negeri Sambas yaitu menerapkan algoritma K-Means Clustering pada data penerimaan mahasiswa baru di program Studi Manajemen Informatika. Atribut data yang akan digunakan adalah nama mahasiswa, alamat, jenis kelamin, jalur pendaftaran, sekolah asal, dan kecamatannya. Data yang digunakan adalah data mahasiswa angkatan 2020-2023 dan sumber data berasal dari bagian akademik Program Studi Manajemen Informatika di Politeknik Negeri Sambas. Pengolahan data menggunakan teknik data mining dengan algoritma K-Means clustering. 1 Rumusan Masalah Berdasarkan latar belakang masalah di atas, dapat dirumuskan sebuah permasalahan yaitu: Bagaimana karakteristik demografis pada Progra Studi Manajemen Informatika di Politeknik Negeri Sambas? Berapa jumlah cluster yang optimal yang dapat dihasilkan dari analisis data mahasiswa menggunakan algoritma K-Means Bagaimana hasil analisis data mahasiswa tersebut dapat digunakan untuk merancang strategi promosi yang lebih terarah dan relevan? 2 Tujuan Penelitian Berdasarkan rumusan masalah yang telah dipaparkan, maka tujuan dari penelitian ini adalah sebagai berikut: Data mahasiswa bervariasi tergantung pada kampusnya. Disini yang sering diidentifikasi dalam analisis mahasiswa yaitu karakteristik demografis berupa kecamatannya. Untuk penentuan jumlah cluster yang optimal dalam analisis data mahasiswa menggunakan algoritma K-Means Clustering dapat dilakukan dengan berbagai metode, namun tidak ada pendekatan yang tunggal atau baku untuk menentukannya. Disini yang digunakan untuk menentukan jumlah cluster optimal menggunakan cluster Elbow Method. Metode ini melibatkan plot nilai inertia . ithin-cluster sum of square. terhadap jumlah cluster yang Pada grafik, titik dimana penurunan inertia mulai melambat . enyerupai sik. dapat dianggap sebagai cluster yang optimal. Jumlah cluster terpilih, hasil analisis tersebut dapat digunakan untuk merancang strategi promosi dengan cara menggunakan hasil clustering untuk membagi mahasiswa ke dalam kelompok-kelompok homogen berdasarkan karakteristik demografis. METODE PENELITIAN Jenis metode penelitiian yang digunakan yaitu metode mixed-method metode ini adalah pendekatan penelitian yang menggabungkan metode kualitatif dan kuantitatif dalam satu studi penelitian. Pendekatan ini memungkinkan peneliti untuk memperoleh pemahaman yang lebih mendalam 36 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. dan komprehensiftentang suatu fenomena dengan memanfaatkan kekuatan dari kedua jenis metode tersebut. Metode Penelitian yang digunakan dalam analisis ini adalah menggunakan metode CRISP-DM ( Cross Industry Standard Process for Data Mining ). Langkah-langkah pada analisis yang akan dilakukan dapat dilihat pada Gambar 1. Gambar 1. Metode CRISP-DM Data Mining memiliki 6 fase CRISP-DM (Cross Industry Standard Process for Data Mining ). Pemahaman Bisnis (Business Understandin. Proses memahami konteks, tujuan,operasi, dan tantangan yang dihadapi oleh sebuah bisnis atau organisasi. Pemahaman Data (Data Understandin. Langkah penting dalam proyek data science dan analisis data yang bertujuan untuk mengenali, mengidentifikasi, dan memahami data yang akan digunakan. Pengolahan Data (Data Preparatio. Langkah penting dalam proses analisis data yang melibatkan pembersihan, transformasi, dan pengorganisasian data mentah menjadi bentuk yang sesuai untuk analisis lebih lanjut. Tahap ini memastikan bahwa data yang akan dianalisis bebas dari kesalahan, konsisten, dan siap digunakan dalam berbagai metode analisis. Pemodelan (Modellin. Proses pembuatan model matematis, statistik, atau komputasional untuk merepresentasikan suatu sistem, proses, atau fenomena nyata. Dalam konteks data science dan machine learning, pemodelan melibatkan pembangunan algoritma atau model yang dapat memprediksi atau mengklarifikasikan data berdasarkan pola yang telah dikenali dari data Evaluasi (Evaluatio. Langkah penting dalam proses analisis data dan pengembangan model yang bertujuan untuk menilai kinerja dan efektivitas model atau metode yang Penyebaran (Deploymen. 37 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. Tahap akhir dalam siklus pengembangan model data science dan machine learning, dimana model yang telah dilatih dan diuji ditempatkan ke dalam lingkungan produksi sehingga dapat digunakan untuk membuat prediksi atau keputusan dalam aplikasi dunia nyata. HASIL DAN PEMBAHASAN Data yang digunakan pada analisis ini adalah data mahasiswa Program Studi Manajemen Informatika Politeknik Negeri Sambasyang terdiri dari 33 atribut dan 219 record. Data awal disajikan pada Tabel 1 dibawah ini. Tabel 1. Data Mahasiswa Tahun 2020-2023 Prodi Manajemen Informatika Data yang sudah dikumpulkan kemudian dilakukan pengolahan data awal untuk mendapatkan data yang lebih akurat. Data hasil pengolahan data awal ditunjukkan pada Tabel 2. 38 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. Tabel 2. Hasil Pengolahan Data Awal Selanjutnya dilakukan proses clustering menggunakan data kecamatan, jumlah mahasiswa perkecamatan, latitude, dan longitude di setiap Tabel 3. Data Untuk proses Clustering 39 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. Kemudian dilakukan metode optimasi menggunakan metode elbow untuk menentukan jumlah cluster terbaik. Berikut Gambar 1 Hasil Grafik 22 Kecamatan. Gambar 1. Hasil Grafik Elbow Method 22 Kecamatan Didapatkan titik yang paling optimal dilihat pada Gambar 2 pada k=4 grafik nya terlihat membentuk siku manusia dan jika sudah membentuk siku itulah titik yang paling optimal. Dapat dilihat pada Gambar 2. Gambar 2. Metode Elbow for Optimal Pada Gambar 3 visualisasi dari hasil K-Means Clustering dengan 4 Closest Centroid atau lingkaran magenta yaitu titik yang plaing dekat dengan titik tertentu . , . Dapat dilihat pada Gambar 3. Gambar 3. Visualisasi Hasil K-Means Clustering 40 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. KESIMPULAN Berdasarkan metode Elbow, jumlah cluster yang optimal untuk analisis data mahasiswa Program Studi Manajemen Informatika menggunakan algoritma K-Means Clustering adalah 4 cluster. Ini berarti mahasiswa dapat secara efektif dikelompokkan kedalam 4 kelompok berbeda berdasarkan variabel yang dianalisis . Quarter / tanggal lahir, jenis kelamin, jalur pendaftaran dan jumlah data perkecamata. Hasil analisis data mahasiswa yang dihasilkan dari algoritma K-Means clustering dapat digunakan untuk merancang startegi promosi yang lebih terarah dan relevan untuk Program Studi Manajemen Informatika Politeknik Negeri Sambas, yaitu dengan melihat kecamatan mana yang lebih sedikit jumlah mahasiswa yang mendaftar di Prodi Manajemen Informatika. UCAPAN TERIMA KASIH Penelitian ini tidak akan mungkin terlaksana tanpa dukungan dan bantuan dari berbagai pihak. Oleh karena itu, dengan segala kerendahan hati, penulis ingin menyampaikan ucapan terima kasih kepada: Politeknik Negeri Sambas yang telah memberikan dukungan finansial dan sarana yang diperlukan selama proses penelitian ini. Bapak Fathushahib. Kom. Kom. yang telah terlibat secara langsung dalam pelaksanaa penelitian ini. Terima kasih atas dedikasi dan kontribusinya yang tak ternilai selama proses penelitian berlangsung. Ibu Theresia Widji Astuti. Kom. Kom. dan Ibu Erifa Syahnaz. Kom. Kom. yang telah memberikan dukungan moral dan teknis. Kontribusi yang sangat penting dalam menyelesaikan penelitian ini tepat waktu. PERNYATAAN KONTRIBUSI PENULIS Dengan ini, penulis menyatakan bahwa kontribusi setiap penulis terhadap pembuatan karya tulis ini adalah sebagai berikut: Helen Septriani sebagai kontributor utama yang bertanggung jawab atas konsep penelitian, analisis data dan penulisan draft utama. Bapak Fathushahib. Kom. Kom. sebagai koresponden yang bertanggung jawab memberikan kontribusi dalam analisis statistik dan peninjauan literatur. Ibu Theresia Widji Astuti. Kom. Kom. dan Ibu Erifa Syahnaz. Kom. Kom. sebagai anggota yang bertanggung jawab dalam revisi manuskrip. 41 | P a g e JUMANTIK JURNAL MANAJEMEN INFORMATIKA VOL. 1 NO. DAFTAR PUSTAKA