Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol.
No.
Februari 2026, hlm.
p-ISSN: 2355-7699
e-ISSN: 2528-6579
PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI UNTUK PEMILIHAN
TEMPAT PROMOSI UPAYA MENINGKATKAN JUMLAH MAHASISWA BARU
Nurul Fadilah*1.
Sri Yulianto Joko Prasetyo2.
Budhi Kristianto3
1,2,3
Universitas Kristen Satya Wacana.
Salatiga Email: 972021014@gmail.
com, 2sri.
yulianto@uksw.
edu, 3budhik@uksw.
Penulis Korespondensi (Naskah masuk: 23 September 2024, diterima untuk diterbitkan: 10 April 2.
Abstrak Efektivitas strategi promosi menjadi kunci keberhasilan institusi pendidikan tinggi dalam menarik minat calon mahasiswa baru.
Namun, banyak institusi menghadapi masalah serius dalam pemilihan lokasi promosi yang tepat, yang mengakibatkan penurunan minat calon mahasiswa dan pemborosan sumber daya.
Untuk mengatasi masalah ini, penelitian ini mengembangkan model klasifikasi berbasis data mining yang mampu mengidentifikasi lokasi promosi paling efektif.
Tiga algoritma klasifikasi yang digunakan dalam penelitian ini adalah Logistic Regression.
Support Vector Machine (SVM), dan Decision Tree (C4.
Data pendaftaran mahasiswa dikumpulkan dan diproses melalui tahapan pra pemprosesan yang meliputi penggantian nilai hilang, normalisasi data, dan transformasi atribut nominal menjadi numerik.
Data kemudian dibagi menjadi subset pelatihan dan pengujian menggunakan metode split data dengan rasio 70:30.
Hasil evaluasi menunjukkan bahwa model Decision Tree (C4.
memberikan performa terbaik dengan accuracy 93.
75%, precision 97.
37%, dan recall 90.
Logistic Regression juga menunjukkan hasil yang memuaskan dengan accuracy 90.
00%, precision 92.
31%, dan recall Sementara itu.
SVM menunjukkan performa yang lebih rendah dengan accuracy 72.
50%, precision 65%, dan recall 60.
Kesimpulannya, model Decision Tree (C4.
dan Logistic Regression dapat diandalkan untuk mengoptimalkan strategi promosi institusi pendidikan tinggi, memastikan alokasi sumber daya yang lebih efisien dan efektif, serta meningkatkan jumlah pendaftar baru.
Penelitian ini juga memberikan kontribusi signifikan dalam literatur terkait penggunaan data mining untuk strategi promosi di sektor pendidikan Kata kunci: Data Mining.
Klasifikasi.
Decision Tree.
Logistic Regression.
Promosi Pendidikan PERFORMANCE COMPARISON OF CLASSIFICATION ALGORITHMS FOR PROMOTION SITE SELECTION IN AN EFFORT TO INCREASE THE NUMBER OF NEW STUDENTS Abstract The effectiveness of promotional strategies is crucial for higher education institutions in attracting new student However, many institutions face serious issues in selecting the appropriate promotional locations, leading to decreased student interest and resource wastage.
To address this issue, this study develops a data mining-based prediction model capable of identifying the most effective promotional locations.
The three classification algorithms used in this study are Logistic Regression.
Support Vector Machine (SVM), and Decision Tree (C4.
Student enrollment data were collected and processed through pre-processing stages, including missing value replacement, data normalization, and transformation of nominal attributes to numerical.
The data were then split into training and testing subsets using a 70:30 split ratio.
Evaluation results indicate that the Decision Tree (C4.
model performed the best with an accuracy of 93.
75%, precision of 97.
37%, and recall of Logistic Regression also showed satisfactory results with an accuracy of 90.
00%, precision of 92.
and recall of 87.
Meanwhile.
SVM demonstrated lower performance with an accuracy of 72.
50%, precision 65%, and recall of 60.
In conclusion, the Decision Tree (C4.
and Logistic Regression models are reliable for optimizing promotional strategies of higher education institutions, ensuring more efficient and effective resource allocation, and increasing new student enrollments.
This study also makes a significant contribution to the literature related to the use of data mining for promotional strategies in the higher education Keywords: Data Mining.
Prediction.
Decision Tree.
Logistic Regression.
Educational Promotion 2 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
PENDAHULUAN
Di era globalisasi pendidikan tinggi, efektivitas strategi promosi menjadi kunci keberhasilan institusi dalam menarik minat calon mahasiswa baru.
Namun, banyak institusi menghadapi masalah serius dalam pemilihan lokasi promosi yang tepat, mengakibatkan penurunan minat calon mahasiswa dan pemborosan sumber daya.
Masalah ini tidak hanya berdampak pada aspek finansial, tetapi juga mengancam keberlanjutan program akademik dan reputasi institusi (Manimaran.
Priyadharshini, & Yamuna Devi, 2.
Ketidakefektifan dalam pemilihan lokasi promosi menjadi masalah krusial karena dapat menyebabkan institusi gagal mencapai target penerimaan mahasiswa baru.
Hal ini berpotensi menurunkan prestasi akademik, dan bahkan mengganggu stabilitas keuangan institusi (Wan Yaacob et al.
, 2.
Oleh karena itu, diperlukan pendekatan baru yang lebih efektif dan efisien dalam strategi promosi pendidikan tinggi.
Penelitian ini dilakukan untuk mengatasi masalah tersebut dengan memanfaatkan teknologi data mining dalam mengoptimalkan pemilihan lokasi Tujuan utamanya adalah memecahkan permasalahan ketidakefektifan promosi melalui analisis data yang lebih strategis dan berbasis bukti.
Pendekatan ini diharapkan dapat meningkatkan jumlah pendaftar baru secara signifikan sambil mengoptimalkan penggunaan sumber daya yang tersedia (Gumba & Paragas, 2.
Pentingnya membahas masalah ini terletak pada potensinya untuk meningkatkan efektivitas dan efisiensi strategi promosi institusi pendidikan tinggi.
Dengan optimalisasi pemilihan lokasi promosi, institusi dapat meningkatkan Return On Investment (ROI), mencapai target penerimaan mahasiswa, dan memperkuat posisi kompetitif mereka (Xiao.
Zhang.
Zhang.
Li, & Shen, 2.
Untuk mengatasi masalah ini, penelitian mengusulkan penggunaan teknik data mining yang inovatif, khususnya dalam analisis klasifikasi untuk pemilihan lokasi promosi.
Metode ini meliputi pengumpulan data, pra-pemrosesan, transformasi data, split data, klasifikasi, dan evaluasi (Wan Yaacob et al.
, 2.
Inovasi utama penelitian ini terletak pada penggunaan kombinasi algoritma klasifikasi yang belum banyak dieksplorasi dalam konteks promosi pendidikan tinggi.
Penelitian ini dilakukan untuk mengisi kesenjangan dalam literatur terkait penggunaan analisis data dalam pemilihan lokasi promosi di sektor pendidikan tinggi.
Sementara penelitian sebelumnya lebih fokus pada pendekatan tradisional, penelitian ini menawarkan perspektif baru dengan mengintegrasikan teknik data mining terkini (Gumba & Paragas, 2.
Konteks dalam penelitian ini meliputi penggunaan data mining di bidang pendidikan, beberapa penelitian telah menunjukkan efektivitas berbagai algoritma seperti Logistic Regression.
Support Vector Machine (SVM), dan C4.
Sebuah studi (Manimaran et al.
, 2.
menggunakan algoritma tersebut untuk mengklasifikasi peluang penempatan kerja mahasiswa, mendemonstrasikan manfaat analisis data historis dalam meningkatkan persentase penempatan kerja.
Penerapan algoritma Logistic Regression untuk menganalisis data fisik mahasiswa memungkinkan universitas untuk menentukan kondisi fisik mahasiswa dan memberikan saran latihan yang Studi komparatif (Rahman & Raihan, 2.
membandingkan berbagai metode data mining untuk mengklasifikasi prestasi akademik mahasiswa, memberikan rekomendasi untuk peningkatan kinerja.
Penelitian lainnya (Wan Yaacob et al.
, 2.
menemukan bahwa Logistic Regression merupakan algoritma terbaik untuk mengklasifikasi dropout mahasiswa dengan akurasi tinggi.
Untuk pengoptimalan lokasi promosi, sebuah penelitian (Gumba & Paragas, 2.
menggunakan algoritma klasifikasi untuk menganalisis data penerimaan mahasiswa, membantu universitas dalam meningkatkan kebijakan penerimaan berdasarkan data historis.
Studi lain (Waheed et al.
, 2.
membandingkan Logistic Regression dengan model deep learning untuk mengklasifikasi kinerja akademik mahasiswa, menunjukkan keunggulan model deep learning dalam akurasi klasifikasi.
Penelitian-penelitian mendemonstrasikan efektivitas teknik data mining, terutama algoritma Logistic Regression.
SVM, dan C4.
5, dalam berbagai aspek manajemen pendidikan Algoritma-algoritma ini telah berhasil diterapkan untuk klasifikasi kinerja akademik (Rahman & Raihan, 2.
, optimalisasi penerimaan mahasiswa (Gumba & Paragas, 2.
, dan analisis dropout (Wan Yaacob et al.
, 2.
Logistic Regression, khususnya, menunjukkan keunggulan dalam mengklasifikasi peluang penempatan kerja dan potensi dropout mahasiswa (Manimaran et al.
, 2022.
Wan Yaacob et al.
, 2.
Temuan-temuan ini menyediakan dasar yang kuat untuk pengembangan model klasifikasi lokasi promosi yang optimal, yang menjadi fokus utama penelitian ini.
Dengan berlandaskan pada hasil-hasil tersebut, penelitian ini bertujuan untuk mengoptimalkan penggunaan algoritma-algoritma ini dalam konteks pemilihan lokasi promosi pendidikan tinggi, guna meningkatkan efektivitas strategi promosi dan alokasi sumber daya (Manimaran et al.
, 2022.
Rahman & Raihan, 2.
Inovasi yang diusulkan dalam penelitian ini adalah penggunaan kombinasi algoritma klasifikasi yang dioptimalkan untuk konteks promosi pendidikan tinggi.
Penelitian akan mengevaluasi kinerja pendekatan ini terhadap data pendaftaran mahasiswa untuk menentukan metode yang paling efektif dalam mengklasifikasi lokasi promosi Fadilah, dkk.
Perbandingan Kinerja Algoritma Klasifikasi A 3 Dengan melakukan analisis mendalam dan perbandingan kinerja algoritma, penelitian ini bertujuan untuk menghasilkan model prediktif yang lebih akurat untuk pemilihan lokasi promosi.
Hasil yang diharapkan adalah rekomendasi yang lebih tepat sasaran dalam strategi promosi, yang pada akhirnya akan membantu institusi pendidikan meningkatkan jumlah pendaftar baru dan mengoptimalkan alokasi sumber daya mereka (Manimaran et al.
, 2022.
Rahman & Raihan, 2.
Manfaat penelitian ini mencakup tiga aspek utama yaitu praktis, teoritis, dan metodologis.
Secara praktis, penelitian ini memberikan informasi tentang algoritma data mining klasifikasi yang paling efektif dalam mengklasifikasi lokasi promosi yang akurat, membantu perguruan tinggi mengoptimalkan strategi dan alokasi sumber daya promosi mereka, serta berpotensi meningkatkan jumlah pendaftar baru secara signifikan.
Dari segi teoritis, penelitian ini memperkaya wawasan dan pengetahuan mengenai penggunaan algoritma klasifikasi data mining .
hususnya Logistic Regression.
SVM, dan C4.
dalam bidang pemasaran dan promosi pendidikan tinggi, serta memberikan kontribusi pada pengembangan literatur tentang aplikasi data mining dalam optimalisasi strategi pemasaran pendidikan.
Secara metodologis, penelitian ini mengembangkan kerangka kerja yang dapat diadaptasi oleh institusi pendidikan lain untuk membandingkan dan mengevaluasi kinerja berbagai algoritma klasifikasi dalam konteks promosi, sehingga menyediakan dasar untuk penelitian lebih lanjut tentang integrasi teknik data mining dalam pengambilan keputusan strategis di institusi pendidikan.
Penelitian ini berlandaskan pada temuantemuan sebelumnya dan mengisi kesenjangan dalam Fokus khusus diberikan pada penggunaan kombinasi algoritma Logistic Regression.
SVM, dan C4.
5 untuk optimalisasi lokasi promosi di pendidikan Pendekatan ini diproyeksikan memberikan kontribusi signifikan dalam meningkatkan efektivitas strategi promosi institusi pendidikan tinggi.
METODE PENELITIAN
Penelitian ini menggunakan pendekatan data mining untuk mengoptimalkan pemilihan lokasi promosi bagi institusi pendidikan tinggi.
Metode yang digunakan melibatkan serangkaian tahapan yang sistematis, dimulai dari pengumpulan data hingga interpretasi hasil dan penyusunan laporan.
Pendekatan ini dipilih untuk menganalisis data historis pendaftaran mahasiswa dan menghasilkan model prediktif yang dapat membantu dalam pengambilan keputusan strategis terkait promosi.
Berikut adalah diagram alur yang menggambarkan tahapan penelitian secara keseluruhan:
Pengumpulan Data Pra-Pemrosesan Data Transformasi Data Split Data A Logistic Regression A SVM A C4.
Evaluasi Kerja Interprestasi Penyusunan Laporan dan Publikasi Gambar 1.
Tahapan Penelitian 1 Collecting (Pengumpulan Dat.
Tahap ini meliputi pengumpulan data historis pendaftaran mahasiswa STMIK YMI Tegal periode 2017-2021, mencakup 268 data dengan informasi sekolah, wilayah, jenis, status, akreditasi, jumlah lulusan, mahasiswa, dan kompetitor.
Data tambahan diperoleh dari dapo.
Proses deskripsi dan eksplorasi data dilakukan untuk menganalisis sumber data awal dan menentukan sumber data yang paling relevan.
Verifikasi kualitas data menjadi langkah penting untuk memastikan data bebas dari kesalahan, konsisten, dan representatif.
2 Preprocessing (Pra Pemprosesa.
Tahap ini mencakup data reduction, cleaning, selection, dan balancing menggunakan MS Excel.
Proses ini bertujuan untuk memastikan kualitas data yang akan diproses lebih lanjut .
Kompetitor dikategorikan menjadi "sedikit" .
urang dari 10 institus.
dan "banyak" .
atau lebih institus.
berdasarkan jumlah dan kepadatan institusi pendidikan di wilayah tersebut.
3 Transformation (Transformas.
Data ditransformasikan untuk mendapatkan variabel relevan dalam pemetaan tempat promosi (Rahman & Raihan, 2.
Ditambahkan kolom target "POTENSI" dan "KURANG POTENSI" berdasarkan analisis historis dan tren data pendaftaran sebelumnya.
4 Split Data (Data Terpisa.
Data dibagi menjadi subset pelatihan dan pengujian dengan persentase umum seperti 70:30, 80:20, atau 90:10 (Asana & Yanti, 2023.
Muningsih.
Metode ini dipilih karena kesederhanaan dan kecepatannya dibandingkan teknik lain seperti cross- 4 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
validation (Joseph & Vakayil, 2020.
KrivzaniN.
Tabel 1.
Data Preprocessing Di mana:
c = .
ycU ) adalah probabilitas kejadian yc = 1 diberikan variabel prediktor ycU.
yu0 adalah intercept dari model.
yu1 , yu2 .
A , yuycu adalah koefisien dari variabel prediktor ycU1 , ycU2 .
A , ycUycu .
Pseudocode Logistic Regression:
Initialize weights 0, 1, .
, n For each iteration:
Calculate logit: z = 0 1 * X1 2 * X2 .
n * Xn Calculate probability: P.
X) = 1 / .
e^(-.
) Update weights using gradient descent Algoritma Support Vector Machine (SVM) Digunakan untuk menemukan hyperplane terbaik yang memisahkan dua kelas data dengan margin Jika input data dapat dipisahkan secara linear, pemisahan hyperplane dapat digambarkan sebagai berikut:
Tabel 2 Data Transformation Gambar 2 Bidang Pemisah Linier Model ini sangat efektif untuk menangani data berdimensi tinggi (Kasim & Sudarsono, 2.
Rumus untuk SVM adalah:
= yeiyeOyeOyea.
eo UI yeo yeE) Di mana:
yeo adalah vektor bobot.
yeo adalah vektor fitur.
yeE adalah bias.
Pseudocode SVM:
5 Classification (Klasifikas.
Penelitian menggunakan algoritma Logistic Regression.
Support Vector Machine (SVM), dan C4.
5 (Kangythe & Mburu, 2023.
Palacios.
ReyesSuyrez.
Bearzotti.
Leiva, & Marchant, 2021.
Rahman & Raihan, 2.
Berikut adalah penjelasan dari masing-masing algoritma:
Algoritma Logistic Regression Logistic Regression berdasarkan karakteristik demografis dan lokasi Model ini bekerja dengan menghitung logit, yaitu logaritma dari rasio peluang .
dds rati.
, dan kemudian mengaplikasikan fungsi sigmoid untuk mendapatkan probabilitas (Palacios et al.
, 2021.
Rahman & Raihan, 2022.
Sahamony.
Terttiaavini, & Rianto, 2.
Rumus Logistic Regression:
c = .
ycU) = 1 yceOe.
u yu ycU yu ycU U yu ycU ) .
ycu ycu Initialize weights w and bias b For each iteration:
For each training sample .
i, y.
If yi * .
A xi .
< 1:
Update weights: w = w * .
i * xi - 2 * * .
Update bias: b = b * yi Else:
Update weights: w = w - 2 * * * w Algoritma C4.
Algoritma ini digunakan untuk membangun pohon keputusan yang membantu dalam memetakan hubungan antara variabel prediktor dan hasil klasifikasi.
Proses ini melibatkan penggunaan information gain untuk memilih atribut yang paling informatif dalam membagi dataset (Rahman & Raihan, 2.
Rumus untuk information gain adalah:
c | ycyeCyeOyea.
c, y.
OcyeOOycyeCyesyenyeIyei.
ye ycyeayeiyeeyeayecyeo.
cye ) .
Fadilah, dkk.
Perbandingan Kinerja Algoritma Klasifikasi A 5 Di mana:
ycyeCyeOyea.
c, y.
adalah informasi yang diperoleh dari pembagian set data yc dengan atribut yc.
adalah entropi dari set data yc.
ycye adalah subset dari yc yang memiliki nilai ye untuk atribut yc.
digunakan, yaitu Logistic Regression.
SVM, dan Decision Tree (C4.
Setiap model dievaluasi berdasarkan beberapa metrik penting termasuk accuracy, precision, recall, dan AUC.
Berikut adalah hasil dan pembahasan dari masing-masing model.
Pseudocode C4.
Proses dilakukan menggunakan RapidMiner.
Diagram proses berikut ini menunjukkan alur kerja yang meliputi pengumpulan data, pra-pemrosesan, transformasi data, validasi silang, dan evaluasi kinerja algoritma.
Proses ini memastikan setiap tahapan dilaksanakan dengan teliti untuk menghasilkan model prediktif yang akurat.
Logistic Regression Logistic Regression adalah salah satu metode klasifikasi yang paling umum digunakan dalam analisis prediktif.
Dalam penelitian ini.
Logistic Regression menunjukkan performa yang sangat Berikut adalah gambar proses Logistic Regression.
If all instances are of the same class:
Return a leaf node with that class If attribute list is empty:
Return a leaf node with the most common class Select attribute A with the highest information For each value v in A:
Create a branch for value v Split the dataset S into subsets Sv Recursively apply C4.
5 to the subsets 6 Evaluation (Evaluas.
Setelah model diklasifikasikan, kinerjanya dievaluasi menggunakan metrik seperti accuracy, precision, recall, dan area under the curve (AUC).
Hasil dari masing-masing algoritma dikumpulkan dan dibandingkan untuk menentukan algoritma mana yang memberikan hasil paling akurat dalam mengklasifikasi lokasi promosi potensial (Budiman & Niqotaini, 2022.
Toro & Lestari, 2.
Tabel 3 menyajikan hasil evaluasi kinerja model.
Tabel 3 Klasifikasi nilai AUC Nilai AUC Kualitas AUC 0,90 Ae 1,00 Excellent Classification 0,80 Ae 0,90 Good Classification 0,70 Ae 0,80 Fair Classification 0,60 Ae 0,70 Poor Classification 0,50 Ae 0,60 Failuer Classification 7 Interpretation (Interpretas.
Interpretasi melibatkan pemahaman hasil dan pemilihan algoritma dengan nilai accuracy, precision, recall, dan AUC terbaik untuk rekomendasi keputusan dalam pemilihan tempat promosi (Azizah.
Nurdiawan.
Dwilestari.
Kaslani, & Tohidi, 2.
8 Preparation of Reports and Publications (Penyusunan Laporan dan Publikas.
1 Hasil Analisis Gambar 3 Desain Penerapan Logistic Regression Proses dimulai dengan pengambilan data menggunakan operator "Retrieve", diikuti dengan penanganan nilai hilang melalui "Replace Missing Values".
Selanjutnya, peran atribut ditentukan menggunakan "Set Role", dan atribut nominal diubah menjadi binominal dengan "Nominal to Binominal".
Data kemudian dibagi menjadi subset pelatihan dan pengujian menggunakan "Split Data".
Model Logistic Regression diterapkan pada subset pelatihan, dan hasilnya diuji pada subset pengujian dengan operator "Apply Model".
Kinerja model dievaluasi menggunakan operator "Performance", menghasilkan metrik seperti accuracy, precision, recall, dan AUC untuk mengukur efektivitas model dalam memklasifikasi lokasi promosi yang Laporan penelitian yang komprehensif akan disusun dan dipublikasikan dalam jurnal ilmiah atau konferensi akademik untuk berbagi temuan dengan komunitas akademik.
HASIL DAN PEMBAHASAN
Penelitian ini bertujuan untuk mengembangkan model klasifikasi berbasis data mining yang mampu mengidentifikasi lokasi-lokasi promosi yang paling efektif dalam meningkatkan jumlah pendaftar baru di institusi pendidikan tinggi.
Untuk mencapai tujuan ini, tiga algoritma klasifikasi yang berbeda telah Gambar 4 Hasil Performance Vector Logistic Regression 6 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
Model ini memiliki accuracy sebesar 90.
yang berarti bahwa 90% dari klasifikasi yang dibuat oleh model ini adalah benar.
Precision dari model ini 31% untuk kelas "KURANG POTENSI", yang menunjukkan bahwa dari semua klasifikasi yang diklasifikasikan sebagai "KURANG POTENSI", 92.
31% di antaranya benar-benar merupakan kelas tersebut.
Lebih lanjut, recall untuk kelas "KURANG POTENSI" adalah 80.
49%, yang berarti bahwa dari semua instance yang sebenarnya adalah "KURANG POTENSI", model berhasil mengidentifikasi sekitar 49% dari mereka.
"Performance", menghasilkan metrik seperti accuracy, precision, recall, dan AUC untuk mengukur efektivitas model dalam memklasifikasi lokasi promosi yang Gambar 7 Hasil Performance Vector Support Vector Machine (SVM) Gambar 5 Grafik AUC Logistic Regression Nilai AUC yang mencapai 0.
969 menunjukkan bahwa model Logistic Regression memiliki kemampuan diskriminatif yang sangat baik dalam membedakan antara kelas "POTENSI" dan "KURANG POTENSI".
Dengan kata lain, model ini sangat efektif dalam memklasifikasi potensi lokasi promosi dengan tingkat kesalahan yang sangat Model SVM menghasilkan accuracy sebesar 50%, yang berarti sekitar 73% dari klasifikasi yang dibuat adalah benar.
Precision untuk kelas "KURANG POTENSI" menunjukkan bahwa dari semua klasifikasi yang diklasifikasikan sebagai "KURANG POTENSI", sekitar 81% di antaranya benar.
Namun, nilai recall untuk kelas "KURANG POTENSI" hanya mencapai 60.
Hal ini menunjukkan bahwa model SVM kurang efektif dalam mengidentifikasi semua instance dari kelas "KURANG POTENSI".
Dengan kata lain, ada banyak instance dari kelas "KURANG POTENSI" yang tidak berhasil diidentifikasi oleh model.
Support Vector Machine (SVM) Support Vector Machine (SVM) adalah algoritma klasifikasi yang kuat terutama dalam kasus di mana data memiliki dimensi yang tinggi.
Berikut adalah gambar proses Support Vector Machine (SVM).
Gambar 6 Desain Penerapan Support Vector Machine (SVM) Proses dimulai dengan pengambilan data menggunakan operator "Retrieve", diikuti dengan penanganan nilai hilang melalui "Replace Missing Values".
Selanjutnya, peran atribut ditentukan menggunakan "Set Role", dan atribut nominal diubah menjadi numerik dengan operator "Nominal to Numerical".
Data kemudian dibagi menjadi subset pelatihan dan pengujian menggunakan "Split Data".
Model SVM diterapkan pada subset pelatihan, dan hasilnya diuji pada subset pengujian dengan operator "Apply Model".
Kinerja model dievaluasi Gambar 8 Grafik AUC Support Vector Machine (SVM) Nilai AUC sebesar 0.
859 menunjukkan bahwa kemampuan diskriminatif model SVM masih cukup baik, namun tidak sebaik Logistic Regression atau Decision Tree.
Penerapan Algoritma C.
45 (Decision Tre.
Decision Tree (C4.
adalah algoritma klasifikasi yang sederhana namun sangat efektif dalam banyak kasus.
Dalam penelitian ini.
Decision Tree (C4.
menunjukkan performa yang sangat baik, bahkan sedikit lebih baik dibandingkan Logistic Regression.
Berikut adalah gambar proses Fadilah, dkk.
Perbandingan Kinerja Algoritma Klasifikasi A 7 Decision Tree RapidMiner.
(C4.
Gambar 9 Desain Penerapan Algoritma C.
45 (Decision Tre.
Proses dimulai dengan pengambilan data menggunakan operator "Retrieve", diikuti dengan penanganan nilai hilang melalui "Replace Missing Values".
Selanjutnya, peran atribut ditentukan menggunakan operator "Set Role".
Data kemudian dibagi menjadi subset pelatihan dan pengujian menggunakan operator "Split Data".
Model Decision Tree dilatih menggunakan subset pelatihan dan diterapkan pada subset pengujian menggunakan operator "Apply Model".
Terakhir, kinerja model dievaluasi menggunakan operator "Performance" untuk mengukur efektivitas model dalam klasifikasi.
Hasil pohon keputusan model Decision Tree (C4.
yang dihasilkan dari RapidMiner.
Gambar 10 Hasil Pohon Keputusan Pohon keputusan ini digunakan untuk mengklasifikasikan potensi wilayah promosi berdasarkan jumlah lulusan, status mahasiswa, wilayah, dan jenis sekolah.
Hasil pohon keputusan dengan kedalaman maksimal 5 adalah sebagai Jumlah Lulusan > 89:
A Jika terdapat mahasiswa:
A 521 lulusan: KURANG POTENSI .
POTENSI, 3 KURANG POTENSI).
A O 521 lulusan:
n Wilayah KAB.
BREBES: POTENSI .
POTENSI, 1 KURANG POTENSI).
n Wilayah KAB.
PEMALANG:
KURANG POTENSI .
POTENSI, 3
KURANG POTENSI).
n Wilayah KAB.
TEGAL: POTENSI .
POTENSI, 1 KURANG POTENSI).
n Wilayah KOTA TEGAL: POTENSI .
POTENSI, 0 KURANG POTENSI).
A Jika tidak terdapat mahasiswa:
n 119 lulusan: KURANG POTENSI .
POTENSI, 64 KURANG POTENSI).
n O 119 lulusan:
n Jenis sekolah SMA: POTENSI .
POTENSI.
KURANG POTENSI).
n Jenis sekolah SMK: KURANG POTENSI .
POTENSI, 7 KURANG POTENSI).
Jumlah Lulusan O 89:
A Wilayah KAB.
BREBES: POTENSI
POTENSI,
KURANG
POTENSI).
A Wilayah KAB.
PEMALANG:
A Jenis sekolah SMA: POTENSI .
POTENSI.
KURANG POTENSI).
A Jenis sekolah SMK:
n Jika POTENSI .
POTENSI, 1 KURANG POTENSI).
n Jika tidak ada mahasiswa:
KURANG POTENSI .
POTENSI, 12 KURANG
POTENSI).
A Wilayah KAB.
TEGAL: POTENSI .
POTENSI, 3 KURANG POTENSI).
A Wilayah KOTA TEGAL: POTENSI .
POTENSI, 0 KURANG POTENSI).
Secara keseluruhan, pohon keputusan ini mengidentifikasi wilayah promosi yang potensial berdasarkan kombinasi variabel jumlah lulusan, status mahasiswa, wilayah, dan jenis sekolah.
Wilayah dengan jumlah lulusan tinggi dan beberapa kombinasi spesifik dari variabel ini cenderung diklasifikasikan sebagai "POTENSI", sementara kombinasi lainnya mungkin diklasifikasikan sebagai "KURANG POTENSI".
Untuk hasil performance vector sebagai berikut:
Gambar 11 Hasil Performance Vector Decision Tree (C4.
Decision Tree (C4.
menunjukkan performa yang sangat baik, dengan accuracy sebesar 93.
Precision untuk kelas "KURANG POTENSI" 37%, yang berarti bahwa dari semua klasifikasi yang diklasifikasikan sebagai "KURANG POTENSI", 97.
37% di antaranya benar.
Selain itu, 8 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK).
Vol.
No.
Februari 2026, hlm.
recall untuk kelas "KURANG POTENSI" adalah 24%, yang berarti model ini berhasil mengidentifikasi lebih dari 90% dari semua instance yang sebenarnya adalah "KURANG POTENSI".
(C4.
Logistic Regression memastikan penggunaan sumber daya yang lebih efisien dan efektif.
Penelitian ini juga berkontribusi pada literatur dengan mengkombinasikan algoritma klasifikasi yang belum banyak dieksplorasi dalam konteks promosi pendidikan tinggi.
DAFTAR PUSTAKA