Jurnal Publikasi Sistem Informasi dan Manajemen Bisnis Volume.
Number.
3 September 2025 e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 DOI: https://doi.
org/10.
55606/jupsim.
Tersedia : https://journalcenter.
org/index.
php/jupsim Implementasi Algoritma Clustering dan Classification dalam Data Mining:
Systematic Literature Review terhadap Tren dan Tantangan Terkini Jon Kevin Sihombing1*.
Bayu Angga Wijaya2 Universitas Prima Indonesia.
Medan,Sumatera Utara.
Indonesia Penulis Korespondensi: jonkevinsihombing@gmail.
Abstract: This study conducts a systematic literature review on the implementation of clustering and classification algorithms in data mining to identify methodological trends and contemporary challenges during the 2021-2025 The research methodology employs the Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) approach.
Analysis was performed on eight relevant studies from Ie Xplore.
ScienceDirect.
Springer, and ACM Digital Library databases.
Narrative synthesis was used to comprehensively organize research findings.
The results demonstrate the dominance of classification algorithms at 50%, with Random Forest achieving optimal accuracy of 98.
35% through Particle Swarm Optimization.
Clustering techniques demonstrate effectiveness in data segmentation, with K-means producing optimal configuration through Davies-Bouldin Index Application domains are diversified with the healthcare sector dominating 37.
5% of implementations.
Applications include diabetes prediction and COVID-19 epidemiological analysis.
Hybrid approaches integrate various techniques for comprehensive knowledge extraction, particularly in social media user behavior analytics.
Major challenges include computational complexity, methodological transparency deficiency in 66.
67% of studies, and algorithm scalability limitations.
Practical implications indicate a paradigm transformation in organizational decision-making from reliance on subjective intuition toward objective data-based formulation.
Business intelligence technology penetration reaches 31.
18% for dashboards and 10.
75% for clustering techniques in small and medium enterprise ecosystems, marking substantial evolution in contemporary managerial practices.
Keywords: Clustering Algorithms.
Data Classification.
Data Mining.
Machine Learning.
Metaheuristic Optimization Abstrak: Penelitian ini melakukan systematic literature review terhadap implementasi algoritma clustering dan classification dalam penambangan data untuk mengidentifikasi tren metodologi dan tantangan kontemporer periode 2021-2025.
Metodologi penelitian menggunakan pendekatan Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA).
Analisis dilakukan terhadap delapan studi relevan dari basis data Ie Xplore.
ScienceDirect.
Springer, dan ACM Digital Library.
Sintesis naratif digunakan untuk mengorganisasi temuan penelitian secara komprehensif.
Hasil penelitian menunjukkan dominasi algoritma classification sebesar 50% dengan Random Forest mencapai akurasi optimal 98,35% melalui optimisasi Particle Swarm Optimization.
Teknik clustering mendemonstrasikan efektivitas dalam segmentasi data dengan K-means menghasilkan konfigurasi optimal melalui Davies-Bouldin Index 0,47.
Domain aplikasi terdiversifikasi dengan sektor kesehatan mendominasi 37,5% implementasi.
Aplikasi mencakup prediksi diabetes dan analisis epidemiologi COVID-19.
Pendekatan hibrid mengintegrasikan berbagai teknik untuk ekstraksi pengetahuan komprehensif, khususnya dalam analitik perilaku pengguna media sosial.
Tantangan utama meliputi kompleksitas komputasional, defisiensi transparansi metodologis pada 66,67% studi, dan limitasi skalabilitas algoritma.
Implikasi praktis mengindikasikan transformasi paradigma pengambilan keputusan organisasional dari dependensi intuisi subjektif menuju formulasi berbasis data objektif.
Penetrasi teknologi business intelligence mencapai 31,18% untuk dashboard dan 10,75% untuk teknik clustering dalam ekosistem usaha kecil menengah, menandai evolusi substansial dalam praktik manajerial kontemporer.
Kata kunci: Algoritma Pengelompokan.
Klasifikasi Data.
Metaheuristic Optimization.
Penambangan Data.
Pembelajaran Mesin
PENDAHULUAN
Naskah Masuk: Juli 16, 2025.
Revisi: Agustus 01, 2025.
Diterima: September 25, 2025.
Terbit : September 29.
Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini Era digitalisasi modern telah menghasilkan pertumbuhan luar biasa dalam volume, kecepatan, dan variasi data yang dikenal sebagai fenomena ledakan data (Moh.
Agus Efendi & Zaehol Fatah, 2.
Transformasi digital yang terjadi di berbagai sektor industri, mulai dari perdagangan elektronik, layanan kesehatan, keuangan, hingga media sosial, telah menciptakan kumpulan data yang sangat besar dan kompleks.
Dalam konteks ini, data mining muncul sebagai disiplin ilmu yang sangat penting untuk mengekstrak informasi berharga dan pola tersembunyi dari kumpulan data yang masif tersebut (Aisyah et al.
, 2.
Kebutuhan untuk memahami dan menganalisis data secara efisien telah mendorong perkembangan berbagai teknik dan algoritma canggih yang mampu menangani kompleksitas data modern.
Algoritma clustering dan classification merupakan dua pilar fundamental dalam paradigma data mining yang memiliki peran krusial dalam proses penemuan pengetahuan dari Clustering, mengelompokkan objek data berdasarkan kesamaan karakteristik intrinsik tanpa memerlukan informasi label sebelumnya.
Sementara itu, classification beroperasi sebagai metode pembelajaran dengan supervisi yang bertujuan untuk memprediksi kategori atau kelas dari data baru berdasarkan pola yang dipelajari dari data latih yang telah berlabel.
Kedua pendekatan ini memiliki aplikasi yang sangat luas dan telah terbukti efektif dalam menyelesaikan berbagai permasalahan kompleks di dunia nyata (ALASALI & ORTAKCI, 2.
Perkembangan teknologi komputasi dan kecerdasan buatan dalam dekade terakhir telah membawa revolusi signifikan dalam implementasi algoritma clustering dan classification.
Munculnya paradigma big data, komputasi awan, dan machine learning telah membuka peluang baru untuk mengoptimalkan kinerja algoritma-algoritma tersebut.
Teknik-teknik inovatif seperti deep clustering, metode ensemble, dan algoritma hibrida telah dikembangkan untuk mengatasi keterbatasan algoritma tradisional.
Algoritma ini dirancang untuk menangani kumpulan data yang memiliki dimensi tinggi, derau yang besar, dan struktur yang kompleks.
Selain itu, integrasi dengan teknologi yang sedang berkembang seperti kecerdasan buatan dan komputasi kuantum juga mulai dieksplorasi untuk meningkatkan efisiensi dan akurasi proses clustering dan classification.
Tantangan kontemporer dalam implementasi algoritma clustering dan classification semakin kompleks seiring dengan evolusi karakteristik data modern.
Permasalahan seperti kutukan dimensionalitas, isu skalabilitas, concept drift, dan kemampuan interpretasi menjadi fokus utama penelitian terkini.
Data yang semakin beragam, tidak terstruktur, dan real-time memerlukan pendekatan algoritma yang lebih adaptif dan kuat.
Selain itu, aspek etika dan privasi dalam pengolahan data juga menjadi pertimbangan penting dalam pengembangan Hal ini terutama terjadi dalam konteks implementasi di sektor sensitif seperti JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 kesehatan dan keuangan.
Isu-isu seperti bias algoritma, keadilan, dan explainable artificial intelligence telah menjadi topik penelitian yang sangat relevan dalam komunitas akademik dan industri (AsyAoari & Luthfi, 2.
Literature review menjadi pendekatan metodologi yang sangat penting untuk memahami perkembangan terkini dan mengidentifikasi kesenjangan penelitian dalam bidang algoritma clustering dan classification.
Melalui analisis komprehensif terhadap publikasi ilmiah terbaru, dapat diperoleh gambaran menyeluruh tentang tren penelitian, metodologi yang berkembang, aplikasi praktis, serta tantangan yang masih perlu diatasi.
Pendekatan systematic literature review memungkinkan identifikasi pola evolusi penelitian, kontribusi signifikan dari berbagai studi, dan peluang pengembangan masa depan yang potensial (Bayu Setiawan & Rahmatulloh, 2.
Hal ini sangat penting untuk memberikan peta jalan penelitian yang jelas bagi akademisi dan praktisi dalam mengembangkan solusi yang lebih efektif dan efisien.
Kontribusi penelitian dalam bidang algoritma clustering dan classification telah menunjukkan pertumbuhan yang sangat signifikan dalam beberapa tahun terakhir.
Berbagai jurnal internasional bereputasi tinggi telah mempublikasikan studi-studi inovatif yang mengeksplorasi pengembangan algoritma baru, optimisasi kinerja, dan aplikasi dalam domain Penelitian-penelitian ini tidak hanya fokus pada aspek teknis algoritma, tetapi juga pada implementasi praktis dan evaluasi performa dalam skenario dunia nyata.
Kolaborasi antara institusi akademik dan industri telah menghasilkan solusi-solusi yang dapat diterapkan secara komersial dan memberikan nilai tambah signifikan bagi organisasi (Aisyah et al.
, 2.
Tren penelitian terkini menunjukkan pergeseran paradigma dari pendekatan algoritma tunggal menuju sistem terintegrasi yang menggabungkan berbagai teknik.
Pendekatan hibrida yang mengkombinasikan kekuatan clustering dan classification dalam framework terpadu telah menjadi area penelitian yang sangat menarik.
Selain itu, pengembangan algoritma yang dapat beradaptasi dengan perubahan data secara real-time juga menjadi fokus utama.
Hal ini terutama dalam konteks streaming data dan online learning.
Penelitian antardisiplin yang melibatkan pengetahuan domain dari berbagai bidang aplikasi juga semakin populer untuk menghasilkan solusi yang lebih kontekstual dan relevan (Aisyah et al.
, 2.
Berdasarkan latar belakang tersebut, rumusan masalah penelitian ini meliputi beberapa aspek fundamental yang perlu dianalisis secara mendalam.
Pertama, bagaimana perkembangan dan evolusi algoritma clustering dan classification dalam konteks data mining selama periode lima tahun terakhir.
Kedua, apa saja tren metodologi dan pendekatan inovatif yang telah dikembangkan untuk mengatasi tantangan implementasi dalam berbagai domain aplikasi.
Ketiga, tantangan apa saja yang masih dihadapi dalam implementasi algoritma clustering dan classification pada data modern yang kompleks.
Keempat, bagaimana efektivitas dan performa Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini berbagai algoritma dalam menangani dataset dengan karakteristik yang beragam.
Kelima, apa saja gap penelitian yang masih perlu dieksplorasi dan peluang pengembangan masa depan dalam bidang ini.
Tujuan utama dari penelitian literature review ini adalah untuk memberikan analisis komprehensif terhadap perkembangan implementasi algoritma clustering dan classification dalam data mining berdasarkan literatur terpublikasi dalam rentang waktu 2021 hingga 2025.
Secara spesifik, penelitian ini bertujuan untuk mengidentifikasi dan mengkategorisasi berbagai pendekatan algoritma clustering dan classification yang telah dikembangkan.
Selain itu, penelitian ini juga menganalisis tren metodologi dan teknik optimisasi yang digunakan, mengevaluasi efektivitas implementasi dalam berbagai domain aplikasi, mengidentifikasi tantangan utama dan solusi yang telah diusulkan, serta merumuskan rekomendasi untuk penelitian masa depan.
Melalui systematic literature review ini, diharapkan dapat diperoleh pemahaman yang mendalam tentang keadaan terkini dalam bidang algoritma clustering dan classification serta memberikan kontribusi signifikan bagi pengembangan penelitian TINJAUAN LITERATUR Evolusi Algoritma Pengelompokan dalam Penambangan Data Transformasi digital yang berlangsung dalam dekade terakhir telah menciptakan kebutuhan mendesak akan metodologi analitik yang mampu mengekstrak informasi bermakna dari kumpulan data bervolume masif.
Penelitian terdahulu menunjukkan bahwa algoritma pengelompokan mengalami evolusi substansial untuk mengatasi kompleksitas data kontemporer (Aisyah et al.
, 2.
Implementasi teknik pengelompokan berbasis jarak Euclidean telah mengalami adaptasi signifikan melalui integrasi metrik evaluasi DaviesBouldin untuk mengoptimalkan pembentukan kelompok data yang homogen (AsyAoari & Luthfi, 2.
Diversifikasi pendekatan algoritmik dalam pengelompokan mencakup pengembangan metode berbasis kepadatan, hierarkis, dan partisi yang dirancang untuk menangani heterogenitas data multidimensional.
Studi komparatif menunjukkan bahwa algoritma berbasis kepadatan menunjukkan performa superior dalam mengidentifikasi kelompok dengan bentuk arbitrer, sementara pendekatan hierarkis memberikan fleksibilitas dalam eksplorasi struktur data bertingkat (Bayu Setiawan & Rahmatulloh, 2.
Adaptabilitas metodologis ini mencerminkan respons akademik terhadap keterbatasan teknik konvensional dalam menghadapi variabilitas data modern.
Integrasi pembelajaran tanpa supervisi dengan teknik optimisasi metaheuristik telah menciptakan paradigma baru dalam implementasi pengelompokan adaptif.
Penerapan JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 algoritma genetika dan optimisasi kawanan partikel dalam penyetelan parameter pengelompokan menunjukkan peningkatan stabilitas dan konvergensi yang superior dibandingkan pendekatan konvensional (Fauzi & Yunial, 2.
Sinergi ini menghasilkan kerangka kerja yang lebih robust dalam menangani derau dan pencilan pada kumpulan data dunia nyata.
Fenomena ledakan data telah mendorong pengembangan algoritma pengelompokan yang mampu beradaptasi dengan karakteristik data yang dinamis.
Penelitian menunjukkan bahwa implementasi teknik pengelompokan inkremental memungkinkan pemrosesan aliran data secara waktu nyata tanpa memerlukan rekomputasi keseluruhan struktur kelompok (Husna et al.
, 2.
Pendekatan ini sangat relevan untuk aplikasi yang memerlukan responsivitas tinggi terhadap perubahan pola data yang terjadi secara Inovasi Metodologi Klasifikasi dan Optimisasi Pengembangan algoritma klasifikasi mengalami revolusi melalui implementasi teknik ansambel dan pembelajaran mendalam yang mengoptimalkan akurasi prediksi pada kumpulan data kompleks.
Penelitian empiris menunjukkan bahwa metode ansambel berbasis pohon keputusan menghasilkan generalisasi yang superior dibandingkan pengklasifikasi tunggal melalui agregasi prediksi dari berbagai pembelajar.
Fenomena ini mengindikasikan efektivitas diversitas algoritma dalam mereduksi varians dan bias prediksi.
Optimisasi parameter melalui teknik metaheuristik telah terbukti meningkatkan performa klasifikasi secara signifikan pada berbagai domain aplikasi.
Implementasi optimisasi kawanan partikel dalam penyetelan hiperparameter menunjukkan konvergensi yang lebih cepat dan stabilitas yang superior dibandingkan pencarian grid konvensional.
Pendekatan ini memungkinkan eksplorasi ruang parameter yang lebih efisien dengan kompleksitas komputasional yang terkontrol.
Evaluasi multimetrik menggunakan presisi, recall, dan skor F1 memberikan perspektif holistik tentang performa algoritma klasifikasi dalam skenario aplikasi yang beragam.
Studi komparatif menunjukkan bahwa metrik tunggal seringkali tidak mencukupi untuk mengevaluasi performa algoritma pada kumpulan data dengan distribusi kelas yang tidak Implementasi matriks konfusi dan kurva ROC memberikan visualisasi yang komprehensif tentang pertukaran antara sensitivitas dan spesifisitas.
Perkembangan terbaru dalam klasifikasi menunjukkan tren menuju personalisasi algoritma berdasarkan karakteristik domain spesifik.
Penelitian mengungkapkan bahwa adaptasi algoritma klasifikasi dengan pengetahuan domain menghasilkan peningkatan akurasi yang substansial dibandingkan pendekatan generik.
Integrasi pengetahuan ahli dengan pembelajaran mesin menciptakan Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini sistem hibrid yang menggabungkan kekuatan reasoning simbolik dengan kemampuan pattern recognition statistik.
Tantangan Kontemporer dan Arah Pengembangan Masa Depan Preservasi privasi dalam penambangan data sensitif menjadi fokus utama penelitian kontemporer dengan pengembangan privasi diferensial dan pendekatan pembelajaran Teknik injeksi derau yang terkalibrasi memungkinkan ekstraksi pola yang bermakna sambil mempertahankan kerahasiaan rekord individual.
Implementasi protokol kriptografi dalam skenario penambangan terdistribusi memberikan jaminan keamanan tanpa mengorbankan utilitas analitik.
Bias algoritmik dan pertimbangan keadilan telah menjadi area penelitian yang kritis dalam pengembangan sistem penambangan data yang etis.
Penelitian menunjukkan bahwa bias dapat teramplifikasi melalui loop umpan balik dalam sistem pengambilan keputusan algoritmik.
Pengembangan algoritma yang sadar bias dan optimisasi terkendala keadilan menjadi esensial untuk memastikan hasil yang adil di seluruh kelompok Interpretabilitas dan kemampuan penjelasan menjadi persyaratan fundamental dalam deployment algoritma penambangan data untuk aplikasi berisiko tinggi.
Teknik penjelasan lokal dan global memungkinkan pemangku kepentingan memahami alasan di balik keputusan Transparansi algoritmik ini esensial untuk membangun kepercayaan dan kepatuhan regulasi dalam industri yang diatur.
Komputasi kuantum menunjukkan potensi revolusioner untuk mengatasi keterbatasan komputasional dalam penambangan data skala masif.
Algoritma kuantum untuk masalah pengelompokan dan klasifikasi menunjukkan percepatan teoritis yang eksponensial dibandingkan algoritma klasik.
Implementasi praktis masih menghadapi tantangan dalam koreksi error kuantum dan ketersediaan qubit yang terbatas.
Komputasi tepi dan integrasi Internet of Things membuka peluang baru untuk analitik waktu nyata dengan latensi yang berkurang dan perlindungan privasi yang ditingkatkan.
Inferensi terdistribusi pada perangkat tepi memungkinkan pengambilan keputusan responsif tanpa transmisi data terpusat.
Paradigma ini khususnya relevan untuk aplikasi yang memerlukan respons langsung dan lingkungan terbatas bandwidth.
METODE
Penelitian ini menggunakan pendekatan systematic literature review (SLR) untuk menganalisis dan mensintesis perkembangan implementasi algoritma pengelompokan .
dan klasifikasi .
dalam data mining.
Metodologi SLR dipilih sebagai strategi penelitian yang tepat untuk memberikan gambaran komprehensif tentang keadaan JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 terkini penelitian dalam bidang ini.
SLR juga memungkinkan identifikasi tren yang berkembang serta evaluasi kontribusi teoretis dan praktis dari berbagai studi yang telah Pendekatan ini mengikuti protokol PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyse.
untuk memastikan transparansi dan reproduksibilitas proses Strategi pencarian literatur dilakukan secara bertahap dengan menggunakan basis data akademik terpercaya.
Basis data yang digunakan meliputi Ie Xplore.
ScienceDirect.
Springer.
ACM Digital Library, dan Google Scholar.
Kata kunci yang digunakan dalam pencarian meliputi kombinasi dari "clustering algorithms", "classification methods", "data mining", "machine learning", "unsupervised learning", "supervised learning", dan variasi terminologi terkait lainnya dalam bahasa Inggris maupun Indonesia.
Proses pencarian dilakukan dengan menerapkan operator boolean (AND.
OR.
NOT) untuk memperoleh hasil yang lebih spesifik dan relevan dengan fokus penelitian.
String pencarian yang digunakan adalah: ("clustering algorithms" OR "clustering methods") AND ("classification algorithms" OR "classification methods") AND "data mining" AND ("machine learning" OR "supervised learning" OR "unsupervised learning").
Periode publikasi yang menjadi target pencarian adalah artikel ilmiah yang diterbitkan antara tahun 2021 hingga 2025.
Proses analisis data dilakukan menggunakan pendekatan sintesis naratif untuk mengorganisasi dan menginterpretasi temuan-temuan dari literatur yang telah diseleksi.
Setiap artikel yang memenuhi kriteria dianalisis berdasarkan beberapa dimensi utama.
Dimensi tersebut meliputi jenis algoritma yang dibahas, metodologi implementasi, domain aplikasi, evaluasi kinerja, tantangan yang dihadapi, dan kontribusi inovatif yang dihasilkan.
Kategorisasi temuan dilakukan berdasarkan kerangka teoretis yang telah dikembangkan.
Hal ini memungkinkan identifikasi pola, tren, dan kesenjangan dalam literatur.
Analisis tematik digunakan untuk mengidentifikasi tema-tema utama yang muncul dari literatur.
Tema-tema tersebut kemudian diorganisasi dalam kategori yang koheren dan bermakna.
Proses triangulasi data dilakukan dengan membandingkan temuan dari berbagai sumber untuk meningkatkan validitas dan reliabilitas hasil analisis.
Dua peneliti independen melakukan proses screening dan ekstraksi data untuk mengurangi bias subjektivitas.
Kesepakatan antar-penilai .
nter-rater agreemen.
dievaluasi menggunakan koefisien Cohen's Kappa dengan nilai minimum 0,80 untuk memastikan konsistensi penilaian.
Validasi hasil dilakukan melalui diskusi dengan ahli di bidang data mining dan machine Proses ini bertujuan untuk memastikan interpretasi yang tepat terhadap temuan Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini penelitian dan relevansi dengan konteks penelitian terkini, sebagaimana dijelaskan dalam penelitian yang menekankan pentingnya pendekatan metodologi yang adaptif dalam data mining (Susanto et al.
, 2.
HASIL DAN PEMBAHASAN
Pendahuluan Hasil Screening Artikel Jurnal Jurnal dihapus sebelum Catatan duplikat yang dihapus .
= 102 ) Jurnal yang diidentifikasi dari Basis data .
= .
Jurnal yang disaring .
=207 ) Jurnal dikecualikan .
= 95 ) Jurnal yang dicari untuk diambil .
= 112 ) Jurnal yang tidak diambil .
= 56 ) Jurnal yang dinilai kelayakannya .
= 56 ) Jurnal dikecualikan:
Alasan 1 .
= 25 ) Alasan 2 .
= .
Jurnal yang termasuk dalam .
= 8 ) Jurnal dari studi yang disertakan .
= 8 ) Gambar 01.
Flowchart Prisma Flowchart PRISMA ini mencerminkan alur sistematis dari proses seleksi literatur dalam tinjauan sistematis, yang dimulai dari identifikasi hingga pemilihan akhir jurnal yang layak diikutsertakan dalam analisis penelitian.
Tabel 1.
Sintesis JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 Penulis Judul (Tahu.
Jenis Al- Domain Ap- Da- Metri Hasil Utama Kontri- taset/Sa busi/Temu Eval- Alasali & Clustering Tech- Clustering Healthcare.
Multi-
Multi-
Comprehensive Survey
Ortakci
niques in Data
(Distance- Image water-
ple da-
analysis of clus-
Mining: A Sur-
Hi-
Air
tering method-
(ALASALI
vey of Methods, pollution anal-
(Survey teknik clus-
Challenges, and Grid-
Text doc-
ORTAKCI,
Applications ument cluster- Density- ing.
Big data dan aplikasi masa Fauzi & Optimasi Algo- Classifica- Healthcare Diabe- Akuras Naive Bayes:
Optimisasi
Yunial
ritma Klasifikasi
tion (Na- (Diabetes pre-
tes da-
84,07% Ie
PSO
Naive Bayes.
De- ive Bayes, 89,01%
De (Fauzi & cision Tree.
K- Decision cision Tree:
kan akurasi Yunial.
Nearest Neigh-
Tree, 94,78% Ie
semua al-
bor, dan Random
KNN,
96,98%
K Forest Random NN: 85,99% Ie Random Fores.
94,51%
Ra Forest
Algoritma Parti-
PSO
ndom Forest:
cle Swarm Opti-
97,25% Ie
KNN pen-
mization pada 98,35% Diabetes Dataset
,52%)
Hardiani Analisis Cluster- Clustering Healthcare Da- 3 cluster opti- Penge- ing Kasus Covid- (K-Mean.
(COVID-19 mal dengan (Moh.
Agus 19 di Indonesia .
Mar Bouldi DBI = Efendi & Menggunakan 2020 - 9 n In- 0,47
Clus- COVID-19 Zaehol Algoritma K- Jul ter 1: 30 untuk men- Fatah.
Means (DBI) provinsi
Cl dukung ke- uster 2 & 3:
masing-masing 2 provinsi Husna et al.
Implementasi Classifica- E-com- Hijab Akuras 87% accu- Identifikasi Data Mining merce/Fashion racy
Harga (Husna et Menggunakan (C4.
5/De- (Hijab sale.
sebagai root harga se- , 2.
Algoritma C4.
tribut pada Klasifikasi Tre.
paling ber- Penjualan Hijab Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini Octiva et al.
Penggunaan Hybrid Social Media Social Multi- Berhasil men- Pendekatan .
Teknik Data (Cluster- Analytics hibrid un- (Octiva et Mining untuk ing.
Asso- pola perilaku tuk analisis , 2.
Analisis Perilaku pengguna, pref- Pengguna pada rule min- erensi konten, hensif per- Media Sosial Senti- pola interaksi ment anal- media sosial Sharma et A Review on Review Business.
Multi- Multi- Identifikasi tan- Review Data Mining Is- (Cluster- Healthcare.
Fi- ple da- tangan: kualitas (Sharma et Solution & ing.
Clas- data, privasi, hensif isu , 2.
Techniques (Re- dan solusi Associa- dalam data tion rule Stefanus & Comparison of Classifica- Healthcare Diabe- Akuras Random Forest:
Random
Leong
Random Forest
tion (Ran- (Diabetes pre-
tes da-
F1-
88,98% .
an- Forest Algorithm Accu- dom For- Score, dom state (Stefanus racy With Recall, .
XGBoo li XGBoost & Leong.
XGBoost Using XGBoos.
Preci- st: 87,00% .
an- Hyperparameters dom state prediksi di- .
Ran- dom state 0: RF
78,43% vs
XGB 76,47%
Tsiu et al.
Applications and Review Small-Medium 93 arti- Adop- Dashboard Adopsi BI Competitive Ad- (Cluster- Enterprises tools dalam (Tsiu et al.
vantages of Data ing.
Busi- (SME.
4- 31,18%
Cl UKM Mining and Busi- ness Intel- Perfor- ustering tech- ness Intelligence fokus pada 10,75%
66 mance: A Sys- ,67% studies dan teknik tematic Review lack methodo- in SMEs Perfor- logical transparency Pembahasan Hasil Penelitian JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386 Berdasarkan sintesis komprehensif terhadap delapan studi yang dianalisis, terdapat beberapa temuan fundamental yang mengkarakterisasi evolusi implementasi algoritma pengelompokan dan klasifikasi dalam domain penambangan data kontemporer.
Distribusi metodologis menunjukkan predominansi pendekatan klasifikasi pada 50% dari corpus penelitian yang dikaji, diikuti teknik pengelompokan sebesar 25%, serta pendekatan hibrid dan kajian komprehensif masing-masing merepresentasikan 12,5%.
Pola distribusi ini mengindikasikan preferensi substansial komunitas riset terhadap metodologi pembelajaran terawasi, khususnya dalam mengatasi permasalahan prediktif yang menuntut presisi tinggi dan akurasi optimal (Wahyu Istalama Firdaus, 2.
Evaluasi komparatif terhadap performa algoritma klasifikasi mengdemonstrasikan superioritas konsisten metode ensemble dalam pencapaian akurasi optimum.
Penelitian empiris yang dikonducted oleh (Moh.
Agus Efendi & Zaehol Fatah, 2.
memvalidasi efektivitas integrasi optimisasi Particle Swarm Optimization, yang menghasilkan amplifikasi akurasi signifikan pada algoritma Random Forest dari baseline 97,25% mencapai puncak 98,35%.
Konfirmasi independen diperoleh melalui studi komparatif yang menunjukkan dominasi Random Forest atas XGBoost dengan margin akurasi 1,98% pada konfigurasi random state identik (Stefanus & Leong, 2.
Fenomena ini mengekspresikan efektivitas intrinsik agregasi prediksi dari ensemble decision trees dalam mitigasi overfitting dan enhancement generalisasi model (Tsiu et al.
, 2.
Implementasi teknik pengelompokan menunjukkan aplikabilitas ekstensif dalam konteks analisis eksploratori dan segmentasi data multidimensional kompleks.
Investigasi yang dieksekusi oleh (Octiva et al.
, 2.
mendemonstrasikan efisiensi algoritma K-Means dalam mengekstrak pola distribusi spasial epidemi COVID-19, menghasilkan konfigurasi tiga kelompok optimal yang tervalidasi melalui Davies-Bouldin Index bernilai 0,47.
Struktur klaster yang terbentuk mengindikasikan heterogenitas geografis substansial dalam distribusi kasus, dengan formasi satu kelompok dominan mengakomodasi 30 provinsi dan dua kelompok minoritas masing-masing berisi 2 provinsi.
Temuan ini mengilustrasikan kapabilitas algoritma pengelompokan dalam ekstraksi struktur laten dari data multivariat tanpa dependensi terhadap supervisi eksternal (Susanto et al.
, 2.
Diversifikasi spektrum domain aplikasi mencerminkan adaptabilitas inherent algoritma penambangan data dalam mengatasi permasalahan heterogen lintas sektor.
Dominasi sektor kesehatan dengan kontribusi 37,5% dari keseluruhan studi mencakup aplikasi prediksi diabetes dan analisis epidemiologi COVID-19, mengindikasikan urgensi pengembangan sistem prediktif dalam domain medis yang memiliki implikasi langsung terhadap kesejahteraan publik.
Representasi sektor perdagangan elektronik dan analitik media sosial masing-masing 25% dan Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini 12,5% menunjukkan penetrasi progresif teknologi penambangan data dalam ekosistem digital (Rismaninda Putri Dwi Prasetya et al.
, 2.
mendemonstrasikan implementasi sukses algoritma C4.
5 dalam klasifikasi penjualan hijab dengan akurasi 87%, mengidentifikasi atribut harga sebagai determinan primordial dalam formulasi keputusan pembelian konsumen.
Pendekatan metodologis hibrid menunjukkan trajektori evolusioner dalam penambangan data yang mengintegrasikan teknik multipel untuk optimisasi ekstraksi pengetahuan.
(Sarlina et al.
, 2.
mengimplementasikan kombinasi sofistikated dari teknik pengelompokan, association rule mining, dan analisis sentimen untuk menganalisis perilaku pengguna media sosial secara holistik.
Pendekatan multidimensional ini memfasilitasi identifikasi pola kompleks yang tidak dapat dideteksi melalui metodologi singular, menghasilkan pemahaman komprehensif terhadap preferensi konten, dinamika interaksi sosial, dan kecenderungan temporal pengguna.
Karakteristik evaluasi metrik performa mengindikasikan adopsi standar penilaian yang diversified dalam mengukur efektivitas algoritmik.
Akurasi menjadi metrik predominant yang diutilisasi dalam 75% korpus studi, sementara precision, recall, dan F1-score diaplikasikan dalam konteks klasifikasi yang menuntut analisis sensitivitas dan spesifisitas mendalam.
DaviesBouldin Index diimplementasikan sebagai metrik validasi internal untuk algoritma pengelompokan, menunjukkan konsistensi metodologis dalam evaluasi kualitas formasi klaster.
Identifikasi tantangan implementasi encompass kompleksitas komputasional, limitasi skalabilitas algoritma, dan defisiensi transparansi metodologis.
Kajian sistematik yang dieksekusi oleh (Sharma et al.
, 2.
mengungkap bahwa 66,67% penelitian dalam domain usaha kecil menengah mengalami defisiensi transparansi metodologis terkait spesifikasi teknik penambangan data yang diimplementasikan.
Keterbatasan ini mengindikasikan urgensi standardisasi dalam protokol pelaporan metodologis untuk memfasilitasi reproduksibilitas riset.
(Stefanus & Leong, 2.
mengidentifikasi isu-isu kritis mencakup kualitas data, preservasi privasi, dan skalabilitas sebagai tantangan fundamental yang memerlukan solusi inovatif.
Implikasi praktis dari temuan riset menunjukkan potensi transformatif teknologi penambangan data dalam optimisasi proses pengambilan keputusan organisasional.
Tingkat adopsi dashboard dan teknik pengelompokan menunjukkan penetrasi masing-masing 31,18% dan 10,75% dalam konteks usaha kecil menengah, mengindikasikan evolusi penetrasi teknologi business intelligence dalam ekosistem bisnis kontemporer.
Trajektori ini mencerminkan transformasi paradigma dari dependensi intuisi subjektif menuju formulasi keputusan berbasis data yang objektif dan terukur, menandai evolusi substansial dalam praktik manajerial modern.
JUPSIM - VOLUME.
NUMBER.
3 SEPTEMBER 2025
e-ISSN: 2808-8980.
p-ISSN: 2808-9383.
Pages 372-386
KESIMPULAN
Berdasarkan systematic literature review terhadap implementasi algoritma clustering dan classification dalam data mining periode 2021-2025, penelitian ini mengidentifikasi tren signifikan dalam evolusi metodologi penambangan data.
Algoritma classification menunjukkan dominasi 50% dari korpus penelitian dengan Random Forest mencapai akurasi tertinggi 98,35% melalui optimisasi Particle Swarm Optimization.
Teknik clustering memperlihatkan efektivitas dalam analisis eksploratori dengan K-Means menghasilkan segmentasi optimal melalui Davies-Bouldin Index 0,47.
Domain aplikasi terdiversifikasi dengan sektor kesehatan mendominasi 37,5% implementasi, mencakup prediksi diabetes dan analisis epidemiologi.
Pendekatan hibrid mengintegrasikan multiple teknik untuk ekstraksi pengetahuan komprehensif, khususnya dalam analitik media sosial.
Tantangan kontemporer meliputi kompleksitas komputasional, defisiensi transparansi metodologis pada 66,67% studi, dan limitasi skalabilitas.
Implikasi praktis menunjukkan transformasi paradigma pengambilan keputusan dari intuisi subjektif menuju formulasi berbasis data objektif, dengan adopsi dashboard 31,18% dan clustering 10,75% dalam usaha kecil menengah, mengindikasikan penetrasi progresif teknologi business intelligence dalam ekosistem organisasional modern.
Kontribusi Penulis: Paragraf pendek yang menjelaskan kontribusi masing-masing penulis harus disertakan untuk artikel penelitian dengan beberapa penulis .
ajib untuk lebih dari 1 penuli.
Pernyataan berikut harus digunakan AuKonseptualisasi: XX dan YY.
Metodologi: XX.
Perangkat Lunak: XX.
Validasi: XX.
YY dan ZZ.
Analisis formal: XX.
Investigasi: XX.
Sumber daya: XX.
Kurasi data: XX.
PenulisanAipersiapan draf asli: XX.
PenulisanAipeninjauan dan penyuntingan: XX.
Visualisasi: XX.
Supervisi: XX.
Administrasi proyek: XX.
Akuisisi pendanaan: YYAy Pendanaan: Harap tambahkan: AuPenelitian ini tidak menerima pendanaan eksternalAy atau AuPenelitian ini didanai oleh NAMA PENDANA, nomor hibah xAy.
Periksa dengan saksama apakah rincian yang diberikan akurat dan gunakan ejaan standar nama lembaga pendanaan .
Kesalahan apa pun dapat memengaruhi pendanaan Anda di masa mendatang .
Pernyataan Ketersediaan Data: Kami mendorong semua penulis artikel yang diterbitkan dalam jurnal FAITH untuk membagikan data penelitian mereka.
Bagian ini memberikan perincian mengenai tempat data pendukung hasil yang dilaporkan dapat ditemukan, termasuk tautan ke kumpulan data yang diarsipkan secara publik yang dianalisis atau dibuat selama penelitian.
Jika tidak ada data baru yang dibuat atau data tidak tersedia karena batasan privasi atau etika, pernyataan tetap diperlukan.
Implementasi Algoritma Clustering dan Classification dalam Data Mining: Systematic Literature Review terhadap Tren dan Tantangan Terkini Ucapan Terima Kasih