36 P-ISSN: 2477-3042. E-ISSN: 3026-3034 SURYA INFORMATIKA. VOL. 14 No. Mei 2024 Penerapan Data Mining Untuk Klasifikasi Penyakit Artritis Gout Menggunakan Algoritma KNN Yuni Handayani1. Abdul Rahman Ismail2. Bagus Prindo Sugihartono Putro3 Teknik Informatika. Fakultas Komputer dan Desain dan Universitas Selamat Sri Sistem Informasi. Fakultas Ilmu Komputer dan Universitas Ichsan Gorontalo Utara handayani@gmail. com 1, abdulrahmanismail123@gmail. com 2, bagusprindo96@gmail. ABSTRACT This study aims to apply the K-Nearest Neighbor (KNN) algorithm to classify Gouty Arthritis based on patient clinical data. Gouty arthritis is a type of arthritis caused by a buildup of uric acid crystals in the joints, which can cause severe pain and swelling. The research method uses a dataset consisting of 500 entries, including information such as clinical symptoms, risk factors, medical history, and response to This data is processed through pre-processing stages to clean invalid data and convert categorical data into a format suitable for Next, the dataset is divided into training and test data for model building and evaluation. The KNN algorithm is applied to training data to build a classification model that can recognize important patterns related to the diagnosis of Gouty Arthritis. The evaluation was carried out using a test dataset to verify the accuracy and reliability of the model predictions. The research results show that the KNN algorithm at a value of K=5 achieved an accuracy of 87. 76%, recall of 92. 31%, and precision of 90. 48% in classifying Gouty Arthritis. The implication of this research is the potential use of data mining techniques to support more effective diagnosis and disease management in clinical practice Keywords : Artritis Gout. K-Nearest Neighbor (KNN). Data Mining ABSTRAK Penelitian ini bertujuan untuk menerapkan algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan penyakit Artritis Gout berdasarkan data klinis pasien. Artritis Gout adalah jenis artritis yang disebabkan oleh penumpukan kristal asam urat di dalam sendi, yang dapat menyebabkan nyeri hebat dan pembengkakan. Metode penelitian menggunakan dataset yang terdiri dari 500 entri, termasuk informasi seperti gejala klinis, faktor risiko, riwayat medis, dan respons terhadap pengobatan. Data ini diproses melalui tahapan pra-pemrosesan untuk membersihkan data yang tidak valid dan mengubah data kategorikal menjadi format yang sesuai untuk analisis. Selanjutnya, dataset dibagi menjadi data latih dan uji untuk pembangunan serta evaluasi model. Algoritma KNN diterapkan pada data latih untuk membangun model klasifikasi yang dapat mengenali pola-pola penting terkait dengan diagnosis Artritis Gout. Evaluasi dilakukan menggunakan dataset uji untuk memverifikasi keakuratan dan keandalan prediksi model. Hasil penelitian menunjukkan bahwa algoritma KNN pada nilai K=5 mencapai nilai akurasi 87,76%, recall 92,31%, dan precision 90,48% dalam mengklasifikasikan penyakit Artritis Gout. Implikasi dari penelitian ini adalah potensi penggunaan teknik data mining untuk mendukung diagnosis dan manajemen penyakit secara lebih efektif dalam praktik klinis Keywords : Artritis Gout. K-Nearest Neighbor (KNN). Data Mining PENDAHULUAN Artritis Gout merupakan salah satu jenis artritis yang disebabkan oleh penumpukan kristal asam urat di dalam sendi, yang sering kali menimbulkan rasa nyeri yang hebat, pembengkakan, dan peradangan. Penyakit ini umumnya menyerang sendi pada jempol kaki, namun bisa juga mempengaruhi sendi lain seperti pergelangan kaki, lutut, dan tangan (Tabalujan et al. , 2. Prevalensi Artritis Gout terus meningkat di seluruh dunia, seiring dengan gaya hidup yang tidak sehat dan meningkatnya usia harapan hidup. Diagnosis Artritis Gout secara konvensional biasanya dilakukan melalui pemeriksaan klinis dan laboratorium, seperti analisis cairan sendi untuk mendeteksi kristal urat. Namun, metode ini sering memakan waktu dan memerlukan keahlian khusus. Selain itu, gejala Artritis Gout yang mirip dengan jenis artritis lainnya seringkali menyebabkan kesulitan dalam penentuan diagnosis yang tepat. Seiring dengan perkembangan teknologi informasi, data mining muncul sebagai solusi potensial untuk membantu proses diagnosis penyakit. Data mining adalah proses untuk menemukan pola dan pengetahuan yang bermanfaat dari data yang besar dan kompleks. Dalam konteks medis, data mining dapat digunakan untuk menganalisis data klinis pasien, mengidentifikasi pola penyakit, serta memberikan prediksi dan rekomendasi untuk penanganan Algoritma K-Nearest Neighbor (KNN) merupakan salah satu teknik data mining yang efektif untuk klasifikasi. KNN (Dwi Fasnuari et al. , 2. bekerja dengan cara mencari sejumlah titik data terdekat . etangga terdeka. dari titik data baru dan menentukan kelasnya berdasarkan mayoritas kelas tetangga KNN dikenal karena kesederhanaannya dalam implementasi dan kemampuan adaptasinya pada berbagai jenis data. Pada penelitian yang dilakukan oleh (Dwi Fasnuari et al. , 2. Happy Andrian Dwi Fasnuari. Haris Yuana. Taofik Chulkamdi pada tahun 2022 yang berjudul Penerapan Algoritma K-Nearest Neighbor (K-NN) Untuk Klasifikasi Penyakit Diabetes Melitus Studi Kasus : Warga Desa Jatitengah yang membahas tentang klasifikasi penyakit diabetes melitus dengan menggunakan algoritma KNN pada penelitian ini menggunakan 8 variabel yaitu mudah haus, berat badan meskipun konsumsi makan teratur, tekanan darah tinggi, terdapat Riwayat diabetes dalam keluarga, luka yang sulit sembuh, sering buang air di malam hari, serta hasil cek gula darah dan usia. Pada hasil penelitian menunjukan data yang digunakan sebanyak 108 data training dan 27 data testing menghasilkan akurasi 93% pada K=9, presisi 100%, recall 60% dan F1-Score 75%. Dengan diperoleh nilai akurasi sebesar 93% menunjukan bahwa penelitian ini telah berhasil menerapkan metode KNN untuk melakukan klasifikasi terhadap penyakit diabetes mellitus. Penelitian ini bertujuan untuk menerapkan algoritma KNN dalam mengklasifikasikan Penerapan Data Mining Untuk Klasifikasi Penyakit Artritis Gout Menggunakan Algoritma KNN P-ISSN: 2477-3042. E-ISSN: 3026-3034 SURYA INFORMATIKA. VOL. 14 No. Mei 2024 penyakit Artritis Gout berdasarkan data klinis pasien. Dengan menggunakan data mining, diharapkan dapat meningkatkan akurasi diagnosis serta mempercepat proses identifikasi Selain itu, penelitian ini juga bertujuan untuk KNN membandingkannya dengan metode klasifikasi lainnya, guna menemukan pendekatan terbaik dalam mendiagnosis Artritis Gout. Dengan demikian, penelitian ini diharapkan dapat memberikan kontribusi yang signifikan dalam bidang medis, terutama dalam meningkatkan kualitas diagnosis dan penanganan Artritis Gout melalui pemanfaatan teknologi data risiko, riwayat medis, dan respons terhadap pengobatan. Penelitian ini memiliki dua tujuan utama: pertama, mengidentifikasi pola-pola tersembunyi dalam data menggunakan algoritma pohon keputusan. mengembangkan model prediktif untuk mendukung diagnosa awal dan manajemen penyakit artritis gout. Selama penelitian, dataset artritis gout dipelajari secara menyeluruh untuk memahami distribusi fitur utama dan interaksi di antara mereka. Pra pemrosesan data dilakukan untuk membersihkan data dari nilai yang hilang atau tidak valid dan mengubah data kategorikal ke format yang sesuai untuk analisis. Dataset dibagi menjadi subset data latih dan uji untuk membangun serta mengevaluasi model. Algoritma KNN diterapkan pada dataset latih untuk membangun model klasifikasi yang mengenali pola-pola penting terkait diagnosis artritis gout. Evaluasi dilakukan menggunakan dataset uji terpisah untuk memverifikasi keandalan dan ketepatan prediksi model. Hasil penelitian diharapkan memberikan wawasan baru tentang factor faktor yang memengaruhi artritis gout dan mendukung pengembangan model prediktif untuk penanganan yang lebih efektif. LANDASAN TEORI Artritis Gout Artritis Gout disebabkan oleh penumpukan kristal urat dalam sendi akibat tingginya kadar asam urat dalam darah. Faktor risiko termasuk genetik, diet tinggi purin, obesitas, dan kondisi seperti hipertensi (Nofia et al. , 2. Gejala utama meliputi serangan nyeri sendi akut, terutama pada jempol kaki, serta kemerahan dan pembengkakan. Diagnosis melibatkan analisis cairan sendi dan tes darah. Pengobatan meliputi penggunaan OAINS, kolkisin, dan obat penurun asam urat, disertai dengan perubahan gaya Pencegahan melibatkan diet sehat dan monitoring kadar asam urat secara teratur untuk mencegah serangan. Data Mining Data Mining merupakan salah satu disiplin ilmu yang berkaitan dengan proses (Handayani et al. , 2. mengeksplorasi dan menganalisis data besar untuk menemukan pola-pola yang bermanfaat dan pengetahuan yang tersembunyi. Tujuan utama dari data mining adalah untuk mengidentifikasi hubungan yang dapat digunakan untuk pengambilan keputusan yang lebih baik. Metode data mining mencakup berbagai teknik seperti klasifikasi, klastering, regresi, asosiasi, dan penggalian pola urutan (Cahyanti et al. , 2. Data mining diterapkan dalam berbagai industri dan bidang, termasuk bisnis, kedokteran, keuangan, pemasaran, dan ilmu pengetahuan lainnya untuk mendukung pengambilan keputusan berdasarkan analisis data yang kuat dan relevan. KNN K-Nearest Neighbors (KNN) adalah algoritma dalam data mining dan machine learning yang digunakan untuk klasifikasi dan regresi. Algoritma ini menentukan kategori atau nilai target dari data baru berdasarkan mayoritas tetangga terdekatnya dalam ruang fitur (Sumarlinda & Lestari, 2. KNN bekerja dengan menghitung jarak antara data yang akan diklasifikasikan dengan data pelatihan, lalu memilih kategori mayoritas dari tetangga terdekat . engan nilai K yang ditentuka. Algoritma ini populer karena kesederhanaannya dan fleksibilitasnya dalam menangani berbagai jenis data. Dataset Penelitian ini bertujuan untuk menganalisis dan mengelompokkan data dari pasien dengan penyakit artritis gout menggunakan sebuah dataset berisi 500 entri. Data tersebut mencakup informasi seperti gejala klinis, faktor METODOLOGI PENELITIAN Pengumpulan Data Preprocessing Pembagian Dataset Pembangunan Model Decision Tree Evaluasi Model Analisis Hasil Evaluasi Model Interpretasi dan Kesimpulan Gambar 1. Alur Penelitian Penelitian ini menggunakan langkah-langkah sistematis untuk menganalisis dataset penyakit gout dan membuat model prediktif menggunakan algoritma KNN. Ini adalah tahapan utama dari metodologi penelitian: Pengumpulan Data: 500 dataset pasien artritis gout dikumpulkan dari berbagai sumber, termasuk survei, catatan medis, dan database kesehatan yang relevan. Data ini mencakup berbagai informasi seperti gejala klinis, faktor risiko, riwayat medis, dan respons pasien terhadap pengobatan. Preprocessing Data: Langkah ini melibatkan pengolahan data kategorikal menjadi format yang sesuai untuk analisis dan pembersihan nilai-nilai yang hilang atau tidak valid. Mengubah format data dan menangani Penerapan Data Mining Untuk Klasifikasi Penyakit Artritis Gout Menggunakan Algoritma KNN P-ISSN: 2477-3042. E-ISSN: 3026-3034 nilai-nilai yang hilang atau tidak valid membantu mempersiapkan dataset untuk analisis lebih lanjut. Pembagian Dataset: Data tentang penyakit gout dibagi menjadi dua kelompok: data latih dan data uji. Data latih digunakan untuk membuat model prediktif, sedangkan data uji digunakan untuk mengevaluasi dan memvalidasi model yang telah dikembangkan. Membangun Model KNN: Algoritma KNN digunakan pada dataset latih untuk membangun model klasifikasi yang dapat menemukan pola penting yang terkait dengan diagnosis artritis gout. Proses ini melibatkan validasi silang untuk mengoptimalkan kinerja model dan penyesuaian parameter algoritma KNN. Evaluasi Model: Evaluasi dilakukan menggunakan dataset uji yang berbeda setelah model KNN dibangun. Untuk memastikan keakuratan dan keandalan prediksi model, evaluasi melibatkan pengukuran akurasi, presisi, recall pada performance vector. Analisis Hasil: Hasil evaluasi model digunakan untuk menganalisis kinerja model prediktif dan menemukan faktor-faktor yang penting untuk diagnosis artritis gout. Analisis ini membantu memahami peran variabel tertentu dalam prediksi diagnosis dan penanganan penyakit gout. Interpretasi dan Kesimpulan: Hasil analisis memberikan interpretasi pola-pola yang ditemukan dalam data dan implikasinya terhadap diagnosis dan penanganan artritis gout. Penelitian ini mencakup hasil penting, masalah, dan rekomendasi untuk penelitian lebih lanjut. Penelitian ini bertujuan untuk mendapatkan pemahaman yang lebih baik tentang faktor-faktor yang mempengaruhi penyakit gout dan untuk membuat model prediktif yang dapat digunakan untuk membantu praktik klinis mengelola penyakit ini secara lebih baik. SURYA INFORMATIKA. VOL. 14 No. Mei 2024 Nilai akurasi sistem sebesar 89,80% diperoleh melalui pengolahan data menggunakan aplikasi RapidMiner. Gambar menunjukkan bahwa prediksi tidak adalah 19, dan prediksi iya adalah 25, dan nilai precision sebesar 86,21% dan nilai recall sebesar 96,15%. Dengan pengolahan data menggunakan aplikasi RapidMiner didapat nilai akurasi sistem sebesar 89. Dari gambar di jelaskan bahwa prediksi tidak adalah 19 dan prediksi iya adalah 25 dengan nilai precision sebesar 86. dan nilai recall sebesar 96. Gambar 4. Visualisasi Arthritis Gout Langkah berikutnya adalah menguji hasil analisis dengan perhitungan manual setelah data diklasifikasikan dan dianalisis menggunakan Algoritma KNN. Proses klasifikasi Arthritis Gout dilakukan dengan menggunakan Aplikasi RapidMiner. KESIMPULAN Algoritma KNN pada data mining dapat digunakan untuk mendapatkan informasi tentang klasifikasi penyakit Arthritis Gout. Sebuah Algoritma KNN dapat dibangun dari lima ratus contoh data pelatihan dan menghasilkan aturan untuk mengklasifikasikan penyakit Arthritis Gout pada nilai K=5. Akurasi 87,76%, recall 92,31%, dan precision 90,48% ditunjukkan oleh tes. DAFTAR PUSTAKA