LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 e-ISSN: 2798-9593 p-ISSN: 2798-9836 Evaluasi Performa Metode Rough Set dan Algoritma Apriori dalam Mengidentifikasi Pola Penyakit Demam Tifoid Beny Irawan11*. Erwin Daniel Sitanggang2 1*Institut Kesehatan Medistra Lubuk Pakam Jl. Sudirman No. Petapahan. Kec. Lubuk Pakam. Kabupaten Deli Serdang. Sumatera Utara - 20512 2Universitas Mandiri Bina Prestasi Jl. Letjend. Djamin Ginting No. Padang Bulan. Medan Baru. Kota Medan. Sumatera Utara. Indonesia - 20155 1*benyirawan@medistra. id, 2rwins. sitanggang@gmail. DOI: 10. 58918/cmws6d52 Abstrak Informasi merupakan kebutuhan vital dalam kehidupan sehari-hari dan memiliki peranan penting dalam proses pengambilan Namun, memperoleh informasi yang tepat dan akurat sering kali menjadi tantangan tersendiri. Penelitian ini bertujuan untuk membantu pengambil keputusan dengan membandingkan kinerja metode Rough Set dan algoritma Apriori dalam proses analisis data. Metode Rough Set dimanfaatkan untuk menghasilkan aturan yang ringkas melalui proses reduksi, sedangkan algoritma Apriori digunakan untuk menemukan kombinasi itemset yang sering muncul dalam basis data berdasarkan nilai minimum support . , dengan tahapan utama berupa proses join dan prune. Tujuan utama dari penelitian ini adalah meningkatkan akurasi kedua metode dalam mengidentifikasi penyakit demam tifoid. Penelitian ini menggunakan tujuh variabel input utama, dan berdasarkan pengujian terhadap dataset demam tifoid, metode Rough Set menghasilkan aturan dengan panjang empat, sedangkan algoritma Apriori menghasilkan aturan dengan panjang tiga. Hasil akhir menunjukkan bahwa kedua metode memberikan rata-rata akurasi sebesar 87,4%. Kata Kunci: Metode Rough Set. Algoritma Apriori. Demam. Demam Tifoid. Pendahuluan Informasi merupakan elemen yang sangat penting dalam pengambilan keputusan di berbagai bidang, termasuk bidang kesehatan. Seiring dengan meningkatnya jumlah data yang tersedia, tantangan utama bukan lagi pada pengumpulan data, melainkan bagaimana menggali dan mengolah data tersebut agar menghasilkan informasi yang akurat, relevan, dan Dalam konteks ini, teknik data mining menjadi sangat penting karena mampu mengekstraksi pola dan pengetahuan tersembunyi dari sejumlah besar data secara otomatis dan efisien. Data mining adalah suatu proses seleksi, eksplorasi, dan pemodelan terhadap data dalam jumlah besar untuk menemukan pola atau tren yang tidak tampak secara eksplisit (Turban et al. , 2. Proses ini menggunakan berbagai metode seperti algoritma Apriori. Rough Set. Fuzzy Logic, dan metode lainnya untuk melakukan analisis dan prediksi berbasis data. Data mining juga telah banyak digunakan dalam bidang kesehatan, seperti untuk prediksi penyakit, pengelompokan data pasien, serta penentuan pola hubungan antar gejala dan penyakit. Metode Rough Set, yang pertama kali dikembangkan oleh ZdzisCaw Pawlak pada tahun 1980-an, merupakan salah satu pendekatan matematika yang digunakan untuk menangani ketidakpastian, ketidaktepatan, dan ambiguitas dalam Rough Set tidak memerlukan informasi tambahan seperti probabilitas atau tingkat keanggotaan sebagaimana yang dibutuhkan dalam teori probabilitas dan fuzzy. Melalui konsep seperti lower approximation, boundary region, dan reduct, metode ini dapat digunakan untuk menemukan aturan keputusan dari data secara efisien (Hakim & Rusli. Li et al. , 2. Sementara itu, algoritma Apriori merupakan teknik association rule mining yang digunakan untuk menemukan asosiasi antar item dalam suatu basis data, berdasarkan nilai support dan confidence (Jiawei & Kamber, 2. Algoritma ini bekerja melalui dua tahap utama, yaitu join . enggabungan itemse. dan prune . emangkasan berdasarkan minimum suppor. , untuk membentuk aturan yang merepresentasikan hubungan antar atribut dalam dataset. Beberapa menunjukkan bahwa metode Rough Set dan algoritma Apriori mampu memberikan hasil yang signifikan dalam analisis data medis. Misalnya. Budiono et al. LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 . menggunakan algoritma Apriori untuk menemukan pola penyakit radang sendi, sedangkan penelitian oleh Adeyemo et al. menunjukkan bahwa algoritma Multilayer Perceptron (MLP) memiliki akurasi tinggi untuk diagnosis demam tifoid, meskipun C4. 5 lebih cepat dalam proses pelatihan. Berdasarkan latar belakang tersebut, penelitian ini bertujuan untuk menganalisis kinerja metode Rough Set dan algoritma Apriori dalam mengidentifikasi pola penyakit demam tifoid. Dengan membandingkan kedua metode ini, diharapkan dapat diperoleh hasil analisis yang optimal, baik dari segi akurasi, efisiensi, maupun kualitas aturan yang dihasilkan, sehingga dapat mendukung proses diagnosis dan pengambilan keputusan di bidang kesehatan. Tinjauan Pustaka Data Mining Data mining adalah proses penambangan pengetahuan dari sejumlah besar data untuk menemukan pola dan informasi yang bermakna (Han & Kamber, 2. Proses ini merupakan bagian dari Knowledge Discovery in Databases (KDD) dan melibatkan ekstraksi, pengenalan, serta penyajian informasi dari basis data yang besar untuk mendukung pengambilan keputusan (Connolly & Begg, 2005. Berry & Linoff, 2. Penggunaan data mining menjadi penting karena pertumbuhan data yang pesat dan kebutuhan untuk menginterpretasikan data secara Disiplin ilmu yang terlibat dalam data mining antara lain statistika, basis data, pembelajaran mesin, dan visualisasi data. Data Cleaning Data cleaning adalah tahap awal dalam proses KDD yang bertujuan untuk menangani data tidak lengkap, redundan, atau inkonsisten (Kurniawati, 2. Salah satu teknik yang digunakan adalah remove incomplete data, yaitu menghapus baris data yang tidak memiliki informasi lengkap. Misalnya, jika dalam tabel data pasien terdapat entri yang kosong, maka data tersebut dihapus agar hanya data yang lengkap yang digunakan dalam analisis. Data Transformation Data transformation adalah proses mengubah data mentah ke dalam format yang sesuai untuk analisis, salah satunya dengan menggunakan algoritma fungsi Transformasi ini mengonversi data kategorik menjadi bentuk numerik biner agar dapat digunakan dalam metode analisis data mining. e-ISSN: 2798-9593 p-ISSN: 2798-9836 Teori Rough Set Teori Rough Set dikembangkan oleh Z. Pawlak pada tahun 1982 dan merupakan metode matematis untuk menganalisis klasifikasi data dalam bentuk tabel, khususnya data diskrit (Thangavel et al. , 2. Tujuannya adalah memperoleh decision rules yang sederhana dan relevan dari data yang mengandung Rough Set tidak memerlukan informasi tambahan atau distribusi probabilistik dalam proses analisis, namun kurang efektif dalam menangani atribut kontinu. Pendekatan ini sangat berguna dalam knowledge discovery in database (KDD) dan telah diterapkan dalam berbagai bidang seperti kedokteran, farmasi, perbankan, teknik, dan pengolahan citra. Beberapa keunggulannya adalah kemampuannya dalam mereduksi data, mengevaluasi signifikansi atribut, menghasilkan aturan keputusan, dan menyediakan interpretasi langsung yang mudah dipahami. Beberapa konsep dasar dalam teori Rough Set mencakup Information System (IS) dan Decision System (DS), yaitu struktur data yang merepresentasikan objek beserta atribut kondisi dan atribut keputusan. Indiscernibility Relation menggambarkan relasi antar objek yang tidak dapat dibedakan berdasarkan atribut kondisi yang sama. Konsep Equivalence Class mengelompokkan objekobjek yang memiliki nilai atribut identik. Selanjutnya. Discernibility Matrix dan Modulo D dimanfaatkan untuk mengidentifikasi atribut yang dapat membedakan antar objek. Reduct merupakan himpunan minimal dari atribut-atribut yang tetap mengklasifikasikan data. Dari data yang telah direduksi tersebut, dilakukan proses Generating Rules untuk membentuk aturan-aturan keputusan yang merepresentasikan pola dari data yang dianalisis. Algoritma Apriori Algoritma Apriori mengidentifikasi himpunan item yang sering muncul dalam basis data melalui proses berulang. Setiap tahap iterasi mencakup dua proses utama, yaitu pembentukan kandidat dan perhitungan nilai support. Proses dimulai dari himpunan 1-item, kemudian diperluas menjadi k-itemset dengan mengombinasikan itemset dari iterasi sebelumnya yang telah memenuhi ambang batas minimum support. Ciri khas algoritma ini adalah: Pruning: Kandidat itemset dibuang jika subset-nya termasuk dalam frequent itemset LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 e-ISSN: 2798-9593 p-ISSN: 2798-9836 Pemindaian ulang database: Diperlukan pada setiap iterasi untuk menghitung support. informasi rekam medis elektronik rumah sakit berdasarkan kriteria yang telah ditetapkan. Ukuran utama dalam algoritma Apriori: Support: Proporsi transaksi yang memuat antecedent dan consequent. Confidence: Proporsi transaksi yang memuat consequent dari seluruh transaksi yang memuat Teknik Analisis Data Classification-Based Association Classification-based association menggabungkan association rule mining dan klasifikasi. Dua pendekatan utama yaitu: ARCS: Mengelompokkan data terlebih dahulu, lalu menghasilkan aturan berbentuk Aquant1 O Aquant2 Ie Acat. Associative Classification: Menghasilkan aturan condset Ie y dengan basis frequent itemset. Aturan dipilih berdasarkan support dan confidence Metodologi Penelitian Jenis Penelitian Penelitian ini merupakan penelitian kuantitatif dengan pendekatan eksploratif dan deskriptif. Tujuan utama penelitian adalah untuk mengeksplorasi polapola data serta mengidentifikasi aturan-aturan pengambilan keputusan dalam diagnosis penyakit Tifoid menggunakan metode data mining berbasis Rough Set Theory. Jenis dan Sumber Data Data yang digunakan merupakan data sekunder yang diperoleh dari sistem rekam medis RS Grand Medistra Lubuk Pakam. Data mencakup variabelvariabel sebagai berikut: Identitas pasien . nisial, umur, jenis kelami. Hasil pemeriksaan laboratorium . ilai Widal, leukosit, hematokrit, dan lainny. Gejala klinis . emam, nyeri perut, diare, dan lainlai. Status diagnosis akhir . ositif/negatif Tifoi. Teknik Pengumpulan Data Pengumpulan data dilakukan melalui studi dokumentasi dengan mencatat informasi dari sistem Gbr. Diagram Alir Proses Analisis Data dengan Metode Rough Set Analisis data dilakukan dengan pendekatan Rough Set, melalui tahapan sebagai berikut: Pra-pemrosesan Data (Preprocessin. o Seleksi atribut berdasarkan relevansi terhadap diagnosis Tifoid. o Pembersihan data . ata cleanin. untuk menangani data yang hilang atau tidak konsisten. o Diskretisasi data, yaitu mengubah nilai atribut numerik ke dalam kategori diskrit sesuai kebutuhan metode Rough Set. Pembuatan Decision Table Data yang telah diproses disusun dalam bentuk decision table, di mana setiap baris merepresentasikan satu kasus pasien, kolom merepresentasikan atribut kondisi, dan kolom terakhir adalah atribut keputusan . iagnosis Tifoi. Penerapan Rough Set Theory o Menentukan indiscernibility relation berdasarkan nilai-nilai atribut. o Menentukan lower approximation dan upper approximation terhadap kelas keputusan. o Menghasilkan reduct, yaitu subset atribut minimal yang mempertahankan kemampuan klasifikasi. LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 e-ISSN: 2798-9593 p-ISSN: 2798-9836 o Menyusun decision rules yang merepresentasikan pola pengambilan keputusan berdasarkan data. Validasi Aturan Keputusan Aturan-aturan menggunakan pengukuran akurasi, sensitivitas, dan Validasi dilakukan melalui metode crossvalidation atau dengan membagi data menjadi data latih dan data uji, jika memungkinkan. Pembahasan dan Hasil Penelitian Pra Pengolahan Data Proses pra-pengolahan data dilakukan untuk memperoleh rule . dari kasus demam tifoid dengan menggunakan metode Rough Set, serta untuk mengevaluasi akurasi dari rule yang dihasilkan. Pengujian dilakukan dengan bantuan perangkat lunak Rosetta. Data yang digunakan disusun dalam bentuk Decision System dan disimpan menggunakan perangkat lunak Microsoft Excel, seperti ditunjukkan pada Gbr. Gbr. Tampilan Hasil Import Data Rosetta Reduct Reduct merupakan proses seleksi atribut minimal . tribut yang paling berpengaru. dari sekumpulan atribut kondisi, menggunakan pendekatan prime implicant dari fungsi Boolean. Hasil reduct dari perangkat lunak Rosetta ditampilkan pada Gbr. Gbr. Hasil Reduct Gbr. Data Dalam Bentuk Excel Hasil Implementasi Menggunakan Metode Rough Set Untuk menguji keakuratan hasil pengolahan data secara manual pada bab sebelumnya, digunakan perangkat lunak Rosetta yang mendukung metode Rough Set. Proses ini diawali dengan mengimpor data dalam format Excel ke dalam Rosetta, seperti ditunjukkan pada Gbr. Dari hasil yang diperoleh, terdapat delapan reduct yang menjadi dasar pembentukan rule. Setiap reduct menunjukkan kombinasi atribut yang disederhanakan dan relevan untuk pengambilan keputusan. Kolom support menunjukkan banyaknya kondisi pada reduct yang sesuai dengan data awal, sementara length menunjukkan panjang kombinasi atribut pada reduct Generating Rules Proses generating rules adalah langkah dalam metode Rough Set untuk menghasilkan aturan . atau pengetahuan dari equivalence class dan hasil Hasil proses ini ditampilkan pada Gbr. LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 e-ISSN: 2798-9593 p-ISSN: 2798-9836 yang tinggi. Proses ini dilakukan menggunakan perangkat lunak Weka versi 3. 9, setelah data diimpor dalam format . csv tanpa atribut keputusan seperti pada Gbr. Gbr. Hasil Generating Rules Dari pengolahan data menggunakan Rosetta, diperoleh sebanyak 57 rule. Namun, hanya delapan rule terbaik yang dipilih berdasarkan akurasi prediksi tertinggi sebesar 87,4%. Rincian rule dapat dilihat pada Tabel 1. Tabel 1 Akurasi Rule Rough Set Gbr. Data dalam Format Excel Rule Akurasi Jika Demam . AND Sakit Kepala . AND Pusing . AND Sakit Perut . Ie Diagnosa . 87,4% Jika Demam . AND Pusing . AND Sakit Perut . AND Muntah . Ie Diagnosa . 87,4% Jika Demam . AND Sakit Kepala . AND Sakit Perut . AND Nafsu Makan Menurun . Ie Diagnosa . 87,4% Jika Demam . AND Sakit Perut . AND Muntah . AND Nafsu Makan Menurun . Ie Diagnosa . 87,4% Jika Demam . AND Sakit Perut . AND Batuk . AND Nafsu Makan Menurun . Ie Diagnosa . 87,4% Jika Pusing . AND Sakit Perut . AND Batuk . Ie Diagnosa . 87,4% Gbr. Hasil Rules Apriori Jika Sakit Kepala . AND Pusing . AND Sakit Perut . AND Nafsu Makan Menurun . Ie Diagnosa . 87,4% Jika Pusing . AND Sakit Perut . AND Muntah . AND Nafsu Makan Menurun . Ie Diagnosa . 87,4% Hasil pembentukan rule menunjukkan gejala-gejala yang paling sering muncul bersamaan pada penderita demam tifoid, dengan nilai confidence yang tinggi. Beberapa di antaranya adalah: Jika pasien mengalami Batuk . Ie kemungkinan Nafsu Makan Menurun . onfidence = . Jika pasien mengalami Sakit Perut . Ie kemungkinan Nafsu Makan Menurun . onfidence = . Jika pasien mengalami Batuk . Ie kemungkinan Sakit Perut . onfidence = . Jika pasien mengalami Batuk . dan Nafsu Makan Menurun . Ie kemungkinan Sakit Perut . onfidence = . Jika pasien mengalami Muntah . Ie kemungkinan Demam . onfidence = 0,. Rata-rata 87,4% Analisis Penerapan Algoritma Apriori Proses analisis dengan algoritma Apriori dilakukan dengan membuat kombinasi kandidat itemset berdasarkan aturan tertentu, kemudian diuji apakah kombinasi tersebut memenuhi syarat minimum Itemset yang memenuhi kriteria akan digunakan untuk membentuk rule dengan confidence LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 7-12 Tabel 2 Akurasi Rule Apriori e-ISSN: 2798-9593 p-ISSN: 2798-9836 dataset, maka dapat diambil kesimpulan bahwa hasil akurasi kinerja metode rough set dalam identifikasi penyakit demam tifoid sebesar 87,4%, sedangkan untuk kinerja algoritma apriori hasil akurasi yang didapat sebesar 87,4%. Juga aturan prediksi yang dihasilkan oleh metode rough set terdiri dari 4 gejala sedangkan aturan yang dihasilkan algoritma apriori terdiri dari 3 gejala. Rule Support Confidence Akurasi Batuk . dan Nafsu Makan . Diagnosa Positif 87,4% Sakit Perut . dan Nafsu Makan Menurun . Diagnosa Positif 87,4% Batuk . dan Sakit Perut . Ie Diagnosa Positif 87,4% Ucapan Terima Kasih Batuk . Sakit Perut Nafsu Makan Menurun . Diagnosa Positif 87,4% Penulis mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penelitian ini. Muntah . dan Demam . Diagnosa Positif 87,4% Rata-Rata 87,4% Berdasarkan hasil analisis Apriori, lima rule yang dihasilkan masing-masing juga menunjukkan akurasi sebesar 87,4%, menunjukkan konsistensi hasil dengan metode Rough Set. Pembahasan Berdasarkan hasil implementasi kedua metode, baik Rough Set maupun Apriori sama-sama menghasilkan akurasi yang tinggi dan konsisten sebesar 87,4%. Hal ini menunjukkan bahwa kedua metode mampu mengidentifikasi pola gejala demam tifoid dengan baik. Rough Set unggul dalam penyederhanaan atribut dan eksplorasi rule secara logis, sedangkan Apriori efektif dalam mengungkap asosiasi antar gejala dengan support dan confidence yang kuat. Temuan ini mendukung pemanfaatan data mining dalam sistem pendukung keputusan medis untuk meningkatkan kecepatan dan ketepatan diagnosis demam tifoid. Kesimpulan dan Saran Berdasarkan analisa kinerja metode rough set dan algoritma apriori pada kasus penyakit demam tifoid di RS Grand Medistra Lubuk Pakam menggunakan 500 Referensi