LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 e-ISSN: 2798-9593 p-ISSN: 2798-9836 Implementasi Algoritma Principal Component Analisys dan Jaringan Syaraf Tiruan Dalam Mengoptimasi Fitur dan Performa Intrusion Detection System Fauzi Haris Simbolon1. Sartana2. Maranata Pasaribu3. Marice Hotnauli Simbolon4. Maradu Sihombing5 1,2,3,4,5Universitas Mandiri Bina Prestasi Jl. Letjend. Djamin Ginting No. Padang Bulan. Medan Baru. Kota Medan. Sumatera Utara. Indonesia - 20155 1farizboy@gmail. com, 2sartanasinurat@gmail. com, 3kiainggo@gmail. com, 4simbolonice@gmail. 5maradus71@gmail. DOI: https://doi. org/10. 58918/yyzrza47 Abstrak Mengamankan data dan informasi merupakan aktivitas yang sangat dibutuhkan dalam dunia idustri, bisnis maupun perkantoran terutama terkait dengan data dan informasi yang dikirim melalui jaringan. Intrusion Detection System atau Sistem deteksi intrusi (IDS) merupakan suatu produk perangkat keras atau perangkat lunak yang mampu mendeteksi aktivitas yang janggal, aneh dan mengandung unsur bahaya di jaringan komputer atau di host yang terpisah. IDS hanya memantau lalu lintas yang disalin, dan memberi peringatan, bahwa paket yang sebenarnya bermasalah telah terkirim ke target yang dituju. Bahkan jika telah dilakukan pengaturan IDS untuk memperbarui firewall dengan aturan pemblokiran, paket serangan awal sudah terlanjur masuk Pelaksanaan proses intrusi berkecepatan tinggi tentunya akan menimbulkan beberapa kendala yang cukup signifikan terutama masalah dimensionalitas yang sangat besar, untuk itu dibutuhkan algoritma Principal Component Analisys (PCA) untuk menangani masalah tersebut, dengan algoritma ini memungkinkan peningkatan kinerja pengklasifikasian Jaringan Syaraf Tiruan (JST) dalam deteksi intrusi. Melalui bantuan algoritma PCA dapat diidentifikasi 15 fitur teratas dari 41 fitur yang terdapat pada kumpulan fitur KDD Cup 1999, dan perolehan peningkatan lebih dari 62% pada saat pelatihan JST. melalui pengujian menggunakan JST dapat disimpulkan bawa Jaringan Saraf Tiruan Multi Layer Perceptron dapat meningkatkan akurasi bahkan setelah mereduksi fitur-fitur yang ada. Kata Kunci: Fitur dan Performa. IDS. MLP. PCA. JST. Pendahuluan Deteksi serangan dalam jaringan komputer selalu menjadi tantangan yang dihadapi oleh administrator dan personel keamanan jaringan. Sistem Deteksi Intrusi (IDS) merupakan pilihan utama dan salah satu alat untuk keamanan trafik jaringan. Di antara dua jenis utama IDS, yaitu berbasis Penyalahgunaan (Misus. dan berbasis Kejanggalan (Anomal. IDS berbasis Anomali memiliki keunggulan dibandingkan jenis lainnya dalam mendeteksi pola serangan yang baru dan terus berubah . Banyak literatur dan penelitian yang membahas penggunaan Jaringan Syaraf Tiruan (JST) . , . , . , . karena beberapa keunggulan seperti kemampuan belajar yang baik, adaptabilitas, toleran terhadap kesalahan, kemampuan implementasi perangkat keras, fitur inheren pemrosesan informasi kontekstual, konsumsi energi yang rendah dll. Dalam makalah ini, kami telah mengusulkan pengklasifikasi 15 kelas. Sebagian besar literatur didasarkan pada standar data evaluasi IDS KDD 1999 yang terdiri dari 41 fitur. Dalam studi ini, peeliti telah melatih dan menguji JST dengan seluruh 41 fitur dan juga mencoba mengoptimalkan set fitur dengan mengurangi jumlah fitur menjadi 15 menggunakan Principal Componenet Analisys (PCA). Pelatihan dan pengujian lebih lanjut menunjukkan peningkatan waktu pelatihan yang signifikan sebesar P Anderson . mendefinisikan upaya intrusi dalam dan menciptakan ruang untuk beberapa studi dan teknik tentang IDS. Dorothy Denning . telah menginspirasi banyak peneliti dengan mengusulkan model Deteksi Intrusi berbasis anomali. Karya menarik dari Varun Chandola dkk . , membahas berbagai mekanisme deteksi intrusi anomali. Karya serupa yang dilakukan oleh Fariba Haddadi dkk . , menunjukkan pengklasifikasi lima kelas untuk mendeteksi intrusi dari kumpulan data DARPA yang melaporkan rata-rata tingkat deteksi 82,44%. Dalam karya lain . , pengklasifikasi dua kelas berdasarkan jaringan saraf tiruan umpan-maju diusulkan. Jaringan LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 e-ISSN: 2798-9593 p-ISSN: 2798-9836 Saraf Tiruan terbukti baik untuk deteksi anomali guna menemukan perilaku pengguna dalam . Dalam . , sistem deteksi intrusi Hibrida didemonstrasikan. Penggunaan PCA dalam . oleh Solomon Raju dkk. mereduksi kumpulan data kompleks menjadi dimensi untuk mengungkap struktur tersembunyi yang lebih Dalam makalah oleh T. Petreus dkk. PCA digunakan untuk mengekstraksi fitur-fitur penting dalam bidang bioinformatika. Dalam sebuah studi . , peneliti menggunakan PCA untuk mendeteksi fitur perangkat lunak tersembunyi untuk analisis malware. Dalam . Leila Mechtri dkk. menggunakan PCA dan jaringan saraf abu-abu untuk klasifikasi data intrusi dengan lima kelas. Dalam penelitian saat ini, peneliti telah mengusulkan model pengklasifikasi multikelas baru yang dapat mendeteksi 15 kelas serangan termasuk trafik jaringan normal. Fitur-fitur yang dioptimalkan terbukti meningkatkan kinerja pada JST dengan mengurangi waktu pelatihan dan juga akurasi Adapun tujuan dari aktivitas penelitian ini adalah mengoptimasi fitur dan performa kinerja Sistem Deteksi Intrusi melalui pelatian Jaringan Syaraf Tiruan mengunakan Algoritma Principal Component Analisys. Sedangkan sararan dari penelitian ini adalah untuk meningkatkan dan mengoptimasi kinerja Router dan Firewall dalam memonitoring dan mencegah adanya serangan maupun penyusupan ke komputer server maupun client dan membuat traffic jaringan menjadi lancar dan aman. Tiruan Multi-Layer Perceptron (MLP) digunakan sebagai algoritma IDS untuk klasifikasi berbagai jenis Sistem jaringan saraf tiruan membutuhkan set data untuk pelatihan, yang harus mencakup lalu lintas normal maupun lalu lintas serangan. Set data evaluasi IDS KDD Cup 1999 digunakan karena merupakan set data standar bagi para peneliti di bidang keamanan data dan jaringan . Sistem Deteksi Intrusi Dan Set Data KDD Intrusion Detection System (IDS) Sistem Deteksi Intrusi (IDS) masih menjadi pilihan utama bagi administrator keamanan data dan jaringan karena beberapa alasan, termasuk tidak adanya sistem yang sepenuhnya aman tanpa kekurangan atau kerentanan . Jenis-jenis intrusi yang penting meliputi upaya pembobolan, penetrasi sistem kontrol keamanan, kebocoran informasi. Denial of Service (DNS). Penyamaran, penggunaan Berbahaya, dll. IDS dapat mendeteksi sebagian besar jenis serangan ini dan membantu studi dan analisis lebih lanjut, serta menambal sistem keamanan. Di antara dua jenis utama IDS, yaitu berbasis kejanggalan (Anomal. dan berbasis Penyalahgunaan (Misus. IDS berbasis Anomali memiliki keunggulan dalam mendeteksi variasi serangan yang baru, bahkan yang kecil sekalipun, . Teknik Kecerdasan Buatan seperti ANN. SVM. HMM, dll. sering digunakan untuk IDS guna mendeteksi serangan baru. Jaringan Syaraf Deskripsi Set Data KDD Cup 1999 KDDCUPAo99 adalah kumpulan data yang paling banyak digunakan untuk evaluasi metode deteksi Kumpulan data ini mencakup kategori serangan berikut . Denial Of Service Attack (DoS Attac. Serangan terhadap jaringan dimana Penyerang mencoba mengirim beberapa paket berbahaya, bisa berupa TCP. UDP, atau ICMP, untuk memenuhi memori atau membuat Sumber daya komputasi yang sangat sibuk untuk menangani akses pengguna yang sah ke suatu mesin. User to Root (U2R) Merupakan jenis serangan di mana peretas mencoba mendapatkan akses ke akun root sistem target, dimulai dengan akses ke akun pengguna biasa, dengan bantuan kode atau metode eksploitasi yang memanfaatkan kerentanan. Remote To Local (R2L) Dalam jenis serangan ini, penyerang yang tidak memiliki akun di mesin target, mengeksploitasi beberapa kerentanan dan mencoba mendapatkan akses ke mesin target tersebut. Probing Attack Merupakan kelas eksploitasi di mana peretas jahat mencoba mengumpulkan informasi tentang jaringan Kumpulan data KDD CUP 99 terdiri dari 41 fitur untuk setiap paket. Tabel 1 menunjukkan deskripsi fitur dari semua fitur dalam kumpulan data KDD CUP Kumpulan data tersebut diproses terlebih dahulu sebelum diterapkan pada JST agar hanya berisi nilai numerik, tetapi bukan nilai string. Tabel 1 Fitur set data KDD Cup 1999 No. Feature Duration Type Protocol Service Flag No. Feature Is Guest Login Count Srv Count Serror Rate LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 Src Bytes Dsc Bytes Land Wrong Fragment Urgent Hot Num Failed Logins Logged In Num Compromissed Root Shell Su Attempted Num Root Num File Creations Num Sell Num Access Files Num Outbounds Ends Is Host Login Srv Serror Rate Rerror Rate Srv Rerror Rate Same Srv Rate Diff Srv Rate Srv Diff Host Rate Dst Host count Dst Host Srv Count Dst Host Same Srv Rate Dst Host Diff Srv Rate Dst Host Same Src Port Rate Dst Host Srv Diff Host Rate Dst Host Serror Rate Dst Host Srv Serror Rate Dst Host Rerror Rate Dst Host Srv Rerror Rate e-ISSN: 2798-9593 p-ISSN: 2798-9836 Jaringan Syaraf Tiruan (JST) Jaringan Syaraf Tiruan Keunggulan utama penggunaan JST adalah sifat nonliniernya . , menyediakan pemetaan input-output dengan belajar bersama seorang pengajar, dapat memberikan respons berbasis bukti, toleran terhadap kesalahan, dapat diimplementasikan dengan Very Large Scale Integration (VLSI), dan yang terpenting, terinspirasi oleh neurobiologis . Di antara berbagai jenis jaringan saraf, multilayer perceptron (MLPNN) adalah yangpaling cocok untuk mengimplementasikan pengklasifikasi multikelas . Jaringan Saraf Umpan Maju (Feed Forwar. Pemilihan Set Data untuk Aktivitas Dataset KDD cup 1999 . terdiri dari dua berkas, yaitu 10% KDD dan terkoreksi. Untuk heterogenitas data, kami mengambil sampel pelatihan dari kedua berkas ini seperti yang ditunjukkan pada Tabel 2. Tabel 2 Jumlah sampel yang dipilih dari set data KDD Cup 1999 Jaringan saraf tiruan umpan-maju multilapis memiliki beberapa neuron yang terstruktur dalam lapisan-lapisan seperti lapisan masukan, tersembunyi, dan keluaran. Lapisan keluaran dengan satu atau banyak neuron menyediakan keluaran untuk satu atau banyak masukan. Dalam satu contoh neuron, tugas proses pelatihan adalah menemukan bobot yang tepat untuk koneksi neuron yang, jika dikombinasikan dengan masukan, akan mencapai keluaran yang Proses ini dilakukan dengan algoritma propagasi balik. Peneliti menggunakan kode Matlab untuk menjalankan algoritma JST, tetapi tidak menggunakan aplikasi alat bantu untuk hal ini. Jaringan Syaraf Tiruan Multi Layer Perceptron sebelum menerapkan PCA adalah . Berisi 41 neuron input untuk setiap fitur input dalam dataset KDD. Lima neuron tersembunyi dipilih berdasarkan metode coba-coba. Lima belas neuron keluaran untuk menentukan tipe normal atau serangan. LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 e-ISSN: 2798-9593 p-ISSN: 2798-9836 LANGKAH 6: STOP Pada akhir proses pelatihan, bobot dibekukan dan model JST akan dimulai. Optimasi Fitur Menggunakan PCA Gbr 1. Arsitektur Jaringan Syaraf MLP. Algoritma JST MLP LANGKAH 1: MULAI LANGKAH 2: Inisialisasi jumlah neuron tersembunyi dan epoch. LANGKAH 3: Muat data masukan yang telah diproses sebelumnya untuk pelatihan. LANGKAH 4: Hasilkan bobot awal neuron secara LANGKAH 5: For i=1 ke N epoch For j=1 ke N pola masukan - Pilih pola acak - Hitung keluaran lapisan tersembunyi dengan menggunakan rumus berikut: Sesuaikan bobot lapisan tersembunyi Hitung keluaran lapisan keluaran dengan menggunakan rumus berikut: For j=1 To num_Hidden, di mana Tj adalah keluaran target yang sesuai. - Propagasi balik kesalahan dan hitung kesalahan pada unit tersembunyi sebagai berikut: Sesuaikan tersembunyi berdasarkan kesalahan Sesuaikan tersembunyi akhiri loop if error < 0. 001 end loop C1 = b 11(X. b12(X . b1p(X. ---. Dimana: C1 = skor subjek pada komponen utama 1 . omponen pertama yang diekstraks. b1p = koefisien regresi . tau bobo. untuk variabel teramati p, seperti yang digunakan dalam pembuatan komponen utama 1 Xp = skor subjek pada variabel p yang diamati Hitung kesalahan pada keluaran neuron Optimasi fitur dilakukan untuk mengurangi redundansi fitur. Analisis Komponen Utama digunakan untuk tujuan ini. Dalam PCA, pemilihan fitur dilakukan untuk memilih subset fitur yang relevan, sehingga meningkatkan kinerja sistem. Dengan menghilangkan sebagian besar fitur yang tidak relevan dan redundan dari data, pemilihan fitur membantu meningkatkan kinerja model pembelajaran. Penggunaan PCA dalam optimasi menghasilkan komponen-komponen utama, yang jumlahnya kurang dari atau sama dengan jumlah komponen sebenarnya. PCA adalah multi varian berbasis vektor Eigen. Seringkali, operasinya dapat dianggap sebagai pengungkapan struktur internal data dengan cara yang paling baik menjelaskan varians dalam data. Dengan visualisasi koordinat himpunan data multivariat dalam ruang data berdimensi tinggi . sumbu per variabe. PCA dapat memberikan pengguna gambaran berdimensi lebih rendah, sebuah "bayangan" dari objek ini. Hal ini dilakukan dengan hanya menggunakan beberapa komponen utama pertama sehingga dimensionalitas data yang ditransformasi Berikut ini rumus umum untuk menghitung skor pada komponen pertama yang diekstraksi . dalam analisis komponen utama: Algoritma PCA LANGKAH 1: Dapatkan beberapa data (Sebanyak 41 fitur dari dataset KDD CUP 99 yang terkumpul diterapkan ke PCA untuk optimasi fitur pada 41 fiturnya yang redundan dan berkorelas. LANGKAH 2: Kurangi rata-rata Rata-ratanya dihitung menggunakan rumus di bawah ini: LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 Sekarang, rata-rata dikurangi dari setiap dimensi dalam himpunan data. Rata-rata yang dikurangi adalah rata-rata di setiap dimensi. Himpunan data yang dihasilkan dengan rata-rata yang dikurangi akan memiliki rata-rata nol. LANGKAH 3: Hitung matriks kovariansi Matriks kovarians akan berdimensi dua karena datanya berdimensi dua. Matriks kovarians dihitung dengan: LANGKAH 4: Hitung vektor Eigen dan nilai Eigen dari matriks kovarians Untuk menghasilkan sinyal, perlu dihitung vektor Eigen dan nilai Eigen untuk matriks ini, karena merupakan matriks persegi. LANGKAH 5: Membentuk vektor fitur dengan memilih komponen: Bergantung pada sinyal yang dihasilkannya, sebaiknya dipilih fitur yang nilai sinyalnya lebih besar dan fitur ini disebut komponen utama. LANGKAH 6: Dapatkan data baru Dengan cara mengalikan komponen yang diperoleh dengan data lama, sehingga diperoleh data baru. e-ISSN: 2798-9593 p-ISSN: 2798-9836 Tabel 3 Tingkat Deteksi MLP JST sebelum menerapkan PCA. Tabel 4 menunjukkan keluaran PCA yang berhasil memilih 15 fitur teratas yang lebih efektif. Tabel 4 15 fitur teratas yang dipilih dari PCA. Hasil dan Kesimpulan Hasil Tabel 3 menunjukkan tingkat deteksi dan tingkat positif kesalahan yang diperoleh dari pengklasifikasi JST 15 kelas untuk berbagai kelas serangan sebelum menerapkan PCA. Tabel 5 dan 6 menunjukkan matriks confusion yang Hasilnya jelas menunjukkan bahwa tingkat deteksi bergantung pada jumlah set pelatihan yang tersedia karena dari Tabel 1 kita dapat melihat bahwa rekaman untuk beberapa jenis serangan seperti Tear drop, warezmaster, saint, dll. lebih sedikit jumlahnya, demikian pula tingkat deteksinya. LOFIAN: Jurnal Teknologi Informasi dan Komunikasi https://ejournal. id/index. php/lofian/ Vol. No. Agustus 2025. Halaman 13-19 Tabel 5. e-ISSN: 2798-9593 p-ISSN: 2798-9836 Kesimpulan Waktu pelatihan MLP JST untuk berbagai jumlah set data. Gbr. menunjukkan perbandingan waktu pelatihan JST sebelum dan sesudah menerapkan PCA untuk mereduksi fitur. Gbr 2. Grafik Waktu Pelatihan untuk perbandingan sebelum dan sesudah PCA. Tingkat deteksi yang lebih rendah pada beberapa kelas disebabkan oleh fakta bahwa kumpulan data untuk pelatihan sangat terbatas. Tabel 6 Tingkat Deteksi MLP JST setelah menerapkan PCA. Hasil pelatihan dan pengujian menunjukkan bahwa Analisis Komponen Utama terbukti merupakan teknik yang sangat efisien yang dapat digunakan untuk reduksi dimensionalitas data tanpa kehilangan orisinalitas set data. Jaringan saraf tiruan MLP telah terbukti dapat mengimplementasikan masalah klasifikasi multikelas dengan sangat efisien bahkan dengan 15 kelas. Dalam penelitian ini, didemonstrasikan kapabilitas JST dalam klasifikasi outlier terperinci terkait dengan set data Sistem Deteksi Intrusi. Tabel 5 menunjukkan peningkatan 62% dalam efisiensi pelatihan terkait waktu yang dihabiskan, yang merupakan peningkatan yang sangat Ucapan Terima Kasih Terimakasih penulis ucapkan kepada pihak-pihak yang terkait dengan penelitian yang telah dilaksanakan terutama kepada pihak pejabat yang ada di LPPM Universitas Mandiri Bina Prestasi yang telah mengeluarkan surat pelaksanaan penelitian sehingga semua prosedur dan pelaksanaan penelitian dapat berjalan dengan lancar. Kami penulis juga mengucapkan terimakasih kepada Universitas Mandiri Bina Prestasi serta teman-teman peneliti yang telah mendukung pelaksanaan penelitian hingga publikasi ke jurnal terakreditasi. Referensi