Jurnal informasi dan Komputer Vol: 10 No:2. P-ISSN: 2337-8344 E-ISSN: 2623-1247 KLASIFIKASI JENIS KUCING MENGGUNAKKAN ALGORITMA PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR Aisyah Nur Ramadhayani1. Veronica Lusiana,2 Universitas Stikubank Semarang Jl. Tri Lomba Juang No 1. Kecamatan Semarang Selatan. Kota Semarang. Jawa Tengah 50241 E-mail : aisyahnura02@gmail. com1, vero@edu. ABSTRAK Kucing dalam bahasa latin adalah Felis silvestris catus adalah sejenis hewan karnivora. Kucing adalah hewan peliharaan terpuler di dunia yang memiliki banyak peminat dan penggemar. Kucing yang memiliki garis keturunan tercatat secara resmi sebagai kucing trah atau jalur murni . ure bree. Jumlah ras kucing seperti ini hanya sedikit yaitu 1 % dari populasi kucing yang ada di dunia yang biasanya hanya dikembang biakan di tempat pemeliharaan hewan resmi. Penelitian ini menggunakkan algoritma Principal Component Analysis(PCA) dan K-nearest Neighbor(KNN) dengan mempunyai tujuan untuk mengklasifikasi citra hewan kucing melalui tahap analisis pada citra asli, citra biner dan citra grayscale. Hasil keluaran ekstraksi ciri akan menjadi masukan untuk metode algoritma Principal Component Analysis(PCA) dan K-nearest Neighbor(KNN) untuk aplikasi klasifikasi jenis kucing. Ekstraksi ciri yang akan digunakan dalam penelitian ini yaitu RGB dan HSV. Data yang akan digunakan dalam penelitian ini adalah 34 data citra, terdiri dari 24 citra data latih dan 10 data citra uji. Maka dengan adanya penelitian ini diharapkan agar bisa membantu orang untuk lebih mudah mengetahui klasifikasi hewan peliharaan yaitu kucing . Hasil keluaran akurasi pada aplikasi klasifikasi menggunakkan Algoritma Multi Support Vector Machine (SVM) dengan ekstraksi ciri orde satu algoritma Principal Component Analysis(PCA) dan K-nearest Neighbor (KNN) yaitu mencapai tingkat akurasi sebesar 80%. Kata kunci : Pure Breed. K-NN. PCA. RGB. HSV. ABSTRACTS Cats in Latin is Felis silvestris catus is a kind of carnivorous animal. Cats are the most popular pets in the world that have many enthusiasts and fans. Cats that have bloodlines are officially registered as purebred cats or pure breeds. The number of cat breeds like this is only slightly, only 1% of the world's cat population, which is usually only bred in official animal husbandry. This study uses the Principal Component Analysis (PCA) and K-nearest Neighbor (KNN) algorithms with the aim of classifying cat images through the analysis stage on original images, binary images and grayscale The output of the feature extraction will be the input for the Principal Component Analysis (PCA) and K-nearest Neighbor (KNN) algorithms for cat species classification applications. The feature extraction that will be used in this research are RGB and HSV. The data that will be used in this study are 34 image data, consisting of 24 training data images and 10 test image data. So with this research, it is hoped that it can help people to more easily find out the classification of pets, namely cats. The output accuracy in the classification application uses the Multi Support Vector Machine (SVM) Algorithm with firstorder feature extraction from the Principal Component Analysis (PCA) and K-nearest Neighbor (KNN) algorithms, which reaches an accuracy rate of 80%. Keywords: Pure Breed. K-NN. PCA. RGB. HSV. 257 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. PENDAHULUAN Kucing dalam bahasa latin adalah Felis silvestris catus adalah sejenis hewan karnivora. Kucing adalah hewan peliharaan terpuler di dunia yang memiliki banyak peminat dan penggemar. Kucing yang memiliki garis keturunan tercatat secara resmi sebagai kucing trah atau jalur murni . ure bree. Jumlah ras kucing seperti ini hanya sedikit hanya 1 % dari populasi kucing yang ada di dunia yang biasanya hanya dikembang biakan di tempat pemeliharaan hewan resmi. Banyaknya ras kucing sekitar 32 kucing yang diakui secara internasional diantaranya seperti Anggora dan Persia. Kucing Anggora berasal dari angora merupakan sebuah kota di Turki. Kota Angora semenjak tahun 1930 disebut Ankara Kedisi. Kucing Persia memiliki ciri berhidung pesek, berbadan agak membulat serta sekujur badannya berbulu panjang. Sedangkan kucing Anggora umumnya berhidung mancung, berbadan relatif ramping serta bulunya panjang di bagian-bagian tertentu saja. Penelitian yang dilakukan Ratri Enggar Pawening. Wali JaAfar Shudiq, dan Wahyuni. Universitas Nurul Jadid AuKlasifikasi Kualitas Jeruk Lokal Berdasarkan Tekstur Bentuk Menggunakkan Metode k-Nearest Neigbor. -NN)Ay, fitur-fitur bentuk yang dicari berdasarkan Luas Keliling Objek, nilai k yang digunakan dalam penelitian ini adalah 1 sampai 5 yang menghasilkan tingkat akurasi teringgi pada uji k1 sebesar 93,3% dan akurasi terendah sebesar 86,20% pada data uji k7 dan data uji k8. Penelitian yang dilakukan oleh Atikah Khairiyah Hasibuan. Universitas Islam Negeri Sumatra Utara Medan AuKlasifikasi Jenis Buah Jambu Berdasarkan Daun Menggunakkan Metode Principal Component AnalysisAy, penelitian ini menggunakkan 4 jenis buah jambu. Klasifikasi sebanyak 16 data citra daun jambu menghasilkan tingkat akurasi sebesar 81,25%. Penelitian yang dilakukan oleh Muhammad Afif Amanullah Fawwaz. Kurniawan Nur Ramadhani, ,M. Febryanti Sthevanie S. T,M. Universitas Telkom Bandung AuKlasifikasi Ras pada Kucing menggunakan Algoritma Convolutional Neural Network(CNN)Ay, hasil testing didapatkan berupa akurasi untuk tiap modelnya yaitu 60,85%, 84,94%, 71,39%, dan 93,75%. Kucing yaitu hewan peliharaan yang dapat dimiliki semua orang. Memelihara kucing memiliki pengaruh positif terhadap pyschologist well-being P-ISSN: 2337-8344 E-ISSN: 2623-1247 Tetapi terkadang tidak semua pemilik kucing bisa mengetahui ras kucingnya. Oleh sebab itu diperlukan sebuah program aplikasi yang bisa membedakan 3 jenis kucing. Sebagai upaya mengatasi keterbatasan kemampuan manusia untuk mengenali jenis Kucing dan informasi tentang Kucing maka perlu dibuat suatu pengolahan Pengolahan citra diharapkan dapat membantu mendeteksi jenis kucing dari gambar yang dimasukkan ke dalam pengolahan citra, maka berdasarkan uraian permasalahan diatas menjadi acuan penulis menyusun penelitian dengan judul AuKlasifikasi Jenis Kucing Menggunakan Algoritma Principal Component Analysis (PCA) dan K-Nearest Neighbor (K-NN)Ay. Penggunaan metode ini diharapkan untuk memudahkan mengatasi kesulitan membedakan jenis Aplikasi ini juga dapat membantu manusia yang tidak mengenali atau mengetahui informasi mengenai kucing yang akan dipelihara atau diadopsi. METODE PENELITIAN Metode yang digunakan dalam penelitian ini adalah sebagai berikut: 1 Obyek Penelitian Obyek yang digunakan dalam penelitian ini ada 3 . jenis kucing yaitu kucing anggora, kucing persia, dan kucing scotis fold. 1 Metode Pengumpulan Data Metode pengumpulan data yang digunakan dalam penelitian ini: Studi Pustaka Studi pustaka yang dilakukan peneliti yaitu mengumpulkan beberapa jurnal-jurnal dan artikel buku yang terkait dengan klasifikasi jenis citra lainnya yang telah dibuat sebelumnya. Hasil pengumpulan jurnal tersebut kemudian dipelajari literatur-literaturnya untuk digunakan dalam menganalisa data penelitian ini. Studi Pustaka yang dilakukan dengan melakukan pencarian jenis-jenis citra kucing di sumber internet. Hasil tersebut digunakkan sebagai citra dataset pada obyek penelitian yang akan diaplikasikan. 2 Langkah penelitian Langkah-langkah dalam klasifikasi jenis kucing 258 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. P-ISSN: 2337-8344 E-ISSN: 2623-1247 dalam penelitian ini dengan alur sebagai berikut: dan biru berada pada pojok sumbu. Penelitian ini dimulai dengan pengambilan sampel 3 jenis kucing. Kemudian dilakukan cropping citra untuk menuju tahap proses selanjutnya yakni ekstraksi ciri, training dan Sampel data yang digunakan 3 objek jenis Masing-masing ikan di ambil 10 data Total data pelatihan 24 data citra, dan 10 data citra digunakan sebagai data uji, total keseluruhan data 34 data citra. Proses ekstraksi ciri menggunakan ekstraksi ciri RGB,HSV dan area. Proses training dan testing menggunakan algoritma PCA dan klasifikasi menggunakan KNN. Warna hitam berada pada titik asal dan warna putih berada di ujung kubus yang berseberangan. Gambar memperlihatkan kubus warna secara nyata dengan resolusi 24 bit. Perlu diketahui, dengan menggunakan 24 bit, jumlah warna mencapai . 2 Pengolahan Citra Digital Pengolahan Citra merupakan bidang ilmu yang mempelajari tentang bagaimana suatu citra dibentuk, diolah dan dianalisis sehingga akan menghasilkan informasi yang mudah dipahami oleh masyarakat. Pengolahan Citra juga merupakan interprestasi digital dari citra dengan bantuan komputer. Menurut pendapat ahli Suhandy. Pengolahan citra digital adalah sebuah teknologi visual yang dipakai untuk mengamati dan menganalisis objek tanpa berhubungan secara langsung dengan objek yang diamati itu. Teknologi ini bisa dipakai untuk mengevaluasi mutu suatu produk tanpa merusak produk itu sendiri. Citra digital merupakan representatif dari citra yang diambil oleh mesin dengan bentuk Sampling kotak-kotak yang disusun dalam baris dan Dengan skata lain, sampling pada citra menyatakan besar kecilnya ukuran pixel . pada citra, dan kuantisasi menyatakan besarnya nilai tingkat kecerahan yang dinyatakan dalam nilai tingkat keabuan . sesuai dengan jurnlah bit biner yang digunakan oleh mesin, dengan kata lain kuantisasi pada citra menyatakan jumlah warna yang ada pada citra. 4 Citra RGB Citra warna RGB biasa diterapkan pada monitor CRT dan kebanyakan sistem grafika komputer. Citra warna ini menggunakan tiga komponen dasar yaitu merah (R), hijau (G), dan biru (B). Setiap piksel dibentuk oleh ketiga komponen Model RGB biasa disajikan dalam bentuk kubus tiga dimensi, dengan warna merah, hijau. Gambar 1. Skema Kubus Warna RGB 5 Citra Biner Citra biner . inary imag. adalah citra digital yang hanya memiliki 2 kemungkinan warna, yaitu hitam dan putih. Citra biner disebut juga dengan citra W&B (White&Blac. atau citra monokrom. Hanya dibutuhkan 1 bit untuk mewakili nilai setiap piksel dari citra biner. Pembentukan citra biner memerlukan nilai batas keabuan yang akan digunakan sebagai nilai patokan. Gambar 2. Citra Biner pada Citra Kucing Piksel dengan derajat keabuan lebih besar dari nilai batas maka diberi nilai 1 dan piksel dengan derajat keabuan yang lebih kecil dari nilai batas harus diberi Citra biner sering muncul sebagai hasil pengambangan, morfologi ataupun dithering. Fungsi binerisasi untuk mempermudah proses pengenalan pola, karena pola lebih mudah terdeteksi pada citra yang mengandung lebih sedikit warna. 5 Citra Grayscale Citra grayscale merupakan citra digital yang hanya memiliki satu nilai kanal pada setiap pikselnya, artinya nilai dari Red = Green = Blue. Nilai-nilai tersebut digunakan untuk menunjukkan intensitas 259 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. P-ISSN: 2337-8344 E-ISSN: 2623-1247 Citra grayscale berbeda dengan citra Ayhitam-putihAy, dimana pada konteks komputer, citra hitam putih hanya terdiri atas 2 warna saja yaitu AyhitamAy dan AyputihAy saja. Pada citra grayscale warna bervariasi antara hitam dan putih, tetapi variasi warna diantaranya sangat banyak. Citra grayscale seringkali merupakan perhitungan intensitas cahaya pada setiap piksel pada spektrum elektromagnetik single band. Citra grayscale disimpan dalam format 8 bit memungkinkan sebanyak 256 intensitas. Untuk mengubah citra berwarna yang mempunyai nilai matrik masing-masing R. G dan B menjadi citra grayscale dengan nilai X, maka konversi dapat dilakukan dengan mengambil rata-rata dari nilai R. G dan B sehingga dapat dituliskan menjadi: X = (R G B)/3. Warna = RGB(X. X). 6 Kucing Kucing adalah hewan berjenis mamalia yang berasal dari keluarga felidae. Mamalia darat ini biasanya hidup serta berbaur dengan manusia untuk peliharaan tetapi juga cukup banyak yang hidup di alam liar. Catatan bercampur dengan manusia setidaknya 000 SM, sebagaimana dibuktikan oleh kerangka kucing di pulau Siprus. Pada SM. Mesir menggunakan kucing sebagai mengusir tikus atau hewan pengerat lainnya di tempat-tempat yang dijual untuk menyimpan hasil panen. Kucing dalam bahasa latin yaitu Felis silvestris catus atau hewan karnivora. Selama ini kucing ialah salah satu hewan peliharaan yang paling populer di dunia dan mempunyai banyak penggemar. Di dunia ini jumlah ras kucing sangatlah beragam. Setiap ras kucing tersebut mempunyai ciri spesifik pada tiap rasnya, tetapi seiring berjalannya waktu sering terjadi peristiwa kawin silang antar ras yang mengakibatkan banyak bermunculan ras-ras Di Indonesia sendiri jenis kucing yang bisa ditemui yakni Anggora. Persia. Himalaya, kucing kampung dan lainnya. Kucing memiliki keunikan atau karakteristik dalam corak dan warna bulunya, namun keunikan warna dan corak bulu yang ada tidak bisa membedakan pada tiap-tiap rasnya. Gambar 3. Citra Kucing HASIL DAN PEMBAHASAN 1 Algoritma PCA Principal Component Analysis yaitu metode yang digunakan untuk mengidentifikasi pola pada data. Principal Component Analysis merupakan algoritma yang berguna untuk menemukan komponen dari data yang lebih kompleks, sering digunakan untuk dan kompresi data maupun Algoritma Principal Component Analysis juga bekerja untuk mengubah variabel independen awal menjadi variabel independen baru yang tidak memiliki korelasi untuk menghilangkan korelasi antar variabel independen. Variabel baru ini berisi nilai variabel komponen utama (PC). Algoritma ini digunakan untuk mengurangi kesalahan pada proses klasifikasi. Reduksi dimensi ini dapat dilakukan menggunakan algoritma Principal Component Analysis (PCA). Principal Component Analysis akan membentuk sekumpulan dimensi baru yang kemudian di ranking berdasarkan varian datanya. PCA akan menghasilkan Principal Component dari matriks kovarian . Gambar 4 . Flowchart PCA Langkah-langkah algoritma PCA sebagai berikut. Menghitung mean (X)dari data pada 260 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. P-ISSN: 2337-8344 E-ISSN: 2623-1247 tiap dimensi menggunakan persamaan . Oc Dengan: yco = jumlah data sampel Xi = data sampel Menghitung covariance matrix (CX) menggunakan persamaan . Dengan: yco = jumlah data sampel Xi = data sampel X mean Menghitung eigenvector . dan eigenvalue. dari covarince matrix menggunakan persamaan . ycyco = yuIycoycyco Gambar 5 . Flowchart K-NN Urutkan eigenvalue secara descending. Principal Component (PC) adalah deretan eigenvector sesuai dengan urutan eigenvalue pada tahap 3. Menghasilkan dataset baru. 2 Algoritma KNN Algoritma k-Nearest Neighbor. -NN) yaitu metode yang menggunakkan Algoritma supervised learning bertujuan untuk menemukan pola baru dalam data dengan menghubungkan pola data yang sudah ada dengan data yang baru. Tujuan dari algoritma k-NN adalah untuk mengklasifikasi objek baru berdasarkan atribut dan training Dimana hasil dari sampel uji yang baru diklasifikasikan berdasarkan mayoritas dari katagori pada k-NN. Algoritma k-NN menggunkan klasifikasi ketetanggaan sebagai nilai prediksi sampel uji yang baru. Prinsip kerja KNN yaitu mencari jarak terdekat antara data yang akan dievaluasi dengan K tetangga . terdekatnya dalam data Data pelatihan diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pelatihan. Sebuah titik pada ruang ini ditandai kelas c, jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titik Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean dengan rumus sebagai berikut. ycci = Ocycy . cu2i ycu1. Dengan x1 = sampel data, x2 = data uji, i = variabel data, dist = jarak, p= dimensi data. Pada fase pembelajaran, algoritma ini hanya melakukan penyimpanan vektor-vektor fitur dan klasifikasi dari data pembelajaran. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk data test. Jarak dari vektor yang baru ini terhadap seluruh vektor data pembelajaran dihitung, dan sejumlah k buah yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik-titik tersebut. Nilai k yang terbaik untuk algoritma ini tergantung pada data. Umumnya, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi lebih kabur . 3 Hasil dan Pembahasan Pada bagian ini akan dibahas hasil dari perancangan 261 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. dalam bentuk jadi berupa tangkapan layar aplikasi dan hasil pengujian aplikasi. P-ISSN: 2337-8344 E-ISSN: 2623-1247 diuji untuk mengetahui jenis citra kucing. Warna merah . menunjukkan kategori jenis anggora, warna hijau . menunjukkan kategori jenis persia, sedangkan warna biru . menunjukkan kategori jenis scotisfold. 6 Sebaran Data Pengujian Gambar 6 . Tampilan pada halaman utama Pada gambar 4 terlihat tampilan perancangan pada menu aplikasi terdiri dari pilih file, segmentasi, ekstraksi ciri,klasifikasi, dan reset. 4 Tampilan Pelatihan Pada tampilan data pelatihan diambil data citra latih file dengan nama anggora6. jpg dan menghasilkan klasifikasi anggora. Gambar 7. Tampilan data pelatihan Pada klasifikasi diatas melalui proses segmentasi dari citra asli diubah menjadi citra biner dan Kemudian menghasilkan ekstraksi ciri RGB dan HSV. Hasil akhir mengidentifikasi klasifikasi jenis kucing secara otomatis. 5 Sebaran Data Pelatihan Gambar 8. Sebaran Data Latih Dari gambar 6 diatas, terlihat sebaran data yang menunjukkan kelas jenis kucing dari gambar yang sudah diajdikan objek latih, yang berfungsi menjadi pembanding bagi data citra yang akan Gambar 9. Sebaran Data Uji Pada gambar 7 sebaran data uji, terlihat perbandingan antara data latih dan data uji yang ditandai dengan tanda silang berwarna, untuk kelas jenis anggora tanda silang berwarna cyan, untuk kelas jenis persia tanda silang berwarna magenta, dan untuk kelas jenis scotisfold tanda silang berwarna kuning. Dari hasil pengujian akurasi antara data latih dan data uji memperoleh akurasi sebesar 80%, dimana terdapat 2 hasil data yang tidak akurat dari 10 data citra uji. Sehingga dalam kedepannya bisa disempurnakan agar aplikasi sistem dapat memperoleh keluaran yang lebih akurat lagi. Pengujian pada 10 data citra uji, menggunakkan aplikasi klasifikasi algoritma PCA dan K-NN menghasilkan keluaran klasifikasi jenis kucing pada data tabel sebagai berikut : Tabel 3. 1 Hasil Klasifikasi Data Uji Data Uji Anggora1. Anggora2. Anggora3. Persia1. Persia2. Persia3. Scotis1. Scotis2. Scotis3. Hasil Klasifikasi ScotisFold (Sala. Anggora (Bena. Anggora (Bena. Persia (Bena. Persia (Bena. Anggora (Sala. Scotisfold (Bena. Scotisfold (Bena. Scotisfold (Bena. Dari 10 data uji yang dihitung didapatkan hasil klasifikasi akurat dan 2 citra dengan hasil klasifikasi tidak akurat dan dapat diketahui dari hasil pengujian yaitu dirumuskan sebagai berikut: 262 | S T M I K D i a n C i p t a C e n d i k i a K o t a b u m i Jurnal informasi dan Komputer Vol: 10 No:2. Pada hasil pengujian ini diperoleh presentase akurasi keseluruhan menggunakan PCA dan KNN adalah sebesar 80 % . elapan puluh perse. KESIMPULAN DAN SARAN 1 Kesimpulan Berdasarkan hasil klasifikasi jenis kucing menggunakkan algoritma PCA dan algoritma KNN diperoleh kesimpulan sebagai berikut : Metode Principal Component Analysis(PCA) dan Algoritma K-Nearest Neighbor(K-NN) dapat melakukan klasifikasi pada jenis kucing dengan data latih 24 citra dan data uji 10 citra. Hasil evaluasi klasifikasi pada citra kucing menggunakan klasifikasi K-NN berdasarkan ekstraksi ciri dengan PCA menghasilkan akurasi sebesar 80%. 2 Saran Berdasarkan hasil klasifikasi jenis kucing menggunakkan algoritma PCA dan algoritma KNN diperoleh saran sebagai berikut : Dapat dikembangkan menggunakkan metode ekstraksi ciri dan metode algoritma lain yang dapat digunakan untuk membedakan jenis kucing agar dapat meningkatkan hasil akurasi. Untuk pengembangan dari penelitian ini dapat menambahkan jenis kucing yang lain untuk P-ISSN: 2337-8344 E-ISSN: 2623-1247 Adiwijaya. Wisesty. Lisnawati. Aditsania dan D. Kusumo. AuDimensionality Reduction Principal Component Analysis for Cancer Detection based on Microarray Data Classification,Ay Jurnal Computer Science, vol. , pp. 1521-1530, . Jamala. Handayania. Septiandria. Ripmiatina Effendi. AuDimensionality Reduction using PCA and K-Means Clustering for Breast Cancer Prediction,Ay Lontar Komputer, 9 . , pp. 192-201, . Muhammad Ridwan Effendi. AuSistem Deteksi Wajah Jenis Kucing Dengan Image Clasification Menggunakkan OpenCVAy,. Elok Faiqotul H. Maura W. Maysaroh. AuIdentifikasi Kematangan Buah Kelapa Sawit Berdasarkan Warna RGB dan HSV Menggunakkan Metode K-Means ClusteringAy,Vol 6. No. 2 November . Ratri Enggar P. WaliJa'far S. Wahyuni,Ay Klasifikasi Kualitas Jeruk Lokal Berdasarkan Tekstur dan Bentuk Menggunakkan Metode k-Nearest . NN)Ay,. DAFTAR PUSTAKA