Volume 19 Nomor 2 . E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika IMPLEMENTASI K-MEANS CLUSTERING MENGGUNAKAN RAPIDMINER DALAM PENGELOMPOKAN DATA KUNJUNGAN WISATAWAN ASING DI PROVINSI JAWA TIMUR Edwin Wira Liyanto. Ahmad Homaidi. Ahmad Lutfi. Jurusan Teknologi Informasi. Fakultas Sains dan Teknologi. Universitas Ibrahimy Jl. KHR. Syamsul Arifin No. Sukorejo. Situbondo 68374. Jawa Timur. Indonesia e-mail : . agistasinta15@gmail. com, . ahmadhomaidi@ibrahimy. id, . 14@gmail. ABSTRAK Pariwisata adalah salah satu sektor yang mampu memberikan sumbangsi yang sangat signifikan kepada perekonomian di suatu negara, terlebih pengelolaan pariwisata yang baik dapat memberikan dampak positif bagi sosial dan ekonomi di suatu wilayah. Jawa Timur menjadi salah satu wilayah destinasi wisata alam yang cukup banyak menarik wisatawan mancanegara dengan daya tarik wisata, tradisi, budaya dan kearifan lokalnya yang menjadi target utama kunjungan wisatawan mancanegara. Pengelompokan wisatawan dilakukan dengan teknik Data Mining menerapkan algoritma k-means, analisis yang digunakan memakai metode Knowledge Discovery in Database (KDD). Dengan menerapkan algoritma K-Means clustering dalam rangka klasterisasi data Kunjungan Wisatawan Mancanegara (ASIA) ke Jawa Timur Melalui Bandara Juanda Tahun 2016 Ae 2023 yang diambil dari portal resmi BPS Jawa Timur. Dari data yang telah diolah ditemukan 2 cluster yang menghasilkan nilai dbi paling optimal yaitu 0. 293 dengan cluster 0 berisi 2 data, cluster 1 48 data. Kata Kunci: Pariwisata. K-Means. Data Mining. ABSTRACT Tourism is one sector that is able to make a very significant contribution to the economy of a country, especially good tourism management can have a positive impact on the social and economy of a region. East Java is one of the natural tourist destination areas that attracts quite a lot of foreign tourists with its tourist attractions, traditions, culture and local wisdom which are the main targets for foreign tourist visits. Tourist grouping is carried out using Data Mining techniques applying the k-means algorithm, the analysis used uses the Knowledge Discovery in Database (KDD) method. By applying the K-Means clustering algorithm in order to cluster data on Foreign Tourist Visits (ASIA) to East Java via Juanda Airport for 2016 - 2023 taken from the official BPS East Java portal. From the data that has been processed, 2 clusters were found which produced the most optimal dbi value, namely 0. 293 with cluster 0 containing 2 data, cluster 1 48 data. Keywords: Tourism. K-Means. Data Mining. PENDAHULUAN Latar Belakang Penelitian Jawa Timur sebagai Provinsi paling timur dari kepulauan Jawa yang dipenuhi dengan keragaman dan kekayaan alam maupun budaya yang sangat menarik untuk pelajari secara eksploratif. Namun, masih banyak daerah di Jawa Timur yang tidak paham dan sadar sebesar apa potensi yang dimiliki. Oleh karena itu menguraikan setiap potensi daerah dalam memanfaatkan kekayaan alamnya sehingga mampu membentuk satu ikon pesona daerah yang menjadi magnet untuk siapapun yang berkunjung ke tempat pariwisata tersebut. Semua potensi yang ada di Jawa Timur masih banyak untuk di eksplorasi lebih dalam hingga mampu menjadi sebuah daya tarik yang mampu mengungkit perekonomian yang di Jawa Timur secarah signifikan. Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Sektor pariwisata menjadi salah satu sektor yang memperoleh prioritas utama untuk memulihkan sektor ekonomi yang ada di suatu daerah. Pariwisata sendiri juga merupakan ujung tombak dari peningkatan pendapatan daerah karena dari sektor perekonomian masyarakat di segala bidang karena pariwisata merupakan sektor yang dapat terus . Demi peningkatan kunjungan wisatawan terutama wisatawan mancanegara, dibutuhkanlah sebuah strategi dalam meningkatkan kontribusi di sektor wisata dalam menunjang keberlangsungan sektor wisata di suatu daerah. Tujuan utama wisatawan mancanegara datang yakni ingin mengenal lebih jauh tradisi, budaya serta kearifan lokal yang terdapat di suatu tempat. Pola hidup dan ilmu pengetahuan serta bermacam-macam cara hidup yang berwujud kegiatan yang dilakukan masyarakat disekitar sebagai upaya menyelesaikan berbagai masalah kehidupan mereka adalah esensi dari kearifan lokal sendiri. Banyak hal yang dapat dipelajari dari kearifan lokal yang ada di Jawa Timur, sehingga mampu memikat wisatawan asing untuk sekedar singgah dan menghabiskan waktunya di tempat wisata yang ada. Pariwisata sendiri memiliki banyak efek pada perkembangan sebuah wilayah. Salah satu efek yang dapat dirasakan langsung oleh masyarakat yakni tersedianya banyak kesempatan pekerjaan bagi masyarakat yang bersentuhan langsung dengan . Mulai dari sektor transportasi, kuliner, hingga produk olahan yang berbasi perumahan maupun industri dapat merasakan langsung dampak dari pariwisata yang ada di suatu daerah. Berbagai produk pariwisata juga dapat terus berkembang seiring berjalannya waktu dan memiliki pengaruh jangka panjang jika dapat diolah dengan baik. Produktifitas dari pelayanan, objek wisata serta event yang mampu menarik lebih banyak wisatawan akan memberikan keuntungan terhadap suatu Sedangkan wisatawan adalah sebuah komponen penting yang bersanding selaras dengan dunia pariwisata. Wisatawan memiliki beragam jenis, mancanegara dan lokal, tua dan muda, miskin dan kaya, semuanya memiliki keinginan dan harapan yang berbeda-beda. Semua kalangan wisatawan memiliki tujuan yang sama yakni untuk mengunjungi suatu tempat wisata terlepas dari berbagai tujuaannya namun tetap pada visi yang sama yakni bepergian dan melepas rutinitas setiap Dengan terus berkembangnya zaman hingga kini trend pariwisata mengalami banyak perubahan yang cukup signifikan, dari pariwisata yang berbasis konvensional berubah menjadi pariwisata berbasis minat khusus. Seperti wisata petualangan yang memberikan sensasi pengalaman yang luar biasa dan juga sensasional, di jawa timur sendiri begitu banyak wisata minat khusus seperti ini pada kegiatan wisata, hiking, snorkeling, dan lain sebagainya. Pada wisata minat khusus, wisata kuliner menjadi salah satu bagian wisata minat khusus. Jawa Timur dengan sejuta budaya dan letak geografisnya yang beragam memiliki banyak wisata kuliner yang dapat di jelajahi di setiap sudut daerahnya, mulai dari pantai hingga pegunungan selalu menawarkan kuliner dengan cita rasa yang beragam. Wisata edukasi yang tengah dikembangkan oleh banyak tempat wisata ternyata menjadi bagian dari wisata minat khusus, saat ini di Jawa Timur sudah banyak sekali menawarkan wisata edukasi seperti jatim park 2 dan 3 yang menawarkan wisata edukasi flora dan fauna bagi segala usia. Pilihan terakhir dari trend wisata edukasi adalah wisata olahraga yang cukup banyak menarik minat wisatawan, wisata olahraga biasanya menawarkan berbagi kegaiatan yang menguji adrenalin seperti adalah surfing, rafting, snorkelin, tubing dan lain sebagainya. Dapat disimpulkan bahwa wisata minat khusus mungkin menjadi pilihan bagi para pelancong yang akan berlibur dengan cara berbeda. Wisata minat khusus pada umumnya mengajrakan kita untuk lebih menghargai alam dengan semua kekayaannya yang terkandung di dalamnya. Semua tempat wisata yang ada di Jawa Timur memang mampu menarik minat wisatawan mancanegara untuk berkunjung. Namun tidak dipungkiri bahwa belum banyak wisata yang di ketahui oleh banyak masyarakat sendiri, terlebih wisatawan macanegara yang lebih berfokus terhadap wisata-wisata yang sudah berkembang dan memiliki nilai jual yang pasti. Padahal tidak dapat dipungkiri Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika wisata yang ada di Jawa Timur tidak terbatas hanya itu saja, banyak sekali wisata yang mulai berkembang dan menjadi daya tarik wisatawan Hal tersebut tidak lepas dari kurangnya informasi wisatawan asing terhadap tempat-tempat wisata tersebut dan lebih banyak tour guide yang masih belum mengetahui nilai dari suatu tempat Belum adanya penelitian dan kajian terhadap tempat wisata baru juga menjadi keterbatasan yang harus segera ditemukan penyelesaiannya sehingga tidak hanya tempat wisata yang sudah memiliki nilai yang menjadi daya ungkit kunjungan wisatawan mancanegara melainkan wisata-wisata berkembang lainnya yang memiliki nilai budaya, tradisi dan kearifan lokal lainya mampu mendorong hal Adanya pandemi Covid-19 menjadi krisis terbesar yang pernah di alami oleh seluruh dunia, tidak terkecuali Indonesia dan Jawa Timur pada Hampir semua sektor mengalami penurunan yang sangat sinifikan akibat pandemi Covid-19. Sektor kesehatan yang paling terguncang memberikan efek yang besar bagi ekonomi dan memunculkan beragam problematika yang saling berkaitan dan menciptakan efek domino yang tak Pariwisata pun tidak ketinggalan menjadi salah satu sektor yang mengalami kemunduran yang sangat signifikan akibat pandemi. Kebijakan isolasi mandiri serta tertutupnya pintu masuk negara melalui bandara nasional dan internasional mempengaruhi jumlah wisatawan mancanegara yang ingin berkunjung ke Indonesia, serta seluruh komoditas ekonomi yang menjadi satu kesatuan dalam kegiatan pariwisata, agen travel, hotel dan guest house menjadi beberapa komuditas yang terdampak langsung. Seiring berjalannya waktu, kondisi pariwisata di tahun 2023 semakin menunjukkan pemulihan. Pemerintah terus menggelontorkan berbagai program serta kebijakan dalam upaya mendukung kembalinya sektor pariwisata pasca pandemi Covid-19. Pengembangan pariwisata berupa program yang tepat sasaran sangat dibutuhkan untuk meningkatkan jumlah kedatangan Strategi dikembangkan seperti meningkatkan infrastruktur, promosi pariwisata secara agresif dapat memberikan kemudahan berwisata ke destinasi pariwisata. Sektor pariwisata Jawa Timur pada tahun 2023 mengalami perkembangan yang cukup baik jika dibandingkan dengan daerah lain di Indonesia, hal ini di tandai dengan naiknya nilai Produk Domestik Regional Bruto (PDRB ADHK 2. Provinsi Jawa Timur sektor akomodasi serta produk makan minum mencapai 101,73 triliun rupiah. Nilai ini lebih tinggi dibandingkan tahun 2022 (PDRB ADHK 2. yang mencapai 94,15 triliun rupiah (BPS Jawa Timur. Kenaikan ini menunjukkan bahwa sektor pariwisata di Jawa Timur mengalami kebangkitan pasca pandemi Covid-19. UNWTO sebagai organisasi pariwisata meramalkan bahwa Covid-19 akan berdampak pada (PDB) yang melonjak tajam sebesar 1,5 persen hingga 2,8 persen. Pada awal tahun sampai mei tahun 2020, telah terjadi penyusutan yang begitu drastis pada banyaknya wisatawan mancanegara yang berkunjung dengan penurunan yakni mencapai 56%, dan turunnya penghasilan dari ekspor pariwisata mencapai 320 juta USD. Selain dampak tersebut . Covid-19 juga beresiko menghilangkan hingga 120 juta pekerjaan yang berhubungan dengan dunia wisata. Pariwisata sendiri sektor dengan sebagian besar kontribusinya berasal dari padat karya serta kegiatan usahanya mikro kecil menengah. Sempat terpuruk karena pandemi Covid-19, kini sektor pariwisata menunjukkan peningkatan yang cukup drastis. Pemulihan sektor pariwisata juga terlihat dari pencapaian Indonesia di forum internasional. Travel and Tourism Competitivenes Index (TTDI) Indonesia naik 12 peringkat menjadi posisi 32 di atas Malaysia. Thailand. Vietnam, dan Filipina. Bahkan Indonesia mencapai peringkat pertama dalam Global Muslim Travel Index (GMTI) menurut sumber dari BPJ Jawa Timur. Diluar permasalahan komplek yang terjadi di sektor pariwisata yang ada di Jawa Timur, pemerintah serta elemen masyarakat di dunia pariwisata harus terus berkolaborasi untuk terus meningkatkan nilai tambah sektor pariwisata khusunya kunjungan wisatawan mancanegara. Promosi yang tepat serta target audiens yang beragam dari berbagai negara yang berkunjung ke Jawa Timur menjadi point penting dalam mengambil keputusan. Data kunjungan wisatawan asing yang di peroleh dari data publik yang di publikasikan oleh BPS Jawa Timur Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika akan menjadi data utama dalam proses penelitian. Penelitian akan mengklasifikasikan mana saja negara yang layak untuk menjadi target promosi dengan menggunakan algoritma k-means clustering. Landasan Teori Keputusan yang tepat harus diambil dengan mengutamakan aspek data yang relevan sehingga mampu mewujudkan strategi yang baik dalam menentukan kebijakan. Penentuan kebijakan tersebut tidak hanya dapat dilakukan oleh permerintah sebagai lading sektor pariwisata pada umumnya, masyarakat yang terlibat dalam usaha wisata sendiri dapat menggunakan penelitian ini sebagai landasan teori yang penting dalam mempromosikan tempat-tempat wisata di Jawa Timur. Data yang digunakan dalam penelitian ini adalah data kunjungan wisatawan mancanegara (ASIA) ke Jawa Timur melalui bandara juanda Tahun 2016 Ae 2023 yang diambil melalui portal BPS jawa timur dengan sifat data publik. Data tersebut berasal dari buku Statistik Pariwisata Provinsi Jawa Timur yang diterbitkan oleh BPS Jawa Timur pada setiap tahun. Dari data tersebut akan dilakukan pemisahan secara kelompok negara mana yang memiliki jumlah wisatawan terbanyak hingga yang paling sedikit guna mencari sasaran yang tepat dari promosi wisata yang akan dilakukan nantinya. Data yang digunakan merupakan dataset kunjungan wisatawan mancanegara melalui bandara juanda dari tahun 2016 s. d 2023 di Provinsi Jawa Timur. Data yang digunakan telah memiliki struktur data yang jelas, jenis yang tetap, serta format data yang tidak rubah, sehingga data ini disebut sebuah data Data mining merupakan suatu tahap penyimpanan informasi dan data yang menggunakan berbagai teknik seperti matematika, statistik, artificial intelligence (AI) serta machine learning mencari dan menerjemahkan berbagai informasi atau pengetahuan yang berguna untuk disimpan di dalam database. Data mining merupakan sebagian proses dari Knowledge Discovery in Databases (KDD) yang tersusun dari beberapa pemilihan,pengolahan, transformasi,data mining hingga evaluasi hasil. Ada 5 fungsi pada data mining yang pertama yakni : classification, ini merupaka fungsi untuk menyimpulkan berbagai macam deskripsi dari berbagai karakteristik tertentu dari sepotong Clustering, merupakan fungsi yang mendreskripsikani suatu kelompok dari sebuah data sehingga mempunyai karakteristik khusus perbedaan khusus pada clustering adalah dimana pada clustering tidak ada definisi karakteristik awal seperti pada Association, fungsi yang biasa digunakan untuk mengidentifikasi hubungan antara kejadian yang terjadi pada suatu waktu. Sequencing, memiliki fungsi yang hampir sama dengan hubungan yang berbeda pada suatu periode waktu. Terakhir yakni forecasting yaitu fungsi untuk memperkirakan nilai pada masa depan berdasarkan pola atau kebiasaan tertentu. Clustering adalah proses mencari dan mengelompokkan data dalam suatu data ke dalam kelompok data yang memiliki kesamaan . antara data yang satu dengan yang lainnya. Tahapan pada algoritma K-means clustering adalah sebagai berikut:. Menentukan banyaknya cluster Menentukan titik centroid, untuk menentukan titik centroid awal pada iterasi yakni dilakukan secara manual menurut peneliti. Namun ketika tahap iterasi pertama hingga iterasi terakhir ketika nilai centroid tidak berubah lagi, dipastikan dengan mengaplikasikan rumus ycAycn ycOycnyc = Oc ycUycoyc ycAycn yco=0 Keterangan : Vij = Centroid average pada klaster ke-i untuk variabel ke-j Ni = Banyak himpunan pada klaster ke-i i,k = index dari klaster j = index dari variabel Xkj = nilai dari data ke-k variabel ke-j untuk klaster tersebut. Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Untuk memastikan jarak gunakan rumus Euclidean Distance guna menentukan jarak tiap titik centroid dengan titik pada tiap objek, sehingga ditemukan jarak garis lurus memisahkan antara dua titik dalam ruang Euclidean. yayce = Oo. cuycn Oe ycycn ) 2 . cycn Oe ycycn ) 2 Keterangan : De = Euclidean Distance (Jara. i = Banyak objek . , . = Titik Koordinat objek . , . = Titik Koordinat centroid Xkj = nilai dari data ke-k variabel ke-j untuk klaster Objek dikelompokkan sesuai anggota cluster dengan memperhitungkan jaraknya ke titik centroid paling dekat. Lakukan pengulangan tahap 2 hingga tahapan 4 sampai nilai centroid yang keluarkan menjadi tetap atau bernilai optimal, dan anggota kluster tidak ada yang berpindah ke kluster lainnya. Bentuk algoritma k-means clustering adalah sebagai berikut : Gambar 1. Flowchart K-means Clustering. Untuk mengevaluasi dan menilai klaster dalam klasifikasi akan digunakan Davies Bouldin Index (DBI) berdasarkan nilai kohesi dan separasi . Davies Bouldin Indeks (DBI) juga disebut konsistensi dari serangkaian pengukuran klasifikasi indeks. diperkenalkan oleh David L. Davies dan Donald W. Bouldin pada tahun 1979 Davies Bouldin Index (DBI) memiliki pengertian yakni perbandingan average jarak antar klaster untuk . Rumus yang gunakan untuk menemukan kerangka kohesi dari sebuah kelompok ke-i yang disebut Sum of Square Within Cluster (SSW) dan diformulasikan sebagai berikut : ycIycIycOycn = ycoycn Oc ycoycn yc=ycn ycc . cuycn , ycaycn ) Keterangan: m = Banyak data pada klaster ke-i c = Centroid klaster ke-i d = Jarak . Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Sebaliknya fungsi yang digunakan untuk menemukan nilai pemisahan antar kelompok disebut Sum of Square Between Cluster (SSB) yang diformulasikan sebagai berikut: ycIycIyaAycnyc = ycc . caycn , ycayc ) Keterangan: d = Jarak . c = Centroid klaster ke-i Setelah menemukan nilai kohesi dan nilai separasi, dilanjutkan dengamn pengukuran rasio . cIycnyc ) dengan tujuan untuk mencari nilai komparasi antara kelompok ke-i dan kelompok ke-j. Dan nantinya kelompok terbaik adalah klaster yang memiliki nilai afinitas terkecil dan nilai separasi terbesar. Rasio . cIycnyc ) dapat dihitung dengan menggunakan rumus ycIycnyc = ycIycIycOycn ycIycIycOyc ycIycIyaAycnyc Setelah nilai rasio ditemukan lalu gunakan untuk menghitung nilai Davies Bouldin Index (DBI) dengan cara berikut: yco yayaAya = Oc ycn=1 ycoycaycuycn O yc Setelah diketahui nilai k atau jumlah klister dari persamaan Davies Bouldin Index (DBI) diambil kesimpulan jika semakin kecil nilai DBI yang diperoleh . on negatif >= . maka klaster tersebut semakin baik. II. METODE PENELITIAN 1 Tahapan Penelitian Dalam penelitian ini digunakan Knowledge Discovery in Databases (KDD) sebagai metode dalam mengevaluasi hasil pengolahan data. Pengelompokan data jumlah kunjungan wisatawan asing ke Jawa Timur akan dilakukan dengan memanfaatkan tool Rapidminer. Pengelompokan memanfaatkan operator atau fungsi yang ada pada Rapidminer. Operator yang akan diaplikasikan pada penelitian memiliki tujuan dan fungsi yang berbeda tergantung kebutuhan penelitian. Metodologis yang digunakan diuraikan pada gambar 1 . Gambar 1. Metode Knowledge Discovery in Databases (KDD) Penjabaran gambar 1 Data dikumpulkan melalui laman resmi Badan Pusat Statistik Provinsi Jawa Timur mulai tahun 2016 hingga 2023 pada statistik pariwisata Provinsi Jawa Timur. Pengolaha data mencakup proses pemilahan data mentah yang mengandung informasi yang tidak dibutuhkan dalam penelitian sehingga perlu di proses Kembali menjadi data set yang akan menjadi objek penelitian. Transformasi data berupa perubahan format data hingga penyusunan data untuk kemudiann di proses secara manual menggunakan excel atau menggunakan tool aplikasi Rapidminer menggunakan algoritma k-means clustering. Data yang telah diproses kemudian di evaluasi menggunakan dan disimpulkan menggunakan metode Knowledge Discovery in Databases (KDD) hingga menghasilkan informasi dan pengetahuan baru. HASIL DAN PEMBAHASAN 1 Perhitungan Manual Menggunakan Excel dengan K-Means Clustering Pengolahan data dimulai dari menentukan jumlah klaster yang akan dibentuk. Ada 2 klaster yang akan di bentuk dengan kondisi jumlah klaster harus lebih sedikit dari jumlah data . Negara Brunei Darussalam Philippina Singapura 23382 24898 25692 Thailand Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 A. Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Vietnam 1698 A. Hongkong 4245 A. India 6081 A. Jepang 5884 A. Korea A. Selatan Pakistan A. Bangladesh A. Srilanka A. Taiwan 13550 14168 9096 A. Tiongkok 16648 17511 18194 A. Afrika A. Lainnya Tabel 1. Data Kunjungan Wisatawan berdasarkan negara dan tahun Negara Singapura Oo Thailand Oo India Oo Jepang Oo Korea Selatan Oo Taiwan Oo Tiongkok Oo 4110 Amerika Serikat Oo Philippina Oo Prancis Oo A. Jerman Oo Inggris Oo Australia Oo Hongkong Oo Belanda Oo A. Oo Dari data awal yang ditampilkan akan tercipta Afrika Lainnya Oo Tabel 4. Hasil Klaster 2 klaster . dan dalam penentuan centroid awal ditentukan secara random oleh peneliti ataupun Dari 50 negara diperoleh hasil anggota klaster secara manual, pemilihan data awal ini akan sangat 1 sebanyak 8 negara dan klaster 2 sebanyak 42 menentukan perhitungan centroid selanjutnya. Kemudian dilakukan pencarian centorid yang Menggunakan rumus Euclidean Distance seperti yca baru kembali dengan menggunakan rumus Oc ycn yakni ycu total nilai data pada setiap klasster dibagi dengan yaycaycyca 1 banyak anggota klaster. yaAycycycuycaycn yaycaycycycycycaycoycayco 2016, yayceycuycycycuycnycc 1 2016 = Centr Centroid 2016 2017 A. Thailand Thaila 7274 9507 A. (C. 11320,125 Norwegia (C. 178 227 A. (C. Norw 925,785714 A 578,857142 Tabel 2. Centroid Awal 988,64 (C. Pengenal centroid pada Tabel 2 adalah C1 Tabel 5. Centroid Ke 2 . 4,9507,9175,7058,712,4,1178,3. dan C2 Hitung kembali jarak antar centroid . ,227,109,108,51,0,38,. Untuk selanjutnya bila terdapat data yang berpindah klaster, menggunakan rumus Euclidean Distance pada tiap maka tentukan kembali nilai centroid baru yang objek hingga tiap anggota klaster tidak mengalami dihitung dengan mnggunakan nilai rata-rata pada perubahan klaster. setiap klaster. Iterasi atau perhitungan akan dihentikan apabilah data yang muncul pada perhitungan baru dan sebelumnya tidak berpindah Setelah ditetapkan nilai centroid awal selanjutnya lakukan perhitungan jarak menggunakan rumus Euclidean Distance untuk menentukan jarak antara setiap titik centroid dengan titik pada tiap objek , yaitu jarak garis lurus yang biasa antara dua titik dalam ruang Euclidean. Negara Singapura Thailand Taiwan Tiongkok Amerika Serikat India Jerman Inggris Philippina Prancis Oo Oo Oo Oo Oo Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Oo Oo Oo Oo Oo Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika Jepang Oo Belanda Oo Korea Selatan Oo Australia Oo Brunei Oo Darussalam A. Oo Afrika Lainnya Oo Tabel 6. Hasil Klaster Dengan Centroid Baru Karena jumlah klaster pada iterasi ke 2 mengalami perubahan maka hitung kembali nilai centroid menggunakan rumus Euclidean Distance kembali hingga memunculkan nilai centroid ke 3 seperti pada table berikut. Centroi (C. (C. 1187, 1316,75555 A. 790,5777 Tabel 7. Centroid Ke 3 Lakukan iterasi ke 3 pada data yang sama hingga memunculkan klaster terbaru dengan mengunakan nilai centroid ke 3 hingg keluarlah klaster baru . Negara Singapura Oo Taiwan Oo Tiongkok Oo Thailand Oo Amerika Serikat Oo Brunei Oo Darussalam Philippina Oo Vietnam Oo Hongkong Oo Korea Selatan Oo Jepang Oo India Oo Srilanka Oo Bangladesh Oo Pakistan Oo A. Oo Afrika Lainnya Oo Tabel 8. Hasil Klaster Dengan Centroid Ke 3 Karena jumlah klaster pada iterasi ke 3 mengalami perubahan maka hitung kembali nilai centroid menggunakan rumus Euclidean Distance kembali hingga memunculkan nilai centroid ke 4 seperti pada table berikut. Centroi (C. (C. 1421,851 1316,755 A. 790,5777 Tabel 9. Centroid Ke 4 Setelah dilakukan iterasi sebanyak 4 kali dengan nilai centroid ke 4 dan centorid ke 5 tidak mengalami perubahan diperoleh hasil data anggota klaster 1 sebanyak 3 negara yakni Singapura. Taiwan dan Tiongkok dan klaster 2 sebanyak 47 negara yang di dapat dilihat dari tabel 10. Negara Singapura Oo Taiwan Oo Tiongkok Oo Brunei Oo Darussalam Philippina Oo Thailand Oo Vietnam Oo Hongkong Oo India Oo Jepang Oo Korea Selatan Oo Pakistan Oo Bangladesh Oo Srilanka Oo Asia Lainnya Oo A. Oo Afrika Lainnya Oo Tabel 10. Hasil Klaster Dengan Centroid 4 Setelah dilakukan penghitungan manual dengan menggunakan Excel kemudian akan k-means menggunakan tool Rapidminer pada penelitian ini, k-means diimplementasikan menggunakan tools RapidMiner (Altair AI Studi. 1 Dataset digunakan terdiri dari 50 negara dengan kunjungan sejak tahun 2016 hingga tahun 2023. Langkah-langkah dalam proses ini meliputi: Pemilihan Data Pemilihan data akan menggunaan seleksi data pada Rapidminer. Tujuannya adalah untuk Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika menentukan atribut dari data set yang akan digunakan pada proses selanjutnya sehingga data yang tidak diperlukan pada penelitian dapat disingkirkan dan tidak melalui proses Operator Select Attributes merupakan fungsi yang akan digunakan pada proses seleksi data. Operator Select Attributes sendiri memiliki fungsi untuk melakukan proses pemilihan atribut dari data set yang digunakan. Untuk memilih beberapa atribut, gunakan subset pada parameter dari operator Select Atribut. Dataset kunjungan wisatawan mancanegara ke jawa timur berjumlah 12 atribut. Awal proses seleksi data akan milih atribut pada data yang nantinya akan muncul 9 atribut data yang digunakan dalam penelitian ini. Nama Atribut Kode Kebangsaan Keterangan Tidak Digunakan Tidak Kebangsaan Digunakan Negara Digunakan Digunakan Digunakan Digunakan Digunakan Digunakan Digunakan Digunakan Digunakan Tidak Total Digunakan Tabel 7. Atribut Data Set Dari table 7 diketahui bahwa peneliti hanya menggunakan 9 atribut data dari total 12 atribut pada dataset yaitu atribut Negara, 2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023. Melalui data dari dari Tabel 7, akan diterapkan pada pemilihan data pada operator Select Attributes dengan cara memindahkan data yang berada pada kolom kiri ke kolom sebelah kanan seperti Gambar 2 berikut: Gambar 2. Operator Select Attributes Setelah dataset diberikan fungsi select attributes maka data set yang akan kita gunakan juga berubah dan menjadi data set yang baru dengan tabel dan data yang telah di pilih pada operator select attribute seperti pada Gambar 3 berikut : Gambar 3. Data Set Penggunaan Operator Select Attributes Transformasi Data Langka transformasi data dilakukan di Rapidminer dengan memanfaatkan operator multiply untuk menciptakan tiruan objek pada aplikasi RapidMiner. Operator ini memngut objek melalui port input dan membawa tiruannya ke port output. Setiap port yang terkoneksi akan membuat salinan yang independen. Apabilah mengubah satu tiruan tidak akan berpengaruh pada tiruan yang lainnya. Gambar 4. Data Set Penggunaan Operator Filter Examples Pengelolaan Data atau Data Mining Penggunaan Algoritma k-means clustering digunakan pada Rapidminer dengan memunculan operator k-means yang dapat ditemukan pada folder Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . 205-216 E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika operator Modeling lalu pulih Segmentation dan tarik operator k-means pada jendela Process . Algoritma kmeans clustering dipakai untuk membuat pengelompokan pada dataset wisatawan asing yang berkunjung ke Jawa Timur dengan jumlah klaster terpilih menggunakan nilai DBI (Davies Bouldin Inde. Gunakan nilai parameter jumlah kelompok sebanyak 2 . = . dengan nilai iterasi sebanyak 10 kali, dibuat pula perbandingan dengan menggunakan klaster 3 . hingga klister 5 . sebagai perbandingan klaster terbaik dari ke 4 klaster Gunakan parameter measure types dan terapkan Numerical Measure dengan menggunakan pilihan Euclidean Distance. Gambar 6. Proses Davies Bouldin Index (DBI) di Rapidminer Setelah menggunakan tools Rapidminer untuk mencari angka DBI paling optimal, dengan permulaan penelitian menerapan kelompok K=2 hingga K=5 diperoleh kesimpulan bahwa klaster K=2 mempunya nilai DBI terkecil yakni 0. 293 seperti pada tabel berikut. Gambar 5. Operator K-Means Clustering di Rapidminer Interpretasi Evaluasi (Interpretation/Evaluatio. Pada proses interpretasi penelitian ini yakni mengunakan operator Performance atau (Cluster Distance Performanc. karena k-mens clustering termasuk pengelompokan berdasarkan distance atau jarak maka kita gunakan cluster distance performance untuk mengukur kualitas klaster kita berbasis jarak. Parameter Operator ini memiliki 2 jenis kriteria, yaitu average within centroid distance dan juga Davies Bouldin Index (DBI). Di tahap evaluasi untuk model penelitian ini digunakan kriteria utama Davies Bouldin Index (DBI) dengan parameter maximize untuk menghasilkan nilai DBI non-negatif (> = . Jumlah Nilai DBI Klaster K=2 K=3 K=4 K=5 Tabel 8. Nilai DBI Pada Setiap Klaster Hasil Evaluasi Dari penelitian ini dapat disimpulkan bahwa klasterisasi wisatawan mancanegara di Provinsi Jawa Timur dapat dikelompokkan menjadi 2 klaster menggunakan k-means clastering. Klasterisasi data wisatawan mancanegara di Provinsi Jawa Timur di proyeksikan dengan klaster 0 sebanyak 2 anggota dan klaster 1 sebanyak 48 anggota seperti pada gambar Gambar 7. Hasil Klasterisasi di Rapidminer IV. KESIMPULAN DAN SARAN Diterima Redaksi :26 Juli 2024 | Selesai Revisi : 25 September 2024 | Diterbitkan Online : 15 Oktober 2024 Volume 19 Nomor 2 . E Ae Link P-ISSN 1858-2109 E-ISSN 2656-5676 Jurnal Teknik Elektro dan Informatika 1 KESIMPULAN Pada penelitian ini ditemukan 2 klaster wisatwan mancanegara yang berkunjung ke Jawa Timur klaster 1 diisi oleh 3 negara dan klaster 2 diisi oleh 47 negara dengan perhitungan menggunakan Excel. Dari klasterisasi Dataset wisatawan asing yang berkunjung ke Jawa Timur melalui bandara juanda disimpulkan ke dalam 2 klaster dengan klaster 1 negara-negara Asia Tiongkok,Taiwan. Singapura sedangkan untuk klaster ke 2 diisi negara dari Eropa. Asia. Timur Tengah dan Amerika. Pada klaster ke 2 dapat di jadikan acuan data sebagai target promosi pariwisata Jawa Timur sehingga lebih banyak negara-negara dari klaster 2 yang mengunjungi Jawa Timur. 2 SARAN Dari hasil penelitian telah disimpulkan jumlah klaster dan anggota klaster pada masing-masing Data anggota klaster tersebut dapat menjadi data yang mampu membantu pariwisata Jawa Timur untuk menentukan promosi sepeti apa yang harus dilakukan serta target promosi seperti apa yang akan di pilih dalam rangka meningkatkan kunjungan wisatawan mancanegara ke Jawa Timur. Selain itu hasil penelitian dapat menjadi rujukan bagia penelitian lainnya dengan metode yang berbeda sehingga mampu menghasilkan data yang lebih bermanfaat untuk kedepannya. Keadilan, vol. 5, no. 1, pp. 16Ae31, 2018, doi: 14710/gk. Aji. Pramono, and D. Rahmi. AuKontribusi Sektor Pariwisata Terhadap Ekonomi Wilayah Di Provinsi Jawa Timur,Ay Jurnal Planoearth, vol. 3, no. 2, p. 57, 2018, doi: 10. 31764/jpe. Priyanto. AuPengembangan Potensi Desa Wisata Berbasis Budaya Tinjauan Terhadap Desa Wisata Di Jawa Tengah,Ay Jurnal Vokasi Indonesia, vol. 4, no. 1, 2016, doi: 7454/jvi. Prihandari. AuData Mining: Konsep Dan Apikasi Menggunakan Rapidminer (Series: Supervised Learning Dan Unsupervised Learnin. ,Ay p. 8, 2022. Ahmad. Samsugi, and Y. Irawan. AuImplementasi Data Mining Sebagai Pengolahan Data,Ay Jurnal Teknoinfo, vol. 1, p. 46, 2022. Iqbal. AuKlasterisasi Data Jamaah Umroh Pada Auliya Tour & Travel Menggunakan Metode K-Means Clustering,Ay JURTEKSI (Jurnal Teknologi dan Sistem Informas. , vol. 5, no. 2, pp. 97Ae104, 2019, doi: 33330/jurteksi. Wakhidah. AuClustering Menggunakan KMeans Algorithm ( K-Means Algorithm Clustering ),Ay Fakultas Teknologi informasi, 21, no. 1, pp. 70Ae80, 2014. Ling. Tu. Jin. Wang. Cui, and Zhu. AuResearch on Distributed Resource Aggregation Technology Based on Hierarchical Agglomerative Clustering Analysis,Ay Journal of Physics: Conference Series, vol. 2399, no. 1, 2022, doi: 1088/1742-6596/2399/1/012034. Hedar. Ibrahim. AbdelHakim, and A. Sewisy. AuK-means cloning: Adaptive spherical K-means clustering,Ay Algorithms, vol. 11, no. 10, pp. 1Ae21, 2018, doi: 10. 3390/a11100151. REFERENSI