Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Penerapan Algoritma K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori Menurut Provinsi Juwitha Lovely Sweets Sinaga1. Solikhun2. Dedi Suhendro3 1Mahasiswa Program Studi Sistem Informasi. STIKOM Tunas Bangsa. Pematangsiantar 2,3AMIK Tunas Bangsa. Pematangsiantar 1juwithalovelysweetssinaga@gmail. com, 2solikhun@amiktunasbangsa. su@amiktunasbangsa. Abstract Calories are a source of energy that we get from food intake that contains nutrients and as a basic human need for humans to survive. The number of people who consume excessive calories and do not pay attention to the amount of calorie intake that is consumed will result in the emergence of various diseases that are bad for health. In this case the government does not have information about the data on the average calorie consumption per province by province. The purpose of this study is to determine the highest and lowest clusters, for that the authors use Data Mining with the K-Means Algorithm to classify Average Calorie Consumption per day by province. This test is carried out using RapidMiner software. The results were obtained from the average grouping of calorie consumption grouped by two clusters: high and low clusters, high clusters of 13 provinces and low clusters of 21 Provinces that are classified as low clusters are expected to be a contribution for the Indonesian government for decision making in an effort to maintain a balanced consumption of calories per day and create a healthy lifestyle program in the future. Keywords: S K-Means. Clustering. RapidMiner. Rata-rata konsumsi kalori Abstrak Kalori adalah sumber energi yang kita dapatkan dari asupan makanan yang mengandung nutrisi dan sebagai kebutuhan pokok manusia agar manusia dapat bertahan hidup. Banyaknya masyarakat yang mengkonsumsi kalori secara berlebihan dan tidak memperhatikan jumlah asupan kalori yang dimakan akan mengakibatkan munculnya berbagai macam penyakit yang berakibat buruk bagi kesehatan. Dalam hal ini pemerintah belum memiliki informasi tentang data pengelompokkan rata-rata konsumsi kalori per hari menurut provinsi. Tujuan dari penelitian ini adalah untuk mengetahui cluster teringgi dan rendah, untuk itu penulis menggunakan Data Mining dengan Algoritma K-Means untuk mengelompokkan Rata-rata Konsumsi Kalori per hari menurut Pengujian ini dilakukan dengan menggunakan software RapidMiner. Hasil penelitian diperoleh dari pengelompokkan rata-rata konsumsi kalori yang dikelompokkan dengan dua cluster yaitu cluster tinggi dan rendah, cluster rendah 13 provinsi dan cluster tinggi 21 provinsi. Provinsi yang termasuk cluster rendah diharapkan dapat dijadikan kontribusi bagi pemerintah Indonesia pemerintah untuk pengambilan keputusan dalam upaya menjaga keseimbangkan konsumsi kalori per harinya dan membuat program pola hidup sehat di masa yang akan datang. Kata kunci: K-Means. Clustering. RapidMiner. Rata-rata konsumsi kalor PENDAHULUAN Kalori merupakan salah satu nutrisi yang terkandung dalam makanan. Kebutuhan energi seseorang menurut FAO/WHO . adalah konsumsi energi berasal dari makanan yang diperlukan untuk menutupi pengeluaran energi seseorang . Kalori merupakan salah satu kebutuhan pokok bagi tubuh manusia agar dapat bertahan hidup dan fungsi untuk memicu tubuh agar bisa bernafas dan Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Ada beberapa macam makanan pokok dan minuman yang mengandung jumlah kalori tinggi, seperti nasi yang mengandung karbohidrat, kacang-kacangan, buah alpokat, sirup, es krim dan lainnya. Makanan yang dimakan jika dibarengi dengan aktifitas sehari-hari akan membuat tubuh menjadi stabil. Rata-rata kebutuhkan kalori tergantung dari berat badan, jenis kelamin, usia dan aktivitas. Seiring bertambahnya usia maka metabolisme tubuh akan berjalan dengan sangat Sehingga membuat energi yang kita butuhkan berkurang dibandingkan saat usia masih muda. Kebutuhan kalori tubuh perharinya 1800 kkal sampai 2000 Total kebutuhan energi harian yang harus dikonsumsi tidak boleh kurang dari BMR yang ditetapkan. BMR bergantung terhadap parameter berat badan(BB), tinggi badan (TB), umur (U), dan jenis kelamin (JK) dan jenis aktivitas yang dilakukan . Meningkatnya jumlah masyarakat dalam mengkonsumsi makanan yang mengandung kalori tinggi setiap harinya dapat mengakibatkan timbulnya beberapa penyakit seperti penyakit diabetes, stroke, penyakit jantung dan dapat mengalami obesitas. Tubuh yang mengalami obesitas yaitu masalah pada kegemukan, dimana berat badan terlalu berlebihan dan tidak seimbang akan sangat beresiko. Namun sebaliknya, jika tubuh kekurangan kalori tubuh akan merasa lemas tidak bergairah, karna tidak adanya energi bahkan membuat tubuh menjadi kurus dan dapat mengalami gizi buruk. Dalam hal ini pemerintah belum memiliki informasi tentang data pengelompokkan rata-rata konsumsi kalori per hari menurut provinsi. Data tersebut sangat dibutuhkan pemerintah sebagai informasi agar dapat memberikan arahan kepada masyarakat, untuk menjaga kesehatan dengan melakukan upaya menjaga keseimbangkan dalam mengkonsumsi kalori per harinya dan membuat program pola hidup sehat dengan Setiap asupan makanan yang di konsumsi, masyarakat sebaiknya mengetahui bagaimana cara mengolah makanan dan tidak mengkonsumsi makanan secara berlebihan setiap harinya, sehingga makanan yang kita makan tidak mengakibatkan timbulnya berbagai macam penyakit dan obesitas. Dengan dilakukannya penelitian ini diharapkan dapat menjadi informasi bagi pemerintah agar lebih memperhatikan masyarakat dan memberikan fasilitas program pola hidup sehat dengan berolahraga. Perlunya olahraga minimal dua kali seminggu dan aktifitas yang memerlukan pergerakan banyak dapat membuat tubuh menjadi ideal dan seimbang, dan untuk masyarakat yang kekurangan kalori pemerintah dapat memberikan bantuan berupa asupan makanan bergizi dengan kalori yang Maka solusi yang tepat menurut penulis dalam melakukan penelitian ini adalah dengan menggunakan Data Mining Metode K-means untuk mengelompokkan rata-rata konsumsi kalori. Menurut S. Agustina, dkk ( dalam . AoK-Means merupakan suatu algoritma yang digunakan dalam pengelompokkan secara pertisi yang memisahkan data ke dalam kelompok yang berbeda Ae berbeda. Algoritma ini mampu meminimalkan jarak antara data ke clusternyaAo. Diharapkan penelitian ini dapat memberikan kontribusi kepada pemerintah, ahli kesehatan dan masyarakat dalam upaya menentukan rata-rata konsumsi Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik METODOLOGI PENELITIAN Data Mining Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis Data mining mulai ada sejak 1990-an sebagai cara yang benar dan tepat untuk mengambil pola dan informasi yang digunakan untuk menemukan hubungan antara data untuk melakukan pengelompokkan ke dalam satu atau lebih cluster sehingga objek - objek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan lainnya. Data mining merupakan bagian dari proses penemuan pengetahuan dari basis data Knowledge Discovery in . RapidMiner RapidMiner merupakan perangkat lunak yang dibuat oleh Dr. Markus Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari rapid-i. com dengan tampilan GUI (Graphical User Interfac. sehingga memudahkan pengguna dalam menggunakan perangkat lunak ini . Algoritma K-Means K-Means adalah pengelompokan data non hirarki . yang mempartisi data ke dalam bentuk dua atau lebih kelompok sehingga data yang berkarakteristik sama dimasukkan ke dalam satu kelompok yang sama . Langkah-langkah melakukan clustering dengan metode K-Means penjelasannya adalah sebagai berikut . Algoritma k-means menerima inputan dari pengguna berupa nilai jumlah klaster sebanyak k klaster, dan suatu dataset yang ingin dikelompokkan. Sebanyak k data dipilih secara random dari suatu dataset yang kemudian ditentukan sebagai initial centroid. Ulang langkah 4, 5 dan 6 hingga tidak ada lagi objek yang berubah di dalam suatu klaster. Hitung jarak masing-masing titik objek data ke masing-masing intial centroid. Mengalokasikan masing-masing titik data ke dalam klaster dengan jarak paling minimum. Menghitung rata-rata dari semua data yang terdapat di dalam klaster tersebut sebagai pusat klaster baru. HASIL DAN PEMBAHASAN Data yang digunakan untuk penelitian ini yaitu data rata-rata konsumsi kalori menurut provinsi mulai dari tahun 2007- 2018 dan data ini di peroleh dari BPS (Badan Pusat Statistik. Perangkat lunak yang digunakan sebagai alat pengujinya yaitu Rapidminer 5. 3 untuk menyajikan cluster terendah dan tertinggi yang paling produktif. Data yang diperoleh di Menentukkan jumlah data yang akan di cluster, dimana sampel data jumlah rata-rata konsumsi kalori yang kan digunakan dalam proses clustering adalah data jumlah yang terdapat pada Badan Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Pusat Statistik pada tahun 2007 sampai 2018 dengan jumlah data sebanyak 34 Berikut adalah beberapa cara untuk mencari nilai rata-rata. R1 = . 0,02 2080,83 2010,37 2075,79 1962,62 1869,93 1823,36 1794,04 1989,61 2021,08 2115,09 2101,. /12 = 2004,53 R2 = . 9,52 2074,76 1921,70 1970,81 1993,59 1892,36 1848,80 1883,81 2010,98 1999,99 2133,84 2184,. /12 = 1998,76 Sampai R34 dan berikut hasil dari nilai rata-rata untuk cluster pertama: transformasikan ke format data Microsoft excel 2010. Kumpulan data sebagai data masukkan dalam membuat model aturan algoritma Clustering K-Means menggunakan aplikasi Rapidminer. Pengolahan Data Manual K-means Untuk mendapatkan hasil dari penelitian yang dilakukan, berikut uraian perhitungan manual proses clustering dilakukan mulai dari penentuan data yang ingin di cluster. Dalam hal ini variabel data yang ingin di cluster adalah data dari tahun 2007 sampai 2018 dan disini peneliti mengambil nilai rata-rata dari tahun 2007 sampai 2018 sebagai data yang akan di cluster. Berikut adalah langkahlangkah penyelesaian yang dilakukan penulis dalam mengelompakkan rata-rata konsumsi kalori menurut provinsi menggunakan algoritma K-means. Tabel 1. Rata-rata Konsumsi Kalori Nama Nilai Rata-Rata Aceh 2004,53 Sumatera Utara 1998,76 Sumatera Barat 2075,46 Riau 2001,57 Jambi 1962,46 Sumatera Selatan 2023,63 Bengkulu 2021,29 Lampung 1977,69 Kepulauan Bangka Belitung 1966,93 Papua 1831,95 Pada tahap ini penulis menetapkan nilai k ada sebanyak 2 . cluster yang akan diterapkan dalam perhitungan manual K-means yaitu cluster tinggi . dan rendah . supaya dapat menjadi kontribusi kepada pemerintah Indonesia untuk memperhatikan jumlah provinsi yang mengkonsumsi kalori agar tidak meningkat di tahun-tahun berikutnya. Menentukan nilai centroid . usat cluste. awal yang telah ditentukan secara random berdasarkan nilai variabel data yang di cluster sebanyak yang ditentukan sebelumnya. Adapun cluster tertinggi di peroleh dari nilai dan cluster rendah diambil dari nilai terkecil pada tabel 2. Cara mencari nilai centroid data awal untuk iterasi 1 adalah dengan mencari nilai tertinggi dari nilai rata-rata seperti contoh dibawah ini: Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik 2004,53/1998,76/2075,46/2001,57/1962,46/2023,63/2021,29/ 1977,69/1966,93/2020,61/1950,29/2011,52/1921,56/1950,21/1932, 06/2044,12/2182,63/2048,68/1894,85/1930,01/2060,30/2098,41/18 34,52/1875,67/2032,60/1987,71/2047,42/1990,46/1936,70/1989,29 /1836,66/1773,51/1816,21/1831,95 = 2182,63 2004,53/1998,76/2075,46/2001,57/1962,46/2023,63/2021,29/ 1977,69/1966,93/2020,61/1950,29/2011,52/1921,56/1950,21/1932, 06/2044,12/2182,63/2048,68/1894,85/1930,01/2060,30/2098,41/18 34,52/1875,67/2032,60/1987,71/2047,42/1990,46/1936,70/1989,29 /1836,66/1773,51/1816,21/1831,95 = 1773,51 Adapun hasil dari data centroid data awal seperti tabel di bawah ini. Tabel 2. Centroid Data Awal (Iterasi . Cluster Nilai Tinggi (Max/C. 2182,63 Rendah (Min/C. 1773,51 . Menghitung jarak setiap data rata-rata konsumsi kalori terhadap pusat Setelah nilai pusat cluster awal ditentukan, maka langkah selanjutnya adalah menghitung jarak masing-masing data terhadap pusat cluster dengan menggunakan rumus yang perhitungannya dapat kita lihat sebagai berikut: 2 = 178,11 D(C1. Dan seterusnya Sampai D(C1. setelah itu lanjut ke centroid cluster ke dua seperti berikut ini. 2 = 231,01 D(C2. Dan seterusnya Sampai D(C2. Berikut tabel iterasi 1 dapat dilihat pada tabel 4. 3 dibawah ini: Tabel 3. Iterasi 1 Rata-rata Konsumsi Kalori Nama Nilai Rata-Rata Aceh 2004,53 Sumatera Utara 1998,76 Sumatera Barat 2075,46 Riau 2001,57 Jambi 1962,46 Sumatera Selatan 2023,63 Bengkulu 2021,29 Lampung 1977,69 Kepulauan Bangka Belitung 1966,93 Papua 1831,95 178,11 183,87 107,17 181,07 220,17 159,00 161,34 204,95 215,71 350,68 231,01 225,25 301,95 228,05 188,95 250,12 247,78 204,17 193,41 58,44 Setelah menghitung centroid cluster C1 dan C2 maka dapatlah hasil pengelompokkan jarak terpendek berdasarkan centroid pada iterasi 1 dengan Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik menggunakan rumus pada Ms. Excel = MIN(C1. dapat kita lihat pada tabel 4 berikut ini: Tabel 4. Jarak Centroid Iterasi 1 No Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 2023,63 2021,29 1977,69 1966,93 1831,95 178,11 183,87 107,17 181,07 220,17 159,00 161,34 204,95 215,71 350,68 Jarak Terpendek Hasil 231,01 178,11 225,25 183,87 301,95 107,17 228,05 181,07 188,95 188,95 250,12 159,00 247,78 161,34 204,17 204,17 193,41 193,41 58,44 58,44 Dalam menentukan posisi cluster dari tabel 4. 4 diatas, dapat dilakukan dengan melihat pernyataan berikut. Aujika jarak terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C1 diberi nilai 1Ay dan jika jarak terpendek berada di kolom C2 maka pada tabel posisi cluster, kolom C2 diberi nilai 1Ay. Nilai 1 hanya untuk simbolis atau pertanda bahwa pada kolom tersebut terdapat nilai jarak terpendek mewakili kolom tersebut. Berikut adalah tebel posisi cluster pada iterasi 1: Tabel 5. Posisi cluster pada Iterasi 1 No Jarak Terpendek Hasil C1 C2 178,11 183,87 107,17 181,07 188,95 159,00 161,34 204,17 193,41 58,44 Maka diperolehlah hasil dari posisi cluster 1 pada C1 berjumlah 19 data dan posisi cluster 1 pada C2 berjumlah 15 data. Dapat dilihat provinsi mana saja yang masuk pada C1 dan C2 pada tabel 6 berikut: Cluster Tabel 6. Hasil Iterasi 1 Provinsi Hasil 1,2,3,4,6,7,8,10,12,16,17,18,21,22,25,26,27,28,30 19 Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik 5,9,11,13,14,15,19,20,23,24,29,31,32,33,34 . Jika nilai centroid hasil iterasi dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah optimal serta posisi cluster data rata-rata konsumsi kalori tidak mengalami perubahan lagi maka proses iterasi berhenti. Namun jika nilai centroid tidak sama atau belum optimal serta posisi data rata-rata konsumsi kalori masih berubah maka proses iterasi masih akan berlanjut pada iterasi berikutnya sampai nilai centroidnya . Karena pada iterasi 1 nilai centroid tidak bernilai sama maka akan dilanjutkan pada iterasi ke 2 dan seterusnya hingga centriodnya bernilai sama. Untuk menghitung Iterasi ke-2, dapat dilakukan menggunakan cara yang sama pada Iterasi ke-1 yaitu sebagai berikut: Pada Iterasi ke-2 yaitu menghitung jarak antara rata-rata dengan nilai k centroid pusat yang telah ditentukan, akan tetapi nilai k centroid iterasi 1 dan 2 berbeda, nilai k centroid pada itersi 2 di peroleh dengan menambah ratarata hasil iterasi 1 dengan jumlah hasil pada iterasi 1 sebagai berikut: C1=. 4,53 1998,76 2075,46 2001,57 2023,63 2021,29 1977,69 2020, 61 2011,52 2044,12 2182,63 2048,68 2060,30 2098,41 2032,60 1987, 71 2047,42 1990,46 1989,. /19 = 2032,46 C2=1962,46 1966,93 1950,29 1921,56 1950,21 1932,06 1894,85 1930, 01 1834,52 1875,67 936,70 1836,66 1773,51 1816,21 1831,. /15 = 1894,24 Kemudian menghitung jarak antara rata-rata dengan nilai k centroid dengan menggunakan rumus perhitungan sebagai berikut: 2 = 27,93 D(C1. Dan seterusnya Sampai D(C1. setelah itu lanjut ke centroid cluster ke dua seperti berikut ini. 2 = 110,29 D(C2. Dan seterusnya Sampai D(C2. Berikut tabel iterasi 2 dapat dilihat pada tabel 7 dibawah ini: Tabel 7. Iterasi 2 Rata-rata Konsumsi Kalori Nama Aceh Sumatera Utara Sumatera Barat Riau Jambi Sumatera Selatan Bengkulu Lampung Kepulauan Bangka Belitung Kepulauan Riau Papua Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 2023,63 2021,29 1977,69 1966,93 2020,61 1831,95 27,93 33,70 43,00 30,89 70,00 8,82 11,16 54,77 65,53 11,85 200,50 110,29 104,52 181,22 107,33 68,22 129,39 127,05 83,45 72,69 126,37 62,28 Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik . Setelah menghitung centroid cluster C1 dan C2 maka dapatlah hasil pengelompokkan jarak terpendek berdasarkan centroid pada iterasi 2 dengan menggunakan rumus pada Ms. Excel = MIN(C1. dapat kita lihat pada tabel 8 berikut ini: Tabel 8. Jarak Centroid Iterasi 2 No Nilai Rata-Rata C1 Jarak Terpendek Hasil 2004,53 27,93 110,29 27,93 1998,76 33,70 104,52 33,70 2075,46 43,00 181,22 43,00 2001,57 30,89 107,33 30,89 1962,46 70,00 68,22 68,22 2023,63 8,82 129,39 8,82 2021,29 11,16 127,05 11,16 1977,69 54,77 83,45 54,77 1966,93 65,53 72,69 65,53 10 2020,61 11,85 126,37 11,85 34 1831,95 200,50 62,28 62,28 Dalam menentukan posisi cluster dari tabel 4. 8 diatas, dapat dilakukan dengan melihat pernyataan berikut. Aujika jarak terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C1 diberi nilai 1Ay dan jika jarak terpendek berada di kolom C2 maka pada tabel posisi cluster, kolom C2 diberi nilai 1Ay. Nilai 1 hanya untuk simbolis atau pertanda bahwa pada kolom tersebut terdapat nilai jarak terpendek mewakili kolom tersebut. Berikut adalah tebel posisi cluster pada iterasi 2: Tabel 9. Posisi cluster pada Iterasi 2 Jarak Terpendek 27,93 33,70 43,00 30,89 68,22 8,82 11,16 54,77 65,53 11,85 62,28 Hasil C1 C2 Maka diperolehlah hasil dari posisi cluster pada C1 berjumlah 20 data dan posisi cluster 1 pada C2 berjumlah 14 data. Dapat dilihat provinsi mana saja yang masuk pada C1 dan C2 pada tabel 4. 10 berikut: Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Tabel 10. Hasil Iterasi 2 Cluster Provinsi Hasil 1,2,3,4,6,7,8,9,10,12,16,17,18,21,22,25,26,27,28,30 20 5,11,13,14,15,19,20,23,24,29,31,32,33,34 Jika nilai centroid hasil iterasi dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah optimal serta posisi cluster data rata-rata konsumsi kalori tidak mengalami perubahan lagi maka proses iterasi Namun jika nilai centroid tidak sama atau belum optimal serta posisi data rata-rata konsumsi kalori masih berubah maka proses iterasi masih akan berlanjut pada iterasi berikutnya sampai nilai centroidnya . Karena pada iterasi 1 dan 2 nilai centroid tidak bernilai sama maka akan dilanjutkan pada iterasi ke 3 dan seterusnya hingga centriodnya bernilai sama. Untuk menghitung Iterasi ke-3, dapat dilakukan menggunakan cara yang sama pada Iterasi ke 1 dan 2 yaitu sebagai berikut: Pada iterasi ke-3 yaitu menghitung jarak antara rata-rata dengan nilai k centroid pusat yang telah ditentukan, nilai k centroid iterasi 1 dan 2 berbeda, tetapi nilai k centroid iterasi 2 dan 3 sama. nilai k centroid pada iterasi 2 dan 3 di peroleh dengan menambah rata-rata hasil iterasi 1 dengan jumlah hasil pada iterasi 2 sebagai berikut: C1=. 4,53 1998,76 2075,46 2001,57 2023,63 2021,29 1977,69 1966, 93 2020,61 2011,52 2044,12 2182,63 2048,68 2060,30 2098,41 2032, 60 1987,71 2047,42 1990,46 1989,. /20 = 2029,18 C2=1962,46 1950,29 1921,56 1950,21 1932,06 1894,85 1930,01 1834, 52 1875,67 936,70 1836,66 1773,51 1816,21 1831,. /14 = 1889,05 Kemudian menghitung jarak antara rata-rata dengan nilai k centroid dengan menggunakan rumus perhitungan sebagai berikut: 2 = 224,65 D(C1. Dan seterusnya Sampai D(C1. setelah itu lanjut ke centroid cluster ke dua seperti berikut ini. 2 = 115,48 D(C2. Dan seterusnya Sampai D(C2. Berikut tabel iterasi 3 dapat dilihat pada tabel 11 dibawah ini: Tabel 11. Iterasi 3 Rata-rata Konsumsi Kalori Nama Aceh Sumatera Utara Sumatera Barat Riau Jambi Papua Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 1831,95 27,93 33,70 43,00 30,89 70,00 200,50 110,29 104,52 181,22 107,33 68,22 62,28 Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik . Setelah menghitung centroid cluster C1 dan C2 maka dapatlah hasil pengelompokkan jarak terpendek berdasarkan centroid pada iterasi 3 dengan menggunakan rumus pada Ms. Excel = MIN(C1. dapat kita lihat pada tabel 12 berikut ini: Tabel 12. Jarak Centroid Iterasi 3 Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 1831,95 24,65 30,42 46,28 27,61 66,72 197,23 115,48 109,71 186,42 112,52 73,41 57,09 Jarak Terpendek 24,65 30,42 46,28 27,61 66,72 57,09 Hasil . Dalam menentukan posisi cluster dari tabel 12 diatas, dapat dilakukan dengan melihat pernyataan berikut. Aujika jarak terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C1 diberi nilai 1Ay dan jika jarak terpendek berada di kolom C2 maka pada tabel posisi cluster, kolom C2 diberi nilai 1Ay. Nilai 1 hanya untuk simbolis atau pertanda bahwa pada kolom tersebut terdapat nilai jarak terpendek mewakili kolom tersebut. Berikut adalah tebel posisi cluster pada iterasi 3: Tabel 13. Posisi cluster pada Iterasi 3 No Jarak Terpendek Hasil C1 C2 24,65 30,42 46,28 27,61 66,72 34 57,09 Maka diperolehlah hasil dari posisi cluster pada C1 berjumlah 21 data dan posisi cluster 1 pada C2 berjumlah 13 data. Dapat dilihat provinsi mana saja yang masuk pada C1 dan C2 pada tabel 14 berikut: Tabel 14. Hasil Iterasi 3 Cluster Provinsi Hasil 1,2,3,4,5,6,7,8,9,10,12,16,17,18,21,22,25,26,27,28,30 21 11,13,14,15,19,20,23,24,29,31,32,33,34 Jika nilai centroid hasil iterasi dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah optimal serta posisi cluster data rata-rata Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik konsumsi kalori tidak mengalami perubahan lagi maka proses iterasi Namun jika nilai centroid tidak sama atau belum optimal serta posisi data rata-rata konsumsi kalori masih berubah maka proses iterasi masih akan berlanjut pada iterasi berikutnya sampai nilai centroidnya . Karena pada iterasi 1, 2 dan 3 nilai centroid tidak bernilai sama maka akan dilanjutkan pada iterasi ke 4 dan seterusnya hingga centriodnya bernilai sama. Untuk menghitung Iterasi ke-4, dapat dilakukan menggunakan cara yang sama pada Iterasi ke 1, 2 dan 3 yaitu sebagai berikut: Pada Iterasi ke-4 yaitu menghitung jarak antara rata-rata dengan nilai k centroid pusat yang telah ditentukan, nilai k centroid iterasi 1 dan 2, 3 berbeda, tetapi nilai k centroid iterasi 2, 3 dan 4 sama. nilai k centroid pada iterasi 2, 3 dan 4 di peroleh dengan menambah rata-rata hasil iterasi 1 dengan jumlah hasil pada iterasi 3 sebagai berikut: C1=. 4,53 1998,76 2075,46 2001,57 1962,46 2023,63 2021,29 1977, 69 1966,93 2020,61 2011,52 2044,12 2182,63 2048,68 2060,30 2098, 41 2032,60 1987,71 2047,42 1990,46 1989,. /21 = 2026,00 C2=1950,29 1921,56 1950,21 1932,06 1894,85 1930,01 1834,52 1875, 67 936,70 1836,66 1773,51 1816,21 1831,. /13 = 1883,40 Kemudian menghitung jarak antara rata-rata dengan nilai k centroid dengan menggunakan rumus perhitungan sebagai berikut: 2 = 21,48 D(C1. Dan seterusnya Sampai D(C1. setelah itu lanjut ke centroid cluster ke dua seperti berikut ini. 2 = 121,13 D(C2. Dan seterusnya Sampai D(C2. Berikut tabel iterasi 4 dapat dilihat pada tabel 15 dibawah ini: Tabel 15. Iterasi 4 Rata-rata Konsumsi Kalori Nama Aceh Sumatera Utara Sumatera Barat Riau Jambi Papua Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 1831,95 21,48 27,24 49,46 24,44 63,54 194,05 121,13 115,36 192,06 118,17 79,06 51,44 Setelah menghitung centroid cluster C1 dan C2 maka dapatlah hasil pengelompokkan jarak terpendek berdasarkan centroid pada iterasi 4 dengan menggunakan rumus pada Ms. Excel = MIN(C1. dapat kita lihat pada tabel 16 berikut ini: Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Tabel 16. Jarak Centroid Iterasi 4 Nilai Rata-Rata 2004,53 1998,76 2075,46 2001,57 1962,46 1831,95 21,48 27,24 49,46 24,44 63,54 194,05 121,13 115,36 192,06 118,17 79,06 51,44 Jarak Terpendek 21,48 27,24 49,46 24,44 63,54 51,44 Hasil . Dalam menentukan posisi cluster dari tabel 4. 16 diatas, dapat dilakukan dengan melihat pernyataan berikut. Aujika jarak terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C1 diberi nilai 1Ay dan jika jarak terpendek berada di kolom C2 maka pada tabel posisi cluster, kolom C2 diberi nilai 1Ay. Nilai 1 hanya untuk simbolis atau pertanda bahwa pada kolom tersebut terdapat nilai jarak terpendek mewakili kolom tersebut. Berikut adalah tebel posisi cluster pada iterasi 4: Tabel 17. Posisi cluster pada Iterasi 4 No Jarak Terpendek Hasil C1 C2 21,48 27,24 49,46 24,44 63,54 59,08 51,44 Maka diperolehlah hasil dari posisi cluster pada C1 berjumlah 21 data dan posisi cluster 1 pada C2 berjumlah 13 data. Dapat dilihat provinsi mana saja yang masuk pada C1 dan C2 pada tabel 18 berikut: Cluster Tabel 18 . Hasil Iterasi 4 Provinsi Hasil 1,2,3,4,5,6,7,8,9,10,12,16,17,18,21,22,25,26,27,28,30 21 11,13,14,15,19,20,23,24,29,31,32,33,34 Proses perhitungan K-means berhenti pada iterasi ke-4, karena pada iterasi ke-4 sama dengan hasil iterasi sebelumnya yaitu iterasi ke-3. Diperoleh hasil dari posisi cluster 4 adalah C1 berjumlah 21 data dan C2 berjumlah 13 data, maka proses perhitungan tidak mengalami perubahan lagi sehingga proses iterasi berhenti. Penerapan K-Means Dalam Mengelompokkan Rata-Rata Konsumsi Kalori (Juwitha Lovely Sweets Sinag. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK) Volume 6 Nomor 1 Februari, pp 75-88 ISSN: 2527-5771/EISSN: 2549-7839 https://tunasbangsa. id/ejurnal/index. php/jurasik Hasil Percobaan Pengujian yang dilakukan penulis menggunakan Rapidminer 5. 3 sehingga dapat diketahui provinsi mana yang masuk kedalam cluster tinggi dan cluster Hasil pengelompokkan dua cluster pada tahap keluaran dapat dilihat dengan mengklik Cluster Model (Clusterin. pada toolbar. Berikut adalah tampilan hasil cluster model: Gambar 5. Nilai cluster Modal Rapidminer SIMPULAN Dari hasil pembahasan sebelumnya kesimpulan yang didapat adalah sebagai berikut: Teknik penerapan data mining menggunakan algoritma k-means dapat diterapkan dalam meng-cluster jumlah provinsi rata-rata konsumsi kalori mulai tahun 2007 sampai dengan 2018. Data yang sebelumnya diolah dalam perhitungan metode K-means clustering telah dilakukan pengujian menggunakan software Rapidminer versi 5. Sebagai pembuktian bahwa hasil dari software Rapidminer sama dengan hasil perhitungan manual pada metode K-means Clustering dan hasil yang diperoleh dalam meng-cluster data rata-rata konsumsi menurut provinsi yang digunakan adalah valid. Jumlah cluster 0 (Renda. berjumlah 13 items yaitu provinsi DKI Jakarta. Jawa Tengah. DI Yogyakarta. Jawa Timur. Nusa Tenggara Timur. Kalimantan Barat. Kalimantan Timur. Kalimantan Utara1. Gorontalo. Maluku. Maluku Utara. Papua Barat. Papua, . Jumlah cluster 1 (Tingg. berjumlah 21 items yaitu provinsi Aceh. Sumatera Utara. Sumatera Barat. Riau. Jambi. Sumatera Selatan. Bengkulu. Lampung. Kepulauan Bangka Belitung. Kepulauan Riau. Jawa Barat. Banten. Bali. Nusa Tenggara Barat. Kalimantan Tengah, kalimantan Selatan. Sulawesi Utara. Sulawesi Tengah. Sulawesi Selatan. Sulawesi Tenggara. Sulawesi Barat. DAFTAR PUSTAKA