Jurnal Teknologi Informasi dan Komunikasi. ISSN : 2087-0868. Volume 11. Nomor 2. September 2020. ANALISA DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY ANALISIS DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY Ahmad Rifqy Syarwani1. Erizkika Mochammad Arsy Rofi2. Nur Aini Rakhmawati33 1,2,3 Departemen Sistem Informasi. Fakultas Teknologi Elektro dan Informatika Cerdas. Institut Teknologi Sepuluh Nopember. Surabaya 17052@mhs. id, 2erizkika. 17052@mhs. id, 3nur. aini@is. Abstrak Indonesia adalah negara demokrasi yang memiliki partai politik untuk merepresentasikan suara rakyat. Politikus mendapatkan jabatan pemerintahan melalui afiliasi partai politik. Suara partai politik dapat mempengaruhi partai lain dan sistem politik secara keseluruhan. Karenanya, pengukuran pengaruh partai politik dilakukan untuk mengetahui dampak pada sistem pemerintahan. Menggunakan algoritma harmonic centrality untuk mengukur pengaruh suatu partai atau politikus yang difasilitasi oleh Node2Vec. Hasil analisa menunjukkan terdapat partai yang memiliki pengaruh terbesar pada Namun graph memiliki density yang cukup rendah dikarenakan keterbatasan data. Kata kunci : harmonic centrality, node2vec, politikus, analisa graf Abstract Indonesia is a democratic country with political party acting as people voices. Politician acquire governmental position through affiliation with a political party. The political party voices can influence other parties and the whole political system. Hence, measuring the influence of a political party is done to determine the impact in the government system. Using harmonic centrality algorithm to measure the influence of a political party or politician which facilitated by Node2Vec. Analysis results shows that there is a political party that has the most influence in the government. However the graph has quite low density due to data limitation. Keywords: harmonic centrality, node2vec, politician, graph analysis Pendahuluan Indonesia merupakan negara dengan sistem politik demokrasi. Pada sistem tersebut terdapat partai politik yang merupakan kelompok terorganisir yang memiliki orientasi, nilai-nilai dan cita-cita yang sama dan dapat dipilih oleh rakyat pada pemilihan umum (Kadir, 2. Politikus dapat memiliki jabatan/kursi dalam suatu pemerintahan dikarenakan dipilih oleh rakyat melalui afiliasi partai politik. Sebagai suatu sistem pemerintahan yang kompleks dan dinamis, sikap dan keputusan suatu partai politik dapat mempengaruhi satu sama lain dan dapat berdampak pada sistem politik secara langsung. Kekuatan suatu partai politik perlu diidentifikasi untuk mengetahui partai politik mana yang memiliki pengaruh besar terhadap partai lainnya. Partai dengan kekuatan besar memiliki pengaruh untuk membentuk koalisi yang akan diikuti oleh partaipartai lainnya. Konsep centrality sering digunakan untuk mencari peran dan pengaruh dari suatu node dalam suatu jaringan. Harmonic centrality adalah konsep centrality dengan menghitung menggunakan harmonic mean (Marchiori & Latora, 2. Penerapan konsep harmonic centrality digambarkan pertama kali oleh (Rochat, 2. , harmonic centrality memiliki hubungan dekat dengan closeness centrality namun dengan keunggulan dapat menyelesaikan kemungkinan jarak tak terbatas dengan tepat. Analisa sentralitas aktor dalam konteks politik dilakukan (Sugiarta, et al. , 2. untuk mengetahui aktor yang paling berpengaruh pada komunikasi Penelitian yang dilakukan (Rochat, 2. mengemukakan perbedaan antara closeness dengan harmonic centrality sehingga harmonic centrality dinilai lebih layak untuk diterapkan pada kasus dunia nyata. Penelitian lain dilakukan oleh (Boldi & Vigna, 2. untuk mengoptimasi nilai centrality menggunakan HyperBall yang dapat mengurangi penggunaan memori secara drastis. Algoritma yang dikemukakan (Putman, et al. , 2. dapat mempercepat perhitungan centrality hingga 33 kali pada dataset directed dan weighted. (R. , et al. Membuat model machine learning agar dapat memprediksi nilai centrality agar mengurangi beban Tujuan penelitian ini dilakukan adalah untuk mengetahui partai politik yang memiliki pengaruh besar terhadap sistem pemerintahan di Indonesia selama ini berdasarkan data dari DBPedia Indonesian. Selain itu dilakukan analisa kedekatan antara partai politik dan politikus melalui Jurnal Teknologi Informasi dan Komunikasi. ISSN : 2087-0868. Volume 11. Nomor 2. September 2020. ANALISA DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY pendekatan graf menggunakan algoritma harmonic ditetapkan algoritma harmonic centrality sebagai berikut (Boldi & Vigna, 2. Dasar Teori . SPARQL SPARQL merupakan serangkain spesifikasi yang menyediakan bahasa dan protokol standar untuk melakukan query dan manipulasi data graf RDF. Sebagai bahasa query untuk RDF. SPARQL dapat mengambil data yang disimpan pada SPARQL service yang merupakan HTTP service endpoint yang dapat menjalankan SPARQL queries. Query yang dapat dijalankan terdiri dari query standar hingga kompleks seperti union, optional query parts, filters dan fitur baru yang ditambahkan di SPARQL 1. 1 yaitu value aggregation, path expression, nested queries, dan sebagainya. Hasil dari SELECT queries di SPARQL terdiri dari pemetaan antara varibel dan RDF terms yang biasa divisualisasikan dalam bentuk tabel. Perihal untuk mengubahnya dalam bentuk yang dapat dengan mudah dibaca oleh mesin. SPARQL mendukung perubahan hasil format ke bentuk umum lainnya, yaitu Extensible Markup Language (XML). JavaScript Object Notation (JSON). Comma Separated Values (CSV), dan Tab Separated Values (TSV) (W3C, 2. Metodologi Penelitian Gambar 1 menunjukkan diagram metodologi yang akan digunakan. Node2Vec Node2Vec merupakan algoritma semisupervised yang digunakan untuk pembelajaran fitur yang terukur pada sebuah jaringan. Pendekatan algoritma ini adalah mengembalikan representasi fitur yang memaksimalkan probabilitas dalam mempertahankan kedekatan jaringan nodes dalam sebuah d-dimensional ruang fitur. (Grover & Leskovec, 2. Algoritma Node2Vec mempelajari secara kontinu representasi untuk nodes pada undirected dan unweighted graf. Hasil representasi dari nodes pada graf nantinya dapat digunakan untuk berbagai pekerjaan machine learning (Leskovec. Algoritma Harmonic Centrality Konsep harmonic centrality diusulkan oleh (Marchiori & Latora, 2. dengan menggunakan harmonic mean untuk mendapatkan jarak konektivitas sebuah graph. Algoritma harmonic centrality dikembangkan untuk menyelesaikan permasalahan jarak antar nodes yang tidak terhubung, karenanya jarak bernilai O. Harmonic centrality dapat menangani kasus ini dengan cara mensubstitusi nilai O dengan O-1, sehingga Gambar 1. Diagram Metodologi Query SPARQL Query dilakukan pada situs aplikasi SPARQL DBpedia Indonesian org/sparql ditunjukkan pada gambar 2. SELECT DISTINCT ?Politikus, ?Partai WHERE { { ?p dbpedia-owl:knownFor . UNION { ?p dbpedia-owl:occupation . UNION { ?p dbpedia-owl:profession . ?p rdfs:label ?Politikus . ?p dbpedia-owl:party ?q . ?q rdfs:label ?Partai . Gambar 2. Sintaks Query Jurnal Teknologi Informasi dan Komunikasi. ISSN : 2087-0868. Volume 11. Nomor 2. September 2020. ANALISA DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY Data yang didapat lalu dilakukan penyeragaman dan penghapusan data politikus pada partai dari luar negeri atau yang sudah tidak aktif beroperasi. Tabel 1 menunjukkan cuplikan hasil query yang didapatkan dengan jumlah data sebanyak 27 baris (Syarwani, 2. Tabel 1. Hasil Query Politikus Prabowo Subianto Fadli Zon Suhardi Marzuki Alie Alex Noerdin Haeny Relawati Rini Widyastuti Ason Sukasa Syahrial Oesman Hatta Rajasa Agus Hamdani Partai Partai Gerindra Partai Gerindra Partai Gerindra Partai Demokrat Partai Golongan Karya Untuk visulasi digunakan tools t-SNE dan Matplotlib. t-SNE dapat memvisualisasikan highdimensional data dengan memberikan masingmasing datapoin sebuah lokasi pada two atau threedimensional map. Hasil yang dihasilkan t-SNE memiliki visualisasi lebih baik apabila dibandingkan dengan teknik serupa lainnya karena hasilnya yang mengurangi kecenderungan untuk menumpuk datapoin ditengah . an der Maaten & Hinton, 2. Matplotlib adalah library pada bahasa Python untuk membuat berbagai macam jenis visualisasi (Matplotlib, 2. Hasil dan Pembahasan Dari data csv yang didapatkan dilakukan perubahan dari bentuk graf kedalam bentuk vektor dengan Node2Vec. Partai Golongan Karya Partai Golongan Karya PDI Perjuangan Partai Amanat Nasional Partai Persatuan Pembangunan Pemodelan Graph Graph model menghubungkan antara seorang politikus dengan partai tempat dia bekerja atau pernah bekerja seperti yang direpresentasikan oleh Relasi yang digunakan adalah pekerjaan. Gambar 3. Node dan Relasi Graf Menjalankan Node2Vec Parameter yang digunakan pada penggunaan Node2Vec adalah sebagai berikut. Dimensions berisi nilai 20, walk_length bernilai 16, num_walks bernilai 100, dan workers bernilai 2. Menjalankan Algoritma Harmonic Centrality Parameter yang digunakan dalam menjalankan algoritma harmonic centralitiy yaitu undirected graph dan unweighted graph. Visualisasi Gambar 4. Visualisasi t-SNE Gambar 4 merupakan visualisasi t-SNE yang menunjukkan daftar politikus dan dikelompokkan berdasarkan hubungan kedekatan dengan partai Perbedaan warna pada politikus yang direpresentasikan sebagai datapoin pada dua dimensi menunjukkan politikus tersebut memiliki kelompok partai yang berbeda. Politikus dengan partai yang sama akan terletak berdekatan dan berwarna sama. Dengan t-SNE, data yang direpresentasikan berupa vektor dengan dimensi tinggi dapat dikelompokkan dalam bentuk visualisasi dua dimensi yang mudah dipahami. Apabila dilihat pada gambar 4 terlihat bahwa kelompok partai dengan datapoin paling banyak yaitu Partai Golongan Jurnal Teknologi Informasi dan Komunikasi. ISSN : 2087-0868. Volume 11. Nomor 2. September 2020. ANALISA DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY Karya dan apabila diperhatikan kelompok Partai Golongan Karya berdekatan dengan kelompok Partai Keadilan Sejahtera dikarenakan kedua kelompok tersebut memiliki kemiripan yang sama dan masih terhubung melalui node politikus Syamsul Arifin yang pernah terafiliasi dengan kedua partai tersebut. menunjukkan bahwa Partai Golongan Karya merupakan partai yang populer dan memiliki pengaruh besar dengan banyaknya politikus yang terhubung dengan node tersebut berdasarkan data dari DBpedia Indonesian pada halaman politikus. Besarnya pengaruh yang dimiliki Partai Golongan Karya dengan politikus yang banyak terafiliasi dengan mereka dan partai lainnya. Hal ini menunjukkan Partai Golongan Karya memiliki kekuatan yang besar untuk menyebarkan pesan mempengaruhi partai-partai lainnya. Sebaliknya partai-partai dengan nilai centrality yang rendah seperti Partai Amanat Nasional yang hanya terhubung dengan satu node saja, memiliki pengaruh yang kecil dan keputusan politiknya tidak banyak berpengaruh terhadap partai dan politikus lainnya. Berikut lima node dengan nilai centrality terbesar yang ditunjukkan pada tabel 2. Tabel 2. Nilai Centrality No. Gambar 5. Hasil Visualisasi Algoritma Harmonic Centrality Gambar 5 merupakan visualisasi algoritma harmonic centrality dari networkx. Visualisasi dilakukan dengan parameter berupa ukuran dan warna yang menyesuaikan dengan nilai harmonic pada suatu node. Semakin besar nilai centrality yang dihasilkan maka akan semakin besar ukuran node dan warna node tersebut akan semakin cerah. Dari visualisasi pada gambar 5 dapat dilihat Partai Golongan Karya memiliki warna dan ukuran yang mencolok apabila dibandingkan dengan node Tingginya nilai centrality yang dihasilkan menunjukkan seberapa penting keberadaan node Partai Golongan Karya yang memiliki banyak relasi hubungan dengan node yang lain. Visulisasi tersebut Node Partai Golongan Karya Syamsul Arifin PDI Perjuangan Alex Noerdin Haeny Relawati Rini Widyastuti Nilai Centrality Graf yang direpresentasikan oleh gambar 4 dan 5 memiliki network density sebesar Hal ini disebabkan oleh banyaknya varian partai yang ada namun dengan sedikit orang yang berada pada partai tersebut. Hasil pengolahan dengan algoritma harmonic centrality menunjukkan terdapat beberapa node yang memiliki pengaruh besar (Tabel . dan Node yang memiliki pengaruh besar diantaranya adalah Partai Golongan Karya. Syamsul Arifin, dan PDI Perjuangan. Asumsi besar kecilnya pengaruh didasari oleh nilai centrality yang dihasilkan oleh algoritma. Semakin besar nilai maka semakin besar pula pengaruhnya, begitu juga Nilai centrality menunjukkan seberapa banyak node tersebut terhubung dengan node yang lainnya sehingga keberadaan mereka dapat mempengaruhi partai atau politikus yang lain. Sedangkan berikut beberapa node yang memiliki pengaruh yang kecil antara lain Hatta Rajasa. Partai Amanat Nasional, dan Agus Hamdani. Kesimpulan Dengan menggunakan algoritma harmonic centrality, data politikus yang didapat dari DBpedia Indonesian partai/politikus yang memiliki kekuatan besar untuk Jurnal Teknologi Informasi dan Komunikasi. ISSN : 2087-0868. Volume 11. Nomor 2. September 2020. ANALISA DATA POLITIKUS MENGGUNAKAN NODE2VEC DAN ALGORITMA HARMONIC CENTRALITY mempengaruhi partai/politikus lain. Hasil yang didapat menunjukkan terdapat partai/politikus dengan nilai sentralitas tertinggi yang terhubung oleh banyak node lainnya yaitu Partai Golongan Karya. Syamsul Arifin dan PDI Perjuangan. Partai Golongan Karya dan PDI Perjuangan memiliki kekuatan yang besar untuk menyebarkan pesan mempengaruhi dan diikuti oleh partai yang lain. Kondisi sistem politik Indonesia selama ini banyak dipengaruhi kedua partai tersebut. Banyak politikus yang menduduki kursi pemerintahan berasal dari kedua partai tersebut. Data memiliki banyak varian partai dengan sedikit orang yang berada pada partai tersebut, hal ini menyebabkan nilai network density Daftar Pustaka: