132
Progresif: Jurnal Ilmiah Komputer Jl.
Ahmad Yani.
33,5 - Kampus STMIK Banjarbaru Loktabat Ae Banjarbaru (Tlp.
, e-mail: puslit.
stmikbjb@gmail.
e-ISSN: 2685-0877 p-ISSN: 0216-3284 Analisis Sentimen Mengenai Penerimaan Calon Pegawai Negeri Sipil Tahun 2024 Menggunakan Support Vector Machine Khairunissabina1*.
Rakhmat Kurniawan2 Ilmu Komputer.
Universitas Islam Negeri Sumatera Utara.
Medan.
Indonesia *e-mail Corresponding Author: khairunissabina0701202158@uinsu.
Abstract The 2024 Civil Servants Candidates (CPNS) recruitment has attracted public attention with various opinions reflecting societal sentiment.
This study applies machine learning and text mining techniques to analyze sentiment based on comments collected from various sources.
The process begins with text preprocessing, including tokenization, stopword removal, and text transformation using TF-IDF.
The Support Vector Machine (SVM) model is used to classify sentiment into positive and negative categories.
The data is divided into training and testing sets to evaluate the model's performance.
Experimental results show that the model achieves an accuracy of 82.
5%, indicating a fairly good performance in recognizing public opinion patterns.
This analysis provides insights into aspects that are appreciated or criticized by the public regarding the 2024 CPNS recruitment.
These findings can be utilized by policymakers to develop more responsive strategies that address public needs and expectations in the CPNS selection process.
Keyword: Machine Learning.
Text Mining.
Civil Servants Candidates.
Support Vector Machine Abstrak Penerimaan Calon Pegawai Negeri Sipil (CPNS) 2024 menarik perhatian publik dengan berbagai opini yang mencerminkan sentimen masyarakat.
Penelitian ini menerapkan machine learning dan teknik text mining untuk menganalisis sentimen berdasarkan komentar yang dikumpulkan dari berbagai sumber.
Proses dimulai dengan pra-pemrosesan teks, termasuk tokenisasi, penghapusan stopwords, serta transformasi teks menggunakan TF-IDF.
Model Support Vector Machine (SVM) digunakan untuk mengklasifikasikan sentimen menjadi positif dan negatif.
Data dibagi menjadi data pelatihan dan pengujian dengan perbandingan 80% data training dan 20% data uji guna mengevaluasi kinerja model.
Hasil eksperimen menunjukkan bahwa model mencapai akurasi 82,5%, menandakan kinerja yang cukup baik dalam mengenali pola opini masyarakat.
Analisis ini memberikan wawasan mengenai aspek yang diapresiasi maupun dikritik oleh publik terkait penerimaan CPNS 2024.
Temuan ini dapat dimanfaatkan oleh pemangku kebijakan untuk merancang strategi yang lebih responsif terhadap kebutuhan dan harapan masyarakat dalam proses seleksi CPNS.
Kata kunci: Machine Learning.
Text Mining.
Calon Pegawai Negeri Sipil.
Support Vector Machine Pendahuluan Pendaftaran Calon Pegawai Negeri Sipil (CPNS) 2024 selalu menyita perhatian sebagian masyarakat, terutama bagi mereka yang memiliki rencana untuk mendaftar.
Seperti tahun-tahun sebelumnya, peminat CPNS pada tahun ini kemungkinan besar akan meningkat Sebelumnya, pemerintah telah mengumumkan akan membuka seleksi CASN dengan 2,3 juta formasi pada 2024.
Formasi yang dibuka terdiri 690 ribu Calon Pegawai Negeri Sipil dan 1,6 juta pegawai pemerintah dengan perjanjian kerja .
K).
Antusiasme masyarakat yang terlihat pada media sosial terkait penerimaan CPNS 2024 ini cukup tinggi, yang pastinya juga menjadi salah satu bahan evaluasi dan pertimbangan pihak pemerintah dan penyelenggara lainnya untuk dapat menyesuaikan dengan kapasitas dan kesiapan dalam melaksanakan penerimaan CPNS 2024 .
Hal inilah yang menjadi acuan Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina Progresif e-ISSN: 2685-0877 peneliti untuk melakukan penelitian ini, dengan demikian proses penerimaan CPNS 2024 akan dapat dilaksanakan dengan baik karena adanya dukungan dari pihak penyelenggara dan Support Vector Machine (SVM) adalah algoritma pembelajaran mesin yang digunakan untuk klasifikasi dan regresi .
Salah satu keunggulan utama SVM adalah kemampuannya menangani data non-linier melalui kernel trick, yang mentransformasikan data ke dimensi lebih tinggi agar dapat dipisahkan secara linier .
Banyak penelitian sebelumnya yang menggunakan metode Support Vector Machine (SVM) untuk klasifikasi sentimen, seperti yang dilakukan oleh Nofandi dengan akurasi 69% menggunakan 550 data .
, dan Santoso Teguh dengan akurasi 94% menggunakan 300 data.
Kedua penelitian ini menggunakan fitur Kernel Trick, yang membantu memetakan data non-linear ke ruang dimensi lebih tinggi untuk mempermudah klasifikasi.
Meskipun menggunakan jumlah data dan fitur yang hampir sama, hasil akurasi kedua penelitian tersebut berbeda signifikan .
Penelitian ini dilakukan guna mengidentifikasi antusiasme masyarakat terhadap pendaftaran CPNS 2024, yang dimana data dari hasil penelitian ini akan menunjukkan data yang berpengaruh dan diperlukan dalam proses evaluasi untuk meningkatkan sistem penerimaan CPNS di masa mendatang.
Tinjauan Pustaka Hasil penelitian yang dilakukan oleh Fajar dan Sugiyono, dengan judul penelitian berupa Analisis Sentimen Masyarakat Terhadap Perekrutan pK Pada Twitter Dengan Metode Naive Bayes Dan Support Vector Machine, guna mencari tahu pendapat rakyat terkait proses perekrutan pK yang dicuitkan pada Twitter.
Algoritma yang diterapkan pada penelitian ini adalah algoritma Nayve Bayes dan Support Vector Machine (SVM), dengan tujuan sebagai variabel dalam melakukan analisis penelitian ini.
Hasil akhir yang diimplementasikan pada metode SVM (Support Vector Machin.
menunjukkan akurasi sebesar 94,80%.
Sedangkan pengujian dengan metode Nayve bayes menunjukkan nilai akurasi sebesar 96,14% .
Sedangkan penelitan yang dilakukan oleh Rahma, dkk, dengan menerapkan metode yang berbeda, dengan judul Analisis Sentimen terhadap Karyawan Dirumahkan pada Media Sosial Twitter menggunakan Fitur N-Gram dan Pembobotan Augmented TF Ae IDF Probability dengan K-Nearest Neighbour.
Dengan menerapkan jarak Manhattan Distance pada pembobotan Augmented TF Ae IDF Probability yang berakurasi senilai 0,6, presicion senilai 0,415, recall senilai 0,404, dan f-measure senilai 0,406 untuk term unigram.
Dan hasil evaluasi terbaik dihasil dengan menggunakan jarak Cosine Distance dengan nilai accuracy 0,776, presicion senilai 0,59 recall senilai 0,408, dan f-measure senilai 0,437 untuk term bigram .
Begitu pula dengan penelitian yang dilakukan oleh Susi dengan judul Analisis Sentimen Cuitan Twitter Pada Proses Seleksi CPNS Menggunakan Algoritma Ensembles Vote, yang dimana metode yang diterapkan dalam penelitian ini jelas berbeda.
Dengan melakukan analisis sentimen cuitan twitter pada proses seleksi CPNS seleksi CPNS 2021, penggunaan algoritma k-Nearest Neighbor .
-NN) akurasinya 61.
90% dengan AUC 0.
912 dibandingkan algoritma Nayve Bayes akurasinya 100.
00% dengan AUC 1.
000, dan untuk algoritma C4.
5 akurasinya 71% dengan AUC 0.
Berbeda dengan penelitian-penelitian tersebut, penelitian yang dilakuan saat ini menggunakan metode Support Vector Machine (SVM) dalam analisis sentimen, yang bertujuan untuk mengklasifikasikan opini masyarakat terkait penerimaan CPNS 2024.
Penggunaan SVM dalam penelitian ini memungkinkan pemisahan antara sentimen positif dan negatif dengan cara menemukan hyperplane yang optimal, sehingga dapat memberikan wawasan yang lebih jelas tentang pandangan masyarakat.
SVM dipilih karena kemampuannya dalam menangani data yang kompleks dan non-linear, serta efektif dalam mengklasifikasikan data berbasis teks, seperti komentar atau tweet yang berhubungan dengan topik CPNS 2024.
Metodologi Dalam penelitian ini, flowchart yang digunakan menggambarkan alur proses analisis sentimen dengan menggunakan metode SVM.
Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina e-ISSN: 2685-0877 Gambar 1 Flowchart Metode SVM Preprocessing Data Data dikumpulkan melalui scrapping Twitter menggunakan kata kunci #CPNS2024 untuk rentang waktu 1 Januari 2024 hingga sekarang.
Sebanyak 800 tweets berhasil dikumpulkan dan diekspor ke format .
xlsx dan terdiri dari 80% data training dan 20% data Setiap tweet diberi label positif atau negatif secara manual untuk menyusun dataset Proses pelabelan ini dilakukan dengan mempertimbangkan konteks dan makna dalam setiap tweet untuk memastikan akurasi data.
Dataset berlabel ini akan digunakan untuk melatih model klasifikasi dalam analisis sentimen, yang nantinya dapat mengidentifikasi sentimen secara otomatis pada data baru dengan tingkat akurasi yang optimal.
Data ini juga akan dianalisis lebih lanjut untuk mengidentifikasi tren opini publik terhadap CPNS 2024.
Tahap preprocessing data meliputi cleaning, case folding, tokenizing, filtering, stopword removal, dan stemming untuk menghasilkan data yang bersih dan terstruktur .
Contoh menghitung manual menggunakan 5 data latih dan 2 data uji disertakan untuk mempermudah pemahaman proses klasifikasi.
Data ini mencakup teks, label pril nt, dan bobot fitur.
Tahap ini bertujuan untuk menggambarkan pril -langkah detail dari preprocessing hingga prediksi nt, yang kemudian akan dibandingkan dengan output sistem untuk memvalidasi akurasi metode SVM.
Tabel 1 Sampel Data Latih Data Latih Negatif Positif Positif Positif Positif @_pegipegi blm kaak pril tuh keknya masih ngurusin cpns 2024 itu sk cpns nya baru pada keluar paling cepet agustus atau sept Penting! 5 Hal yang Wajib Diperhatikan saat Pengisian DRH CPNS 2024 Jangan Sampai Salah https://t.
co/rssFPRyZns berikut Minaru sampaikan Pengumuman Hasil Seleksi Calon Pegawai Negeri Sipil (CPNS) Kementerian ATR/BPN Tahun 2024.
https://t.
co/wdWYqri8lG Seleksi CPNS 2025 Ae Mau dibantu belajar soal CPNS 2025 dengan lebih mudah? Klik lini di bio yaa! Kuota terbatas #cpns2025 https://t.
co/22G2IX2Fla Kelulusan bagi calon pegawai negeri sipil (CPNS) formasi 2024 di lingkungan Pemkab Mojokerto final.
https://t.
co/xpWDlr2HvG #CPNS #NIP #mojokerto Progresif: Vol.
No.
Februari 2025: 132-143 Progresif e-ISSN: 2685-0877 Tabel 2 Sampel Data Uji Data Uji @kempanrb Bgmn untuk yang masuk data P3K yg udah mendaftar CPNS 2024? Mereka sdh tidak bisa ikutan P3K Gel 2? 20 Link Instansi Pusat yang Sudah Umumkan Hasil Akhir CPNS 2024 Salah Satunya Ada KemenPAN RB Ae Ayo Bandung https://t.
co/tPkSPJ8hD9 #link #CPNS .
Cleaning Data Pada tahap cleaning data, elemen-elemen tidak relevan seperti tanda baca, angka.
URL, emotikon, pril , dan karakter non-alfabet dihapus untuk memastikan data pril pada teks utama yang relevan .
Proses ini bertujuan agar analisis selanjutnya, seperti tokenizing dan pembobotan, dapat dilakukan lebih efektif dan menghasilkan output yang lebih akurat .
Tabel 3 Cleaning Komentar Cleaning Data Data Latih @_pegipegi blm kaak pril tuh keknya masih ngurusin cpns 2024 itu sk cpns nya baru pada keluar paling cepet agustus atau sept Penting! 5 Hal yang Wajib Diperhatikan saat Pengisian DRH CPNS 2024 Jangan Sampai Salah https://t.
co/rssFPRyZns A Kelulusan bagi calon pegawai negeri sipil (CPNS) formasi 2024 di lingkungan Pemkab Mojokerto final.
https://t.
co/xpWDlr2HvG #CPNS #NIP #mojokerto Blm Kaak April Tuh Keknya Masih Ngurusin Cpns Itu Sk Cpns Nya Baru Pada Keluar Paling Cepet Agustus Atau Sept Penting Hal Yang Wajib Diperhatikan Saat Pengisian Drh Cpns Jangan Sampai Salah A Kelulusan Bagi Calon Pegawai Negeri Sipil Cpns Formasi Di Lingkungan Pemkab Mojokerto Final Data Uji @kempanrb Bgmn untuk yang masuk data P3K yg udah mendaftar CPNS 2024? Mereka sdh tidak bisa ikutan P3K Gel 2? 20 Link Instansi Pusat yang Sudah Umumkan Hasil Akhir CPNS 2024 Salah Satunya Ada KemenPAN RB - Ayo Bandung https://t.
co/tPkSPJ8hD9 #link #CPNS Bgmn Untuk Yang Masuk Data PK Yg Udah Mendaftar Cpns Mereka Sdh Tidak Bisa Ikutan PK Gel Link Instansi Pusat Yang Sudah Umumkan Hasil Akhir Cpns Salah Satunya Ada Kemenpan Rb Ayo Bandung .
Casefolding Tahapan ini merupakan case folding, yaitu proses untuk mengubah seluruh teks menjadi huruf kecil agar lebih konsisten .
Tabel 4 Casefolding Cleaning Data Casefolding Data Latih Blm Kaak April Tuh Keknya Masih Ngurusin blm kaak april tuh keknya masih ngurusin Cpns Itu Sk Cpns Nya Baru Pada Keluar Paling cpns itu sk cpns nya baru pada keluar paling Cepet Agustus Atau Sept cepet agustus atau sept Penting Hal Yang Wajib Diperhatikan Saat penting hal yang wajib diperhatikan saat Pengisian Drh Cpns Jangan Sampai Salah pengisian drh cpns jangan sampai salah A A Kelulusan Bagi Calon Pegawai Negeri Sipil kelulusan bagi calon pegawai negeri sipil Cpns Formasi Di Lingkungan Pemkab cpns formasi di lingkungan pemkab Mojokerto Final mojokerto final Data Uji Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina e-ISSN: 2685-0877 Cleaning Data Bgmn Untuk Yang Masuk Data PK Yg Udah Mendaftar Cpns Mereka Sdh Tidak Bisa Ikutan PK Gel Link Instansi Pusat Yang Sudah Umumkan Hasil Akhir Cpns Salah Satunya Ada Kemenpan Rb Ayo Bandung Casefolding bgmn untuk yang masuk data pk yg udah mendaftar cpns mereka sdh tidak bisa ikutan pk gel link instansi pusat yang sudah umumkan hasil akhir cpns salah satunya ada kemenpan rb ayo bandung .
Tokenize Tahapan ini merupakan tokenizing, yaitu proses memecah teks menjadi unit-unit terkecil, yang disebut token, seperti kata atau frasa .
Tabel 5 Tokenize Casefolding Tokenizing Data Latih blm kaak april tuh keknya masih ngurusin cpns itu sk cpns nya baru pada keluar paling cepet agustus atau sept penting hal yang wajib diperhatikan saat pengisian drh cpns jangan sampai salah A kelulusan bagi calon pegawai negeri sipil cpns formasi di lingkungan pemkab mojokerto final "blm", "kaak", "april", "tuh", "keknya", "masih", "ngurusin", "cpns", "itu", "sk", "cpns", "nya", "baru", "pada", "keluar", "paling", "cepet", "agustus", "atau", "sept" "penting", "hal", "yang", "wajib", "diperhatikan", "saat", "pengisian", "drh", "cpns", "jangan", "sampai", "salah" A "kelulusan", "bagi", "calon", "pegawai", "negeri", "sipil", "cpns", "formasi", "di", "lingkungan", "pemkab", "mojokerto", "final" Data Uji Bgmn untuk yang masuk data PK yg udah mendaftar cpns Mereka sdh tidak bisa ikutan PK Gel Link instansi pusat yang sudah umumkan hasil akhir cpns salah satunya ada kemenpan rb ayo bandung "bgmn", "untuk", "yang", "masuk", "data", "pk", "yg", "udah", "mendaftar", "cpns", "mereka", "sdh", "tidak", "bisa", "ikutan", "pk", "gel" "link", "instansi", "pusat", "yang", "sudah", "umumkan", "hasil", "akhir", "cpns", "salah", "satunya", "ada", "kemenpan", "rb", "ayo", "bandung" .
Filtering Tahap ini merupakan filtering, yaitu proses untuk menghilangkan elemen atau kata-kata yang tidak relevan atau kurang signifikan dalam teks .
Tabel 6 Filtering Tokenizing Filtering Data Latih "blm", "kaak", "april", "tuh", "keknya", "masih", "ngurusin", "cpns", "itu", "sk", "cpns", "nya", "baru", "kaak", "april", "ngurusin", "cpns", "sk", "pada", "keluar", "paling", "cepet", "agustus", "atau", "cpns", "keluar", "agustus", "sept" "sept" "penting", "hal", "yang", "wajib", "diperhatikan", "penting", "wajib", "diperhatikan", "saat", "pengisian", "drh", "cpns", "jangan", "sampai", "pengisian", "drh", "cpns" "salah" A A "kelulusan", "bagi", "calon", "pegawai", "negeri", "kelulusan", "calon", "pegawai", "negeri", "sipil", "cpns", "formasi", "di", "lingkungan", "sipil", "cpns", "formasi", "lingkungan", "pemkab", "mojokerto", "final" "pemkab", "mojokerto", "final" Progresif: Vol.
No.
Februari 2025: 132-143 Progresif e-ISSN: 2685-0877 Tokenizing Filtering Data Uji "bgmn", "untuk", "yang", "masuk", "data", "pk", "yg", "udah", "mendaftar", "cpns", "mereka", "sdh", "tidak", "bisa", "ikutan", "pk", "gel" "link", "instansi", "pusat", "yang", "sudah", "umumkan", "hasil", "akhir", "cpns", "salah", "satunya", "ada", "kemenpan", "rb", "ayo", "bandung" masuk", "data", "pk", "mendaftar", "cpns", "ikutan", "pk", "gel" "link", "instansi", "pusat", "umumkan", "hasil", "akhir", "cpns", "kemenpan", "rb", "bandung" .
Stopword Tahap ini merupakan stopword removal, yaitu proses menghapus kata-kata umum yang sering muncul dalam teks namun tidak memiliki makna atau kontribusi signifikan dalam analisis Kata-kata seperti "dan", "atau", "di", "ke", "yang", dan "ini" .
Tabel 7 Stopword Filtering Stopword Data Latih "kaak", "april", "ngurusin", "cpns", "sk", "ngurusin", "cpns", "cpns", "keluar" "cpns", "keluar", "agustus", "sept" "penting", "wajib", "diperhatikan", "penting", "wajib", "pengisian", "cpns" "pengisian", "drh", "cpns" "seleksi", "cpns", "dibantu", "belajar", "seleksi", "cpns", "soal", "cpns", "mudah", "soal", "cpns", "mudah", "klik", "lini", "bio", "kuota", "terbatas" "kuota", "terbatas" A A "kelulusan", "calon", "pegawai", "negeri", "kelulusan", "calon", "pegawai", "negeri", "sipil", "cpns", "formasi", "lingkungan", "sipil", "cpns", "formasi", "final" "pemkab", "mojokerto", "final" Data Uji masuk", "data", "pk", "mendaftar", "cpns", "masuk", "data", "mendaftar", "cpns", "ikutan", "pk", "gel" "ikutan", "link", "instansi", "pusat", "umumkan", "instansi", "pusat", "umumkan", "hasil", "hasil", "akhir", "cpns", "kemenpan", "rb", "akhir", "cpns", "bandung" .
Stemming Pada tahap ini merupakan stemming, yaitu proses untuk mengubah kata-kata ke bentuk dasarnya .
Tabel 8 Stemming Stopword Stemming Data Latih "ngurusin", "cpns", "cpns", "keluar" "urus", "cpns", "cpns", "keluar" "penting", "wajib", "pengisian", "cpns" "penting", "wajib", "isi", "cpns" "seleksi", "calon", "pegawai", "negeri", "sipil", "seleksi", "calon", "pegawai", "negeri", "sipil", "cpns", "kementerian", "atr", "bpn" "cpns", "kementerian", "atr", "bpn" A A "kelulusan", "calon", "pegawai", "negeri", "lulus", "calon", "pegawai", "negeri", "sipil", "sipil", "cpns", "formasi", "final" "cpns", "formasi", "final" Data Uji "masuk", "data", "mendaftar", "cpns", "ikutan", "masuk", "data", "daftar", "cpns", "ikut", "instansi", "pusat", "umumkan", "hasil", "akhir", "instansi", "pusat", "umum", "hasil", "akhir", "cpns", "cpns".
Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina e-ISSN: 2685-0877 Hasil dan Pembahasan Nilai TF-IDF Berikut adalah nilai TF-IDF yang diperoleh setelah tahap preprocessing data.
Nilai TFIDF ini menunjukkan bobot penting dari setiap kata dalam dokumen, dengan mempertimbangkan frekuensi kata dalam dokumen serta distribusi kata di seluruh koleksi
Tabel 9 Nilai TF-IDF
TF-IDF
TERM
1,477
6,125
6,125
6,125
6,125
6,125
1,477
1,477
Kernel Linier Adapun hasil dari perhitungan kernel linear dari data sampel yang dimiliki sebagaimana yang disajikan pada tabel berikut.
Tabel 10 Kernel Linier
0,00757
0,03141
0,00757
0,03141
0,65131
0,03141
0,03141
0,03141
0,03141
0,00757
0,03141
0,00757
0,03141
0,00757
0,00757
0,00757
0,03141
0,00757
0,00757
0,00757
Menghitung Nilai Matriks Hessian Berikut adalah hasil perhitungan matriks Hessian yang diperoleh selama proses pelatihan model.
Tabel 11 Nilai Matriks Hessian A lulus
formasi final
0,25757 0,21859 0,25757 A
0,25
0,25
0,25
0,21859 0,90131 0,21859 A 0,28141 0,28141 0,28141
0,25757 0,21859 0,25757 A
0,25
0,25
0,25
0,25 0,28141
0,25 A
0,25
0,25
0,25
A A
0,25 0,28141
0,25 A 0,25757 0,25757 0,25757
Penentuan Support Vector Menentukan support vector untuk setiap dokumen.
Proses ini dilakukan berdasarkan nilai iterbaru yang telah diperoleh.
0,087
0,361
0,087
0,361
Tabel 12 Penentuan Support Vector
0,23993435
0,361
0,361
0,361
0,223021859
0,23993435
0,087
0,238580144
0,087
0,238580144
Progresif: Vol.
No.
Februari 2025: 132-143 Kelas A Progresif e-ISSN: 2685-0877 Langkah selanjutnya adalah menghitung fungsi kernel untuk masing-masing kelas menggunakan nilai tertinggi.
Nilai K.
i, x ) dihitung dengan i terbesar dari kelas positif .
,239163.
, dan K.
i, x-) dihitung dengan i terbesar dari kelas negatif .
,23993.
Nilainilai ini diambil dari elemen matriks Hessian pada kolom yang sesuai untuk masing-masing Perhitungan kernel ini menjadi komponen penting dalam proses klasifikasi menggunakan SVM untuk menentukan posisi data terhadap hyperplane pemisah dan mengambil keputusan K.
i, x ) = = .
23993435 y Oe1y 0.
223021859 y 1 y 0.
y Oe1 y 0.
239163741 y 1 y 0.
239163741 y 1 y 257574.
239163741 y 1 y 0.
235989159 y 1 y 0.
235367369 y 1 y 0.
235367369 y 1 y 0.
235367369 y 1 y .
235367369 y 1 y 0.
238434333 y 1 y 0.
238434333 y 1 y 0.
238434333 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y .
238580144 y 1 y 0.
238580144 y 1 y 0.
238580144 y 1 y 0.
= 1,018662157
i, x-) = = .
23993435 y Oe1 y 0.
223021859 y 1 y 0.
23993435 y Oe1 y 0.
239163741 y 1 y 0.
y 1 y 0.
239163741 y 1 y 0.
235989159 y 1 y 0.
235367369 y 1 y 0.
235367369 y 1 y 0.
235367369 y 1 y .
235367369 y 1 y 0.
238434333 y 1 y 0.
238434333 y 1 y 0.
238434333 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y 0.
238934951 y 1 y .
238580144 y 1 y 0.
238580144 y 1 y 0.
238580144 y 1 y 0.
= 0,995580948
Nilai K.
i, x ) dan K.
i, x-) sudah dihitung, langkah selanjutnya adalah menghitung nilai bias dengan menggunakan persamaan dibawah ini.
Dari persamaan diatas, maka diperoleh nilai b sebagai berikut.
= -1,00712
Pengujian SVM Setelah menghitung nilai bias, langkah selanjutnya adalah menguji model dengan menghitung nilai TF-IDF untuk setiap data uji.
TF-IDF digunakan untuk mengukur pentingnya kata dalam dokumen relatif terhadap kumpulan dokumen, sehingga membantu menentukan bobot kata yang signifikan dalam pengklasifikasian data.
No.
Term
Tabel 13 Nilai TF-IDF Data Uji
IDF
TF-IDF
1,778
1,778
0,3167
1,778
1,778
0,3167
1,778
1,778
0,3167
0,875
1,750
0,3117
1,778
1,778
0,3167
Norm Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina e-ISSN: 2685-0877 Tahap berikutnya adalah menghitung kernel untuk setiap data uji dengan data latih yang telah dihitung sebelumnya.
Perhitungan kernel ini bertujuan untuk mengukur hubungan atau kesesuaian antara data uji dan data latih berdasarkan fitur-fitur yang diwakili dalam ruang dimensi tertentu.
Hasil dari perhitungan kernel ini akan digunakan sebagai dasar untuk menentukan kelas dari data uji.
Berikut adalah hasil perhitungan kernel antara data latih dan data uji yang telah dianalisis.
Tabel 14 Kernel Linier Data Uji No masuk A umum 1 0,0276 0,0276 0,0276 0,0271 A 0,0276 0,0276 0,0276 2 0,5716 0,5716 0,5716 0,5625 A 0,5716 0,5716 0,5716 3 0,0276 0,0276 0,0276 0,0271 A 0,0276 0,0276 0,0276 A A A A A A A 20 0,0276 0,0276 0,0276 0,0271 A 0,0276 0,0276 0,0276 21 0,0276 0,0276 0,0276 0,0271 A 0,0276 0,0276 0,0276 Setelah nilai kernel diperoleh, langkah berikutnya adalah menghitung bobot untuk data Bobot dihitung dengan menggabungkan nilai kernel yang telah diperoleh sebelumnya dan nilai alpha yang terkait dengan masing-masing data.
Perhitungan ini akan memberikan bobot yang digunakan dalam proses klasifikasi, yang pada akhirnya akan membantu menentukan posisi data terhadap hyperplane pemisah dan mengklasifikasikan data ke dalam kelas yang Tabel 15 Nilai Bobot Data Uji A umum -0,0066 -0,0066 -0,0066 -0,0065 A -0,0066 -0,0066 -0,0066 0,1275 0,1275 0,1275 0,1255 A 0,1275 0,1275 0,1275 -0,0066 -0,0066 -0,0066 -0,0065 A -0,0066 -0,0066 -0,0066 A A A A 0,0066 0,0066 0,0066 0,0065 A 0,0066 0,0066 0,0066 0,0066 0,0066 0,0066 0,0065 A 0,0066 0,0066 0,0066 Setelah bobot dihitung, nilai f.
digunakan untuk mengklasifikasikan data.
Jika hasil positif, data termasuk kelas positif .
endukung CPNS 2.
, dan jika negatif, data masuk kelas negatif .
idak mendukun.
Proses ini memastikan klasifikasi sentimen yang akurat terkait CPNS 2024.
Data uji 1 ["masuk", "data", "daftar", "cpns", "ikut"] f.
= w.
= iyiK.
i,x.
= .
,3142 0,3142 0,3142 0,3092 0,3142 ) (- 1,00.
= 2,573
Fungsi Klasifikasi = sign.
Data uji 2 ["instansi", "pusat", "umum", "hasil", "akhir", "cpns"] f.
= w.
= iyiK.
i,x.
= .
,3142 0,3142 0,3142 0,3142 0,3142 0,3.
(- 1,00.
= 2,88717
Fungsi Klasifikasi = sign.
,88.
Progresif: Vol.
No.
Februari 2025: 132-143 Progresif e-ISSN: 2685-0877 Penerapan Algoritma SVM pada RapidMiner Gambar berikut merupakan proses pengujian algoritma SVM menggunakan RapidMiner Studio melibatkan beberapa tahapan utama, dimulai dengan memasukkan data latih dan data uji, diikuti oleh langkah preprocessing untuk membersihkan dan menormalkan data.
Selanjutnya, model SVM dibangun untuk memisahkan data ke dalam kelas positif dan negatif, kemudian data uji diterapkan pada model untuk melakukan klasifikasi.
Gambar 2 Proses Pengujian SVM pada RapidMiner Akurasi Model Gambar di bawah ini menunjukkan nilai akurasi model yang diuji menggunakan RapidMiner, yaitu 82,5%.
Nilai ini menggambarkan bahwa model dapat mengklasifikasikan data uji dengan benar sebanyak 82,5% dari total data yang diuji.
Hasil ini mencerminkan kinerja model dalam mengklasifikasikan data ke dalam kategori yang tepat.
Dengan akurasi sebesar 82,5%, model dapat dianggap cukup efektif, namun masih ada ruang untuk perbaikan, seperti dengan optimasi parameter atau menggunakan teknik lain untuk meningkatkan hasil klasifikasi lebih lanjut.
Gambar 3 Akurasi Model Pembahasan Penelitian analisis sentimen dengan menerapkan metode Support Vector Machine terhadap data X dengan kata kunci #CPNS2024 menunjukkan hasil akurasi sebesar 82,5%.
Nilai akurasi ini tergolong baik dibandingkan dengan penelitian sebelumnya yang dilakukan oleh Susi dengan judul Analisis Sentimen Cuitan Twitter Pada Proses Seleksi CPNS Menggunakan Algoritma Ensembles Vote serta penggunaan algoritma k-Nearest Neighbor .
-NN) yang nilai akurasinya hanya 61.
90% .
Namun berbeda penelitian yang dilakukan oleh Fajar dan Sugiyono, dengan judul penelitian berupa Analisis Sentimen Masyarakat Terhadap Perekrutan pK Pada Twitter Dengan Metode Naive Bayes Dan Support Vector Machine, yang menunjukkan nilai akurasi sebesar 94,80 % .
Penelitian tersebut hanya menggunakan 482 data, namun berhasil mendapatkan nilai akurasi yang lebih tinggi.
Hal ini menunjukkan bahwa jumlah data yang digunakan tidak memberikan pengaruh dalam nilai akurasi dari hasil penelitian.
Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina e-ISSN: 2685-0877 Simpulan Analisis sentimen terhadap penerimaan CPNS 2024 bertujuan untuk menggali pandangan masyarakat, baik positif maupun negatif.
Proses dimulai dengan pengumpulan data komentar, yang kemudian diproses melalui tokenisasi, penghapusan stopwords, penyaringan, dan transformasi teks menggunakan TF-IDF.
Algoritma Support Vector Machine (SVM) digunakan untuk klasifikasi sentimen.
Model diuji dengan data pelatihan dan pengujian, menghasilkan akurasi 82,5%.
Hasil ini memberikan wawasan tentang penerimaan CPNS 2024, membantu pembuat kebijakan merancang langkah-langkah strategis yang lebih baik.
Daftar Referensi .
Nurkarifin.
Hermanto, and M.
Resmi.
AuAnalisis Sentimen Terhadap Aplikasi Lowongan Kerja Menggunakan Lexicon Based Features Dan Support Vector Machine,Ay Jutisi J.
Ilm.
Tek.
Inform.
Dan Sist.
Inf.
, vol.
13, no.
1, p.
May 2024, doi:
35889/jutisi.
Arsi and R.
Waluyo.
AuAnalisis Sentimen Wacana Pemindahan Ibu Kota Indonesia Menggunakan Algoritma Support Vector Machine (SVM),Ay J.
Teknol.
Inf.
Dan Ilmu Komput.
, vol.
8, no.
1, p.
Feb.
2021, doi: 10.
25126/jtiik.
Hartati.
AuPenggunaan Klasifikasi Sayur Segar dan Sayur Busuk Mengunakan Algoritma Support Vector Machine,Ay J.
Tek.
Inform.
Dan Sist.
Inf.
, vol.
Vol 07.
No 03, pp.
678Ae687.
Desember 2020.
Nofandi.
Setiawan, and D.
Brata.
AuAnalisis Sentimen Ulasan Pelanggan dengan Metode Support Vector Machine (SVM) untuk Peningkatan Kualitas Layanan pada Restoran Warung Wareg,Ay J.
Pengemb.
Teknol.
Inf.
Dan Ilmu Komput.
, vol.
7, no.
458Ae466, 2023.
Isnain.
Sakti.
Alita, and N.
Marga.
AuSentimen Analisis Publik Terhadap Kebijakan Lockdown Pemerintah Jakarta Menggunakan Algoritma SVM,Ay J.
Data Min.
Dan Sist.
Inf.
, vol.
2, no.
1, pp.
Feb.
2021, doi: 10.
33365/jdmsi.
Hidayat and S.
Sugiyono.
AuAnalisis Sentimen Masyarakat Terhadap Perekrutan pk Pada Twitter Dengan Metode Naive Bayes Dan Support Vector Machine,Ay J.
Sains Dan Teknol.
, vol.
5, no.
2, pp.
665Ae672.
Dec.
2023, doi: 10.
55338/saintek.
Chairunnisa.
AuAnalisis Sentimen terhadap Karyawan Dirumahkan pada Media Sosial Twitter menggunakan Fitur N-Gram dan Pembobotan Augmented TF Ae IDF Probability dengan K-Nearest Neighbour,Ay J.
Pengemb.
Teknol.
Inf.
Dan Ilmu Komput.
, vol.
6, no.
1960Ae1965, 2022.
Susi.
AuAnalisis Sentimen Cuitan Twitter Pada Proses Seleksi CPNS Menggunakan Algoritma Ensembles Vote,Ay IKRAM: Jurnal Ilmu Komputer Al Muslim, vol.
1, no.
1, pp.
42Ae46, 2022.
Lubis.
Lubis, and Sriani.
AuSentiment analysis on twitter about the death penalty using the support vector machine method,Ay TEKNOSAINS J.
Sains Teknol.
Dan Inform.
, vol.
11, no.
2, pp.
312Ae321, 2024, doi: 10.
Friska Aditia Indriyani.
Ahmad Fauzi, and Sutan Faisal.
AuAnalisis sentimen aplikasi tiktok menggunakan algoritma nayve bayes dan support vector machine,Ay TEKNOSAINS J.
Sains Teknol.
Dan Inform.
, vol.
10, no.
2, pp.
176Ae184.
Jul.
2023, doi:
37373/tekno.
Ginting and S.
Sriani.
AuDeveloping a Web-Based Application for Palm Seedling Eligibility Using C5.
0 Algorithm and CART Algorithm,Ay PIKSEL Penelit.
Ilmu Komput.
Sist.
Embed.
Log.
, vol.
12, no.
1, pp.
97Ae108.
Mar.
2024, doi: 10.
33558/piksel.
Furqan.
Sriani, and S.
Sari.
AuAnalisis Sentimen Menggunakan K-Nearest Neighbor Terhadap New Normal Masa Covid-19 Di Indonesia,Ay Techno.
Com, vol.
21, no.
1, pp.
51Ae60.
Feb.
2022, doi: 10.
33633/tc.
Pulungan.
Sriani, and A.
Armansyah.
AuImplementation of Nayve Bayes Method Diagnosing Diseases Nile Tilapia,Ay J.
Comput.
Netw.
Archit.
High Perform.
Comput.
, vol.
6, no.
2, pp.
817Ae828.
May 2024, doi: 10.
47709/cnahpc.
Siddik.
Hendri.
Putri.
Desnelita, and G.
Gustientiedina.
AuKlasifikasi Kepuasan Mahasiswa Terhadap Pelayanan Perguruan Tinggi Menggunakan Algoritma Nayve Bayes,Ay INTECOMS J.
Inf.
Technol.
Comput.
Sci.
, vol.
3, no.
2, pp.
162Ae166.
Nov.
2020, doi: 10.
31539/intecoms.
Progresif: Vol.
No.
Februari 2025: 132-143 Progresif e-ISSN: 2685-0877 Handayani and I.
Zufria.
AuAnalisis Sentimen Terhadap Bakal Capres RI 2024 di Twitter Menggunakan Algoritma SVM,Ay J.
Inf.
Syst.
Res.
JOSH, vol.
5, no.
1, pp.
53Ae63.
Oct.
2023, doi: 10.
47065/josh.
Idris.
Mustofa, and I.
Salihi.
AuAnalisis Sentimen Terhadap Penggunaan Aplikasi Shopee Mengunakan Algoritma Support Vector Machine (SVM),Ay Jambura J.
Electr.
Electron.
Eng.
, vol.
5, no.
1, pp.
32Ae35.
Jan.
2023, doi: 10.
37905/jje.
Analisis Sentimen Mengenai Penerimaan Calon Pegawai a.
Khairunissabina