Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. Komparasi Algoritma Logistic Regression Dan Naive Bayes Untuk Menyeleksi Melamar Pekerjaan Perusahaan Besar Bagi Alumni Smk Ria Indah Fitria. Nur Tulus Ujianto. Prodi Informatika. Universitas Pancasakti Tegal Email : riaindah@upstegal. Abstrak Sekolah Menengah Kejuruan adalah salah satu jenjang pendidikan menengah dengan kekhususanmempersiapkan lulusannya untuk siap bekerja. Pendidikan kejuruan mempunyai arti yang bervariasi namun dapat dilihat suatu benang merahnya. Banyak sekali alumni dari SMK yang setelah mereka lulus menginginkan pekerjaan di perusahaan besar agar dapat memperoleh gaji yang lumayan besar. Perusahaan besar memiliki beberapa kriteria dalam mencari karyawannya. Tidak semua perusahaan besar dapat menerima alumni dari SMK dengan begitu mudah. Perusahaan besar memiliki beberapa Persyaratan dalam memilih atau menyeleksi karyawannya, misaya . memiliki nilai yang bagus dalam mata pelajaran, . keterampilan dalam teknik, . keterampilan dalam berkomunikasi, dann . dalam bersikap harus memiliki atitude yang baik. Maka dari itu siswa Ae siswi SMK dilatih untuk siap kerja dengan dibekali skill yang bagus dan atitude yang baik. Dalam penelitian ini diusulkan metode yang digunakan adalah Agoritma Naive Bayes dan regresi logistic . Kata kunci : SMK. Perusahaan. Persyaratan. Naive Bayes dan regresi logistic Pendahuluan Sekolah Menengah Kejuruan adalah salah satu jenjang pendidikan menengah dengan kekhususanmempersiapkan lulusannya untuk siap bekerja. Pendidikan kejuruan mempunyai arti yang bervariasi namun dapat dilihat suatu benang merahnya. Pendidikan kejuruan adalah pendidikan yang dirancang untuk mengembangkan keterampilan,kemampuan/kecakapan,pemahaman, sikap, kebiasaan-kebiasaan kerja, dan apresiasi yang diperlukan oleh pekerja dalam mamasuki pekerjaan dan membuat kemajuan-kemajuan dalam pekerjaan penuh makna dan produktif. Mengacu pada pada isi Undang-Undang Sistem Pendidikan Nasional No. 20 Tahun 2003 pasal 3 mengenai tujuan pendidikan nasional dan penjelasan pasal 15 yang menyebutkan bahwa pendidikan kejuruan merupakan pendidikan menengah yang mempersiapkan peserta didik terutama untuk bekerja di bidang Pendidikan kejuruan adalah pendidikan yang mempersiapkan peserta didik untuk dapat bekerja dalam bidang tertentu. Pengertian ini mengandung pesan bahwa setiap institusi yang menyelenggarakan pendidikan keJuruan harus berkomitmen menjadikan tamatannya mampu bekerja dalam bidang tertentu. Nayve Bayes Classifier merupakan penyederhanaan dari teorema Bayes, penemu metode ini adalah seorang ilmuwan Inggris yang bernama Thomas Bayes. Algoritma dalam metode Nayve Bayes didasarkan dengan teknik klasifikasi (Kusumadewi, 2. dapat dibuktikan bahwa saat kecepatan sangat tinggi dan bersamaan diaplikasikan dalam suatu database dengan jumlah data yang besar, naive bayes mempunyai akurasi dan juga kecepatan yang tinggi. Metode Naive Bayes dengan prinsip teorema Bayes mempunyai atribut yang saling berhubungan satu sama lain. Pendekatan yang digunakan teorema bayes yaitu menghitung probabilitas sebuah kejadian pada kondisi tertentu. Dasar dari teorema Bayes dinyatakan dalam persamaan. Analisis regresi logistik merupakan analisis yang digunakan untuk memprediksi hasil dari variabel terikat yang bersifat kategori berdasarkan satu atau lebih variabel bebas. Dalam dunia pendidikan, peran dan fungsi guru merupakan salah satu faktor yang sangat Guru merupakan bagian terpenting dalam proses belajar mengajar, baik di jalur pendidikan formal, informal maupun nonformal. Oleh sebab itu, dalam setiap upaya peningkatan kualitas pendidikan di tanah air, guru tidak dapat dilepaskan dari berbagai hal yang berkaitan dengan eksistensi Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. Guru adalah pendidik profesional dengan tugas utama mendidik, mengajar, membimbing, mengarahkan, melatih, menilai, dan mengevaluasi peserta didik. Untuk meningkatkan mutu siswa, tenaga guru pun harus yang profesional. Tujuannya, untuk meningkatkan lingkungan hidup dan kaitan dalam ilmu pendidikan. Peningkatan kualifikasi guru sampai ke jenjang pendidikan S1 hingga S3. Kualifikasi guru yang diprioritaskan untuk ditingkatkan, terutama di daerah terpencil, tertinggal dan sulit dijangkau yang belum mencapai kualifikasi pendidikan S1. Tujuannya memperkecil kesenjangan mutu guru antardaerah, memenuhi persyaratan minimal profesionalisme tenaga pendidik dalam program sertifikasi guru. Serta memperluas pemerataan pendidikan bagi guru. Berdasarkan definisi di atas, maka sekolah menengah kejuruan sebagai sub sistim pendidikan nasional mengutamakan mempersiapkan peserta didiknya untuk mampu memilih karir, memasuki lapangan kerja, berkompetisi, dan mengembangkan dirinya dengan sukses di lapangan kerjayang cepat berubah dan berkembang. Didalam dunia industri atau perusahaan besar skill atau kemampuan sangat dibutuhkan. Selain kemampuan yang dibutuhkan dalam dunia kerja atitude juga dibutuhkan dalam pekerjaan. Alumni dari SMK biasanya mereka sudah siap kerja karena dari sekolah mereka sudah mempelajari yang menjadi jurusan mereka. Contohnya siswa dengan jurusan RPL . ekayasa perangkat kera. , mereka sudah dibekali ilmu komputer. Setidaknya siswa RPL memiliki skill membuat 1 program komputer dengan menggunakan 1 bahasa pemrograman. Banyak sekali alumni dari SMK yang setelah mereka lulus menginginkan pekerjaan di perusahaan besar agar dapat memperoleh gaji yang lumayan besar. Perusahaan besar memiliki beberapa kriteria dalam mencari karyawannya. Tidak semua perusahaan besar dapat menerima alumni dari SMK dengan begitu mudah. Ada beberapa kretaria seperti contoh siswa dengan nilai UN . jian nasiona. tertinggi di SMK belum tentu dapat diterima diperusahaan besar jika siswa tersebut tidak memiliki attitude yang sopan. Jadi perusahaan besar kebanyakan menerima karyawannya bukan hanya dari skilya tetapi juga dari sikap atau attitude karyawannya. Perusahaan besar memiliki beberapa Persyaratan dalam memilih atau menyeleksi karyawannya, misaya . memiliki nilai yang bagus dalam mata pelajaran, . keterampilan dalam teknik, . keterampilan dalam berkomunikasi, dann . dalam bersikap harus memiliki atitude yang baik. Maka dari itu siswa Ae siswi SMK dilatih untuk siap kerja dengan dibekali skill yang bagus dan atitude yang Melihat data dari sekolah yang sering berlebihan dan tidak lengkap maka pendekatan naive bayes cocok untuk mengklastering atau untuk mengelompokan siswa Ae siswi yang diterima didalam perusahaan besar. Teorema bayes menggunakan asumsi independensi . sehingga nayve bayes menggunakan model fitur yang independen. Sedangkan pendekatan logistic regression untuk menelompokan atau memprediksi dua grup dari variabel-variabel yang dipilih. Didalam logistic regression jika kategori dependennya berjumlah dua kategori maka digunakan binary logistic, dan ketika dependen variabeya lebih dari dua kategori maka digunakan multinominal logistic regression. Lalu ketika dependen variabeya berbentuk ranking, maka disebut dengan ordinal logistic regression. Landasan Teori Metode klastering adalah proses pengelompokan sekumpulan objek data ke dalam beberapa kelompok atau klaster . sehingga data dalam sebuah klaster memiliki kemiripan yang maksimum, dan data antar klaster memiliki tingkat kemiripan yang minimum . Aplikasi pengklasteran dipakai di berbagai bidang, seperti data mining, pengenalan pola, klasifikasi citra, ilmu-ilmu yang terkait dengan biologi, pemasaran, perencanaan kota, document retrival, dan lain-lain. Data Mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan Data Mining adalah kenyataan bahwa Data Mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dahulu. Berawal dari beberapa disiplin ilmu. Data Mining bertujuan untuk memperbaiki teknik tradisional sehingga bisa menangani: Jumlah data yang sangat besar Dimensi data yang tinggi Data yang heterogen dan berbeda sifat . Algoritma Nayve Bayes merupakan suatu bentuk klasifikasi data dengan menggunakan metode probabilitas dan statistik. Metode ini pertama kali dikenalkan oleh ilmuwan Inggris Thomas Bayes, yaitu digunakan untuk memprediksi peluang yang terjadi di masa depan berdasarkan pengalaman di Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. masa sebelumnya sehingga dikenal sebagai teorema Bayes. Metode Teorema bayes kemudian dikombinasikan dengan naive yang diasumsikan dengan kondisi antar atribut yang saling bebas. Algoritma Naive Bayes dapat diartikan sebagai sebuah metode yang tidak memiliki aturan. Naive Bayes menggunakan cabang matematika yang dikenal dengan teori probabilitas untuk mencari peluang terbesar dari kemungkinan klasifikasi, dengan cara melihat frekuensi tiap klasifikasi pada data training. Naive Bayes juga termasuk metode klasifikasi yang sangat populer dan masuk dalam sepuluh algoritma terbaik dalam data mining, algoritma ini juga dikenal dengan namaIdiotAos Bayes. Simple Bayes, dan Independence Bayes. Klasifikasi bayesian memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network . Bayes rule digunakan untuk menghitung probabilitas suatu class. Algoritma Naive Bayes memberikan suatu cara mengkombinasikan peluang terdahulu dengan syarat kemungkinan menjadi sebuah formula yang dapat digunakan untuk menghitung peluang dari tiap kemungkinan yang terjadi. Dalam sebuah penelitian biasanya kita memodelkan hubungan antar 2variabel, yaiitu variabel X . dan Y . Metode yang biasadipakai dalam penelitian seperti ini adalah regresi linier, baik sederhana maupunberganda. Namun, adakalanya regresi linier dengan metode OLS (Ordinary LeastSquar. yang dipakai tidak sesuai untuk digunakan. Regresi linier yang seringdigunakan kadang terjadi pelanggaran asumsi Gauss-Markov. Misaya padakasus dimana variabel dependent (Y) bertipe data nominal, sedangkan variabelbebas/prediktornya (X) bertipe data interval atau rasio. Ingin diketahui apakah mahasiswa sudah melek keuangan berdasarkanjenis kelamin, fakultas yang dipilih dan indeks prestasi kumulatif. Dalam kasus inihanya ada 2 kemungkinan respon mahasiswa, yaitu mahasiswa melekkeuangan dan mahasiswa tidak melek keuangan. Dari contoh kasus di atas, dapat diketahui bahwa tipe data variabelrespon (Y) adalah nominal, yaitu kategorisasi keputusan mahasiswa melekkeuangan atau tidak . isal melek keuangan angka 1, sedangkan tidak melekkeuangan angka . , sedangkan tipe data untuk variabel bebas (X) setidaktidaknyainterval . kala liker. Bila metode regresi linier biasa diterapkan padakasus semacam ini, akan terdapat 2 pelanggaranasumsi Gauss-Markov dan 1 buah pelanggaran terhadap batasan dari nilai. Menurut . , akan terdapat 2 pelanggaranasumsi Gauss-Markov dan 1 buah pelanggaran terhadap batasan dari nilai duga. itted valu. dari variabel respon (Y), yaitu: Error dari model regresi yang didapat tidak menyebar normal. Ragam . dari error tidak homogen . erjadi heteroskedastisitas pada ragam erro. Sedangkan, pelanggaran bagi batasan nilai duga Y . itted valu. adalah bahwa nilai duga yang dihasilkan dari model regresi linier biasa melebihi rentang antara 0 s. Hal ini jelas tidak masuk Metode Penelitian Jenis Penelitian Penelitian yang dilaksanakan adalah jenis penelitian eksperimen, yaitu melakukan pengujian tingkat akurasi komparasi algoritma untukseleksi pelamar pekerjaan pada perusahaan besar bagi alumni SMK. Data eksperimen diambil dari tempat penelitian yaitu di SMK Karya Bhakti Brebes. Pengumpulan Data Penelitian ini memakai data dari SMK Karya Bhakti Brebes. Data yang dibutuhkan dalam penelitian ini antara lain. jumlah data eksperimen 386 data dengan atribut seperti jenis kelamin, jumlah nilai UN, rata Ae rata nilai UN , kejujuran,kedisiplinan,tanggung jawab dalam bekerja,bertoleransi,santun, percaya diri, keterampilan, status. Atribut Aeatribut tersebut diambil pada data alumni di bagian admin sekolah. Selanjutnya data perolehan ditransformasi untuk mendapatkan atribut yang relevan dan sesuai dengan format input algoritma soft computing dikomparasi dan bersesuaian dengan menggunakan tool rapid miner. Adapun gambaran data yang digunakan dapat dilihat pada tabel 3. Sampel Data Sampel data yang digunakan adalah data data alumni SMK Karya Bhakti Brebes Tahun 2017 dan Tahun 2018 dengan jenis kelamin, jumlah nilai UN, rata Ae rata nilai UN, kejujuran, kedisiplinan, tanggung jawab dalam bekerja, bertoleransi, santun, percaya diri, keterampilan, dan status. Sampel data berjumlah 386 siswa Perempuan 165 dan 221 laki Ae laki. Metode yang digunakan adalah metode perbandingan algoritma Logistic regression (LR) dan Naive Bayes (NB) mendeteksi klasifikasi permasalahan seleksi melamar pekerjaan pada perusahaan besar bagi alumni SMK. Dari hasil pengujian metode akan di ketahui kedua algoritma tersebut Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. manakah yang memiliki tingkat akurasi yang tinggi. Akurasi tinggi tidaknya sebuah algoritma dilihat dari berapa presentasi AUC dan ROC yang diperoleh, jika hasil presentasi AUC lebih besar dibanding dengan yang lain dan tingkat akurasi lebih tinggi maka algoritma tersebut dapat menunjukan tingkat akurasi yang lebih baik dibandingkan metode algoritma lainnya. Gambar 6. 1 Metode Usulan Hasil Dan Pembahasan Pengukuran hasil penelitian ini menggunakan metode precision, recall, dan akurasi klasifikasi yang digunakan untuk melakukan pengukuran didapatkan dari hasil data alumni dari SMK sebanyak 386 siswa. Adapun untuk menentukan pengukuran menggunakan Precision dan Recall menggunakan persamaan sebagai berikut: Precision Recall = TP / (TP FP) = TP / (TP FN) Keterangan: TP (True Positiv. FP (False Positiv. TN (True Negativ. FN (False Negativ. = True Ditolak = Diterima = True Diterima = Ditolak Sampling data dinyatakan True Positive / True Sakit apabila informasi yang diberikan dari SMK dengan algoritma sesuai kriteria. Misalnya : Hasil dari data alumni . ata-rata UN <. dan hasil deteksi komparasi algoritma menyatakan ditolak. Sampling data dinyatakan False Positive / diterima apabila informasi yang diberikan dari alumni dengan algoritma tidak sesuai kriteria. Misalnya : Hasil dari data alumni . ata-rata UN < . dan hasil deteksi komparasi algoritma menyatakan diterima. Sampling data dinyatakan True Negative / True diDiterima apabila informasi yang diberikan dari data alumnidengan algoritma sesuai kriteria. Misalnya : Hasil dari data alumni . ata-rata UN > . dan hasil deteksi komparasi algoritma menyatakan diDiterima. Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. Pengukuran Akurasi dengan Algoritma Naive Bayes Gambar 7. 1 Akurasi penyeleksian pelamar pekerjaan alumni dari SMK Menggunakan Algoritma Naive Bayes alumni dari SMK TP = 335 FP = 5 FN = 5 TN = 42 Precision = TP / (TP FP) = 335 / . = 0,9852 Recall = TP / (TP FN) = 335 / . = 0,9852 Akurasi = (TP TN) / (TP TN FP FN) = . / . 42 5 . = 377/387 = 0,9741 Error rate = (FP FN) / (TP TN FP FN) = . / . 42 5 . = 0,025 Pengukuran Akurasi dengan Algoritma regresi logistik Gambar 7. 2 Akurasi penyeleksian pelamar pekerjaan alumni dari SMK Menggunakan Algoritma regresi logistik Engineering Vol. 12 No. ISSN : 2587-3859 (Prin. ISSN : 2549-8614 (Onlin. alumni dari SMK TP = 337 FP = 12 FN = 2 TN = 35 Precision = TP / (TP FP) = 337 / . = 0,9656 Recall = TP / (TP FN) = 337/ . = 0. Akurasi = (TP TN) / (TP TN FP FN) = . / . 35 12 . = 372/389 = 0,956 Error rate= (FP FN) / (TP TN FP FN) = . 35 12 . = 0,035. Inter prestasi hasil Naive Bayes dan regresi logistic Berdasarkan tingkat akurasi yang ditunjukan tabel pengukuran diatas menunjukan beberapa inter prestasi, yaitu diantaranya : Perbandingan antara pengukuran Naive Bayes dan regresi logisticmenunjukan bahwa algoritma Naive Bayes lebih besar dibandingkan regresi logistickarena dalam Naive Bayes memiliki kelebihan dalam menanggani data kuantitatif dan data diskrit algoritma Naive Bayes lebih baik di bandingkan algoritma regresi logistic. Selain itu di dalam Naive Bayesmemiliki titik noise yang di isolasi dibandingkan dengan algoritmaregresi logistic, misalkan dalam Naive Bayes titik noise akan dirata ratakan ketika mengestimasi peluang bersyarat data. Dalam Naive Bayes menangani nilai yang hilang dengan cara mengabaikan instalasi selama perhitungan estimasi peluang. Kesimpulan Penelitian ini dilakukan menggunakan komparasi dua algoritma antara lain:. Algoritma Naive Bayes dan Algoritma regresi logistik. Dari kedua algoritma hasil eksperimen algoritma Algoritma Naive Bayes menunjukkan tingkat akurasi sebesar 0,9741, dan algoritma regresi logistik sebesar 0,956 dalam mendeteksi klasifikasi yang digunakan untuk melakukan pengukuran didapatkan dari hasil data alumni dari SMK. Hasil penelitian komparasi algoritma menunjukkan bahwa Algoritma Naive Bayes dapat mendeteksi klasifikasi melamar pekerjaan pada perusahaan besar bagi alumni SMK dengan tingkat akurasi yang lebih baik dibandingkan metode algoritma regresi logistik. Dari mulai tahap awal hingga pengujian penelitian menggunakan penerapan komparasi algoritma untuk memberikan jawaban atas permasalahan sulitnya mendeteksi klasifikasi melamar pekerjaan pada perusahaan besar bagi alumni SMK. Berdasarkan hasil penelitian, menyimpulkan bahwa komparasi algoritma untuk menentukan algoritma terbaik dan mudah dalam mendeteksi klasifikasi melamar pekerjaan pada perusahaan besar bagi alumni SMK Karya Bhakti Brebes. Daftar Pustaka