Jurnal Kecerdasan Buatan dan Teknologi Informasi Vol. No. January 2025, hlm. e-ISSN: 2964-2922, p-ISSN: 2963-6191 DOI : https://doi. org/10. 69916/jkbti. IMPLEMENTASI ALGORITMA DECISION TREE PADA PENILAIAN KINERJA KARYAWAN MENGGUNAKAN KERANGKA OBJECTIVE AND KEY RESULT Andrian Falah Kalyana*1. Dini Hamidin2. Saepudin Nirwan3 1,2,3 Program Diploma i Teknik Informatika. Sekolah Vokasi. Universitas Logistik dan Bisnis Internasional. Bandung. Indonesia Email: 1andrianedisi1@gmail. com , 2dinihamidin@ulbi. id , 3saepudin@ulbi. (Diterima : 19 Agustus 2024. Direvisi : 6 September 2024. Disetujui : 16 Desember 2. Abstrak OKR (Objectives and Key Result. merupakan kerangka kerja yang digunakan untuk menetapkan dan memantau tujuan serta hasil kunci yang ingin dicapai oleh suatu organisasi. Penilaian dilakukan secara berkala untuk mengukur kemajuan dan efektivitas OKR dalam mencapai tujuan yang telah ditentukan. Dalam penelitian ini, data sintetis digunakan untuk memprediksi kinerja karyawan. Data tersebut dihasilkan menggunakan metode faker dari library Python, dengan mengacu pada data asli. Machine learning, sebagai bagian dari kecerdasan buatan, memungkinkan sistem untuk belajar secara otomatis dan meningkatkan performanya berdasarkan pengalaman tanpa perlu pemrograman eksplisit. Algoritma Decision Tree diterapkan dalam penelitian ini untuk melakukan klasifikasi dan Tujuan penelitian ini adalah memprediksi kinerja karyawan dengan label "cukup," "baik," "memuaskan," dan "sangat memuaskan. " Hasil penelitian menunjukkan bahwa algoritma Decision Tree mampu membangun pohon keputusan yang efektif dalam memprediksi kategori kinerja karyawan dengan akurasi mencapai 95%. Selain itu, nilai Macro Average untuk precision dan recall masing-masing adalah 0,75, sedangkan F1-Score mencapai 0,77. Adapun nilai Weighted Average untuk F1-Score juga sebesar 0,77. Kesimpulannya, algoritma Decision Tree terbukti efektif dalam evaluasi kinerja karyawan. Kata kunci: objective and key result. , machine learning. Decision Tree IMPLEMENTATION OF THE DECISION TREE ALGORITHM IN EMPLOYEE PERFORMANCE ASSESSMENT USING THE OBJECTIVE AND KEY RESULT FRAMEWORK Abstract OKR (Objectives and Key Result. is a framework used to set and monitor goals and key outcomes desired by an Assessments are conducted periodically to evaluate progress and measure the effectiveness of OKRs in achieving the established goals. In this study, synthetic data is used to predict employee performance. The data is generated using the faker method from the Python library, referencing original data as a basis. Machine learning, as part of artificial intelligence, allows systems to learn automatically and improve their capabilities based on experience without the need for explicit programming. The Decision Tree algorithm is applied in this study for classification and regression tasks. The study aims to predict employee performance with labels such as "adequate," "good," "satisfactory," and "very satisfactory. " The results indicate that the Decision Tree algorithm can effectively build a Decision Tree for predicting employee performance categories with an accuracy of 95%. Additionally, the Macro Average for precision and recall are both 0. 75, with an F1-Score of 0. The Weighted Average for the F1Score is also 0. In conclusion, the Decision Tree algorithm proves to be effective in evaluating employee Keywords: objective and key results . , machine learning, decision tree algorithm PENDAHULUAN Memantau dan meningkatkan kinerja serta produktivitas organisasi semakin penting untuk mencapai tujuan strategis yang telah ditetapkan . Salah satu metode yang efektif dalam mengelola dan mengevaluasi kinerja adalah dengan menggunakan Objective dan Key Result. OKR adalah kerangka kerja yang digunakan untuk mendefinisikan dan melacak tujuan . serta hasil kunci . ey resul. yang diinginkan oleh organisasi . Penilaian ini Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result dilakukan secara berkala untuk mengevaluasi kemajan dan mengukur seberapa efektif OKR dalam mencapai tujuan . Penggunaan OKR dalam penilaian kinerja karyawan menawarkan beberapa keunggulan. Pertama. OKR membantu organisasi menetapkan tujuan yang jelas dan terukur, yang dapat menjadi panduan bagi setiap individu dalam mencapai target mereka. Kedua. OKR meningkatkan transparansi dan akuntabilitas, karena setiap anggota tim dapat melihat peran mereka dalam pencapaian tujuan organisasi. Ketiga. OKR memfasilitasi komunikasi yang lebih efektif di seluruh organisasi, memungkinkan penyesuaian strategi secara dinamis untuk merespons perubahan dalam lingkungan bisnis. Dalam konteks penelitian ini. OKR digunakan untuk mengukur dan mengevaluasi kinerja karyawan disuatu Data kinerja yang dikumpulkan melalui OKR dapat memberikan wawasan penting mengenai pencapaian individu maupun tim dalam organisasi . Namun, untuk mendapatkan pemahaman yang lebih mendalam dan akurat diperlukan analisis data lebih komprehensif. Machine learning adalah Aplikasi bagian dari kecerdasan buatan yang membuat sistem memiliki kemampuan belajar secara otomatis dan meningkatkan kemampuan berdasarkan pengalaman tanpa diprogram secara eksplisit . Tujuan dari Machine learning yakni untuk menemukan dan mengaplikasikan pola-pola di dalam data . Machine learning dapat digunakan untuk mengalisis data OKR, membuat prediksi dan rekomendasi yang dapat membantu pengambilan keputusan strategis. Pembersihan dan praproses data, eksplorasi data, pelatihan dan evaluasi model adalah beberapa langkah penting dalam proses ini . Dalam pengolahan data OKR kinerja karyawan, metode Decision Tree digunakan sebagai salah satu teknik Machine learning. Metode Decision Tree ini merupakan teknik klasifikasi yang efektif dalam proses tersebut . Dengan menggunakan teknik Machine learning, hasil analisis ini diharapkan dapat memberikan gambaran yang lebih jelas dan mendalam tentang faktor-faktor yang mempengaruhi kinerja karyawan. Decision Tree adalah metode dalam Machine learning yang digunakan untuk klasifikasi dan regresi. Metode ini memodelkan keputusan dan hasil strukkturnya menyerupai pohon. Simpul akar . nternal nod. mewakili fitur dalam dataset, simpul ranting . ranch nod. mewakili aturan keputusan, dan setiap simpul daun . eaf nod. mewakili hasil atau output . Penelitian ini diharapkan perusahaan dapat meningkatkan produktivitas dan efektivitas kerja, serta mencapai tujuan strategis mereka dengan lebih optimal dengan penggunaan Machine learning dan algoritma Decision Tree dalam analisis data kinerja kerja. Dengan demikian, teknologi Machine learning dapat diintegrasikan dengan kerangka kerja OKR untuk membuat sistem pengelolaan kinerja karyawan yang lebih efisien. METODE PENELITIAN Metodologi untuk pembuatan data sintetis menggunakan faker. Faker sangat berguna untuk kebutuhan pengujian, simulasi, dan pengembangan perangkat lunak, terutama ketika data asli tidak tersedia atau tidak digunakan karena alasan privasi atau keamanan . Metodologi yang digunakan untuk menganalisis data adalah dengan penerapan Machine learning menggunakan algoritma Decision Tree. Algoritma Decision Tree ini bertujuan untuk memprediksi kinerja karyawan, dengan haril output yang dikategorikan sebagai cukup, baik, memuaskan, dan sangat memuaskan . Metodologi yang digunakan untuk pengembangan website yaitu menggunakan metode waterfall dengan tahapan, requirements analiysis, design, implementasi dan, testing. Tahapan penelitian sebagai berikut. Gambar 1. Tahapan Penelitian Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result 1 Analisis Data sintetis yang telah dibuat dianalisis menggunakan Machine learning dengan mengimplementasikan algoritma Decision Tree untuk memprediksi kinerja karyawan. 2 Preprocedding Data Data yang telah diperoleh perlu diolah terlebih dahulu sebelum digunakan untuk prediksi. Pengolahan data ini bertujuan untuk mempersiapkan data agar dapat digunakan secara efektif dalam proses prediksi. 3 Exploratory Data Analysis (EDA) Exploratory Data Analysis (EDA) adalah pendekatan untuk menganalisis data dengan cara visualisasi, statistik, dan teknik eksplorasi lainnya untuk memahami struktur, pola, dan hubungan dalam dataset sebelum menerapkan model analitik atau Machine learning. 4 Feature Engineering Feature Engineering adalah proses dalam Machine learning dan data science yang melibatkan pembuatan, transformasi, dan pemilihan fitur . dari data mentah untuk meningkatkan kinerja model prediksi. Tujuannya adalah untuk membuat fitur yang lebih informatif, relevan, dan berguna bagi algoritma Machine learning. 5 Normalisasi Data Proses skala ulang fitur dalam dataset sehingga semua fitur memiliki rentang yang serupa, biasanya dalam rentang 0 hingga 1 atau -1 hingga 1. Proses ini membantu algoritma Machine learning berkonvergensi lebih cepat dan meningkatkan akurasi model. Contoh seperti ditunjukkan pada rumus formula. ycuA = ycu Oe ycu_ycoycnycu ycu_max Oe ycu_ycoycnycu . Keterangan: X = nilai asli dari fitur. Xmin = nilai minimum dari fitur dalam dataset. Xmax = nilai maksimum dari fitur dalam dataset. XA = nilai yang dinormalisasi. 6 Encode Data Proses konversi data ke dalam format yang dapat dipahami oleh algoritma Machine learning, terutama ketika data tersebut tidak berbentuk numerik. 7 Modeling Proses pembagian dataset menjadi set pelatihan . raining se. dan set pengujian . est se. untuk evaluasi model. Pembagian ini membantu dalam melatih model pada data yang sudah dikenal dan menguji kinerjanya pada data yang belum pernah dilihat sebelumnya. 8 Implementasi Algoritma Decision Tree Tahap di mana model Decision Tree dibangun dan digunakan untuk melakukan prediksi berdasarkan dataset yang tersedia. Langkah-langkah implementasi ini melibatkan beberapa fase, mulai dari preprocessing data hingga evaluasi model. 9 Rumus Gini Index Rumus dari algoritma gini index bertujuan untuk mengukur kemurnian atau homogenitas daris sebuah node. Contoh seperti ditunjukkan pada rumus formula . ycu yaycnycuycn. cI) = 1 Oe Oc ycEycn2 . ycn=1 Keterangan: S = set data atau node yang sedang dianalisis. n = jumlah kelas yang ada dalam data. Pi = proporsi dari elemen dalam kelas i di dalam set data S. 10 Evaluasi Model Dengan memvisualisasikan hasil prediksi menggunakan pohon keputusan dan confusion matri, peneliti dapat memperoleh gambaran yang jelas tentang pola dan distribusi kelompok-kelompok tersebut. Selain itu Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result memvisualisasikan kinerja karyawan pada setiap predikat memungkinkan peneliti untuk mengetahui nilai rata-rata kinerja setiap karyawannya 11 Use Case Use Case diagram menggambarkan fungsional yang di harapkan dari sebuah sistem. Tujuan dari Use Case adalah untuk menunjukkan interaksi antara aktor dengan sistem. Aktor adalah suatu entitas manusia yang berinteraksi dengan sistem untuk melakukan pekerjaan-pekerjaan tertentu. Gambar 1. Use Case Sistem Prediksi Penilaian Kinerja Karyawan HASIL DAN PEMBAHASAN Pada bagian ini dijelaskan terkait dengan pengolahan data yang di lakukan pada data kinerja karyawan menggunakan Machine learning. Imporiting Library Pada tahap ini mengimport semua library yang dibutuhkan untuk memprediksi penilaian kinerja karayawan. Gambar 3. Importing Library Membaca Data Data yang dipakai data sintetis kinerja karyawan dengan format . CSV Gambar 4. Membaca Data Data Processing Data Processing bertujuan untuk memastikan bahwa data yang digunakan dalam model adalah akurat, konsisten dan bebas dari kesalahan. Proses ini mencakup berbagai langkah untuk mengatasi maslah umum yang ditumukan dalam data mentah. Gambar 5. Data Processing Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Exploratory Data Analysis (EDA) Exploratory Data Analysis (EDA) adalah pendekatan untuk menganalisis data dengan cara visualisasi, statistik, dan teknik eksplorasi lainnya untuk memahami struktur, pola, dan hubungan dalam dataset sebelum menerapkan model analitik atau Machine learning. Distribusi target q1 memiliki nilai 1. 07, dan target q2 memiliki nilai 1. memiliki skewness posistif yang signifikan, yang mengidentifikasikan bahwa data cenderung berkumpul di nilainilai yang lebih rendah dengan beberapa outlier tinggi. Gambar 6. Diagram Target Q1 Gambar 7. Diagram Target Q2 Complexcity memiliki nilai 0. 19, memiliki distribusi yang hampir simetris data yang relatif merata dan target q2 memiliki nilai 1. 16, yang mengidentifikasikan bahwa data cenderung berkumpul di nilai-nilai yang lebih rendah dengan beberapa outlier tinggi. Gambar 8. Diagram Complexcity Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Gambar 9. Diagram Progress Q1 Progress Q2 memiliki nilai 1. 12, yang mengidentifikasikan bahwa data cenderung berkumpul di nilai-nilai yang lebih rendah dengan beberapa outlier tinggi. Assignor rating q1 memiliki nilai -0. 02, data cenderung pada nilai yang lebih tinggi dengan beberapa outlier rendah. Gambar 10. Diagram Progress Q2 Gambar 11. Diagram Assignor Rating Q1 Assignor rating q1 memiliki nilai -0. 12 dan nilai quartal 1 memiliki nilai -0. 36, data cenderung pada nilai yang lebih tinggi dengan beberapa outlier rendah. Gambar 12. Diagram Assignor Rating Q2 Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Gambar 13. Diagram Nilai Quartal 1 Nilai quartal 2 memiliki nilai -0. 4 dan predikat -0. 31, data cenderung pada nilai yang lebih tinggi dengan beberapa outlier rendah. Gambar 14. Diagram Nilai Quartal 2 Gambar 15. Diagram Predikat Feature Engineering Proses dalam Machine learning dan data science yang melibatkan pembuatan, transformasi dan pemilihan fitur . dari data mentah guna meningkatkan kinerja model prefiktif. Gambar 16. Feature Engineering Normaslisasi Data Gambar 17 adalah proses normalisasi data. Proses mengubah data ke dalam skala tertentu biasanya antara 0 dan 1, tanpa mengubah distribusi atau hubungan antara nilai-nilai dalam dataset. Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Gambar 17. Data Yang Telah Dinormalisasikan Data Encoded Gambar dibawah ini adalah proses data encoded. Proses konversi data ke dalam format yang dapat dipahami oleh algoritma Machine learning, terutama ketika data tersebut tidak berbentuk numerik. Gambar 18. Data Encoded Modelling Gambar dibawah ini adalah proses modeling. Proses merancang dan melatih model matematis untuk memprediksi atau mengklasifikasikan data berdasarkan pola yang ditemukan dalam dataset. Gambar 19. Modelling Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Model Training Algoritma Decision Tree Gambar dibawah ini hasil dari traning model menggunakan algoritma Decision Tree, yang menghasilkan pohon keputusan, pohon keputusan ini mencari hasil akhir. Berikut adalah codenya. Gambar 20. Kode Pembuatan Pohon Keputusan Berikut keterangan untuk gambar dibawah ini Predikat O 69. 821: Sebagian besar data diklasifikasikan sebagai 'Baik' jika nilai predikat di bawah 69. Predikat O 44. 083: Dalam subset dengan Predikat O 69. 821, jika predikat juga kurang dari atau sama dengan 083, mayoritas sampel akan diklasifikasikan sebagai 'Cukup'. Predikat > 88. 95: Jika nilai predikat lebih besar dari 88. 95, sebagian besar data diklasifikasikan sebagai 'Baik', tetapi klasifikasi lebih lanjut bergantung pada nilai Nilai_Quartal_2. Gambar 21. Pohon Keputusan Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Evaluasi Model Precision. Recall, dan F1 Score Precision: Mengukur berapa banyak dari prediksi yang benar-benar relevan. Rumusnya adalah Precision = True Positives / (True Positives False Positive. Recall: Mengukur berapa banyak dari kasus yang relevan yang berhasil ditemukan oleh model. Rumusnya adalah Recall = True Positives / (True Positives False Negative. F1 Score: Merupakan harmonic mean dari precision dan recall, memberikan gambaran keseimbangan antara keduanya. Rumusnya adalah F1 = 2 * (Precision * Recal. / (Precision Recal. Precision: 1. 0 (Mencapai 100% untuk presisi, artinya semua prediksi yang dibuat model benar-benar Recall: 0. 95 (Artinya, model berhasil menemukan 95% dari semua kasus yang releva. F1 Score: 0. 97 (Gabungan dari precision dan recall yang sangat tingg. Accuracy Accuracy on test set: 0. % dari prediksi model pada data uji adalah bena. Ini dihitung dengan accuracy = (True Positives True Negative. / Total Samples. Classification Report Classification report memberikan rincian performa model pada masing-masing kelas yang diprediksi. Kolom yang dijelaskan dalam classification report adalah sebagai berikut: Precision: Tingkat ketepatan model dalam mengklasifikasikan setiap kelas. Recall: Kemampuan model dalam mendeteksi setiap kelas. F1-Score: Keseimbangan antara precision dan recall untuk setiap kelas. Support: Jumlah contoh sebenarnya untuk setiap kelas dalam dataset uji. Pada laporan ini, kita melihat performa pada empat kelas: 'Baik', 'Cukup', 'Memuaskan', dan 'Sangat Memuaskan'. Overall Metrics: Accuracy: 95% Macro Average: Average dari precision, recall, dan F1-Score dihitung untuk setiap kelas dan diambil rata-rata . 75 untuk precision dan recall, 0. 77 untuk F1-Scor. Weighted Average: Rata-rata tertimbang dari metrik di atas berdasarkan support dari setiap kelas . 77 untuk F1-Scor. Confussion Matrix Karena data yang digunakan sedikit berikut hasil analisis menggunakan confusion mastrix. Akurasi Tinggi pada 'Baik', 'Cukup', dan AoKurangAo: Model ini memiliki performa yang sangat baik dalam mengklasifikasikan kelas 'Baik', 'Cukup', dan AoKurangAo, yang ditunjukkan oleh nilai diagonal yang tinggi . , 8, dan . tanpa ada kesalahan . ilai di luar diagonal utam. Struktur Confussion Matrix: Baris (Actua. : Label sebenarnya dari data uji. Kolom (Predicte. : Prediksi yang dibuat oleh model. Diagonal utama: Prediksi yang benar untuk setiap kelas. Di luar diagonal: Kesalahan prediksi. Interpretasi: Baik: 5 prediksi benar, 0 salah. Cukup: 8 prediksi benar, 0 salah. Kurang: 6 prediksi benar, 1 salah. Memuaskan: Tidak ada prediksi benar. Sangat Memuaskan: Tidak ada prediksi. Andrian Falah Kalyana, dkk. Implementasi Algoritma Decision Tree Pada Penilaian Kinerja Karyawan Menggunakan Kerangka Objective And Key Result Gambar 22. Confussion Matriks Penilaian Kinerja Karyawan KESIMPULAN Penelitian ini mengimplementasikan metode pembuatan data sintetis dan algoritma pohon keputusan (Decision Tre. untuk memprediksi kinerja karyawan. Hasil evaluasi model menunjukkan akurasi sebesar 95%, yang berarti 95% dari prediksi model pada data uji sesuai dengan hasil yang benar. Selain itu, evaluasi juga mencakup penghitungan macro average dan weighted average, dengan nilai precision dan recall masing-masing mencapai 75, serta F1-Score sebesar 0. 77 pada kedua kategori tersebut. Analisis confusion matrix mengindikasikan bahwa model ini unggul dalam mengklasifikasikan kelas 'Baik', 'Cukup', dan 'Kurang', dengan prediksi akurat sebanyak 5, 8, dan 6 kali. Namun, terdapat tantangan dalam mengklasifikasikan kelas 'Memuaskan' dan 'Sangat Memuaskan'. Penggunaan library Python Faker berhasil menghasilkan data sintetis yang sangat menyerupai data asli tanpa mengungkapkan informasi sensitif. Algoritma Decision Tree juga mampu membentuk model yang efektif dalam menggambarkan proses pengambilan keputusan berbasis data pelatihan, menghasilkan prediksi yang akurat, dan relevan untuk penilaian kinerja karyawan. DAFTAR PUSTAKA