PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . ISSN . ANALISIS BUTIR SITUATIONAL JUDGEMENT TEST KOMPETENSI INTI KARYAWAN PT ANGKASA PURA INDONESIA DENGAN RASCH MODEL ANALYSIS OF SITUATIONAL JUDGMENT TEST OF CORE COMPETENCIES USING THE RASCH MODEL ON EMPLOYEES OF BUMN PT ANGKASA PURA INDONESIA Chasya Nia Khoerunnisa & Moh. Abdul Hakim Fakultas Psikologi. Universitas Sebelas Maret. Surakarta nia1106@gmail. hakim@staff. ABSTRAK Asesmen kompetensi dalam manajemen sumber daya manusia sangat penting untuk memetakan kebutuhan pengembangan pegawai. PT Angkasa Pura Indonesia, salah satu perusahaan sektor transportasi di Indonesia, mengembangkan asesmen kompetensi dalam bentuk tes menggunakan metode Situational Judgment Test (SJT). Penelitian ini bertujuan untuk melakukan analisis kualitas butir SJT kompetensi inti dengan model Rasch berdasarkan sampel karyawan PT Angkasa Pura Indonesia. Teknik purposive sampling digunakan dengan kriteria pemilihan sampel yaitu karyawan PT Angkasa Pura Indonesia dengan kelompok jabatan level 1 . sebanyak 3,989 karyawan. Analisis kualitas butir dilakukan dengan model Rasch pada 27 butir soal yang mengukur tiga kompetensi inti, yaitu Customer Focus (CFO). Driving Innovation (DIN), dan Building Strategic Partnership (BSP). Hasil analisis Rasch menunjukkan keseluruhan butir fit dengan nilai infit dan outfit dalam rentang . ,5 - 1,. , sedangkan pada measure seluruh butir berada dalam rentang logit sedang (-2,0 - 2,. Wright Map menunjukkan bahwa tiga kompetensi inti memotret kemampuan pada tingkatan rerata. Namun, butir soal pada kompetensi CFO dan DIN tidak memotret abilitas rendah maupun tinggi, sedangkan pada BSP butir soal tidak memotret abilitas rendah. Penelitian ini menyimpulkan bahwa instrumen SJT ini memiliki kualitas dan keandalan yang baik sebagai alat asesmen kompetensi inti di PT Angkasa Pura Indonesia. Kata Kunci: analisis butir, kompetensi inti, rasch model, situational judgment test, validasi alat tes ABSTRACT PT Angkasa Pura Indonesia, a transportation company in Indonesia, has developed a competency assessment in the form of a test using the Situational Judgment Test (SJT) The purpose of this study is to analyze the quality of the core competency items of the SJT using the Rasch model based on a sample of PT Angkasa Pura Indones employees. The sampling technique employed is purposive sampling, with the criteria for selecting samples being PT Angkasa Pura Indonesia employees holding position level 1 . amounting to 3,989 employees. The quality analysis of the items was conducted using the Rasch model on 27 items that measure 3 core competencies: Customer Focus (CFO). Driving Innovation (DIN), and Building Strategic Partnerships (BSP) for position level 1 . The Rasch analysis results showed that all items fit within the infit and outfit values ranging 5 to 1. 5, and all items were within the moderate logit range (-2. 0 to 2. The Wright Map demonstrated that the 3 core competencies captured ability at the average level. However, the items in the CFO and DIN competencies did not capture low or high abilities, while the BSP items did not capture low abilities. This study concludes that the SJT https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 instrument has good item quality and reliability and can be used as a core competency assessment tool at PT Angkasa Pura Indonesia. Keywords: item analysis, core competencies. Rasch model, situational judgment test, validation of test equipment PENDAHULUAN Asesmen kompetensi merupakan upaya penting untuk memberikan gambaran mengenai kemampuan kinerja karyawan, termasuk kekuatan, kelemahan, keterampilan, dan potensi karyawan, serta untuk merancang program pengembangan yang dapat meningkatkan kualitas dan kuantitas kerja (Mintawati et al. , 2. Asesmen kompetensi biasanya digunakan untuk mengukur kemampuan individu di berbagai sektor, mulai dari sektor kesehatan, pendidikan hingga perusahaan (Junaedi et al. , 2023. Nurlina, 2019. Setiawati & Hindriana, 2. Dalam konteks perusahaan, salah satu penerapannya asesmen kompetensi terdapat di Perusahaan Badan Usaha Milik Negara (BUMN). Penerapan ini sejalan dengan Peraturan Menteri mengenai kewajiban karyawan untuk . Permen BUMN 11/MBU/07/2021 tentang syarat, tata cara pengangkatan, dan pemberhentian calon anggota Direksi BUMN, . Permen BUMN No. Per 04/MBU/10/2019 tentang Kamus Kompetensi ASN di Lingkungan Kementerian BUMN (Kementrian BUMN, 2019, 2. Sejalan dengan peraturan menteri tersebut, salah satu perusahaan BUMN yang bergerak di bidang transportasi. PT Angkasa Pura Indonesia (PT API), telah menerapkan kamus kompetensi dalam pengembangan asesmen kompetensi menggunakan metode assessment center yang biasanya digunakan untuk keperluan seleksi, promosi dan pengembangan karyawan berbasis kompetensi (Kleinmann & Ingold, 2. Namun, dalam penerapan assessment center di PT API, terdapat beberapa implikasi yang mengindikasikan perlunya peningkatan efektivitas pelaksanaan asesmen. Implikasi ini meliputi biaya operasional yang besar dan kebutuhan jumlah asesor yang tinggi, sementara jumlah karyawan yang perlu dinilai cukup banyak. Oleh karena itu. PT API mengembangkan asesmen kompetensi menggunakan metode Situational Judgment Test (SJT) yang meminimalkan keterlibatan asesor. PT API mengembangkan asesmen komptensi dengan SJT dengan tiga model kompetensi yaitu core competency . ompetensi int. , leadership competency . ompetensi https://doi. org/10. 36269/psyche. ompetensi Dengan PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 mengembangkan model asesmen SJT ini, diharapkan kompetensi karyawan dapat diukur melalui respon karyawan terhadap situasi pekerjaan yang relevan (Lievens & Motowidlo. Asesmen kompetensi berbasis SJT yang dikembangkan PT API telah melalui uji validitas isi yang dilakukan oleh ahli psikometri dan asesor SDM (Hakim et al. , 2. Namun, masih diperlukan penelitian lebih lanjut untuk mengevaluasi kualitas psikometris butir-butir tes tersebut untuk mengoptimalkan keandalannya (Courville. Oleh karena itu, perlu dilakukan analisis kualitas butir dengan cara merevisi atau menghapus soal yang tidak efektif, serta memberikan informasi diagnostik mengenai pemahaman karyawan terhadap kompetensi yang diuji (Aiken, 1. Dalam analisis kualitas butir, terdapat beberapa pendekatan yang sering digunakan, yaitu teori tes klasik dan teori respon butir . tem response theor. Kedua pendekatan ini telah digunakan dalam berbagai penelitian untuk menganalisis kualitas butir soal (Jumini et al. , 2023. Pratama, 2. Namun, untuk analisis butir pada asesmen kompetensi di PT API, pendekatan teori respon butir . tem response theor. akan memberikan hasil yang lebih optimal karena IRT memiliki hasil analisis yang lebih akurat apabila diterapkan pada sampel yang besar (Siregar & Panjaitan, 2. Teori respon butir . tem response theor. menganalisis hubungan antara respon individu dan karakteristik item dengan Rasch Model sebagai salah satu modelnya yang mengklasifikasikan item dan individu dalam peta distribusi untuk menilai kemampuan dan kesukaran item secara akurat (Azizah & Wahyuningsih, 2. Rasch Model menjadi pilihan yang tepat karena bermanfaat untuk mengukur tingkat kesukaran item, kualitas instrumen, dan tingkat kemampuan individu secara bersamaan (Rahman et al. , 2. Penelitian sebelumnya oleh Kusuma & Hakim . telah melakukan analisis butir menggunakan Rasch Model pada asesmen kompetensi berbasis SJT di PT API, khususnya untuk model kepemimpinan pada level jabatan 1 . Hasil penelitian tersebut membuktikan bahwa alat tes kompetensi kepemimpinan memiliki kualitas dan keandalan butir yang dapat menjadi instrumen asesmen berkelanjutan dengan rekomendasi perbaikan pada butir tertentu. Meskipun penelitian tersebut telah memberikan kontribusi dalam pengembangan asesmen kompetensi di PT API, masih terdapat model kompetensi lain yang belum di analisis kualitas butirnya seperti core competency . ompetensi int. dan functional competency . ompetensi fungsiona. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Berdasarkan kamus kompetensi PT API, terdapat tiga kompetensi inti yang menjadi tujuan strategis organisasi yaitu customer focus . ervice orientatio. , building strategic partnerships, dan driving innovation . Oleh karena itu, analisis butir terhadap kompetensi inti ini menjadi penting untuk memastikan kontribusi optimal karyawan terhadap kinerja organisasi. Hal ini didukung oleh penelitian Liang et al. yang menunjukkan korelasi positif antara kompetensi inti dan kinerja organisasi. Mempertimbangkan pentingnya level jabatan 1 . sebagai pondasi awal karir, penelitian ini fokus pada analisis butir tes kompetensi inti untuk level tersebut. Hasil analisis ini dapat menjadi dasar yang kuat untuk merancang program pengembangan karyawan yang efektif dan selaras dengan kebutuhan strategis perusahaan. Berbagai penelitian terdahulu telah menerapkan Rasch Model dalam menganalisis kualitas butir soal (Aqida, 2024. Sugitri & Fitri, 2024. Widyaningsih et al. , 2. Lebih lanjut, penggunaan Rasch Model dalam menganalisis butir Situational Judgment Test (SJT) juga telah dilakukan sebelumnya baik dalam sektor organisasi maupun non-organisasi sebagai instrumen evaluasi kompetensi bagi tenaga pengajar dan tenaga kesehatan (Chao et al. , 2019. Heininger et al. , 2. Sementara itu, dalam lingkup BUMN. Kusuma & Hakim . telah menerapkan Rasch Model untuk menganalisis kualitas butir SJT pada kompetensi kepemimpinan. Namun, belum ada penelitian yang secara khusus menganalisis kompetensi inti. Oleh karena itu, penelitian ini bertujuan untuk menganalisis kualitas butir SJT instrumen pengukuran kompetensi inti level jabatan 1 . dengan Rasch Model pada karyawan PT Angkasa Pura Indonesia. METODE PENELITIAN Penelitian ini menggunakan pendekatan kuantitatif dengan data sekunder yang diperoleh melalui hasil asesmen kompetensi yang telah dilakukan oleh PT API. Pengumpulan data dalam penelitian ini diperoleh melalui asesmen kompetensi yang dilakukan oleh PT API menggunakan sistem Computer Based Test (CBT) yang dikembangkan oleh PT API. Pengumpulan data dilakukan mulai tanggal 26 Februari 2024 hingga 4 Juni 2024, dengan cakupan wilayah meliputi kantor pusat dan 20 kantor cabang yang tersebar di seluruh Indonesia dengan persebaran distribusi responden berdasarkan wilayah meliputi provinsi Aceh . %). Banten . %). DKI Jakarta . ,7%). Jambi . ,7%). Jawa Barat . ,4%). Jawa Tengah . ,2%). Jawa Timur . ,1%). Kalimantan Barat . ,4%), https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Kalimantan Tengah . ,1%). Kepulauan Bangka Belitung . ,0%). Lampung . ,2%). Riau . ,3%). Sumatera Barat . ,4%). Sumatera Selatan . ,5%), dan Sumatera Utara . ,0%). Populasi merupakan keseluruhan objek atau subjek yang memiliki karakteristik dan kualitas tertentu yang ditetapkan peneliti untuk diteliti dan dijadikan dasar penarikan kesimpulan (Sugiyono, 2. Populasi dalam penelitian ini adalah karyawan PT Angkasa Pura Indonesia. Sampel merupakan bagian dari populasi yang memiliki karakteristik tertentu yang mewakili suatu populasi (Sugiyono, 2. Metode pengambilan sampel dalam penelitian ini diambil berdasarkan non probability sampling dengan teknik purposive sampling, dimana pemilihan sampel dilakukan berdasarkan kriteria atau pertimbangan khusus yang telah ditentukan oleh peneliti (Sugiyono, 2. Kriteria pemilihan sampel yaitu karyawan PT API yang merupakan kelompok jabatan level 1 . Oleh karena itu, jumlah sampel yang digunakan sebanyak 3. 989 orang. Teknik analisis data dalam penelitian ini dilakukan dengan menganalisis butir masing-masing kompetensi inti menggunakan metode Rasch Model Unidimensional, dengan bantuan aplikasi Jamovi 2. Analisis ini menghasilkan berbagai parameter, yaitu skor Item Mean . ata-rata buti. Measure . ingkat kesukara. Standard Error (SE) Measure, nilai Outfit & Infit, dan Wright Map. Selain itu, uji Martin-Lyf dilakukan guna memastikan bahwa instrumen yang digunakan hanya mengukur satu konstruk utama . (Smith, 2. Uji ini bertujuan untuk memverifikasi asumsi unidimensionalitas dalam model Rasch. Penelitian ini menggunakan instrumen SJT yang dikembangkan oleh PT API untuk mengukur 3 kompetensi inti pada karyawan PT API. Instrumen tersebut terdiri dari 27 butir yang mengukur 3 kompetensi inti pada level kompetensi 1. Blueprint kompetensi inti dapat dilihat pada tabel 1. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Tabel 1. Blueprint Kompetensi Inti Kode Aitem/Butir CFO 1. CFO 1. CFO 1. Customer Focus (Service Orientatio. - CFO CFO 1. CFO 1. CFO 1. CFO 1. CFO 1. CFO 1. CFO 1. CFO 1. CFO 1. BSP 1. BSP 1. BSP 1. Building Strategic Partnership - BSP BSP 1. BSP 1. BSP 1. BSP 1. BSP 1. BSP 1. Customer Focus (Service Orientatio. - CFO TOTAL DIN 1. DIN 1. DIN 1. DIN 1. DIN 1. DIN 1. HASIL PENELITIAN Item Mean. Measure. SE Measure Gambar 1 disusun berdasarkan urutan Measure . ingkat kesukara. setiap item, mulai dari yang paling sukar hingga yang paling mudah. Item Mean memberikan gambaran nilai rata-rata bagi setiap butir (Kusuma & Hakim, 2. Analisis pada alat tes kompetensi ini dilakukan dengan format dikotomi . engan jawaban hanya benar atau sala. , yang artinya secara umum skor rata-rata butir . tem mea. Hal ini mengindikasikan bahwa 50% responden memberikan jawaban benar dan 50% responden memberikan jawaban salah. Artinya, apabila item mean < 0. 5, maka lebih dari 50% responden memberikan jawaban salah pada butir terkait . , sedangkan apabila item mean > 0. 5, maka lebih dari 50% responden memberikan jawaban benar pada butir terkait . Berdasarkan hasil analisis pada tabel 6, terdapat 23 butir memiliki item mean < 0,5 dan 4 butir memiliki item mean > 0,5. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Gambar 1. Sebaran Item Mean per Item SJT Measure memberikan gambaran tentang kesukaran bagi setiap butir (Sumintono & Widhiarso, 2. Berdasarkan hasil analisis, seluruh butir soal berada pada tingkat kesukaran butir sedang, dengan rentang -2,0 logit hingga 2,0 logit (Hadiyanti et al. , 2. Pada kompetensi CFO, nilai logit butir soal berada di rentang 1. 3146 - 1. Dari seluruh butir soal. CFO 1. 1 memiliki tingkat kesukaran tertinggi dengan nilai logit sebesar 1. 1246, sedangkan CFO 1. 2 memiliki tingkat kesukaran paling rendah dengan nilai logit sebesar -1. Pada kompetensi BSP, nilai logit butir soal berada di rentang -1. 04907 - 0. Dari seluruh butir soal. BSP 1. 3 memiliki tingkat kesukaran tertinggi dengan nilai logit sebesar 0. 92048, sedangkan BSP 1. memiliki tingkat kesukaran paling rendah dengan nilai logit sebesar -1. Pada kompetensi DIN, nilai logit butir soal berada di rentang -1. 258 - 1. Dari seluruh butir soal. DIN 1. 3 memiliki tingkat kesukaran tertinggi dengan nilai logit sebesar 028, sedangkan DIN 1. 2 memiliki tingkat kesukaran paling rendah dengan nilai logit sebesar -1. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Gambar 2. Sebaran Measure per Item SJT Nilai SE Measure memberikan gambaran evaluasi mengenai stabilitas estimasi kemampuan individu dalam satuan logit, di mana semakin besar nilai standard error, maka semakin kurang akurat estimasi kemampuannya (Katz et al. , 2. Berdasarkan hasil analisis, nilai SE Measure pada seluruh kompetensi inti berada dalam rentang 0346 - 0. 0524 dengan nilai SE Measure terendah adalah CFO 1. 2 sebesar 0. yang menunjukkan stabilitas pengukuran paling akurat dibandingkan aitem lainnya. Sedangkan, nilai SE Measure tertinggi adalah BSP 1. 3 sebesar 0. 0524, yang mengindikasikan stabilitas pengukurannya kurang akurat dibandingkan aitem Gambar 3. Sebaran SE Measure per Item SJT https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Item Fitness Nilai infit menunjukkan seberapa baik butir soal sesuai dengan pola keseluruhan tes, sedangkan nilai outfit mengukur hubungan butir soal dengan kemampuan yang diukur dan lebih sensitif terhadap respons yang tidak terduga atau outlier (Aqida & Khairunisa, 2. Berdasarkan hasil analisis, seluruh butir soal pada kompetensi inti menunjukkan nilai infit dan outfit yang dapat dikatakan fit dengan nilai dalam rentang 0. 5 - 1. 5 (Andrich & Marais, 2. Pada kompetensi Customer Focus (CFO), rentang skor infit adalah 0. 923 - 1. sedangkan skor outfit berada pada rentang 0. 889 - 1. Kompetensi Building Strategic Partnership (BSP) memiliki rentang skor infit sebesar 0. 942 - 1. 092 dan rentang skor outfit sebesar 0. 927 - 1. Terakhir, pada kompetensi Driving Innovation (DIN), rentang skor infit sebesar 0. 949 - 1. 021, sedangkan skor outfit berada di rentang 0. 894 - 1. Gambar 4. Sebaran Item Fitness per Item SJT https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Persebaran Wright Map Wright Map adalah representasi grafis dua dimensi yang digunakan untuk menunjukkan hubungan antara kemampuan responden dan tingkat kesulitan butir (Green & Frantom, 2. Area kanan pada Wright Map menunjukkan kemampuan individu, dengan kemampuan lebih rendah berada di bawah dan yang lebih tinggi di atas, sedangkan area kiri menunjukkan tingkat kesukaran soal, dengan soal yang lebih sulit berada di atas dan yang lebih mudah di bawah (Sukarelawan et al. , 2. Dalam analisis butir kompetensi inti, butir-butir dengan tingkat kesukaran tinggi terlihat pada area kanan atas, sedangkan butir dengan tingkat kesukaran rendah berada di bagian kanan bawah. Nilai pada area kanan menggambarkan visualisasi distribusi dari item measure yang menyajikan informasi secara kuantitatif. Sementara itu, kelompok responden . dengan abilitas atau kompetensi tinggi terlihat pada area kiri atas, sedangkan pada bagian kiri bawah merupakan kelompok responden . dengan abilitas atau kompetensi rendah. Berdasarkan distribusi Wright Map, area kanan pada kompetensi Customer Focus (CFO). Building Strategic Partnership (BSP) dan Driving Innovation (DIN) menunjukkan bahwa tidak terdapat butir soal yang lebih tinggi dari nilai logit . atau lebih rendah dari nilai logit (-. , sehingga seluruh butir soal pada kompetensi tersebut memiliki tingkat kesukaran yang sedang. Wright map ini menunjukkan bahwa persebaran butir soal pada kompetensi seluruh kompetensi CFO dapat memotret abilitas rata-rata. Namun, tidak ada butir soal yang dapat memotret abilitas rendah maupun tinggi. Sedangkan seluruh kompetensi BSP dapat memotret abilitas rata-rata. Namun, tidak ada butir soal yang dapat memotret abilitas rendah. Wright map ini menunjukkan bahwa persebaran butir soal pada seluruh kompetensi DIN dapat memotret abilitas rata-rata. Namun, tidak ada butir soal yang dapat memotret abilitas rendah maupun tinggi. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Gambar 5. Wright Map Kompetensi CFO Gambar 6. Wright Map Kompetensi BSP Gambar 7. Wright Map Kompetensi DIN Uji Unidimensi (Martin-Ly. Uji unidimensionalitas (Martin-Ly. dilakukan dengan melihat nilai . -valu. , 0,05 multidimensionalitas (Horton et al. , 2. Berdasarkan hasil uji unidimensionalitas yang disajikan pada tabel 6, diperoleh bahwa kompetensi Customer Focus (CFO) dan Driving Innovation (DIN) menunjukkan unidimensionalitas yang baik dengan nilai p untuk CFO sebesar 0. > 0. dan DIN sebesar 0. > 0. Sementara kompetensi Building Strategic Partnership (BSP) menunjukkan kecenderungan multidimensionalitas dengan nilai p sebesar 0. < 0. Tabel hasil uji unidimensionalitas per kompetensi dapat dilihat pada tabel 2. https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Tabel 2. Hasil Uji Unidimensionalitas Per Kompetensi Kompetensi Value Customer Focus (CFO) Building Strategic Partnership (BSP) Driving Innovation (DIN) DISKUSI Rata-rata butir . tem mea. secara umum adalah 0. 5 yang artinya setengah responden menjawab benar dan setengahnya menjawab salah. Hasil analisis menunjukkan 23 butir dijawab salah oleh sebagian besar responden, sementara 4 butir lainnya dijawab benar oleh sebagian besar responden, mengindikasikan adanya butir yang terlalu mudah atau terlalu sulit. Oleh karena itu, analisis selanjutnya berfokus pada pendalaman tingkat kesukaran setiap butir soal . menggunakan nilai logit. Hasil analisis menunjukkan bahwa butir soal secara keseluruhan berada pada tingkat kesulitan yang baik, yakni dalam kategori sedang (Hadiyanti et al. , 2. Butir soal yang diterima adalah yang memiliki tingkat kesulitan sesuai dengan rentang yang ditentukan (Nuryanti et al. , 2. Selanjutnya, stabilitas estimasi kemampuan individu dievaluasi melalui nilai Standard Error (SE) Measure. Semakin besar nilai SE, semakin kurang akurat estimasi kemampuan responden (Katz et al. , 2. Meskipun sebagian besar butir soal mengukur kompetensi dengan presisi, butir soal dengan SE Measure tertinggi (BSP 1. menunjukkan estimasi kemampuan yang kurang akurat jika dibandingkan dengan butir soal lainnya, sehingga perlu evaluasi lebih lanjut. Item fitness digunakan untuk mengevaluasi kecocokan setiap butir soal. Hasil analisis menunjukkan bahwa seluruh butir soal berada dalam rentang infit dan outfit yang baik . 5 - 1. , serta tidak ada butir soal yang misfit (Andrich & Marais, 2. Oleh karena itu, meskipun terdapat indikasi awal bahwa terdapat butir soal yang mungkin kurang andal berdasarkan hasil pengukuran SE Measure, hasil evaluasi item fitness menunjukkan bahwa instrumen ini valid dan andal untuk mengukur kompetensi (Chasanah et al. , 2. Tidak ditemukannya item misfit dalam instrumen ini mengonfirmasi bahwa setiap butir soal sesuai untuk mengukur kompetensi inti karyawan PT API (Napitupulu, 2. Hal ini menunjukkan bahwa semua soal berfungsi https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 sesuai tujuan pengukuran. Soojung et al. , . berpendapat bahwa apabila terdapat butir soal yang tidak sesuai . , maka aitem tersebut mengukur konstruk yang berada di luar tujuan pengukuran instrumen sehingga perlu dilakukan revisi atau Selain itu, butir soal misfit juga dapat menurunkan keandalan tes (Zubairi & Kassim, 2. Dengan tidak adanya item misfit, instrumen ini memenuhi standar kualitas yang diperlukan dan tidak memerlukan perubahan lebih lanjut. Berdasarkan hasil analisis wright map, yang menunjukkan sejauh mana kemampuan responden . dengan tingkat kesulitan soal pada skala logit yang sama, diperoleh seluruh butir soal pada 3 kompetensi inti yaitu Customer Focus (CFO). Building Strategic Partnership (BSP), dan Driving Innovation (DIN) hanya mampu mengukur kemampuan responden pada tingkat kesukaran yang sedang . ata-rat. Sementara itu, pada kompetensi BSP, tidak ada butir soal yang dapat mengukur kemampuan responden dengan abilitas rendah, sedangkan pada kompetensi CFO dan DIN, tidak ada butir soal yang dapat mengukur kemampuan peserta dengan abilitas rendah maupun tinggi. Hal ini menunjukkan bahwa instrumen tes ini kurang mampu menangkap kemampuan peserta yang ekstrem, baik yang sangat rendah maupun sangat Temuan ini sejalan dengan penelitian Novriyanti & Arthur . , yang menyarankan untuk menambahkan butir soal pada tingkat kesulitan yang sangat mudah dan sangat sulit, sehingga pengukuran instrumen tes dapat lebih efektif dalam mengukur semua tingkat kemampuan peserta. Namun, dalam konteks pengukuran kompetensi inti pada alat ukur PT API, penambahan butir soal yang efektif sebaiknya difokuskan pada butir soal yang memiliki tingkat kesulitan tinggi. Hal ini relevan untuk mengukur kemampuan peserta dengan abilitas tinggi, sehingga dapat memenuhi standar kompetensi yang dibutuhkan PT API. Temuan ini sejalan dengan penelitian oleh Karst et al. , . , yang menyoroti pentingnya keberadaan soal-soal sulit untuk membedakan responden dengan kemampuan tinggi yang mempermudah identifikasi individu dengan potensi terbaik. Penambahan butir soal yang sulit dapat dilakukan dengan melakukan analisis mendalam terhadap kompetensi yang ingin diukur, serta mengintegrasikannya dengan situasi nyata yang relevan dalam penerapannya di PT API, sehingga membutuhkan keterlibatan para ahli/praktisi dalam perusahaan untuk merancang soal yang menantang dan nyata. Selain itu, alternatif lain yang dapat dilakukan adalah melakukan revisi dengan https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 memasukkan soal isomorfik, di mana soal dirancang untuk memiliki struktur dan format yang sama tetapi dengan konteks atau detail yang berbeda (Lievens & Sackett, 2. Sebagai contoh, revisi pada butir soal CFO 1. 1 (Butir soal terlampir pada lampira. , dapat dilakukan dengan menambahkan kalimat Au. Namun. Anda juga menyadari bahwa jika Anda tidak memenuhi permintaan Bapak Andi, dia mungkin akan mencari vendor lain yang menawarkan harga lebih baikAy. Dengan penambahan situasi ini, dilema muncul, sehingga responden harus mempertimbangkan konsekuensi baik untuk menjaga hubungan berkelanjutan dengan pelanggan ataupun untuk menjaga kestabilan finansial perusahaan. Penambahan ini membuat butir soal menjadi lebih kompleks sehingga diharapkan mampu meningkatkan kesulitan soal. Selain itu penerapan Rasch Model dalam analisis ini memungkinkan evaluasi terhadap asumsi unidimensionalitas dan independensi lokal yang merupakan aspek penting dalam validitas instrumen (Sumintono & Widhiarso, 2. Analisis terhadap asumsi unidimensionalitas menunjukkan bahwa kompetensi CFO dan DIN menunjukkan unidimensionalitas yang baik, sedangkan kompetensi BSP cenderung multidimensional, dengan nilai p < 0. 05 (Horton et al. , 2. Hal ini menunjukkan bahwa kompetensi BSP melibatkan berbagai aspek perilaku yang relevan meskipun tidak terfokus pada satu faktor laten tunggal (Kusuma & Hakim, 2. Penelitian ini menggarisbawahi bahwa unidimensionalitas bukanlah keharusan dalam pengukuran kompetensi, karena fokus utama adalah pada keberadaan perilaku kunci yang relevan dalam tugas pekerjaan (Kusuma & Hakim, 2024. Taylor, 2. Hasil menunjukkan bahwa kompetensi dengan unidimensionalitas baik, seperti CFO dan DIN, memiliki kecenderungan untuk memenuhi kriteria independensi lokal, sesuai dengan pendapat Retnawati . yang menyatakan bahwa jika asumsi unidimensionalitas terpenuhi, maka asumsi independensi lokal juga cenderung Sebaliknya, pada kompetensi BSP yang tidak unidimensional, independensi lokal tidak dapat dipastikan. Temuan ini dapat menjadi bahan evaluasi bagi PT API untuk memastikan apakah perilaku-perilaku kunci . eys behavio. yang disusun dalam kamus kompetensi bersifat unidimensional . aktor laten tungga. atau multidimensional. Secara keseluruhan, hasil penelitian menunjukkan bahwa instrumen SJT dapat diterapkan secara berkelanjutan sebagai alat ukur kompetensi inti di PT API. Instrumen ini menunjukkan validitas dan reliabilitas yang baik, serta dapat mengevaluasi https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 kompetensi dengan akurat dan efisien (Ida & Musyarofah, 2021. Rost & Davier, 1. Meskipun demikian, hasil analisis Wright map menunjukkan perlunya penambahan butir soal dengan tingkat kesulitan yang sangat sulit, untuk mengukur spektrum kemampuan responden secara lebih luas. Penelitian ini memberikan beberapa rekomendasi untuk penelitian lebih lanjut, seperti penambahan butir soal yang lebih beragam tingkat kesulitannya dan penerapan pendekatan multidimensional untuk alat tes yang bersifat Penelitian ini juga mencatat keterbatasan dalam hanya menganalisis kompetensi pada level 1, dan tidak mencakup evaluasi parameter psikometris lainnya yang juga dapat mempengaruhi validitas instrumen. Dengan keterbatasan-keterbatasan tersebut, diharapkan penelitian ini dapat menjadi landasan bagi penelitian lanjutan yang lebih mendalam serta memperkuat kontribusi penelitian terhadap pengembangan asesmen kompetensi karyawan di PT API dan bidang psikometri secara umum. KESIMPULAN DAN SARAN Berdasarkan hasil penelitian, dapat disimpulkan bahwa butir-butir soal dalam instrumen Situational Judgment Test (SJT) kompetensi inti karyawan PT Angkasa Pura Indonesia memiliki kualitas dan keandalan butir yang baik dilihat dari tingkat kesukaran butir . tem measur. dan kesesuaian butir . tem fitnes. Tidak ditemukan butir yang gugur berdasarkan kriteria analisis Rasch Model, yang menunjukkan bahwa instrumen ini secara psikometris layak digunakan untuk asesmen kompetensi inti di PT API. Meskipun demikian, penambahan atau revisi butir dengan tingkat kesukaran yang lebih tinggi perlu dipertimbangkan, sehingga cakupan pengukuran kompetensi dapat mengukur kompetensi karyawan dengan kemampuan/abilitas yang tinggi. Dari sisi penerapan, penelitian ini memberikan kontribusi praktis bagi pengembangan asesmen di lingkungan BUMN. Selain itu, secara teoritis, penelitian ini juga memperkaya literatur mengenai penerapan Rasch Model dalam pengembangan alat tes berbasis metode SJT di ranah industri, khususnya dalam lingkup BUMN yang belum banyak dieksplorasi. Temuan ini menunjukkan bahwa Rasch Model efektif dalam mengevaluasi kualitas butir alat tes SJT. Penelitian selanjutnya disarankan untuk melakukan analisis pada instrumen level jabatan 2 . ompetensi manajeria. agar dapat memastikan butir-butir soal pada level jabatan yang lebih tinggi memiliki kualitas yang baik serta dapat memberikan wawasan yang lebih komprehensif mengenai kemampuan kompetensi karyawan pada level https://doi. org/10. 36269/psyche. PSYCHE: Jurnal Psikologi Universitas Muhammadiyah Lampung Vol. 7 No. Agustus 2025 ISSN . 2655-6936 ISSN . 2686-0430 Selain itu. Penelitian selanjutnya juga dapat menggunakan pendekatan multidimensional seperti Multidimensional Item Response Theory (MIRT), yang lebih tepat diterapkan pada instrumen dengan karakteristik multidimensi (Embretson & Reise. Pengembangan analisis juga dapat diperluas dengan mempertimbangkan penggunaan parameter psikometrik tambahan, seperti model 2PL (Two-Parameter Logistic Mode. yang memungkinkan pengukuran terhadap tingkat kesukaran dan daya diskriminasi item serta model 3 PL (Three-Parameter Logistic Mode. dengan pengukuran terhadap tingkat kesukaran, daya diskriminasi, dan tebakan semu . seudo-guessin. yang dapat memengaruhi hasil respons peserta terhadap item tertentu (Amelia & Kriswantoro, 2. PENDANAAN PENELITIAN Penelitian ini didanai oleh RKAT Universitas Sebelas Maret Tahun Anggaran 2025 melalui skema Penelitian PENGUATAN KAPASITAS GRUP RISET (PKGR-UNS) C dengan Nomor Perjanjian Penugasan Penelitian: 371/UN27. 22/PT. 03/2025. DAFTAR PUSTAKA