Jurnal Armada Pendidikan Vol. No. Agustusi 2025 https://doi. org/10. 60041/jap/v3i3. ISSN 2985-8623 /Print/ ISSN 2985-7902 /Online/ Analisis Butir Soal Penilaian Akhir Semester (PAS) Ganjil Mata Pelajaran Bahasa Indonesia Kelas XI Akuntansi SMK Negeri 2 Padang 1,2,3 Nada Salsabilla1*. Zuraida Khairani2. Susanti Marisya3 Pendidikan Bahasa dan Sastra Indonesia. Universitas Ekasakti-Aai Padang. Indonesia *Email: salsabillanada96@gmail. Received 06/08/2025 . Revised 14/08/2025 . Accepted 27/08/2025 . Published 29/08/2025 Abstrak Penelitian ini dilatarbelakangi oleh belum dilaksanakannya analisis butir soal Penilaian Akhir Semester (PAS) mata pelajaran Bahasa Indonesia tahun ajaran 2024/2025 di sekolah, sehingga kualitas soal dari aspek validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh belum diketahui. Penelitian ini bertujuan menganalisis kualitas butir soal PAS serta mengidentifikasi apakah soal terlalu mudah/sulit dan mampu membedakan siswa yang telah menguasai materi dengan yang belum. Penelitian menggunakan metode deskriptif kuantitatif. Data berupa naskah soal dan lembar jawaban peserta didik PAS ganjil 2024/2025, kemudian ditabulasi berdasarkan pilihan jawaban dan dianalisis menggunakan teori pengukuran meliputi uji validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. Hasil penelitian menunjukkan: pada paket A terdapat 7 butir valid . %) dan 3 tidak valid . %), reliabilitas sedang . , tingkat kesukaran didominasi kategori sedang 7 butir . %) dan mudah 3 butir . %), daya pembeda kategori baikAebaik sekali 7 butir . %) namun masih terdapat 3 butir berkategori jelek . %), serta pengecoh baikAesangat baik pada seluruh butir . %). Pada paket B terdapat 8 butir valid . %) dan 2 tidak valid . %), reliabilitas tinggi . , tingkat kesukaran didominasi mudah 6 butir . %) dan sedang 4 butir . %), daya pembeda baikAebaik sekali 7 butir . %) dengan 3 butir cukupAejelek . %), serta pengecoh baikAesangat baik 9 butir . %) dan 1 butir jelek . %). Rekomendasi penelitian adalah merevisi atau mengganti butir yang tidak valid dan berdaya pembeda rendah, menyeimbangkan tingkat kesukaran terutama pada paket B, serta melakukan analisis butir secara rutin sebelum soal digunakan kembali. Kata Kunci: Analisis butir soal, penilaian akhir semester, validitas, reliabilitas, efektivitas pengecoh Abstract This study was motivated by the absence of item analysis for the Indonesian Language End-of-Semester Assessment (PAS) for the 2024/2025 academic year, so the quality of the test items in terms of validity, reliability, difficulty level, discrimination power, and distractor effectiveness was unknown. The study aimed to analyze the quality of the PAS items and to identify whether the items were too easy or too difficult and whether they could differentiate between students who had mastered the content and those who had not. A descriptive quantitative method was employed. The data consisted of the test papers and studentsAo answer sheets from the odd-semester PAS 2024/2025. StudentsAo responses were tabulated by option choice and analyzed using measurement theory, covering item validity, test reliability, item difficulty, item discrimination, and distractor effectiveness. The results showed that in Package A, 7 items were valid . %) and 3 were invalid . %). the reliability was moderate . difficulty levels were dominated by the medium category . 70%) and easy category . 30%). discrimination indices were good to very good for 7 items . %), but 3 items . %) were poor. and all distractors were good to very good . %). In Package B, 8 items were valid . %) and 2 were invalid . %). reliability was high . difficulty levels were dominated by easy items . 60%) and medium items . 40%). discrimination indices were good to very good for 7 items . %), with 3 items . %) in the fair to poor range. and distractors were good to very good for 9 items . %), while 1 item . %) had poor distractors. The study recommends revising or replacing invalid items and items with low discrimination, balancing item difficultyAiespecially in Package BAiand conducting routine item analysis before reusing the test. Keywords: Item analysis, end-of-semester assessment, validity, reliability, distractor effectiveness This Is an open access article under the CC BY SA-4. 0 licence | 329 Jurnal Armada Pendidikan Vol. No. Agustusi 2025 https://doi. org/10. 60041/jap/v3i3. ISSN 2985-8623 /Print/ ISSN 2985-7902 /Online/ PENDAHULUAN PENDAHULUAN Penilaian Akhir Semester (PAS) Bahasa Indonesia berfungsi sebagai evaluasi sumatif untuk menilai capaian belajar peserta didik pada akhir periode pembelajaran sekaligus menjadi dasar pengambilan keputusan akademik. Karena hasil PAS dipakai untuk memotret ketercapaian tujuan pembelajaran, instrumen PAS harus disusun dan dievaluasi berbasis data agar pengukuran capaian siswa tidak bias oleh butir soal yang terlalu mudah, terlalu sulit, atau tidak selaras dengan kompetensi yang diukur (Mertasari, 2022. Himawan et al. , 2. (Ejournal Undiksh. Kualitas sebuah tes tidak cukup dinilai dari Aubanyaknya siswa benarAy atau nilai rata-rata kelas, tetapi perlu ditopang oleh karakteristik instrumen yang baik. Literatur evaluasi pendidikan menempatkan validitas dan reliabilitas sebagai syarat utama, lalu diikuti analisis karakteristik butir seperti tingkat kesukaran, daya pembeda, dan efektivitas pengecoh untuk memastikan setiap butir berfungsi membedakan siswa yang menguasai materi dan yang belum (Arikunto. Himawan et al. , 2. (BintangPusna. Kajian 10 tahun terakhir menunjukkan masalah yang berulang pada tes buatan guru: analisis butir belum menjadi kebiasaan, sehingga masih ditemukan butir berkualitas rendah yang tetap digunakan dalam ujian semester. Pada konteks PAS Bahasa Indonesia tingkat SMP. Pohan dan Nurrahmah . menemukan proporsi butir berkategori AujelekAy dan bahkan AunegatifAy pada daya pembeda masih muncul, serta sebagian pengecoh tidak berfungsi sehingga perlu diganti atau dibuang. Temuan serupa pada mata pelajaran lain juga memperlihatkan bahwa evaluasi butir . aliditas, reliabilitas, kesukaran, pembeda, pengeco. diperlukan untuk menentukan butir yang layak masuk bank soal dan butir yang wajib direvisi (Dzahabiyyah et al. , 2. Pada konteks tes bahasa Indonesia berbasis ITEMAN. Himawan et . menegaskan masih banyak praktik penilaian yang langsung memberi nilai tanpa analisis butir, padahal hasil analisis digunakan untuk memutuskan kualitas instrumen secara (Jurnal LLDikti . Kondisi lapangan di sekolah menunjukkan persoalan yang sejalan. Wawancara peneliti dengan guru Bahasa Indonesia (Nurhamidah, 16 Desember 2. menunjukkan soal PAS Bahasa Indonesia tahun ajaran 2024/2025 belum pernah dianalisis dari aspek validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. Situasi ini berisiko menghasilkan keputusan penilaian yang kurang akurat karena kualitas butir tidak diketahui, padahal PAS dipakai sebagai cermin ketercapaian tujuan pembelajaran dan pemetaan kemampuan siswa. (Ejournal Undiksh. Kesenjangan penelitian terletak pada belum tersedianya bukti empiris berbasis data respons siswa untuk menilai kualitas soal PAS Bahasa Indonesia tahun ajaran 2024/2025 pada konteks sekolah ini, sementara penelitian terdahulu lebih banyak mengambil lokasi dan tahun pelaksanaan berbeda atau hanya menekankan sebagian indikator. Kebaruan penelitian ini adalah evaluasi komprehensif terhadap paket soal PAS Bahasa Indonesia 2024/2025 menggunakan lima komponen pengukuran . aliditas, reliabilitas, tingkat kesukaran, daya pembeda, efektivitas pengeco. sehingga menghasilkan keputusan berbasis data tentang butir yang dipertahankan, direvisi, atau diganti untuk perbaikan kualitas tes berikutnya (Himawan et al. , 2024. Pohan & Nurrahmah, 2. Penelitian ini diarahkan untuk: . mendeskripsikan validitas butir soal PAS Bahasa Indonesia 2024/2025, . menentukan reliabilitas tes, . memetakan tingkat kesukaran butir, . menilai daya pembeda tiap butir, . mengevaluasi efektivitas pengecoh pada setiap opsi jawaban, serta . merumuskan rekomendasi perbaikan berupa klasifikasi butir layak pakai. This Is an open access article under the CC BY SA-4. 0 licence | 330 Jurnal Armada Pendidikan Vol. No. Agustusi 2025 https://doi. org/10. 60041/jap/v3i3. ISSN 2985-8623 /Print/ ISSN 2985-7902 /Online/ revisi, dan tidak layak untuk mendukung penguatan bank soal dan peningkatan kualitas evaluasi pembelajaran (Dzahabiyyah et al. , 2024. Himawan et al. , 2. METODE PENELITIAN Pada penelitian ini metode yang digunakan merupakan metode deskriptif kuantitatif. Menurut Rustamana, dkk . penelitian kuantitatif didefinisikan sebagai investigasi sistematis terhadap fenomena dengan mengumpulkan data yang dapat diukur dengan melakukan teknik statistik, matematika atau komputasi. Penelitian deskriptif adalah penelitian yang dilakukan untuk mengetahui nilai variabel, baik satu variabel atau lebih yang sifatnya independen tanpa membuat hubungan maupun perbandingan dengan variabel yang Penelitian deskriptif bertujuan untuk memberikan gambaran atau deskripsi tentang suatu keadaan secara objektif (Sujarweni dalam Purnia dkk, 2. Pada penelitian ini informasi dan data yang diperoleh berupa data kuantitatif. Penelitian deskriptif kuantitatif dapat berupa pengelompokan, peringkasan, dan penyajian data berupa angka-angka yang lebih informatif. Penelitian ini menginformasikan keadaan objek yang diamati sesuai dengan apa yang ada sebenarnya dengan mendeskripsikan butir Peneliti mengambil dan mengumpulkan data, lalu data dianalisis dengan mengacu teori pengukuran yang meliputi validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. Peneliti melakukan analisis terhadap butir soal ujian akhir semester. Data yang diperoleh berupa lembar jawaban peserta didik dan soal dari penilaian akhir semester ganjil tahun ajaran 2024/2025 mata pelajaran Bahasa Indonesia. Data yang didapatkan kemudian ditabulasi untuk setiap pilihan jawaban peserta didik. Bagi peserta didik yang menjawab soal dengan benar maka diberi skor . dan peserta didik yang menjawab salah diberi skor . Software yang digunakan untuk mengolah dan menganalisis data menggunakan program SPSS Version 22 dan Microsoft Excel. HASIL DAN PEMBAHASAN Penelitian yang dilakukan ini untuk mengetahui tingkat kualitas analisis butir soal Ujian Akhir Semester Ganjil pada mata pelajaran Bahasa Indonesia kelas XI program keahlian Akuntansi Keuangan Lembaga SMK Negeri 2 Padang tahun ajaran 2024/2025 yang dilihat dari segi Validitas. Reliabilitas. Tingkat Kesukaran. Daya Pembeda, dan Efektivitas Pengecoh. Data yang digunakan dalam penelitian ini berupa 20 butir soal pilian ganda dengan bentuk soal terbagi atas 10 soal paket A dan 10 soal paket B yang diikuti oleh 34 peserta didik dimana 17 peserta didik untuk soal paket A dan 17 peserta didik untuk soal paket B pada kelas XI program keahlian Akuntansi Keuangan Lembaga. Instrumen yang digunakan untuk memperoleh data melalui metode dokumentasi berupa soal ujian, jawaban peserta didik, dan kunci jawaban. Selanjutnya, data yang telah ada dianalisis dengan menggunakan software Excel dan SPSS sehingga mendapatkan hasil untuk mengetahui kualitas butir soal baik dari segi validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. This Is an open access article under the CC BY SA-4. 0 licence | 331 Jurnal Armada Pendidikan Vol. No. Agustusi 2025 https://doi. org/10. 60041/jap/v3i3. ISSN 2985-8623 /Print/ ISSN 2985-7902 /Online/ Persentase Validitas Butir Soal Paket A Soal Valid Soal Tidak Valid Gambar 1. Validitas butir soal paket A Hasil analisis validitas butir soal Ujian Akhir Semester Ganjil pada mata pelajaran Bahasa Indonesia kelas XI program keahlian Akuntansi Keuangan Lembaga SMK Negeri 2 Padang tahun ajaran 2024/2025 memiliki validitas pada soal paket A yang baik. Hal ini membuktikan bahwa terdapat 7 butir soal . %) yang dinyatakan valid dan 3 butir soal . %) dinyatakan tidak valid. Soal yang valid terdiri dari butir soal nomor 1,3,4,6,7,8,10 karena pada perhitungan menggunakan rumus dan SPSS menunjukkan rhitung Ou rtabel. Peninjauan data dari bentuk soal pilihan ganda, butir soal yang valid ditemukan sesuai dengan capaian pembelajaran dan indikator pembelajaran serta untuk option yang digunakan relavan dengan soal dan tidak mudah ditebak oleh siswa. Pada soal yang tidak valid terdapat pada butir soal nomor soal 2,5,9 karena pada perhitungan dengan menggunkan rumus dan SPSS menunjukkan rhitung 0,. Tingkat kesukaran paket A didominasi kategori sedang . butir/70%) sehingga tergolong baik, sedangkan paket B didominasi butir mudah . butir/60%) sehingga kurang seimbang dari sisi kesukaran. Daya pembeda tergolong baik pada sebagian besar butir: paket A 6 butir . %) dan paket B 7 butir . %) sudah mampu membedakan siswa yang menguasai materi dan yang Efektivitas pengecoh umumnya baik: paket A seluruh butir baikAesangat baik . % sangat 90% bai. , sedangkan paket B mayoritas baikAesangat baik . % sangat baik. namun terdapat 1 butir dengan pengecoh jelek . %). This Is an open access article under the CC BY SA-4. 0 licence | 337 Jurnal Armada Pendidikan Vol. No. Agustusi 2025 https://doi. org/10. 60041/jap/v3i3. ISSN 2985-8623 /Print/ ISSN 2985-7902 /Online/ DAFTAR PUSTAKA (APA)