Analisis Butir Soal Model Timss dengan Item Respon Theory Muhammad NaAoim Mahmud1*. Afudin La Arua2 . Samron3. Irawati Windani4 1Pendidikan Matematika. Universitas Muslim Buton. Kota Baubau. Indonesia. naimmahmudmuhammad@gmail. Pendidikan Matematika. Universitas Muslim Buton. Kota Baubau. Indonesia. afudinlaarua@umubuton. Pendidikan Matematika. Universitas Muslim Buton. Kota Baubau. Indonesia. samron2772@gmail. Pendidikan Matematika. Universitas Muslim Buton. Kota Baubau. Indonesia. irawatiwindani@gmail. Abstrak. Penelitian ini bertujuan untuk menganalisis kualitas butir soal matematika model TIMSS yang digunakan pada siswa kelas Vi di Kota Baubau. Penelitian ini merupakan jenis ex-post facto yang memadukan dua pendekatan, yakni pendekatan rasional dan empiris. Sampel dalam penelitian ini berjumlah 400 siswa kelas Vi yang terdiri dari 5 SMP dari total keselurahan 29 SMP yang ada di Kota Baubau. Adapun instrumen penelitian yang digunakan berupa tes pilihan ganda dengan soal-soal matematika yang mengadopsi model TIMSS. Analisis data dilakukan dengan bantuan perangkat lunak Bilog-MG dan SPSS. Berdasarkan hasil analisis kecocokan model menggunakan Teori Respon Butir, ditemukan bahwa model yang paling sesuai adalah model dua parameter logistik . -PL). Hasil output dari Bilog-MG menunjukkan bahwa seluruh butir soal . ebanyak 30 buti. memiliki indeks daya beda yang tergolong baik. Sementara itu, untuk tingkat kesulitan butir, ditemukan bahwa 27 soal berada dalam kategori sedang, satu soal . tergolong terlalu mudah, dan dua soal . utir 26 dan . termasuk dalam kategori terlalu sulit. Kata Kunci: Analisis butir. Soal-soal model TIMSS. Bilog Mg Abstract. This study aims to analyze the quality of TIMSS model mathematics questions used in grade Vi students in Baubau City. This study is an ex-post facto type that combines two approaches, namely rational and empirical approaches. The sample in this study consisted of 400 class Vi students consisting of 5 junior high schools from a total of 29 junior high schools in Baubau City. The research instrument used was a multiple-choice test with mathematics questions that This is an open access article under the CCAeBY-SA license Mahmud. Arua. Samron. Windani. Analisis Butir SoalA 131 adopted the TIMSS model. Data analysis was carried out with the help of BilogMG and SPSS software. Based on the results of the model fit analysis using Item Response Theory, it was found that the most appropriate model was the twoparameter logistic model . -PL). The output results from Bilog-MG showed that all questions . s many as 30 item. had a fairly good discrimination index. Meanwhile, for the level of item difficulty, it was found that 27 questions were in the moderate category, one question . was too easy, and two questions . tems 26 and . were too difficult. Keywords. Item analysis. TIMSS model questions. Bilog Mg Pendahuluan Penilaian yang efektif dapat dilakukan dengan mengumpulkan bukti-bukti akurat mengenai capaian pembelajaran siswa dan memastikan bahwa proses dan hasil penilaian di kelas bermanfaat bagi siswa. Untuk memperoleh data yang akurat, penilaian harus didukung oleh proses pengukuran yang tepat. Dalam sistem penilaian hasil pembelajaran, penilaian merupakan tahap lanjutan setelah Sebagai seorang pendidik, salah satu metode untuk menilai pemahaman siswa terhadap materi adalah melalui tes. Tes merupakan suatu instrumen yang digunakan untuk mengumpulkan informasi, baik berupa serangkaian pertanyaan maupun soal yang secara khusus dirancang untuk diberikan kepada siswa dengan kriteria tertentu (Susilawati. Sejalan dengan pendapat (Kartowagiran, 2. , tes merupakan sebuah serangkaian kegiatan yang dilakukan secara sistematis dengan menyajikan sejumlah pertanyaan yang mempunyai jawaban benar atau salah, yang bertujuan untuk mengukur kemampuan siswa secara kuantitatif. Output yang dihasilkan oleh tes tidak hanya dijadikan sebagai alat evaluasi, tetapi juga dapat digunakan secara strategis untuk meningkatkan kualitas pembelajaran (El Hasbi et al. , 2. Selain itu, hasilnya dapat digunakan untuk mengidentifikasi area dimana siswa mengalami kesulitan atau masih rendah pemahamannya. Informasi yang diperoleh melalui analisis ini sangat membantu guru dalam merancang pembelajaran yang sesuai dengan kebutuhan siswa, baik secara individu maupun Tes yang baik terdiri dari butir-butir soal yang berkualitas. Instrumen yang berkualitas mampu memberikan informasi secara tepat sesuai dengan tujuan yang di inginkan (Safitri et al. , 2. Ada berbagai jenis butir soal, seperti pilihan ganda, benar-salah, menjodohkan, dan sebagainya. Untuk menilai kualitas suatu butir soal, diperlukan evaluasi melalui proses analisis. Tes yang baik dapat mengukur kemampuan siswa secara akurat. Oleh karena itu, butir-butir soal harus disusun dengan baik dan sesuai dengan tujuan tes yang akan dilaksanaka (Elvira & Samsul, 2. Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika Vol. 15 No. Untuk meningkatkan mutu soal yang telah disusun, analisis butir soal perlu dilakukan oleh guru atau pihak yang terlibat dalam tim penyusun soal (Mania et , 2. Soal yang kurang bermutu dapat mempengaruhi hasil evaluasi, sehingga diperlukan upaya untuk meningkatkan mutu soal yang telah dibuat. Analisis butir soal merupakan proses evaluasi yang dilakukan untuk menilai mutu soal dalam ujian atau tes . Dengan menganalisis butir soal merupakan sebuah langkah penting bagi guru untuk menilai kualitas soal yang digunakan, sehingga dapat menentukan mana soal yang layak digunakan kembali dan mana yang harus diperbaiki atau dihapus (Ida & Musyarofah, 2. Sehingga, dengan melakukan analisis butir soal, pendidik dapat menentukan keputusan dalam menilai proses pengumpulan, penyimpulan, dan pemanfaatan informasi yang diperoleh dari respon peserta didik. Tujuan dari analisis butir soal adalah untuk memastikan kualitas soal dengan cara meninjau setiap butir soal sebelum digunakan dalam melakukan Analisis butir soal dapat membantu mengidentifikasi kelemahankelemahan dalam tes (Urbina, 2. dan menentukan apakah peserta didik telah memahami atau masih mengalami kesulitan dalam memahami materi yang telah Analisis butir soal dapat dilakukan dengan menggunakan pendekatan klasik maupun modern. Hambleton & Jones, 1993. Hambleton & Swaminathan, 1985 mengemukakan beberapa kelemahan dalam teori tes klasik, antara lain: Tingkat kesulitan dan daya pembeda butir soal tergantung pada kelompok peserta yang mengerjakannya. Analisis tes dilakukan dengan cara membandingkan kemampuan peserta didik berdasarkan kelompok atas, tengah, dan bawah. Reliabilitas skor didasarkan pada konsep tes paralel. Tidak ada dasar teori yang jelas untuk menentukan kesesuaian tes dengan kemampuan peserta didik. Standard Error of Measurement (SEM) berlaku secara umum untuk semua peserta Hasil estimasi parameter sangat dipengaruhi oleh karakteristik peserta tes . ersifat group dependen. Konsekuensinya, tingkat kesukaran soal akan tampak lebih rendah apabila tes diberikan kepada kelompok peserta yang memiliki kemampuan tinggi. Sebaliknya, soal yang sama akan terlihat lebih sukar apabila diberikan kepada peserta dengan kemampuan rendah (Sarea & Ruslan, 2. Keterbatasan ini menyebabkan estimasi kemampuan peserta menjadi rendah jika soal yang dikerjakan berada di atas kemampuan mereka. Sebaliknya, estimasi kemampuan akan tampak tinggi apabila soal yang diberikan berada di bawah tingkat kemampuan peserta Penelitian ini menggunakan teori tes modern atau yang biasa dikenal dengan teori respons butir yang dikembangkan oleh para ahli di bidang pengukuran psikologi dan pendidikan. Teori Respon Butir (IRT) merupakan pendekatan analisis butir yang modern. Teori ini dikembangkan oleh para ahli untuk Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Mahmud. Arua. Samron. Windani. Analisis Butir SoalA 133 mengatasi keterbatasan teori analisis butir klasik. Dengan demikian. IRT berfungsi sebagai penyempurnaan konsep dalam Teori Tes Klasik (CTT) (Mulyani et al. Teori respons butir hadir untuk menjawab berbagai kekurangan dalam teori tes klasik. Keterbatasan pendekatan klasik tersebut kerap kali menghambat penerapannya dalam proses seperti penyusunan butir tes, penyetaraan antar butir, atau pembandingan karakteristik peserta. Esensi utama teori respons butir adalah memisahkan pengaruh antara butir tes dan peserta tes secara independen. Item Response Theory (IRT) merupakan penyempurnaan dari kelemahankelemahan yang terdapat pada teori klasik. Salah satu kelebihan IRT adalah Probabilitas seorang individu menjawab benar suatu butir soal bergantung pada kemampuan subjek dan sifat karakteristik dari butir tersebut (Sarea & Ruslan. Teori respons butir soal memiliki sejumlah karakteristik penting, yaitu: . karakteristik butir soal tidak bergantung pada peserta tes, . skor yang diperoleh peserta tidak dipengaruhi oleh tes yang digunakan, . pendekatan ini berfokus pada analisis tiap butir soal, bukan keseluruhan soal, . tidak mensyaratkan penggunaan tes paralel yang ketat untuk menaksir reliabilitas, dan . memungkinkan adanya dasar pengambilan keputusan melalui fungsi hubungan antara kemampuan peserta dengan respons yang diberikan (Hambleton et al. Selain itu. Hambleton dan Swaminathan . menambahkan bahwa secara matematis, peluang seseorang menjawab suatu butir soal dengan benar ditentukan oleh kemampuan peserta dan karakteristik butir soal. Mengacu pada latar belakang tersebut, penelitian ini bertujuan untuk menganalisis kualitas butir soal dan mengkarakterisasikan tes yang dikembangkan untuk mengukur kemampuan siswa SMP se-Kota Baubau dalam mata pelajaran matematika dengan menggunakan soal-soal model TIMSS. Metode Penelitian ini dikategorikan sebagai penelitian ex-post facto dengan menggabungkan dua pendekatan, yaitu pendekatan rasional dan pendekatan Tujuan utama dari penelitian ini adalah untuk mengidentifikasi butirbutir soal matematika berbasis model TIMSS yang digunakan pada siswa SMP dengan pendekatan Teori Respon Butir (Item Response Theor. Teknik pengambilan sampel yang digunakan adalah proportionately stratified random sampling, yakni metode yang memperhitungkan keberadaan subkelompok . dengan ukuran berbeda dalam populasi (Mertens, 2. Metode ini bertujuan untuk memastikan bahwa jumlah sampel dari setiap strata proporsional terhadap ukuran strata dalam populasi. Populasi dalam penelitian ini mencakup seluruh siswa kelas Vi SMP yang berada di wilayah Kota Baubau. Sebanyak lima sekolah (SMPN 1 Baubau. SMPN 3 Baubau. SMPN 4 Baubau. SMPN 6 Baubau, dan SMP Swasta Darussala. dipilih sebagai sampel dengan total responden sebanyak 400 siswa kelas Vi. Instrumen tes yang digunakan berupa soal-soal matematika Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika Vol. 15 No. berformat model TIMSS, terdiri atas 30 soal pilihan ganda dengan empat opsi jawaban (A. C, dan D). Soal TIMSS yang digunakan sebagai instrumen penelitian terdiri dari materi bilangan, aljabar, geometri, dan statistik & peluang yang telah disesuaikan dengan kurikulum yang berlaku. Analisis empiris terhadap butir soal dilakukan menggunakan pendekatan Teori Respon Butir (IRT) dengan bantuan perangkat lunak Bilog-MG. Hasil dan Pembahasan Secara umum, terdapat 3 model yang paling umum diaplikasikan dalam pendekatan teori respons butir yaitu model 1-PL, 2-PL, dan 3-PL. Untuk melakukan analisis lebih lanjut, diperlukan pemenuhan dua asumsi dasar terlebih dahulu: unidimensi dan independensi lokal. Uji asumsi dilakukan melalui analisis faktor eksploratori dengan bantuan SPSS, bertujuan mengevaluasi kelayakan sampel serta kevalidan instrumen dalam mengukur satu kemampuan, yaitu Tabel 1. Bartlett KMO and BartlettAos Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy Bartlett's Test of Sphericity 0,709 Approx. Chi-Square 1183,433 Sig. 0,000 Dari tabel 1 di atas, diketahui bahwa nilai KMO yang didapatkan yaitu sebesar 0,709. Angka tersebut mengindikasikan bahwa sampel penelitian cukup memadai untuk digunakan, karena nilainya lebih besar dari 0,05. Oleh karena itu, analisis dapat diteruskan dengan menguji unidimensionalitas menggunakan scree plot sebagaimana ditampilkan pada gambar di bawah. Gambar 1. Hasil output Scree Plot Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Mahmud. Arua. Samron. Windani. Analisis Butir SoalA 135 Berdasarkan hasil output SPSS 22 pada Gambar 1, instrumen yang digunakan pada penelitian yaitu berupa soal-soal model TIMSS terdapat satu faktor yang terlihat dominan. Perbedaan begitu signifikan jika melihat pada hasil scree plot yang terjadi pada faktor pertama ke faktor kedua. Adapun untuk faktor yang kedua tidak cukup jauh berbeda dengan faktor lainnya yang mempunyai perubahan nilai eigen yang tidak jauh berbeda atau begitu besar. Berdasarkan hasil tersebut instrumen yang digunakan yaitu soal-soal model TIMSS uji asumsi unidimensinya sudah terpenuhi. Berikutnya yaitu akan disajikan nilai eigen berdasarkan hasil analisis dengan menggunakan bantuan program SPSS 22 pada tabel 2 di bawah ini . Tabel 2. Faktor Nilai Eigen > 1 dan Komponen Variansi Hasil Analisis Faktor Initial Eigenvalues Component Total % of Variance Cumulative % 7,860 26,201 26,201 2,908 9,693 35,894 1,981 6,603 42,497 1,760 5,868 48,364 1,475 4,918 53,282 1,366 4,553 57,835 1,208 4,027 61,862 1,111 3,703 65,565 1,033 3,443 69,008 Uji berikutnya yaitu uji asumsi independensi lokal. Uji tersebut otomatis dapat terpeneuhi jika uji sebelumnya yaitu uji asumsi unidimensi terpenuhi. Langkah berikutnya yaitu melakukan uji kecocokan antara model 1-PL, 2-PL dan 3-PL. Hasil uji tersebut dilihat dengan membandingkan nilai signifikansi dari nilai A 2 dengan nilai alpa yang digunakan ( A = 0. 05 ). Kriteria yang menunjukan butir yang cocok yaitu dengan melihat apakah nilai X2hitung kurang dari nilai X2tabel. Berikut tabel yang menunjukan kecocokan model antara 1 PL, 2 PL, dan 3 PL. Item . Tabel 3. Kecocokan Butir Soal Model TIMSS Berdasarkan IRT (Item Respon Theor. Model 1-PL 2-PL 3-PL Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Tidak Fit Model Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika Vol. 15 No. Model Item . 1-PL 2-PL 3-PL Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Tidak Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Tidak Fit Model Fit Model Tidak Fit Model Tidak Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Tidak Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Tidak Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Tidak Fit Model Tidak Fit Model Tidak Fit Model Tidak Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Tidak Fit Model Tidak Fit Model Fit Model Fit Model Tidak Fit Model Fit Model Tidak Fit Model Fit Model Fit Model Fit Model Fit Model Tidak Fit Model Tabel 3 di atas menunjukkan bahwa model 2 PL merupakan model yang paling banyak memiliki kecocokan dengan butir soal. Sehingga, penentuan parameter butir yang berupa soal-soal model TIMSS mneggunakan model 2 PL. Adapun dua parameter penting yang dihasilkan,pada model 2 PL yaitu parameter diskriminasi . dan parameter kesulitan . Berikut rincian karakteristik butir hasil analisis dengan model 2-PL melalui program Bilog-MG ditampilkan pada tabel 4 di bawah ini. Tabel 4. Hasil Analisis Model 2-PL menggunakan Bilog-MG Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Mahmud. Arua. Samron. Windani. Analisis Butir SoalA 137 Item Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 Item 11 Item 12 Item 13 Item 14 Item 15 Item 16 Item 17 Item 18 Item 19 Item 20 Item 21 Item 22 Item 23 Item 24 Item 25 Item 26 Item 27 Item 28 Item 29 Item 30 Total Tingkat Kesukaran (Threshol. Keterangan Keterangan Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Tidak Baik Baik Tidak Baik Baik Baik Baik Baik 612 Tidak Baik Jumlah Item Fit Daya Beda (Slop. Baik Tidak Baik Chi-Square Prob Keterangan Fit model Fit model Fit model Fit model Fit model Fit model Fit model Fit model Fit model Tidak Fit model Fit model Fit model Fit model Fit model Fit model Fit model Tidak Fit model Fit model Fit model Tidak Fit model Fit model Fit model Fit model Tidak Fit model Tidak Fit model Fit model Fit model Fit model Fit model Fit model Berdasarkan kriteria teori respon butir bahwa Indeks daya beda yang dikatakan baik yaitu apabila memiliki nilai rentang antara 0 Ae 2. Tabel diatas Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika Vol. 15 No. menunjukan bahwa analisis model 2-PL seluruh itemnya yang terdiri dari 30 butir soal model TIMSS memiliki daya beda yang baik. Berikutnya, kriteria tingkat kesulitan dikatakan baik jika nilai interval yang didapatkan yaitu berkisar antara Oe2 O yuE O 2. Berdasarkan penjelasan diatas dapat disimpulkan, bahwa untuk tingkat kesulitan butir didapatkan 27 butir tergolong kategori baik sedangkan butir lainnya yaitu sebanyak 3 butir tergolong tidak baik. Berikut akan disajikan tingkat kesulitan butir dari butir yang termudah ke butir yang sulit. Tabel 5. Daya Beda dan Tingkat Kesulitan Butir Matematika Model TIMSS Item . Item . 0,753 -0,453 1,346 -0,444 1,194 -0,399 1,150 -0,388 1,297 -0,872 1,052 -0,369 1,240 -0,8 0,899 -0,273 2,191 -0,734 0,662 -0,243 1,141 -0,706 1,067 -0,029 2,052 -0,685 1,231 0,15 1,280 -0,657 0,895 0,215 1,471 -0,603 0,859 0,284 1,388 -0,559 0,951 0,352 0,507 -0,546 0,452 0,598 1,445 -0,533 0,544 2,514 1,046 -0,459 0,391 2,612 Tabel 5 di atas menunjukan bahwa indeks daya beda pada butir soal-soal model TIMSS yang digunakan sebagai penelitian dengan nilai parameter a berada antara 0 sampai 2. Adapun parameter lainnya yaitu tingkat kesulitan . , yang dikatakan baik yaitu jika nilai yang didapatkan berada pada -2 hingga 2. Output yang didapatkan berdasarkan hasil anilisis menggunakan bilog menunjukkan bahwa dari 30 butir soal terdapat satu butir yang terlalu mudah, dua butir tergolong sulit, sebagaimana tercantum dalam tabel. Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Mahmud. Arua. Samron. Windani. Analisis Butir SoalA 139 Subtest: TEST0001 Information Standard Error Scale Score Gambar 2. Grafik Plot Berdasarkan grafik plot pada Gambar 2 di atas, garis biru menggambarkan kurva informasi tes, sementara garis merah menunjukkan tingkat kesalahan Kedua garis tersebut membentuk kurva fungsi informasi tes dan kesalahan pengukuran. Sumbu vertikal sebelah kiri merepresentasikan total informasi tes, sedangkan sumbu vertikal kanan menunjukkan besar kesalahan Dari grafik terlihat bahwa garis merah berpotongan dengan garis biru pada rentang kemampuan sekitar -2,4 hingga 1,4. Dengan demikian, dapat disimpulkan bahwa instrumen tes yang digunakan paling optimal atau paling sesuai untuk mengukur kemampuan siswa yang berada dalam kisaran -2,4 sampai 1,4. Simpulan Berdasarkan hasil analisis data dengan menggunakan program Bilog-MG dapat disimpulkan bahwa instrumen tes matematika model TIMSS yang digunakan dalam penelitian ini telah memenuhi asumsi unidimensional yang berarti semua soal mengukur satu konstruk utama yaitu kemampuan matematika. Dengan terpenuhinya asumsi unidimensional tersebut, maka secara umum asumsi independensi lokal dianggap telah terpenuhi, karena jawaban peserta pada salah satu butir soal tidak dipengaruhi oleh jawaban butir soal yang lain. Model Item Response Theory yang paling tepat untuk menganalisis soal dalam penelitian ini adalah model logistik dua parameter . -PL). Model ini menghasilkan dua parameter utama yaitu daya pembeda . dan tingkat kesukaran butir soal . yang menunjukkan kemampuan soal dalam membedakan siswa berdasarkan tingkat kemampuannya dan tingkat kesukaran relatif masing-masing butir soal. Dengan analisis model 2-PL seluruh itemnya yang terdiri dari 30 butir soal model TIMSS memiliki daya beda yang Adapun untuk tingkat kesulitan butir didapatkan 27 butir tergolong kategori baik sedangkan butir lainnya yaitu sebanyak 3 butir tergolong tidak baik. Output softwer Bilog MG bahwa dari 30 butir soal ditemukan satu butir yang terlalu mudah, dua butir tergolong sulit dan lainnya tergolong sedang. Berdasarkan Copyright A 2025 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika p-ISSN : 2088-3021 e-ISSN : 2598-8077 Buana Matematika : Jurnal Ilmiah Matematika dan Pendidikan Matematika Vol. 15 No. kurva informasi tes, instrumen menunjukkan tingkat informasi tertinggi dan galat ukur rendah pada rentang kemampuan antara -2,4 sampai dengan 1,4. Hal ini menunjukkan bahwa instrumen ini paling efektif dan akurat untuk siswa dengan kemampuan pada rentang tersebut. Temuan penelitian ini mengindikasikan bahwa guru perlu melakukan analisis butir soal secara berkala guna memastikan kualitas instrumen evaluasi yang digunakan, baik dari segi validitas maupun tingkat kesukarannya Ucapan Terima Kasih Peneliti menyampaikan rasa terima kasih yang setulus-tulusnya kepada seluruh pihak yang telah terlibat memberikan dukungan, bantuan, serta kontribusi selama penyusunan artikel ini. Ucapan terima kasih ditujukan kepada seluruh stakeholder yang terlibat dan pihak sekolah di SMP yang ada di kota Baubau khususnya yang menjadi tempat penelitian yang telah mengizinkan dan memudahkan dalam pengambilan data. Semoga karya tulis ini dapat memberikan sumbangsih dalam pengembangan ilmu pengetahuan, pengembangan butir-butir soal yang dijadikan alat tes dan menjadi rujukan yang bermanfaat bagi penelitianpenelitian sejenis di masa yang akan datang. Daftar Pustaka