Equating (Penyetaraan) dalam Teori Tes Klasik dan Teori Respons Butir

Bismillahirrohmanirrohim.

Assalamu'alaykum warohmatullahi wabarakatuh

Dikarenakan ada tugas presentasi topik "equating" dalam kuliah S3 PEP saya, tiba-tiba terpikir saja oleh pikiran saya untuk sekalian membuat tulisan sederhana dalam postingan blog kali ini. Materi yang dijelaskan disini mungkin tidak menyentuh aspek rinci dari equating yang saya rujuk dari Wikipedia. Semoga bermanfaat bagi para pembaca yang secara tidak sengaja sampai pada blog ini dan mungkin sedang mencari referensi tambahan untuk melengkapi bahan bacaan selama studi atau penelitian.

Pendahuluan

Secara singkat, equating merupakan proses statistik untuk menentukan skor yang sebanding pada beberapa paket ujian yang dibuat. Equating dapat dilakukan dengan menggunakan teori tes klasik atau teori respon butir.

Dalam teori respon butir, equating adalah proses menempatkan skor dari dua atau lebih paket tes paralel dalam skala skor umum. Tujuan equating adalah menghasilkan skor dari dua paket ujian yang berbeda sehingga dapat dibandingkan secara langsung. Beberapa paket ujian ini seolah-olah diperlakukan berasal dari paket ujian yang sama. Ketika paket ujian tidak paralel, prosesnya umum disebut menghubungkan (linking). Proses ini adalah proses menyamakan (equating) satuan dan origin dari dua skala dimana estimasi letak kemampuan siswa dalam paket ujian yang berbeda. Proses ini dapat diibaratkan seperti membandingkan pengukuran suhu dengan satuan Fahrenheit dan satuan Celcius dimana hasil pengukurannya dapat dikonversi dari satu skala ke skala lainnya. Penentuan skor pembanding merupakan hasil sampingan dari equating yang dihasilkan dari penyetaraan skala yang diperoleh dalam ujian.

Ilustrasi dan Tujuan Analisis Equating

Misalkan Dedi dan Juwita sama-sama mengikuti ujian untuk mendapatkan lisensi dalam profesi tertentu. Ujian lisensi ini sangat penting bagi peserta karena mereka akan diakui profesinya setelah "lulus" mengikuti ujian ini. Tingginya harapan peserta agar bisa lulus dalam ujian ini, memungkinkan terjadinya kecurangan seperti mencontek dalam ujian lisensi. Untuk mengantisipasinya, pengelola ujian membuat dua paket soal ujian yang setara (A dan B). Jika diketahui bahwa Dedi memperoleh skor 60% pada paket A dan Juwita memperoleh skor 70% pada paket B. Kemudian, apakah kita dapat menyimpulkan siapa diantara mereka yang lebih menguasai materi? Bagaimana jika paket A memiliki butir soal yang lebih sulit sedangkan paket B yang lebih mudah? Analisis equating harus dilakukan untuk memecahkan masalah ini untuk menghasilkan skor ujian yang seadil-adilnya.

Equating dalam Teori Respons Butir

Gambar 1. Test characteristic curve (TCC) yang menunjukkan hubungan antara skor total dan letak ability seseorang dua paket ujian yang berbeda dalam skala yang sama. Dalam contoh ini skor 37 pada Paket 1 sama dengan skor 34,9 pada Paket 2 seperti yang ditunjukkan oleh garis vertikal.

Dalam teori respon butir, "letak" orang atau peserta ujian diestimasi dalam skala interval dengan satuan dan titik origin yang ditetapkan. Ujian adalah hal yang umum dilakukan dalam evaluasi pendidikan untuk menilai kelompok siswa dengan kemampuan (ability) yang berbeda-beda untuk menetapkan skala umum yang berlaku dalam satu kelompok dengan memperhatikan titik asal (origin) dan skala yang diperoleh dari data respon ujian. Proses ini disebut dengan equating atau test equating.

Dalam teori respon butir, ada dua jenis equating yaitu horizontal equating dan vertical equating. Vertical equating merupakan proses menyamakan ujian kepada kelompok siswa dengan kemampuan yang berbeda-beda, seperti siswa di kelas yang berbeda (X, XI, XII dalam konteks sekolah menegah atas (SMA) di negara Indonesia). Kemudian, horizontal equating adalah proses penyetaraan tes yang diberikan kepada kelompok siswa dengan kemampuan yang sama. Misalnya, dua tes diberikan kepada siswa di kelas yang sama dalam dua tahun berturut-turut. Tes dengan paket yang berbeda dibuat untuk menghindari efek latihan siswa pada soal-soal tahun sebelumnya.

Dalam teori respons butir, equating merupakan kasus khusus dari proses penskalaan yang lebih umum, yang dapat diterapkan pada ujian yang memiliki beberapa paket. Namun, dalam praktiknya, penskalaan sering diterapkan secara terpisah untuk pengujian yang berbeda dan kemudian skala tersebut kemudian disamakan.

Terdapat dua jenis metode equating yaitu common person equating dan common item equating. Common person equating dilakukan dengan memberikan ujian kepada sekelompok orang yang sama. Rata-rata dan standar deviasi letak dalam skala kelompok pada kedua ujian disamakan dengan menggunakan transformasi linier. Common item equating dilakukan dengan menggunakan satu set butir soal sama (anchor test) yang terkandung dalam dalam dua paket ujian yang berbeda. Rata-rata dari lokasi butir dari item umum disamakan.

Equating dalam Teori Tes Klasik

Dalam teori tes klasik, mean equating hanya menyesuaikan distribusi skor sehingga mean dari satu paket ujian sebanding dengan mean dari paket lainnya. Kemudian dengan teori tes klasik mudah dilakukan karena kesederhanaannya. Namun teori ini tidak memiliki fleksibel karena tidak mempertimbangkan kemungkinan jika standar deviasi setiap paket bisa berbeda.

Linear equating akan menyesuaikan kedua paket ujian sehingga memiliki mean dan standar deviasi yang sebanding. Ada beberapa jenis linear equating yang dibedakan berdasarkan asumsi dan prosedur matematika yang digunakan untuk mengestimasi parameter. Metode Tucker dan Levine Observed Score mengestimasi hubungan antara skor amatan pada kedua paket ujian, sedangkan metode Levine True Score mengestimasi hubungan antara true score pada kedua paket ujian.

Equipercentile equating menentukan hubungan persamaan sebagai hubungan di mana skor dapat memiliki persentil ekuivalen pada kedua paket. Hubungan ini bersifat nonlinier.

Berbeda dengan teori respon butir, equating dengan teori tes klasik tidak berkonsentrasi pada penskalaan. Equating dalam teori klasik adalah transformasi skor mentah ke mentah yang mengestimasi skor mentah Paket B yang setara dengan setiap skor mentah pada Paket A. Setiap transformasi penskalaan yang digunakan kemudian diterapkan di atas, atau dengan, persamaan.

Referensi

https://en.wikipedia.org/wiki/Equating

Wabilahi taufik wal hidayah.

Wassalamu’alaykum warahmatullohi wabarokatuh.

Cari Blog Ini

Calon Guru Fisika