DAYA PEMBEDA SOAL
Daya pembeda sebuah instrumen adalah kemampuan instrumen
tersebut membedakan antara audiens yang pandai (berkemampuan tinggi) dengan
audiens yang tidak pandai (berkemampuan rendah). Indek daya pembeda ini
disingkat dengan D dan dinyatakan dengan Indeks Diskriminasi.

Manfaat daya pembeda butir soal adalah seperti berikut ini:
1.
Untuk
meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi,
atau ditolak.
2.
Untuk
mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi
yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan
siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya"
seperti berikut ini:
a) Kunci jawaban butir soal itu tidak
tepat.
b) Butir soal itu memiliki 2 atau lebih
kunci jawaban yang benar
c) Kompetensi yang diukur tidak jelas
d) Pengecoh tidak berfungsi
e) Materi yang ditanyakan terlalu
sulit, schingga banyak siswa yang menebak
f) Sebagian besar siswa yang memahami
materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya
Indeks daya pembeda setiap butir soal biasanya juga
dinyatakan dalam bentuk proporsi. Semakin tinggi indeks daya pembeda soal
berarti semakin mampu soal yang bersangkutan membedakan warga belajar/siswa
yang telah memahami materi dengan warga belajar/peserta didik yang belum
memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00.
Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika
daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga
belajar/peserta didik yang tidak memahami materi) menjawab benar soal dibanding
dengan kelompok atas (warga belajar/peserta didik yang memahami materi yang
diajarkan guru).
Untuk
mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan menggunakan
rumus berikut ini.
DP
= daya pembeda soal,
BA
= jumlah jawaban benar pada kelompok atas,
BB
= jumlah jawaban benar pada kelompok bawah,
N
=jumlah siswa yang mengerjakan tes.
Hasil perhitungan dengan menggunakan rumus di atas dapat
menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik yang
sudah memahami materi yang diujikan dengan peserta didik yang belum/tidak
memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini
(Crocker dan Algina, 1986: 315).
0,40
- 1,00 soal diterima baik
0,30
- 0,39 soal diterima tetapi perlu diperbaiki
0,20
- 0,29 soal diperbaiki
0,19
- 0,00 soal tidak dipakai/dibuang
Kriteria tingkat daya
pembeda item soal adalah sebagai berikut.
Daya Pembeda Item
|
Keterangan
|
0 – 0,20
|
Item soal memiliki
daya pembeda lemah
|
0,21 – 0,40
|
Item soal memiliki
daya pembeda sedang
|
0,41 – 0,70
|
Item soal memiliki
daya pembeda baik
|
0,71 – 1,00
|
Item soal memiliki
daya pembeda sangat kuat
|
Bertanda negatif
|
Item soal memiliki
daya pembeda sangat jelek
|
Sumber: Arikunto, 2003:213, 218
TINGKAT KESUKARAN SOAL
Tingkat kesukaran soal atau proporsi jawaban benar adalah
jumlah peserta tes yang menjawab dengan benar pada butir soal yang dianalisis
dibandingkan dengan jumlah peserta tes seluruhnya (Surapranata, 2004: 12).
Butir soal yang banyak dikerjakan dengan benar oleh peserta didik termasuk tipe
soal mudah. Sebaliknya soal sulit adalah soal yang dikerjakan dengan benar oleh
lebih sedikit peserta didik.
Sedangkan menurut Arikunto (2009: 207) bilangan yang
menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran
(difficulty index). Indeks kesukaran butir adalah bilangan yang menunjukkan
sukar dan mudahnya soal. Semakin tinggi indeks kesukaran butir maka soal
semakin mudah. Soal yang baik adalah soal tidak terlalu mudah atau tidak
terlalu sukar. Analisis tingkat kesukaran soal adalah mengkaji soal-soal dari
segi kesulitannya sehingga dapat diperoleh soal-soal mana yang termasuk rendah,
sedang, dan sukar;
Menurut Witherington dalam Sudijono (2008: 371) dan Arikunto (2009: 207) angka indeks kesukaran butir itu besarnya berkisar antara 0,00 sampai dengan 1,00. Semakin besar angka indeks kesukaran maka soal semakin mudah. Jika seluruh peserta ujian menjawab dengan salah butir tersebut maka soal tersebut sangat sukar dengan angka kesukaran 0, 00 dan jika angka kesukaran 1, 00 maka soal sangat mudah karena dijawab dengan benar oleh seluruh peserta tes.
Menurut Witherington dalam Sudijono (2008: 371) dan Arikunto (2009: 207) angka indeks kesukaran butir itu besarnya berkisar antara 0,00 sampai dengan 1,00. Semakin besar angka indeks kesukaran maka soal semakin mudah. Jika seluruh peserta ujian menjawab dengan salah butir tersebut maka soal tersebut sangat sukar dengan angka kesukaran 0, 00 dan jika angka kesukaran 1, 00 maka soal sangat mudah karena dijawab dengan benar oleh seluruh peserta tes.
Uji tingkat
kesukaran suatu soal bertujuan mengetahui tingkat kesulitan soal yang digunakan
untuk mengukur hasil pembelajaran. Instrumen perlu diuji tingkat kesukaran
dengan menggunakan rumus:
Keterangan:
P :
Angka indeks kesukaran item
B:
Banyaknya peserta tes yang menjawab
dengan benar terhadap butir item yang bersangkutan
JS: Jumlah peserta tes yang mengikuti tes.
Kriteria
tingkat kesukaran suatu item soal dapat dilihat pada Tabel berikut:
Indeks Kesukaran
|
Keterangan
|
Kurang dari 0,30
|
Item soal berkategori
sukar
|
0,30 – 0,70
|
Item soal berkategori
cukup
|
Lebih dari 0,70
|
Item soal berkategori
mudah
|
Menurut Witherington dalam Sudijono (2008: 372) Tingkat
kesukaran soal dibedakan dalam tiga kategori yaitu: soal yang memiliki p 0,75
disebut soal terlalu mudah. Sedangkan menurut Thorndike dalam Sudijono (2008:
372) memberikan penafsiran terhadap angka tingkat kesukaran adalah p 0,70
disebut soal terlalu mudah.
Tingkat kesukaran soal adalah peluang untuk menjawab benar
suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam
bentuk indeks. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap
nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada
butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Fungsi tingkat kesukaran butir soal
biasanya dikaitkan dengan tujuan tes. Misalnya untuk
Keperluan ujian semester digunakan
butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi
digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk
keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat
kesukaran rendah/mudah.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan
bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-313).
Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap
pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran
adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang, (b)
tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c)
memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal
yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi tes,
tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir
dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan
penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan
dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi
antarsoal, semakin tinggi reliabilitas (Nunnally, 1981: 270-271).
Tingkat kesukaran butir soal juga dapat digunakan untuk
mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam
memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk kategori
mudah, maka prediksi terhadap informasi ini adalah seperti berikut.
- Pengecoh butir soal itu tidak berfungsi.
- Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi
terhadap informasi ini adalah seperti berikut.
- Butir soal itu "mungkin" salah kunci jawaban.
- Butir soal itu mempunyai 2 atau lebih jawaban yang benar.
- Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga kompetensi minimum yang harus dikuasai siswa belum tercapai.
- Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan ganda).
- Pernyataan atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini
memang memiliki keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk
mengestim
asi secara tepat karena estimasi tingkat kesukaran dibiaskan
oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan tinggi, maka soal
akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal
akan sangat sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan
analisis secara IRT, karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa
menentukan siapa peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat
mengestimasi parameter dan tingkat kesukaran soal tanpa bias.

Ada beberapa alasan untuk menyatakan tingkat kesukaran
soal. Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman soal,
kompleksitas, atau hal-hal lain yang berkaitan dengan kemampuan yang diukur oleh
soal. Namun demikian, ketika kita mengkaji lebih mendalam terhadap tingkat
kesukaran soal, akan sulit menentukan mengapa sebuah soal lebih sukar
dibandingkan dengan soal yang lain.
Secara umum, menurut teori klasik, tingkat kesukaran
dapat dinyatakan melalui beberapa cara diantaranya (1) proporsi menjawab benar,
(2) skala kesukaran linear, (3) indeks Davis, dan (4) skala bivariat. Proporsi
jawaban benar (p), yaitu jumlah peserta tes yang menjawab benar pada butir soal
yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya merupakan
tingkat kesukaran yang paling umum digunakan. Intinya, bermutu atau tidaknya
butir-butir item tes hasil belajar
pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesukaran yang
dimiliki oleh masing-masing butir item
tersebut. Butir-butir item tes hasil
belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah
dengan kata lain derajat kesukaran item
itu adalah sedang atau cukup. Angka yang dapat memberikan petunjuk mengenai
tingkat kesulitan item itu dikenal
dengan istilah difficulty index
(angka indeks kesukaran item), yang
dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P, yaitu
singkatan dari kata proportion
(proporsi = proporsa).
Kategori
Tingkat Kesukaran
Nilai p
|
Kategori
|
P < 0.3
|
Sukar
|
0.3 ≤ p ≤ 0.7
|
Sedang
|
P > 0.7
|
Mudah
|
Tindak Lanjut Hasil Analisis
Interpretasi Item
|
Tindak Lanjut
|
Sukar
|
1. butir item dibuang atau didrop dan tidak
dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang
2. diteliti
ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang
bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan soalnya
sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang
tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item tersebut dikeluarkan lagi dalam
tes hasil belajar yang akan datang.
3. butir-butir
yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi)
yang sifatnya sangat ketat.
|
Sedang
|
Butir item
ini dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang
akan datang
|
Mudah
|
1. butir item dibuang atau didrop dan tidak
dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang
2. diteliti
ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang
bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan solnya
sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang
tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item tersebut dikeluarkan lagi dalam
tes hasil belajar yang akan datang.
3. butir-butir
yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi)
yang sifatnya longgar.
|
Contoh
menentukan indeks kesukaran (P):
Sampel sebanyak
30 siswa, mengikuti tes formatif dengan soal sebanyak 20. Misalnya pada soal no
1, siswa yang menjawab benar adalah 27, maka tingkat kesukaran soalnya adalah:
= 0. 09
(Berarti soal
nomor 1 termasuk golongan soal mudah)
Komentar
Posting Komentar