16 Juni 2015
Secara umum yang dimaksud dengan
instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat
dipergunakan sebagai alat ukur atau pengumpulan data mengenai suatu variable.
Dalam bidang penelitian instrumen diartikan sebagai alat untuk mengumpulkan
data mengenai variabel-variabel penelitian untuk kebutuhan penelitian,
sedangkan dalam bidang pendidikan instrumen digunakan untuk mengukur prestasi
belajar siswa, faktor-faktor yang diduga mempunyai hubungan atau berpengaruh
terhadap hasil belajar, perkembangan hasil belajar, keberhasilan proses belajar
mengajar dan keberhasilan pencapaian suatu program tertentu (Djaali & Pudji
Mulyono, 2007)
Pada dasarnya instrumen dapat dibagi
dua yaitu tes dan non-tes. Yang termasuk kelompok tes adalah tes prestasi
belajar, tes intelegensi, tes bakat, dan tes kemampuan akademik, sedangkan yang
termasuk dalam kelompok non tes ialah skala sikap, skala penilaian, observasi,
wawancara, angket dokumentasi dan sebagainya.
Teknik
pembuatan instrumen evaluasi tes dan non-tes
A. Tes
a. pengertian
Secara umum tes diartikan sebagai alat
yang dipergunakan untuk mengukur pengetahuan atau penguasaan objek ukur
terhadap seperangkat materi tertentu. Menurut Sudijono (1996) tes adalah alat
atau prosedur yang digunakan dalam rangka pengukuran dan penilaian. Tes dapat
juga diartikan sebagai alat pengukur yang mempunyai standar objektif, sehingga
dapat dipergunakan secara meluas, serta betul-betul dapat dipergunakan untuk
mengukur dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan
menurut Norman (1976) tes merupakan salah satu prosedur evaluasi yang
komprehensif, sistematik, dan objektif yang hasilnya dapat dijadikan dasar
dalam pengambilan keputusan (Djaali & Pudji Mulyono, 2007).
b. Fungsi
Menurut Anas Sudijono (2001: 67) secara
umum ada dua fungsi tes antara lain:
1. Tes sebagai
alat pengukur terhadap peserta didik. Dalam hubungan ini tes berfungsi mengukur
tingkat perkembangan atau kemajuan yang telah dicapai oleh peserta didik
setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu.
2. Tes sebagai
alat pengukur keberhasilan program mengajar di sekolah. Sebab melalui tes akan
dapat diketahui sudah berapa jauh program pengajaran yang telah ditentukan atau
dicapai.
c. Jenis Tes
Ada beberapa jenis tes yang sering
digunakan dalam proses pendidikan, yaitu:
1. Tes penempatan
Tes yang dilaksanakan untuk keperluan penempatan bertujuan agar setiap
siswa yang mengikuti kegiatan pembelajaran di kelas atau pada jenjang
pendidikan tertentu dapat mengikuti kegiatan pembelajaran secara efektif,
karena dengan bakat dan kemampuannya masing-masing. Contohnya tes bakat, tes
kecerdasan dan tes minat.
2. Tes Diagnostik
Tes diagnostik dilaksanakan untuk mengidentifikasi kesulitan belajar yang
dialami siswa, menentukan faktor-faktor yang menyebabkan kesulitan belajar dan
menetapkan cara mengatasi kesulitan belajar tersebut. Dengan demikian jelas ada
kaitan yang erat antara tes penempatan dan diagnostik. Bahkan dapat dikatakan
keduanya saling melengkapi dalam memberikan kontribusi terhadap peningkatan
efektivitas kegiatan pendidikan pada suatu jenis atau jenjang pendidikan
tertentu.
3. Tes Formatif
Tes formatif pada dasarnya adalah tes yang bertujuan untuk mendapatkan
umpan balik bagi usaha perbaikan kualitas pembelajaran dalam konteks kelas.
Kualitas pembelajaran di kelas ditentukan oleh intensitas proses belajar
(proses intern) dalam diri setiap siswa sebagai subjek belajar sekaligus peserta
didik.
4. Tes Sumatif
Hasil tes sumatif berguna untuk (a) menentukan kedudukan atau
rangking masing-masing siswa dalam kelompoknya (b) menentukan dapat atau
tidaknya siswa melanjutkan program pembelajaran berikutnya, dan (c)
menginformasikan kemajuan siswa untuk disampaikan kepada pihak lain seperti
orang tua, sekolah, masyarakat, dan lapangan kerja. Jika tes sumatif
dilaksanakan pada setiap akhir semester, maka setiap akhir jenjang pendidikan
dilaksanakan tes akhir atau biasa disebut evaluasi belajar tahap akhir (Djaali
& Pudji Mulyono, 2007)
d. Bentuk Tes
Untuk melaksanakan evaluasi hasil
mengajar dan belajar, seorang guru dapat menggunakan dua macam tes, yakni tes
yang telah distandarkan (standardized test) dan tes buatan guru sendiri
(teacher-made test).Achievement test yang biasa dilakukan oleh guru
dapat dibagi menjadi dua golongan, yakni tes lisan (oral tes) dan tes tertulis
(writen tes). Tes tertulis dapat dibagi atas tes essay dan tes objektif atau
disebut juga short-answer test (Ngalim Purwanto, 2006).
Ø Tes
Lisanmerupakan sekumpulan item pertanyaan atau pernyataan yang disusun secara
terencana, diberikan oleh seorang guru kepada para siswanya tanpa melalui media
tulis. Pada kondisi tertentu, seperti jumlah siswa kecil (kelompok siswa yang
praktek laboratorium) atau sebagian siswa yang memerlukan tes remedial, maka
tes lisan dapat digunakan secara efektif. Tes lisan ini sebaiknya berfungsi
sebagai tes pelengkap, setelah tes utama dalam bentuk tertulis dilakukan
(Sukardi, 2008).
Ø Tes EssaySecara
ontology adalah salah satu bentuk tes tertulis, yang susunannya terdiri atas
item-item pertanyaan yang masing-masing mengandung permasalahan dan menuntut
jawaban siswa melui uraian-uraian kata yang merefleksikan kemampuan berpikir
siswa (Sukardi, 2008).
Menurut Sukardi (2008: 96) untuk
meningkatkan mutu pertanyaan esai sebagai alat pengukur hasil belajar yang
kompleks, memerlukan dua hal penting yang perlu diperhatikan oleh para
evaluator. Kedua hal penting tersebut, yaitu:
b) bagaimana
menskor jawaban yang diperoleh dari siswa. Berikut adalah cara-cara dalam
menyusun tes esai yang dimaksud:
·
Para guru hendaknya memfokuskan pertanyaan esai pada
materi pembelajaran yang tidak dapat diungkap dengan bentuk tes lain misalnya
tes objektif. Ada beberapa faktor penting dalam proses belajar mengajar,yang
hanya bisa diungkap oleh tes esai.
·
Para guru hendaknya memformulasikan item pertanyaan yang
mengungkap perilaku spesifik yang diperoleh dari pengalaman hasil belajar. Tes
yang direncanakan oleh guru, baik tes objektif maupun tes esai perlu tetap
mengukur penilaian tujuan intruksional.Item-item pertanyaan tes esai sebaiknya jelas dan tidak
menimbulkan kebingungan sehingga para siswa dapat menjawab dengan tidak
ragu-ragu
·
Sertakan petunjuk waktu pengerjaan untuk setiap
pertanyaan, agar para siswa dapat memperhitungkan kecepatan berpikir, menulis
dan menuangkan ide sesuai dengan waktu yang disediakan.
·
Ketika mengonstruksi sejumlah pertanyaan esai, para guru
hendaknya menghindari penggunaan pertanyaan pilihan. Pertanyaan pilihan
biasanya terletak pada kalimat instruksi pengerjaan pada awal tes, misalnya
“pilih empat soal dari lima pertanyaan yang tersedia”.
Ø Tes Objektif
Merupakan tes yang cara pemeriksaannya
dapat dilakukan secara objektif yang dilakukan dengan cara mencocokkan kunci
jawaban dengan hasil jawaban tes. hal ini memungkinkan tes untuk menjawab
banyak pertanyaan dalam waktu yang relatif singkat.
Ada beberapa jenis tes objektif
1) Tes Objektif
Pilihan Ganda
Item tes pilihan ganda merupakan jenis tes objektif yang paling banyak
digunakan oleh para guru. Tes ini dapat mengukur pengetahuan yang luas dengan
tingkat domain yang bervariasi. Item tes pilihan ganda memiliki semua
persyaratan sebagai tes yang baik, yakni dilihat dari segi ojektivitas,
reliabilitas, dan daya pembeda antara siswa yang berhasil dengan siswa yang
gagal (Sukardi, 2008).
2) Tes Objektif
Benar-Salah
Item tes benar-salah dibedakan menjadi dua macam bentuk yaitu, item tes
bentuk regular atau tidak dimodifikasi dan item tes bentuk modifikasi. Di
bidang pendidikan umum maupun kejuruan, item tes benar salah yang tidak
dimodifikasi atau regular banyak digunakan oleh para guru. Salah satu alasannya
adalah bahwa item tes benar salah jenis regular dapat digunakan dalam proses
belajar mengajar sebagai tehnik untuk mengawali dimulainya diskusi yang
hangat, menarik dan bermakna. Item tes betul salah apabila dicermati secara
intensif , akan membawa peserta didik ke dalam diskusi isu-isu pembelajaran
yang bergeser sedikit menjadi problem solving (Sukardi, 2008).
3) Tes Objektif
Menjodohkan
Item tes menjodohkan sering juga disebut matching test item. Item
tes menjodohkan ini juga termasuk dalam kelompok tes objektif. Secara fisik ,
bentuk item tes menjodohkan, terdiri atas dua kolom yang sejajar. Pada kolom
pertama berisi pernyataan yang disebut daftar stimulus dan kolom kedua berisi
kata atau fakta yang disebut juga daftar respon atau jawaban (Sukardi, 2008).
Teknik Pembuatan Tes
Ada dua macam teknik yang dapat
digunakan dalam melaksanakan evaluasi, yaitu teknik tes dan teknik non tes.
Teknik tes meliputi tes lisan, tes tertulis dan tes perbuatan. Tes lisan
dilakukan dalam bentuk pertanyaan lisan di kelas yang dilakukan pada saat
pembelajaran di kelas berlangsung atau di akhir pembelajaran. Tes tertulis
adalah tes yang dilakukan tertulis, baik pertanyaan maupun jawabannya.
Sedangkan tes perbuatan atau tes unjuk kerja adalah tes yang dilaksanakan
dengan jawaban menggunakan perbuatan atau tindakan.
Evaluasi dengan
menggunakan teknik tes bertujuan untuk mengetahui:
a) Tingkat
kemampuan awal siswa
b) Hasil belajar
siswa
c) Perkembangan
prestasi siswa
Tes lisan
dilakukan melalui pertanyaan lisan untuk mengetahui daya serap siswa. Tujuan
tes lisan ini terutama untuk menilai:
a) Kemampuan
memecahkan masalah
b) Proses berpikir
terutama melihat hubungan sebab akibat
c) Kemampuan
menggunakan bahasa lisan
d) Kemampuan mempertanggungjawabkan
pendapat atau konsep yang dikemukakan.
Tes tertulis dapat berbentuk uraian (essay)
atau soal bentuk obyektif (objective tes). Tes uraian merupakan alat
penilaian hasil belajar yang paling tua. Secara umum tes uraian ini adalah
pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan, menjelaskan,
mendiskusikan, membandingkan, memberikan alasan, dan bentuk lain yang sejenis
sesuai dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa
sendiri.
Cara-cara penyusunan tes esai yang dimaksud:
a) Guru hendaknya
memfokuskan pertanyaan esai pada materi pembelajaran yang tidak dapat diungkap
dengan bentuk tes lain misalnya tes objektif.
b) Guru kendaknya
memformulasikan item pertanyaan yang mengungkap perilaku spesifik yang diperoleh
dari pengalaman hasil belajar.
c) Item-item
pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan kebingungan sehingga
siswa dapat menjawabnya dengan tidak ragu-ragu.
d) Sertakan
petunjuk waktu pengerjaan untuk setiap pertanyaan, agar para siswa dapat memperhitungkan
kecepatan berpikir, menulis dan menuangkan ide sesuai dengan waktu yang
disediakan.
e) Ketika
mengontruksi sejumlah pertanyaan esai, para guru hendaknya menghindari
penggunaan pertanyaan pilihan. Misalnya pilih empat soal dari lima pertanyaan
yang tersedia.
Ø Bentuk soal
benar-salahadalah bentuk tes yang soal-soalnya berupa pernyataan. Sebagian dari
pernyataan itu merupakan pernyataan yang benar dan sebagian lagi merupakan
pernyataan yang salah.
Kelebihan betul salah yaitu;
- Item tes betul salah memiliki karakteristik yang
menguntungkan, yaitu mudah dan cepat dalam menilai
- Untuk item betul salah yang di konstruksi secara
cermat, membawa implikasi kepada peserta didik, yaitu waktu mengerjakan
soal lebih cepat diselesaikan
- Seperti bentuk tes objektif lainnya, item tes benar
salah hasil akhir penilaian dapat objektif
Kelemahan betul salah;
- Mengonstruksi item tes betul salah pada umumnya
diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes
esai
- Penggunaan pertanyaan alternatif lebih memungkinkan
peserta didik mengira-ngira jawaban.
Ø Bentuk soal
pilihan ganda atau pilihan jamak (multiple choice)
Soal pilihan ganda adalah bentuk tes yang mempunyai satu jawaban yang benar atau paling tepat.
Soal pilihan ganda adalah bentuk tes yang mempunyai satu jawaban yang benar atau paling tepat.
Kelebihan bentuk soal pilihan ganda yaitu:
- Tes pilihan ganda memiliki karakteristik yang baik
untuk suatu alat pengukur hasil belajar siswa
- Item tes pilihan ganda yang di konstruksi dengan
intensif dapat mencakup hampir seluruh bahan pembelajaran yang diberikan
oleh guru di kelas.
- Item tes pilihan ganda adalah tepat untuk mengukur
penguasaan informasi para siswa yang hendak dievaluasi.
Kelemahan bentuk soal pilihan ganda yaitu;
- Mengonstruksi item tes betul salah pada umumnya
diperlukan waktu yang lebih lama jika dibandingkan dengan pembuatan tes
esai
- Penggunaan pertanyaan alternative lebih memungkinkan
peserta didik mengira-ngira jawaban.
Ø Bentuk soal
menjodohkan (matching) terdiri atas dua kelompok pernyataan yang
paralel. Kedua kelompok pernyataan ini berada dalam satu kesatuan. Kelompok
sebelah kiri merupakan bagian yang berisi soal-soal yang harus dicari
jawabannya.
Kelebihan bentuk soal menjodohkan
- Penilaiannya dapat dilakukan dengan cepat dan
objektif.
- Tepat digunakan untuk mengukur kemampuan bagaimana
mengidentifikasi antara dua hal yang berhubungan.
- Dapat mengukur ruang lingkup pokok bahasan atau sub
pokok bahasan yang lebih luas.
Kelemahan bentuk soal menjodohkan
- Hanya dapat mengukur hal-hal yang didasarkan atas
fakta dan hafalan
- Sukar untuk menentukan materi atau pokok bahasan
yang mengukur hal-hal yang berhubungan
Ø Bentuk soal
jawaban singkat (isian)merupakan soal yang menghendaki jawaban dalam bentuk
kata, bilangan, kalimat, atau simbol.
Kelebihan
bentuk soal jawaban singkat;
- Menyusun soalnya relatif mudah
- Kecil kemungkinan siswa memberi jawaban dengan cara
menebak
- Menuntut siswa untuk dapat menjawab dengan singkat
dan tepat
- Hasil penilaiannya cukup objektif
Kelemahan bentuk soal jawaban singkat;
- Kurang dapat mengukur aspek pengetahuan yang lebih
tinggi.
- Memerlukan waktu yang agak lama untuk menilainya
sekalipun tidak selama bentuk uraian
- Menyulitkan pemeriksaan apabila jawaban siswa
membingungkan pemeriksa
Non Tes
Tehnik evaluasi
nontes berarti melaksanakan penilaian dengan tidak menggunakan tes.
Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh
meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidup dan
lain-lain. Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik
secara individu maupun secara kelompok.
Jenis-jenis
Tehnik Non-Tes
Beberapa alat
ukur yang hendak diuraikan pada bagian ini adalah observasi, wawancara, daftar
cek dan skala nilai/rating scale.
1.
Observasi
Secara garis
besar terdapat dua rumusan tentang pengertian observasi, yaitu pengertian
secara sempit dan luas. Dalam arti sempit, observasi berarti pengamatan secara
langsung terhadap apa yang diteliti, Dalam arti luas observasi meliputi
pengamatan yang dilakukan secara langsung mau pun tidak langsung terhadap objek
yang diteliti (Susilo Rahardjo & Gudnanto, 2011).
2. Wawancara
Kompetensi
evaluasi lain yang juga perlu dimiliki oleh para guru sebagai evaluator di
bidang pendidikan adalah penggunaan evaluasi non tes dengan menggunakan tehnik
wawancara/interview. Mengenai apa yang dimaksud dengan wawancara dalam evaluasi
non tes. Johnson and Johnson (dalam Sukardi, 2008: 187) menyatakan sebagai berikut:
An interview is a personal interaction between interviewer (teacher) and one
or more interviwees (students) in which verbal questions are asked. Wawancara
adalah interaksi pribadi antara pewawancara (guru) dengan yang diwawancarai
(siswa) di mana pertanyaan verbal diajukan kepada mereka.
Dalam konteks
evaluasi pendidikan, wawancara dapat dilakukan secara individual maupun secara
berkelompok, di mana seorang guru bertatap muka dan melakukan tenya jawab
terhadap siswanya. Di samping itu wawancara dapat dilakukan baik sebelum,
selama dan sesudah proses belajar mengajar berlangsung (Sukardi, 2008).
3. Daftar cek adalah sebuah daftar yang memuat
sejumlah pernyataan singkat, tertulis tentang berbagai gejala yang dimaksudkan
sebagai penolong pencatatan ada tidaknya sesuatu gejala dengan cara memberi
tanda cek (V) pada setiao emunculan gejala yang dimaksud. Daftar cek bertujuan
untuk mengetahui apakah gejala yang berupa pernyataan yang tercantum dalam
daftar cek ada atau tidak ada pada seorang individu atau kelompok (Ign.
Masidjo, 1995).
4. Skala rating
merupakan alat ukur keterampilan yang masih juga tergolong alat ukur non tes.
Seperti alat ukur daftar cek lis, alat ukur ini juga sudah lama digunakan di
bidang evaluasi pendidikan. Pada umumnya, alat ukur rating terdiri atas dua
bagian, yaitu:
Ø Satu rangkaian
karakteristik atau kualitas yang hendak dinilai
Ø Beberapa tipe
skala ukur yang menunjukkan tingkat atau derajat atribut subjek atau objek yang
ada (Crondlund & Linn, dalam Sukardi, 2008)
Teknik Pembuatan
Non Tes
Teknik tes
bukanlah satu-satunya teknik untuk melakukan evaluasi hasil belajar, sebab
masih ada teknik lainnya yang dapat digunakan, yaitu teknik non tes. Dengan
teknik non tes maka penilaian atau evaluasi hasil belajar peserta didik
dilakukan dengan tanpa menguji peserta didik melainkan dilakukan melalui:
1. Pengamatan atau
observasi
Secara umum,
pengertian observasi adalah cara menghimpun bahan-bahan keterangan yang
dilakukan dengan mengadakan pengamatan dan pencatatan secara sistematis terhadap
fenomena-fenomena yang sedang dijadikan sasaran pengamatan. Alat yang digunakan
berupa lembar observasi yang disusun dalam bentuk check list atau skala
penilaian.
2. Wawancara
Secara umum
yang dimaksud dengan wawancara adalah cara menghimpun bahan-bahan keterangan
yang dilaksanakan dengan melakukan tanya jawab lisan secara sepihak. Alat yang
digunakan adalah pedoman wawancara yang mengacu pada tujuan yang telah
ditetapkan.
3. Angket
Angket adalah
wawancara yang dilakukan secara tertulis. Angket dapat digunakan sebagai alat
penilaian hasil belajar. Angket dapat diberikan langsung kepada peserta didik,
dapat pula diberikan kepada orang tua mereka.
4. Skala
Skala adalah
alat untuk mengukur nilai, sikap, minat, perhatian, dan lain-lain yang disusun dalam
bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam bentuk
rentangan nilai sesuai dengan kriteria yang ditentukan.
Kualitas alat evaluasi (Validitas, Reabilitas, Daya
pembeda)
Keberhasilan
mengungkapkan hasil belajar dan proses belajar siswa sebagaimana adanya
(objektivitas hasil penilaian)sangat bergantung pada kualitas alat penilainya
di samping pada cara pelaksanaannya. Suatu alat evaluasi yang baik akan
mencerminkan kemampuan sebenarnya dari tes yang dievaluasi dan bisa membedakan yang
pandai (di atas rata-rata), dan siswa yang kemampuannya sedang(pada kelompok
rata-rata), dan siswa yang kemampuannya kurang (di bawah rata-rata), sehingga
penyebaran skor atau nilai evaluasi tersebut berdistribusi normal).
Ø Validitas
Validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan
mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan
tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah.
Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk satu situasi mungkin tidak valid untuk situasi yang lain. Sebagai contoh : menilai kemampuan siswa dalam matematika dan diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan tentang tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Oleh sebab itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi.
Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk satu situasi mungkin tidak valid untuk situasi yang lain. Sebagai contoh : menilai kemampuan siswa dalam matematika dan diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan tentang tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Oleh sebab itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi.
Ø Reabilitas
Reabilitas merupakan penerjemahan dari
kata Reability yang mempunyai asal kata rely dan ability. Pengukuran yang
memiliki reabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable)
walaupun reabilitas mempunyai berbagai nama lain seperti kepercayaan,
keterandalan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang
terkandung dalam konsep reabilitas adalah sejauh mana hasil suatu pengukuran
dapat dipercaya.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini, relatif yang dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan)dan bisa diabaikan. Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Dari uraian di atas dapat dipahami bahwa prinsip reabilitas akan menyangkut pertanyaan : “ seberapa jauhkah pengukuran yang dilakukan secara berulang kali terhadap subjek atau sekelompok subjek yang sama, memberikan hasil-hasil yang relatif tidak mengalami perubahan “. Bila hasil yang diperoleh selalu sama (setidak-tidaknya mendekati sama). Maka dapat dikatakan bahwa alat pengukur berupa tes tersebut telah memiliki reabilitas yang tinggi. Jadi perinsif reabilitas menghendaki adanya keakuratan dari hasil pengukuran yang berulang-ulang terhadap seorang subjek atau sekelompok subjek yang sama.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini, relatif yang dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti (tidak signifikan)dan bisa diabaikan. Perubahan hasil evaluasi ini disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Dari uraian di atas dapat dipahami bahwa prinsip reabilitas akan menyangkut pertanyaan : “ seberapa jauhkah pengukuran yang dilakukan secara berulang kali terhadap subjek atau sekelompok subjek yang sama, memberikan hasil-hasil yang relatif tidak mengalami perubahan “. Bila hasil yang diperoleh selalu sama (setidak-tidaknya mendekati sama). Maka dapat dikatakan bahwa alat pengukur berupa tes tersebut telah memiliki reabilitas yang tinggi. Jadi perinsif reabilitas menghendaki adanya keakuratan dari hasil pengukuran yang berulang-ulang terhadap seorang subjek atau sekelompok subjek yang sama.
Dengan catatan
subjek-subjek yang diukur itu tidak mengalami perubahan.
Estimasi terhadap tingginya reabilitas dapat dilakukan melalui berbagai metode pendekatan. Masing-masing metode pendekatan dikembangkan sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan mempertimbangkan dengan mempertimbangkan pula segi-segi praktisnya.
Estimasi terhadap tingginya reabilitas dapat dilakukan melalui berbagai metode pendekatan. Masing-masing metode pendekatan dikembangkan sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan mempertimbangkan dengan mempertimbangkan pula segi-segi praktisnya.
Terdapat tiga macam pendekatan
reabilitas yaitu :
·
Pendekatan tes ulang (test-retest)
Dalam
pendekatan ini dilakukan dengan menyajikan tes dua kali pada satu kelompok
subjek dengan tenggang waktu di antara kedua kajian tersebut. Asumsi yang
menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan
menghasilkan skor tampak yang relatif sama apabila dikenakan dua kali pada
waktu yang berbeda. Semakin besar variasi perbedaan skor subjek antara kedua
pengenaan itu berarti semakin sulit untuk mempercayai bahwa tes itu memberikan
hasil ukur konsisten.
·
Pendekatan Bentuk Paralel (paralel-forms)
Tes bentuk
paralel adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran,
dan susunan tetapi butir-butir soalnya berbeda. Dengan bahasa sederhana dapat
dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang
paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.
Pendekatan ini dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel satu sama lain, kepada sekelompok subjek. Dalam pelaksanaannya, kedua tes paralel itu dapat digabungkan terlebih dahulu seakan-akan merupakan suatu bentuk tes semula dipisahkan kembali untuk diberi skor masing-masing, sehingga diperoleh dua distribusi skor.
Pendekatan ini dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel satu sama lain, kepada sekelompok subjek. Dalam pelaksanaannya, kedua tes paralel itu dapat digabungkan terlebih dahulu seakan-akan merupakan suatu bentuk tes semula dipisahkan kembali untuk diberi skor masing-masing, sehingga diperoleh dua distribusi skor.
·
Pendekatan Tes Tunggal
Pendekatan tes
tunggal dalam estimasi reliabilitas dimaksudkan, antara lain, untuk menghindari
masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang dan oleh
pendekatan bentuk paralel. Dalam menggunakan pendekatan ini prosedurnya hanya
memerlukan satu kali pengenaan sebuah tes pada sekelompok individu sebagai
subjek (single trial administration). Oleh karena itu pendekatan ini mempunyai
nilai praktis dan efisiensi yang tinggi. Dengan hanya satu kali tes pengenaan
tes akan diperoleh satu distribusi skor tes dari kelompok subjek bersangkutan
Analisis data
untuk pendekatan tes tunggal bisa dibagi ke dalam dua macam teknik, yaitu :
·
Teknik Belah Dua
Dalam menentukan reabilitas suatu perangkat tes (evaluasi) dengan menggunakan
teknik belah dua, dilakukan dengan jalan membelah alat evaluasi tersebut
menjadi dua bagian yang sama (relatif sama), sehingga masing-masing tes
memiliki dua macam skor. Salah satu syarat yang harus dipenuhi untuk teknik
belah dua ini adalah jumlah soal dalam perangkat harus genap, supaya kedua bagian
itu jumlah soalnya sama.
Teknik belah dua ini bisa dilakukan dengan dua cara,yaitu
:
o Pembelahan
menurut nomor (soal) ganjil dan nomor genap atau disingkat Metode Ganjil Genap.
Misalkan suatu perangkat tes terdiri dari 20 butir soal, maka kelompok belahan
pertama terdiri dari skor-skor untuk nomor 1, 3, 5, 7, 9, 11, 13, 15, 17, dan
19 sedangkan untuk kelompok kedua terdiri dari 2, 4, 6, 8, 10, 12, 14, 16, 18,
20.
o Pembelahan
menurut nomor urut yang disebut dengan metode awal akhir. Misal perangkat tes
terdiri dari 20 butir soal, maka kelompok bahan pertama terdiri dari skor-skor
untuk nomor 1 sampai dengan 10 dan kelompok belahan kedua terdiri dari
skor-skor untuk nomor 11 sampai dengan 20.
Daya Pembeda
Yang dimaksud
Daya Pembeda suatu soal tes ialah bagaimana kemampuan soal itu untuk membedakan
siswa-siswa yang termasuk kelompok pandai (upper group) dengan siswa-siswa yang
termasuk kelompok kurang (lower group). Daya pembeda suatu soal tes dapat
dihitung dengan menggunakan rumus seperti berikut
DP=(WL-WH) / n
Keterangan:
DP : Daya Pembeda
n : Jumlah kelompok atas atau kelompok
bawah
WL : jumlah
peserta didik yang menjawab salah dari kelompok bawah
WH : jumlah
peserta didik yang menjawab salah dari kelompok atas
Contoh:
Untuk
mendapatkan gambar yang lebih jelas mengenai langkah-langkah yang ditempuh
dalam mencari Indeks kesukaran dan daya pembeda suatu item, di bawah ini akan
dikemukakan sebuah contoh.
o Kita misalkan
murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang. Lembar
jawaban murid-murid tersebut kita susun dari skor tertinggi paling atas sampai
dengan skor rendah yang terbawah.
o Kita ambil 27%
dari mereka yang mendapatkan skor tertinggi. Dalam hal ini, 27% x 50 orang sama
dengan 13,5 orang kita bulatkan menjadi 14 orang. Begitu pula kita ambil 27%
dari mereka yang mendapatkan skor yang terendah. Jumlahnya tentu sama dengan
kelompok atas, yaitu 14 orang.
o Misalkan data
yang diperoleh adalah sebagai berikut:
§ Untuk item
no.1, dari kelompok bawah salah 9 orang dan dari kelompok atassalah 2 orang.
§ Untuk item
no.2, dari kelompok bawah salah 8 orang dan dari kelompok atas salah 5 orang.
§ Untuk item
no.3, dari kelompok bawah salah 14 orang dan dari kelompok atas salah 5 orang.
§ Untuk item
no.4, dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang
salah.
§ Untuk item
no.5, dari kelompok bawah salah 13 orang dan dari kelompok atas salah 10 orang.
§ Untuk item
no.6, dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.
Berdasarkan
data tersebut, maka dapat dibuat tabel seperti di bawah ini.
|
No.Item
|
WL
|
WH
|
WL + WH
|
WL - WH
|
|
1
2
3
4
5
6
|
9
8
14
6
13
2
|
2
5
8
0
11
3
|
11
13
23
6
24
5
|
7
3
6
6
2
-1
|
Berdasarkan
tabel diatas, maka indeks kesukaran untuk masing-masing item dapat dicari
sebagai berikut;
Untuk item no 1 : DP=7/14=0,5·
Untuk item no.2 : DP=3/14=0,21
Untuk item no.3 : DP=6/14=0,43
Untuk item no.4 : DP=6/14=0,43
Untuk item no.5 : DP=2/14=0,14
Untuk item no.6 : DP=-1/14=-0,07
Daya Pembeda
yang ideal adalah daya pembeda 0,40 ke atas. Namun untuk ulangan-ulangan
harian, masih dapat ditolerir daya pembeda sebesar 0,20. Item-item yang
memenuhi syarat dapat kita simpan dan kita gunakan untuk keperluan evaluasi
yang akan datang. Item-item yang tidak memenuhi syarat harus dibuang atau
direvisi.
Matkul :
Evaluasi Pembelajaran
Dosen : Dirgantara
Wicaksono, M.Pd
Tidak ada komentar:
Posting Komentar