Makalah Reliabilitas Tes
-
Upload
magano-el-fhira -
Category
Documents
-
view
360 -
download
33
Transcript of Makalah Reliabilitas Tes
MAKALAH
Disusun guna memenuhi salah satu tugas mata kuliah “Evaluasi Pembelajaran Sains” yang diampu oleh Dr. Eli Rohaeti
Disusun Oleh :
Magfirah Perkasa (13708251079)
PROGRAM STUDI PENDIDIKAN SAINS
PROGRAM PASCASARJANA
UNIVERSITAS NEGERI YOGYAKARTA2014
DAFTAR ISI
DAFTAR ISI............................................................................................................1
BAB I PENDAHULUAN........................................................................................2
A. Latar Belakang....................................................................................2
B. Pembatasan Masalah...........................................................................3
C. Rumusan Masalah...............................................................................3
D. Tujuan.................................................................................................3
BAB II PEMBAHASAN.........................................................................................4
A. Arti Reliabilitas Tes............................................................................4
B. Metode Mencari Besar Nilai Reliabilitas............................................5
1. Metode tes ulang (test-retest method)............................................5
2. Metode bentuk paralel (alternate/parallel form)............................6
3. Metode belah dua (split-half method).............................................7
4. Metode Kuder-Richardson-20 & 21...............................................8
5. Metode Cronbach alpha.................................................................9
C. Cara Menghitung Reliabilitas Serta Contohnya................................10
1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan program SPSS........................................................10
2. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan program Quest.......................................................11
BAB III PENUTUP..............................................................................................16
DAFTAR ISI..........................................................................................................17
1
BAB I
PENDAHULUAN
A. Latar Belakang
Validitas dan reliabilitas merupakan indikator utama pada sebuah tes.
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam
bahasa Inggris, yang berasal dari kata reliable yang artinya dapat dipercaya.
Seringnya terjadi kesalahan dalam penggunaan istilah validitas dan valid, juga
terjadi dalam penggunaan istilah reliabilitas dan reliabel. Istilah reliabilitas
merupakan kata benda, dan kata reliabel merupakan kata sifat atau keadaan.
Seseorang dikatakan dapat dipercaya apabila orang tersebut selalu
berbicara ajeg tentang suatu hal, tidak berubah-ubah isi pembicaraannya dari
waktu ke waktu dan selalu konsisten. Tes juga memiliki keajegan, sebuah tes
dinyatakan memiliki keajegan apabila tes tersebut dapat memberikan
informasi yang sama (serupa) walaupun diujikan pada kesempatan yang
berbeda, dan dapat mengukur kemampuan testee sesuai dengan kenyataannya.
Seberapa besar informasi tersebut “dapat dipercaya” dapat dilihat pada
besarnya nilai reliabilitas dengan berbagai metode sesuai dengan kebutuhan
tester dan kondisi serta faktor pendukung pengukuran tersebut.
Seiring dengan perkembangan ilmu pengetahuan, teknologi dan seni
(IPTEKS), terdapat beberapa metode yang dapat digunakan untuk mencari
besar nilai reliabilitas tes serta cara menghitungnya dengan berbagai program
atau software. Reliabilitas merupakan salah satu komponen dalam proses
analisis item. Analisis item dapat dilakukan dengan pendekatan teori tes klasik
(Classical Test Theory atau CTT) dan teori tes modern yang dikenal dengan
teori respons item (Item Respons Theory atau IRT). Program yang berbasis
pendekatan Classical Test Theory salah satunya yaitu Iteman. Beberapa
program yang berbasis pendekatan Item Respons Theory diantaranya: Quest,
Ascal, Rascal, Bilog, Bigstep, dll. Reliabilitas tes juga dapat
dihitung/dianalisis dengan menggunakan program SPSS (Statistical Program
for Social Science).
2
B. Pembatasan Masalah
Berdasarkan latar belakang masalah, masalah yang dikaji dalam
makalah ini hanya membahas pengertian reliabilitas, cara mencari besar nilai
reliabilitas dan cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS. Makalah ini disusun berdasarkan
studi literatur dan penalaran (reasoning) penulis.
C. Rumusan Masalah
Berdasarkan pembatasan masalah, masalah dalam makalah ini
dirumuskan sebagai berikut:
1. Apakah yang dimaksud dengan reliabilitas?
2. Bagaimanakah metode mencari besar nilai reliabilitas?
3. Bagaimanakah cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS?
D. Tujuan
Berdasarkan rumusan masalah, maka tujuan dalam makalah ini dapat
diuraikan sebagai berikut:
1. Menjelaskan pengertian reliabilitas.
2. Menentukan metode mencari besar nilai reliabilitas.
3. Menentukan cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS.
3
BAB II
PEMBAHASAN
A. Arti Reliabilitas Tes
Reliabilitas dan validitas merupakan indikator utama pada sebuah tes.
Validitas berhubungan dengan makna ketepatan, dan reliabilitas berhubungan
dengan makna ketetapan dan kepercayaan (Alias, 2005). Lankes (2008)
menyatakan bahwa reliabilitas menunjuk pada sesuatu atau seseorang yang
independen dan konsisten secara kualitas. Reliabilitas merupakan indikator
konsistensi antara dua atau lebih pengukuran pada tes yang sama (Alias,
2005). Secara garis besar dapat dinyatakan bahwa reliabilitas menunjuk pada
konsistensi (stabilitas) skor yang dihasil melalui pengukuran dengan
menggunakan alat ukur tertentu (Reynolds, et al., 2009: 91; Ross, 2006).
Makna ketetapan/konsistensi dalam konteks reliabilitas dapat diilustrasikan
seperti: jika diperoleh hasil tes A menunjukkan nilai yang lebih rendah dari
hasil tes B, maka ketika dilakukan tes ulang dengan alat ukur yang serupa
kepada keduanya, hasil tes tetap akan menunjukkan bahwa A memperoleh
nilai yang lebih rendah dari hasil tes B, meskipun nilai keduanya tidak sama
antara hasil tes pertama dan kedua. Reliabilitas sebuah tes merupakan derajat
konsistensi dari tes tersebut dalam mengukur sesuatu yang diharapkan dapat
terukur (Tella, 2011).
Sebuah tes yang memiliki reliabilitas yang tinggi belum pasti memiliki
validitas yang tinggi, namun sebuah tes yang memiliki validitas yang tinggi
biasanya dapat dipastikan memiliki reliabilitas yang tinggi pula (Arikunto,
2010: 87; Alias, 2005). Suatu tes (alat ukur) dinyatakan memiliki
reliabilitas/taraf kepercayaan yang tinggi apabila tes tersebut dapat
memberikan hasil/gambaran data atau informasi yang tetap apabila diujikan
beberapa kali, walaupun pada testee (objek-dalam hal ini siswa) yang berbeda
(Arikunto, 2010, hal. 86).
4
B. Metode Mencari Besar Nilai Reliabilitas
Besar nilai reliabilitas dari sebuah paket tes ditentukan oleh nilai
koefisien reliabilitas. Nilai koefisien reliabilitas dipengaruhi oleh jumlah item
dalam sebuah paket soal. Hubungan antara jumlah item soal dengan koefisien
reliabilitas disajikan seperti berikut:
Tabel 1Hubungan Antara Jumlah Item dengan Koefisien Reliabilitas
Jumlah Soal Koefisien Reliabilitas5 0.2010 0.3320 0.5040 0.6760 0.7580 0.80100 0.83200 0.95300 0.94
(Ebel & Frisbie, 1991)
Terdapat berbagai cara untuk mencari/menentukan besar nilai
reliabilitas. Metode yang digunakan untuk mencari besar nilai reliabilitas
dalam penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal (Ayodele, 2012).
Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis tiga
prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method); (2)
metode bentuk paralel (alternate/parallel form); (3) metode belah dua (split-
half method); (4) metode Kuder-Richardson-20 & 21; (5) metode Cronbach
alpha (Ayodele, 2012; Arikunto, 2010: 90-112; Cook & Beckman, 2006;
Felder & Spurlin, 2005; Reynolds, Livingston, & Willson, 2009: 29-48;
Carmines & Zeller, 1979) yang dijelaskan lebih lanjut sebagai berikut:
1. Metode tes ulang (test-retest method)
Metode tes ulang (test-retest method) merupakan metode yang
digunakan dimana tes diberikan kepada satu orang testee pada dua
kesempatan yang berbeda (Cook & Beckman, 2006). Metode tes ulang
dilakukan untuk menghindari penyusunan dua seri tes. Satu tes disusun
5
oleh tester untuk dicobakan dua kali. Oleh karena tesnya hanya satu dan
dicobakan dua kali, metode ini dapat disebut juga single-test-double-trial-
method. Besar nilai reliabilitas melalui metode ini dapat dilihat pada besar
koefisien korelasi antara tes pertama dan tes kedua (Arikunto, 2010, hal.
91). Koefisien korelasi untuk tes yang dapat dinyatakan reliabel dan layak
untuk dicobakan yaitu 0.70 keatas (Tella, 2011).
Ayodele (2012) menyatakan terdapat beberapa faktor yang perlu
diperhatikan dalam penggunaan metode ini, antara lain:
a. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh panjang (lama) untuk menghindari faktor perubahan situasi.
b. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh pendek (cepat) untuk menghindari faktor testee yang masih
mengingat materi tes pertama.
c. Testee harus mengetahui materi soal pertama maupun kedua dan
seharusnya terdapat perbedaan skor antara test dan retest.
Rentang waktu antara tes pertama dan tes kedua idealnya antara 2-4
minggu (Felder & Spurlin, 2005; Tella, 2011; Carmines & Zeller, 1979).
2. Metode bentuk paralel (alternate/parallel form)
Metode ini disebut juga dengan alternate-forms method (Arikunto,
2010: 90; Ayodele, 2012; Cook & Beckman, 2006). Tester yang
menggunakan metode ini perlu mengembangkan dua paket tes yang
mempunyai kesamaan dalam tujuan, isi, spesifikasi, jumlah, format,
tingkat kesukaran dan diskriminan. Menentukan besar nilai reliabilitas
menggunakan tes paralel disebut juga dengan metode double-test-double-
trial-method (Arikunto, 2010: 91; Ayodele, 2012). Dua paket tes yang
dikembangkan dicobakan pada testee yang sama dalam kesempatan yang
sama maupun kesempatan yang berbeda.
Hal ini dapat diilustrasikan apabila paket soal A yang ingin
diketahui reliabilitasnya diberikan kepada testee, selanjutnya paket soal B
diberikan juga kepada testee baik dalam kesempatan yang sama (jika
6
memungkinkan) maupun kesempatan yang berbeda. Besar nilai reliabilitas
melalui metode ini dapat dilihat pada besar koefisien korelasi antara kedua
tes. Koefisien korelasi untuk tes yang dapat dinyatakan reliabel dan layak
untuk dicobakan yaitu 0.70 keatas.
3. Metode belah dua (split-half method)
Pada metode ini, satu paket tes dicobakan pada testee hanya satu
kali sehingga disebut juga single-test-single-trial-method. Hasil tes
dianalisis dengan metode belah dua. Persyaratan khusus untuk penggunaan
metode ini yaitu memastikan bahwa item soal dikembangkan dengan
jumlah yang genap sehingga dapat dibagi dua sama banyak.
Kemungkinan terjadinya kesalahan dalam metode belah dua ini
yaitu adanya kecenderungan kesalahan dalam melakukan belah dua
dengan membelah dua testee. Prosedur dalam metode belah dua yaitu
dengan membelah item tes, bukan membelah dua testee dari jumlah total.
Arikunto (2010, hal. 93) menguraikan bahwa ada dua cara dalam
membelah item (butir) soal, yaitu:
a. Membelah dengan membagi item berdasarkan nomor genap-ganjilnya
item yang selanjutnya disebut dengan belahan genap-ganjil.
b. Membelah dengan membagi item berdasarkan awal-akhir item, 50%
item awal disebut bagian awal, 50% item akhir disebut item akhir,
selanjutnnya pembelahan ini disebut belahan awal-akhir.
Secara umum persamaan yang digunakan untuk menentukan besar
nilai reliabilitas melalui metode belah dua yaitu dengan menggunakan
rumus Spearman-Brown (Arikunto, 2010: 93; Cook & Beckman, 2006;
Ayodele, 2012) seperti disajikan berikut:
Reliabilitas = 2 r
1+r dimana r = korelasi antar skor-skor setiap belahan
Secara khusus metode belah dua dengan belahan genap-ganjil
menggunakan rumus Flanagan yaitu:
7
2
22
21
11 12TS
SSr
Keterangan:r11 = reliabilitas tes secara keseluruhan S1
2 = varians skor belahan ganjilS2
2 = varians skor belahan genapST
2 = varians skor total
Metode belah dua dengan belahan awal-akhir menggunakan rumus Rulon
yaitu:
Keterangan:r11 = reliabilitas tes secara keseluruhan Sd
2 = varians bedad = difference yaitu perbedaan skor antara belahan awal dan
belahan akhir
Penggunaan metode ini disertai dengan beberapa syarat yang perlu
diperhatikan, antara lain:
a. Banyaknya item harus genap sehingga pembelahan dapat terbagi sama
rata.
b. Item-item soal harus homogen atau paling tidak setelah dilakukan
pembelahan terdapat keseimbangan antar belahan.
4. Metode Kuder-Richardson-20 & 21
Metode ini digunakan apabila kesulitan memenuhi persyaratan
pada metode belah dua. Metode K-R 20 &21 digunakan pada data
dikotomus, data yang secara sederhana apabila benar mendapatkan poin 1
dan salah mendapatkan poin 0 (Carmines & Zeller, 1979: 48; Reynolds,
Livingston, & Willson, 2009: 101; Cook & Beckman, 2006). Data seperti
itu umumnya terdapat pada jenis tes objektif seperti pilihan ganda, benar-
salah, menjodohkan, dll.
8
r11=1−Sd
2
St2
Terdapat dua rumus yang digunakan pada metode Kuder-
Richardson-20 & 21 yaitu rumus K-R 20 dan rumus K-R 21. Rumus K-R
20 disajikan seperti berikut:
Keterangan:r20 = reliabilitas tes secara keseluruhan k = jumlah itemS2 = varians skorp = proporsi subjek yang menjawab item dengan benarq = proporsi subjek yang menjawab item dengan salah/p=1-q
Rumus K-R 21 disajikan seperti berikut:
Keterangan:r21 = reliabilitas tes secara keseluruhan k = jumlah itemS2 = varians skorM = mean skor
5. Metode Cronbach alpha
Metode Cronbach alpha umumnya digunakan pada tipe data yang
bukan data dikotomus seperti pada metode-metode sebelumnya, namun
metode ini dapat diterapkan pada tipe data yang lebih kompleks
(politomus). Metode ini dapat juga digunakan untuk menghitung
reliabilitas tes uraian (Arikunto, 2010: 108; Cook & Beckman, 2006;
Ayodele, 2012). Besar nilai reliabilitas dapat dihitung dengan
menggunakan rumus Alpha seperti disajikan berikut:
9
Keterangan:α = reliabilitas tes yang dicari N = jumlah itemSi
2 = varians skor tiap itemSx
2 = varians total
C. Cara Menghitung Reliabilitas Serta Contohnya
Berikut diuraikan cara menghitung reliabilitas serta contohnya dengan
menggunakan program SPSS dan Quest.
1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan
program SPSS
Skor perolehan dari testee disusun seperti gambar berikut:
Pada windows SPSS, klik AnalyzeScaleReliability Analysis
masukkan semua Butir ke dalam Items Pilih metode yang diinginkan
pada tool ModelOk
Windows akan muncul seperti berikut:
10
Setelah itu akan muncul output seperti berikut:
Reliability Statistics
Cronbach's Alpha N of Items
.248 30
Model yang dipilih pada pengujian ini yaitu dengan menggunakan
model/metode Alpha sehingga interpretasi output yang muncul yakni
dengan melihat angka pada kolom Cronbach's Alpha dimana pada uji ini,
nilai reliabilitas dari data yang diuji adalah 0.248. Oleh karena nilai
reliabilitas tidak memenuhi standar reliabilitas (jumlah soal 30, standar
reliabilitas = 0.55) maka data/paket tes dinyatakan kurang reliabel.
2. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan
program Quest
Program Quest merupakan salah satu program yang digunakan
berbasis pendekatan Item Respons Theory dimana diantaranya: Quest,
Ascal, Rascal, Bilog, Bigstep, dll. Sebelum IRT dikembangkan, terlebih
dahulu terdapat satu pendekatan dalam menganalisis item yaitu
pendekatan Classical Test Theory atau CTT dimana salah satu contoh
program berbasis CTT yaitu Iteman. Namun, Subali & Suyata (2011a;
2011b) memaparkan bahwa terdapat keterbatasan dalam proses analisis
item berbasis CTT, diantaranya:
11
a. Statistika CTT bergantung kepada subpopulasi penempuh tes.
Berbeda grup penempuh tes berbeda pula nilai rata-rata skor dari
atribut variabel yang diukur. Dengan demikian, para pengembang tes
harus hati-hati ketika memilih sampel untuk kalibrasi item. Jika
sampel-sampel kalibrasi berbeda karakteristik/sifat dengan sampel
operasional (sampel populasi yang sesungguhnya sebagai target),
properti-properti psikometri hasil pengukuran akan berubah secara
dramatis.
b. Ketepatan pengukuran suatu tes (galat baku atau standard error
pengukuran) secara implisit dirata-ratakan ke semua level
kemampuan yang diukur. Dengan demikian, ketepatan pengukuran
pada level-level skor yang tertentu tidak dikenal/tidak diketahui.
Oleh karena itu, pada makalah ini ditunjukkan cara mencari nilai
reliabilitas dengan menggunakan program Quest yang merupakan salah
satu program analisis item berbasis IRT.
Etimasi reliabilitas menurut IRT dihitung berdasarkan item disebut
indeks sparasi item dan berdasarkan testee (case/person) dan disebut
dengan indeks sparasi person. Semakin tinggi estimasi ideks sparasi
item semakin tepat keseluruhan item dianalisis menurut model yang
digunakan. Semakin tinggi indeks sparasi person semakin konsisten
setiap item pengukur digunakan untuk mengukur testee yang
bersangkutan. Estimasi reliabilitas berdasarkan testee (case/person)
sama kedudukannya dengan reliabilitas menurut CTT—yakni
reliabilitas menurut alpha Cronbach untuk data politomus dan
reliabilitas menurut Kuder-Richardson-20 untuk data dikotomus.
Indeks separasi item (item separation index atau RI) disebut dengan
istilah ”reliabilitas sampel”, indeks sparasi person disebut dengan
”reliabilitas tes”.
Cara menghitung reliabilitas dengan menggunakan program Quest
dipaparkan sebagai berikut:
12
a. Membuat data yang akan dianalisis pada notepad dengan kode
simpan .txt atau .dat seperti gambar berikut:
b. Membuat sintaks pada windows Quest seperti gambar berikut:
13
Dengan keterangan sebagai berikut:
Selanjutnya akan muncul beberapa output dan output yang dipilih untuk
melihat nilai reliabilitas yaitu output yang berkode XXXXsh.out. Berikut
salah satu contoh output untuk menginterpretasikan nilai reliabilitas tes:
14
Berdasarkan reliability of estimate diperoleh nilai reliabilitas 0.00 yang
bermakna bahwa data kurang reliabel. Nilai reliabilitas berdasarkan
estimasi case atau testee disebut dengan reliabitas tes. Semakin tinggi
nilainya semakin meyakinkan bahwa pengukuran memberikan hasil yang
konsisten. Hasil ini juga ditentukan oleh karakteristik sampel. Semakin
rendah berarti juga semakin banyak sampel untuk uji coba yang tidak
memberikan informasi yang diharapkan. (tidak mengerjakan, atau
mengerjakan secara asal-asalan). Data tersebut merupakan hasil tes pilihan
ganda yang berupa data dengan skala dikotomus.
15
BAB III PENUTUP
A. Kesimpulan
Berdasarkan uraian materi diatas, maka isi dari makalah ini dapat
disimpulkan sebagi berikut :
1. Reliabilitas merupakan derajat konsistensi, kepercayaan, ketetapan,
kestabilan dari suatu tes dalam mengukur sesuatu yang diharapkan dapat
terukur.
2. Metode yang digunakan untuk mencari besar nilai reliabilitas dalam
penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal.
3. Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis
tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method);
(2) metode bentuk paralel (alternate/parallel form); (3) metode belah dua
(split-half method); (4) metode Kuder-Richardson-20 & 21; (5) metode
Cronbach alpha.
4. Cara menghitung nilai reliabilitas dengan menggunakan program SPSS
dapat menggunakan beberapa model sesuai dengan kebutuhan penguji.
5. Cara menghitung nilai reliabilitas dengan menggunakan program Quest
dapat dilihat pada output yang berkode sh.out dengan menginterpretasikan
angka pada reliability of estimate.
16
DAFTAR ISI
Alias, M. (2005). Assessment of learning outcomes: validity and reliability of classroom tests. World Transactions on Engineering and Technology Education, 4(2), 235-238.
Arikunto, S. (2010). Dasar-dasar evaluasi pendidikan. Jakarta: Bumi Aksara.
Ayodele, J. (2012). Validity and reliability issues in educational research. Journal of Educational and Social Research, 2(2), 391-400.
Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment. USA: Sage Publications.
Cook, D. A., & Beckman, T. J. (2006). Current concepts in validity and reliability for psychometric instruments: theory and application. The American Journal of Medicine, 119(2), 166.e7-166.e16.
Ebel, R. L., & Frisbie, D. A. (1991). Essential of educational measurement . New Jersey: Prentice Hall.
Felder, R. M., & Spurlin, J. (2005). Applications, reliabillity and validity of the index of learning styles. International Journal Engng Education, 21(1), 103-112.
Lankes, R. D. (2008). Credibility on the internet: shifting from authority to reliability. Journal of Documentation, 64(5), 667-686.
Reynolds, C. R., Livingston, R. B., & Willson, V. (2009). Measurement and assesment in education. New Jersey: Pearson Education.
Ross, J. A. (2006). The Reliability, validity, and utility of self-assessment. Practical Assessment Research & Evaluation, 11(10), 1-13.
Subali, B., & Suyata, P. (2011a). Panduan analisis data pengukuran pendidikan untuk memperoleh bukti empirik kesahihan menggunakan program Quest. Yogyakarta: (Versi Elektronik).
Subali, B., & Suyata, P. (2011b). Panduan menggunakan program Quest. Yogyakarta: (Versi Elektronik).
Tella, A. (2011). Reliability and factor analysis of a blackboard course management system success: a scale development and validation in an
17
educational context. Journal of Information Technology Education, 10, 1-26.
18