Makalah Reliabilitas Tes

MAKALAH

Disusun guna memenuhi salah satu tugas mata kuliah “Evaluasi Pembelajaran Sains” yang diampu oleh Dr. Eli Rohaeti

Disusun Oleh :

Magfirah Perkasa (13708251079)

PROGRAM STUDI PENDIDIKAN SAINS

PROGRAM PASCASARJANA

UNIVERSITAS NEGERI YOGYAKARTA2014

DAFTAR ISI

DAFTAR ISI............................................................................................................1

BAB I PENDAHULUAN........................................................................................2

A. Latar Belakang....................................................................................2

B. Pembatasan Masalah...........................................................................3

C. Rumusan Masalah...............................................................................3

D. Tujuan.................................................................................................3

BAB II PEMBAHASAN.........................................................................................4

A. Arti Reliabilitas Tes............................................................................4

B. Metode Mencari Besar Nilai Reliabilitas............................................5

1. Metode tes ulang (test-retest method)............................................5

2. Metode bentuk paralel (alternate/parallel form)............................6

3. Metode belah dua (split-half method).............................................7

4. Metode Kuder-Richardson-20 & 21...............................................8

5. Metode Cronbach alpha.................................................................9

C. Cara Menghitung Reliabilitas Serta Contohnya................................10

1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan program SPSS........................................................10

2. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan program Quest.......................................................11

BAB III PENUTUP..............................................................................................16

DAFTAR ISI..........................................................................................................17

1

BAB I

PENDAHULUAN

A. Latar Belakang

Validitas dan reliabilitas merupakan indikator utama pada sebuah tes.

Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam

bahasa Inggris, yang berasal dari kata reliable yang artinya dapat dipercaya.

Seringnya terjadi kesalahan dalam penggunaan istilah validitas dan valid, juga

terjadi dalam penggunaan istilah reliabilitas dan reliabel. Istilah reliabilitas

merupakan kata benda, dan kata reliabel merupakan kata sifat atau keadaan.

Seseorang dikatakan dapat dipercaya apabila orang tersebut selalu

berbicara ajeg tentang suatu hal, tidak berubah-ubah isi pembicaraannya dari

waktu ke waktu dan selalu konsisten. Tes juga memiliki keajegan, sebuah tes

dinyatakan memiliki keajegan apabila tes tersebut dapat memberikan

informasi yang sama (serupa) walaupun diujikan pada kesempatan yang

berbeda, dan dapat mengukur kemampuan testee sesuai dengan kenyataannya.

Seberapa besar informasi tersebut “dapat dipercaya” dapat dilihat pada

besarnya nilai reliabilitas dengan berbagai metode sesuai dengan kebutuhan

tester dan kondisi serta faktor pendukung pengukuran tersebut.

Seiring dengan perkembangan ilmu pengetahuan, teknologi dan seni

(IPTEKS), terdapat beberapa metode yang dapat digunakan untuk mencari

besar nilai reliabilitas tes serta cara menghitungnya dengan berbagai program

atau software. Reliabilitas merupakan salah satu komponen dalam proses

analisis item. Analisis item dapat dilakukan dengan pendekatan teori tes klasik

(Classical Test Theory atau CTT) dan teori tes modern yang dikenal dengan

teori respons item (Item Respons Theory atau IRT). Program yang berbasis

pendekatan Classical Test Theory salah satunya yaitu Iteman. Beberapa

program yang berbasis pendekatan Item Respons Theory diantaranya: Quest,

Ascal, Rascal, Bilog, Bigstep, dll. Reliabilitas tes juga dapat

dihitung/dianalisis dengan menggunakan program SPSS (Statistical Program

for Social Science).

2

B. Pembatasan Masalah

Berdasarkan latar belakang masalah, masalah yang dikaji dalam

makalah ini hanya membahas pengertian reliabilitas, cara mencari besar nilai

reliabilitas dan cara menghitung reliabilitas serta contohnya dengan

menggunakan program Quest dan SPSS. Makalah ini disusun berdasarkan

studi literatur dan penalaran (reasoning) penulis.

C. Rumusan Masalah

Berdasarkan pembatasan masalah, masalah dalam makalah ini

dirumuskan sebagai berikut:

1. Apakah yang dimaksud dengan reliabilitas?

2. Bagaimanakah metode mencari besar nilai reliabilitas?

3. Bagaimanakah cara menghitung reliabilitas serta contohnya dengan

menggunakan program Quest dan SPSS?

D. Tujuan

Berdasarkan rumusan masalah, maka tujuan dalam makalah ini dapat

diuraikan sebagai berikut:

1. Menjelaskan pengertian reliabilitas.

2. Menentukan metode mencari besar nilai reliabilitas.

3. Menentukan cara menghitung reliabilitas serta contohnya dengan

menggunakan program Quest dan SPSS.

3

BAB II

PEMBAHASAN

A. Arti Reliabilitas Tes

Reliabilitas dan validitas merupakan indikator utama pada sebuah tes.

Validitas berhubungan dengan makna ketepatan, dan reliabilitas berhubungan

dengan makna ketetapan dan kepercayaan (Alias, 2005). Lankes (2008)

menyatakan bahwa reliabilitas menunjuk pada sesuatu atau seseorang yang

independen dan konsisten secara kualitas. Reliabilitas merupakan indikator

konsistensi antara dua atau lebih pengukuran pada tes yang sama (Alias,

2005). Secara garis besar dapat dinyatakan bahwa reliabilitas menunjuk pada

konsistensi (stabilitas) skor yang dihasil melalui pengukuran dengan

menggunakan alat ukur tertentu (Reynolds, et al., 2009: 91; Ross, 2006).

Makna ketetapan/konsistensi dalam konteks reliabilitas dapat diilustrasikan

seperti: jika diperoleh hasil tes A menunjukkan nilai yang lebih rendah dari

hasil tes B, maka ketika dilakukan tes ulang dengan alat ukur yang serupa

kepada keduanya, hasil tes tetap akan menunjukkan bahwa A memperoleh

nilai yang lebih rendah dari hasil tes B, meskipun nilai keduanya tidak sama

antara hasil tes pertama dan kedua. Reliabilitas sebuah tes merupakan derajat

konsistensi dari tes tersebut dalam mengukur sesuatu yang diharapkan dapat

terukur (Tella, 2011).

Sebuah tes yang memiliki reliabilitas yang tinggi belum pasti memiliki

validitas yang tinggi, namun sebuah tes yang memiliki validitas yang tinggi

biasanya dapat dipastikan memiliki reliabilitas yang tinggi pula (Arikunto,

2010: 87; Alias, 2005). Suatu tes (alat ukur) dinyatakan memiliki

reliabilitas/taraf kepercayaan yang tinggi apabila tes tersebut dapat

memberikan hasil/gambaran data atau informasi yang tetap apabila diujikan

beberapa kali, walaupun pada testee (objek-dalam hal ini siswa) yang berbeda

(Arikunto, 2010, hal. 86).

4

B. Metode Mencari Besar Nilai Reliabilitas

Besar nilai reliabilitas dari sebuah paket tes ditentukan oleh nilai

koefisien reliabilitas. Nilai koefisien reliabilitas dipengaruhi oleh jumlah item

dalam sebuah paket soal. Hubungan antara jumlah item soal dengan koefisien

reliabilitas disajikan seperti berikut:

Tabel 1Hubungan Antara Jumlah Item dengan Koefisien Reliabilitas

Jumlah Soal Koefisien Reliabilitas5 0.2010 0.3320 0.5040 0.6760 0.7580 0.80100 0.83200 0.95300 0.94

(Ebel & Frisbie, 1991)

Terdapat berbagai cara untuk mencari/menentukan besar nilai

reliabilitas. Metode yang digunakan untuk mencari besar nilai reliabilitas

dalam penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)

Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal (Ayodele, 2012).

Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis tiga

prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method); (2)

metode bentuk paralel (alternate/parallel form); (3) metode belah dua (split-

half method); (4) metode Kuder-Richardson-20 & 21; (5) metode Cronbach

alpha (Ayodele, 2012; Arikunto, 2010: 90-112; Cook & Beckman, 2006;

Felder & Spurlin, 2005; Reynolds, Livingston, & Willson, 2009: 29-48;

Carmines & Zeller, 1979) yang dijelaskan lebih lanjut sebagai berikut:

1. Metode tes ulang (test-retest method)

Metode tes ulang (test-retest method) merupakan metode yang

digunakan dimana tes diberikan kepada satu orang testee pada dua

kesempatan yang berbeda (Cook & Beckman, 2006). Metode tes ulang

dilakukan untuk menghindari penyusunan dua seri tes. Satu tes disusun

5

oleh tester untuk dicobakan dua kali. Oleh karena tesnya hanya satu dan

dicobakan dua kali, metode ini dapat disebut juga single-test-double-trial-

method. Besar nilai reliabilitas melalui metode ini dapat dilihat pada besar

koefisien korelasi antara tes pertama dan tes kedua (Arikunto, 2010, hal.

91). Koefisien korelasi untuk tes yang dapat dinyatakan reliabel dan layak

untuk dicobakan yaitu 0.70 keatas (Tella, 2011).

Ayodele (2012) menyatakan terdapat beberapa faktor yang perlu

diperhatikan dalam penggunaan metode ini, antara lain:

a. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak

boleh panjang (lama) untuk menghindari faktor perubahan situasi.

b. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak

boleh pendek (cepat) untuk menghindari faktor testee yang masih

mengingat materi tes pertama.

c. Testee harus mengetahui materi soal pertama maupun kedua dan

seharusnya terdapat perbedaan skor antara test dan retest.

Rentang waktu antara tes pertama dan tes kedua idealnya antara 2-4

minggu (Felder & Spurlin, 2005; Tella, 2011; Carmines & Zeller, 1979).

2. Metode bentuk paralel (alternate/parallel form)

Metode ini disebut juga dengan alternate-forms method (Arikunto,

2010: 90; Ayodele, 2012; Cook & Beckman, 2006). Tester yang

menggunakan metode ini perlu mengembangkan dua paket tes yang

mempunyai kesamaan dalam tujuan, isi, spesifikasi, jumlah, format,

tingkat kesukaran dan diskriminan. Menentukan besar nilai reliabilitas

menggunakan tes paralel disebut juga dengan metode double-test-double-

trial-method (Arikunto, 2010: 91; Ayodele, 2012). Dua paket tes yang

dikembangkan dicobakan pada testee yang sama dalam kesempatan yang

sama maupun kesempatan yang berbeda.

Hal ini dapat diilustrasikan apabila paket soal A yang ingin

diketahui reliabilitasnya diberikan kepada testee, selanjutnya paket soal B

diberikan juga kepada testee baik dalam kesempatan yang sama (jika

6

memungkinkan) maupun kesempatan yang berbeda. Besar nilai reliabilitas

melalui metode ini dapat dilihat pada besar koefisien korelasi antara kedua

tes. Koefisien korelasi untuk tes yang dapat dinyatakan reliabel dan layak

untuk dicobakan yaitu 0.70 keatas.

3. Metode belah dua (split-half method)

Pada metode ini, satu paket tes dicobakan pada testee hanya satu

kali sehingga disebut juga single-test-single-trial-method. Hasil tes

dianalisis dengan metode belah dua. Persyaratan khusus untuk penggunaan

metode ini yaitu memastikan bahwa item soal dikembangkan dengan

jumlah yang genap sehingga dapat dibagi dua sama banyak.

Kemungkinan terjadinya kesalahan dalam metode belah dua ini

yaitu adanya kecenderungan kesalahan dalam melakukan belah dua

dengan membelah dua testee. Prosedur dalam metode belah dua yaitu

dengan membelah item tes, bukan membelah dua testee dari jumlah total.

Arikunto (2010, hal. 93) menguraikan bahwa ada dua cara dalam

membelah item (butir) soal, yaitu:

a. Membelah dengan membagi item berdasarkan nomor genap-ganjilnya

item yang selanjutnya disebut dengan belahan genap-ganjil.

b. Membelah dengan membagi item berdasarkan awal-akhir item, 50%

item awal disebut bagian awal, 50% item akhir disebut item akhir,

selanjutnnya pembelahan ini disebut belahan awal-akhir.

Secara umum persamaan yang digunakan untuk menentukan besar

nilai reliabilitas melalui metode belah dua yaitu dengan menggunakan

rumus Spearman-Brown (Arikunto, 2010: 93; Cook & Beckman, 2006;

Ayodele, 2012) seperti disajikan berikut:

Reliabilitas = 2 r

1+r dimana r = korelasi antar skor-skor setiap belahan

Secara khusus metode belah dua dengan belahan genap-ganjil

menggunakan rumus Flanagan yaitu:

7

2

22

21

11 12TS

SSr

Keterangan:r11 = reliabilitas tes secara keseluruhan S1

2 = varians skor belahan ganjilS2

2 = varians skor belahan genapST

2 = varians skor total

Metode belah dua dengan belahan awal-akhir menggunakan rumus Rulon

yaitu:

Keterangan:r11 = reliabilitas tes secara keseluruhan Sd

2 = varians bedad = difference yaitu perbedaan skor antara belahan awal dan

belahan akhir

Penggunaan metode ini disertai dengan beberapa syarat yang perlu

diperhatikan, antara lain:

a. Banyaknya item harus genap sehingga pembelahan dapat terbagi sama

rata.

b. Item-item soal harus homogen atau paling tidak setelah dilakukan

pembelahan terdapat keseimbangan antar belahan.

4. Metode Kuder-Richardson-20 & 21

Metode ini digunakan apabila kesulitan memenuhi persyaratan

pada metode belah dua. Metode K-R 20 &21 digunakan pada data

dikotomus, data yang secara sederhana apabila benar mendapatkan poin 1

dan salah mendapatkan poin 0 (Carmines & Zeller, 1979: 48; Reynolds,

Livingston, & Willson, 2009: 101; Cook & Beckman, 2006). Data seperti

itu umumnya terdapat pada jenis tes objektif seperti pilihan ganda, benar-

salah, menjodohkan, dll.

8

r11=1−Sd

2

St2

Terdapat dua rumus yang digunakan pada metode Kuder-

Richardson-20 & 21 yaitu rumus K-R 20 dan rumus K-R 21. Rumus K-R

20 disajikan seperti berikut:

Keterangan:r20 = reliabilitas tes secara keseluruhan k = jumlah itemS2 = varians skorp = proporsi subjek yang menjawab item dengan benarq = proporsi subjek yang menjawab item dengan salah/p=1-q

Rumus K-R 21 disajikan seperti berikut:

Keterangan:r21 = reliabilitas tes secara keseluruhan k = jumlah itemS2 = varians skorM = mean skor

5. Metode Cronbach alpha

Metode Cronbach alpha umumnya digunakan pada tipe data yang

bukan data dikotomus seperti pada metode-metode sebelumnya, namun

metode ini dapat diterapkan pada tipe data yang lebih kompleks

(politomus). Metode ini dapat juga digunakan untuk menghitung

reliabilitas tes uraian (Arikunto, 2010: 108; Cook & Beckman, 2006;

Ayodele, 2012). Besar nilai reliabilitas dapat dihitung dengan

menggunakan rumus Alpha seperti disajikan berikut:

9

Keterangan:α = reliabilitas tes yang dicari N = jumlah itemSi

2 = varians skor tiap itemSx

2 = varians total

C. Cara Menghitung Reliabilitas Serta Contohnya

Berikut diuraikan cara menghitung reliabilitas serta contohnya dengan

menggunakan program SPSS dan Quest.

1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan

program SPSS

Skor perolehan dari testee disusun seperti gambar berikut:

Pada windows SPSS, klik AnalyzeScaleReliability Analysis

masukkan semua Butir ke dalam Items Pilih metode yang diinginkan

pada tool ModelOk

Windows akan muncul seperti berikut:

10

Setelah itu akan muncul output seperti berikut:

Reliability Statistics

Cronbach's Alpha N of Items

.248 30

Model yang dipilih pada pengujian ini yaitu dengan menggunakan

model/metode Alpha sehingga interpretasi output yang muncul yakni

dengan melihat angka pada kolom Cronbach's Alpha dimana pada uji ini,

nilai reliabilitas dari data yang diuji adalah 0.248. Oleh karena nilai

reliabilitas tidak memenuhi standar reliabilitas (jumlah soal 30, standar

reliabilitas = 0.55) maka data/paket tes dinyatakan kurang reliabel.

2. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan

program Quest

Program Quest merupakan salah satu program yang digunakan

berbasis pendekatan Item Respons Theory dimana diantaranya: Quest,

Ascal, Rascal, Bilog, Bigstep, dll. Sebelum IRT dikembangkan, terlebih

dahulu terdapat satu pendekatan dalam menganalisis item yaitu

pendekatan Classical Test Theory atau CTT dimana salah satu contoh

program berbasis CTT yaitu Iteman. Namun, Subali & Suyata (2011a;

2011b) memaparkan bahwa terdapat keterbatasan dalam proses analisis

item berbasis CTT, diantaranya:

11

a. Statistika CTT bergantung kepada subpopulasi penempuh tes.

Berbeda grup penempuh tes berbeda pula nilai rata-rata skor dari

atribut variabel yang diukur. Dengan demikian, para pengembang tes

harus hati-hati ketika memilih sampel untuk kalibrasi item. Jika

sampel-sampel kalibrasi berbeda karakteristik/sifat dengan sampel

operasional (sampel populasi yang sesungguhnya sebagai target),

properti-properti psikometri hasil pengukuran akan berubah secara

dramatis.

b. Ketepatan pengukuran suatu tes (galat baku atau standard error

pengukuran) secara implisit dirata-ratakan ke semua level

kemampuan yang diukur. Dengan demikian, ketepatan pengukuran

pada level-level skor yang tertentu tidak dikenal/tidak diketahui.

Oleh karena itu, pada makalah ini ditunjukkan cara mencari nilai

reliabilitas dengan menggunakan program Quest yang merupakan salah

satu program analisis item berbasis IRT.

Etimasi reliabilitas menurut IRT dihitung berdasarkan item disebut

indeks sparasi item dan berdasarkan testee (case/person) dan disebut

dengan indeks sparasi person. Semakin tinggi estimasi ideks sparasi

item semakin tepat keseluruhan item dianalisis menurut model yang

digunakan. Semakin tinggi indeks sparasi person semakin konsisten

setiap item pengukur digunakan untuk mengukur testee yang

bersangkutan. Estimasi reliabilitas berdasarkan testee (case/person)

sama kedudukannya dengan reliabilitas menurut CTT—yakni

reliabilitas menurut alpha Cronbach untuk data politomus dan

reliabilitas menurut Kuder-Richardson-20 untuk data dikotomus.

Indeks separasi item (item separation index atau RI) disebut dengan

istilah ”reliabilitas sampel”, indeks sparasi person disebut dengan

”reliabilitas tes”.

Cara menghitung reliabilitas dengan menggunakan program Quest

dipaparkan sebagai berikut:

12

a. Membuat data yang akan dianalisis pada notepad dengan kode

simpan .txt atau .dat seperti gambar berikut:

b. Membuat sintaks pada windows Quest seperti gambar berikut:

13

Dengan keterangan sebagai berikut:

Selanjutnya akan muncul beberapa output dan output yang dipilih untuk

melihat nilai reliabilitas yaitu output yang berkode XXXXsh.out. Berikut

salah satu contoh output untuk menginterpretasikan nilai reliabilitas tes:

14

Berdasarkan reliability of estimate diperoleh nilai reliabilitas 0.00 yang

bermakna bahwa data kurang reliabel. Nilai reliabilitas berdasarkan

estimasi case atau testee disebut dengan reliabitas tes. Semakin tinggi

nilainya semakin meyakinkan bahwa pengukuran memberikan hasil yang

konsisten. Hasil ini juga ditentukan oleh karakteristik sampel. Semakin

rendah berarti juga semakin banyak sampel untuk uji coba yang tidak

memberikan informasi yang diharapkan. (tidak mengerjakan, atau

mengerjakan secara asal-asalan). Data tersebut merupakan hasil tes pilihan

ganda yang berupa data dengan skala dikotomus.

15

BAB III PENUTUP

A. Kesimpulan

Berdasarkan uraian materi diatas, maka isi dari makalah ini dapat

disimpulkan sebagi berikut :

1. Reliabilitas merupakan derajat konsistensi, kepercayaan, ketetapan,

kestabilan dari suatu tes dalam mengukur sesuatu yang diharapkan dapat

terukur.

2. Metode yang digunakan untuk mencari besar nilai reliabilitas dalam

penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)

Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal.

3. Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis

tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method);

(2) metode bentuk paralel (alternate/parallel form); (3) metode belah dua

(split-half method); (4) metode Kuder-Richardson-20 & 21; (5) metode

Cronbach alpha.

4. Cara menghitung nilai reliabilitas dengan menggunakan program SPSS

dapat menggunakan beberapa model sesuai dengan kebutuhan penguji.

5. Cara menghitung nilai reliabilitas dengan menggunakan program Quest

dapat dilihat pada output yang berkode sh.out dengan menginterpretasikan

angka pada reliability of estimate.

16

DAFTAR ISI

Alias, M. (2005). Assessment of learning outcomes: validity and reliability of classroom tests. World Transactions on Engineering and Technology Education, 4(2), 235-238.

Arikunto, S. (2010). Dasar-dasar evaluasi pendidikan. Jakarta: Bumi Aksara.

Ayodele, J. (2012). Validity and reliability issues in educational research. Journal of Educational and Social Research, 2(2), 391-400.

Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment. USA: Sage Publications.

Cook, D. A., & Beckman, T. J. (2006). Current concepts in validity and reliability for psychometric instruments: theory and application. The American Journal of Medicine, 119(2), 166.e7-166.e16.

Ebel, R. L., & Frisbie, D. A. (1991). Essential of educational measurement . New Jersey: Prentice Hall.

Felder, R. M., & Spurlin, J. (2005). Applications, reliabillity and validity of the index of learning styles. International Journal Engng Education, 21(1), 103-112.

Lankes, R. D. (2008). Credibility on the internet: shifting from authority to reliability. Journal of Documentation, 64(5), 667-686.

Reynolds, C. R., Livingston, R. B., & Willson, V. (2009). Measurement and assesment in education. New Jersey: Pearson Education.

Ross, J. A. (2006). The Reliability, validity, and utility of self-assessment. Practical Assessment Research & Evaluation, 11(10), 1-13.

Subali, B., & Suyata, P. (2011a). Panduan analisis data pengukuran pendidikan untuk memperoleh bukti empirik kesahihan menggunakan program Quest. Yogyakarta: (Versi Elektronik).

Subali, B., & Suyata, P. (2011b). Panduan menggunakan program Quest. Yogyakarta: (Versi Elektronik).

Tella, A. (2011). Reliability and factor analysis of a blackboard course management system success: a scale development and validation in an

17

educational context. Journal of Information Technology Education, 10, 1-26.

18

Makalah Reliabilitas Tes

Documents

Transcript of Makalah Reliabilitas Tes