teori test klasik

download teori test klasik

of 43

description

teori tes klasik

Transcript of teori test klasik

  • BAB II

    TINJAUAN PUSTAKA

    Dewasa ini ada dua macam teori tentang pengukuran, yakni Teori Tes Klasik

    dan Teori Tes Modern (Suryabrata, 2005) di dalam buku Azwar (2007)

    menambahakan Teori Skor Murni Kuat, teori ini mirip dengan Teori Tes Klasik

    mengenai nilai harapan skor tampak yang merupakan skor murni, akan tetapi dalam

    Teori Skor Murni Kuat terdapat asumsi-asumsi tambahan mengenai probabilitas skor

    tampak yang diperoleh seorang subjek yang merupakan skor murni tertentu sehingga

    kelayakkan Teori Skor Murni Kuat dapat diuji.

    Universitas Sumatera Utara

  • Teori Tes Klasik disebut juga dengan Classical True-Score Theory,

    dinamakan Teori Tes Klasik karena unsur-unsur teori ini sudah dikembangkan dan

    diaplikasikan sejak lama, namun tetap bertahan hingga sekarang (Suryabrata, 2005).

    Teori Tes Modern disebut juga dengan Latent-Trait Theory karena teori ini

    berasumsi bahwa performansi subjek dalam mengerjakan suatu tes dapat diprediksi

    dari kemampuannya yang bersifat laten atau menetap. Teori Tes Modern juga sering

    disebut dengan Item Response Theory, artinya respon subjek terhadap suatu aitem

    menunjukkan kemampuan kognitifnya.

    Teori Tes Modern muncul untuk menjawab keterbatasan dari Teori Tes

    Klasik yakni, parameter dalam Teori Tes Klasik merupakan karakteristik aitem

    tergantung pada kelompok sampel yang digunakan untuk menghitungnya selain itu

    Teori Tes Klasik juga memerlukan kesetaraan eror pengukuran bagi semua subjek

    yang dikenai tes, definisi paralel dalam Teori Tes Klasik juga sangat sulit untuk

    dipenuhi dalam prakteknya, dengan hadirnya Teori Tes Modern dapat menjawab

    semua keterbatasan ini, namun perlu diingat bahwa Teori Tes Modern ini tidak

    praktis, dari semua keterbatasan Teori Tes Klasik tersebut perlu dilihat juga kelebihan

    dari Teori Tes Klasik yakni, Teori Tes Klasik telah dikembangkan sejak dulu

    sehingga telah berhasil dalam meletakkan konsep-konsep dasar pengukuran, selain

    itu Teori Tes Klasik juga memiliki nilai praktis yang tinggi sehingga dalam penelitian

    ini akan menggunakan pendekatan Teori Tes Klasik dalam proses analisis yang

    dilakukan.

    Universitas Sumatera Utara

  • A. Teori Tes Klasik

    1. Pengertian Teori Tes Klasik

    Teori Tes klasik berkembang sedikit demi sedikit melalui unsur-unsur yang

    kemudian secara akumulatif merupakan bangunan teori yang utuh. Inti Teori Tes

    Klasik adalah asumsi-asumsi yang dirumuskan secara sistematis serta dalam jangka

    waktu yang lama. Skor tampak disimbolkan dengan huruf X merupakan nilai

    performansi individu pada alat tes yang dinyatakan dalam bentuk angka, skor murni

    yang dilambangkan dengan huruf T merupakan performansi individu sesungguhnya

    yang tidak pernah dapat kita ketahui besarnya karena tidak dapat diungkap secara

    lansung oleh alat tes, dan eror pengukuran yang diberi simbol huruf E (Azwar, 2005).

    2. Asumsi-Asumsi dalam Teori Tes Klasik

    Allen & Yen (dalam Azwar, 2005) menguraikan asumsi-asumsi teori klasik

    sebagai berikut:

    a. Asumsi 1

    X = T + E (1)

    Asumsi ini menjelaskan bahwa sifat aditif berlaku pada hubungan antara skor

    tampak, skor muni, dan eror. Skor tampak (X) merupakan jumlah skor murni (T) dan

    eror (E), jadi besar skor tampak akan tergantung oleh besarnya eror pengukuran,

    sedangkan besarnya skor murni individu pada setiap pengukuran yang sama

    diasumsikan selalu tetap.

    b. Asumsi 2:

    Universitas Sumatera Utara

  • (X) = T (2)

    Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan dari skor

    tampaknya, jadi T merupakan harga rata-rata distribusi teoretik skor tampak apabila

    orang yang sama dikenai tes yang sama berulang kali dengan asumsi pengulangan tes

    itu dilakukan tidak terbatas banyaknya dan setiap pengulangan tes adalah tidak

    bergantung satu sama lain.

    c. Asumsi 3:

    = 0 (3)

    Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes,

    distribusi eror pengukuran dan distribusi skor murni tidak berkorelasi. Implikasinya,

    skor murni yang tinggi tidak selalu berarti mengandung eror yang selalu positif

    ataupun selalu negatif.

    d. Asumsi 4:

    = 0 (4)

    Bila E1 melambangkan eror pada pengukuran atau tes pertama dan E2

    melambangkan eror pada tes yang kedua maka asumsi ini menyatakan bahwa eror

    pengukuran pada dua tes yang berbeda, yaitu E1 dan E2 tidak berkorelasi satu sama

    lain.

    e. Asumsi 5

    = 0 (5)

    Universitas Sumatera Utara

  • Asumsi ini menyatakan bahwa eror pada suatu tes (E1) tidak berkorelasi

    dengan skor murni pada tes lain (T2). Asumsi ini tidak dapat bertahan apabila tes

    yang kedua mengukur aspek yang mempengaruhi eror pada pengukuran yang

    pertama.

    Selain dua asumsi yang telah disebutkan, dalam buku Suryabrata (2005)

    menuliskan dua asumsi sebagai berikut:

    f. Asumsi 6

    Asumsi ini menyatakan jika ada dua tes yang dimaksudkan untuk mengukur

    atribut yang sama mempunyai skor tampak X dan X yang memenuhi asumsi 1

    sampai 5, dan jika untuk setiap populasi subjek T = T serta varians eror kedua tes

    tersebut sama, kedua tes tersebut disebut sebagai tes yang paralel.

    g. Asumsi 7

    Asumsi ini menyatakan jika ada dua tes yang dimaksudkan untuk mengukur

    atribut yang sama mempunyai skor tampak X dan X yang memenuhi asumsi 1

    sampai 5, dan jika untuk setiap populasi subjek T1 = T2 + C, dengan C sebagai suatu

    bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara

    (equivalent test).

    Asumsi-asumsi teori klasik sebagaimana disebutkan di atas memungkinkan

    untuk dikembangkan dalam rangka pengembangan berbagai formula yang berguna

    dalam melakukan pengukuran psikologis. Indeks daya beda, indeks kesukaran,

    efektivitas distraktor, reliabilitas dan validitas adalah formula penting yang disarikan

    dari teori tes klasik.

    Universitas Sumatera Utara

  • B. Analisis Karakteristik Psikometri

    Alat tes yang efektif dan bermanfaat tergantung kepada kualitas aitem yang

    terdapat di dalam alat tes tersebut (Kumar, 2009). Hal ini sesuai dengan yang

    dikatakan oleh Anwar (2006) bahwa kualitas tes bergantung kepada kualitas aitem

    yang menyusunnya yang dapat diketahui melalui beberapa parameter diantaranya

    adalah, taraf kesukaran aitem, daya pembeda aitem dan untuk tes objektif jawaban

    selain kunci haruslah dapat berfungsi secara efektif (efektivitas distraktor).

    1. Indeks Kesukaran Aitem

    a. Pengertian Indeks Kesukaran Aitem

    Indeks kesukaran aitem adalah proporsi jumlah subjek yang menjawab benar

    pada suatu aitem berbanding jumlah subjek yang menjawab pada aitem tersebut

    (Azwar, 2007). Hal ini sesuai dengan yang dikatakan oleh Tate (dalam Kumar, 2009)

    indeks kesukaran aitem dapat diukur dengan mengetahui proporsi jumlah subjek yang

    menjawab aitem dengan benar dengan jumlah subjek yang menjawab aitem tersebut.

    Berdasarkan dari pengertian ini dapat dilihat bahwa indeks kesukaran aitem sama

    dengan nilai rata-rata subjek dalam kelompok. Hal ini sesuai dengan yang dikatakan

    Suryabrata (2005) bahwa presentase subjek yang menjawab benar suatu aitem itu

    sama dengan nilai rata-rata kelompok subjek yang dites, karena itu indeks kesukaran

    aitem sering juga disebut indeks kesukaran rata-rata.

    Indeks kesukaran aitem ditentukan oleh seberapa banyak peserta tes berhasil

    menjawab aitem dengan benar. Semakin banyak peserta tes menjawab dengan benar,

    Universitas Sumatera Utara

  • semakin mudah aitem tersebut. Begitu juga sebaliknya semakin sedikit peserta

    menjawab dengan benar, maka semakin sulit aitem tersebut. Indeks kesukaran aitem

    disimbolkan dengan p. Rumusan ini dituangkan dalam formula.

    p =

    (6)

    Keterangan: p = Indeks kesukaran aitem

    ni = Banyak peserta tes yang menjawab benar

    N = Banyak peserta tes yang menjawab aitem

    Indeks kesukaran aitem dapat membantu dalam menyusun aitem, aitem mana

    yang harus diletakkan di awal, di tengah hingga di akhir (Kumar, 2009). Pernyataan

    ini didukung oleh Murphy & Davidshofer (2003) disarankan untuk menyusun aitem-

    aitem dalam tes secara sistematis, dengan menempatkan aitem-aitem berdasarkan

    tingkat kesukarannya, mulai dari aitem yang paling mudah hingga yang paling sulit.

    Sehingga pola penyusunan aitem-aitem dalam tes dimulai dari aitem dengan harga p

    yang paling tinggi hingga aitem dengan harga p yang paling rendah (Murphy &

    Davidshofer, 2003).

    b. Analisis Indeks Kesukaran Aitem

    Tes disusun bertujuan untuk melihat perbedaan individu sehingga jika tidak

    ada seorang pun yang menjawab pertanyaan dengan benar, dalam artian soal sangat

    susah (p = 0) bahkan sebaliknya jika soal sangat mudah sehingga semua dapat

    menjawab pertanyaan dengan benar (p = 1) tentu tujuan alat tes tidak dapat dipenuhi

    (Murphy & Davidshofer, 2003).

    Universitas Sumatera Utara

  • Menurut Azwar (2005), tingkat kesukaran yang terbaik bergantung pada

    tujuan dari tes tersebut, untuk tes prestasi yang bertujuan untuk evaluasi formatif

    misalnya, tidak jarang diperlukan aitem-aitem yang mudah atau aitem-aitem dengan

    harga p tinggi, namun demikian untuk tes yang bertujuan untuk proses seleksi masuk,

    terlebih dalam tes masuk yang bertujuan untuk proses pendidikan, harus diusahakan

    tes yang memiliki harga p yang rendah atau aitem yang sulit, sehingga individu yang

    dinyatakan lulus selanjutnya adalah individu yang benar-benar menguasai serta

    mampu untuk mengikuti proses pendidikan selanjutnya (Suryabrata, 2005).

    Tabel 1. Kategorisasi Batasan Nilai p No P Kategori

    1 P

  • 5 Jawaban terbuka 0,50

    Nilai p dipengaruhi oleh jumlah pilihan jawaban, Sehingga akan berbeda

    indeks kesukaran aitem yang memiliki dua pilihan jawaban dengan aitem yang

    memiliki tiga atau lebih pilihan jawaban, karena jika hanya ada dua pilihan jawaban

    berarti hanya terdapat dua kemungkinan apakah subjek menjawab benar atau salah,

    sehingga seharusnya indeks kesukaran aitem bernilai tinggi.

    2. Indeks Daya Beda Aitem

    a. Pengertian Indeks Daya Beda Aitem

    Daya beda aitem merupakan kemampuan aitem dalam membedakan antara

    individu yang memiliki atribut psikologis yang diukur dengan individu yang tidak

    memiliki atribut psikologis yang diukur sehingga dalam penelitian ini daya beda

    aitem pada IST subtes SE dapat diartikan sebagai kemampuan aitem dalam

    membedakan individu yang memiliki pengetahuan umum dengan individu yang tidak

    memiliki pengetahuan umum.

    Aitem yang memiliki indeks daya beda yang baik adalah aitem dapat dijawab

    benar oleh sebagian besar kelompok subjek kemampuan tinggi, dan dijawab salah

    oleh sebagian besar kelompok subjek kemampuan rendah jadi kesimpulannya indeks

    daya beda aitem merupakan suatu harga yang menunjukkan perbedaan proporsi

    penjawab aitem dengan benar antara kelompok yang memiliki kemampuan tinggi

    dengan kelompok yang memiliki kemampuan rendah.

    Universitas Sumatera Utara

  • Daya beda aitem dilakukan untuk memenuhi tujuan pengukuran psikologis

    yaitu untuk mengukur perbedaan individu atau reaksi individu yang sama pada situasi

    yang berbeda (Anastasi & Urbina, 1997).

    Murphy dan Davidshofer (2003) mengatakan bahwa aitem yang baik

    seharusnya dapat membedakan kelompok individu yang mampu mengerjakan tes

    dengan individu yang tidak, atau dengan kata lain antara kelompok yang memiliki

    kemampuan tinggi dengan kelompok yang memiliki kemampuan rendah. Indeks daya

    beda aitem disimbolkan dengan d.

    d =

    -

    (7)

    Keterangan: nit = Jumlah peserta dari kelompok tinggi yang menjawab aitem

    dengan benar

    Nt = Jumlah peserta dari kelompok tinggi

    nir = Jumlah peserta dari kelompok rendah yang menjawab aitem

    dengan benar

    Nr = Jumlah peserta dari kelompok rendah

    Karena

    = p, maka d dapat juga diformulasikan dengan:

    d = pt-pr (8)

    Keterangan: pt = Indeks kesukaran aitem kelompok tinggi

    pr = Indeks kesukaran aitem kelompok rendah

    Universitas Sumatera Utara

  • Menurut Murphy dan Davidshofer (2003) ada tiga cara statsistik yang dapat

    digunakan untuk mengestimasi daya beda aitem, yaitu:

    1. Metode Kelompok Ekstrim

    Metode kelompok ekstrim dapat digunakan untuk mengukur daya beda aitem

    pada kelompok yang besar. Daya beda aitem dapat dihitung dengan cara membagi

    kelompok menjadi dua, kelompok tinggi yakni kelompok yang memiliki skor yang

    tinggi (25-35 % nilai tertinggi didalam kelompok) dan kelompok rendah yakni

    kelompok yang memiliki nilai yang rendah (25-35 % nilai terendah dalam

    kelompok). Aitem yang memiliki indeks daya beda aitem yang baik akan dijawab

    benar oleh kelompok tinggi dan dijawab salah oleh kelompok rendah.

    2. Korelasi aitem-total

    Korelasi aitem-total memberikan informasi tentang apakah aitem mengukur

    hal yang sama dengan tes, korelasi aitem-total dapat dihitung menggunakan korelasi

    point biserial. Korelasi point biserial digunakan jika variabel kontinu dihubungkan

    dengan variabel dikotomi yang sesungguhnya. Contoh variabel dikotomi

    sesungguhnya adalah benar-salah, psikotik-normal, buta warna-normal (Kumar,

    2009).

    Korelasi point biserial yang bernilai positif menunjukkan bahwa aitem dan tes

    mengukur hal yang sama, nilai mendekati nol menunjukkan bahwa bahwa aitem tidak

    memiliki indeks daya beda yang baik sehingga kelompok tinggi menjawab pertayaan

    dengan salah dan kelompok rendah menjawab pertanyaan dengan benar. Nilai negatif

    Universitas Sumatera Utara

  • menunjukkan bahwa aitem tidak mengukur hal yang sama dengan alat tes. Korelasi

    poin biserial diformulasikan sebagai berikut:

    (9)

    Keterangan: bis = Korelasi poin biserial

    + = Rata-rata skor kriteria bagi individu yang menjawab jawaban

    dengan benar

    = Rata-rata skor kriteria kelompok

    Standar deviasi skor kriteria kelompok

    P = Indeks Kesulitan aitem

    Q = 1-P

    3. Korelasi inter-aitem

    Korelasi inter-aitem digunakan untuk memahami pengukuran daya beda

    aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem menunjukkan

    nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem yang memiliki nilai

    korelasi aitem-total yang positif akan menunjukkan nilai yang positif juga pada

    kebanyakan aitemnya, namun korelasi aitem-total tidak dapat menjelaskan mengapa

    korelasi aitem total dapat bernilai negatif dan dalam hal ini dapat dijelaskan dengan

    menggunakan korelasi inter-aitem.

    Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa

    aitem gagal dalam membedakan subjek yang memiliki kemampuan dengan subjek

    Universitas Sumatera Utara

  • yang tidak memiliki kemampuan, dalam artian kelompok tinggi dapat menjawab

    dengan salah dan subjek dari kelompok rendah dapat menjawab dengan benar.

    Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti,

    kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,

    sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem

    memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang disusun

    untuk mengukur dua atribut yang berbeda.

    Daya beda aitem dalam penelitian dapat diestimasi dengan korelasi aitem total

    dengan menggunakan korelasi point biserial.

    b. Analisis Indeks Daya Beda Aitem

    Indeks daya beda aitem secara matematis akan berkisar mulai dari -1 sampai

    dengan +1, namun demikian hanya harga d yang bernilai positif saja yang memiliki

    arti dalam analisis aitem.

    Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang

    bersangkutan mempunyai daya beda yang rendah sedangkan harga d yang negatif

    menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali bahkan bisa

    menyesatkan.

    Indeks daya beda aitem yang ideal adalah yang mendekati angka 1, semakin

    besar indeks daya beda (semakin mendekati 1) berarti aitem tersebut mampu

    membedakan antara individu yang menguasai materi yang diujikan dan mereka yang

    tidak menguasainya, semakin kecil daya beda aitem (semakin mendekati 0) berarti

    semakin tidak jelaslah fungsi aitem yang bersangkutan dalam membedakan mana

    Universitas Sumatera Utara

  • subjek yang menguasai materi yang diujikan dan subjek yang tidak tahu apa-apa

    (Azwar, 2007).

    Ebel (dalam dalam Azwar, 2007) terdapat suatu panduan dalam evaluasi

    indeks daya beda aitem, yaitu :

    Tabel 3. Evaluasi Indeks Daya Beda Aitem Indeks

    Daya Beda Evaluasi

    0,4 atau lebih Bagus sekali

    0,3 - 0,39 Lumayan bagus, tidak membutuhkan revisi

    0,2 0,29 Belum memuaskan, perlu revisi

    Kurang dari 0,20 Jelek dan harus dibuang

    Thorndike (dalam Azwar, 2007) bahwa dalam proses seleksi aitem, aitem-

    aitem yang memiliki nilai daya beda aitem di atas 0,50 akan langsung dianggap baik

    sedangkan aitem-aitem dengan indeks daya beda di bawah 0,20 dapat langsung

    dibuang dan dianggap jelek.

    3. Efektivitas Distraktor

    a. Pengertian Efektivitas Distraktor

    Aitem yang baik harus memiliki dua karakteristik yaitu: pertama individu

    yang mengetahui jawaban dari pertanyaan yang diajukan haruslah menjawab

    pertanyaan tersebut dengan benar, kedua individu yang tidak mengetahui jawaban

    dari pertanyaan yang diajukan haruslah memilih pilihan jawaban secara acak

    Universitas Sumatera Utara

  • (Murphy & Davidshofer, 2003), jadi dapat disimpulkan karakteristik kedua adalah

    efektivitas distraktor.

    Efektivitas distraktor diperiksa untuk melihat apakah semua distraktor atau

    semua pilihan jawaban yang bukan kunci jawaban telah berfungsi sebagaimana

    mestinya, yaitu apakah distraktor-distraktor tersebut telah dipilih lebih banyak (atau

    semua) individu dari kelompok rendah sedangkan individu dari kelompok tinggi

    hanya sedikit (atau tidak ada) yang memilihnya. Pengaruh yang jelas ketika distraktor

    yang digunakan tidak popular adalah tingkat kesukaran aitem menjadi rendah.

    b. Analisis Efektivitas Distraktor

    Terdapat dua kemungkinan jika jumlah orang yang menjawab suatu distraktor

    melebihi jumlah yang diharapkan. Pertama, kemungkinannya bahwa pilihan subjek

    tersebut menunjukkan pengetahuan parsial. Artinya subjek mengetahui bahwa

    distraktor yang dipilihnya tersebut juga berkaitan dengan pengetahuan yang

    dipertanyakan. Kedua, kemungkinan yang ditakutkan adalah aitem tersebut

    merupakan aitem buruk yang menjebak. Artinya, jika salah satu distraktor lebih

    dikenal oleh subjek yang memiliki pengetahuan baik mengenai domain ukur dan jika

    identifikasi dari respon benar merupakan jawaban yang kurang dikenal atau tidak

    jelas maka aitem ini tidak valid mengukur kawasan ukurnya. Kehadiran aitem dengan

    distraktor yang sangat tidak asing bagi subjek memiliki reliabilitas dan validitas tes

    yang rendah (Murphy & Davidshofer, 2003). Jumlah subjek yang diharapkan

    menjawab pertanyaan adalah perbandingan anatara subjek yang menjawab salah

    dengan jumlah distraktor. Efektivitas distraktor dapat dilihat dari dua kriteria:

    Universitas Sumatera Utara

  • 1. Distraktor dipilih oleh individu dari kelompok rendah

    2. Pemilih distraktor yang tersebar relatif proporsional pada masing-masing

    distraktor yang ada.

    Penelitian ini melihat efektivitas distraktor berdasarkan distraktor yang dipilih

    oleh individu dari kelompok rendah, dan distraktor yang menyebar secara

    proporsional pada masing-masing distraktor yang ada.

    4. Reliabilitas Alat Ukur

    a. Pengertian Reliabilitas

    Reliabilitas merupakan penerjemahan dari kata reliability yang berasal dari

    kata rely dan ability. Ada banyak istilah yang digunakan untuk menyatakan

    reliabilitas, seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi

    dan sebagainya, namun pada intinya konsep reliabilitas memiliki makna sejauh mana

    hasil suatu pengukuran dapat dipercaya (Azwar, 2007), karena konsepsi mengenai

    reliabilitas berkaitan dengan indeks konsistensi antara dua perangkat skor tes, maka

    formula reliabilitas selalu dinyatakan dalam bentuk koefisien korelasi (Azwar, 2007).

    Menurut Suryabrata (2005) reliabilitas alat ukur menunjukkan sejauh mana

    hasil pengukuran dengan alat tersebut dapat dipercaya, yang mana hal ini ditunjukkan

    oleh taraf konsistensi skor yang diperoleh para subjek yang diukur dengan alat yang

    sama atau minimal setara, dalam kondisi yang berbeda.

    Universitas Sumatera Utara

  • Crocker dan Algina (2005) menjelaskan bahwa pada dasarnya reliabilitas

    menggambarkan indeks konsistensi, yaitu :

    a reliability term refers to the degree to which individuals deviation scores, or z-scores, remain relatively consistent over repeated

    administration of the same test or alternate test forms.

    Berdasarkan beberapa definisi di atas, dapat disimpulkan bahwa reliabilitas

    menunjukkan pada indeks konsistensi penyimpangan skor individu.

    Menurut Kumar (2009) ada dua pengertian reliabilitas yang hampir mirip yaitu:

    1. Reliabilitas adalah proporsi varians skor murni dengan varians skor tampak

    2. Reliabilitas adalah proporsi varians eror skor murni dengan varians eror skor

    tampak.

    b. Bentuk Estimasi Reliabilitas

    Teori Tes Klasik mengasumsikan bahwa varians skor observasi kelompok

    orang sama dengan varians skor sesungguhnya ditambah dengan varians karena eror

    pengukuran sistematis, karena varians skor sesungguhnya tidak dapat langsung

    dihitung, reliabilitas di estimasi dengan menganalisa dampak variasi pada skor

    penyelenggara dan isi tes pada skor yang diobservasi. Beberapa metode untuk

    mengesitimasi reliabilitas:

    1. Pendekatan tes ulang

    Pendekatan ini dilakukan dengan cara menyajikan tes dua kali pada suatu

    kelompok yang sama yang diantara penyajian kedua tes tersebut diberi rentang

    waktu, sehingga akan diperoleh dua distribusi skor dari kelompok tersebut.

    Universitas Sumatera Utara

  • Komputasi koefisien korelasi antara kedua distribusi skor kelompok tersebut akan

    menghasilkan koefisien reliabilitas.

    Mengingat bahwa dalam prakteknya pendekatan ini mengandung kelemahan

    yaitu kondisi subjek pada tes kedua tidak lagi sama dengan kondisi subjek pada tes

    pertama baik dari proses belajar, perubahan motivasi, pengalaman, sehingga

    pendekatan ini lebih baik digunakan bila objek ukur berupa keterampilan, terutama

    keterampilan fisik.

    2. Pendekatan tes paralel

    Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan

    sekaligus dua bentuk tes yang paralel kepada sekelompok subjek, dalam

    pelaksanaannya kedua tes yang paralel tersebut dapat digabungkan sehingga seakan-

    akan merupakan satu bentuk tes, setelah dijawab subjek barulah aitem-aitem masing-

    masing tes semula dipisahkan, sehingga diperoleh dua distribusi skor. Keuntungan

    cara ini adalah subjek tidak merasa berat untuk menjawab pertanyaan dalam tes

    sehingga dapat mengurangi efek carry-over namun kelemahan pendekatan ini adalah

    sulitnya menyusun perangkat tes yang paralel.

    3. Pendekatan konsistensi internal

    Seperangkat tes diberikan kepada sekelompok subjek satu kali sehingga

    diperoleh satu distribusi skor tes dari kelompok subjek tersebut. Prosedur analisis

    reliabilitasnya diarahkan pada analisis terhadap aitem-aitem atau terhadap kelompok-

    kelompok aitem dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi

    beberapa kelompok aitem yang disebut belahan tes. Membelah tes prinsipnya adalah

    Universitas Sumatera Utara

  • mengusahakan agar antar belahan memiliki jumlah aitem sama banyak, taraf

    kesukaran seimbang, isi sebanding, dan memenuhi ciri-ciri paralel . Berikut beberapa

    pilihan cara untuk membelah tes menjadi lebih dari dua bagian.

    1. Pembelahan cara random

    Membelah tes menjadi dua bagian secara random dapat dilakukan dengan cara

    undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang

    dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua.

    Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah berisi

    aitem-aitem yang homogen baik dari segi konten maupun segi taraf kesukaran aitem,

    namun jika aitem tersebut heterogen dapat juga menggunakan cara pembelahan ini

    asalkan aitem tersebut jumlahnya sangat besar.

    2. Pembelahan gasal-genap

    Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh

    aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang

    bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan ini

    selain mudah dilakukan juga dapat menghindari kemungkinan terjadinya

    pengelompokkan aitem-aitem tertentu ke dalam salah satu belahan saja.

    3. Pembelahan matched-random Subtes

    Pembelahan dengan cara matched-random subtes ditemukan oleh Gulikksen

    (1950), sebelum melakukan pembelahan tes terlebih dahulu harus dihitung indeks

    taraf kesukaran aitem serta korelasi aitem dengan skor total tes, dengan cara ini setiap

    aitem dalam tes diletakkan pada satu posisi atau titik tertentu dalam grafik

    Universitas Sumatera Utara

  • berdasarkan harga indeks kesukaran aitem dan korelasi antara aitem yang

    bersangkutan dengan skor tes.

    Keuntungan menggunakan pendekatan konsistensi internal adalah, dapat

    menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang

    dan pendekatan tes paralel.

    c. Formula Estimasi Reliabilitas Konsistensi Internal

    Formula estimasi yang berbeda, walaupun dikenakan pada data yang sama,

    pada umumnya tidak akan menghasilkan koefisien yang serupa. Beberapa hal yang

    berpengaruh terhadap hasil komputasi koefisien reliabilitas adalah:

    1. Perbedaan konsep dan dasar pikiran yang melandasi ide dasar terbentuknya

    suatu formula.

    2. Sifat distribusi skor kelompok subjek.

    3. Homogenitas aitem-aitem dalam tes.

    4. Homogenitas isi dan varians antar belahan tes.

    5. Indikasi yang ditunjukkan oleh hasil teknik perhitungan tertentu.

    Berikut beberapa formula estimasi yang dapat digunakan untuk menghitung

    koefisien reliabilitas:

    1. Spearman-Brown

    Formula komputasi Spearman-Brown merupakan formula koreksi terhadap

    koefisien korelasi antara dua bagian tes dan dirumuskan sebagai berikut (Azwar,

    2005):

    Universitas Sumatera Utara

  • S-B = rxx=

    (10)

    Keterangan: rxx = Koefisien reliabilitas Spearman-Brown

    r12 = Koefisien korelasu antara dua belahan

    Formula ini dapat digunakan jika aitem dikotomi ataupun politomi,

    pembelahan tes dilakukan dengan cara gasal-genap dan matched-random subtes dan

    menghasilkan dua bagian yang paralel satu sama lain dan korelasi antara kedua

    belahan paralel tersebut cukup tinggi.

    2. Rulon

    Rulon (1939) mempersoalkan reliabilitas tes yang dibelah menjadi dua

    belahan, jika sekiranya belahan tersebut setara maka secara teori skor subjek pada

    perangkat belahan pertama dan skor perangkat belahan kedua akan sama. Jika skor-

    skor pada kedua perangkat itu tidak sama, maka itu terjadi karena kesalahan

    pengukuran. Berdasarkan atas pemikiran ini maka diusulkan rumus reliabilitas tes

    sebagai berikut (Suryabrata, 2005):

    rxx = 1- sd2/sx

    2 (11)

    Keterangan: sd2

    = Varians perbedaan skor kedua belahan

    sx2

    = Varians skor tes

    d = Perbedaan skor kedua belahan

    Universitas Sumatera Utara

  • Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan

    tes tidak harus paralel, namun harus memenuhi asumsi -equivalent.

    3. Koefisien alpha belah dua

    Formula koefisien alpha untuk estimasi reliabilitas belah dua dirumuskan

    sebagai berikut:

    rxx = 2

    (12)

    Keterangan: = Varians pada belahan 1

    = Varians pada belahan 2

    = Varians total skor tes

    Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan

    tes tidak harus paralel, namun harus memenuhi asumsi -equivalent, aitem-aitem

    dalam tes haruslah homogen sehingga formula ini tidak bisa digunakan untuk

    mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa trait.

    4. Koefisien alpha belah lebih dari dua

    Pembelahan tes tidak hanya terbatas pada membagi tes ke dalam dua belahan

    saja. Cara-cara pembelahan dapat diperluas pemakainnya untuk membagi tes menjadi

    beberapa belahan. Bahkan suatu tes yang akan diestimasi reliabilitasnya dapat dibelah

    menjadi bagian-bagian sebanyak jumlah aitemnya sehingga setiap bagian hanya berisi

    satu aitem saja.

    Universitas Sumatera Utara

  • Tes yang dibelah menjadi lebih dari dua belahan yang masing-masing berisi

    aitem yang berjumlah sama banyak kita dapat menggunakan formula alpha dengan

    rumus:

    =

    (13)

    Keterangan : = banyaknya belahan tes

    = varians belahan j; j = 1, 2k

    = varians skor tes

    Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, setiap

    belahan memiliki aitem yang relatif setara, paralel setidaknya memenuhi asumsi -

    equivalent, aitem-aitem dalam tes haruslah homogen sehingga formula ini tidak bisa

    digunakan untuk mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa

    trait.

    5. Kuder-Richardson 20 (KR-20)

    KR 20 merupakan rata-rata estimasi reliabilitas dari semua cara belah-dua

    yang mungkin dilakukan. Koefisien ini juga mencerminkan sejauhmana kesetaraan isi

    aitem-aitem dalam tes. Rumusan formula KR-20 adalah:

    (14)

    Keterangan : = Banyaknya aitem dalam tes

    = Varians skor tes

    Universitas Sumatera Utara

  • p = Proporsi subjek yang mendapat angka 1 pada suatu aitem, yaitu

    banyaknya subjek yang mendapat angka 1 dibagi oleh

    banyaknya seluruh subjek yang menjawab aitem tersebut.

    Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan

    membelahan tes sebanyak jumlah aitem, aitem-aitem dalam tes haruslah homogen

    sehingga formula ini tidak bisa digunakan untuk mengestimasi koefisien reliabilitas

    alat tes yang mengukur beberapa trait, dan tingkat kesukaran aitem haruslah

    bervariasi.

    6. Kuder-Richardson 21 (KR-21)

    Perhitungan KR-21 menggunakan rata-rata harga p dari keseluruhan aitem.

    hal inilah yang membedakan antara KR-20 dengan KR-21. Rumusan formula KR-21

    adalah:

    (15)

    Keterangan : = Banyaknya aitem dalam tes

    = Rata-rata p yaitu,

    = Varians skor tes

    Untuk mempermudah komputasi, formula KR-21 dapat pula dinyatakan

    sebagai:

    (16)

    Universitas Sumatera Utara

  • Keterangan : Mx = Harga rata-rata means skor tes

    Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan

    membelahan tes sebanyak jumlah aitem

    Estimasi koefisien reliabilitas pada penelitian ini dilakukan dengan

    pendekatan konsistensi internal dengan formula estimasi koefisien reliabilitas yang

    digunakan adalah KR-20.

    d. Interpretasi Koefisien Reliabilitas

    Reliabilitas merupakan konsistensi performa relatif subjek pada tes-tes yang

    diadminstrasikan ulang atau paralel, namun ketidakkonsistenan skor dapat terjadi

    terutama disebabkan oleh eror yang mempengaruhi performa subjek yang mengikuti

    tes.Terdapat dua jenis eror yang mempengaruhi performa subjek, yaitu:

    1. Eror yang sistematik yaitu kecendrungan subjek untuk memperoleh skor yang

    semuanya tinggi atau sebaliknya semuanya rendah. Eror ini akan secara konsisten

    mempengaruhi performa individu dalam mengerjakan tes. Sumber eror ini

    biasanya berkaitan dengan karakteristik subjek atau alat tes.

    2. Eror tidak sistematik yaitu kecendrungan subjek memperoleh skor yang tidak

    tetap. Eror ini secara tidak sengaja muncul dan mempengaruhi skor individu. Eror

    ini bersifat acak. Sumber eror ini seperti kelelahan memori, situasi tes (misalnya

    suhu ruangan yang terlalu dingin atau terlalu panas), dan suasana hati subjek.

    Eror yang telah dijelaskan dapat mengakibatkan skor yang diperoleh individu

    (skor tampak) tidak selalu sama dengan skor murni seseorang dalam konteks suatu

    performansi tertentu, padahal skor murnilah yang mencerminkan kondisi sebenarnya

    Universitas Sumatera Utara

  • dari performansi subjek terhadap kriteria tertentu, oleh karena skor murni tidak dapat

    diperoleh secara langsung, koefisien reliabilitas merupakan salah satu bentuk

    pendekatan yang dapat digunakan untuk mengestimasi nilai ini, melalui koefisien ini

    dapat diestimasi letak skor murni tersebut dalam suatu wilayah interval tertentu.

    Penafsiran terhadap koefisien reliabilitas harus dilakukan melalui penafsiran

    standard eror pengukuran, dengan rumusan sebagai berikut:

    SEm = Sx (17)

    Keterangan: SEm = Standar eror pengukuran

    Sx = Standar deviasi skor

    Semakin tinggi koefisien reliabilitas suatu tes, maka kemungkinan kesalahan

    yang terjadi akan semakin kecil, jadi tidak ada harga mati dalam koefisien reliabilitas.

    Tingi rendahnya koefisien reliabilitas sangat bergantung kepada tujuan penerapan tes

    (Suryabrata, 2005).

    Murphy dan Davidshofer (2003) menyatakan bahwa reliabilitas yang rendah

    dapat diterima jika tes digunakan untuk membuat keputusan awal, tidak untuk

    keputasan akhir dan tes yang digunakan untuk mengelompokkan individu kedalam

    krlompok yang kecil berdasarkan perbedaan yang mencolok.

    Reliabilitas yang tinggi diperlukan untuk tes yang digunakan untuk membuat

    keputusan akhir dan tes yang digunakan untuk mengelompokkan individu kedalam

    kategori yang beragam yang berdasarkan perbedaan yang kecil antara individu.

    Tabel 4.Tingkat Reliabilitas untuk Berbagai Tipe Tes

    Universitas Sumatera Utara

  • Estimasi

    Reliabilitas

    Bentuk

    Tes

    Interpretasi

    0.95 Pengukuran eror sebenarnya memiliki efek yang rendah

    0.90 Tes Intelegensi Reliabilitas tinggi-sedang

    0.85

    0.80

    Tes Prestasi

    0.75 Tes Pilihan

    Ganda

    Reliabilitas sedang-rendah

    0.70 Skala

    0.65 Reliabilitas rendah

    0.60 Tes Proyektif

    0.55

    0.50

    Skor murni dan eror memiliki efek yang sama dalam

    pengukuran

    Berdasarkan tabel diatas maka IST harus memiliki koefisien reliabilitas

    sebesar 0.9.

    e. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas

    Crocker & Algina (2005) menjelaskan bahwa ada 3 hal utama yang secara

    tidak langsung mempengaruhi tinggi rendahnya koefisien reliabilitas suatu instrumen,

    yaitu:

    1. Homogenitas Kelompok

    Homogenitas kelompok harus diperhatikan ketika menyusun alat tes karena

    dalam suatu kondisi tes, semakin besar homogenitas kelompok berkaitan dengan

    trait-trait tertentu yang diukur maka indeks reliabilitas akan semakin rendah bila

    dibandingkan dengan kondisi ketika kelompok sampel lebih heterogen.

    2. Batasan Waktu dalam Tes

    Universitas Sumatera Utara

  • Tes yang memiliki waktu yang lebih panjang cenderung akan memiliki indeks

    reliabilitas yang lebih tinggi dibandingkan tes yang memiliki waktu yang lebih

    pendek.

    3. Panjang Tes

    Panjang dari suatu tes sangat bergantung dengan seberapa banyaknya aitem-

    aitem yang menyusun tes tersebut. Semakin banyak aitem yang memiliki kualitas

    baik dalam suatu tes, maka semakin tinggi pula indeks reliabilitas instrumen tersebut.

    5. Validitas

    a. Pengertian Validitas

    Validitas mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat

    ukur dalam melakukan fungsi ukurnya. Suatu alat ukur dapat dikatakan memiliki

    validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau

    memberikan hasil ukur, yang sesuai dengan maksud dilakukannnya pengukuran

    tersebut, sehingga disini tampak bahwa bahwa pengertian validitas juga sangat erat

    kaitannya dengan tujuan pengukuran, oleh karena itu, tidak ada validitas yang berlaku

    umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan

    ukuran yang valid untuk satu tujuan yang spesifik, dengan demikian, pernyataan valid

    terhadap suatu pengukuran harus diikuti oleh keterangan yang menunjuk kepada

    tujuan awal pengukuran serta kelompok subjek yang mana (Azwar, 2007).

    Sisi lain dari pengertian validitas menurut Azwar (2007) adalah aspek

    kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu

    Universitas Sumatera Utara

  • menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang

    cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat

    memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek

    yang satu dengan yang lain.

    b. Jenis-Jenis Validitas

    1. Content related validation

    Validitas isi menunjukkan sejauhmana tes yang merupakan seperangkat

    aitem-aitem dilihat dari isinya memang mengukur apa yang dimaksudkan untuk

    diukur (sesuai dengan kawasan ukur). Ukuran sejauhmana ini ditentukan berdasar

    indeks representatifnya isi tes tersebut bagi isi hal yang akan diukur. Validitas

    berdasarkan estimasi isi merupakan bentuk validitas yang diestimasi lewat pengujian

    terhadap isi tes dengan analisis rasional atau lewat professional judgement.

    2. Criterion related validation

    Validitas berdasar kriteria merupakan validitas yang diperlihatkan oleh

    adanya hubungan skor pada tes yang bersangkutan dengan skor suatu criteria, dalam

    validasi tes berdasar kriteria, umumnya tes yang akkan diuji validitasnya disebut

    sebagai prediktor. Prosedur validasi berdasar kriteria menghasilkan dua macam

    validitas, yaitu :

    a). Validitas prediktif

    Estimasi validitas prediktif sangat penting artinya bila tes yang dimaksud

    berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang (Azwar,

    2005).

    Universitas Sumatera Utara

  • b). Validitas konkuren

    Estimasi validitas konkuren dilakukan apabila skor tes dan skor kriterianya

    dapat diperoleh dalam waktu yang sama. Azwar (2007) mengatakan bahwa

    sebagian besar faktor kriteria dalam estimasi validitas konkuren ialah skor tes lain

    yang biasanya sudah teruji dan terstandar dengan baku.

    3. Construct related validation

    Ada baiknya diketahui pengertian konstrak terlebih dahulu, Sebelum

    membahas tentang validitas konstrak, konstrak psikologis adalah suatu konsep yang

    dengan kesadaran penuh sengaja diciptakan bagi tujuan ilmiah khusus, dan konsep

    adalah merupakan abstraksi yang terbentuk melalui generalisasi dari hal-hal khusus

    (Kerlinger, 1973). Konstrak terdiri dari dua proposisi, yaitu:

    1. Definisi dan spesifikasi mengenai suatu konsep secara sistematis dan terencana

    sehingga memungkinkan dilakukannya observasi an pengukuran terhadapnya.

    Dalam hal ini konstrak dapat berupa petunjuk kegiatan-kegiatan atau tindakan

    yang diperlukan dalam pengukuran suatu konstrak.

    2. Konstrak tersebut dimasukkan kedalam bagan teori yang dengan berbagai cara

    akan dikaitkan dengan konstrak-konstrak lain. Dengan kata lain merumuskan

    hipotesis yang mengaitkan konstrak baru tersebut dengan konstrak-konstrak lain

    kedalam jalinan teoritis yang kompak.

    Prinsipnya, pengujian kedua proposisi inilah yang menjadi fokus kajian dalam

    validitas konstrak. Validitas konstrak adalah validitas yang menunjukkan sejauhmana

    Universitas Sumatera Utara

  • suatu tes mengukur trait atau konstrak teoretik yang hendak diukurnya (Azwar,

    2007). Fokus pengujian validitas konstrak tersebut adalah:

    1. Apakah data yang dikumpulkan dari alat ukur yang disusun telah mendukung

    konstruksi teorinya.

    2. Apakah bukti-bukti empiris yang dikumpulkan dari berbagai pengujian relasi

    telah mendukung hipotesis dalam bagan teorinya.

    Berdasarkan kedua fokus pengujian validitas konstrak tersebut dapat ditarik

    kesimpulan bahwa fokus pengujian pertama adalah analisis faktor dan fokus

    pengujian yang kedua adalah analisis multitrait multimethode.

    1. Analisis faktor

    Analisis faktor merupakan kumpulan prosedur matematik yang kompleks guna

    menganalisis hubungan diantara variable-variabel dan menjelaskan hubungan tersebut

    dalam bentuk kelompok variable yang terbatas yang disebut faktor.

    2. Analisis multitrait multimethode

    Campbell dan Fiske (dalam Murphy & Davidshofer, 2003) menguraikan

    tentang cara mengukur validitas konstrak dan menjelaskan bahwa jika ingin

    mengukur dua konstrak atau lebih menggunakan dua macam metode atau lebih dapat

    menggunakan pendekatan multitrait multimethode.

    Pendekatan multitrait multimethode menghasilkan dua macam validitas, yakni

    validitas konvergen dan validitas diskriminan. Dasar pemikirannya adalah suatu tes

    Universitas Sumatera Utara

  • harus berkorelasi tinggi dengan variabel-variabel yang secara teori harus berkorelasi

    tinggi inilah yang disebut validitas konvergen dan tidak berkorelasi dengan variable-

    variabel yang secara teori tidak berkorelasi (validitas diskriminan).

    Teknis penerapan pendekatan multitrait multimethode adalah sebagai berikut.

    Pada suatu kesempatan dilakukan pengukuran terhadap lebih dari satu konstrak

    dengan menggunakan lebih dari satu metode, kemudian diari interkorelasi antara hasil

    pengukuran itu. Interkorelasi itu adalah antara hal-hal berikut:

    1. Konstrak yang sama diukur dengan alat yang sama (monotrait-monomethode).

    2. Konstrak yang sama diukur dengan alat yang berbeda (monotrait-

    heteromethode).

    3. Konstrak yang berbeda diukur dengan alat yang sama (heterotrait-

    monomethode).

    4. Konstrak yang berbeda diukur dengan alat yang berbeda (heterotrait-

    heteromethode).

    Teori koefisien korelasi untuk keempat hal yang telah dijelaskan adalah:

    1. Konstrak yang sama diukur dengan alat yang sama (monotrait-monomethode)

    koefisien korelasinya akan tinggi karena menjelaskan tentang unsur

    konvergen

    2. Konstrak yang berbeda diukur dengan alat yang berbeda (heterotrait-

    heteromethode) koefisien korelasinya akan tinggi karena menjelaskan tentang

    unsur diskriminan ( Suryabrata,2005).

    Universitas Sumatera Utara

  • Penelitian ini akan menggunakan validitas konstruk tes dengan metode

    multitrait-multimethode meliputi validitas diskriminan dan validitas konvergen.

    c. Interpretasi Koefisien Validitas

    Interpretasi koefisien validitas bersifat relatif, tidak ada batasan pasti

    mengenai koefisien terendah yang harus dipenuhi agar validitas dinyatakan

    memuaskan. Estimasi validitas pada umumnya tidak dapat dituntut koefisien yang

    tinggi sekali.

    Koefisien validitas yang dianggap memuaskan akan dikembalikan kepada

    para penguji validitas dan pemakai tes itu sendiri, terutama pemakai alat tes yang

    akan memanfaatkan keputusan yang didasari hasil pengukuran yang bersangkutan

    (Azwar, 2005). Koefisien validitas dapat dianggap memuaskan apabila melebihi 0,30.

    Angka ini ditetapkan sebagai konvensi yang didasarkan pada asumsi distribusi skor

    dari kelompok subjek yang berjumlah besar.

    6. Analisis Karakteristik Psikometri

    Alat tes merupakan kumpulan aitem-aitem yang disusun sedemikian rupa

    sehingga dapat digunakan untuk mengukur sesuatu yang menjadi tujuannya, jadi

    dapat dikatakan bahwa alat tes yang berkualitas akan disusun oleh aitem yang

    berkualitas juga. Kualitas suatu aitem dapat dilihat dari analisis aitemnya, Menurut

    (Murphy & Davidshofer, 2003) analisis aitem dapat memberikan tiga informasi

    penting yaitu, informasi tentang distraktor, informasi tentang tingkat kesukaran aitem

    Universitas Sumatera Utara

  • dan informasi tentang daya beda aitem. Tiga informasi ini berbeda namun saling

    terkait satu dan yang lainnya. Hal ini dapat dilihat dalam keterkaitan antara distraktor

    dengan kesukaran aitem, kesukaran aitem dengan diskriminasi dan distraktor dengan

    diskriminasi.

    Tingkat kesukaran aitem sangat dipengaruhi oleh tingkat keterpercayaan

    distraktor, jika semua distraktor tidak masuk akal maka subjek akan dengan mudah

    untuk memilih jawaban yang benar tanpa harus memiliki pengetahuan tentang hal

    yang ditanyakan, tentu hal ini mempengaruhi tingkat kesukaran aitem, sehingga

    tingkat kesukaran aitem menjadi rendah.

    Tingkat kesukaran aitem secara langsung mempengaruhi diskriminasi aitem.

    Aitem yang sangat susah (p = 0) dan aitem yang sangat mudah (p = 1) tidak dapat

    membedakan antara subjek yang memiliki pengetahuan dan subjek yang tidak

    memiliki pengetahuan sehingga indeks daya beda bernilai rendah.

    Aitem yang memiliki distraktor yang buruk tentu memiliki indeks daya beda

    aitem yang buruk juga, karena sebagaimana yang telah dijelaskan tadi, distraktor

    yang buruk akan membuat subjek dengan mudah menjawab pertanyaan atau

    sebaliknya membuat subjek susah untuk menjawab pertanyaan sehingga juga

    berpengaruh terhadap diskriminasi aitem karena tidak dapat membedakan subjek

    yang memiliki pengetahuan dengan subjek yang tidak memiliki pengetahun.

    Perubahan banyaknya aitem akan menyebabkan perubahan reliabilitas. Bila

    aitem dalam tes bertambah banyak, maka sampai batas tertentu reliabilitasnya juga

    akan meningkat (Azwar, 2005), namun perlu diingat bahwa hanya penambah aitem

    Universitas Sumatera Utara

  • yang berkualitaslah yang dapat meningkatkan reliabilitas. Tes yang meningkat

    reliabilitasnya akan meningkat pula validitasnya, karena semakin tinggi proporsi

    varians skor tampak yang merupakan varians skor murni maka semakin tinggi

    reliabilitasnya maka semakin besar pula varians yang sama-sama dimiliki oleh tes dan

    kriterinya sehingga validitasnya akan semakin tinggi juga. Alat tes yang baik haruslah

    reliabel dan valid.

    C. Intelligenz Strukture Test

    1. Sejarah dan Perkembangan

    Amthauer mendefinisikan intelegensi sebagai sebuah bagian khusus dalam

    keseluruhan struktur kepribadian manusia. Intelegensi tidak hanya identik dengan

    proses intelektual, melainkan erat kaitannya dengan kehidupan dorongan,

    kemampuan, dan perasaan. Seperti yang telah disinggung sebelumnya, intelegensi

    merupakan keseluruhan struktur dari kemampuan jiwa-rohani yang akan tampak

    jelas dalam hasil tes. Intelegensi hanya akan dapat dikenali melalui manifestasinya

    misalnya pada hasil atau prestasi suatu tes. Dari pemikirannya tersebut, Amthauer

    berasumsi bahwa hasil tes dan kemampuan yang disimpulkan dari hasil tes memiliki

    kaitan satu sama lain dan membentuk suatu struktur tidak hanya hasil tes nya, begitu

    pula dengan pemeriksaannya. Dari asumsi inilah, Amthauer menyusun sebuah tes

    yang dinamakan IST dengan hipotesis kerja sebagai berikut :

    komponen dalam struktur tersebut tersusun secara hierarkis; maksudnya bidang yang dominan kurang lebih akan berpengaruh pada bidang-bidang

    yang lain; kemampuan yang dominan dalam struktur intelegensi akan

    menentukan dan mempengaruhi kemampuan yang lainnya.

    Universitas Sumatera Utara

  • Pandangan Amthauer pada dasarnya didasari oleh teori faktor, baik itu teori

    dua faktor, teori bifaktor, teori multifaktor, model struktur intelek Guilford dan teori

    hierarki faktor. Berdasarkan teori faktor yang menyatakan bahwa untuk mengukur

    inteligensi seseorang diperlukan suatu rangkaian baterai tes yang terdiri dari subtes-

    subtes. Antara subtes satu dengan lainnya, ada yang saling berhubungan karena

    mengukur faktor yang sama (general factor atau group factor), tapi ada juga yang

    tidak berhubungan karena masing-masingnya mengukur faktor khusus (special

    factor). Sedangkan kemampuan seseorang itu merupakan penjumlahan dari seluruh

    skor subtes-subtes. Maka Amthauer menyusun IST sebagai baterai tes yang terdiri

    dari sembilan subtes.

    Karakteristik dari baterai tes Amthauer menunjukan adanya suatu

    interkorelasi yang rendah antar subtesnya (r = 0.25) dan korelasi antara subtes dengan

    jumlah (keseluruhan subtes) yang rendah pula ( r = 0.60). Rendahnya interkorelasi

    antara subtes menunjukkan bahwa alat ukur tersebut lebih cenderung mengukur

    kemampuan-kemampuan spesifik inteligensi individu.

    Tes IST terus dikembangkan oleh Amthauer dengan bantuan dari para

    koleganya, berikut adalah perkembangan tes IST dari tahun 1953 hingga tahun 2000-

    an:

    a. IST 1953

    IST yang pertama ini pada awalnya hanya diperuntukan untuk usia 14 sampai

    dengan 60 tahun. Proses penyusunan norma diambil dari 4000 subjek pada

    tahun 1953.

    Universitas Sumatera Utara

  • b. IST 1955

    IST merupakan pengembangan dari IST 1953, pada IST 1955 range untuk

    subjek diperluas menjadi berawal dari umur 13 tahun. Subjek dalam

    penyusunan norma bertambah menjadi 8642 orang. Pada tes ini sudah ada

    pengelompokan jenis kelamin dan kelompok usia

    c. IST 70

    Permintan dan tuntutan pengguna yang menyarankan pengkoreksian dengan

    mesin juga pengembangan tes setelah penggunaan lebih dari 10 tahun, maka

    disusunlah IST 70. Dalam IST 70 ini tidak terlalu banyak perubahan, tes ini

    memiliki 6 bentuk, setiap pemeriksaan dilakukan 2 tes sebagai bentuk parallel

    yaitu A1 dan B2, atau C3 dan D4. Dua bentuk lainnya untuk pemerintah dan

    hanya bagi penggunaan khusus. Pada IST 70, rentang kelompok usia diperluas

    menjadi berawal dari 12 tahun. Disamping itu telah ditambah tabel kelompok

    dan pekerjaan. Namun demikian, pada IST 70 terdapat kekurangan yaitu

    penyebaran bidang yang tidak merata dan menggunkan kalimat dalam subtes

    RA sehingga jika subjek gagal dalam subtes ini dapat dimungkinkan karena

    tidak mampu mengerjakan soal hitungannya atau tidak mengerti kalimatnya.

    d. IST 2000

    Koreksi dari IST 70, pada IST 2000 tidak terdapat soal kalimat pada soal

    hitungan.

    e. IST 2000-Revised

    Universitas Sumatera Utara

  • Terdapat beberapa perkembangan subtes pada IST 2000-R dan juga

    penambahan subtes. IST ini terdiri dari 3 modul, yaitu sebagai berikut :

    1. Grundmodul-Kurzform (Modul Dasar-Singkatan); terdiri dari subtes : SE,

    AN, GE, RE, ZR, RZ, FA, WU, dan MA.

    2. Modul ME; terdiri dari subtes ME Verbal dan ME Figural

    3. Erweiterungmodul (Modul "menguji pengetahuan"); terdiri dari subtes

    Wissentest (tes pengetahuan)

    2. Subtes IST

    IST adalah tes intelegensi yang dikembangkan oleh Rudolf Amthauer di

    Frankfurt, Jerman pada tahun 1953. Tes ini dipandang sebagai gestalt (menyeluruh),

    yang terdiri dari bagian-bagian yang saling berhubungan secara makna (struktur).

    Struktur intelegensi tertentu meggambarkan pola kerja tertentu, sehingga akan cocok

    untuk profesi atau pekerjaan tertentu.

    Tes ini dikonstruksikan untuk subjek usia 14-60 tahun setelah melalui uji coba

    kurang lebih pada 4000 orang.

    Di Indonesia tes ini pertamakali digunakan oleh psikolog angkatan darat

    Bandung, Jawa Barat. Intellegenz struktur test (IST) terdiri dari 9 subtes yaitu:

    1. SE: melengkapi kalimat

    Universitas Sumatera Utara

  • Subtes ini mengukur pembentukan keputusan (dapatkah seseorang berprestasi,

    rasa realitas/ menilai yang mendekati realitas, common sense (memnfaatkan

    pengalaman masa lalu), dapatkah seseorang berpikir secara berdikari/ mandiri,

    dan berpikir praktis dalam kehidupan sehari-hari

    2. WA: melengkapi kalimat

    Subtes ini mengukur kemampuan bahasa, perasaan empati, berpikir induktif

    menggunakan bahasa, memahami pengertian.

    3. AN: persamaan kata

    Subtes ini mengukur kemampuan fleeksibilitas dalam berpikir, kemampuan

    berpikir logis/menggunakan pikiran sebagai dasar dalam berpikir (kedalaman

    berpikir).

    4. GE: sifat yang dimiliki bersama

    Subtes ini mengukur kemampuan abstraksi, kemampuan untuk mneyatakan

    pengertian akan seseuatu dalam bentuk bahasa, membentuk suatu pengertian

    atau mencari inti persoalan.

    5. RA: berhitung

    Subtes ini melihat aspek berpikir induktif praktis hitungan, kemampuan

    berhitung, menggunakan bilangan secara praktis dalam masalah hitungan.

    6. ZR: deret angka

    Universitas Sumatera Utara

  • Subtes ini akan melihat bagaimana cara berpikir teoritis dengan hitungan

    7. FA: memilih bentuk

    Subtes ini akan mengukur kemampuan dalm membayangkan, kemampuan

    mengkonstruksi (sintesa dan analisa), berpikir konkrit menyeluruh,

    memasukkan bagian pada suatu keseluruhan.

    8. WU: latihan balok

    Subtes ini akan mengukur daya bayang ruang, dan kemapuan tiga dimensi.

    9. ME: latihan simbol

    Subtes ini mengukur daya ingat, konsentrasi yang menetap, dan daya tahan.

    IST berdasarkan karakteristiknya, tergolong kelompok Multiple Aptitude

    Batteries Test, yaitu sebuah tes yang tersusun atas serangkaian subtes dimana masing-

    masing subtes tersebut mengukur suatu kemampuan (Anastasia& Urbina, 1997).

    3. Subtes Satzergaenzung (SE)

    Subtes SE mengukur common sense, pembentukan keputusan, kemadirian

    berpikir, penekanan pada konkrit praktis, dan pemakaian realitis. aitem-aitemnya

    akan menuntut subjek untuk melakukan penilaian berdasarkan pengalaman konkrit

    dan informasi faktual yang dimilikinya dari penilaian subjek dapat dilihat apakah

    subjek mampu membentuk penilaian secara mandiri atau tergantung pada orang

    banyak dan apakah subyek memiliki kemampuan reasoning yang baik.

    Subtes SE terdiri dari 20 soal yang terdiri atas kalimat-kalimat, dengan lima

    pilihan jawaban. Skoring subtes ini berupa dikotomi, yaitu skor 0 untuk jawaban

    salah dan skor 1 untuk jawaban benar.

    Universitas Sumatera Utara

  • Subtes ini mengharuskan subyek untuk memilih salah satu kata yang tepat

    untuk mengisi satu kata yang hilang, sehingga susunan kalimat kalimat dalam soal

    menjadi sempurna.

    Tahap skoring yang digunakan adalah dengan memeriksa setiap jawaban

    dengan menggunakan kunci jawaban yang telah disediakan. Untuk semua subtes SE

    setiap jawaban benar diberi nilai 1, untuk jawaban salah atau kosong diberi nilai 0.

    Total nilai benar yang sesuai dengan kunci jawaban merupakan Raw Score

    (RW) nilai ini belum dapat diinterpretasi sesuai dengan norma yang digunakan. Nilai

    RW yang sudah dibandingkan dengan norma disebut dengan Standardized Score

    (SW). Nilai SW inilah yang dapat menjadi materi untuk tahap selanjutnya yaitu

    interpretasi. Adapun norma yang digunakan adalah sesuai dengan kelompok umur

    subjek.

    a. Interpretasi

    Tahap interpretasi dapat dilakukan setelah didapatkan Standardized Score.

    Kesembilan subtes saling berkaitan, sehingga harus dilakukan semuanya dan

    interpretasinya harus dilakukan secara keseluruhan. Interpretasi yang dapat dilakukan

    dari tes IST adalah sebagai berikut :

    1. Taraf Kecerdasan

    Taraf kecerdasan didapat dari total SW. Nilai ini dapat diterjemahkan menjadi

    Intelligent Quotient (IQ). Nilai ini dapat menggambarkan perkembangan individu

    melalui pendidikan dan pekerjaan. Nilai ini perlu dihubungkan dengan latar belakang

    sosial serta dibandingkan dengan kelompok seusianya.

    Universitas Sumatera Utara

  • 2. Dimensi Festigung-Flexibilitas

    Dimensi Festigung-Flexibilitas menggambarkan corak berpikir yang dimiliki

    oleh subjek. Dimensi Festigung-Flexibilitat merupakan dua kutub yang ekstrim,

    keduanya menggambarkan corak berpikir yang ekstrim pula. Kutub Festigung

    memiliki arti corak berpikir yang eksak, sedangkan kutub Flexibilitt memiliki arti

    corak berpikir yang non-eksak. Corak berpikir ini merupakan hasil perkembangan

    (pengalaman) individu yang akan semakin mantap ke salah satu kutub seiring

    bertambahnya usia.

    Menentukan seseorang subjek apakah memiliki kecenderungan Festigung atau

    Flexibilitat adalah dengan membandingkan nilai GE+RA dengan nilai AN+ZR. Jika

    nila GE+RA lebih besar maka subjek memiliki kecenderungan Festigung, sebaliknya

    jika nilai AN+ZR lebih besar maka subjek memiliki kecenderungan Flexibilitas.

    Tabel 5. Perbandingan Nilai Festingung &

    Flexibilitat

    GE+RA > AN+ZR Festigung

    GE+RA < AN+ZR Flexibilitat

    Keterangan: jika selisih 10 maka tidak dapat dilakukan interpretasi.

    Subjek memiliki nilai GE = 117; RA = 105; AN =126; dan ZR = 117. Maka

    nilai AN+ZR lebih besar dari GE+RA sebesar +21, dengan demikian subjek

    memiliki corak berpikir yang flexibilitat (fleksibel).

    3. Profil M-W

    Profil M-W menggambarkan cara berpikir, apakah verbal-teoritis atau praktis-

    konkrit. Untuk mendapatkan profil M atau W ini dapat dilihat dari 4 subtes pertama

    Universitas Sumatera Utara

  • (SE, WA, AN, GE) yang tampak pada grafik, jika grafik menunjukan bentuk M pada

    empat subtes pertama maka profilnya adalah M (verbal-teoritis), jika yang tampak

    adalah bentuk huruf W maka profilnya adalah W (praktis-konkrit).

    Grafik diatas menunjukan 4 subtes pertama (SE, WA, AN, GE) sebagai bentuk

    M, sehingga profil yang dimiliki subjek adalah profil M. Profil M mengandung arti

    bahwa subjek memiliki cara berpikir yang verbal-teoritik.

    4. Struktur Kecerdasan

    Struktur kecerdasan menggambarkan kecerdasan subjek berdasarkan masing-

    masing subtes.

    5. Kesesuaian terhadap Jurusan atau Pekerjaan

    Interpretasi yang kelima adalah kesesuaian dengan jurusan atau pekerjaan

    (sesuai dengan kepentingan). IST biasanya digunakan dalam proses seleksi, baik

    seleksi jurusan di SMU, seleksi perguruan tinggi, maupun seleksi pekerjaan. Untuk

    melihat kesesuaian terhadap jurusan atau pekerjaan, perlu ditinjau norma untuk

    masing-masing jurusan atau pekerjaan yang berisi nilai SW sebagai batas yang

    dibutuhkan untuk jurusan atau pekerjaan tersebut. Disamping itu, untuk melihat

    kesesuaian terhadap jurusan dapat pula dilakukan dengan melihat grafik subjek dan

    membandingkannya dengan bentuk grafik jurusan atau pekerjaan tertentu; jika

    bentuknya kurang lebih sama, maka subjek memiliki kesempatan untuk menempuh

    jurusan/pekerjaan tersebut ( Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).

    Universitas Sumatera Utara