ANALISIS KUALITAS SOAL FORMATIF SEMESTER...
Transcript of ANALISIS KUALITAS SOAL FORMATIF SEMESTER...
ANALISIS KUALITAS SOAL FORMATIF SEMESTER GENAP
PADA MATA PELAJARAN SEJARAH KELAS X IPS
SMAN1 JEMBER TAHUN AJARAN 2017/2018
Proposal Skripsi
Oleh
Anita Fitriawati
NIM 140210302073
HALAMAN JUDUL
PROGRAM STUDI PENDIDIKAN SEJARAH
JURUSAN PENDIDIKAN ILMU PENGETAHUAN SOSIAL
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS JEMBER
2018
ii
DAFTAR ISI
Halaman
HALAMAN JUDUL ........................................................................................................ i
DAFTAR ISI ................................................................................................................... ii
DAFTAR TABEL .......................................................................................................... iv
DAFTAR GAMBAR ...................................................................................................... v
DAFTAR LAMPIRAN ................................................................................................. vi
BAB 1. PENDAHULUAN .............................................................................................. 1
1.1 Latar Belakang .................................................................................................. 1
1.2 Rumusan Masalah ............................................................................................. 8
1.3 Tujuan Penelitian .............................................................................................. 9
1.4 Manfaat Penelitian .......................................................................................... 10
BAB 2. TINJAUAN PUSTAKA .................................................................................. 11
2.1 Pengertian Evaluasi Pedidikan dan Penilaian Hasil Belajar ........................... 11
2.2.1 Penilaian Hasil Belajar ............................................................................ 12
2.1.2 Prinsip Penilaian Hasil Belajar ................................................................ 14
2.1.3 Tujuan dan Fungsi Penilaian Hasil Belajar ............................................. 15
2.2 Bentuk Ujian Formatif .................................................................................... 19
2.3 Tes Pilihan Ganda (Multiple Choice Test)...................................................... 22
2.4 Penyusunan Soal yang Baik ............................................................................ 25
2.5 Analisis Kualitas Soal ..................................................................................... 28
2.6 Penelitian Terdahulu ....................................................................................... 38
2.7 Kerangka Berfikir........................................................................................... 42
BAB 3. METODE PENELITIAN ............................................................................... 46
3.1 Jenis Penelitian ................................................................................................ 46
3.2 Tempat dan Waktu Penelitian ......................................................................... 46
3.3 Populasi, Sampel dan Objek Penelitian .......................................................... 47
3.4 Definisi Operasional........................................................................................ 48
iii
3.5 Prosedur Penelitian.......................................................................................... 51
3.6 Metode Pengumpulan data .............................................................................. 52
3.7 Teknik Analisis Data ....................................................................................... 53
3.8 Penarikan Kesimpulan .................................................................................... 57
DAFTAR PUSTAKA ................................................................................................... 58
iv
DAFTAR TABEL
Tabel 2.1 Perbedaan Evaluasi Formatif dan Sumatif.................................................... 20
Tabel 2.2 Perbedaan Evaluasi Formatif dan Sumatif.................................................... 32
v
DAFTAR GAMBAR
Halaman
Gambar 2.1 Gambar Kerangka Berfikir....................................................................... 45
vi
DAFTAR LAMPIRAN
Halaman
Lampiran 1.1 Matrik Penelitian..................................................................................... 46
Lampiran 1.2 Lembar Hasil Wawancara....................................................................... 67
Lampiran 1.3 Hasil Belajar Peserta Didik Ujian Formatif Bulan April........................ 69
Lampiran 1.4 Hasil Belajar Peserta Didik Ujian Formatif Bulan April........................ 71
1
BAB 1. PENDAHULUAN
1.1 Latar Belakang
Perkembangan ilmu pengetahuan dan teknologi telah membawa manusia dalam
persaingan global. Agar dapat bertahan salah satu cara yang dapat ditempuh adalah
meningkatkan sumber daya manusia melalui pendidikan (Djamarah, 2005:22; Utami,
2016; Sari, 2017; Werdiningsih, 2015; Wahyuningsih, 2015; Widawati, 2011;
Sudarsana, 2015; Winata dkk, 2014; Pramana dkk, 2013). Peningkatan kualitas
pendidikan merupakan sasaran pembangunan dibidang pendidikan nasional serta bagian
integral dari upaya peningkatan kualitas manusia Indonesia secara menyeluruh
(Mulyasa, 2005:31; Diastuti, 2015; Werdiningsih, 2015; Wijayanti, 2014; Nurgiyantoro,
2010). Pendidikan dikatakan bermutu apabila mampu mengembangkan potensi peserta
didik dalam memecahkan problem kehidupan (Ratnawulan & Rusdiana, 2014). Hasil
survey internasional PISA (Program for International Student Assesment)dipublikasi
pada tahun 2018 oleh Organisation for Economic Co-Operation and
Development(OECD)menunjukan bahwa Indonesia masih berada pada peringkat 69
dari 76 negara terkait kualitas pendidikan dan menempati peringkat ke 4 dari 5 negara di
asia (OECD, PISA, 2018). Agar dapat meningkatkan kualitas pendidikan salah satu
upaya yang dapat dilakukan adalah memperbaiki kualitas pembelajaran. Proses ini
merupakan tanggung jawab pendidik dalam mengembangkan potensi peserta didiknya
(Isnaeni, 2017; Imanuddin, 2015; Sanjaya, 2014; Novianto, 2012). Berdasarkan hasil
penelitian dan pendapat beberapa ahli dapat disimpulkan bahwa sangat penting untuk
meningkatkan mutu pendidikan. Peningkatan mutu ini dapat dilakukan melalui kegiatan
pembelajaran yang semakin baik agar dapat menciptakan sumber daya manusia yang
berkualitas dan dapat bersaing secara global.
Kegiatan pembelajaran dapat diketahui keberhasilannya melalui kegiatan
evaluasi sebagai komponen integral dalam pembelajaran selain rencana, tujuan, bentuk,
cara, alat (media) dan metode pembelajaran (Solichin, 2017; Yuniasari, 2016; Sanjaya,
2014; Suyata dkk, 2010; Daryanto, 1999). Pendapat ini didukung oleh Mardapi (2003:8)
2
yang menyatakan bahwa usaha peningkatan kualitas pendidikan dapat ditempuh dengan
peningkatan kualitas pembelajaran dan penilaian. Keduanya saling terikat karena
dengan pembelajan yang baik akan menghasilkan kualitas belajar yang baik pula
(Yuslita dkk, 2016:131; Ratnawulan & Rusdiana, 2014; Indasari, 2014; Novianto, 2012;
Slameto, 2003).Pelaksanaan evaluasi sebagai kegiatan pengendalian, penjaminan, dan
penetapan mutu pendidikan dan bentuk pertanggung jawaban penyelenggaraan
pendidikan terkait peserta didik, program sekolah dan lembaga sekolah. Selain itu
evaluasi merupakan komponen penting yang harus dilakukan oleh pendidik dalam
kegiatan pembelajaran (Arifin, 2012:2; Tayibnapis, 2008). Evaluasi juga bagian penting
dari proses belajar-mengajar yang memungkinkan pendidik untuk mengevaluasi peserta
didik selama dan pada akhir pembelajaran untuk menentukan ketercapaian tujuan
pembelajaran (Diastuti, 2015; Novytasari, 2014; Gundogan, 2013:15; Arifin, 2012;
Jihad & Haris, 2012:54; Mardapi, 2003; Umar, et al,1998; Gronlund, 1984; Grounlund
& Linn, 1990:5). Kegiatan evaluasi memiliki manfaat untuk menilai kegiatan
pembelajaran yang dilakukan agar dapat dilakukan kegiatan tindak lanjut dari hasil
belajar yang diperoleh (Majid, 2014; Sudijono, 2011; Daryanto, 2008; Guba & Lincoln,
1985; Stufflebeam dkk, 1977). Evaluasi yang baik merupakan evaluasi yang dapat
mengukur secara tepat kemampuan peserta didik(Isnaini, 2017; Jihad & Haris, 2012).
Kegiatan evaluasi yang dimaksud diatur dalam Undang-Undang RI No. 20 Tahun 2003
tentang Sistem Pendidikan Nasional Bab XVI Pasal 58, Ayat 1 menyatakan Evaluasi
hasil belajar peserta didik dilakukan oleh pendidik untuk memantau proses, kemajuan,
dan perbaikan hasil belajar peserta didik secara berkesinambungan (Sisdiknas, 2003).
Hal ini juga tercantum dalam Peraturan Pemerintah No. 19 Tahun 2005 tentang standar
nasioanal dalam pasal 63 ayat 1 menyataan bahwa penilaian hasil belajar oleh pendidik
harus dilakukan secara berkesinambungan dengan tujuan untuk memantau proses,
kemajuan, dan perbaikan hasil belajar yang berupa seperti ulangan harian, ulangan
tengah semester, ulangan akhir semester dan ulangan kenaikan kelas. Sedangkan dalam
Peraturan Mentri Pendidikan dan Kebudayaan Republik Indonesia No. 23 Tahun 2016
tentang standar penilaian pendidikan, penilaian pendidikan pada jenjang pendidikan
dasar dan menengah terdiri atas: penilaian hasil belajar, penilaian hasil belajar oleh
3
satuan pendidikan dan penilaian hasil belajar oleh pemerintah (Permendikbud, 2016).
Penilaian dalam kurikulum 2013 mengacu pada permendikbud No. 66 tentang standar
penilaian yang bertujuan (1) perencannan penilaian yang sesuai dengan kompetensi
yang akan dicapai dan berdasarkan prinsip-prinsip penilaian, (2) pelaksanaan penilaian
dilakukan secara profesional, edukatif, efektif, efisien, dan sesuai dengan konteks sosial
budaya, dan (3) pelaporan hasil penilaian harus secara objektif, akuntabel, dan
informatif. Standar tersebut digunakan sebagai acuan penilaian bagi pendidik, satuan
pendidikan dan pemerintah. Berdasarkan pernyataan tersebut dapat disimpulkan bahwa
evaluasi sebagai kegiatan pengendalian, penjaminan dan penentu mutu pendidikan
sangat penting untuk dilakukan. Evaluasi yang dimaksud merupakan bentuk penilaian
hasil belajar peserta didik yang dilakukan secara berkesinambungan dengan tujuan agar
pendidik dapat memantau proses, kemajuan dan perbaikan terhadap sistem
pembelajaran yang diterapkan. Pendidik dapat melakukan kegiatan evaluasi selama
proses pembelajaran atau akhir pembelajaran sebagai laporan kemajuan hasil
belajarnya.
Pelaksanaan kegiatan evaluasi dapat dilakukan menggunakan suatu teknik
penilaianyang memberikan hasil secara objektif mengenai kemampuan yang telah
dicapai oleh peserta didik. Maka perlu pemakaian suatu alat yang mampu mengukur
kompetensi peserta didiksecara tepat dan dapat dipertanggungjawabkan hasilnya. Salah
satu teknik yangdigunakan oleh pendidik dapat berupa tes atau non tes (Wahyuningsih,
2015:2; Novytasari, 2014; Purwanto, 2011:56). Teknik evaluasi yang sering digunakan
adalah tes (Novytasari, 2014:1). Tes merupakan alat yang digunakan sebagai sarana
untuk menentukan nilai. Tes digunakan sebagai alat pengukur keberhasilan belajar
peserta didik yang terdiri atas kumpulan soal-soal atau item tes. Selain itu tes juga
berfungsi menilai hasil belajar peserta didik khususnya berkaitan dengan penguasaan
materi yang sesuai (Yuslita dkk, 2016:132; Wahyudi, 2011:1, Sudijono, 2011:367).
Banyak tes dalam bentuk soal digunakan untuk mengukur ketercapaian hasil belajar
peserta didik. Tes bentuk soal terdiri atas dua jenis yaitu soal pilihan ganda dan soal
uraian. Namun,banyaknya materi yang harus dievaluasi pendidik cenderung lebih sering
4
menggunakan soal pilihan ganda. Tujuannya agar dapat mengukur ketercapaian hasil
belajardari materi yang banyak. Tes ini disukai karena relatif mudah dalam persiapan
dan penyususnannnya (Toksoz & Ertunc, 2017: 142; Ozturk, 2007). Tes yang menjadi
alat evaluasi perlu dilakukan validitas soal, reliabilitas soal, tingkat kesukaran, daya
pembedanya serta fungsi pengecohnya bagi soal bentuk pilihan ganda. Hal ini sangat
penting dilakukan agar tes sebagai alat evaluasi dapat sesuai dengan tujuan yang hendak
dicapai dan diketahui kualitasnya (Yuslita dkk, 2016:132; Diastuti, 2015:2; Yuniarti,
2013:2;Novianto, 2012;Wahyudi, 2011:2; ). Berdasarkan beberapa pendapat tersebut
dapat ditarik kesimpulan bahwa tes sebagai alat ukur bertujuan untuk mengukur sejauh
mana tingkat keberhasilan belajar peserta didik. Tes yang sering digunakan oleh
pendidik adalah tes bentuk pilihan ganda yang memiliki keunggulan lebih mudah dalam
segi persiapan dan peyusunannya. Perlunya penilaian kualitas tes sebagai alat ukur agar
tes yang dihasilkan dapat sesuai dengan tujuan dan harapan.
Permasalahan dalam pelaksanaan penilaian hasil belajar disekolah menurut
Kunandar (2014:62-65) diantaranya, (1) materi yang diujikan kurang esensial artinya
instrumen yang disusun belum mengukur materi pokok dari kompetensi yang harus
dikuasai. Sehingga instrumen penilaian belum mampu mengukur kemampuan berpikir
tinggi, analisis dan pemecahan masalah, (2) penyusunan soal belum sepenuhnya
mengacu pada kisi-kisi soal bahkan terdapat pendidik yang membuat soal tanpa
menyusun kisi-kisi terlebih dahulu, (3) belum semua pendidik menggunakan pedoman
penskoran yang telah disusun khususnya pedoman penskoran soal bentuk uraian, (4)
belum semua pendidik menyusun pengecoh dan kunci jawaban yang tepat pada bentuk
soal pilihan ganda, (5) nilai yang diberikan oleh pendidik satu dengan yang lainnya
tidak dapat dibandingkan. Hal ini terjadi karena instrumen penilaian yang digunakan
belum terstandar (Valid dan Reliabel), (6) hasil penilaian yang dilakukan belum
sepenuhnya menggambarkan pencapaian kompetensi sebenarnya dari peserta didik,
artinya meskipun peserta didik dinyatakan menguasai dari hasil tes namun sebenarnya
belum menguasi terkait materi yang sama jika pada ujian selanjutnya mengalami
kesulitan, (7) mutu dari instrumen atau soal yang dihasilkan belum valid dan reliabel,
karena penyusunan yang tidak sesuai, kurang teliti, terburu-buru, bahan yang kurang
5
relevan dengan tuntutan dan (8) tes yang sudah disusun belum melalui tahap ujicoba.
Instrumen atau soal yang digunakan sebagai alat ukur hasil belajar peserta didik
idealnya dirancang dengan seksama, disusun berdasarkan kaidah penulisan soal,
diujicobakan dan dilakukan analisis kualitas soal. Agar dapat menghindari permasalah
tersebut pendidik perlu mempehatikan beberapa hal diantaranya, (1) materi yang
diujikan harus esensial artinya instrumen yang disusun harus dapat mengukur pokok
subtansi dari kompetensi yang dikuasai, (2) membuat kisi-kisi soal terlebih dahulu, (3)
menyusun pedoman penskoran dan menerapkannya agar menghindari hasil penilaian
yang bias pada soal uraian, (4) menyusun soal dan pengecoh kunci jawaban yang tepat,
(5) memperhatikan mutu instrumen atau soal yang yang akan disusun agar sesuai
dengan kriteria soal yang baik dan kaidah penyusunan soal, (6) melakukan ujicoba soal
dan menganalisisnya agar diketahui kualitas dari tiap soal yang disusun. Harapannya
pendidik akan menghasilkan soal yang berkualitas dan dapat mengukur hasil belajar
peserta didik dengan baik agar sesuai dengan tujuan pembelajaran yang ingin dicapai.
Permasalahan terkait tes saat ini adalah kumpulan soal yang dijadikan alat
evaluasi belum dilakukan kegiatan analisis mendalam sehingga kualitas soal masih
belum diketahui secara jelas. Isu penting ini dapat mempengaruhi kualitas peserta didik.
Pada jurnal penelitian oleh Jandaghi & Shaterian (2018) dengan judul Validity,
Reliability and Difficulty Indies for Instructor-Built Exam Question menyatakan bahwa
salah satu isu penting dalam mengajar apapun dan sistem pembelajaran adalah kualitas
peserta didik. Harus ada standar untuk soal ujian sehingga dapat memiliki tingkat
kualitas yang tinggi dari standar kelulusan yang diharapkan. Soal-soal ujian memainkan
peran penting dalam prestasi peserta didik. Tingkat kesulitan, daya pembeda, validitas
dan reliabilitas soal ujian harus dipastikan agar memiliki output yang baik.
Soal yang sudah disusun seharusnya diujicobakan terlebih dahulu. Hal ini
dimaksudkan untuk mengetahui kualitas soal sehinggamampu mengukur kemampuan
peserta didik. Apabila soal yang dibuat olehpedidik tidak diketahui kualitasnya, maka
akan berdampak pada nilai atauhasil akhir ulangan peserta didik (Isnaini, 2017;
Wahyuningsih, 2015; Kunandar, 2014). Kualitas soal dapat ditentukan dengan
6
mengetahui karakteristik soal yang baik. Soal yang baik harus memiliki syarat validitas,
reliabilitas, tingkat kesukaran, dan daya pembeda soal serta efektifitas pengecoh bagi
soal bentuk pilihan ganda (Wahyuningsih, 2015; Arikunto, 2013:222).Upaya
pemerintah mengatasi isu ini adalah dengan melakukan revisi pada kurikulum 2013
untuk memaksimalkan mutu pendidikan, menerbitkan buku pedoman penyusunan soal
yang baik, penyusunan soal tipe HOTs (Higher Order Thinking Skill) dan menerbitkan
buku panduan penilaian hasil belajar baik untuk sekolah dasar maupun menengah.
Namun belum semua pendidik melakukan penilaian sesuai dengan harapan pemerintah
tersebut. Berdasarkan pernyataan-pernyataan di atas menegaskan bahwa realita
kebanyakan dilapangan tes yang dijadikan sebagai alat evaluasi pembelajaran belum
dilakukan analisis secara mendalam. Kegiatan analisis sangat penting dilakukan oleh
pendidik agar soal tes yang akan diberikan kepada peserta didik memiliki kualitas yang
baik dan sesuai dengan tujuan pengukuran yang dilakukan pendidik.
Berdasarkan hasil observasi yang dilakukan pada 22 Januari 2018 di SMA
Negeri 1 Jemberpendidik belum melakukan analisis butir soal terhadap soal formatif
yang diberikan kepada peserta didik secara mendalam. Hal ini terjadi karena
keterbatasan waktu pendidik yang tidak memungkinkan melakukan analisis
mendalam.Selama ini pedidik mengetahui baik atau tidaknya suatu soal berdasarkan
tuntas tidaknya peserta didik dari tes yang diberikan dan tingkat kesukaran soal yang
dilihat dari kata kerja operasional soal yang disusun. Hal ini tentunya akan
menyebabkan perangkat tes belum diketahui kualitasnya sebagai alat evaluasi dari segi
validitas, reliabilitas, tingkat kesukaran, dan daya pembeda. Soal yang berkualitas dan
baik sebagai alat ukur dapat diketahui dengan melakukan analisis butir soal sehingga
dapat diketahui butir soal mana yang harus direvisi dan yang harus dihilangkan.
Kualitas soal akan membantu pendidik untuk mendapatkan hasil evaluasi yang sesuai.
Hasil evaluasi akan memberikan informasi mengenai umpan balik peserta didik
terhadap pembelajaran, kemajuan belajar peserta didik dan progam pembelajaran, serta
tindakan yang harus dilakukan selanjutnya.
Rekomendasi dari penelitian-penelitian yang relevan untuk mengatasi
permasalahan diatas perlu dilakukan analisis butir soal sebagai alat evaluasi
7
pembelajaran. Penelitian yang dilakukan oleh Lydia I. Eleje& Nkechi P.M. Esomonu
(2018)dengan judul “Test of Achievement in Quantitative Economics for Secondary
Schools: Construction and Validation Using Item Response Theory” yang menyatakan
bahwa untuk mengukur kualitas tes prestasi mata pelajaran ekonomi pada peserta didik
sekolah menengah dapat dilakukan dengan uji validasi. Tes terdiri atas 20 item bentuk
pilihan ganda. Hasil penelitian menunjukkan bahwa tes memiliki kualitas baik, valid
dan sangat reliabel. Tes dapat digunakan sebagai alat ukur pencapaian hasil belajar
ekonomi di Nigeria dan negara lain. Selain itu penelitian yang dilakukan oleh Sibel
Toksoz & Ayse Ertunc (2017) dengan judul “Item Analysis of a Multiple-Choice
Exam”. Penelitian ini menyatakan bahwa item tes pilihan ganda yang sering digunakan
sebagai alat ukur disemua jenjang pembelajaran di Turki belum dilakukan analisis item
yang cukup dalam segi tingkat kesukaran, daya pembeda dan efisiensi pengecohnya.
Setelah dilakukan analisis hasil penelitian menunjukkan bahwa tingkat kesukaran
sedang, daya pembeda rendah, dan tidak efektif distraktor serta soal yang dibuat perlu
dilakukan revisi. Berdasarkan dua penelitian ini menunjukkan bahwa pentingnya
dilakukan analisis kualitas soal agar diketahui mana saja soal yang layak digunakan dan
mana yang harus di perbaiki atau dibuang sebagai alat ukur pembelajaran yang
dijalankan.
Rekomendasi penelitian dari dalam negeri seperti penelitian yang dilakukan oleh
Ahmad Isnaeni (2017) dengan judul “Analisis Kualitas Butir Soal Ujian Akhir Semester
Genap Mata Pelajaran Ekonomi Kelas XI SMA Islam Sudirman Purworejo Tahun
Pelajaran 2016/2017”.Hasil penelitian menunjukkan bahwa kualitas tes termasuk
kategogori butir soal yang sangat kurang. Keseluruhan soal Ujian Akhir Semester Mata
Pelajaran Ekonomi kelas XI semester genap SMA Islam Sudirman Purworejo tahun
pelajaran 2016/2017 termasuk soal Kurang Baik. Selanjutnya penelitian yang dilakukan
oleh Utami (2016) dengan judul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir
Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran PKn Kelas IV SD di
Kecamatan Depok, Sleman, Yogyakarta”. Hasil penelitian menyatakan Validitas butir
soal dinyatakan valid, Reliabilitas butir soal dinyatakan tinggi atau reliable, Daya beda
butir soal pilihan ganda UAS dinyatakan baik, Tingkat kesukaran butir soal dinyatakan
8
baik, dan keberfungsian pengecoh berfungsi dengan baik. Selanjutnya penelitian oleh
Diastuti (2015) dengan judul “Analisis Butir Soal Ujian Akhir Semester Gasal Mata
Pelajaran Pengantar Akuntansi dan Keuangan Kelas X Akuntansi Smk Negeri 1 Klaten
Tahun Ajaran 2014/2015” menyatakan bahwa kualitas soal ujian akhir semester gasal
pada mata pelajaran pengantar akuntansi dan keuangan kelas X Akuntansi SMK Negeri
1 Klaten tahun ajaran 2014/2015 tergolong bagus.
Permasalahan terkait kualitas soal juga terjadi pada mata pelajaran sejarah.
Pentingnya dilakukan penelitian ini untuk memperbaiki kualitas pembelajaran sejarah
disekolah dilihat dari segi hasil belajar peserta didik. Perbedaan penelitian yang akan
dilakukan dengan penelitian terdahulu terletak pada soal yang akan dianalisis. Pada
penelitian ini dilakukan pada soal formatif karena di Kelas X SMA Negeri 1 Jember
sistem belajarnya berbasis UKBM (Unit Kegiatan Belajar Mandiri). Pada program ini
tidak terdapat kegiatan UTS dan UAS berbeda dengan kelas XI dan XII yang masih
menggunakan sistem lama. Karena hal tersebut ujian formatif sangat berpengaruh pada
hasil belajar peserta didik dan menentukan peserta didik untuk dapat lanjut pada materi
selajutnya bahkan kenaikan kelas. Selain itu, peneliti mencari penelitian terkait analisis
soal mata pelajaran sejarah masih sulit ditemukan. Kebanyakan analisis dilakukan pada
bidang pelajaran IPA dan pada bidang pelajaran sosial ditemukan di mata pelajaran
ekonomi dan akuntansi. Karena berbagai permasalahan dan jarangnya penelitian analisis
soal pada mata pelajaran sejarah maka perlu dilakukan penelitian ini. Berdasarkan
pemaparan pendapat ahli, realita dan hasil pengamatan maka akan dilakukan penelitian
dengan judul “Analisis Kualitas Soal Formatif Semester Genap Mata Pelajaran
Sejarah Kelas X IPS SMAN 1 Jember Tahun Ajaran 2017/2018”.
1.2 Rumusan Masalah
Berdasarkan latar belakang diatas maka dapat dirumuskan masalahnya adalah
Bagaimanakah Kualitas Soal Formatif Semester Genap Mata Pelajaran Sejarah Kelas X
di SMAN 1 Jember Tahun Ajaran 2017/2018?
9
Spesifikasi Rumusan masalah dapat dipaparkan sebagai berikut:
1. Bagaimanakah validitas soal formatif semester genap mata pelajaran sejarah
kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
2. Bagaimanakah reliabilitas soal formatif semester genap mata pelajaran sejarah
kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
3. Bagaimanakah tingkat kesukaran soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
4. Bagaimanakah daya pembeda soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
5. Bagaimanakah efektivitas pengecoh soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah diatas maka dapat dipaparkan tujuannya adalah
untuk menganalisiskualitas soal formatif semester genap mata pelajaran sejarah kelas X
IPS SMAN 1 Jember tahun ajaran 2017/2018.
Spesifikasi tujuan penelitian dapat dijabarkan sebagai berikut:
1. Menganalisishasil uji validitas soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018;
2. Menganalisis hasil uji reliabilitas soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018;
3. Menganalisishasil uji tingkat kesukaran soal formatif semester genap mata
pelajaran sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018;
4. Menganalisishasil uji daya pembeda soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018;
5. Menganalisis efektivitas pengecoh soal formatif semester genap mata pelajaran
sejarah kelas X IPS SMAN 1 Jember tahun ajaran 2017/2018?
10
1.4 Manfaat Penelitian
Setelah disebutkan tujuan dalam melakukan penelitian ini maka selanjutnya
diharapkan penelitian ini dapat bermanfaat sebagai berikut:
1. bagi peneliti
a. penelitian ini dapat menambah wawasan dan pengetahuan mengenai
evaluasi pembelajaran dengan tes yang berkualitas;
b. menambah keterampilan dalam penerapan analisis item tes mata pelajaran
sejarah yang dapat berguna pada saat terjun dalam dunia kerja nantinya.
2. bagi pendidik
a. hasil penelitian ini dapat dijadikan bahan informasi bagi pendidik mengenai
analisis kualitas butir soal sebagai alat evaluasi disekolah;
b. hasil penelitianini dapat dijadikan sebagai masukan bagi para pendidik
terutama pendidik mata pelajaran sejarah di SMA Negeri 1 Jember dalam
rangka menganalisis kualitas soal mata pelajaran sejarah;
c. hasil penelitianini dapat dijadikan sebagai bahan pertimbangan dalam
pembuatan soal yang akan datang, menyempurnakan kualitas soal menjadi
lebih valid, dan sebagai referensi dalam memilihsoal-soal yang berkualitas.
3. bagi sekolah
hasil penelitian dapat dijadikan sebagai informasi untuk penyempurnaan
pembuatan soal-soal ujian yang leih baik dan berkualitas.
4. bagi Almamater
dapat dijadikan tambahan referensi, kepustakaan dan pengembangan penelitian
yang sejenis.
11
BAB 2. TINJAUAN PUSTAKA
2.1 Pengertian Evaluasi Pedidikan dan Penilaian Hasil Belajar
Teori yang melandasi evaluasi menurut Shorck & Coscarelli (1989) adalah (1)
teori landasan penilaian taksonomi pembelajaran dari Benjamin S. Bloom yang
digunakan hampir setengah abad sebagai dasar untuk penyusunan tujuan pendidikan,
penyusunan tes, dan kurikulum diseluruh dunia, (2) teori kemampuan belajar dari
Gagne yang mengemukakan bahwa keterampilan yang dapat diamati sebagai hasil
belajar disebut kapabilitas (kemampuan yang dimiliki manusia karena belajar), dan (3)
teori kognitif Cangelosi (1990) yang menyatakan penilaian adalah proses pengumpulan
data melalui pengamatan empiris. Proses ini dilakukan untuk menilai apa yang
diperoleh peserta didik setelah mengikuti pembelajaran selama waktu tertentu. Evaluasi
diartikan sebagai penilaian sistematik tentang manfaat suatu objek, proses untuk
menentukan nilai sesuatu, proses penggambaran dan penyajian informasi yang berguna,
proses pengumpulan data terkait ketercapaian pendidikan, dan proses dimana
pertimbangan atau keputusan suatau nilai dari evaluator (Majid, 2014:32; Wandt &
Brown, 1977; Sudijono, 2011; Stufflebeam, 1971; Daryanto, 2008, Taylor, 1950;
Lincoln & Guba, 1985:35; Sax, 1980:18). Evaluasi adalah suatu kegiatan yang
dilakukan guna mengukur suatu hal dengan ukuran tertentu dan bersifat kuantitatif
kemudian dilanjutkan dengan kegiatan pengambilan keputusan baik buruknya terhadap
sesuatu yang bersifat kualitatif(Arikunto, 2012). Menurut Subali evaluasi adalah suatu
proses yang dilakukan secara sistematis untuk mengetahui tingkat keberhasilan dan
efisiensi dari program yang dijalankan (Subali, 2014:1). Menurut Samid Hasan
(2009:33) evaluasi adalah proses pengumpulan informasi guna pengambilan suatu
keputusan (Hasan, 2009:33; Werdiningsih, 2015:8). Menurut Sudijono evaluasi adalah
penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan (Sudijono,
2009; Wahyudi, 2011:12). Evaluasi juga diartikan sebagai identifikasi untuk melihat
suatu program yang telah direncakan sudah tercapai atau belum, berharga atau tidak,
dan melihat tingkat efisiensi pelaksanaannya (Pramana, 2013:2). Pendapat lainnya
12
evaluasi pendidikan adalah penilaian terhadap kinerja pendidikan yang telah
berjalan guna memperoleh informasi yang nantinya akan digunakan untuk memperbaiki
hal-hal yang memang perlu diperbaiki pada kinerja pendidikan (Ratnawulan &
Rusdiana, 2014:14). Menurut Stufflebeam & Shinkfield (1985:159) menyatakan bahwa
evaluasi merupakan proses penyediaan informasi yang dapat dijadikan bahan
pertimbangan dalam pengambilan keputusan. Sedangkan Brikerhoff (1986:ix)
menyatakan bahwa evaluasi adalah proses penentuan sejauh mana tujuan pendidikan
dapat dicapai. Berdasarkan beberapa pendapat tersebut dapat disimpulkan bahwa
evaluasi adalah suatu proses kegiatan penilaian yang bersifat kuantitatif, dilakukan
secara sistematis dan berkelanjutan untuk mengumpulkan, mendeskripsikan,
menginterpretasikan, menyajikan informasi terkait keberhasilan suatu program,
pengambilan keputusan kebijakan selanjutnya atau memperbaiki hal-hal yang perlu
diperbaiki terkait pendidikan. Tujuan evaluasi adalah menentukan kualitas sesuatu
khususnya yang berkaitan dengan nilai dan arti (Arifin, 2012:9). Sedangkan menurut
Sudijono 2009 (dalam Utami, 2016) tujuan evaluasi pendidikan adalah untuk mengukur
kemajuan, menunjang penyusunan rencana, dan memperbaiki kembali (Sudijono,
2006:9; Utami, 2016:13). Kesimpulannya kegiatan evaluasi tidak hanya mengukur
sejauh mana tujuan pendidikan dapat tercapai tetapi juga dapat digunakan untuk
pengambilan keputusan dan perbaikan dalam program pendidikan yang dijalankan.
2.2.1 Penilaian Hasil Belajar
Penilaian hasil belajar merupakan penilaian hasil belajar peserta didik dari
proses pembelajaran untuk melihat sejauh mana hasil belajar dan proses belajar dapat
dinilai baik (Jihad dan Haris, 2012:15; Novytasari, 2014:11). Penilaian hasil belajar
sangat penting dan strategis dalam kegiatan pembelajaran. Melalui penilaian hasil
belajar maka dapat diketahui seberapa jauh keberhasilan peserta didik dalam menguasai
kompetensi atau materi yang telah disampaikan oleh pendidik (Kunandar, 2014:61).
Menurut Sukidin (2012:2) penilaian hasil belajar adalah penerapan berbagaicara dan
penggunaan beragam alat penilaian untuk memperoleh informasi tentangsejauh mana
hasil belajar peserta didik atau ketercapaian kompetensi (rangkaiankemampuan) peserta
13
didik. Penilaian menjawab pertanyaan tentang sebaik apa hasilatau prestasi belajar
seorang peserta didik. Penilaian dapat berupa nilai kualitatif(pernyataan naratif dalam
kata-kata ) dan nilai kuantitatif (berupa angka). Pendapat ini didukung oleh Kunandar
(2013:65) yang menyatakan bahwa penilaian hasil belajar sebagai kegiatan pendidik
dalam pengambilan keputusan tentang pencapaian kompetensi atau hasil belajar peserta
didik yang mengikuti proses pembelajaran. Penilaian ini sebagai bentuk cara yang
digunakan untuk menilai hasil kerja individu/kelompok, menentukan hasil belajar
melalui kriteria tertentu, mengetahui ketercapain tujuan pembelajaran, cara formal
dalam menentukan status peserta didik dalam kepentingan pendidikan (Griffin & Nix,
1991; Widoyoko, 2009:29; Jihad & Haris, 2008; Phopan, 1995; Grounlund, 1982;
Arifin, 2009:4). Evaluasi hasil belajar memiliki tujuan akanmemberikan pedoman
kepada peserta didik untuk mengenalkapasitas dan status dirinya masing-masing di
tengah-tengah kelompokatau kelasnya. Bagi pendidik akan memberikan kepastian
tentang sejauh manakah kiranya usahayang telah dilakukannya selama ini telah
membawa hasil. Kemudian pendidik memiliki pedoman yang pasti berguna untuk
menentukan langkah-langkah apa saja yang dipandang perlu dilakukanselanjutnya
(Wahyudi, 2011:12). Kesimpulannya evaluasi hasil belajar merupakan kegiatan
penilaian terhadap proses pembelajaran dengan tujuan mengukur sejauh mana
ketercapaian tujuan dan hasil belajar peserta didik.
Penilaian hasil belajar harus dilakukan dengan baik oleh seorang pendidik. Agar
dapat tercapai pendidik harus harus menentukan instrumen, penyusunan instrumen,
telaah instrumen, pelaksanaan penilaian, analisis hasil penilaian dan program tindak
lanjut hasil penilaian (Kunandar, 2013:61). Lebih lanjut menurut Kunandar (2014:
penilaian hasil belajar yang baik akan berguna untuk memberikan informasi tentang
kualitas proses pembelajaran dan sebaliknya apabila terjadi kesalahan dalam kegiatan
penilaian hasil belajar maka akan berdampak pada kualitas proses pembelajaran yang
kurang baik dan tujuan pendidikan yang sesungguhnya tidak tercapai.
14
2.1.2 Prinsip Penilaian Hasil Belajar
Prinsip adalah sesuatu yang harus dijadikan pedoman. Prinsip evaluasi penilaian
hasil belajar di kelas merupakan patokan atau pedoman yang digunakan pendidik dalam
melakukan penilaian hasil belajar. Berdasarkan pendapat Arifin (2012: 53) kegiartan
penilaian hasil belajar perlu memperhatikan prinsip-prinsip evaluasi yaitu (1) Penilaian
hendaknya dirancang sedemikian rupa, sehingga jelas abilitas yang harus dinilai, materi
yang akan dinilai, alat penilaian dan interpretasi hasil penilaian, (2) Penilaian harus
menjadi bagian integral dalam proses pembelajaran, (3) Penilaian harus menggunakan
berbagai alat (instrumen), baik yang berbentuk tes maupun non-tes. (4) Pemilihan alat
penilaian harus sesuai dengan kompetensi yang ditetapkan, (5) Alat penilaian harus
mendorong kemampuan penalaran dan kreatifitas peserta didik. (5) Objek penilaian
harus mencakup aspek pengetahuan, keterampilan, sikap dan nilai-nilai, (6) Penilaian
harus mengacu kepada prinsip diferensiasi, yaitu memberikan peluang kepada peserta
didik untuk menunjukkan apa yang diketahui, apa yang dipahami dan apa yang dapat
dilakukan, (7) Penilaian tidak bersifat diskriminatif. Artinya, pendidik harus bersikap
adil dan jujur kepada semua peserta didik, serta bertanggung jawab kepada semua
pihak, (8) Penilaian harus diikuti dengan tindak lanjut, dan (9) Penilaian harus
berorientasi kepada kecakapan hidup dan bersifat mendidik.
Sistem penilaian dalam pembelajaran baik penilaian berkelanjutan maupun
penilaian akhir perlu dikembangkan berdasarkan prinsip menyeluruh, berkelanjutan,
berorientasi pada indikator ketercapaian dan sesuai dengan pengelaman belajar (Jihad &
Haris, 2012). Lebih jelasnya (1) Menyuluruh maksudnya adalah penguasaan kompetensi
dalam mata pelajaran yang menyeluruh baik standar kompetensi, kemampuan dasar
serta keseluruhan indikator ketercapaian, (2) berkelanjutan maksudnya direncanakan
terus menerus untuk mendapatkan gambaran yang utuh mengenai perkembangan hasil
belajar peserta didik sebagai dampak langsung maupun tidak langsung dari proses
pembelajaran, (3) berorientasi pada indikator ketercapaian artinya sistem penilaian
harus mengacu pada indikator ketercapaian yang sudah ditetapkan berdasarkan
kemampuan dasar/kemmapuan minimal dan standar kompetensinya, dan (4) sesuai
15
dengan pengalaman belajar artinya sistem penilaian dalam pembelajaran harus
disesuaikan dengan pengalaman belajarnya. Selanjutnya prinsip menurut Majid
(2014:43) terdiri atas (1) validitas artinya menilai apa yang seharusnya diukur dengan
menggunakan alat yang sesuai, (2) reliabilitas yang berkaitan dengan konsistensi hasil
penilaian, (3) menyeluruh artinya penilaian mencakup seluruh domain pada setiap
kompetensi dasar, (4) berkesinambungan artinya penilaian harus dilakukan terus
menerus, (5) objektif artinya penilaian harus dilaksanakan secara adil, terencana dan
menetapkan kriteria yang jelas, dan (6) mendidik artinya penilaian yang dilakukan dapat
dijadikan dasar motivasi, memperbaiki proses pembelajaran, meningkatkan kualitas
belajar dan membina peserta didik agar tumbuh dan berkembang secara optimal.
Berdasarkan prinsip-prinsip yang telah dijelaskan dapat ditarik kesimpulan bahwa
dalam melaksanakan kegiatan evaluasi atau penilaian pendidik hendaknya
memperhatikan pedoman dalam penyusunan alat evalausi yang tepat dan berorientasi
pada ketercapaian tujuan pembelajaran yang diharapkan.
2.1.3 Tujuan dan Fungsi Penilaian Hasil Belajar
Penilaian hasil belajar memegang peranan penting dalam proses pembelajaran.
Secara umum, penilaian sebagai suatu tindakan atau proses setidaknya mempunyai 3
fungsi pokok yaitu mengukur kemajuan, menunjang penyusunan rencana, dan
memperbaiki atau melakukan penyempurnaan kembali (Ratnawulan & Rusdiana, 2014:
15; Wahyudi, 2011:12). Tujuan penilian yaitu untuk merangsang kegiatan peserta didik
dalam menempuh program pendidikan dan untuk mencari faktor-faktor penyebab
keberhasilan dan kegagalan peserta didik dalam mengikuti program pendidikan,
sehingga dapat dicari dan ditemukan cara-cara untuk dapat memperbaikinya (Sudijono,
2009:7-17; Wahyudi, 2011:13-14). pendapat tersebut diperkuat oleh Sukardi (2008:9)
yang menyatakan bahwa tujuan evaluasi adalah (1) menilai ketercapaian hasil belajar,
(2) mengukur macam-macam aspek belajar yang bervariasi, (3) sarana untuk
mengetahui ketercapaian peserta didik terhadap materi yang telah diajarkan, (4)
memotivasi belajar peserta didik, (5) menyediakan sarana bimbingan terhadap peserta
16
didik yang belum tuntas dalam kegiatan pembelajaran, dan (6) menjadikan hasil
evaluasi sebagai dasar perubahan kurikulum. Berdasarkan beberapa pendapat diatas
dapat disimpulkan bahwa evaluasi memiliki tujuan yang bervariasi namun point
penting dari tujuan evaluasi adalah menilai hasil belajar peserta didik dari proses
pembelajaran yang dijalankan agar diketahui sejauh mana tujuan pembelajaran telah
tercapai dan mengambil tindakan selanjutnya terhadap pembelajaran yang dijalankan
baik perbaikan materi maupun tes yang digunakan sebagai alat ukur hasil belajar.
Secara khusus fungsi penilaian hasil belajar dapat dibagi menjadi tiga yakni
memberikan pedoman peserta didik untuk mengenal kapasitas dan status dirinya
masing-masing termasuk peserta tes kelompok tinggi, kelompok sedang, ataukah
termasuk dalam kelompok rendah ditengah-tengah kelasnya. Menurut (Jihad dan Haris,
2012: 55–56) penilaian hasil belajar bagi pendidik dapat memberikan kepastian
mengenai sejauh mana tujuan pembelajarannya tercapai dan memiliki pedoman pasti
untuk menentukan langkah-langkah selanjutnya. Sementara itu, peni;aian hasil belajar
bagi pendidik memiliki beberapa fungsi, yakni (1) fungsi diagnostik artinya memeriksa
peserta didik yang mengalami kesulitan dalam mengikuti proses pembelajaran dan
selanjutnya dapat dicari jalan keluar dan cara pemecahannya, (2) penempatan artinya
untuk dapat menentukan secara pasti pada kelompok manakah peserta didik harusnya
ditempatkan, (3) selektif artinya menyeleksi peserta didik dinyatakan lulus/tidak, naik
kelas/tidak, atau dapat diterima dijurusan tertentu atau tidak, (4) bimbingan artinya
memberikan pedoman dalam mencari dan menemukan jalan keluar bagi pembelajar
mengenai kendala yang dihadapi, dan (5) instruksional artinya memberikan petunjuk
sejauh manakah program pengajaran yang telah ditentukan telah dapat dicapai
berdasarkan tujuan insruksional khusus yang telah ditentukan.
Adapun secara administratif evaluasi pendidikan memiliki tiga fungsi, yakni
memberikan laporan, memberikan bahan-bahan keterangan/data, dan memberikan
gambaran. (1) Memberikan laporan maksudnya evaluasi dapat disusun dan disajikan
sebagai laporan mengenai kemajuan dan perkembangan pembelajar setelah mengikuti
proses pembelajaran dalam jangka waktu tertentu, (2) Memberikan bahan-bahan
keterangan/data artinya nilai hasil belajar peserta didik yang diperoleh dari kegiatan
17
evaluasi merupakan data yang penting dan akurat untuk keperluan pengambilan
keputusan pendidikan misalnya apakah peserta didik dapat dinyatakan tamat
belajar/naik kelas/tinggal kelas, dan sebagainya, (3) Memberikan gambaran artinya hasil
belajar peserta didik yang didapat kemudian menjadi gambaran mengenai kemampuan
pembelajar, seberapa jauh mereka menguasai materi yang telah diajarkan.
Fungsi diatas dapat digunakan sebagai acuan untuk memperbaiki kegiatan-
kegiatan proses pembelajaran, acuan untuk menentukan kenaikan kelas dan kelulusan,
alat untuk menyeleksi, alat untuk penempatan, dan alat untuk memperbaiki motivasi
belajar pembelajar. Menurut (Ratnawulan & Rusdiana, 2014: 42-43) kegunaan yang
akan diperoleh dari kegiatan evaluasi pembelajaran antara lain:
(1) Terbentuknya kemungkinan untuk dapat dihimpunnya informasi, baik yang
bersifat kuantitatif, maupun kualitatif tentang hasil atau kemajuan pembelajaran
yang telah dicapai, dalam rangka pencapaian program pembelajaran pada
khususnya, dan program pendidikan pada umumnya.
(2) Terbuatnya kemungkinan untuk dapat diketahuinya relevansi antara program
pembelajaran dengan program pendidikan secara umum yang telah dirumuskan,
disatu pihak dengan tujuan yang hendak dicapai di pihak lain.
(3) Terbuatnya kemungkinan untuk dapat dilakukan usaha-usaha perbaikan,
penyesuaian dan penyempurnaan-penyempurnaanprogram pembelajaran yang
dipandang perlu dan lebih berdaya guna, sehingga tujuan yang diinginkan atau
cita-cita akan dapat di capai dengan sebaik- baiknya.
Tujuan dari penilaian hasil belajar menurut Arifin (2012) dapat dijabarkan
sebagai berikut:
1. Untuk mengetahui tingkat penguasaan peserta didik terhadap materi yang
telah diberikan
2. Untuk mengetahui kecakapan, motivasi, bakat, minat, dan sikap peserta
didik terhadap program program pembelajaran
3. Untuk mengetahui tingkat kemajuan, kesesuaian, hasil belajar peserta didik
dengan standar kompetensi dan kompetensi dasar yang diterapkan
18
4. Untuk mengidentifikasi keunggulan dan kelemahan peserta didik dalam
mengikuti kegiatan pembelajaran
5. Untuk menyeleksi peserta didik agar dapat ditentukan jenjang pendidikannya
6. Untuk menentukan kenaikan kelas
7. Untuk menenpatkan potensi yang dimilikinya.
Berdasarkan pemaparan tujuan penilaian hasil belajar diatas dapat disimpulkan
yaitu (1) bertujuan mengetahui sejauh mana peserta didik menguasai pengetahuan.
Nilai-nilai dan keterampilan yang telah diajarkan oleh pendidik, (2) mengetahui aspek
kelemahan dari peserta didik dalam kegiatan pembelajaran, (3) mengetahui ketercapaian
peserta didik dalam kegiatan pembelajaran, (4) saran umpan balik peserta didik terhadap
materi yang diajarkan pendidik, (5) alat ukur perkembangan peserta didik, (6) bahan
laporan pendidik terkait hasil belajar peserta didik kepada orang tua, dan (7) sebagai
bahan pertimbangan perbaikan yang lebih baik dalam kegiatan pembelajaran
selanjutnya.
Penilaian hasil belajar sangat penting dilakukan dalam dunia pendidikan,
khususnya di sekolah baik bagi peserta didik, pendidik maupun sekolah (Widoyoko,
2016:10; Isnaini, 2017:12-13). Manfaat yang akan diperoleh dari kegiatan penilaian
hasil pembelajaran dapat dipaparkan sebagai berikut:
a. Manfaat Penilaian bagi Guru
Terdapat beberapa manfaat yang akan diperoleh bagi guru dari hasil
evaluasi penilain pembelajaran, antara lain: pendidik akan memperoleh data
tentang kemajuan belajar peserta didik, pendidik akan mengetahui apakah materi
yang diajarkannya sudah sesuai atau tidak dengan kemampuan peserta didik,
sehingga dapat dijadikan pertimbangan untuk menentukan materi pelajaran
selanjutnya, pendidik akan dapat mengetahui apakah metode mengajar yang
digunakannya sudah sesuai atau tidak dan hasil penilaian dapat dimanfaatkan
untuk merlaporkan kemajuan belajar peserta didik kepada orang tua.
b. Manfaat Penilaian bagi peserta didik
Setelah peserta didik mengikuti evaluasi dan penilaian hasil belajar,
paling tidak akan memperoleh manfaat yaitu: hasil penilaian dapat menjadi
19
pendorong peserta didik agar belajar lebih giat, hasil penilaian dapat
dimanfaatkan untuk mengetahui kemajuan belajarnya dan hasil penilaian
merupakan data tentang apakah cara belajar yang dilaksanakannya sudah tepat
atau belum.
c. Manfaat Penilaian bagi Lembaga/Sekolah
Hasil penilaian belajar menurut Ratnawulan & Rusdiana (2014: 42-43)
paling tidak sekolah akan memperoleh manfaat, antara lain: hasil penilaian dapat
dimanfaatkan sekolah untuk mengetahui apakah kondisi belajar mengajar yang
dilaksanakan sekolah sudah sesuai dengan harapan atau belum., hasil penilaian
merupakan data yang dapat dimanfaatkan sekolah untuk merencanakan
pengembangan sekolah pada masa yang akan datang dan hasil penilaian
merupakan bahan untuk menetapkan kebijakan dalam upaya meningkatkan
kualitas sekolah.
Berdasarkan pendapat diatas dapat disimpulkan bahwa fungsi evaluasi dalam
pendidikan dan pembelajaran adalah megetahui perkembangan peserta didik dan tingkat
keberhasilan belajar peserta didik, mengetahui kesulitan belajar peserta didik, menjadi
pedoman pendidik untuk melihat ketercapaian program pemelajaran yang direncanakan,
memberikan pandangan dan pertimbangan dalam mengambil keputusan selanjutnya
serta rancangan pembelajaran yang hendak disusun pada kegiatan pembelajaran
selanjutnya dapat disempurnakan atau diperbaiki dengan melihat kekurangan yang
terjadi sebelumnya.
2.2 Bentuk Ujian Formatif
Ditinjau dari segi kegunaan untuk mengukur hasil belajar peserta didik, maka
Jenis ujian dapat dibedakan atas dua macam, yaitu: ujian formatif dan sumatif. Ujian
formatif adalah Proses menyediakan dan menggunakan informasi untuk dijadikan
sebagai dasar pengambilan keputusan tentang perbaikan produk atau perabikan program
instruksional. Formatif juga dapat memperbaiki kekurangan hasil belajar peserta didik
dalam sikap, pengetahuan, dan keterampilan pada setiap kegiatan penilaian selama
20
proses pembelajaran dalam satu semester, sesuai dengan prinsip Kurikulum 2013 agar
peserta didik tahu, mampu dan mau. Hasil dari kajian terhadap kekurangan peserta didik
digunakan untuk memberikan pembelajaran remedial dan perbaikan RPP serta proses
pembelajaran yang dikembangkan guru untuk pertemuan berikutnya (Isnaini, 2017: 18-
19; Widoyoko, 2016:8). Ujian formatif dilaksanakan selama program berjalan dengan
tujuan untuk memberikan informasi yang berguna kepada pimpinan program. Setiap
langkah evaluasi akan menghasilkan umpan balik segera kepada pembuat evaluasi.
Setelah itu informasi yang diperoleh dapat digunakan untuk merevisi bahan jika
dibutuhkan (Umamah, 2014:351-352). Sedangkan menurut Arifin, (2012:32) penilaian
formatif dimaksudkan untuk memantau kemajuan belajar peserta didik selama proses
pembelajaran berlangsung, untuk memberikan umpan balik dalam upaya
penyempurnaan program pembelajaran dan untuk mengetahui kelemahan-kelemahan
yang memerlukan perbaiakan agar peserta didik dan proses pembelajaran lebih baik.
Kesimpulannya evaluasi formatif atau ujian formatif diberikan pada akhir setiap
program. Tes ini merupakan post-test atau tes akhir proses. Tes formatif juga dapat
disamakan dengan ulangan harian. Tujuannya menilai hasil belajar peserta didik dan
memperbaikai hal-hal yang diperlukan dalam kegiatan pembelajaran.
Tabel 2.1 Perbedaan Evaluasi Formatif dan Sumatif
Aspek Formatif Sumatif
Komponen Sebagian Keseluruhan
Instrumen Buatan sendiri Terstandar
Pelaksanaan Pelaksana :Internal evaluator
Dilaksanakan: selamaproses
Pelaksana:Eksternal evaluator
Dilaksanakan:setelah proses
Fungsi Perbaikan Efektivitas
Sifat Berkelanjutan Satu tahapan
Sumber: Umamah (2014: 353).
Berdasarkan tabel diatas dapat disimpulkan bahwa evaluasi sebagai kegiatan
penilaian memiliki dua bentuk yaitu formatif dan sumatif. Kegiatan penilaian formatif
yaitu kegiatan evalausi formatif dengan komponen yang akan diujikan sebagian,
21
instrumennya buatan pendidik sendiri, penilai tes adalah pendidik itu sendiri,
pelaksanaannya selama kegiatan pembelajaran berlangsung secara berkelanjutan, dan
tujuannya adalah perbaikan pembelajaran. Sedangkan penilaian secara sumatif adalah
kegiatan penilaian dengan komponen keseluruhan, instrumennya disusun berdasarkan
standar dengan melibatkan tim penyususun tes, penilai adalah tim penilai, dilaksanakan
di akhir pembelajaran dan dilaksanakan sekali dan tujuannya efektivitas.
Ujian formatif yang dilaksanakan di kelas X SMAN 1 Jember memiliki peranan
yang sangat penting dalam kegiatan pembelajaran. Ujian formatif berperan sebagai
penentu ketuntasan belajar dan kenaikan kelas peserta didik disekolah. Sebagai sekolah
yang menerapkan program sistem belajar kredit semester yang sering di kenal SKS hasil
ujian formatif mernjadi penentu keberhasilan dan ketuntasan belajar peserta didik kelas
X. Program ini dijalankan pada tahun 2016 dan menjadikan kelas X sebagai subyek
pelaksana program terbaru ini. Agar program yang dijalankan dapat tercapai dengan
maksimal dan sesuai dengan tujuan yang diharapkan sebaginya dalam penyusunan alat
ukur ujian memiliki kualitas yang baik dan sesuai dengan tujuan pembelajaran.
Soal dalam ujian formatif biasanya disusun oleh pendidik. Tujuannya untuk
mengukur tingkat penguasaan atau kemajuan peserta didik terhadap materi yang telah
disampaian pendidik (Arifin, 2012:130-131; Djiwandono, 2008:22). Berdasarkan hal
tersebut maka pendidik sebagai individu pembuat soal perlu melakukan perumusan
terhadap Kompetensi Dasar dan Indikator yang akan diajarkan, pemilihan bahan yang
sesuai dan mengukur capaian hasil belajar peserta didik. Pendidik yang menyusun tes
ini biasanya terdiri dari pendidik yang belum pengalaman menyususn tes atau memiliki
keahlian penyususan tes namun tidak sempat mengujicobakan dan menganalisis. Hal ini
mengakibatkan soal tersebut belum dapat dipertanggungjawabakan terkait kualitas tes
yang akan digunakan. Berdasarkan pernyataan tersebut dapat disimpulkan tes buatan
pendidik merupakan tes yang disusun oleh pendidik pada mata pelajaran tertentu yang
digunakan sebagai alat ukur hasil belajar peserta didiknya. Tes hasil buatan pendidik ini
memiliki peran penting dalam ketercapaian pembelajaran yang dijalankan. Maka tes
yang disusun harus dilakukan penilaian agar sesuai dengan tujuan yang hendak dicapai.
22
2.3 Tes Pilihan Ganda (Multiple Choice Test)
Pelaksanaan ujian biasanya menggunakan tes sebagai alat ukur keberhasilan
belajar. Salah satu yang sering digunakan pendidik adalah tes berbentuk soal pilihan
ganda. Tes pilihan ganda merupakan salah satu bentuk dari tes objektif. Tes bentuk
pilihan ganda terdiri atas pembawa pokok persoalan/permasalahan dan pilihan jawaban.
Pembawa pokok persoalan ini dapat berupa pertanyaanatau berupa pernyataan. Pilihan
jawaban dalam tes bentuk pihan ganda (option) dapatberupa perkataan, bilangan atau
kalimat(Arifin, 2010:138). Tes pilihan ganda juga tidak jauh berbeda dengan tes soal
benar-salah namun, karena pernyataan salah dalam tes lebih banyak maka akan
memungkinkan peserta didik mendapatkan jawaban benar lebih kecil dari pada tes
benar-salah (Nurgiyanto, 2011:129). Berdasarkan peryataan-peryataan tersebut dapat
disimpulkan bahwa tes pilihan ganda adalah tes yang disusun berupa pertanyaan dengan
beberapa option (pilihan jawaban) dengan satu jawaban yang paling benar.
Pengurangan faktor menebak pada soal pilihan ganda akan dapat meningkatkan
validitas serta sreliabilitas selama jawaban yang ada masuk akal dan soalnya dibuat
dengan baik (Novytasari, 2014:41). Bentuk soal pilihan ganda sebagai salah satu variasi
dari soal objektifmerupakan bentuk tes yang mempunyai satu jawaban yang benar atau
paling tepat (Sudjana, 2009:48). Dilihat dari strukturnya, bentuk soal pilihan ganda
terdiri atas (1) Stem adalah pertanyaan atau pernyataan yang berisi permasalahan yang
akan dinyatakan, (2) Option adalah sejumlah pilihan atau alternatif jawaban, (3) Kunci
adalah jawaban yang benar atau paling tepat dan (4) Distraktor adalah jawaban-jawaban
lain selain kunci jawaban. Soal-soal pilihan ganda yang merupakan salah satu bentuk tes
pastinya memiliki syarat-syarat dalam penyusunannya. Syarat-syarat penyusunan tes
multiple choice yang baik adalah statement harus jelas merumuskan suatu masalahbaik
statement maupun option sebisa mungkin bukan merupakan suatu kalimat yang terlalu
panjang dan hindari option yang tidak ada sangkut-pautnya satu sama lain (Purwanto,
2005:41). Maksudnya option (pilihan jawaban) hendaknya homogen.Agar diperoleh
soal yang berkualitas menurut Sukiman(2011:93) maka penyusunan tes pilihan ganda
perlu memerhatikan beberapa kaidah berikut (1) pokok soal (pernyataan atau
23
pernyataan) harus jelas, (2) perumusan pokok soal hendaknya kalimat yang diperlukan
saja, (3) pilihan jawaban hendaknya homogen dalam arti isi, (4) panjang kalimat
jawaban relatif sama, (5) usahakan tidak ada petunjuk untuk jawaban yang benar, (6)
hindari menggunakan pilihan jawaban semua benar atau semua salah, (7) apabila pilihan
jawaban berupa angka, disusun secara berurutan dari yang angka terkecil ke angka
terbesar atau sebaliknya, dan (8) semua pilihan jawaban harus logis dan semua
pengecoh harus berfungsi dengan baik.
Soal bentuk pilihan ganda sebagai alat ukur menurut (Sudjana, 2009:49)
memiliki kelebihan dalampelaksanaannya, antara lain :
1. Materi yang diujikan dapat mencakup sebagian besar dari bahan pengajaran
yang telah diberikan. Hal ini dikarenakan soal bentu objektif dapat memuat
banyak materi.
2. Jawaban peserta didik dapat dinilai dengan mudah dan cepat dengan
menggunakan kunci jawaban. Hal ini dikarenakan bentuk soal objektif hanya
terdapat satu jawaban yang benar.
3. Jawaban untuk setiap pertanyaan sudah pasti benar atau salah sehingga
penilaiannya bersifat objektif. Adanya jawaban yang pasti benar dan salah, maka
pengoreksiannya dapat dilakukan dengan mudah dan pengoreksiannya dapat
dilakukan dengan menggunakan mesin.
Keunggulan diatas senadaa dengan pendapat Sudijono (2011:133-135) yang
memaparkan keunggulan dari soal pilihan ganda yaitu :
1. soal pilihan ganda mempunyai validitas yang tinggi jika penyusunannya
dilakukan dengan baik dan benar
2. mempunyai konsistensi yang tinggi
3. petunjuk dan pengerjaaanya mudah dimengerti
4. penskoran lebih mudah dan cepat
5. tes dapat digunakan berulang kali selama tes masih valid dan tidak bocor
6. tes pilihan ganda lebih memungkinkan bagi pendidik untuk bertindak lebih
objektif, menentukan bobot skor, lebih mudah mengoreksi, dan mudah
menentukan nilai hasil tes.
24
Selain memiliki kelebihan sebagai alat ukur soal bentuk pilihan ganda juga
memiliki kekurangan yang dapat dijabarkan sebagai berikut:
1. kemungkinan untuk melakukan tebakan jawaban masih cukup besar. Hal ini
dikarenakan dalam soal bentuk pilihan ganda sudah terdapat alternatif jawaban
yang tersedia;
2. proses berpikir peserta didik tidak dapat dilihat dengan nyata. Hal ini
dikarenakan bentuk soal pilihan ganda memberikan jawaban yang tidak
menuntut jawaban yang panjang;
3. menyusun tes ini tidak mudah, memerlukan ketelitian dan waktu yang agak
lama. Hal ini dikarenakan pada tes bentuk objektif sudah terdapatalternatif
jawaban yang tersedia.
Kelamahan tes soal pilihan ganda juga dijelaskan oleh Surapranata (2009:178)
sebagai berikut:
1. Waktu dalam menyususn soal pilihan ganda cukup lama. Pendapat ini didukung
oleh (Nurgiyanto, 2011:123) bahwa dalam penyusunan soal pilihan ganda relatif
lama karena penyususnan alternatif jawabannya harus tepat sehingga
membutuhkan kecermatan dan kesabaran yang lebih banyak
2. Pengecoh yang homogen, logis dan berfungsi baik sulit dibuat
3. Terdapat peluang untuk menebak jawaban. Pendapat ini didukung Surapranata
(2007:178) dengan empat alternatif jawaban yang ada kemungkinan peserta
didik menerka jawaban tes sebesar 25%. Hal ini dapat terjadi jika pengecoh
yang dibuat malah mengarahkan peserta kejawaban yang benar. Jika jawaban
terkaan ini benar maka alat pengukur ini dapat diragukan daya ketepatannya
(Sudijono, 2011:135). Selain itu kerjasama antar peserta didik loebih terbuka
dalam mengerjakan soal pilihan ganda (Arikunto, 2007:165). Menurut
Nurgiyanto (2011:123) jika dalam pelaksanaan tes peserta diidk melakukan
kegiatan kerja sama maka skor yang diperoleh peserta didik belum
mencerminkan kompetensi pengetahuan peserta didik.
4. Tes pilihan ganda kurang tepat digunakan untuk mengukur kemampuan verbal.
25
5. Peserta tes tidak mempunyai keleluasan dalam menyampaikan pendapanya
dalam bentuk kalimat.
6. Tidak mampu mengukur kemampuan pemecahan masalah. Pendapat ini
didukung oleh (Sudijono, 2011:135) bahwa tes pilihan ganda kurang dapat
mengungkap proses berpikir yang lebih tinggi atau mendalam, tes lebih banyak
mengungkap daya ingat terhadap materi yang diujikan.
Agar dapat menanggulangi kelemahan-kelemahan tes bentuk soal pilihan ganda
diatas menurut Nurgiyanto, 2011:124-125 maka usaha dapat dilakukan adalah (1)
Penyusunan butir soal pilihan ganda hendaknya harus berdasarkan pada kisis-kisi yang
telah direncanakan sebelumnya, (2) Pendidik berlatih secara berkesinambungan dengan
mempelajari soal tes pilihan ganda yang telah dipastikan kualitasnya baik, (3) Untuk
mengatasi permasalah kerjasama antar peserta tes dapat diatasi dengan penjagaan yang
ketat selama pelaksanaan ujian, dan (4) Menerapkan ujian tes objektif maupun subjektif
baik dalam waktu yang bersamaan atau tidak. Usaha ini dapat meningkatkan
kemampuan pendidik dalam menyusun soal yang sesuai dan peningkatan dalam prestasi
peserta didik.
2.4 Penyusunan Soal yang Baik
Kegiatan penyusunanbutir soal terlebih dahulu penyususn tes harus
memperhatikan langkah-langkahnya. Langkahnya dimulai dengan penentuan tujuan tes,
menyusun kisi-kisi soal, selanjutnya menulis atau menyususu soal, sebelum tes
digunakan terlebih dahulu melakukan penelaahan butir soal, dan uji coba soal dan
perakitan soal menjadi perangkat tes (Kartowagiran, 2012:3). langkah-langkahnya dapat
dijabarkan sebagai berikut:
1. Penentuan tujuan
Tujuan pemberian tes adalah untuk mengetahui penguasaan peserta didik
pada kompetensi/sub kompetensi tertentu setelah diajarkan. Tujuan tes harus
jelas agar arah dan ruang lingkup pengembangan tes selanjutnya juga jelas.
2. Penyusunan Kisi-kisi
26
Kisi-kisi soal tes merupakan bagian dari silabus yang berisi standar
kompetensi, kompetensi dasar, materi pokok, kegiatan pembelajaran, penilaian,
waktu, dan sumber belajar.
3. Penulisan butir-butir soal
Penulisan butir-butir soal penting dalam upaya pengembangan alat ukur
kemampuan atau tes yang baik. Penulisan soal adalah penjabaran indikator jenis
dan tingkat perilaku yang hendak diukur menjadi pertanyaan-pertanyaan yang
karakteristiknya sesuai dengan perinciannya dalam kisi-kisi. Maka setiap
pernyataan perlu dibuat sedemikian rupa sehingga jelas apa yang ditanyakan dan
jelas pula jawaban yang diminta. Mutu setiap butir soal akan menentukan mutu
soal tes secara keseluruhan. Butir-butir soal harus memiliki tingkat penalaran
tinggi atau memiliki Higher Order Thinking Skill (HOTs).
4. Telaah Soal atau Analisis Kualitatif Soal
Telaah soal atau analisis kualitatif soal adalah mengkaji secara teoritik
soal tes yang telah tersusun. Telaah ini dilakukan dengan memperhatikan tiga
aspek, yaitu aspek materi, aspek konstruksi, dan aspek bahasa.
5. Ujicoba Soal
Ujicoba soal pada dasarnya adalah upaya untuk mengetahui kualitas soal
tes berdasarkan pada empirik atau respon dari peserta tes. Hal ini dapat terwujud
manakala dilakukan analisis empirik atau analisis kuantitatif, baik menggunakan
teori klasik maupun teori modern.
6. Analisis Empirik
Ada dua pendekatan yang digunakan untuk melakukan analisis empirik
ini, yaitu: teori klasik dan teori respon. Masing-masing pendekatan ada
kelebihan dan kekurangannya.
7. Perakitan Soal Tes
Agar skor tes yang diperoleh tepat dan dapat dipercaya maka soal tes
harus valid dan reliabel. Menurut Kartowagiran (2012:4-6) butir-butir soal perlu
dirakit menjadi alat ukur yang yang terpadu. Hal-hal yang dapat mempengaruhi
validitas skor tes adalah urutan nomor soal, pengelompokan bentuk-bentuk soal,
27
tata letak soal, dan sebagainya. Untuk itu, ada baiknya soal tes disajikan mulai
dari butir mudah ke yang susah, pengelompokan rapi, tata letak bagus dan tidak
terpotong-potong kalimatnya, dan kemasannya menarik.
Penyusunan soal tipe pilihan ganda berdasarkan panduan penulisan soal pilihan
ganda oleh Pusat Penilaian Pendidikan Balitbang-Depdiknas (2007:13-14) penulisan
soal harus memperhatiakn (1) materi, karena harus sesuai indikator, homogen dan logis,
dan mempunyai jawaban paling benar, (2) Konstruksi, karena harus dirumuskan secara
jelas dan tegas, berisi pernyataan yang diperlukan saja, jangan memberi petunjuk ke
arah jawaban paling benar, soal tidak bermakna ganda, panjang jawaban relatif sama,
jawaban tidak mengandung pernyataan, soal tidak bergantung pada soal sebelumnya,
dan (3) bahasa karena harus menggnakan bahasa yang sesuai, bahasa baku, berbahasa
komunikatif dan jawaban tidak mengulang kata selain dari kesatuan pengertian.
sedangkan penyusunan soal tipe Hots (Higher Order Thinking Skill). Berdasarkan
modul pedoman penyusunan soal HOTs 2017 yang diterbitkan oleh Direktorat
Pembinaan Sekolah Menengah Atas Direktorat Jenderal Pendidikan Dasar dan
Menengah Kementrian Pendidikan dan Kebudayaan (2017:17-19) penunyusun soal
dituntut untuk menentukan perilaku yang hendak diukur dan merumuskan materi yang
akan dijadikan dasar pertanyaan. Perilaku yang diukur sesuai dengan harapan. Uraian
materi yang ditanyakan menuntuk penalaran tinggi. Perlu penguasaan materi,
ketrampilan menyususn soal, dan kondisi daerah sekitar satuan pendidikan. Langkah-
langkahnya seagai berikut:
1. Menganalisis Kompetensi Dasar yang dapat dibuat soal HOTs.
Pendidik harus memilih Kompetensi Dasar terlebih dahulu karena tidak
semua dapat diuatkan model soal-soal HOTs. Pemilihan Kompetensi Dasar ini
dapat dilakukan dengan mandiri atau melalui forum MGMP.
2. Menyusun kisi-kisi soal
Penulisan ini ertujuan untuk memantu para pendidik dalam menulis soal
Hots. Kisi-kisi diperlukan untuk memandu pendidik dalam memilih Kompetensi
Dasar yang dapat dibuat soal Hots, memilih materi pokok terkait Kompetensi
Dasar yang diuji, merumuskan indikator soal, dan menentukan level kognitif.
28
3. Memilih stimulus yang menarik dan kontekstual.
Stimulus harus menarik artinya dapat mendorong peserta didik untuk
membaca stimulus. Ciri-ciri stimulus aru adalah baru atau belum pernah dibaca
peserta didik. stimulus konstektual adalah stimulus yang sesuai dengan
kenyataan sehari-hari, menarik, mendorong peserta didik untuk membaca.
4. Menulis butir pertanyaan sesuai dengan kisi-kisi soal.
Butir-butir soal disusun erdasarkan kaidah penulisan soal Hots.hal ini
dikarenakan soal tipe ini berbeda. Peredaan terletak pada aspek materi
sedangkan aspek konstruk dan bahasa relatif sama. Setiap butir soal ditulis pada
kartu soal.
5. Membuat pedoman penskoran atau kunci jawaban
Setiap butir soal dilengkapi dengan pedoman penskoran atau kunci
jawaban. Pedoman penskoran digunakan untuk bentuk soal uraian. Sedangkan
kunci jawaban digunakan pada entuk soal pilihan ganda.
2.5 Analisis Kualitas Soal
Tes sebagai alat evaluasi merupakan alat ukur penting dan harus dikembangkan
sesuai tuntutan (Djiwandodo, 2008:91). Realita yang ada pendidik sering mengabaikan
tugas untuk melakukan evaluasi terhadap alat ukur yang digunakan untuk mengukur
keberhasilan belajar peserta didik yang terdiri dari kumpulan butir soal (Sudijono,
2011:367). Pendidik yang berpengalamanpun masih sering mengabaikan kualitas alat
ukur yang digunakan (Arikunto, 2007:204). Pendapat tersebut didukung Kunandar
(2014:62-65) terkait masalah penilaian disekolah mulai dari materi yang diujikan bukan
materi pokok, penyusunan soal tanpa didahului kisi-kisi, pembuatan pengecoh dan
kunci jawaban yang kurang tepat. Selain itu hasil penilaian belum menggambarkan
secara jelas kompetensi yang telah dicapai peserta didikdan mutu soal yang kurang valid
dan reliabel. Maka untuk mengatasi permasalahan tersebut dapat dilakukan dengan cara
melakukan penganalisisan terhadap tes yang dijadikan alat ukur (Sudijono, 2011:369).
Kegiatan analisis kualitas soal adalah (1) kegiatan mengkaji dan menelaah setiap butir
soal agar diperoleh soal yang bermutu, (2) meningkatkan kualitas butir soal melalui
29
revisi atau membuang soal yang tidak efektif, (3)mengetahui kemampuan peserta didik
terkait pemahaman materi (Aiken, 1994:63; Kusaeri & Suprananto, 2012:163). Menurut
Arikunto analisis butir soal dapat bermanfaat untuk mendapatkan informasi terkait
kekurangan dan petunjuk perbaikan soal (Arikunto, 2007:207). Kegiatan analisis juga
didukung oleh pendapat purwanto, (2003:118) yang menyatakan bahwa salah satu cara
perbaikan dalam proses pembelajaran yang paling efektif adalah mengevaluasi tes hasil
belajar (Purwanto, 2013:118). Analisis kualitas soal adalah kegiatan yang penting
dilakukan dalam rangka memperbaiki mutu soal baik keseluruhan maupun setiap
butirnya (Arifin 2010:246). Soal yang menjadi alat evaluasi diharapkan mampu
memberikan nilai akurat karenanya perlu diperhatikan prinsip-prinsip dasar pembuatan
soal. Analisis soal bertujuan untuk mengetahui baik buruknya soal (Wahyudi, 2011:
17). Analisis kualitas soal dapat dilakukan secara kualitatif (berkaitan dengan isi) dan
secara kuantitatif (berdasarkan ciri statistiknya: validitas, reliabilitas, kesukaran soal,
dan daya pembeda). Kedua teknik ini penting dilakukan semuanya (Anastasi & Urbina,
1997:172; kusaeri & Suprananto, 2012:163). Berdasarkan beberapa pendapat diatas
dapat disimpulkan bahwa kegiatan analisis kualitas soal adalah kegiatan penilaian
terhadap soal sebagai alat ukur hasil belajar peserta didik dengan tujuan memperbaiki
kualitas soal baik sebagaian maupun keseluruhan, melihat efektifitas alat ukur, baik dan
buruknya soal dan memperbaiki soal yang tidak layak digunakan. Soal bermutu atau
berkualitas adalah soal yang dapat memberikan informasi setepat-tepatnya tentang
peserta didik terkait pemahaman materi.
Pentingnya analisis kualitas soal atau tes sebagai alat ukur dalam kegiatan
pembelajaran sedang marak terjadi diberbagai negara dan bidang. Misalnya dalam
jurnal penelitian oleh Yalcin & Eres (2018) dengan judul A Study of Validity ang
Reliability on the Instructional Capacity Scale mengatakan bahwa pentinya melakukan
penilaian tingkat kemampuan peserta didik dan menyediakan alat evaluasinya. Tujuan
melakukan penilaian ini untuk membangun ketrampilan dan mampu meyelesaikan
persoalan sesuai harapan. Salah satu cara agar dapat mengukur kemampuan tersebut
adalah menyusun alat tes yang harus melalui tahap validitas dan reliabilitas.pada
penelitian lain yang berjudul Students Initial Knowledge State and Test Design:
30
Towards a Valid and Reliabel Test Instrument (2015) menurutnya dalam penyusunan
tes tidaklah mudah. Tes yang berkualitas adalah tes yang harus mencerminkan tingkat
kemampuan peserta didik. realita yang ada instrumen tes yang digunakan belum sesuai
dengan harapan. Kebanyakan tes yang ada berada pada tingkat kognitif rendah sehingga
belum mencerminkan kemampuan peserta didik secara menyeluruh. Perlunya analisis
kualitas soal agar dapat dihasilkan instrument tes yang lebih baik secara keseluruhan.
Analisis ini sangat berguna untuk menghasilkan alat tes dengan validitas isi yang
maksimal. Selanjutnya jurnal penelitian yang dilakukan oleh Badjadi Nour El Imane
(2013) dengan judul Conseptualizing Essay Tests Reliability and Validity: From
Research to Theory menyatakan bahwa tes dalam bentuk essai yang juga digunakan
sebagai alat ukur dalam kegiatan pembelajaran perlu dilakukan pengujian keandalan dan
reliabelnya. Permasalah utama terkait dengan tes essai ini dikarenakan banyaknya
pendidik yang kesulitan dalam melakukan pengujian soal secara mendadak karena
subjektifitas jawaban dari peserta didik sehingga memerlukan banyak waktu. Akibatnya
tidak dapat diketahui seberapa valid dan reliabel soal yang diberikan. Pengujian ini
diharapkan dapat memperbaiki pembelajaran bahasa yanng dijalankan, pencapaian
tujuan yang diharapkan dan penilaian yang sesuai dengan tujuan.
Pelaksanaan kegiatan analisis didesain untuk menjawab pertanyaan terkait
kefungsian soal tepat atau tidak, apakah soal sudah memiliki tingkat kesulitan yang
tepat, ketepatan relevansi soal, efektifitas pilihan jawaban, dan kemampuan soal dalam
peningkatkan kemampuan peserta didik (Linn & Gronlund, 1995:315; Kusaeri &
Suprananto, 2012:164). Kegiatan analisis soal memiliki banyak manfaat diantaranya (1)
dapat membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
(relevan bagi penyusunan tes informal, (3) mendukung penulisan soal yang efektif, (4)
memperbaiki tes yang digunakan, (5) meningkatkan validitas dan reliabilitas soal, (6)
menentukan keberfungsian soal sesuai harapan, (7) memberikan masukan terkait
kemampuan peserta didik, (8) pendidik mengetahui kesulitan peserta didiknya, (9)
memberikan masukan dalam perbaikan kurikulum, (10) merevisi materi yang diukur,
dan (11) meningkatkan keteramplan penyusunan soal yang baik bagi pendidik (Anastasi
31
& Urbina, 1997:172; Nitko, 1996:308-309). Manfaat analisis butir soal menurut
(Suprananto, 2012:164) dapat dicirikan sebagai berikut:
1. Menentukan soal-soal yang tidak berfungsi dengan baik
2. Meningkatkan kualitas butir soal melalui 3 komponen yaitu kesukaran, daya
beda dan pengecoh soal
3. Merevisi butir soal yang tidak relevan dengan materi yang diajarkan yang
ditandai dengan banyaknya peserta tes yang tidak dapat menjwab beberapa soal.
Analisis ini dapat dilakukan dengan dua cara yaitu analisis kualitatif (analisis
yang berkaitan dengan isi dan bentuknya) dan analisis kuantitatif (analisis yang
berkaitan dengan validitas empiris) yang dilakukan untuk melihat lebih berfungsi
tidaknya alat ukur yang digunakan (Suprananto, 2012:163). Berikut merupakan
penjabaran dari analisis kualitatif dan kuantitatif.
a. Analisis Kualitatif
Analisis ini biasanya dilakukan disaat melakukan penelaahan soal sebelum
soal diujicobakan. Analisis ini sering disebut analisis logis yaitu analisis yang
dilakukan untuk nmenentukan fungsi tidaknya soal berdasarkan aspek materi,
penyususnan soal, dan pembahasaan soal (Sudarsono, 2012:138). Penelaahan
dapat menggunakan lembar telaah yang telah disiapkan. Lembar telaah ini dibuat
guna membantu dan mempermudah dalam melakukan prosedur pelaksanaannya
(Kusaeri dan Suprananto, 2012: 166). Format penelaahan soal ini digunakan
sebagai dasar untuk menganalisis setiap butir soal (Nurgiyantoro, 2011: 24). Alat
evaluasi yang telah ditulis berdasarkan kisi-kisi dan diketahui telah sesuai dengan
kriteria lembar telaah dapat dinyatakan telah memenuhi validitas
kurikuler/validitas isi sebuah alat tes. Menurut Nurgiyantoro (2011: 52), validitas
isi adalah validitas yang harus terpenuhi dalam tes hasil belajar. Pernyataan ini
senada dengan pendapat Arikunto (2007: 206) yang menyatakan bahwa validitas
kurikuler/validitas isi merupakan validitas yang paling penting dari tes buatan
guru. Untuk mengadakan analisis validitas isi, kita harus merumuskan tujuan
setiap bagian pelajaran secara khusus dan jelas, sehingga setiap butir soal dapat
kita jodohkan dengan setiap tujuan khusus tersebut.
32
Tabel. 2.2 Format Penelaahan Soal Pilihan Ganda
No. Aspek Penilaian Nomor Soal
A. Materi 1 2 3 4 dst
1 Butir soal sesuai dengan indikator
2 Isi materi benar secara keilmuan
3 Hanya ada satu kunci jawaban benar
4 Isi materi sesuai kelas/jenjang pendidikan
5 Butir pengecoh berfungsi dengan baik
B. Konstruksi
1 Pokok soal jelas
2 Pokok soal tidak mengarah kejawaban benar
3 Pilihan jawaban dirumuskan dengan jelas
4 Pilihan jawaban homogen
5 Tidak ada bentuk negatif ganda
6 Panjang pilihan jawaban kurang lebih sama
7 Antar butir soal tidak bergantung satu sama lain
8 Pilihan dalam bentuk angka/waktu diurutkan
C. Bahasa
1 Bahasa komunikatif
2 Kalimat gramatikal
3 Kalimat tidak bermakna ganda
4 Kosakata baku umum/netral
Sumber : Kusaeri & Suprananto (2012:168-169)
Butir soal dianggap sudah memenuhi validitas isi atau validitas secara
rasional jika telah memenuhi aspek materi, konstruksi, dan bahasa. Analisis
materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi
keilmuan yang dinyatakan dalam soal serta tingkat kemampuan yang sesuai
dengan soal.
33
Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya
berkaitan dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai
penelaahan soal mengenai penggunaan bahasa Indonesia yang baik dan benar
menurut EYD. Menurut Kusaeri dan Suprananto (2012: 108–110), yang dilihat
dari aspek materi adalah: (1) butir soal harus menanyakan perilaku atau materi
yang hendak diukur sesuai dengan tuntutan indikator, (2) semua pilihan jawaban
harus berasal dari materi yang sama seperti yang terkandung dalam pokok soal,
penulisannya harus setara, dan semua pilihan jawaban harus berfungsi, dan (3)
setiap butir soal harus mempunyai satu jawaban yang paling benar.
Sementara itu, yang dilihat pada aspek konstruksi adalah: (1) pokok soal
harus dirumuskan secara jelas dan tegas, yang artinya kemampuan atau materi
yang hendak diukur atau ditanyakan harus jelas, tidak menimbulkan makna ganda,
hanya mengandung satu persoalan setiap nomor, bahasa yang digunakan harus
komunikatif (mudah dipahami), (2) rumusan pokok soal dan pilihan jawaban
harus merupakan pernyataan yang diperlukan saja, (3) pokok soal jangan
memberikan petunjuk kearah jawaban yang benar, (4) pokok soal jangan
mengandung pernyataan yang bersifat negatif ganda, kecuali jika dalam ujian
keterampilan bahasa yang hendak mengukur mengenai pengertian negatif ganda
itu sendiri, (5) panjang pilihan jawaban relatif sama, mengingat bahwa banyak
peserta tes yang cenderung menjawab pilihan jawaban yang paling panjang karena
pilihan jawaban yang paling panjang tersebut dirasa paling lengkap dan biasanya
adalah yang menjadi kunci jawaban, (6) pilihan jawaban jangan mengandung
“semua jawaban di atas benar” atau “semua jawaban di atas salah”, karena bentuk
butir soal seperti ini menandakan bahwa dari segi materi pilihan jawaban
berkurang satu, (7) pilihan jawaban yang berbentuk angka harus disusun
berdasarkan urutan besar kecilnya angka tersebut secara kronologis, (8) gambar,
grafik, tabel, diagram, dan sejenisnya yang terdapat pada butir soal harus jelas dan
berfungsi, dan (9) materi butir soal jangan bergantung pada jawaban butir soal
sebelumnya.
34
Selanjutnya, yang dilihat pada aspek bahasa adalah: (1) setiap butir soal
harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia, (2)
jangan menggunakan bahasa yang berlaku setempat jika butir soal akan digunakan
di daerah lain atau nasional, dan (3) pilihan jawaban jangan mengulang kata atau
frasa yang bukan merupakan satu kesatuan pengertian, jadi letakkan kata tersebut
pada pokok soal.
b. Analisis kuantitatif
Ketika pendidik telah memberikan tes kepada peserta tes, maka pengajar
tersebut akan memperoleh banyak informasi tentang karakteristik butir soal tes,
maupun tentang peserta tes. Untuk memperoleh informasi tersebut diperlukan
analisis secara kuantitatif. Analisis butir soal secara kuantitatif menekankan pada
analisis karakteristik internal tes melalui data yang diperoleh secara empiris.
Karakteristik internal secara kuantitatif yang dimaksudkan biasanya meliputi
parameter tingkat kesukaran, daya pembeda, efektivitas distraktor, dan reliabilitas
internal. Jika analisis secara kualitatif biasanya dilakukan sebelum soal
diujicobakan, maka analisis secara kuantitatif seharusnya dilakukan setelah soal
diujicobakan, seperti yang telah dibahas sebelumnya pada bagian prosedur
penyusunan tes yang baik. Salah satu tujuan dilakukannya analisis adalah untuk
meningkatkan kualitas butir soal, yaitu apakah suatu butir soal: (1) dapat diterima
karena telah didukung oleh data statistik yang memadai, (2) diperbaiki, karena
terbukti terdapat beberapa kelemahan, atau bahkan (3) tidak digunakan sama
sekali karena terbukti secara empiris tidak berfungsi sama sekali.
Menurut Arikunto dengan mengerjakan soal-soal yang ada diharapkan dapat
meningkatakan kemampuan dan motivasi peserta didik. Agar dapat menilai kelayakan
soal pilihan ganda pada buku dapat dilakukan degan analisis soal. Menurut Arikunto,
(2013:90)tahapannya adalah Validitas, Reliabilitas, Tingkat Kesukaran, Daya Bedasoal.
Berdasarkan pernyataan diatas melalui analisis kualitas soal dapat diketahui soal-soal
yang baik, mendapatkan informasi soal yang dapat dipakai dan soal yang harus direvisi
pada kesempatan lainnya. Melalui analisis ini diharapkan pendidik memahami bentuk
35
soal yang berkualitas. Kegiatan analisis dapat dilakukan melalui uji kualitas butir soal
yang dapat dijabarkan sebagai berikut:
a. Validitas item
Validitas item merupakan suatu ketepatan mengukur yang dimiliki oleh
instrumen tes pada tiap butirnya yang menjadi bagian tak terpisahkan dari tes
secara keseluruhan dalam mengukur apa yang seharusnya diukur oleh tes
tersebut (Sudijono, 2011: 182). Zainal Arifin (2014: 247) menyebutkan ada dua
unsur penting dalam validitas yaitu validitas menunjukkan suatu derajat dan
validitas selalu dihubungkan dengan suatu putusan atau tujuan yang spesifik.
Suatu instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi
apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Setiap butir
soal yang dijawab dengan benar diberi skor 1, sedangkan untuk setiap jawaban
salah diberikan skor 0. Item-item yang ingin diketahui validitasnya, yaitu valid
ataukah tidak, dapat digunakan teknik korelasi sebagai teknik
analisisnya.Instrumen yang valid, dapat diandalkan dan praktis diperlukan untuk
mengevaluasi pelaksanaan penilaian pembelajaran disekolah (Ghazali,
2016:148). Berdasarkan beberapa pendapat diatas dapat disimpulkan bahwa
validitas item digunakan untuk menilai kevalidan soal yang digunakan.
b. Reliabilitas
Menurut Arifin (2014: 258) reliabilitas merupakan tingkat atau derajat
konsistensi dari suatu alat pengukur atau instrumen. Sebuah instrumen dikatakan
memiliki tingkat reliabilitas yang tinggi apabila dapat dengan ajeg memberikan
data yang sesuai dengan kenyataan. Ajeg atau tetap tidak harus selalu sama,
tetapi mengikuti perubahan secara ajeg. Ajeg disini memiliki arti sama dalam
kedudukan peserta didik diantara anggota kelompok yang lain. Tentu saja tidak
dituntut selalu tetap kedudukannya. Besar ketetapanya inilah yang menujukkan
tingkat reliabilitas sebuah instrumen (Arikunto, 2013: 100-101). Realiabilitas
suatu instrumen dapat dinyatakan reliabel apabila reliabilitasnya sama atau lebih
dari 0,07. Apabila lebih kecil dari itu berarti tes belum memiliki reliabilitas
36
tinggi. (Sudiyono, 2009:209; Wahyudi, 2011:20).Berdasarkan kedua pendapat
tersebut, maka reliabilitas dapat diartikan sebagai tingkat keajegan hasil
pengukuran dengan tes yang sama pada waktu yang berbeda.
c. Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu
sulit (Arikunto, 2013: 222). Soal yang terlalu mudah tidak dapat merangsang
peserta didik untuk mengembangkan kemampuannya dalam memecahkan soal
tersebut. Soal yang terlalu sulit akan membuat peserta didik menjadi putus asa
untuk mencoba lagi karena di luar kemampuan peserta didik.Peluang untuk
menjawab benar pada soal dengan kemampuan tertentu dan dinyatakan dalam
bentuk indeks.
Menurut (Sugiyono, 2012) menyatakan bahwa indek kesukaran sebesar
0,00-0,30 artinya soal terlalu sukar, jika derajatnya 0,30-0,70 berarti cukup atau
sedang dan jika lebih dari 0,70 maka soal terlalu mudah.Semakin besar indeks
tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah
soal itu. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor
soal. Menurut (Novytasari, 2014: 24) pada prinsipnya, skor rata-rata yang
diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat
kesukaran butir soal. Kriteria soal yang baik adalah jika mempunyai
perbandingan presentase indeks kesukaran (IK) sebagai berikut: termasuk
kategori soal yang sukar adalah 27%, kategori soal yang sedang adalah 46%,
dan kategori soal mudah adalah 27%.
d. Daya pembeda soal
Kemampuan suatu butir soal dapat membedakan antara warga
belajar/peserta didik yang telah menguasai materi yang ditanyakan dan warga
belajar/peserta didik yang tidak/kurang/belum menguasai materi yang
ditanyakan (Daryanto, 2008:183). Perhitungan daya pembeda adalah
pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik
yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang
menguasai kompetensi berdasarkan kriteria tertentu (Arifin, 2014:273). Indeks
37
daya pembeda berkisar antara -1,00 sampai +1,00. Lebih rincinya jika angka
indek 0,20 sampai 0,40 maka soal termasuk cukup, jika indek berkisar 0,40-0,70
maka soal termasuk baik, dan jika indek berkisar 0,70-1,00 maka soal masuk
kategori baik sekali (Sudiyono, 2009:389). Semakin tinggi indeks daya pembeda
soal berarti semakin mampu soal yang bersangkutan membedakan peserta didik
yang memahami materi dengan peserta didik yang belum memahami materi.
Semakin tinggi daya pembeda suatu soal maka semakin baik soal itu (Sukidin,
2012:177; Novytasari, 2014: 24-25). Berdasarkan beberapa pendapat diatas
dapat disimpulkan daya pembeda adalah pengukuran sejauh mana suatu butir
soal mampu membedakan peserta didik yang sudah menguasai kompetensi
dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan
kriteria tertentu.
e. Fungsi pengecoh
Kegiatan analisis ini dilakukan pada soal tipe pilihan ganda. Soal pilihan
ganda memiliki beberapa option atau alternatif. Option biasanya terdiri 3-5 buah
dan terdapat kemungkinan jawaban berada dalam pilihan tersebut. Salah satu
option tersebut merupakan jawaban betul. Pengecoh merupakan option atau
pilihan jawaban yang lain dari jawaban yang benar. Suatu option disebut efektif
jika memenuhi fungsinya atau tujuan disajikannya option tersebut tercapai.
Tujuan utama adanya pengecoh adalah agar peserta didik sebagai peserta tes
tertarik memilihnya. Pengecoh dikatakan baik apabila sekurangnya dipilih oleh
5% dari semua peserta tes (Sudiyono, 2009; Wahyudi, 2011:24). Menurut
Anwar (1996: 137) efektifitas pengecoh adalah kemampuan soal dalam
membedakan kemampuan peserta didik.
Berdasarkan pemaparan diatas dapat disimpulkan bahwa efektivitas
pengecoh adalah penyebaran pilihan jawaban dalam soal yang digunakan
pendidik untuk dapat menguji kemampuan peserta didik terkait pemahaman
materi yang telah diajarkan sebelumnya.
38
2.6 Penelitian Terdahulu
Penelitian terdahulu dalam bab ini, bertujuan untuk menguatkan penelitian yang
dilakukan oleh peneliti dalam menggunakan sumber, dan juga sebagai rekomendasi
untuk penelitian selanjutnya. Penelitian terdahulu akan mampu memahami letak
penelitian yang dilakukan oleh peneliti.
Penelitian yang dilakukan oleh Ahmad Isnaeni (2017) dengan judul “Analisis
Kualitas Butir Soal Ujian Akhir Semester Genap Mata Pelajaran Ekonomi Kelas XI
SMA Islam Sudirman Purworejo Tahun Pelajaran 2016/2017”. Hasil penelitian
menunjukkan bahwa (1) berdasrkan tingkat kesulitan menunjukan bahwa butir soal
tergolong sangat sulit berjumlah 11 butir (27,5%), sulit berjumlah 9(22,5 %), sedang
berjumlah 18 butir (45 %), mudah berjumlah 2 butir (5%), sangat mudah berjumlah 0
butir (0 %). (2) berdasarkan daya beda: tidak baik berjumlah 18 butir (45 %), kurang
baik berjumlah 2 butir (5 %), cukup baik 4 butir (10 %), baik 7 butir (217,5 %), amat
baik 9 butir (22,5 %). (3) berdasakan efektivitas pengecoh: pengecoh yang berfungsi
baik, 18 butir soal (45%), 9 butir soal (22,5%) memiliki pengecoh yang kurang, 2 butir
soal (5 %) memiliki pengecoh yang tidak baik, dan. (4) tingkat riliabelnya rendah yaitu
0,521%. Berdasarkan kualitas butir soal dapat diketahui tingkat kesulitan, daya beda,
dan efektivitas pengecoh yaituterdapat % yang termasuk sangat baik, 7,5% yang
termasuk kategori baik, 17 butir soal (42,5 %) yang termasuk kurang baik dan 12 soal
(30 %) termasuk kategori tidak baik. Berdasarkan kualtas instrument termasuk
kategogori butir soal yang sangat kurang. Keseluruhan soal Ujian Akhir Semester Mata
Pelajaran Ekonomi kelas XI semester genap SMA Islam Sudirman Purworejo tahun
pelajaran 2016/2017 termasuk soal Kurang Baik.
Penelitian yang dilakukan oleh Utami (2016) dengan judul “Analisis Butir Soal
Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata
Pelajaran PKn Kelas IV SD di Kecamatan Depok, Sleman, Yogyakarta”. Hasil
penelitian menyatakan bahwa ” hasil penelitiannya menunjukkan bahwa (1) Validitas
butir soal piihan ganda Ujian Akhir Semester (UAS) dinyatakan valid dengan
presentase 100% valid, (2) Reliabilitas butir soal pilihan ganda Ujian Akhir Semester
39
dinyatakan tinggi atau reliable yaitu sebesar 0,74%, (3) Daya beda butir soal pilihan
ganda UAS dinyatakan baik dengan presentase sebesar 66,6%, (4) tingkat kesukaran
butir soal pilihan ganda Ujian Akhir Semester dinyatakan baik sebesar 50% dan (5)
keberfungsian pengecoh butir soal Ujian Akhir Sekolah yang berfungsi dengan baik
yaitu sebesar 73,33%.
Penelitian yang dilakukan oleh Erwin Tri Wahyuningsih (2015) dengan judul
“Analisis Butir Soal Tes Objektif Buatan Guru Ulangan Semester Ganjil Mata
Pelajaran Ekonomi Kelas X di SMA Negeri Melati Tahun Ajaran 2013/2014”
menyatakan bahwa (1) Soal yang termasuk dalam kriteria valid berjumlah 12 butir
(24%) sedangkan soal yang tidak valid berjumlah 38 butir (76%); (2) Berdasarkan
reliabilitas, soal masuk dalam kategori reliabilitas rendah karena bernilai 0,506; (3) Soal
yang termasuk dalam kriteria sukar berjumlah 10 butir (20%), sedang berjumlah 20
butir (40%) dan mudah berjumlah 20 butir (40%); (4) Soal yang memiliki daya beda
tidak baik berjumlah14 butir (28%), cukup baik berjumlah 17 butir (38%) dan butir soal
yang masuk kategori baik berjumlah 19 butir (38%); (5) Dilihat dari tingkat efektivitas
pengecohnya, soal yang pengecohnya berfungsi cukup baik berjumlah 1 soal (2%),
kurang baik berjumlah 21 butir (42%) dan tidak baik berjumlah 28 soal (56%).
Keseluruhan soal Ujian Akhir Semester Ganjil Mata Pelajaran Ekonomi Kelas X SMA
Negeri 1 Mlati Tahun Ajaran 2013/2014 sebagian besar termasuk kriteria cukup baik.
Hanya sebagian kecil soal yang bisa direvisi alternatif jawaban dan diperbaiki pada
bagian tingkat pengecohnya. Sementara soal yang bisa masuk bank soal tidak ada. Hasil
penelitian ini menunjukkan bahwa guru harus lebih meningkatkan kemampuan
menyusun soal yang baik agar dihasilkan soal yang berkualitas.
Penelitian oleh Diastuti (2015) dengan judul “Analisis Butir Soal Ujian Akhir
Semester Gasal Mata Pelajaran Pengantar Akuntansi dan Keuangan Kelas X Akuntansi
Smk Negeri 1 Klaten Tahun Ajaran 2014/2015” menyatakan bahwa kualitas soal ujian
akhir semester gasal pada mata pelajaran pengantar akuntansi dan keuangan kelas X
Akuntansi SMK Negeri 1 Klaten tahun ajaran 2014/2015 tergolong bagus. Hal ini
dibuktikan dengan hasil penelitian yaitu Hasil penelitian menunjukkan bahwa : (1)
Ditinjau dari segi validitas, bentuk soal pilihan ganda soal yang valid berjumlah
40
24 butir soal (80%), tidak valid 6 butir soal (20%), sedangkan soal uraian 100% valid.
(2) Ditinjau dari segi reliabilitas, bentuk soal pilihan ganda memiliki reliabilitas tinggi
yaitu 0,86, dan bentuk soal uraian memiliki reliabilitas rendah yaitu 0,18. (3) Ditinjau
dari segi tingkat kesukaran, bentuk soal pilihan ganda sangat sukar berjumlah 2 butir
soal (6,67%), sukar 1 butir soal (3,33%), sedang 2 butir soal (6,67%), mudah 9 butir
soal (30%), dan sangat mudah 16 butir soal (53,33%) dan bentuk soal uraian
semua dinyatakan sangat mudah (100%). (4) Ditinjau dari segi daya pembeda,
bentuk soal pilihan ganda sangat buruk 7 butir soal (23,33%), buruk 3 butir soal (10%),
agak baik 4 butir soal (13,33%), baik 11 butir soal (36,67%), dan sangat baik 5 butir
soal (16,67%) dan bentuk soal uraian sangat buruk 1 butir soal (20%) dan buruk 4
butir soal (80%). (5) Ditinjau dari efektivitas pengecoh/distractor berfungsi sangat
baik 1 butir soal (3,33%), berfungsi baik 2 butir soal (6,67%), berfungsi cukup 7
butir soal (23,34%), berfungsi kurang baik 10 butir soal (33,33%), dan berfungsi
tidak baik 10 butir soal (33,33%). (6) Kualitas butir soal pada soal pilihan ganda
termasuk kualitas baik berjumlah 8 soal (26,67%), kualitas kurang baik 4 soal
(13,33%), kualitas tidak baik 18 soal (60%). Sedangkan pada soal uraian, kualitas
tidak baik berjumlah 5 soal (100%).
Penelitian yang dilakukan oleh Muslika Purwanti (2014) dengan judul “Analisis
Butir Soal Ujian Akhir Mata Pelajaran Akuntansi Keuangan Menggunakan Microsoft
Office Excel 2010” menyatakan bahwa Hasil penelitian menunjukkan bahwa: (1)butir
soal pilihan ganda valid 19 butir (63,33%), soal tidak valid 11 butir (36,67%), soal
uraian valid 3 butir (75%), tidak valid 1 butir (25%); (2)soal pilihan ganda indeks
reliabilitas menunjukkan angka 0,660, uraian sebesar 0,50 sehingga tidak reliabel;
(3)bentuk soal pilihan ganda 4 butir (13,33%) kategori sukar, 9 butir soal (30%) sedang,
dan 16 butir (56,67%) mudah, bentuk soal uraian 4 butir (100%) kategori soal tingkat
kesulitan sedang; (4)butir soal pilihan ganda dengan daya pembeda jelek 7 butir
(23,33%), cukup 7 butir (23,33%), baik 10 butir (33,33%), baik sekali 6 butir (20%),
bentuk soal uraian dengan daya pembeda jelek 1 butir (25%), cukup 1 (25%), dan baik
sekali 2 butir (50%); (5)bentuk soal pilihan ganda yang termasuk soal dengan pengecoh
atau distractor yang berkualitas 3 butir (10%) memiliki pengecoh sangat baik, 10 butir
41
(33,33%) baik, 11 butir (36,67%) cukup, 4 butir (13,33%) kurang baik, dan 2 butir
(6,67%) tidak baik.
Penelitian yang relevan selanjutnya adalah penelitian yang dilakukan oleh Rini
Nur Indasari (2014) dengan judul “Analisis Butir Soal Ujian Akhir Sekolah Mata
Pelajaran Sejarah Kelas XII IPS SMAN Ambulu Tahun Ajaran 2012/2013”.
Berdasarkan hasil penelitian yang dilakukan secara keseluruhan masih kurang sesuai
dengan teori evaluasi yaitu dengan presentase 27% kategori mudah, 46% kategori
sedang dan 27% kategori sukar. Hasil analisis yang diperoleh untuk butir soal tipe A
adalah 36% untuk kategori mudah, 42% sedang, dan 22% akan tetapi angka tersebut
masih belum memenuhi kriteria dari teori evaluasi. Maka berdasarkan hasil penelitian
diatas perlu adanya perbaikan soal agar dalam pembuatan soal selanjutnya bisa sesuai
dengan kriteria teori evaluasi.
Kasus terkait tidak adanya upaya analisis kualitas soal juga terjadi pada mata
pelajaran sejarah. Pendidik cenderung langsung meminta peserta didik untuk langsung
mengerjakan soal-soal yang telah disusun. Pentingnya dilakukan penelitian ini untuk
memperbaiki kualitas pembelajaran sejarah disekolah dilihat dari segi hasil belajar
peserta didik. Perbedaan penelitian yang akan dilakukan dengan penelitian terdahulu
terletak pada soal yang akan dianalisis. Pada penelitian ini dilakukan pada soal formatif
karena di Kelas X SMA Negeri 1 Jember sistem belajarnya berbasis UKBM (Unit
Kegiatan Belajar Mandiri) dalam program ini tidak terdapat kegiatan UTS dan UAS
berbeda dengan kelas XI dan XII yang masih menggunakan sistem lama. Karena hal
tersebut ujian formatif sangat berpengaruh pada hasil belajar peserta didik dan ini
menentukan peserta didik untuk dapat lanjut pada materi selajutnya bahkan kenaikan
kelas. Selain karena soal formatif menjadi penentu hasil belajar peserta didik tetapi juga
karena peneliti mencari penelitian terkait analisis soal mata pelajaran sejarah masih sulit
ditemukan. Kebanyakan analisis dilakukan pada bidang pelajaran sedangkan pada
bidang pelajaran sosial ditemukan di mata pelajaran ekonomi dan akuntansi. Karena
jarangnya penelitian pada mata pelajaran sejarah perlu dilakukan penelitian ini.
42
2.7 Kerangka Berfikir
Kegiatan evaluasi dalam pendidikan merupakan hal yang sangat penting untuk
dilakukan untuk mengetahui ketercapaian tujuan dari pelaksaan pendidikan.
Pelaksanaan evaluasi sebagai kegiatan pengendalian, penjaminan, dan penetapan mutu
pendidikan sebagai bentuk pertanggung jawaban penyelenggaraan pendidikan yang
berkaitan dengan peserta didik, program sekolah dan lembaga sekolah (Tayibnapis,
2008). Maka dapat disimpulkan bahwa pelaksanaan evaluasi perlu dilakukan agar dapat
mengukur sejauh mana tujuan pendidikantelah tercapai. Selain itu evaluasi yang
dilakukan pada proses pembelajaran juga penting karena dapat diketahui sejauh mana
materi yang telah diajarkan dapat dikuasai oleh peserta didik, adanya evaluasi hasil
belajar dapat membuat pendidik memiliki gambaran sejauh mana peserta didik
mencapai tujuan yang telah direncanakan, dapat dijadikan pedoman oleh pendidik untuk
pelaporan hasil belajar kepada orang tua peserta didik, dan pengambilan keputusan
selanjutnya baik adanya perbaikan ataupun peningkatan.
Kegiatan evaluasi dapat dilakukan menggunakan suatu teknik yang bisa
mengukur keberhasilan kegiatan pembelajaran. Teknik ini dibagi menjadi dua macam
yaitu teknik tess dan teknik non tes. Teknik tes merupakancara pengambilan data
melalui tes yang merupakan alat, prosedur, atau rangkaian kegiatan yang digunakan
untuk memperoleh gambaran tentang kemampuan peserta didik dalam suatu bidang
pelajaran tertentu. Sedangkan teknik non tes merupakan seperangkatpertanyaan atau
pernyataan yang tidak memiliki jawaban benar atau salah. Realita yang ada pendidik
lebih banyak menggunakan teknis evaluasi berbentuk tes baik itu tes objektif maupun
subjektif. Tes objektif merupakan jenis tes tulis yang itemnya dapat dijawab dengan
memilih jawaban yang telah disediakan dan tes subjekti merupakan sejenis tes
kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-
kata.
Permasalahan yang sering muncul terkait dengan penilaian hasil belajar menurut
Kunandar (2013:62-63) adalah (1) nilai yang diberikan oleh seorang pendidik terdapat
perbedaan dari pendidik lainnya dalam hal mata pelajaran yang sama. Hal ini dapat
43
diatasi dengan penggunaan instrumen penilaian yang terstandar (valid dan reliabel) dan
mengacu pada pedoman yang objektif, (2) hasil penilaian tersebut belum sepenuhnya
menggambarkan pencapaian kompetensi sesungguhnya dari peserta didik. Hal ini dapat
mengakibatkan informasi hasil belajar peserta didik yang dilakukan kurang valid dan
akurat serta dapat merugikan peserta didik, (3) mutu instrumen atau soal yang
dihasilkan masih belum valid dan reliabel, hal ini terjadi akibat dari penulisan soal yang
tergesa-gesa bahkan terdapat pendidik yang mengambil soalnya dari soal yang ada di
buku teks atau LKS, (4) soal yang dijadikan alat evaluasi pembelajaran biasanya
langsung dipakai tanpa adanya uji coba terlebih dahulu terkait mutunya. Idealnya soal
sebagai alat ukur pembelajaran harus dirancang secara seksama dengan memperhatikan
kaidah penulisan instrumen atau soal dan karakteristik materi atau kompetensi yang
hendak di ukur. Selain permasalahan tersebut terdapat pula hal-hal yang kurang
diperhatikan oleh pendidik dalam melakukan kegiatan peni;aian hasil belajar peserta
didik, diantaranya (1) materi yang diujikan adalah materi yang kurang esensial atau
bukan materi pokok sebagai subtansi dari kompetensi yang harus dikuasai. Hal ini
ditandai dengan seringnya penyusunan instrumen dengan menilai umumnya saja
dengan tingkat kognitif C1-C3. Maka instrumen tersebut belum mengukur kemmapuan
berpikir tingkat tinggi, analisis, dan pemecahan masalah. (2) belum semua pendidik
menyususn soal dengan membuat kisi-kisi soal terlebih dahulu. Akibatnya instrumen
yang dihasilkan belum mampu mengukur tingkat pencapaian dan kompetensi yang
tepat. (3) tidak semua pendidik menyusun pengecoh dan kunci jawaban yang tepat pada
soal objektif. Hal ini berdampak pada mutu soal yang belum terjamin dengan baik
(Kunandar, 2013:64-65).Sedangkanpermasalahan terkait soal-soal yang ada dalam
evaluasi formatif yang dijalankan di kelas X SMA Negeri Jember belum dilakukan
analisis butir soal. Evaluasi formatif berperan penting bagi peserta didik kelas X
dikarenakan sistem pembelajaran mereka yang berbeda dari kelas XI dan XII. Peserta
didik kelas X sangat bergantung pada nilai formatif untuk mencapai ketuntasan belajar
dan dapat menerima materi selanjutnya. Selain itu hasil evaluasi formatif juga
digunakan untuk pelaporan hasil belajar dan penentu kenaikan kelas peserta didik.
program ini hanya dijalankan dpada kelas X SMAN 1 Jember sebagai sekolah rujukan
44
dikabupaten jember. Program belajar mereka yang berbasis UKBM (Unit Kegiatan
Belajar Mandiri) dimana tidak ada evaluasi selain formatif yang dijalankan. Kelas X
berbeda dengan kelas diatasnya yang masih adanya evaluasi dalam bentuk UTS dan
UAS. Pendidik mata pelajaran sejarah kelas X belum melakukan analisis soal dari segi
kualitas soalnya. Hal ini terjadi karena keterbatasan waktu pendidik sehingga tidak
sempat untuk melakukan analisis.Permasalahan belum terindentifikasinya kualitas soal
yang diberikan oleh pendidik sebagai alat ukur hasil belajar sejarah ini dapat dipecahkan
dengan cara menganalisis kualitas soalnya. Analisis kualitas soal ini dapat dilakukan
melalui uji validitas, reliabilitas, tingkat kesukaran, daya beda dan efektifitas pengecoh.
Cara ini telah terbukti dari hasil penelitian terdahulu yang telah dipaparkan sebelumnya.
Setelah dilakukannya kegiatan analisis soal formatif ini diharapakn soal-soal yang ada
memiliki kualitas yang baik sehingga mampu mengukur ketercapaian tujuan
pembelajaran.
Penelitian ini menggunakan program Microsoft Office Excel 2010. Analisis
menggunakan program Microsoft Office Excel 2010 lebih memudahkan pendidikdalam
melakukan analisis, karena hasil analisis lebih mudah dipahami sehingga akan lebih
membantu. Penggunaan program Microsoft Office Excel 2010 biasanya sudah secara
langsung terinstallangkah pertama secara langsung mengisi jawaban peserta didik pada
kolom yang tersedia (tidak perlu benar = 1, salah = 0), jika terjadi kesalahan dalam
pengetikan jawaban peserta didik maka pada kolom status akan muncul keterangan dan
peringatan sesuai kesalahan (lebih/kurang). Pada daftar hasil ujian dilengkapi dengan
skor (salah, benar, jumlah skor), nilai ujian, dan ketercapaian peserta didik (terlampaui,
tercapai, tidak tercapai). Analisis butir soal dilengkapi dengan indek daya pembeda
(DP) dan indek tingkat kesukaran (TK) yang sekaligus terdapat interpretasi status soal
(diterima, ditolak, diperbaiki).
45
Kerangka Berpikir
2.1 Gambar Kerangka Berpikir
Soal Formatif Semester Genap pada Mata Pelajaran Sejarah Kelas X IPS SMAN
1 Jember Tahun Ajaran 2017/2018
Lembar Jawaban dan Kunci Jawaban
AnalisisButir Soal Pilihan Ganda
Reliabilitas Validitas Fungsi
Pengecoh
Daya
Pembeda
Tingkat
Kesukaran
Kualitas Soal Formatif Semester Genap pada Mata Pelajaran Sejarah Kelas X
SMAN I Jember Tahun Ajaran 2017/2018
46
BAB 3. METODE PENELITIAN
3.1 Jenis Penelitian
Jenis penelitian yang digunakan dalam penelitian ini adalah penelitian Evaluatif
Penelitian evaluatif merupakan penelitian yang menuntut persyaratan yang harus
dipenuhi, yaitu adanya kriteria, tolok ukur, atau standar yang digunakan sebagai
pembanding bagi data yang diperoleh, dan data yang telah diolah tersebut merupakan
kondisi nyata dari objek yang diteliti. Lebih jauh lagi, kesenjangan antara kondisi nyata
dengan kondisi harapan yang dinyatakan dalam kriteria itulah yang dicari sehingga akan
diperoleh gambaran apakah objek yang diteliti sudah sesuai, kurang sesuai, atau tidak
sesuai dengan kriteria. Menurut Arikunto (2014:36) penelitian ini bertujuan untuk
memaparkan atau mendeskripsikan data atau informasi yang telah dikumpulkan untuk
dibandingkan dengan kriteria kemudian diambil kesimpulan.
Pendekatan yang digunakan dalam penelitian ini adalahcampuran yaitu
pendekatan kuantitatif dan kualitatif (Creswell, 2016:5). Pendekatan campuran
merupakan pendekatan yang melibatkan pengumpulan data kuantitatif dan kualitatif,
penggabungan dua bentuk data dan penggunaan rancangan yang berbeda. Kombinasi ini
dapat memberikan pemahaman lebih lengkap dari pada hanya satu pendekatan saja.
Pendekatan kuantitatif digunakan untuk mengukur kualitas soal formatif semester genap
pada mata pelajaran sejarah kelas X SMA Negeri 1 Jember yang akan dibuktikan
melalui perhitungan angka-angka. Sedangkan pendekatan kualitatif digunakan untuk
menjelaskan data-data hasil penelitian secara keseluruhan. Sehingga data numerik hasil
dari kegiatan analisis kuantitatif dapat dipahami secara mudah dan mendalam.
3.2 Tempat dan Waktu Penelitian
a. Tempat Penelitian
Penelitian ini akan dilakukan di SMA Negeri 1 Jember pada kelas X IPS
yang menggunakan kurikulum 2013 revisi dan Menggunakan sistem belajar
47
UKBM (Unit Kegiatan Belajar Mandiri) dalam pelaksanaan program sitem
kredit semester.
Alasan penelitian dilakukan karena (1) peserta didik kelas X sistem
pembelajaran menggunakan UKBM (unit Kegiatan Belajar Mandiri) dimana
tidak terdapat UTS dan UAS sehingga formatif menjadi penentu ketuntasan
belajar, (2) belum dilakukannya analisis soal berdasarkan validitas, reliabilitas,
tingkat kesukaran, daya beda dan efektifav penyecoh, (3) belum ada penelitian
sejenis pada mata pelajara sejarah, (4) kesediaan SMA Negeri 1 Jember sebagai
tempat penelitian; (5) sekolah ini menjadi sekolah rujukan di wilayah kabupaten
jember sehingga terkait sistem pembelajaran, program pembelajaran, sumber
pembelajaran dan evaluasi pembelajaran lebih berbeda atau bahkan menjadi
panutan bagi sekolah-sekolah negeri lainnya dan (6). Pentingnya analisis soal
formatif karena evaluasi ini menjadi penentu hasil belajar peserta didik dan
kenaikan kelas.
b. Waktu Penelitian
Waktu untuk melakukan penelitian ini adalah pada bulan Mei 2018.
Pemilihan ini dikarenakan bertepatan dengan kegiatan ujian formatif yang akan
dilakukan terkait mengukur hasil belajar pada semester genap pada kelas X IPS
di SMAN 1 Jember.
3.3 Populasi, Sampel dan Objek Penelitian
a. Populasi
Populasi menurut Sugiyono (2012:80) adalah wilayah generalisasi yang
terdiri atas objek atau subjek yang mempunyai kuantitas dan karakteristik
tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik
kesimpulannya. Populasi dalam penelitian ini adalah seluruh peserta didik kelas
X IPS SMA Negeri 1 Jember tahun ajaran 2017/2018 yang terdiri dari 2 kelas
yaitu Kelas X IPS 1 dan X IPS 2.
48
Tabel 3.1 Daftar Kelas X IPS SMAN 1 Jember
Kelas Jumlah Siswa
X IPS 1 28
X IPS 2 27
Jumlah Total 55
b. Sampel
Sampel menurut Sugiyono (2012:80) adalah sebagian dari sejumlah dan
karakteristik yang dimiliki oleh populasi tersebut. Pemilihan sampel dalam
penelitian ini dilakukan dengan melihat hasil ujian formatif dari 2 kelas yang
ada. Penilaian hasil ujian yang lebih rendah berdasarkan nilai rata-rata akan
dijadikan sampel dalam penelitian ini. Selain itu terkait pendalaman materi
sejarah lebih mendalam di kelas X IPS karena adanya sejarah peminatan. Hal ini
dikarenakan untuk melihat seberapa baik kualitas soal yang digunakan
berdasarkan hasil ujian sebelumnya. Berdasarkan presentasi ketuntasan kelas X
IPS 1 sebesar 75% dan kelas X IPS 2 sebesar 62,96%. Maka sampel dalam
penelitian akan dilaksanakan di kelas X IPS 2 karena nilai prosentasi
ketuntasannya lebih rendah dibandingkan kelasX IPS 1.
c. Objek Penelitian
Objek dalam penelitian ini adalah butir soal formatif semester genap
kelas X IPS pada mata pelajaran sejarah peminatan tahun pelajaran 2017/2018 di
SMAN 1 Jember dengan Jumlah soal 50 butir bentuk pilihan ganda.
3.4 Definisi Operasional
Definisi operasional adalah penjelasan operatif yang disusun oleh peneliti
tentang variabel penelitiannya (Sanjaya, 2014: 287). Definisi operasional bertujuan agar
antara penulis dan pembaca memiliki persepsi terhadap pemaknaan variabel. Untuk
49
menghindari terjadinya kesalahan penafsiran yang terdapat dalam penelitian ini, maka
perlu adanya definisi operasional untuk beberapa istilah sebagai berikut:
Analisis yang dimaksud dalam penelitian ini adalah kegiatan membaca,
mengkaji, mencatat, dan mengkategorikan soal berdasarkan aturan tertentu. Tes sebagai
alat penilaian maka keberadaannya wajib ada dalam setiap proses belajar mengajar baik
tes yang sudah tersedia dalam buku pelajaran maupun tes yang disusun sendiri untuk
mendapatkan nilai-nilai yang diharapkan. Maka tes mempunyai fungsi yang penting
terhadap keberadaannya.
Secara umum ada dua macam fungsi yang dimilki oleh tes yaitu (1) sebagai alat
pengukur terhadap peserta didik. lebih jelasnya tes berfungsi untuk mengukur tingkat
perkembangan atau kemajuan yang telah dicapai oleh peserta didik setelah mereka
menempuh proses belajar mengajar dalam jangka waktu tertentu, dan (2) sebagai alat
pengukur keberhasilan program pembelajaran. Melalui tes tersebut peserta didik akan
dapat di ketahui seberapa jauh penguasaannya terhadap materi yang diajarkan serta
seberapa tercapainya tujuan pembelajaran (Sudijono 1998:67; Susanti, 2015:15). Maka
pentingnya dilakukan analisis terhadap soal-soal yang akan dijadikan alat evaluasi pada
mata pelajaran sejarah kelas X IPS SMAN I Jember tahun jaran 2017/2018 melalui
tahapan Uji Validitas, Reliabilitas, Tingkat Kesukaran, Daya Bedadan efektifitas
pengecoh agar layak digunakan sebagai alat ukur dalam kegiatan pembelajaran
disekolah.
Validitas adalah suatu ketepatan mengukur yang dimiliki oleh instrumen tes
pada tiap butirnya yang menjadi bagian tak terpisahkan dari tes secara keseluruhan,
dalam mengukur apa yang seharusnya diukur oleh tes tersebut (Sudijono, 2011: 182).
Zainal Arifin (2014: 247) menyebutkan ada dua unsur penting dalam validitas yaitu
validitas menunjukkan suatu derajat dan validitas selalu dihubungkan dengan suatu
putusan atau tujuan yang spesifik. Suatu instrumen pengukur dapat dikatakan
mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Setiap butir soal yang dijawab dengan benar diberi skor 1,
sedangkan untuk setiap jawaban salah diberikan skor 0. Item-item yang ingin diketahui
50
validitasnya, yaitu valid ataukah tidak, dapat digunakan teknik korelasi sebagai teknik
analisisnya.
Reliabilitas merupakan tingkat atau derajat konsistensi dari suatu alat pengukur
atau instrumen Arifin (2014: 258). Reliabilitas dapat diartikan sebagai tingkat keajegan
hasil pengukuran dengan tes yang sama pada waktu yang berbeda. Sebuah instrumen
dikatakan memiliki tingkat reliabilitas yang tinggi apabila dapat dengan ajeg
memberikan data yang sesuai dengan kenyataan. Ajeg atau tetap tidak harus selalu
sama, tetapi mengikuti perubahan secara ajeg. Ajeg disini memiliki arti sama dalam
kedudukan peserta didik diantara anggota kelompok yang lain. Tentu saja tidak dituntut
selalu tetap kedudukannya. Besar ketetapanya inilah yang menujukkan tingkat
reliabilitas sebuah instrumen (Suharsimi Arikunto, 2013: 100-101). Realiabilitas suatu
instrumen dapat dinyatakan reliabel apabila reliabilitasnya sama atau lebih dari 0,07.
Apabila lebih kecil dari itu berarti tes belum memiliki reliabilitas tinggi. Menurut
(Sudiyono, 2009:209; Wahyudi, 2011:20) Tingkat Kesukaran adalah indikator yang
dapat menunjukkan kualitas butir soal. Soal yang baik adalah soal yang tidak terlalu
mudah dan tidak terlalu sulit ( Suharsimi Arikunto, 2013: 222). Soal yang terlalu mudah
tidak dapat merangsang peserta didik untuk mengembangkan kemampuannya dalam
memecahkan soal tersebut. Soal yang terlalu sulit akan membuat peserta didik menjadi
putus asa untuk mencoba lagi karena di luar kemampuan peserta didik.Peluang untuk
menjawab benar pada soal dengan kemampuan tertentu dan dinyatakan dalam bentuk
indeks. Menurut (Sugiyono, 2012) menyatakan bahwa indek kesukaran sebesar 0,00-
0,30 artinya soal terlalu sukar, jika derajatnya 0,30-0,70 berarti cukup atau sedang dan
jika lebih dari 0,70 maka soal terlalu mudah.Semakin besar indeks tingkat kesukaran
yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Perhitungan indeks
tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata
yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat
kesukaran butir soal. Menurut Novytasari (2014: 24)kriteria soal yang baik adalah jika
mempunyai perbandingan presentase indeks kesukaran (IK) sebagai berikut: termasuk
kategori soal yang sukar adalah 27%, kategori soal yang sedang adalah 46%, dan
kategori soal mudah adalah 27%.
51
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan
antara warga belajar/peserta didik yang telah menguasai materi yang ditanyakan dan
warga belajar/peserta didik yang tidak/kurang/belum menguasai materi yang ditanyakan
(Daryanto, 2008: 183). Perhitungan daya pembeda adalah pengukuran sejauh mana
suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi
dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria
tertentu (Arifin, 2014:273). Indeks daya pembeda berkisar antara -1,00 sampai +1,00.
Lebih rincinya jika angka indek 0,20 sampai 0,40 maka soal termasuk cukup, jika indek
berkisar 0,40-0,70 maka soal termasuk baik, dan jika indek berkisar 0,70-1,00 maka
soal masuk kategori baik sekali (Sudiyono, 2009:389). Menurut Sukidin(2012:177;
dalam Novytasari(2014: 24-25)Semakin tinggi indeks daya pembeda soal berarti
semakin mampu soal yang bersangkutan membedakan peserta didik yang memahami
materi dengan peserta didik yang belum memahami materi. Semakin tinggi daya
pembeda suatu soal maka semakin baik soal itu.
Efektifitas Fungsi pengecoh adalah kegiatan analisis yang dilakukan pada soal
tipe pilihan ganda. Soal pilihan ganda memiliki beberapa option atau alternatif. Option
biasanya terdiri 3-5 buah dan terdapat kemungkinan jawaban berada dalam pilihan
tersebut. Salah satu option tersebut merupakan jawaban betul. Pengecoh merupakan
option atau pilihan jawaban yang lain dari jawaban yang benar. Suatu option disebut
efektif jika memenuhi fungsinya atau tujuan disajikannya option tersebut tercapai.
Menurut Sudiyono, 2009 (dalam Wahyudi, 2011:24) Tujuan utama adanya pengecoh
adalah agar peserta didik sebagai peserta tes tertarik memilihnya. Pengecoh dikatakan
baik apabila sekurangnya dipilih oleh 5% dari semua peserta tes .
3.5 Prosedur Penelitian
Prosedur penelitian adalah langkah-langkah yang akan dilaksanakan dalam
penelitian secara berurutan dan sistematis guna memperoleh data yang dibutuhkan
untuk menjawab permasalahan secara sistematis. Prosedur kuantitatif dalam penelitian
ini adalah sebagaiberikut.
52
1) Mengumpulkan soal formatif semester genap dalam bentuk soal pilihan ganda
pada mata pelajaran sejarah kelas X IPS di SMA Negeri 1 Jember tahun ajaran
2017/2018.
2) Melakukan ujicoba soal untuk mengummpulkan hasil jawaban peserta didik.
3) Menganalisis kesesuaian soal yang telah dikumpulkan dari segi validitas butir
tes, reliabilitas, tingkat kesukaran, daya beda menggunakan microsoft office
excel 2010 yang dapat mudah dipahami oleh pendidik dalam menganalisisis
soal.
4) Mengkaji hasil dari semua data yang diperoleh secara kuantitatif
5) Memaparkan secara deskriptif hasil analisis data sebelumnya.
3.6 Metode Pengumpulan data
Pengumpulan data dimaksudkan untuk memperoleh informasi-informasi yang
relevan, akurat dan dapat digunakan dengan tepat sesuai dengan tujuan pendidikan.
Pengumpulan data yang digunakan dalam penelitian adalah wawancara dan
dokumentasi. Wawancara adalah kegiatan menngumpulkan informaasi dengan
mengajukan pertanyaan-pertanyaan yang rasa diperlukan. Dokumentasi merupakan
catatan peristiwa yang sudah berlalu. Dokumen bisa berbentuk tulisan, gambar, atau
karya-karya monumental dari seseorang (Sugiyono, 2013: 82). Menurut (Arikunto,
2014:158) Dokumentasiberasal dari kata dokumen, yang artinya barang-barang tertulis.
Didalam melaksanakan metode dokumentasi, penelitian menyelidiki benda-benda
tertulis seperti buku-buku, majalah, dokumen, peraturan-peraturan, notulen rapat, dan
sebagainya.
Metode pengumpulan data yang digunakan dalam penelitian ini adalah
wawancara terbuka untuk mendapatkan informasi terkait penyusunan soal dan
pelaksanaan ujian formatif dan metode dokumentasi dengan mengumpulkan soal
formatif yang digunakan di kelas X IPS di SMAN 1 Jember. Metode dokumentasi
diawali dengan mengumpulkandata prestasi peserta didik, silabus pembelajaran, kisi-
kisi soal, naskah soal formatif, kunci jawaban soal semester genap dari pendidik mata
53
pelajaran sejarah dan jawaban seluruh peserta didik kelas X IPS 2 soal formatif yang
diujicobakan.
3.7 Teknik Analisis Data
Analisisk kualitas soal dilakukan dengan menggunakan Item Response Theory
(IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan
fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu soal
dengan kemampuanpeserta didik. IRT merupakan hubungan antara probabilitas jawaban
suatu butir soal yang benar dan kemampuan atau tingkatan/level prestasi peserta didik.
Kemudian akan dilakukan analisis kuantitatif menggunakan bantuan program komputer
yaitu Microsoft office Ecxel 2010 dengan menggunakan rumus sebagai berikut:
a. Uji Validitas Butir Tes
Uji validitas item soal dilakukan dengan rumus:
Keteragan :
Rxy = koefisien korelasi antara X dan Y
∑x = jumlah skor item
∑y = jumlah skor total
N = jumlah responden
Dalam perhitungan validitas item ini menggunakan bantuan Microsoft
Excel 2010, yaitu:
r xy > rt = valid
r xy = negative = tidak valid
r xy < rt = tidak validdimana : rt atau r tabel taraf signifikansi 5% = 0, 339
Interpretasi mengenai besarnya koefisien korelasi adalah sebagi berikut:
1. Antara 0,80 sampai dengan 1,00 : sangat tinggi
2. Antara 0,60 sampai dengan 0,80 : tinggi
3. Antara 0,40 sampai dengan 0,60 : cukup
54
4. Antara 0,20 sampai dengan 0,40 : rendah
5. Antara 0,00 sampai dengan 0,20 : sangat rendah (Arikunto, 2013:89)
b. Reliabilitas
Reliabilitas adalah suatu instrument untuk mengukur konsistensi atau
keajegan suatu tes. Pada soal pilihan ganda untuk mencari reliabilitas tes dapat
menggunakan Metode KR-20 dari Kuder Richan atau koefisien alpha (1937),
sebagai berikut:
Keterangan :
r11 = reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah
∑pq = jumlah perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes
Interpretasi terhadap hasil perhiungan koefisien reliabilitas tes pada
umumnya digunakan patokan sebagai berikut:
1. Apabila r11 sama dengan atau lebih besar daripada 0,70 berarti tes hasil
belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki
reliabilitas yang tinggi (=reliable).
2. Apabila r11 lebih kecil daripada 0,70 berarti bahwa tes hasil belajar yang
sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang
tinggi (un-reliable) (Arikunto, 2013: 209)
c. Tingkat Kesukaran
Bermutu atau tidaknya butir-butir item tes hasil belajar
pertamatamadapat diketahui dari derajat kesukaran atau taraf kesulitan
yangdimiliki oleh masing-masing butir item tersebut. Butir-butir item yangbaik
jika derajat kesukaran itemnya sedang.
55
Rumus untuk menghitung tingkat kesulitan adalah adalah:
P=𝐵
JS
Keterangan:
P = Indeks kesukaran
B = Banyaknya peserta didik yang menjawab soal dengan betul
JS = Jumlah seluruh peserta didik peserta tes
Interpretasi terhadap hasil perhitungan angka indeks kesukaran soal
pada umumnya menggunakan kriteria sebagai berikut:
1. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
2. Soal dengan P 0,31 sampai 0,70 adalah soal sedang.
3. Soal dengan P 0,71 sampai 1,00 adalah soal mudah.
Indeks kesukaran suatu butir yang baik terletak dalam kategori sedang
yakni pada interval 0,31 – 0,70. Pada interval ini, informasi tentang kemampuan
siswa akan diperoleh secara maksimal.
(Arikunto, 2013: 115).
d. Daya Pembeda
Daya beda dilakukan untuk membedakan antara peserta didik yang
pandai (berkemampuan tinggi) dengan peserta didik yang kurang
pandai(berkemampuan rendah).
Menghitung daya beda soal dengan cara
𝐷 =Ba−Bb
Ja−Jb = Pa-Pb
Keterangan:
Ba = Jumlah jawaban benar kelompok atas
Bb = Jumlah jawaban benar kelompok bawah
Ja = Jumlah peserta tes dalam kelompok atas
Jb = Jumlah peserta tes dalam kelompok bawah
Pa = Proporsi Peserta kelompok atas yang menjawab benar
56
Pb = Proporsi Peserta kelompok bawah yang menjawab benar
Butir soal yang baik adalah butir soal yang mempunyai indeks daya beda
atau indeks diskriminasi lebih dari 0,3. Berikut ini klasifikasi indeks daya beda
dan keterangannya:
1. Antara 0,40 keatas : sangat tinggi
2. Antara 0,30 sampai dengan 0,39 : tinggi
3. Antara 0,20 sampai dengan 0,29 : cukup
4. Antara 0,00 sampai dengan 0,19 : rendah
e. Efektifitas Pengecoh
Efektifitas penggunaan pengecoh atau distractor dapat diketahui dengan
melihat pola sebaran jawabanpeserta didik.Pola sebaran jawaban diperoleh
dengan menghitung banyaknya testee yang memilih jawaban atau yang tidak
memilih apapun. berdasarkan pola sebaran jawaban dapat ditentukan apakah
pengecoh dapat berfungsi atau tidak.Suatu butir soal dapat dikategorikan sebagai
soal yang baik apabila pengecoh dapat berfungsi dengan baik.Sebuah pengecoh
atau distractor dapat dikatakan berfungsi dengan baik apabila pengecoh tersebut
mempunyai daya tarik yang besar bagi peserta tes yang kurang memahami
konsep atau kurang menguasai materi.
Rumus menghitung efektifas pengecoh
%= ∑𝑑𝑡 Jumlah distraktor terpilih
∑𝑑𝑡 Jumlah seluruh peserta tes x100%
Keterangan :
% : Prosentase efektifitaspengecoh
∑dt : Jumlah distraktorterpilih
∑dt : Jumlah keseluruhan peserta didik yang ikut tes
Pengecoh yang baik ditandai dengan dipilih oleh sedikitnya 5% dari
peserta tes.Jadi apabila suatu alternatif pilihan jawaban yang salah memiliki
indeks pengecoh lebih dari 0,05 maka alternatif jawaban tersebut berfungsi
dengan baik.
57
3.8 Penarikan Kesimpulan
Kegiatan ini dilakukan untuk menafsirkan uraian teori-teori serta analisis data
sehingga menjadi kesimpulan bermakna yang dapat menjawab pertanyaan dari
penelitian.
Setelah dianalisis menurut masing-masing kriteria, butir-butir soal kemudian
dianalisis secara kesuluruhan berdasarkan kriteria validitas, reliabilitas, tingkat
kesukaran, daya pembeda, dan efektivitas pengecoh hendaknya dapat dimasukkan ke
dalam bank soal yang memenuhi syarat yaitu:
1. Butir soal tergolong sangat valid/valid.
2. Butir soal tergolong reliabel tinggi.
3. Memiliki daya pembeda yang tinggi.
4. Memiliki tingkat kesukaran item sedang atau cukup.
5. Semua pengecoh berfungsi dengan baik.
58
DAFTAR PUSTAKA
Aiken, L.R. 1995. Psychological Testing and Asessment. Boston: Allyn and Bacon.
Anastasi, A & Urbina, S. 1997. Psycological Testing. New Jersey: Prentice Hall, Inc.
Azwar, S. 2013. Sikap Manusia: Teori dan Pengukurannya. Yogyakarta: Pustaka
Pelajar.
Arifin, Zainal. 2012. Evaluasi Pembelajaran (Edisi Revisi). Jakarta. Direktorat Jendral
Pendidikan Islam Kementrian Agama.
Arifin, Z. 2014. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Arikunto, S. 2013. Dasar-Dasar Evaluasi Pendidikan.Jakarta: Bumi Aksara.
Arikunto, S. 2014. Prosedur Penelitian : Suatu Pendekatan Praktik. Jakarta.: PT Rineka
Cipta.
Aziz, A. 2017. Peningkatan Mutu Pendidikan. Jurnal Pendidikan. Bangil: STAI
Pancawahana BangilVol 10 No 2 (2015): Pancawahana.
Brinkerhoff, R. O. et al. 1986. Program Evaluation: A Practitioner's Guide for.
Trainers and Educators. Fourth Printing. Massachusetts: Kluwer-Nijhoff.
Publishing.
Creswell, J.W. 2016. Research Design: Pendekatan Metode Kualitatif, Kuantitatif, dan
Campuran (Terjemahan Edisi 4). Yogyakarta: Pustaka Pelajar.
Darmawan, D. 2013. Metode Penelitian Kuantitatif. Bandung: Remaja Rosdakarya.
Depdiknas. 2007. Panduan Penulisan Soal Pilihan Ganda. Jakarta: Pusat Penilaian
Pendidikan Balitbang Depdiknas.
Djamarah, S. 2005. Guru dan Anak didik dalam interaksi edukatif suatu pendekatan
teoritis psikologis. Jakarta:PT. Rineka Cipta.
Djiwandono, S. 2008. Tes Bahasa dalam Pengajaran. Bandung: ITB.
Diana, A.L & Soekirno, S. 2017. Peningkatan Aktivitas Belajar dan Hasil Belajar
Melalui Model Pembelajaran Kooperatif Tipe Think, Pair, Share pada Mata
Pelajaran Matematika Siswa Kelas III Sekolah Dasar Negeri 02 Wonosari
Gondangrejo Tahun Pelajarn 2016/2017. Artikel. Surakarta: Universitas
Slamet Riyadi Surakarta.
59
Ghazali, N.H.Md. 2016. A Reliability and Validity of an Instrument to Evaluate the
Chool-Based Assessment System: A Pilot Study. Jurnal. Malaysia: Universiti
Pendidikan Sultan Idris Malaysia.
Gundogan, A et.cl. Test of Creative Imagination: Validity and Reliability Study. Jurnal.
Ankara, Turkey: Hacettepe University.
Griffin, P. & Nix, P. 1991. Educational Assessments and Reporting. Sidney: Harcout
Brace
Gronlund, N.E. & Linn, R.L .(1990). Measurement and Evaluation in Teaching (6th
ed).
New York: MacMilan Pulishing Company.
Gronlund, E. Norman.1982. Constructing Achievement Test. London: Prentice Hall.
Hasan, Samid. 2009. Evaluasi Kurikulum. Bandung: PT Remaja Rosdakarya.
Isnaini, A. 2017. Analisis Kualitas Butir Soal Ujian Akhir Semester Genap Mata
Pelajaran Ekonomi Kelas XI SMA Islam Sudirman Purworejo Tahun
Pelajaran 2016/2017. Skripsi. Purworejo: Universitas Muhammadiyah
Purworejo.
Ismail, F. 2018. Manajemen Berbasis Sekolah: Solusi Peningkatan Mutu Pendidikan.
Jurnal. Manado: IAIN Manado. Vol 2(2).
Jihad, A & Haris, A. 2012. Evaluasi Pembelajaran. Yogyakarta: Multi Presindo.
Kartowagiran, B. 2012. Penulisan Butir Soal. (tidak diterbitkan). Yogyakarta:
Universitas Negeri Yogyakarta.
Kizlik, B. 2014. Measurement, Assessment, and Evaluation in Education. Jurnal.
Diakses darihttps://www.cloud.edu/Assets/PDFs/assessment/Assessment
%20_%20Evaluation_Measurement.pdf pada 30 April 2018 pukul 06:01
WIB.
Kunandar, 2014. Penilaian Autentik (Penilaian Hasil Belajar Peserta Didik Berdasarkan
Kurikulum 2013) Suatu Pendekatan Praktis. Jakarta: PT. Grafindo Persada.
Kusaeri dan Suprananto. 2012. Pengukuran dan Penilaian Pendidikan.Yogyakarta:
Grha Ilmu.
Linn, R.L. & Gronlund, N.E. 1995. Measurement and Asessment in Teaching (7th
ed).
Ohio: Prentice Hall.
60
Lincoln, Y.S. & Guba, E.G. 1985. Naturalistic Inquiry. Newbury Park, CA: Sage
Publications.
Majid, A. 2014. Penilaian Autentik Proses dan Hasil Belajar. Bandung: PT. Remaja
Rosdakarya Offset.
Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Nontes. Yogyakarta: Mitra
Cendekia.
Muhson, A. 2015. Panduan Penggunaan Anbuso Versi 6.1. Yogyakarta: Universitas
Negeri Yogyakarta.
Mulyasa, E. 2005. Kurikulum Tingkat Satuan Pendidikan. Bandung: PT. Remaja
Rosdakarya.
Nitko, A.J. 1996. Curriculum Based Assessment: Workshop Papers. Jakarta: Dikmenum
Puslitbang Sisjan Depdikbud.
NovytasarI, Y.T. 2014. Analisis Butir Soal Pilihan Ganda Menggunakan Teori
Pengukuran Klasik Pada Ulangan Umum Akhir Semester Genap Bahasa
Prancis SMA Negeri 9 Yokyakarta Tahun Ajaran 2013/2014.Skripsi.
Yokyakarta : Universitas Negeri Yokyakarta.
Nurgiyantoro, B. 2011. Penilaian Pembelajaran Bahasa. Yogyakarta: BPFE.
OECD, PISA. 2018. PISA (Programme for International Student Assessment) 2015 In
Focus. Diakses dari laman https://www.oecd.org/pisa/pisa-2015-results-in-
focus.pdf pada 04 April 2018 pukul 16:00 WIB.
Pemerintah Republik Indonesia. 2003. Undang-Undang Republik Indonesia No. 20
Tahun 2003 Tentang Sistem Pendidikan Nasional, Jakarta.
Peraturan pemerintah N0. 74. 2008. Tentang Pendidik. Diakses dari https://
unnes.ac.id/wp-content/uploads/PP_74_Tahun_2008.pdf pada 12 April 2018
pukul: 10:12 WIB.
Peraturan pemerintah No.19.2005. Tentang Standar Nasional Pendidikan. Diakses dari
https://kemenag.go.id/file/dokumen/PP1905.pdf pada 12 April 2018 pukul
11:30 WIB.
Permendikbud. No. 23 Tahun 2016. Tentang Standar Penilaian Pendidikan. Diakses dari
http://bsnp-indonesia.org/wpcontent/uploads/2009/09/PermendikbudTahun
2016Nomor023.pdf pada 12 April 2018 pukul 13:00 WIB.
Popham, W. J. 1995. Classroom Assesment: What Teacher Need to Know. Boston:
Allyn and Bacon.
61
Pramana, Y.A. 2013. Aplikasi Microsoft Excel 2010 untik Menganalisis Butir Soal
Pilihan Ganda. Skripsi. Semarang: Universitas Negeri Semarang.
Purwanto, Ngalim. 2013. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran.Bandung:
PT. Remaja Rosdakarya.
Purwanto. 2011. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Pelajar.
Ratnawulan, E & Rusdiana.2014. Evaluasi Pembelajaran. Bandung: Pustaka Pelajar.
Sanjaya, W. 2014. Penelitian Pendidikan Jenis Metode dan Prosedur. Jakarta: Kencana.
Sax, Gilbert. 1980. Principles of Educational and Psychological Measurement and
Evaluation (2nd
edition). California: Wadsworth Publishing Company.
Sisdiknas. 2003. Sistem Pendidikan Nasional. Diakses dari http://kelembagaan.
ristekdikti.go.id/wpcontent/uploads/2016/08/UU_no_20_th_2003.pdf pada
12 April 2018 pukul 09:42 WIB.
Shorck, S.A & Coscarelli, W.C. 1989. Criterion- Referenced Test
Development:Technical and Legal Guidelines for Corporate
Training.Addison Wesley Longman Publishing Co (1755).
Slameto. 2001. Evaluasi Pendidikan. Jakarta: PT. Bumi Aksara
Slameto. 2003. Belajar dan Faktor-Faktor yang Mempengaruhi Edisi Revisi. Jakarta:
Rineka Cipta.
Stufflebeam, D. L. 1971. Educational Evaluation and Decision Making (4th
Edition).
Itasca, Illinois, USA: F.E. Peacok Publishers, Inc.
Stufflebeam, D. L., & Shinkfield A. J.1985. Sistematic Evaluation: A self- Instructional
Guide to Theory and Practice. Boston: Kluwer-Nijhoff Publishing.
Subali, B. 2014. Evaluasi Pembelejaran (Proses dan Produk). Purwokerto. Universitas
Muhammadiyah Purwokerto.
Sudijono, A. 2009. Pengantar Evaluasi Pendidikan. Yogjakarta: PT Raja Grafindo
Persada.
Sudjana, N. 2009. Penilaian Hasil Proses Belajar Mengajar. Bandung : PT. Remaja
Rosdakarya.
Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT. Raja Grafindo
62
Sugiyono. 2012. Metode Penelitian Kuantitatif, Kualitatif, dan R&D.
Bandung:Alfabeta.
Sukidin. 2012. Asesmen Berbasis Kompetensi. Jember: Center for Society
Studies(CSS).
Sukiman. 2008. Bahan Ajar Mata Kuliah Pengembangan Sistem Evaluasi PAI,
Surapranata, S. 2009. Analisis, Validitas, Reliabilitas, dan Intepretasi Hasil Tes:
Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya.
Susanti, N.Y. 2015. Analisis Tingkat Kognitif Uji Kompetensi pada Buku Sekolah
Elektronik (BSE) Matematika SMP/MTs Kelas VII Kurikulum 2013
Berdasarkan Taksonomi Bloom. Skripsi. Jember:Universitas Jember Press.
Tayibnapis, F.Y. 2008. Evaluasi Program dan Instrumen Evaluasi untuk Program
Pendidikan dan Penelitian. Bandung: Rineka Cipta.
Tjalla, A. Potret Mutu Pendidikan Indonesia Ditinjau dari Hasil-Hasil Studi
Internasioanal. Jurnal. Jakarta: Universitas Negeri Jakarta.
Toksosz, S & Ertunc, A. 2017. Item Analysis of a Multiple Choice Exam. Jurnal.
Turkey. University, İstiklal Yerleşkesi Turkey.
Umamah, N. 2014. Bahan Ajar : Perencanaan Pembelajaran Bidang Studi. Jember:
Universitas Jember.
Undang-undang No. 20 tahun 2003 tentang Sistem pendidikan Nasional.
Utami, I. 2016. Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap
Tahun Pelajaran 2014/2015 Mata Pelajaran PKn Kelas IV SD di Kecamatan
Depok, Sleman, Yogyakarta. Skripsi. Yogyakarta: Universitas Sanata
Yogyakarta.
Wahyudi, D. 2011. Analisis Kualitas Butir Soal Mata Pelajaran Pendidikan Agama
Islam dalam Pencapaian Kompetensi Siswa SMA Negeri 2 Kebumen.
Skripsi. Yogyakarta: Universitas Islam Negeri Sunan Kalijaga Yogyakarta.
Werdiningsih, G. 2015. Analisis Kualitas Butir Soal Ulangan Akhir Semester Gasal
Mata Pelajaran Ekonomi Kelas XII IPS SMAN 2 Banguntapan Tahun
Ajaran 2014/2015. Skripsi. Yogyakarta: Universitas Negeri Yogyakarta.
Widoyoko, E. P. 2009. Evaluasi Program Pembelajaran (Instructional Program
Evaluation). Yogyakarta: Pustaka Pelajar.
63
Wijayanti, H. 2014. Analisis Butir Soal Objektif UAS Semester Genap Kelas VII Mata
Pelajaran Ilmu Pengetahuan Sosial (IPS) Tahun Pelajaran 2013/2014 Di
SMP 3 Balung.Skripsi. Jember. Universitas Jember Press.
Yulista H., Zulfan, & M. Arifin. Analisis Tingkat Kesukaran Soal dan Daya Pembeda
Soal Mata Pelajaran Sejarah Kelas Xi Semester Ganjil di SMA Negeri 5
Banda Aceh Tahun Pelajaran 2015-2016.Jurnal. Banda Aceh: Universitas
Syiah Kuala. Yuniarti, A.D. 2013. Analisis Butir Soal Olimpiade Ekonomi VI pada Prodi Pendidikan
Ekonomi FKIP UNEJ Tingkat SMA Sederajat. Skripsi. Jember. Universitas
Jember Press.
64
Lampiran 1.1 MATRIK PENELITIAN
Judul Permasalahan Variabel Indikator Sumber Data Metode Penelitian
Analisis Kualitas
Soal Formatif
Semester Genap
Pada Mata
Pelajaran Sejarah
Kelas X Ips
Sman 1 Jember
Tahun Ajaran
2017/2018
Bagaimanakah
kualitas soal
Formatif Semester
Genap Mata
Pelajaran Sejarah
Kelas X di SMAN
1 Jember Tahun
Ajaran 2017/2018?
Soal
Formatif
Kelas X
IPS
1. Tingkat
Validitas
itemsoal
2. Tingkat
reliabilitas
3. Tingkat
kesukaran
4. Tingkatdaya
pembeda
5. Efektifitas
pengecoh
soal
1. Informan
Pendidik
mata
pelajaran
sejarahkela
s X IPS
2. Naskahsoa
l formatif
3. Kunci
jawaban soal
4. Kisi-kisisoal
5. Kartusoal
6. Lembar
Jenis : Penelitian Evaluatif
Desain :Penelitian deskriptif kuantitatif
Teknik Analisis Data:
a. Validitas item
Keterangan :
rxy : Koefisien korelasi antara X dan Y
N : Jumlah sampel
X : Skor masing-masingsoal
Y : Skor total
b. Reliabilitas
Keterangan
r11 : Reliabilitas tes secara
keseluruhan
65
jawaban p : Proporsi subjek yangmenjawab
item dengan benar
q : Proporsi subjek yangmenjawab
item dengansalah
∑pq : Jumlah perkalian p danq
n : Sanyaknya item
S : Standar deviasi dari tes
c. Tingkat Kesukaran
Keterangan:
P : Indeks kesukaran
B : Banyaknya peserta didik menjawab
benar
JS: Jumlah peserta tes
d. Daya Pembeda
Keterangan:
Dp: Daya pembeda
66
Ba : Jumlah jawaban benar kelompok
atas
Bb : Jumlah jawaban benar
kelompok bawah
Ja : Jumlah peserta tes kelompok atas
Jb : Jumlah peserta tes kelompok
bawah
Pa : Proporsi peserta kelompok atas
menjawab benar
Pb : proporsi peserta kelompok
bawah menjawab benar
e. Efektifitas Pengecoh
%= ∑𝑑𝑡 Jumlah distraktor terpilih
∑𝑑𝑡 Jumlah seluruh peserta tes x100%
% : Prosentase efektifitaspengecoh
∑dt : Jumlah distraktorterpilih
∑dt : Jumlah keseluruhan peserta didik
67
Lampiran 1.2Lembar Hasil Wawancara
Lembar Hasil Wawancara
Nama peneliti : Anita Fitriawati
Nama pendidik : Alfianita Imansari, S.Pd.
Peneliti : Apakah penyususnan soal formatif pada mata pelajaran sejarah kelas X
IPS dilakukan oleh pendidik sendiri atau ada tim penyusun khusus
pembuat soal?
Pendidik : Pembuatan soal formatif mata pelajaran sejarah minat ya saya sendiri
mbak.
Peneliti : Apakah dilakukan kegiatan pembuatan kisi-kisi soal dan kartu soal
sebelum menyusun soal ujian?
Pendidik : Iya mbak, saya membuat kisi-kisi dan kartu soal terlebih dahulu. Namun
terkadang jika waktunya tidak memungkinkan saya hanya membuat kartu
soal saja.
Peneliti : Bagaimanakah bentuk soal yang digunakan untuk ujian formatif bu?
Pendidik : Biasanya saya sering menggunakan soal bentuk pilihan ganda, tetapi jika
terdapat beberapa peserta didik yang belum tuntas maka dilakukan
remedial dengan mengerjakan soal di UKBM atau soal lain yang saya
buat.
Peneliti : Kenapa ibu lebih memilih soal pilihan ganda untuk dijadikan alat ukur
hasil belajar peserta didik?
Pendidik : Lebih mudah penyusunan dan pengoreksiannya mbak karena soalnya
objektif jadi cepat koreksinya karena penskorannya langsung
menggunakan komputer mbak dari kunci jawaban yang dimasukkan.
Peneliti : Adakah kendala dalam penyususnan soal ujian bu?
Pendidik : Ya gampang-gampang susah mbak karena soalnya kan harus HOTs,
terkadang soal yang kita anggap sudah masih tergolong cukup mudah oleh
68
peserta didik dianggap soal paling susah. Jadi harus teliti mbak dalam
membuat soal.
Peneliti : Apakah dilakukan analisis terhadap butir soal yang akan diujikan bu?
Pendidik : Beberapa soal dilakukan analisis beberapa lagi langsung diujikan mbak.
Peneliti : Mengapa terkadang tidak dilakukan analisis terlebih dahulu bu?
Pendidik : Waktu yang tidak memungkinkan karena saya memegang banyak kelas
dan tidak sempat melakukan analisis
Peneliti : Apa saja bentuk analisis yang dilakukan bu, apakah analisis terkait materi,
level kognitif dan kualitas soal secara empirik?
Pendidik : Saya menganalisis terkait kesesuaian soal dengan kisi-kisi soal, kemudian
tingkat kesukaran soal berdasarkan tingkatan kognitif mbak dari kata
kerjanya misalnya C3 (menganalisis).
Peneliti : Apakah dilakukan analisis empirik (analisis dari hasil ujian terkait
validitas, reliabilitas, tingkat kesukaran, daya beda ) untuk melihat kualitas
soal yang digunakan?
Pendidik : Tidak mbak, jika sudah tuntas lanjut materi selanjutnya. Bagi peserta didik
yang belum tuntas dapat mengikuti ujian remedial agar tidak ketinggalan
materi selanjutnya.
Peneliti : Apakah sebelum soal diujikan dilakukan ujicoba terlebih dahulu?
Pendidik : Tidak mbak, saya langsung ujikan soal tersebut asal tingkat kesukarannya
sudah dianalisis.
69
Lampiran 1.3 Hasil Belajar Peserta Didik Ujian Formatif Bulan April
Kelas X IPS 1
KKM: 80
No. Nama Peserta Didik L/P Nilai Tuntas Belum
Tuntas
1. Afrizal Ramzy L 80 √
2. Ajeng Febrianti Nur Syarifah P 82 √
3. Alya Nurlyta P 80 √
4. Angela Wulan Verliana P 83 √
5. Ari Kurnianto L 73 √
6. Bunda Asmara P 78 √
7. Cut Gusti Ayu Esmeralda Putri P 83 √
8. Dita Syafira Balqis Nur Rachma P 82 √
9. Dyah Novita Rahmawati P 78 √
10. Fatin Nafisah Azzahra P 88 √
11. Fauziah Izzatun Nisaa’ P 83 √
12. Fio Intan Amaliah L 82 √
13. Gustom Agil Supriyanto L 76 √
14. Intan Maharani Putri Wibowo P 82 √
15. Maskana Putri Salwa P 85 √
16. Neni Heryanti P 74 √
17. Nur Wisam Muhammad L 83 √
18. Puguh Inawan Putra L 80 √
19. Rafli Priambodo L 75 √
20. Rossie Maharani P 68 √
21. Sally Agifta Shafira P 82 √
22. Salsabila Nafi’ah P 84 √
23. Shelly Anisa Nabila P 85 √
70
No. Nama Peserta Didik L/P Nilai Tuntas Belum
Tuntas
24. Syaroful Anam L 81 √
25. Tsabiitah Aqilah Ma’ruf L 80 √
26. Tunikannisa Arsy P 84 √
27. Widara Sekarputri P 82 √
28. Zufar Marsa Elmy P 88 √
Jumlah 2.343 21 7
Nilai rata-rata kelas = 𝐽𝑢𝑚𝑙𝑎 ℎ 𝑠𝑘𝑜𝑟
𝐽𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑙𝑢𝑟𝑢 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘
= 2343
38
= 83,67%
Nilai Klasikal
Presentase Ketuntasan = 𝐽𝑢𝑚𝑙𝑎 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘 𝑦𝑎𝑛𝑔 𝑡𝑢𝑛𝑡𝑎𝑠
𝐽𝑢𝑚𝑙𝑎 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘 𝑘𝑒𝑠𝑒𝑙𝑢𝑟 𝑢ℎ𝑎𝑛 × 100%
= 21
38 × 100%
= 75%
71
Lampiran 1.4 Hasil Belajar Peserta Didik Ujian Formatif Bulan April
Kelas X IPS 2
KKM: 80
No. Nama Peserta Didik L/P Nilai Tuntas Belum
Tuntas
1. Adinda Yulia Setyowati P 80 √
2. Ahmad Ananta Pria Geoferi Ardiana L 64 √
3. Aji Wisesa L 83 √
4. Amalia Tri Puspita Sari P 78 √
5. Anisya Carla Clarinda P 76 √
6. Bimantoro Eko Wardhana L 68 √
7. Carella Putri Muharomah P 77 √
8. Dela Dwi Santi P 78 √
9. Diva Amelia Maharani P 82 √
10. Erdita Nur Rahmawati P 86 √
11. Fauzi Naufal Hakim L 74 √
12. Fihrist Rayhan Deqauni L 68 √
13. Fisastri Nadya Septiani P 84 √
14. Ifana Yulia Rohmawati P 86 √
15. Ireniza Fitri Amita P 82 √
16. Jasmine Dejand Fathmarena P 84 √
17. Jasmine Qonitah Wardhana P 88 √
18. Kanzulia Arsyta Qaribil Hasanah P 86 √
19. Luqman Akhita L 63 √
20. Mirda Prilia Prasetyaningrum P 78 √
21. Putri Lely Masitha P 80 √
22. Raymond Aryakrisna Kalalo L 82 √
23. Revilda Oktalia Inayah P 80 √
72
No. Nama Peserta Didik L/P Nilai Tuntas Belum
Tuntas
24. Riza Rizki Fatimah Azzahra P 85 √
25. Rr.Kunti Dewi Adriane Kusumo
Wardono
P 83 √
26. Salsa Farah Febieta P 86 √
27. Salsabila Nurila Kasih Anggraini P 88 √
Jumlah 2.151 17 10
Nilai rata-rata kelas = 𝐽𝑢𝑚𝑙𝑎 ℎ 𝑠𝑘𝑜𝑟
𝐽𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑙𝑢𝑟𝑢 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘
= 2151
37
= 79, 66
Nilai Klasikal
Presentase Ketuntasan = 𝐽𝑢𝑚𝑙𝑎 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘 𝑦𝑎𝑛𝑔 𝑡𝑢𝑛𝑡𝑎𝑠
𝐽𝑢𝑚𝑙𝑎 ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑑𝑖𝑑𝑖𝑘 𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢 ℎ𝑎𝑛 × 100%
= 17
37 × 100%
= 62, 96%