Evaluasi Program Pembelajaran Full

download Evaluasi Program Pembelajaran Full

of 45

Transcript of Evaluasi Program Pembelajaran Full

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    1/45

    Evaluasi Program Pembelajaran/Kurikulum

    Konsep Dasar Evaluasi Program

    Evaluasi adalah suatu proses yang digunakan untuk mengukur kualitas suatu pekerjaan.

    Evaluasi jika digunakan secara tepat, akan mengadakan kontrol kualitas yang menentukan

    seberapa jauh gap antara apa yang terjadi dan apa yang seharusnya terjadi....

    Akhirnya tujuan dari pada evaluasi adalah untuk mengumpulkan data (hasil), mengubah datamenjadi informasi ( yang dijadikan alat dalam membuat keputusan yang berguna), dan

    menggunakan informasi untuk membuat keputusan. Evaluasi adalah suatu bidang yangmeliputi bidang yang luas baik pengalaman, pertumbuhan, perkembangan, dan perubahan.

    Hal ini digunakan perhatian terutama hubungan antara tujuan yang diinginkan dan penampilan, tetapi sering kali lebih luas dari pada itu. Dengan perluasan bidang ini, ada

    beberapa definisi dari istilah dan nama, dan secara jujur, menjadi sangat membingungkan.Evaluasi program yaitu evaluasi yang menaksir kegiatan pendidikan yang memberikan

    pelayanan pada suatu dasar yang kontinu dan sering melibatkan tawaran-tawaran kurikuler.

    Beberapa contoh di antaranya ialah evaluasi-evaluasi program membaca di suatu sekolah

    daerah, evaluasi program pendidikan khusus di negara bagian atau evaluasi program

    pendidikan berlanjut di suatu universitas.

    Evaluasi proyek adalah evaluasi yang menaksir kegiatan-kegiatan yang menyangkut suatu jangka waktu untuk menyajikan suatu tugas khusus. Beberapa contoh, misalnya lokakarya

    tiga hari tentang tujuan behavioral, percobaan dua tahun tentang pengembangan tes atau

    proyek tiga tahun tentang pendidikan karir. Suatu perbedaan antara program dan proyek

    adalah bahwa program diharapkan berlangsung untuk jangka waktu yang tidak terbatas,

    sedangkan proyek untuk jangka waktu singkat. Proyek yang diintitusionalkan bisa menjadi

    program.

    Evaluasi materi yaitu evaluasi yang menaksir nilai soal-soal fisik yang berhubungan dengan

    isi, termasuk buku, pentunjuk kurikuler, film, tape, dan hasil-hasil instruksional nyatalainnya. Sedangkan evaluasi material ialah evaluasi yang negukur kebaikan-kebaikan atau

    nilai-nilai dari butir-butir fisik yang berhubungan dengan isi, meliputi buku, panduankurikulum, film, pita, lain lain-lain (hasil) pengajaran.

    Evaluasi kurikulum ialah suatu proses mendeskripsikan suatu nilai dan keputusan tentang

    kurikulum baik dari dimensi konsep, dimensi rencana, dimensi kegiatan dan dimensi hasil belajar. Dalam evaluasi program/kurikulum dikenal adanya evaluasi internal dan evaluasi

    eksternal. Evaluasi internal ialah evaluasi dilakukan oleh seorang anggota staf di dalam

    organisasi yang sedang diteliti. Sedangkan evaluasi eksternal ialah evaluasi yang

    dilaksanakan oleh evaluator di luar organisasi dalam mana objek dari evaluasi ditempatkan.

    Evaluasi program/kurikulum juga dibedakan dengan evaluasi formatif dan evaluasi sumatif.

    Evaluasi formatif ialah evaluasi yang dirancang dan digunakan untuk memperbaiki suatu

    objek, khususnya apabila objek itu sedang dikembangkan. Sedangkan evaluasi sumatif ialah

    evaluasi yang dirancang untuk menyajikan kesimpulan-kesimpulan tentang kelebihan atau

    harga suatu objek, dan saran-saran (anjuran-anjurannya) apakah objek itu harusdipertahankan, diubah atau dibuang.

    Evaluasi bebas tujuan: evaluasi dari suatu hal (akibat, hasil) di mana evaluator berfungsi

    tanpa tahu tujuan evaluasi itu.

    Seringkali terjadi pembedaan yang tidak jelas tentang pengertian evaluasi dan penelitian

    dalam pemakaian sehari-hari. Para ilmuwan sudah lama berusaha mencari dan menemukankesepakatan untuk membedakan kedua pengertian tersebut. Apabila kita membaca secara

    cermat sesungguhnya antara kedua istilah evaluasi dan penelitian secara prinsip terdapatperbedaan.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    2/45

    Ditinjau dari sudut tujuan kegiatan, evaluasi dilaksanakan dengan tujuan untuk menemukan

    nilai dan makna dari evaluasi. Dengan nilai dan makna tersebut evaluator dapat memberikan

    informasi kepada pembuat keputusan (decision maker) atau kepada penanggungjawaban

    program. Evaluator dapat memberikan alternatif pemecahan masalah, namun keputusan tetap

    menjadi wewenang pembuat keputusan atau penanggungjawab program. Sedangkan

    penelitian dilaksanakan dengan tujuan untuk menjelaskan hubungan empirik antar berbagai

    variabel. Kegiatan penelitian terutama diarahkan untuk mengembangkan terori dalam disiplnilmu tertentu. Ada jenis penelitian tertentu yang memang dekat hubungannya dengan evaluasi

    yaitu penelitian tindakan (action research). Gambaran garis besar penelitian tindakandibedakan menjadi penelitian dasar (basic research) dan penelitian praktis (practical

    research). Penelitian praktis dapat diklasifikasikan menjadi peneltian evaluasi (evaluationresearch), penelitian terapan (application research) dan penelitian tindakan (action research).

    Penelitian praktis sejak munculnya bermaksud menemukan pemecahan masalah-masalahdalam dunia kerja. Namun dalam pengembangannya mengalami perubahan dengan variasi

    pada sasaran penelitian, keterlibatan sponsor dan peneliti pada saran penelitian. Penelitian

    evaluasi lazimnya dimaksudkan untuk melakukan evaluasi terhadap suatu aspek atau

    beberapa aspek dari program serta mengkaji efektivitas program-program yang dirancang

    untuk melakukan perubahan-perubahan program dalam skala yang lebih luas. Prosedur yang

    lazim dilakukan adalah (a) mengidentifikasi tujuan program, (b) memilih tujuan programyang menjadi acuan, (c) menetapkan kriteria evaluasi, (d) melakukan pengukuran terhadap

    sasaran penelitian, (e) membandingkan hasil pengukuran dengan tujuan, dengan

    menggunakan kriteria yang telah ditetapkan dan (f) merumuskan perbedaan antara data

    dengan tujuan.

    Ditinjau dari sudut onbjek kegiatan, pelaksanaan evaluasi selalu harus berhubungan dengan

    kegiatan yang memang nyata dan telah terjadi. Sedangkan penelitian, objek kegiatannya lebih

    luas dan tidak terbatas. Namum hendaknya memperhatikan dan mengikuti aturan-aturan atau

    norma-norma yang telah ditetapkan, yang disebut dengan istilah etika penelitian. Etika inidijadikan patokan atau pedoman yang sangat penting dalam pelaksanakan penelitian.

    Penelitian dilaksanakan secara sistematis artinya dilaksanakan berdasarkan suatu sistem,prosedur, aturan tertentu sehingga hasil penelitian benar-benar dapat diyakini secara kritis.

    Antara penelitian dan evaluasi, dua istilah yang secara historis berawal dari penelitian- penelitian tentang ilmu-ilmu tingkah laku (behavioral sciences). Mula-mula timbulnya

    psikologi sebagai disiplin ilmu sejak tahun 1800-an. Sebagai ilmu psikologi yang dewasa, halini disusun suatu metodologi dan teknik yang dipinjam dari ilmu-ilmu fisika dan biologi.

    Termasuk prinsip-prinsip penemuan ilmu pengetahuan (principles scientific inquiry),

    pengukuran (measurement) dan analisis data. Kemudian memasuk-kan model-model statistik

    yang dikembangkan untuk aplikasi agrikultur, antropologi, sosiologi, pendidikan dan tinjauan

    bidang ilmu tingkah laku yang lain, yang disesuaikan dengan metodologi penelitian dalam

    bidang yang baru.

    Penelitian memiliki sumber pengetahuan yang merupakan tinjauan terhadap pengembangan

    teori dan paradigma yang sudah lazim dikenal dalam metode penelitian eksperimental. Di

    mana hipotesis diperoleh atau dirumuskan secara logis dari teori dan melakukan tes di bawahkondisi yang terkontrol. Evaluasi memiliki cara teknologi dari pada ilmu. Penekanannya

    bukan pada pembangunan teori, tetapi pada pencapaian hasil atau prestasi dalam

    melaksanakan tugas (unjuk kerja). Esensinya adalah memberikan feedback terbimbing untuk

    mencapai keberhasilan. Menurut Stufflebeam (dalam Isaac, 1984) yang membedakan antara

    kegiatan evaluasi dan penelitian adalah bahwa tujuan evaluasi antara lain adalah to improve(meningkatkan atau memperbaiki), bukan to prove (membuktikan).

    B. Kriteria Evaluasi Program

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    3/45

    Pada umunya evaluasi program memiliki tiga kerangka pokok, yaitu: (1) deskripsi program,

    (2) adanya kriteria dan (3) pertimbangan. Ketiga komponen tersebut saling berkaitan.

    Evaluasi dilaksanakan berdasarkan kriteria tertentu yang disusun dengan berpedoman pada

    deskripsi program. Hasil analisis data selanjutnya dibuatlah suatu pertimbangan dan

    keputusan terhadap program tersebut.

    Deskripsi Program

    Pengumpulan data pada umumnya didasarkan atas konsep deskripsi program yangdikembangkan sebelumnya dengan menggunakan pendekatan tertentu, program dijabarkan

    menjadi beberapa unsur atau aspek. Selanjutnya dapat dirumuskan beberapa panduan ataupedoman yang berguna untuk pengumpulan data.

    Ada tiga pendekatan yang dapat dipergunakan dalam rangka penentuan unsur-unsur pokoksuatu program, yaitu:

    Pendekatan Struktural Pendekatan Fungsional Pendekatan Sistematis Pendekatan struktural, pusat perhatian ditujukan kepada komponen-komponen yang membentuk program.

    Komponen-komponen tersebut dijadikan panduan dalam rangka pengumpulan data.

    Contoh unsur-unsur program yang didasarkan atas pendekatan struktural adalah:

    Tujuan-tujuan program Seleksi dasar rancangan program Seleksi kegiatan-kegiatan program

    Rasional dan pendekatan terhadap evaluasi Karakteristik audiens Sistem penunjang

    administrasi Karakteristik pelaksana program Implementasi program Pendekatan fungsionalpusat perhatiannya ditujukan kepada fungsi-fungsi utama dalam suatu program.

    Sebagai contoh, penekatan fungsional terdapat unsur-unsur program, yaitu:

    Evaluasi dan seleksi program Diagnosis dan remidiasi Community Outreach Penjadwalan

    Kompetensi Functional literacy Penempatan tenaga Latihan jabatan Testing program

    Pendekatan sistematis pusat perhatiannya ditujukan kepada keseluruhan program. Unsur-

    unsur di dalam program terdiri dari:

    Komponen masukan (in-put) Komponen proses (process) Komponen hasil (product)

    C. Manfaat, Peranan, Tujuan dan Fungsi Evaluasi Program

    Manfaat evaluasi program bagi program pendidikan dan pelatihan, maupun proyek adalahsebagai berikut:

    Memungkinkan pengecekan program yang telah disusun, apakah program tersebut dapatdilaksanakan (applicable).

    2. Melakukan pengkajian sejauhmana program yang dilaksanakan relevan dengan tujuanprogram dan membuahkan hasil sebagaimana yang diharapkan.

    3. Memberikan petunjuk apakah pelaksanan program masih sejalan dengan apa yang telah

    direncanakan semula. Melalui teknik pengamatan dan monitoring, evaluasi dapat

    dilaksanakan selama pelaksanaan program berlangsung (evaluasi proses).

    4. Memungkinkan pengkoordinasian kegiatan program dengan baik.

    Peranan dan Tujuan Evaluasi Program

    Peranan evaluasi peogram antara lain:

    Menetapkan kebijakan dan pembuatan keputusan. Menilai hasil yang dicapai setelah prgramdilaksanakan. Mengevaluasi pelaksanaan kurikulum pada salah satu jenjang pendidikan

    tertentu. Memberikan kepercayaan kepada lembaga tertentu (pemerintah atau swasta) yang

    mempunyai program, proyek atau kursus. Memonitor dana yang dikeluarkan untuk

    membiayai pelaksanaan program agar tidak terjadi penyalahgunaan. Memperbaiki dan

    menyempurnakan materi dan program yang telah dilaksanakan. Tujuan Evaluasi ProgramEvaluasi program dilaksanakan untuk kepentingan penentuan kebijakan dan pengambilan

    keputusan. Menetukan kebijakan dana pengambilan keputusan dapat dapatdilaksanakandengan tepat apabila didukung oleh informasi (data ) yang lengkap, benar dan akurat

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    4/45

    mengenai hal-hal yang berkaitan dengan permasalahannya, serta untuk mengukur

    keberhasilan pelaksanaan program. Bentuk keputusan tersebut dapat berupa angka/nilai

    tertentu setelah melalui pertimbangan tertentu pula. Sedangkan tingkat keterandalan dan

    keberadaan suatu keputusan pada dasarnya ditentukan oleh tingkat kebenaran dan

    keterandalan informasi (data) yang diperoleh. Untuk mengumpulkan data yang diperlukan,

    maka menggunakan instrumen pengumpul data yang memiliki tingkat keterandalan yang

    memadai pula.Secara spesifik dapat dijabarkan tujuan evaluasi program adalah untuk menetapkan:

    Apakah program yang telah disusun memenuhi kebutuhan sasaran dan apakah layak untukdilaksanakan? Apakah pelaksanaan program berjalan sesuai dengan tujuan yang diharapkan?

    Berapa besar pengaruh program terhadap sararan yang telah ditetapkan? Seberapa besarprogram mampu memberikan nilai tambah (plus) apabila dibandingkan dengan biaya, tenaga

    dan waktu yang telah digunakan? Kelemahan-kelemahan apa yang terdapat dalam programdan bagaimana upaya-upaya yang dilakukan untuk memperbaiki atau menyempurna-kannya?

    Memberikan bahan pertimbangan bagi pengambil keputusan untuk menetapkan apakah

    program tersebut dapat dilanjutkan penyelenggaraan, diperluas atau dibatalkan/dihentikan.

    Memberikan bahan pertimbangan bagi penyelenggara program untuk mengadakan perbaikan

    dan penyempurnaan program, organisasi penyelenggara, komponen-kopmponen program dan

    aspek-aspek penyelenggara program sepanjang tahap-tahap penyelenggaraan program.Informasi yang diperoleh dapat dipakai sebagai bahan pertimbangan dalam mengambil

    keputusan mengenai perlu tidaknya diadakan modifikasi atau revisi guna meningkatkan

    efisiensi dan efektivitas penyelenggaraan program berikutnya.

    Berdasarkan tujuan yang dikemukakan di atas selanjutnya dapat ditetapkan dan dipilih

    instrumen pengumpul data yang cocok serta teknik analisis data apa seyogyanya digunakan.

    Fungsi Evaluasi Program

    Para perencana, pengelola dan pelaksana program perlu mengetahui tingkat keberhasilan dari

    usahanya menyelenggarakan program, terutama perencana program. Untuk merealisasimaksud tersebut pada waktu merencanakan suatu program hendaknya sudah diperkirakan

    bahwa program tersebut akan baik. Namun tanpa terasa ternyata kurang baik hasilnya. Dalamkeadaan demikian evaluasi dalam konteks ini sangat penting karena telah berfungsi

    memberikan informasi kepada pelaksana program untuk membantu mengontrol pelaksanaanprogram agar dapat diketahui kelemahan-kelemahan atau penyimpangan-penyimpangan atau

    kekeliruan yang tenjadi selama program berjalan sehingga dapat memberikan tindak lanjut

    terhadap pelaksanaan program selanjutnya.

    Beberapa kontribusi yang dapat diberikan oleh evaluasi program dalam hubungannya dengan

    tipe keputusan serta kebijakan yang ditempuh seperti yang ditunjukkan berikut ini:

    Memberikan kontribusi terhadap keputusan tentang instalasi program (program installation).

    Banyak program yang berjalan namun terputus-putus dan bahkan gulung tikar karena tidak

    mampu front-end-analysis kebutuhan dan tuntutan program, tersedianya staf dan fasilitas

    yang dibutuhkan untuk membuahkan hasil yang diharapkan. Memberikan kontribusi terhadapkeutusan tentang kelangsungan/ kontinuitas program, ekspansi dan sertifikasi. Hal ini

    termasuk menentu-kan apakah progran yang dilaksanakan memberikan suatu keuntungan

    atau pengaruh sampingan (side effect) yang sangat bermanfaat. Memberikan kontribusi

    terhadap keputusan tentang modifikasi program. Sasarannya adalah matapelajaran/bidang

    studi, yaitu memberikan informasi bagi pengembang program, pengelola dan pelaksana program yang dapat membantu memperbaiki disain program dan pelayanan peralatan.

    Evaluator mencari dan mengumpulkan informasi tentang pengaruh program atau sumbangan program dalam membantu pengambilan keputusan mengenai ekspansi. Dapat juga

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    5/45

    menyeleksi data untuk memperbaiki program. Memberikan keterangan/informasi kepada

    rally support tentang program yang telah dilaksanakan. Memberikan keterangan/informasi

    kepada rally opposition tentang program yang telah dilaksanakan. Memberikan kontribusi

    agar memahami dasar kejiwaan (psikologis), sosial dan proses lainnya.

    D. Prinsip-Prinsip, Syarat-Syarat Evaluasi dan Evaluator Program

    Pelaksanaan evaluasi program didasarkan atas tujuan tertentu. Setiap program evaluasi

    diarahkan untuk mencapai tujuan yang telah ditetapkan secara jelas dan spesifik. Tujuan-tujuan itu pulalah yang mengarahkan kegiatan-kegiatan sepanjang proses evaluasi

    dilaksanakan. Evaluasi harus bersifat obyektif. Pelaksanaan evaluasi dan hasil evaluasi harusbersifat obyektif, berpijak pada apa adanya dan bersumber dari data yang nyata dan akurat,

    yang diperoleh melalui pengumpulan data dengan instrumen yang terandalkan. Evaluasi bersifat komprehensif. Pelaksanaan evaluasi hendaknya mencakup semua aspek (dimensi)

    yang terdapat dalam program. Evaluasi bersifat komprehensif. Tanggungjawab dalam perencanaan, pelaksanaan dan keberhasilan suatu program merupakan tanggungjawab

    bersama semua pihak yang terlibat dalam peroses evaluasi. Evaluasi hendaknya dilaksanakan

    secara efisien, khususnya dalam penggunaan waktu,niaya dan tenaga serta peralatan yang

    menajdi unsur penunjang. Evaluasi harus dilaksanakan secara berkesinambungan. Hal ini

    perlu mengingat tututan diadakannya perbaikan dan poenyempurnaan program dan

    perbaaikan sistem. Evaluasi program dalam pelaksanaannya hendaknya berpijak padabeberapa asumsi:

    Evaluasi program hendaknya didisain sebaik-baiknya guna memperoleh informasi yang baik

    dan akurat. Evaluasi program hendaknya dibatasi pada penemuan-penemuan yang didukung

    oleh data kuantitatif, kendatipun tidak dapat mengabaikan informasi (data) kualitatif.

    Informasi (data) yang diperoleh melalui pelaksanaan evaluasi hendaknya dapat menjadi alat

    yang efisien dan efektif dalam rangka perbaikan, penyempurnaan dan peningkatan program.

    Evaluasi program dapat dilaksanakan secara berkesinambungan dan mencakup evaluasi

    terhadap komponen input, proses dab output (product).Syarat-Syarat Evaluasi Program.

    Berorientasi pada tujuan. Tujuan program dijadikan patokan/arah dalam melakukan kegiatanevaluasi. Sebagai patokan/arah, tujuan program harus dirumuskan secara operasional, dapat

    diukur serta indikator keberhasilannya dapat diamati.Berorientasi kepada kriteria keberhasilan. Evaluator harus merumuskan indikator-indikator

    keberhasilan sebagai dasar/ pedoman untuk menetapkan keberhasilan dan atau kegagalanpelaksanaan suatu program.

    Menyeluruh (komprehensif) maksudnya mencakup seluruh kegiatan dalam program dan

    penyelengaraannya dilaksanakan secara terpadu seluruh komponen program. Serasi dan

    berkesinambungan. Kegiatan evaluasi hendaknya serasi dengan komponen-komponen dan

    aspek-aspek yang akan dievaluasi dan dilaksanakan secara berkesinambungan dari langkah

    penjajagan, perencanaan, persiapan, pelaksanaan hingga selesainya kegiatan program.

    Menggunakan berbagai sumber informasi dan teknik. Penggunaan berbagai sumber informasi

    dan teknik untuk evalusi program dapat diperoleh dari berbagai sumber antara lain:

    instruktur/pengajar/pelatih, peserta, lembaga atau instansi yang berkepentingan baik milik pemerintah maupun lembaga yang diadakan oleh masyarakat (swasta). Teknik yang

    digunakan dapat bervariasi, di antaranya: dengan menggunakan daftar pertanyaan (angket),

    wawancara (interview), pengamatan langsung (observation), dokumentasi (document), skala

    sikap, tes (tertulus/lisan) dan sebagainya. Berfungsi ganda. Evaluasi program selain berfungsi

    untuk memperoleh informasi yang lengkap, teliti, objektif dan akurat sebagai bahan pertimbangan dalam menyusun rekomendasi perbaikan atau penyempurnaan; tetapi juga

    berfungsi sebagai suatu media komunikasi antara pihak penyelenggara program denganpihak-pihak yang menajdi sumber informasi mengenai komponen dan aspek progrtam serta

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    6/45

    tujuan program yang tidak dievaluasi. Evaluator baik perseorangan maupun tim dapat berasal

    dari dalam (evaluator intern) maupun dari luar (evaluator extern).

    Evaluator yang berasal dari dalam (evaluator intern) yaitu seseorang atau sebuah tim yang

    ditunjuk oleh sebuah organisasi profesional, perusahaan ataupun pusat pendidikan dan

    pelatihan (Pusdiklat) yang melaksanakan program, berasal dari orang-orang yang menjadi

    anggota sebuah organisasi atau orang-orang yang terlibat dalam keanggotaan panitia

    pelaksana Diklat.Contoh: Sebuah Pusat Pendidikan dan Pelatihan atau sebuah Balai Latihan Kerja (BLK),

    sebuah Diklat Penyuluhan Pertanian, menyelenggarakan kegiatan selama tiga bulan.Pusdiklat/BLK membentuk panitia dan menunjuk beberapa orang yang bukan panitia

    bertugas mengevaluasi atau monitoring selama Diklat berlangsung.Evaluator dari luar (evaluator extern), yakni seseorang atau sebuah tim yang ditunjuk oleh

    pihak penguasa (penanggungjawab dan pengambil keputusan) untuk melaksanaakn evaluasiterhadap efektivitas dan efisiensi sebuah program. Dengan demikian hasil yang diperoleh

    dapat dipergunakan sebagai bahan pertimbangan dalam pengambilan keputusan, untuk

    menentukan tindak lanjut terhadap kelangsungan program (perbaikan, modifikasi atau

    dihentikan). Evaluator ekstern hendaknya berasal dari sekelompok orang atau tim yang sudah

    profesional, suatu tim/kelompok yang berasal dari suatu lembaga/organisasi profesi yang siap

    dibayar oleh penanggungjawab program. Evaluator ekstern dapat berasal dari perwakilanbeberapa instansi yang berwenang yang ditunjuk.

    Contoh: Evaluasi terhadap Diklat BKKBN: penyelenggaran Diklat menunjuk perwakilan dari

    instansi terkait yang tidak menyelenggarakan Diklat sebagai evaluator, namun

    berkepentingan dengan Diklat tersebut.

    Sebelum melaksanakan evaluasi terhadap program, evaluator hendaknya menguasai prinsip-

    prinsip dasar evaluasi, yaitu:

    Evaluator seyogyanya tidak memberikan jawaban terhadap pertanyaan khusus dan tidak

    dapat memberikan pertimbangan kepada pihak lain. Tugas evaluator hanya sebatasmemberikan informasi dan beberapa pilihan alternatif. Evaluator tidak terikat pada suatu

    lembaga/instansi penyelengara Diklat. Evaluasi merupakan suatu proses yang berlangsungterus-menerus, sehingga dimungkinkan untuk mengadakan perbaikan ataupun modifikasi

    apabila terjadi hambatan atau kurang efektif ditinjau dari segi tenaga, biaya dan waktu. Hasilevaluasi yang dilaporkan kepada pihak pengambil keputusan merupakan tanggungjawab tim

    dan tidak mempunyai hak untuk memberikan peertimbangan, apakah diperbaiki,dimodifikasi, dihentikan atau dilanjutkannya suatu program. Evaluator hendaknya

    merumuskan pertanyaan-pertanyaan yang operasional untuk menggali informasi (data) serta

    menyelami semua permasalahan yang dihadapi. Evaluator hendaknya menggunakan variasi

    metode, teknik dan instrumen dalam pengumpulan data sebanyak mungkin, sehingga dapat

    mengungkapkan data sebanyak mungkin dari aspek-aspek yang dievaluasi. Evaluasi

    hendaknya dilakukan dengan teliti, cermat dan obyektif. Kesimpulan hasil evaluasi

    hendaknya merupakan deskripsi yang tegas dan jelas menunjukkan sebab-akibat. Untuk

    memperkaya deskripsi, evaluator dapat mengajukan beberapa asumsi yang didukung oleh

    data yang valid dan reliabel. Persyaratan sebagai Evaluator.Agar memperoleh hasil evaluasi yang sebaik-baiknya dan benar-benar onyektif, maka

    evaluator program dituntut memenuhi persyaratan-persyaratan berikut.

    Memahami materi, maksudnya memahami seluk beluk program yang akan dievaluasi

    antaralain: 1) Tujuan program yang telah dirumuskan sebelum memulai program.

    2) Komponen-komponen program.3) Jangka waktu dan jadwal kegiatan.

    4) Mekanisme pelaksanaan program.5) Pelaksanaan program.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    7/45

    6) Sistem monitoring kegiatan program.

    Menguasai teknik, yaitu menguasai cara-cara/teknik-teknik yang digunakan dalam

    pelaksanaan evaluasi program. Oleh karena itu evaluator program hendaknya menguasai: 1)

    Cara menyusun desain evaluasi program.

    2) Teknik penentuan populasi dan sampel.

    3) Teknik penyusunan instrumen evaluasi program.

    4) Teknik dan prosedur pelaksanaan evaluasi.5) Prosedur dan teknik pengumpulan data.

    6) Teknik pengolahan data.7) Teknik menganasisis dan menginterpretasi data.

    8) Cara menyusun laporan hasil evaluasi.

    Obyektif dan Cermat. Tim evaluator adalah sekelompok orang yang mengemban tugas

    penting dan ditopang oleh data yang dikumpulkan secara cermat, teliti dan obyektif.

    Berdasarkan data yang dikumpulkan, diharapkan tim evaluator dapat mengklasifikasikan,

    mentabulasikan, mengolah dan menganalisis serta menginterpretasi data dengan cermat dan

    obyektif. Di dalam mennentukan strategi penyusunan laporan, evaluator tidak diperkenankan

    untuk membedakan serta memandang salah satu atau dua asepek sebagai satu hal atauperistiwa yang istimewa atau luar biasa dan tidak boleh memihak.

    Jujur dan dapat dipercaya. Tim evaluator dalam melaksanakan tugasnya hendaknya berlaku

    jujur dan dapar dipercaya. Jujur artinya, data/informasi yang dikumpulkan benar-benar

    berasal dari sumber yang dapat dipertanggungjawabkan serta apa adanya. Tidak

    dimanipulasi, tidak ditambah dan dikurangi serta jujur melaporkan hasilnya kepada pihak

    pengambil keputusan (penguasa). Kejujuran dalam melaporkan hasil akan mempengaruhi

    keputusan yang diambil serta tidak lanjut yang dilakukan. Di samping itu, tidak bias dalam

    pengamatan ataupun salah dalam persepsi.Evaluator hendaknya orang luar yang tidak ada kaitan dengan pengambil kebijakan

    (keputusan) maupun pengelola dan pelaksana program. Evaluator hendaknya mengadakanhubungan yang baik dengan para responden maupun klient, dapat memahami wataknya,

    kebiasaan dan cara hidup responnden yang dijadikan sumber data. Evaluator hendaknyatangap terhadap masalah politik dan sosial budaya, apalagi tujuan evaluasi adalah untuk

    pengembangan program. Evaluator harus memiliki konsep diri yang tinggi sehingga tidakmudah terpengaruh atau terbawa arus. Evaluator hendaknya menguasai teknik untuk memilih

    desain dan metodologi yang tepat untuk program yang akan dievaluasi. Evaluator hendaknya

    bersikap terbuka terhadap kritik dan memberikan kesempatan kepada orang lain/pihak luar

    untuk melihat apa yang sedang dan akan terjadi. Evaluator hendaknya menyadari kekurangan

    dan keterbatasannya serta bersikap jujur, menyampaikan kelemahan dan kekurangan tentang

    evaluasi yang dilakukan. Evaluator hendaknya bersikap pasrah kepada umum mengenai

    penemuan yang positif maupun yang negatif. Evaluator bersedia menyebarluaskan hasil

    evaluasi, teutama bagi pihak-pihak yang membutuhkan. Hasil evaluasi yang tidak secara

    eksplisit dinyatakan sebagai informasi terbuka, sebaiknya tidak disebarluaskan. Evaluatortidak mudah membuat kontrak. Evaluator yang tidak memenuhi persyaratan-persyaratan yang

    disebutkan di atas, sebaiknya tidak mudah menyanggupi menerima tugas-tugas, karena secara

    etis dan moral akan merupakan sesuatu yang kurang dapat dibenarkan.

    E. Context Evaluation.

    Context Evaluation, according to Stufflebeam (90), addresses this questions:

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    8/45

    What unmet needs exist in the context served by a particular institution? What objectives

    should be pursued in order to order to meet this needs? What objectives will receive support

    from the community? What set of objectives in most feasible to achieve?

    Stufflebeam (90) suggest five questions that input evaluation should be capable of answering:

    Does a given project strategy provide a logical response to a set of specified objectives? Is a

    given strategy legal? What strategies already exist with potential relevance for meeting

    previously established objectives? What specific procedures and time schedules will beneeded to implement a given strategy? What are the oprerating characteristics and effects of

    competing strategy ubder pilot conditions?Stufflebeam (90) suggest the folowing questions to be addresed by process evaluation:

    Is the project on schedule? Should be staff be retrained or reoriented prior to completions ofthe process priject cycle? Are the facilities and materials being used adequately and

    appropiately? What major procedural barriers need to be overcome during the present cycle?The checlist consists of six major steps:

    Focusing the evaluation, which means identifying and defining the decision situations or

    goals of the evaluatuon, the setting within which it is be conducted, and the polities within

    which it is to operate; Planning the data cillection; Planning the organization odf the data;

    Planning the data analysis; Specifying audience, format, means, and schedule for reporting

    the finding; Adminstrating the evaluation, or providing an overal plan for executing theevaluation design.

    Dressel (21) offers a more comprehensive and useful checklist plan for planning an

    evaluation:

    What is the purpose and background of the evaluation?What inputs, environment factors,

    processes, or outcomes are to be evaluated? What are the critical points at which evidence

    will be required for decisions? What rules, procedures, assumsions, and principles are

    involved in the decisions? Who will make decisions and what is the process by which these

    will be made? Does the overall situation suggest. Require, or prohibit certain tactics andstrategies? What timing considerations are involved? What are the litimitation on costs? What

    are the specific evaluation tasks?What information is to be collected?Are the particular items unambigiously defined and

    collectible by objective and reliable means? Frome where or from whom id the evidence tobe collected? By whom is it to be collected? What instruments or procedures are to be used?

    Will the collections of evidence in itself seriously affect the input, environment, process, oroutcomes? Will the collections of evidence become a regular part of the process, or is it an

    add-on for one-time evaluation? What is the schedule for collection of information?

    What procedures will be used for organizing and analysing data?In what form is information

    to be collected? Will coding be required? If subjective judgements wiil be required in coding,

    are the criteria for the adequate? Who will do the coding? How will the data be stored,

    received, and processed? What analytic procedures are to be used?

    Is the reporting procedure clear?Who will receive reports? Will reports be organized by

    analytic procedures, by type of data, or by decisions to be made? Will report include the

    practical implications regarding the various possible decisions to be made or leave theseimplications for the project staff of admnistrators to the evidence? Is the evaluator to state

    explisitly the particular decisions which be believes are supported by the evidence? When

    and in what detail are reports to be made?

    How is the evaluation to be evaluated?Who will be involvedproject staff, the evaluator,

    decision-makers, some presumably more objective individual? What will the criteria used inthis second-level evaluation becosts, program improvement, impact on further planning of

    related enterprises? To whom and when is this report to be presented? What decisions are to

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    9/45

    be anticipated as a result of the report? Will they include improvement of evaluation

    processes in the future?

    F. Beberapa Model Evaluasi Program

    1. Model Tyler

    Model ini dinamakan model Tyler karena tidak ada nama resmi yang diberikan oleh

    pengembangnya. Tyler yang mengajukan model ini menuliskan buah pikirannya tersebuttidak dalam suatu tulisan lepas mengenai evaluasi. Ia mengemukakan pikiran-nya mengenai

    evaluasi program ini dalam suatu buku kecil tentang kurikulum. Dengan buku kecil ini pulanamannya terangkat sebagai seorang ahli yang disegani baik dalam kurikulum maupun dalam

    evaluasi. Buku yang diberi judul Basic principles of curriculum and instruction ditulis ketikaia bertugas sebagai tenaga pengajar di Universutas Chicago. Idenya tentang evaluasi

    dituangkan dalam bab 4 yang diberi judul How can the efeffectiveness of leraningexperiences be evaluated?

    Model yang dikemukakannya dibangun atas dua dasar, yaitu: evaluasi yang ditujukan kepada

    tingkah laku siswa dan evaluasi harus dilakukan pada tingkah laku awal siswa sebelum suatu

    pelaksanaan kurikulum serta pada saat siswa telah melaksana-kan kurikulum tersebut.

    Dengan kedua dasar ini ia ingin mengatakan bahwa evaluasi kurikulum yang sebenarnya

    hanya berhubungan dengan hasil belajar menurut pengertian yang dikemukakan terdahulu.Evaluasi kurikulum sebagai rencana yang dinamakan sebagai intermediate or preliminary

    stages of evaluation (Tyler 1949:104) dianggap bukan merupakan suatu penghargaan yang

    adekuat terhadap kurikulum. Evaluasi terhadap kurikulum sebagai kegiatan tidak dimasukkan

    dalam ruang lingkup evaluasi oleh Tyler.

    Dengan dasar evaluasi yang kedua, Tyler menghendaki evaluasi dapat menentukan

    perubahan tingkah laku yang terjadi adalah memang perubahan yang disebabkan oleh

    kurikulum. Kenyataan seperti itu menurut Tyler tidak mungkin dapat ditetapkan apabila

    evaluator hanya melihat tingkah laku siswa setelah mereka mengikuti kurikulum tersebut.Dalam kata-katanya sendiri Tyler 1949:108 menulis:

    On this basic, one is not able to evaluate an instructional prgram by testing students only atthe end odfthe program. Without knowing where the students were at the beginning, it is not

    possible to tell how far changes have taken place.

    Karena itu evaluasi yang dilakukan di mana model Tyler dipergunakan sebagaimanamestinya memerlukan informasi perubahan tingkah laku paling tidak pada dua saat yaitu

    sebelum dan sesudah siswa mengikuti suatu kurikulum. Dalam istilah yang banyak

    dipergunakan sekarang ini diperlukan adanya tes awal (pretest) dan tes akhir (posttest) untuk

    mengumpulkan kedua informasi tersebut.

    Berdasarkan informasi yang diperoleh dari hasil tes awal dan tes akhir ini kemudian model

    yang dikembangkan Tyler ini mensyaratkan bahwa informasi yang diperoleh dari tes awal

    adalah gambaran tingkah laku siswa yang ada sebelum mengikuti program. Sedangkan

    informasi dari tes akhir adalah gambaran tingkah laku siswa karena pengalaman yang

    diperolehnya selama mengikuti program tersebut. Oleh karena itu Tyler juga mengisyaratkanvaliditas informasi tes akhir tersebut. Usaha untuk menjamin validitas ini memerlukan cara

    yang dianggap sangat tepat.

    Lebih lanjut karena model ini sangat menekankan adanya tes awal dan tes akhir maka model

    Tyler ini dikenal pula dengan nama black box. Nama ini mencerminkan bahwa apa yang

    terjadi dalam proses tidak memerlukan perhatian oleh evaluator. Bagian ini sudah terjamindengan desain eksperimen tadi walalupun sesungguhnya evaluator tidak tahu persis apa yang

    terjadi pada diri siswa. Karena itu bagian dari proses ini dianggap sebagai kotak hitam yangmenyimpan segala macam teka-teki.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    10/45

    Dalam pelaksanaannya, Tyler mengemukakan ada tga prosedur utama yang harus dilakukan.

    Ketiga prosedur tersebut itu adalah:

    menentukan tujuan kurikulum yang akan dievaluasi. menentukan situasi di mana siswa

    mendapatkan kesempatan untuk memperlihatkan tingkahlaku yang berhubungan dengan

    tujuan. memnentukan alat evaluasi yang akan dipergunakan untuk mengukur tingkah laku

    siswa. Ketika menentukan tujuan kurikulum yang akan dievaluasi harus pula

    dipertimbangkan mengenai tingkah laku yang bagaimana yang dianggap merupakanpernyataan bahwa tujuan tersebut telah tercapai. Artinya, evaluator harus dapat menentukan

    jenis tingkah laku yang harus diperlihatkan siswa sesuai dengan materi yang telahdipelajarinya. Disini evaluator dituntut untuk mengembangkan kisi-kisi tujuan yang akan

    dievaluasi dalam tabel dua dimensi: dimensi tingkahlaku dan dimensi materi. Oleh karena itudiharapkan para pengembang kurikulum telah merumuskan tujuan tersebut dalam bentuk

    behavioral objectives.Konsekuensi dari persyaratan ini seringkali evaluator yang mempergunakan model Tyler

    mengharapkan pula agar para pengembang program merumuskan tujuan program dalam

    bentuk behavioral objectives. Seringkali terjadi, evaluator harus berkonsultasi terlebih dahulu

    dengan para pengembang kurikulum mengenai tujaun apa yang akan dievaluasi mengenai

    tingkat pencapaiannya. Pekerjaan evaluasi yang dilakukan oleh Braithwaite dan Koop (1982)

    merupakan contoh model ini. Mereka mendapat tugas untuk mengevaluasi penataran yangdilakukan di bagian barat metropolitan Sidney. Untuk itu mereka membicarakan mengenai

    tujuan program yang akan dievaluasi dan mengembangkan tujuan tersebut dalam bentuk

    behavioral atau juga sering diistilahkan dengan operasional.

    Persoalan pengembangan tujuan program menurut ukuran behavioral seperti yang

    dipersyaratkan poleh Tyler memang sudah umum dilakukan di Indonesia, terutama setelah

    PPSI diperkenalkan melalui Kurikulum 1975. tetapi harus diingat bahwa pada waktu Tyler

    mengemukakan persyaratan tersebut, tujuan dengan rumusan yang demikian masih

    merupakan sesuatu yang baru bagi dunia pendidikan di A.S. Justru gagasam Tyler ini yangkemudian mengilhami Bloom dan kawan-kawan mengembang-kan ide tersebut menjadi

    taksonomi tujuan pendidikan yang terkenal tersebut. Taksonomi ini kemudian yangditerapkan di Indoensia melalui cara pengembangan tujuan instruksional yang tercakup dalam

    model PPSI.Tujuan kurikulum yang akan dievaluasi, seperti yang juga dikembangkan dalam taksonomi

    tujuan pendidikan Bloom dan kanwan-kawan, tidak selalu hanya berhubung-an dengan tujuanyang bersifat kognitif saja. Tetapi kurikulum yang menyangkut asepek afektif dan juga

    psikomotorik dapat pula dievaluasi apabila tujuan tersebut dianggap penting oleh para

    pengembang kurikulum dan dapat dinyatakan dalam bentuk operasional sehingga tujuan itu

    dapat diamati. Dengan demikian ruang lingkup pekerjan evaluator dapat menjadi sangat luas.

    Langkah kedua adalah menentukan situasi atau keadaan yang memberikan kesempatan

    kepada siswa untuk menunjukkan kemampuan yang akan dievaluasi. Langkah ini sangat

    berhubungan erat dengan langkah pertama. Pada langkah pertama dikatakan bahwa yang

    dievaluasi adalah tingkat pencapaian tujuan kurikulum dan siswa dijadikan sumber utama

    untuk mendapat informasi mengenai tingkat pencapaian tujuan tersebut. Oleh karena itudalam langkah kedua ini evaluator harus dapat menentukan situasi apa yang dianggap terbaik

    agar kemampuan yang akan diperlihatkan siswa sebagai sumber informasi betul-betul

    memperlihatkan kemampuan sebenarnya. Dengan demikian validitas data evaluasi terjamin.

    Dalam langkah ini evaluator dapat saja mempergunakan lebih dari satu situasi, sesuai dengan

    jenis data yang diharapkan yang sebetulnya merupakan konsekuensi dari tujuan yang akandievaluasi. Misalkan seorang evaluator akan menilai pencapaian tujuan kognitif kurikulum.

    Katakanlah, evaluasi tadi ingin mengetahui tingkat pencapai-an tujuan kurikulum dalamsetiap jenjang kemampuan kognitif seperti yang dipersyarat-kan oleh kurikulum. Dengan

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    11/45

    demikian evaluator tersebut akan berhubungan dengan kemampuan siswa dalam jenjang

    pengetahuan, pemahaman, aplikasi, analisis, sintesis, dan evaluasi. Maka dalam langkah

    kedua ini evaluator tadi harus menentukan situasi yang paling sesuai untuk mengevaluasi

    kemampuan-kemampuan tersebut. Misalnya evaluator tida dapat menentukan bahwa

    kemampuan-kemampuan tadi akan diperlihat-kan oleh siswa dalam suatu tes. Dengan

    demikian, seluruh siswa yang dijadikan sumber informasi harus menyatakan kemampuan

    mereka dalam situasi tes yang mungkin pula berupa situasi tes tertulis, tes lisan, tesperformansi, dan sebagainya.

    Mungkin pula evaluator tersebut menentukan bahwa untuk tujuan seperti di atas akandipergunakan beberapa situasi yang berbeda. Untuk jenjang pengetahuan, pemahaman, dan

    evaluasi akan dipergunakan situasi tes. Untuk jenjang aplikasi, analisis, dan sintesis akandipergunakan situasi bekerja di laboratorium. Barangkali pula kombinasi situasi lainnya yang

    dipergunakan sesuai dengan hekikat bidang studi (konten kurikulum), karakteristik tujuan,waktu dan dana yang tersedia, serta kemampu-an evaluator yang melakukan tugas tersebut.

    Pertimbangan profesional evaluator terhadap faktor-faktor yang baru disebutkan menentukan

    situasi apa yang akan dipergunakannya.

    Langkah kedua ini nampaknya sederhana. Tetapi ia sangat menentukan keberhasilan evaluasi

    yang dulakukan. Apabila situasi yang ditetapkan tidak tepat, tingkah laku siswa yang

    diharapkan tidak akan terungkapkan dengan baik. Artinya, apa yang ingin kita ketahui tidakterungkapkan dengan sebenarnya validitas data yang diperoleh sangat diragukan. Dengan

    perkataan lain, tujuan kurikulum tidak terevaluasi sebagaimana seharusnya. Oleh karena itu

    walaupun tampaknya sederhana, sebaiknya evaluator memberikan perhatian yang seksama

    terhadap pelaksanaan langkah kedua ini.

    Seperti hubungan antara langkah pertama dan langkah kedua, demikian pula keeratan

    hubungan antara langkah kedua dengan langkah ketiga. Pada waktu evaluator menentukan

    situasi dalam langkah kedua secara eksplisit sebenarnya ia telah pula menentukan langkah

    ketiga, yaitu penetuan alat evaluasi yang akan dipergunakan. Alat evaluasi dapat berbentuktes seperti yang banyak dipergunakan orang. Tapi ia dapat pula berbentuk alat bukan tes

    seperti alat observasi, kuesioner, panduan wawancara, dan lain sebagainya. Ketika iamenentukan situasi di mana siswa diharapkan dapat mengemukakan hasil belajar dengan

    baik, evaluator harus memiliki pengetahuan tentang alat evaluasi: karakteristik alat tersebut,kekuatan dan kelemahan yang ada dihubungkan dengan tujuan yang akan diukur.

    Meskipun secara eksplisit ia telah menentukan alat evaluasi yang akan dipergunakan, secaraeksplisit hal itu perlu dilakukan evaluator yang bersangkutan. Ia harus menyebutkan jenis alat

    evaluasi tersebut. Setelah itu, model evaluasi kurikulum Tyler ini menghendaki evaluator

    untuk melakukan kajian mengenai alat evaluasi yang tersedia. Pertanyaan pokok di sini ialah

    apakah alat evaluasi yang tersedia sesuai dengan tujuan yang akan diukur. Dalam kata-

    katanya sendiri Tyler (1949:113) menulis:

    It is only after the objectives have been identified, clearly defined, and situations listed which

    give opportunity for the expression of the behavior desired that it is possible to examine

    available evaluation instruments to see how far they may serve the evaluation purposes

    desired.

    Apabila di antara instrumen yang tersedia ada yang memang mengukur tujuan yang sama

    dengan tujuan yanga akan diukur, instrumen tersebut sudah barang tentu dapat dipergunakan.

    Katakanlah bahwa seorang evaluator bertugas untuk mengukur pencapaian tujuan suatu

    kurikulum tertentu. Untuk mudahnya sebut saja tujuan yang akan diukur tersebut sebagai X.kemudian setelah ia menentukan situasi bagi siswa untuk menyatakan kapasitasnya terhadap

    tujuan tersebut, ia menelaah alat evaluasi yang telah dikembangkan orang. Apabila di antaraalat evaluasi yang tersedia ada yang memang sesuai dengan situasi yang telah ditentukan dan

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    12/45

    untuk mengukur tujuan X tadi maka tidak ada salahnya apabila ia mempergunakan instrumen

    tersebut. Hal ini bahkan sangat dianjurkan oleh model ini.

    Tetapi kalau tidak ada, evaluator yang bersangkutan harus mengembangkan instrumen yang

    sesuai dengan tujuan dan situasi yang telah ditetapkan. Dalam model ini sangat ditekankan

    bahwa penggunaan suatu insrumen janganlah didasarkan atas pertimbangan kecanggihan

    ataupun popularitas yang dipunyainya. Tujuan yang ingin diukurlah yang menentukanpemakaian suatu instrumen. Memang tugas mengembang-kan instrumen ini merupakan tugas

    yang tidak ringan. Meskipun demikian, evaluator tersebut tidak dapat mengindarkan tugasini. Instrumen yang dikembangkan haruslah pula memenuhi persyaratan objektif, terandal

    (reliabel) dan sahih (valid).Dilihat dari prosedur kerja evaluasi yang mempergunakan model Tyler ini, proses

    pengembangan kriteria evaluasi dapat dilakukan melalui pendekatan pengembangan pre-ordinate maupun fidelity. Model ini memberikan keleluasaan kepada penggunaan kedua

    pendekata ini. Pada waktu evaluator bersama dengan para pengembang kurikulum

    menentukan tujuan mana yang akan diukur, disaat itulah kemungkinan penggunaan salah satu

    dari kedua pendekatan pengembangan kriteria itu terjadi. Kalau pada waktu itu ditentukan

    bahwa tujuan yang akan diukur adalah tujuan yang bersifat umum untuk setiap kurikulum

    tanpa memperhatikan karakteristiknya, maka evaluator akan bekerja dengan pendekatanpengembangan kriteria pre-ordinate. Dengan demikian, alat evaluasi yang akan dipergunakan

    cenderung pada alat evaluasi yang sudah ada karena alat evaluasi yang demikian banyak

    dikembangkan orang. Biasanya tujuan yang akan diukur dengan pendekatan ini adalah tujuan

    generik.

    Apabila pada waktu penentuan tujuan yanga akan diukur ditentukan hanya tujuan-tujuan

    yang spesifik terhadap kurikulum itu sendiri maka pendekatan pengembangan kriteria fidelity

    akan dilakukan. Dengan pendekatan ini evaluator mempunyai kemungkinan besar harus

    mengembangkan alat evaluasi khusus. Perbedaan kerakteristik antar setiap kurikulummenyebabkan tidak ada alat evaluasi yang tersedia akan sesuai dengan tujuan kurikulum yang

    akan diuji. Terkecuali apabila evaluator tersebut mengevaluasi kurikulum yang sama denganevaluator atau tugas sebelumnya, hanya lingkungan pendidikan yang berbeda antara kedua

    tugas tersebut. Dalam keadaan demikian tentu saja evaluator tersebut dapat mempergunakaninstrumen yang sudah ada. Jadi sebagian kerja sudah dapat diselesaikan.

    Seperti pada setiap model, model evaluasi Tyler inipun memiliki kelebihan dan kelemahan.Keunggulan utamanya ialah kesederhanaanya. Jika dibandingkan dengan model evaluasi

    lainnya, model evaluasi Tyler ini lebih sederhana, terlihat dalam peosedur kerja sepeeti

    dibicara terdahulu. Evaluator hanya perlu memberikan perhatian kepada pengukuran hasil

    belajar siswa yang belajar dari kurikulum yang dinilai. Bagi mereka yang terlatih dalam

    pengukuran, kesederhanaan model ini memberikan kesempatan yang luas untuk melakukan

    evaluasi kurikulum tanpa perlu pendidikan khusus lagi. Perbedaannya dengan prosedur

    pengukuran adalah sangat kecil. Kalau dalam pengukuran mereka tidak perlu memperhatikan

    karakteristik evaluan, sekarang mereka harus melakukannya. Tetapi, identifikasi karakteristik

    itu segera dapat dilakukan dengan berkonsentrasi kepada pihak pengembang kurikulum.Keunggulan ini pada sisi lain merupakan kelemahan model evaluasi Tyler. Perhatiannya yang

    hanya terpusatkan pada kurikulum sebagai hasil belajar menjadikan model ini tidak cukup

    luas dipakai sebagai model evaluasi komprehensif. Seperti telah dibahas sebelumnya, hasil

    belajar hanyalah merupakan salah satu dimensi kurikulum. Dengan demikian, dimensi

    kurikulum lainnya tidak dapat dievaluasi dengan memper-gunakan model Tyler ini. Dimensikurikulum sebagai rencana dan proses tidak dapat dievaluasi dengan mempergunakan model

    ini.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    13/45

    Asumsi yang dipergunakan model ini mengenai dimensi kurikulum sebagai proses sukar

    dipertahankan. Studi-studi yang mengkaji mengenai dimensi proses memperlihatkan bahwa

    implementasi kurikulum seringkali tidak sesuai dengan apa yang dikehendaki oleh kurikulum

    sebagai rencana. Kenyataan dari hasil studi tentang proses ini menyebabkan sukar untuk

    melakukan claim bahwa hasil yang diperlihatkan siswa adalah hasil yang ditimbulkan oleh

    kurikulum yang dievaluasi. Oleh karena itu, proses merupakan variabel penting yang harus

    diperhatikan dalam suatu kegiatan evaluasi.

    2. Model Countenance Stake

    Ini adalah model pertama evaluasi kurikulum yang dikembangkan oleh Stake. Dalamtulisannya ia sendiri tidak memberikan nama khusus tehadap model ini. Nama countenance di

    sini disesuaikan dengan judul artikel yang ditulis walaupun pengertian countenance itusendiri mempunyai makna ambigous. Dalam suatu pengertian ia adalah keseluruhan

    sedangkan dalam pengertian lain kata itu bermakna sesuatu yang disenangi (favourable).

    Dalam tulisan itu, Stake ingin mengemukakan keseluruhan kegiatan evaluasi yang harus yang

    harus dilakukan dan cara yang diinginkannya bagaimana evaluasi tersebut dilakukan. Oleh

    karena itu, walaupun beberapa penulis lain yang membicarakan model ini memprgunakan

    judul seperti model concruence atau model contingency, nama nama tersebut tidakdipergunakan di sini karena baik congruence maupun contingency merupakan dua konsep

    utama dalam model pengolahan data yang dikemukakan oleh Stake. Tetapi kedua konsep itu

    tidak dapat mewakili keseluruhan ide Stake mengenai evaluasi kurikulum. Jadi nama

    countenance dipertahankan sebagai nama model ini secara keseluruhan.

    Dalam model ini, Stake mendasarkan dirinya pada evaluasi formal, di mana dikatakannya

    sebagai suatu kegiatan evaluasi yang sangat tergantung pada pemakaian checklist, structured

    visitation by peers, controlled comparisons, and standardized testing of students (Stake,

    1972:93). Lebih lanjut, model ini dikembangkan atas keyakinan bahwa suatu evaluasiharuslah memberikan deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dasat ini

    masih menjadi keyakinannya ketika ia mengembangkan model-model evaluasi lain dikemudian hari, yang memberikan tekanan pada pendekatan kualitatif.

    Model ini dimasukkan dalam model kuantitatif, karena dalam model ini jelas Stake masihmengutamakan data kuantitatif dan pendekatan kuantitatif dalam mengumpulkan data.

    Bahkan mengenai peertimbangan yang duberikan berbagai kelompok sumber haruslahdikumpulkan secara obyektif; suatu sikap yang berubah ketika ia kemudian lebih cenderung

    mempergunakan model-model kualitatif. Seperti yang diungkapkannya ketika ia

    menguraikan tentang pertimbangan (Stake, 1872:95):

    Evaluation will seek out and record the opinions of persons of special qulification. These

    opinion, though subjective, can be very useful and can be gathered objectively, independent

    of the solicitors opinions.

    Bahkan dalam model ini Stake sangat menekankan peran evaluator dalam mengembangkan

    tujuan kurikulum menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisipengukuran yang behavioristik dan kuantitatif.

    Dalam model ini, Stake mengemukakan bahwa suatu evaluasi forma harus memberikan

    perhatian terhadap keadaan sebelum suatu kegiatan kelas berlangsung dan terhadap kegiatan

    kelas itu sendiri, serta menghubungkan dengan berbagai bentuk hasil belajar. Keadaan

    sebelum suatu kegiatan kelas berlangsung dinamakannya antecendent. Sedangkan kegiataninteraksi yang terjadi di sekolah dinamakannya dengan istilah transactions.

    Lebih lanjut dikemukakannya, bahwa ketiga tingkatan tersebut, antecendent, transaction danhasil (outcome), terbagi atas dua kategori. Kategori pertama ialah apa yang diinginkan

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    14/45

    (intent) oleh pengembang program. Seorang guru, sebagai seorang pengembang program,

    merencanakan mengenai keadaan (persyaratan) yang diingin-kannya, untuk suatu kegiatan

    kelas tertentu. Apakah persyaratan tersebut berhubungan dengan siswanya seperti minat,

    kemampuan, pengalaman, dan lain sebagainya yang biasa diisitilahkan dengan entry

    behavior. Mungkin pula ersyaratan itu berhubungan dengan lingkungan di kelas. Lebih lanjut,

    guru tersebut merencanakan apa yang diperkirakan akan terjadi pada waktu interaksi dikelas,

    dan kemampuan apa yang diharapkan dimiliki siswa setelah proses interaksi berlangsung.Dengan kata lain, perencanaan yang dilakukan guru dalam satuan pelajaran, merupakan apa

    yang diingin-kan guru tersebut (intent).Kategori kedua ialah kategori yang berhubungan dengan apa yang sesungguhnya terjadi,

    bukan lagi apa yang diinginkan. Misalnya keadaan apa yang ada pada waktu suatu interaksikelas akan dilakukan; bagaimana dengan kemampuan siswa yang akan belajar; apakah siswa

    telah belajar mengenai topik yang akan dibicarakan pada malam hari sebelum pelajaran berlangsung. Apakah atlas yang akan digunakan guru memang tersedia; demikian pula

    dengan OHP yang akan dipakai oleh guru yang bersangkutan? Bagaimana interaksi tersebut

    berlangsung? Apakah setelah guru mencoba memberikan pertanyaan kepada siswa untuk

    mengetahui kemajuan yang mereka peroleh dari proses interaksi yang terjadi? Karena Stake

    membuat ketegorinya berdasarkan apa yang dilakukan evaluator, kategori kedua ini

    dinamakan observasi. Jadi seperti juga dengan intent, data mengenai observasi ini meliputiantecendent, transaction, dan hasil yang diperoleh.

    Baik data yang dikelompokkan ke dalam intent maupun observasi adalah data yang

    mengungkapkan tentang apa dan bagaimana kurikulum itu. Data ini baru merupakan sebagian

    dari data yang harus dikumpulkan evaluator yang bekerja mempergunakan model evaluasi

    ini. Oleh karena itu, pekerjan belumlah selesai. Ia baru menyelesaikan sebagian dari kegiatan

    pengumpulan data yang harus dilakukannya.

    Stake juga beranggapan bahwa, suatu evaluasi harus sampai kepada pemberian pertimbangan.

    Stake yang menyadari banyak di antara evaluator yang enggan memberikan pertimbangandan untuk mengatasi hail tersebut, dalam model ini ia mengemukakan jalan keluar yaitu

    evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orangyang dianggap memiliki kualifikasi untuk memberikan pertimbangan tersebut. Data

    pertimbangan ini yang kemudian dimasukkan ke dalam matriks sebagai bagian dari modelini.

    Data pertimbangan ini meliputi tiga jenjang yang dikemukakan oleh Stake, yaituantecendent, transactions, dan hasil yang diperoleh. Di samping meliputi tiga jenjang ini, data

    mengenai pertimbangan tersebut terbagi pula atas tiga kategori, yaitu standar dan

    pertimbangan. Oleh karena itu matriks pertimbangan, seperti juga metriks deskripsi, terdiri

    dari atas 6 kotak. Tiga kotak untuk data pertimbangan dan tiga kotak lagi mengenai data

    standar.

    Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak. Di samping itu,

    ada sebuat kotak lagi yang dinamakan kotak rasional. Setiap pengembang kurikulum/guru

    harus memiliki rasional untuk setiap intent yang dikembangkan. Mungkin sekali mereka tidak

    mempunyai rasional yang tertulis, dan mungkin pula mereka tidak dapat mengemukakannyadalam susunan kalimat yang baik tapi mereka pasti memilikinya.

    Cara kerja model evaluasi Stake ini adalah sebagai berikut. Evaluator mengumpulkan data

    mengenai apa yang diinginkan pengembangan program baik yang berhubungan dengan

    antecendents (persyaratan awal), transaksi (interaksi), dan juga hasil. Data dapat

    dikumpulkan melalui studi dokumen tetapidapat pula dilakukan dengan jalan wawancara.Cara terakhir ini dilakukan apabila dokumen tidak diperoleh karena sesuatu dan lain hal. Cara

    terbaik tentulah melalui studi dokumen.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    15/45

    Bersamaan dengan pengumpulan data mengenai intents (tujuan) ini dapat pula dikumpulkan

    resional dari setiap tujuan tersebut. Di sini Stake memperingatkan agar data mengenai

    rasional janganlah dikumpulkan dengan jalan mendikte pengembang program/guru tersebut.

    Biarkanlah mereka berbicara dengan pengertian dan bahasa yang ada pada diri mereka.

    Evaluator mendengarkan dan mencatat apa yang dikemukakan oleh pengembang program.

    Suatu hal yang perlu diperhatikan, walaupun dalam gambar kotak rasional berada di sebelah

    kiri matriks deskripsi, hal itu tidaklah berarti bahwa pengumpulan data tentang rasionaldilakukan terlebih dahulu. Dalam kenyataannya, data tentang rasional tak mungkin

    dikumpulkan sebelum data mengenai tujuan telah dikumpulkan. Oleh karena itu waktu yangpaling cepat untuk segera mengumpulkan data mengenai rasional adalah bersamaan dengan

    waktu pengeumpulan data mengenai tujuan.Kegiatan berikutnya ialah pengumpulan data observasi mengenai persyaratan awal, transaksi

    dan hasil. Sesuai dengan namanya, data untuk bagian ini dikumpulkan melalui observasi.Dan, seperti ditekankan Stake, observasi ini haruslah observasi formal. Maksudnya, observasi

    tersebut haruslah dilakukan denga mepergunakan instrumen (alat pengumpul data yang

    dikembangkan khusus). Stake (1972:98) mengemukakan bahwa instrumen yang dipakai

    dapat meliputi daftar inventori, daftar pertanyaan tentang data biografis, daftar wawancara,

    daftar cek, pertanyaan tentang pendapat (optionares), dan semua jenis tes psikometrik. Yang

    penting, data tersebut berhubungan dengan apa yang dikembangkan dalam tujuan.Dalam pengolahan data matriks deskripsi, Stake mengemukakan dua konsep yaitu

    contingency dan cungruency. Kedua konsep ini berbeda dalam penggnnaannya. Contingency

    dipegunakan untuk menganalisis data secara vertikal, mencari kesesuaian antara kotak di atas

    dengan kotak di bawahnya. Ada dua analisis mengenai kesesuaian ini. Pertama adalah

    kesesuaian secara logika, yaitu kesesuaian menurut pemikiran logika evaluator. Evaluator

    mempertimbangkan apakah hubungan yang satu dengan lainnya masuk akal, apakah yang

    satu itu mungkin tercapai melalui apa yang ada pada kotak lainnya.

    Analisis logis ini dipergunakan Stake dalam memberikan pertimbangan mengenaiketerhubungan antara persyaratan awal, transaksi, dan hasil dari kotak-kotak tujuan (intent).

    Evaluator harus dapat menentukan apakah persyaratan awal yang telah dikemukakanpengembang program/guru. Ataukah sebetulnya ada model transaksi lain yang lebih efektif

    untuk mencapai apa yang dikemukakan dalam prasyarat. Demikian pula mengenai hubunganantara transaksi dengan hasil yang diharapkan.

    Analisis kedua adalah analisis empirik kontingensi. Dasar bekerjanya adalah sama dengananalisis logis tapi data yang dipergunakan adalah data empirik. Jadi, dalam analisis ini

    evaluator harus mempertimbangkan keterhubungan tersebut berdasarkan data empirik yang

    telah dikumpulkannya. Pertanyaan-pertanyaan yang diajukan untuk analisis logus

    dipergunakan untuk analisis empirik ini.

    Masih dalam analisis mengenai data deskriptif, pekerjaan evaluator berikutnya ialah

    mengadakan analisis congruence (kesesuaian) antara apa yang dikemukakan dalam tujuan

    (intent) dengan apa yang terjadi dalam kegiatan observasi. Pertanyaan yang dapat diajukan di

    sini ialah apakah yang telah direncanakan dalam tujuan memang sesuai dalam

    pelaksanaannya di lapangan (observasi). Apakah terjadi penyimpangan-penyimpangan antaraapa yang direncanakan (intent) dengan apa yang terjadi dan kalau ada penyimpangan faktor-

    faktor apa yang berperan dalam penyimpangan tersebut.

    Apabila analisis contingency dan concruency tersebut telah diselesaikan, adalah tugas

    evaluator untuk menyerahkan hasilnya kepada tim yang terdiri dari para ahli dan orang yang

    terlibat dalam program. Tim ini yang akan meneliti kasahihan hasil analisis evaluatortersebut. Lebih lanjut tim ini pula yang akan memberikan persepsinya mengenai faktor

    penting baik dalam contingency maupun congruency.

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    16/45

    Tugas berikut evaluator ialah memberikan pertimbangan mengenai program yang sedang

    dikaji. Untuk itu evaluator memerlukan standar. Dalam model keseluruhan digambarkan

    bahwa dalam matriks pertimbangan ada yang dinamakan standar dan pertimbangan. Standar

    dapat berbentuk standar mutlak dan relatif. Standar mutlak adalah standar yang dianggap

    belaku untuk suatu kurikulum atau program. Katakanlah untuk program IPS ditentukan

    adanya standar-standar tertentu baik mengenai tujuan yang akan dicapai, proses belajar

    mengajar, dan hasil belajar. Mungkin saja standar itu datang dari individu para ahli tetapistandar itu adalah standar yang diinginkan bagi setiap program studi IPS, terlepas dari

    karakteristik khusus yang dimiliki program tersebut.Standar relatif berhubungan dengan komparasi antara satu program dengan program lainnya

    dalam satu bidang studi yang sama. Untuk konteks pendidikan di AS dan beberapa negaralainnya, adanya beberapa program dalam satu bidang studi yang sama adalah jamak. Suatu

    negara bagian tertentu atau bahkan satu lingkungan otoritas pendidikan tertentu memiliki program IPA yang berbeda dengan negara bagian atau lingkungan otoritas pendidikan

    lainnya. Dalam konteks pendidikan Indonesia perbedaan semacam itu mungkin tidak akan

    terjadi. Oleh karena itu komparasi untuk konteks pendidikan di Indonesia hanya dapat

    dilakukan antara program yang lama dengan program yang baru.

    Menurut Stake (1972:101), evaluator yang harus mempergunakan kedua standar tersebut.

    Jadi, evaluator harus memberikan pertimbangan baik yang bersifat mutlak maupun relatif.Hanya dengan kedua pertimbangan tersebut arti dari kurikulum tersebut dapat ditetapkan

    terlebih mantap. Dengan demikian, pada waktu evaluator memberikan umpan balik kepada

    pembuat keputusan, pertimbangan yang diberikannya adalah pertimbangan yang bersifat

    menyeluruh (komprehensif).

    Model Stake ini lebih dapat dipergunakan untuk melakukan evaluasi mengenai pelaksanaan

    implementasi kurikulum dalam konteks pendidikan Indonesia. Proses pengembangan

    kurikulum di Indoensia sedemikian rupa sehungga kurikulum sebagai rencana dibuat di

    tingkat basional dan bersifat tidak siap pakai. Guru masih harus mengembangkan rencanabesar tersebut menjadi rencana yang lebih operasional, yang dalam istilah kependidikan di

    Indonesia disebut satuan pelajaran (SP). Satuan pelajaran inilah yang dapat dipergunakanuntuk mengisi matriks intent model yang dikemukakan Stake.

    Mengenai standar yang diinginkan Stake dapat dikembangkan dari komponen yang adadalam rencana besar kurikulum tersebut. Meskipun demikian, tidak ada salahnya apabila

    evaluator juga mempergunakan standar yang dikembangkan dari para ahli bidang studibersangkutan. Tentu saja masalah akan timbul apabila antara standar yang dikembangkan dari

    rencana besar tidak bersesuaian dengan yang dikembangkan dari para ahli tadi. Tapi

    persoalan yang demikian juga dihadapi setiap evaluator yang mempergunakan model Stake

    ini, meskipun dalam konteks pendidikan di AS di mana model ini dilahirkan. Hal ini pula

    kiranya yang menyebabkan mengapa Stake (1972:100) menganjurkan agar jangan

    mengevaluasi kurikulum dengan mikroskop tetapi seharusnya dengan a panoramic view

    finder. Adanya beragam standar akan memebrikan kesempatan kepada evaluator untuk

    mempergunakan standar tersebut sebagai teorpong panorama dan buka mikroskop.

    Meskipun demikian untuk konteks pendidiakn di Indonesia, selain untuk mengevaluasidimensi kurikulum sebagai kegiatan, model Stake ini dapat dipergunakan dalam

    pengembangan kurikulum di tringkat nasional apabila eksperimen dilakukan. Pada waktu

    eksperimen, pengembang kurikulum dapat menerapkan model ini sepenuhnya karena semua

    persyaratan Stake terpenuhi.

    3. Model CIPP

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    17/45

    Model ini dikembangkan oleh suatu tim yang diketuai Stufflebeam. Pada waktu memimpin

    tim ini ia bekerja di Ohio State University. Meskipun demikian, tim yang dipimpinnya

    tersebut terdiri dari para sarjana yang berkerja di berbagai universitas dan salah seorang

    anggotanya, Gephart, adalah sarjana yang bekerja di Phi Delta Kappa (PDK). Organisasi ini

    pula yang menugaskan Stufflebeam dan kawan-kawannya berkarya mengembangkan

    pemikiran tentang evaluasi pendidikan. Oleh karena itu, model yang mereka kembangkan itu

    kadang-kadang dinamakan pula dengan model PDK.Nama CIPP, dalam kenyataannya lebih dikenal masyarakat perguruan tinggi dan kalangan

    evaluator. Hal ini mungkin sekali disebabkan CIPP adalah singkatan dari Context, Input,Process dan Product. Memang keempat daerah kerja ini adalah komponen utama dari model

    ini. Dalam buku yang mereka tulis, model tersebut dikemukakan dalam bab 7, setelah merekamendiskusikan pikiran mereka mengenai evaluasi dan hubungannya dengan pembuatan

    keputusan. Dalam buku suntingan Madaus, Scriven dan Stufflebeam (1983) model inidibicarakan kembali dalam bab 7 pula, ditulis oleh Stufflebeam sendiri. Tetapi dalam buku

    suntingan ini, Evaluation Model, Stufflebeam membuat semacam penyederhanaan yang

    sebenarnya lebih mengena pada pokok ide tentang model itu sendiri.

    Menurut Stufflebem (1983:117) model ini telah diterapkan di banyak tempat di A.S. dan

    telah dibahas dalam beberapa disertasi doktor. Di antara beberapa disertasi dibuat oleh

    mahasiswa di the Ohio State Universiry. Sayangnya, di universitas ini pada saat sekarangsudah tidak menunjukkan bekas-bekas hasil kerja profesor tersebut. Seolah-olah hasil binaan

    Stufflebeam di unversitas tersebut sirna begitu saja. Adalah wajar pula kalau model CIPP ini

    berkembang di universitas Western Michigan di mana Stufflebeam sekarang ini bekerja.

    Penyederhanaan model dalam bentuk diagram dilakukan setelah ia meninggalkan the Ohio

    State Unversity.

    Meskipun terjadi penyederhanaan, pokok-pokok pikiran CIPP yang dikembang-kan tim PDK

    masih tetap merupakan dasar dari penyederhanaan yang dilakukan Stufflebeam. Oleh karena

    itu, pembahasan mengenai model CIPP ini tidak akan membandingkan antara keduanya.Pembahasan dilakukan berdasarkan model yang dikembangkan terakhir.

    Sesuai dengan namanya, model ini terbentuk dari 4 jenis evaluasi yaitu evaluasi konteks(Context), masukan (Input), proses (Process) dan hasil (Product). Keempat evaluasi ini

    merupakan suatu rangkaian keutuhan. Tetapi seperti dikemukakan oleh Stufflebeam sendiri,dalam pelaksanaan seorang evaluator dapat saja hanya melakukan satu jenis atau kombinasi

    dari dua atau lebih jenis evaluasi itu (Stufflebeam, 1983:122). Artinya, seorang evaluatortidak selalu harus mempergunakan keempatnya. Walaupun demikian, karena model ini

    dikembangkan berdasarkan suatu pandangan tentang kegiatan kurikulum sebagai sesuatu

    dalam dimensinya yang utuh, pelaksanaan ke empat jenis evaluasi model ini merupakan hal

    yang diharapkan. Lagi pula kekuatan model sebetulnya terletak dari rangkaian kegiatan

    keempat jenis evaluasi itu sendiri.

    Sesuai dengan namanya, keempat jenis evaluasi Stufflebeam ini mempunyai obyek kejian

    yang berbeda. Evaluasi konteks ditujukan untuk menilai keadaan yang sedang dilakukan oleh

    suatu lembaga pendidikan. Jadi, evaluasi ini tidak mengharuskan lembaga pendidikan

    mempunyai suatu kurikulum baru terlebih dahulu untuk melakukan kegiatan evaluasi.Evaluasi justru dilakukan dari kegiatan awal sebelum suatu inovasi kurikulum direncanakan.

    Bahkan adalah fungsi dari evaluasi konteks untuk melihat apakah diperlukan adanya suatu

    inovasi atau tidak.

    Tujuan evaluasi konteks yang utama ialah untuk mengetahui kekuatan dan kelemahan yang

    dimiliki evaluan (Stufflebeam, 1983:128). Dengan mengetahui kekuatan dan kelemahan ini,evaluator dapat memberikan arah perbaikan yang diperlukan. Dalam melakukan evaluasi ini

    evaluator harus dapat menemukan kebutuhan yang diperlukan evaluan. Oleh karena itu,evaluan konteks ini sebagian tigasnya adalah melakukan need assesment. Tetapi, selain dari

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    18/45

    need asesment, evaluasi konteks ini harus pula dapat memberikan pertimbangan apakah

    tujuan yang akan dicapai sesuai dengan kebutuhan yang telah ditentukan.

    Dari tugas yang harus dilakukan terlihat nahwa evaluasi konteks mencoba untuk memberikan

    pertimbangan mengenai nilai dan arti dari auatu keadaan. Nilai diperlihat-kan dengan

    mengemukakan mengenai keadaan evaluan. Kekuatan dan kelemahan yang dimiliki evaluan

    merupakan hasil pertimbangan evaluator tentang nilai evaluan. Sedangkan arti evaluan

    diperlihatkan dengan memberikan pertimbangan apakah tujuan yang akan dicapai sesuaidengan kebutuhan.

    Dari evaluasi konteks ini terlihat perbedaan antara model CIPP ini dengan model-modelevaluasi yang telah dibahas terdahulu. Model-model lain mulai dengan adanya suatu inovasi

    yang sedang dilaksanakan oleh suatu lembaga pendidikan. Inovasi itu yang kemudiandijadikan evaluan. CIPP bahkan membantu evaluan untuk memutus-kan apakah inovasi

    diperlukan atau tidak. Kalau perlu, evaluator yang mempergunakan model CIPP tidak lantasberpangku tangan. Evaluator harus dapat menentukan skala inovasi yang dilakukan.

    Dalam model aslinya dikenal ada tiga jenis skala inovasi yang mungkin dilakukan. Ketiganya

    diberi label yang cukup klasik walaupun cukup jelas menggambarkan skala yang dimaksud.

    Ketiganya ialah homeostatic, incremental, dan neobolistic. Homeostatic merupakan skala

    terendah di mana inovasi yang akan dilakukan hanya memasukkan unsur baru yang tidak

    berarti. Dapat dikatakan bahwa skala inovasi homeostatic tidak akan mengubah pola kegiatanyang sudah ada. Hanya elemen tertentu dari pola yang ada yang harus diubah. Dampak

    perubahan hanya bersifat mikro. Oleh karena itu, apabila inovasi yang akan dilakukan

    bersifat homeostatic, evaluasi berikutnya tidak dapat dikatakan tidak diperlukan. Tetapi

    apabila skala inovasi yang akan dilakukan bersifat incremental (penambahan), apalagi dalam

    skala noebolistic, evaluasi berikutnya yaitu evaluasi masukan merupakan suatu yang

    dipersyaratkan.

    Mengapa demikian? Seperti dikemukakan oleh Stufflebeam (1983:130), bahwa orientasi

    utama evaluasi ialah mengemukakan suatu program yang dapat mencapai apa yangdiinginkan lembaga tersebut. Program yang dimaksudkan ialah program yang membawa

    perubahan yang membawa perubahan berskala penambahan dan pembaharu-an. Lebih lanjut,Staufflebeam menulis:

    This type of study should identify and rate relevant approaches (including any that arealready in operation) and assist and explicating and shaking down the one that is chosen for

    instalation or continuation. It should also search the clients environment for barriers,constraints, and potentially available resources that need to be taken info account in the

    process of activating the program.

    Dengan demikian evaluasi masukan tidak hanya melihat apa yang ada pada lingkungan

    lembaga tersebut ( baik material maupun personal) tetapi juga harus dapat memperkira-kan

    kemungkinan-kemungkinan yang akan dihadapi di waktu mendatang ketika suatu inovasi

    kurikulum dilaksanakan.

    Dari apa yang telah dibicarakan mengenai evaluasi masukan ini, makin jelas bahwa CIPP

    tidak hanya dilaksanakan dalam situasi di mana suatu inovasi sedang dilaksanakan tetapi justru model ini dilakukan ketika inovasi itu akan atau belum dilaksanakan. Meskipun

    demikian, tidaklah berarti bahwa CIPP tidak dapat dapat dilaksanakan apabila suatu inovasi

    kurikulum sedang dalam proses pelaksanaan. CIPP tetap dapat dilakukan kendati suatu

    lembaga pendidikan telah melaksanakan suatu inovasi kurikulum dalam waktu tertentu.

    Seperti telah dikemukakan, Stufflebeam telah mengatakan CIPP tidak mutlak harusdigunakan dalam keseluruhan model, CIPP dapat digunakan dalam salah satu atau kombinasi

    dari dua atau lebih kegiatan evaluasi. Jadi, CIPP dapat digunakan hanya denganmenggunakan evaluasi proses saja. Mengingat obyek kajian dan tujuan yang akan dicapai

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    19/45

    evaluasi proses, CIPP dapat digunakan walaupun bukan dari sejak awal ketika akan

    menemukan ide inovasi.

    Evaluasi proses adalah evaluasi mengenai pelaksanan dari suatu inovasi kurikulum. Jadi,

    kalau evaluasi konteks adalah evaluasi kurikulum dalam dimensi pengertian sebagai ide,

    evaluasi masukan adalah evaluasi kurikulum dalam dimensi pengertian sebagai rencana,

    evaluasi proses adalah evaluasi kurikulum dalam dimensi pengertian sebagai realita atau

    kegiatan. Artinya, evaluasi proses ini baru dapat dilakukan apabila inovasi kurikulum tersebuttelah dilaksanakan di lapangan, bukan pada waktu ia dirancang. Oleh karena itu, evaluator

    dapat saja menggunakan model CIPP walaupun ia baru diminta berpartisipasi ketika suatuprogram inovasi sedang dilaksanakan.

    Dalam pelaksanaannya, model CIPP ini bertujuan memperbaiki keadaan yang ada. Evaluatordiminta untuk menentukan sampai sejauh mana rencana inovasi itu dilaksanakan di lapangan,

    hambatan-hambatan apa yang ditemui yang tak dapat diperkirakan sebelumnya, dan perubahan-perubahan apa yang harus dilakukan terhadap inovasi tersebut. Informasi yang

    dikumpulkan disajikan sebagai umpan balik bagi para pengelola dan juga staf. Dengan

    demikian, keputusan-keputusan yang diperlukan dalam usaha memperbaiki proses yang

    sedang berlangsung dapat dilaksanakan.

    Dari tujuan yang akan dicapai oleh evaluasi proses CIPP ini terlihat jelas bahwa CIPP

    mempergunakan pendekatan pengembangan kriteria baik yang bersifat fidelity maupun yang bersifat mutual adaptive. Kriteria yang bersifat fidelity terlihat dari tujuan untuk

    menentukan sampai sejauh mana rencana inovasi yang dibuat telah tercapai. Pendekatan

    mutual adaptive terlihat dari adanya usaha untuk memperbaiki keadaan lapangan agar

    inovasi itu sendiri. Artinya, evaluator yang melaksanakan evaluasi proses ini harus pula dapat

    memberikan informasi mengenai hal-hal apa dari lapangan yang harus diubah dan komponen

    apa dari inovasi yang harus pula diubah. Dengan perubahan-perubahan tersebut diharapkan

    inovasi dan lapangan mencapai kesesuaian.

    Evaluasi hasil adalah kegiatan evaluasi berikutnya dalam model CIPP. Tujuan utama darievaluasi hasil ini adalah untuk menentukan sampai sejauh mana kurikulum yang

    dimplementasikan tersebut telah dapat memenuhi kebutuhan kelompok yangmempergunakannya (Stufflebeam, 1983:134). Dalam hal ini, diharapkan pula bahwa evaluasi

    hasil memperlihatkan pengaruh program tidak hanya yang bersifat langsung tapi jugapengaruh tidak langsung. Pengaruh tersebut tidak saja yang bersifat positif (biasanya evaluasi

    hasil hanya melihat pengaruh dari sudut pandangan positif ini), tetapi juga pengaruh negatifdari kurikulum tersebut.

    Adanya pengaruh negatif ini kedengarannya aneh tetapi sebenarnya realistis. Bukankah suatu

    hal yang mustahil bahwa suatu kurikulum menghasilkan pengaruh sampingan yang bersifat

    negatif yang tidak pernah diperkirakan oleh para pengembang-nya. Misalnya, suatu

    kurikulum yang dikembangkan berdasarkan tradisi intelektual. Hasilnya, mungkin

    memberikan kemampuan intelektual tinggi bagi siswa tapi dapat pula kemampuan intelektual

    tinggi tersebut menyebabkan siswanya menjadi ingkar terhadap agama. Dalam suatu studi di

    AS, misalnya, ditemukan bahwa program yang dikembangkan berdasarkan pandangan

    humanistik, memberikan pengaruh negatif dalam aspek disiplin. Evaluasi hasil dalam konsepCIPP ini memberikan laporan komprehensif mengenai pengaruh dari program tersebut.

    Untuk itu barangkali suatu perbandingan dengan kurikulum lainnya perlu dilakukan sehingga

    pendekatan pengembangan kriteria preordinate yang dipergunakan.

    Adanya ruang lingkup pengaruh yang luas sebagai fokus kajian evaluasi hasil CIPP

    memberikan kesan ada pengaruh model evaluasi Goal Free dari Scriven. Sayangnya, haltersebut tidak dapat dinyatakan secara pasti. Paling tidak adanya pengaruh tersebut tidak

    dapat diidentifikasi dari bacaan yang dipergunakan Stufflebeam. Kiranya korespondensi pribadi dapat lebih menjelaskan persoalan. Sayangnya, korespondensi semacam itu belum

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    20/45

    dapat dilakukan penulis buku ini. Hanya pada bagian awal tulisannya, dikatakan ia

    berhubungan dengan Scriven. Bahkan mereka berdua pernah diminta untuk membicarakan

    model masing-masing pada beberapa lembaga. Bukan tidak mungkin pengaruh tersebut

    berkembang selama masa ini. Atau, ide tersebut memang muncul secara terpisah pada kedua

    diri pengembang model tersebut walaupun keduanya sering berdiskusi.

    Suatu hal yang pasti dan diakui oleh Stufflebeam bahwa terdapat perbedaan pandangan

    mengenai peran evaluasi yang cukup prinsipil antara dia dengan Scriven. Sementara modelCIPP lebih menekankan pada peran formatif sedangkan model Scriven, baik formatif-sumatif

    maupun Goal Free, sangat memberikan perhatian yang besar terhadap peran sumatif. Olehkarena itu dalam evaluasi hasil inipun model CIPP memberikan posisi penting bagi peran

    formatif. Artinya, informasi yang dihasilkan evaluasi hasil CIPP tidak dipergunakan untukmenentukan apakah suatu program harus diganti. Informasi yang diberikan digunakan untuk

    menetapkan apakah ada komponen kurikulum yang harus diperbaiki.Karena sifatnya yang demikian, adalah sangat berbahaya kalau evaluasi hasil model CIPP ini

    dilakukan secara terpisah. Keterbatasan ruang lingkup evaluasi hasil merupakan hambatan

    sehingga informasi yang diberikan tidak cukup kuat untuk dipergunakan sebagai landasan

    dalam memperbaiki program. Misalnya, katakanlah kalau evaluasi hasil menunjukkan bahwa

    hasil belajar siswa sangat rendah dibanding-kan dengan apa yang direncanakan. Lantas,

    kesimpulan apa yang dapat diambil? Apakah kelemahan tersebut disebabkan oleh faktormasukan ataukah faktor proses.

    Atau, mungkin kelemahan itu disebabkan kelemahan dalam kurikulum itu sebagai suatu ide?

    Adanya kelemahan semacam ini bukannya tidak disadari oleh Stufflebeam. Oleh karena itu ia

    menganjurkan, kalaulah jenis-jenis evaluasi yang ada dalam CIPP akan dilakukan tidak

    seutuhnya, sebaiknya pekerjaan evaluasi meng-gabungkan dua atau lebih dari jenis evaluasi

    yang ada. Dengan adanya penggabungan ini tentu saja kelemahan seperti yang diungkapkan

    di atas tidak perlu dikhawatirkan. Keunggulan suatu jenis evaluasi dapat menutupi kelemahan

    jenis evaluasi lainnya.Tampaknya, kalau model CIPP ini diperhatikan, yang paling dapat diper-tanggungjawabkan

    ialah evaluasi konteks di sati pihak, evaluasi masukan, proses, dan hasil di lain pihak.Pemisahan semacam ini merupakan suatu penyelesaian terutama apabila evaluasi hasil akan

    dilakukan. Apabila evaluasi hasil tidak diikutsertakan, persoalannya tidaklah begitumengkhawatirkan. Setiap gabungan lainnya tidak akan membawa persoalan yang

    mengandung resiko tinggi bagi pengambil keputusan.Sudah tentu yang terbaik ialah apabila keseluruhan model CIPP dapat dilaksana-kan. Gambar

    6 memperlihatkan alur kerja keseluruhan model tersebut. Seperti terlihat dalam gambar

    tersebut, dalam model ini perbedaan kegiatan dinyatakan dengan perbedaan bentuk. Bentuk

    kotak persegi empat digunakan untuk menggambarkan kegiatan pelaksanaan. Bentuk belah

    ketupat digunakan untuk menggambarkan keputusan yang harus diambil. Oleh karena itu

    dalam setiap keputusan itu ada garis ya yang berarti keputusan yang diambil mengiyakan

    pertanyaan ayanga ada dalam bentuk belah ketupat itu. Sedangkan tidak berarti menolak

    pertanyaan yang diajukan. Bentuk lonjong (oval) menunjukkan kegiatan evaluasi yang

    dilakukan. Bagi pembaca yang kenal dnegan program komputer tentu saja bentuk-bentuktersebut bukanlah sesuatu yang baru.

    Dalam diagram asli mengenal CIPP kotak untuk kegiatan evaluasi proses dan hasil

    dipisahkan. Dalam diagram terbaru ini Stufflebeam menggabungkan kedua kegiatan evaluasi

    itu dalam satu kotak. Kiranya, penggabungan ini merupakan sesuatu yang sugestif bahwa

    paling tidak evaluasi hasil harus digabungkan dalam pelaksanaan-nya dengan evaluasi proses.Gambar 6 yang memperlihatkan alur kerja model CIPP itu sangat jelas memperlihatkan

    kapan suatu evaluasi diadakan dan jenis keputusan apa diharapkan, serta tindak lanjut apayang dapat dilakukan berdasarkan keputusan yang diambil. Sebagai contoh, evaluasi konteks

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    21/45

    secara berkala melakukan kajian terhadap pelaksanaan sistem yang berlaku. Dari hasil kajian

    itu harus dapat diputuskan apakah suatu inovasi diperlukan. Kalau tidak, kembali

    melaksanakan apa yang sedang dilakukan oleh lembaga pendidikan itu. Kalau suatu inovasi

    diperlukan (ya), masalah yang dihadapi harus diidentifikasi dan tujuan yang akan dicapai

    harus pula dirumuskan. Setelah itu, keputusan yang harus diambil adalah apakah pemecahan

    masalah sudah memuaskan. Kalau sudah, solusi itu dilaksanakan. Kalau tidak, evaluasi

    masukan dilaksanakan. Demikian seterusnya.Model CIPP ini memiliki keunggulan terutama apabila keseluruhan model dilaksanakan.

    Keempat dimensi kurikulum, seperti yang dibicaraan dalam buku ini dapat dilayani dengan baik oleh model ini. Kurikulum dalam dimensi ide dapat dievaluasi meklakui evaluasi

    konteks. Pertnyaan keputusan tentang apakah suatu ide inovasi kurikulum mempunyaikekuatan justifikasi adalah pertanyaan dasar dalam kajian dimensi ide. Evaluasi masukan

    dapat ditujukan kepada kurikulum dalam dimensi sebagai rencana. Seperti diketahui dalam pendekatan sistem, yang juga sebenarnya merupakan dasar pemikiran model CIPP ini,

    kurikulum sebagai rencana adalah suatu masukan (kadang-kadang disebut dengan istilah

    instrumental input. Sedangkan evaluasi proses dan hasil, sesuai dengan namanya, ditujukan

    untuk mengkaji dimensi proses dan hasil suatu kurikulum.

    Keunggulan lain dari model ini ialah peran aktif evaluator sejak awal. Seperti telah

    dikemukakan, evaluasi konteks dilaksanakan bahkan sebelum suatu ide inovasi dirumuskansecara kongkrit. Evaluator harus melihat keadaan yang barlaku dan kemudian, berdasarkan

    hasil kajian tersebut, mempertanyakan apakah suatu inovasi diperlukan. Di sini evaluator

    bertindak sebagai orang yang mempunyai posisi penting dalam membantu memberikan

    penyelesaian terhadap masalah yang dihadapi suatu lembaga pendidikan. Sepanjang

    pengetahuan penulis, model lain tidak memberikan pesan yang sedemikian penting bagi

    evaluator terkecuali kejian need assessment yang biasanya dimasukkan dalam ruang

    lingkup kajian perencanaan. Tetapi model CIPP menempatkan kajian need assessment

    sebagai salah satu teknik evaluasi konteks dan memberikan kedudukan yang penting bagievaluator dalam suatu usaha inovasi.

    Kelemahan model ini ialah apabila ia diterapkan secara bagian demi bagian (partial).Penerapan yang demikian melemahkan ide dasar model. Pelaksanaan kombinasi antar dua

    atau lebih jenis evaluasi menyebabkan alur kegiatan evaluasi menjadi tidak utuh. Dengan pelaksanaan yang demikian, hubungan antara satu keputusan dengan keputusan lain dapat

    kehilangan kesinambungan.

    4. Model Evaluasi Scriven

    Menurut Michael Scriven, evaluasi program dibedakan atas dasr fungsinya yaitu: evaluasi

    formative dan evaluasi sumatif.

    Evaluasi formatif berfungsi untuk mengumpulkan data selama kegiatan sedang dilaksanakan.

    Data yang dikumpulkan dapat pula digunakan oleh pengembang program untuk membentuk

    dan memodifikasi program. Dalam beberapa hal, penemuan-penemuan dari evaluasi dapat

    digunakan sebagai bahan acuan bagi pelaksana dalam melaksanakan program selanjutnya,agar tidak terjadi pemborosan biaya, tenaga dan waktu.

    Evaluasi sumatif berfungsi untuk mengmpulkan data ketika kegiatan program benar-benar

    selesai. Evaluasi sumatif dilaksanakan dengan tujuan untuk mengetahui kemanfaatan

    program, terutama jika dibandingkan dengan program lain yang sejenis. Data yang

    dikumpulkan selama evaluasi sumatif sangat berguna bagi pihak pembuat keputusan ataupenanggungjawab program dalam menentukan kebijakan dan tindak lanjut.

    Oleh Scriven, evaluasi formatif dan sumatif menunjuk model evaluasi karena mengandungpengertian tentang:

  • 8/2/2019 Evaluasi Program Pembelajaran Full

    22/45

    a. Komponen

    1) Formatif : Evaluasi sebagian program

    2) Sumatif : Evaluasi seluruh program

    b. Instrumen

    1) Formatif : Disusun oleh evaluator

    2) Sumatif : Terstandar

    c. Pelaksana1) Formatif : Dilakukan orang dalam

    2) Sumatif : Dilakukan orang luard. Langkah-langkah

    1) Formatif : Terus menerus disusun, memperoleh hasil sambilmenggunakan langsung, tidak perlu desain lengkap.

    2) Sumatif : Satu kali pelaksanaan: menyeluruh, memperolehdata, mengolah dan menyimpulkan data dan

    menyebarkan kepada pihak pengambil

    keputusan. Memerlukan penyusunan desain

    secara lengkap.

    Langkah-langkah pelaksanaan evaluasi formatif dan evaluasi sumatif.

    5. Evaluasi formatif dilaksanakan selama program berlangsung dengan tujuan untukmenyediakan informasi yang bermanfaat kepada pimpinan atau penanggungjawab program

    untuk kepentingan perbaikan dan penyempurnaan program. Setiap langkah pelaksanaan

    evaluasi akan menghasilkan umpan balik segera. Selanjutnya berdasarkan informasi yang

    telah dikumpulkan dapat dipergunakan untuk merevisi dan menyempurnakan progran apabila

    diperlukan.

    6. Evaluasi sumatif dilaksanakan pada akhir kegiatan untuk memberi-kan informasi kepada

    kemampuan potensial tentang manfaat atau kegunaan program.

    7. Evaluasi formatif hendaknya menarah kepada keputusan tentang program, termasuk perbaikan, modifikasi dan penyempurnaan. Sedangkan evaluasi sumatif mengarah kepada

    kebutuhan mengenai kelanjutan program berikutnya atau program yang ditersukanpengabdosiannya.

    8. Jelasnya bahwa kedua evaluasi ini penting karena keputusan yang diperlukan selama proses, tingkat pengembangan program, untuk memperbaiki dan memperkuat keputusan

    progran yang diambil. Dan apabila sudah stabil dapat dipakai untuk mengevaluasi manfaatprogran atau untuk memutuskan masa depan/kelanjutan program yang bersangkutan.

    5. Model Evaluasi Discrepancy (Kesenjangan)

    Malcolm Provus sebagai perintis dan pengembang model ini berpendapat bahwa evaluasi

    kesenjangan berfungsi untuk mengetahui tingkat kesesuaian antara standar yang sudah

    ditetapkan dengan penampilan aktual program yang bersangkutan. Sedangkan menurut

    AECT (1979), evaluasi kesenjangan adalah suatu metode untuk mengidentifikasi

    perbedaan/kesenjangan antara tujuan khusus yang ditetapkan dengan penampilan aktual.Adapun langkah-langkah dalam pelaksanaan model evaluasi kesenjangan adalah:

    Tahap Penyusunan Desain, kegiatan yang dilakukan antara lain:Merumuskan tujuan program.

    Menyiapkan audience, personil dan kelengkapan lainnya. Menentukan kriteria dalam bentuk

    rumusan yang menunjuk pada sesuatu yang dapat diukur. Tahap pemasangan Instalasi,

    kegiatan yang dilakukan antara lain:Menilai kembali penetapan kriteria (standar) yang telahditetapkan pada tahap penyusunan desain. Meninjau/memonitor program yang sedang

    dilaksanakan. Meneliti kesenjangan antara apa yang telah direncanakan dengan apa yangtelah dicapai. Taha