ANALISIS KUALITAS SOAL UJIAN AKHIR SEKOLAH (UAS) MATA PELAJARAN MATEMATIKA TINGKAT SMK KABUPATEN TAKALAR TAHUN PELAJARAN 2012/2013

HERWELIS, HERWELIS (2013) ANALISIS KUALITAS SOAL UJIAN AKHIR SEKOLAH (UAS) MATA PELAJARAN MATEMATIKA TINGKAT SMK KABUPATEN TAKALAR TAHUN PELAJARAN 2012/2013. S2 thesis, Universitas Negeri Makassar.

[img] Text
herwelis, 2013.doc

Download (7MB)

ANALISIS KUALITAS SOAL UJIAN AKHIR SEKOLAH (UAS) MATA PELAJARAN MATEMATIKA TINGKAT SMK KABUPATEN TAKALAR TAHUN PELAJARAN 2012/2013 ANALYSIS ON THE QUALITY OF THE QUESTIONS OF FINAL TEST AT SCHOOLS ON MATHEMATICS SUBJECT OF ACADEMIC YEAR 2012/2013 AT VOCATIONAL SCHOOLS IN TAKALAR DISTRICT HERWELIS PROGRAM PASCASARJANA UNIVERSITAS NEGERI MAKASSAR 2013 ANALISIS KUALITAS SOAL UJIAN AKHIR SEKOLAH (UAS) MATA PELAJARAN MATEMATIKA TINGKAT SMK KABUPATEN TAKALAR TAHUN PELAJARAN 2012/2013 Tesis Sebagai Salah Satu Syarat untuk Mencapai Derajat Magister Program Studi Penelitian dan Evaluasi Pendidikan Disusun dan Diajukan oleh HERWELIS kepada PROGRAM PASCASARJANA UNIVERSITAS NEGERI MAKASSAR 2013 TESIS ANALISIS KUALITAS SOAL UJIAN AKHIR SEKOLAH (UAS) MATA PELAJARAN MATEMATIKA TINGKAT SMK KABUPATEN TAKALAR TAHUN PELAJARAN 2012/2013 Disusun dan Diajukan oleh HERWELIS Nomor Pokok : 11B12003 Telah dipertahankan di depan Panitia Ujian Tesis pada tanggal 22 Juli 2013 Menyetujui Komisi Penasihat, Prof. Dr. Mansyur, M.Si. Dr. Patahuddin, M.Pd Ketua Anggota Mengetahui : Ketua Direktur Program Studi Program Pascasarjana Penelitian Dan Evaluasi Pendidikan Universitas Negeri Makassar Prof. Dr. Ruslan, M.Pd Prof. Dr. Jasruddin, M.Si NIP 196003 12 198603 1 003 NIP 19641222 199103 1 002 PRAKATA Alhamdulillah Puji syukur kehadirat Allah SWT karena atas rahmat dan ridho-Nyalah sehingga penelitian dan penyusunan tesis ini dapat diselesaikan dengan judul ” Analisis Kualitas Soal Ujian Akhir Sekolah (UAS) Mata Pelajaran Matematika Tingkat SMK Kabupaten Takalar Tahun Pelajaran 2012/2013”. Sungguh proses penyelesaian tesis ini merupakan suatu perjuangan panjang yang cukup melelahkan bagi penulis. Selama proses penelitian berlangsung tidak sedikit kendala yang dihadapi penulis, namun berkat usaha, kerja keras dan semangat pantang menyerah, solusi selalu ada berkat Rahmat dari Allah SWT dan atas dukungan keluarga, teman dan keseriusan pembimbing dalam mengarahkan penulis. Oleh karena itu, penulis patutlah mengucapkan terima kasih kepada: 1. Prof. Dr. H. Arismunandar, M.Pd, Rektor Universitas Negeri Makassar, Prof. Dr. Jasruddin, M.Si., Direktur Program Pascasarjana Universitas Negeri Makassar, Prof. Dr. Suradi Tahmir, MS, Asisten Direktur I, Prof. Dr.Andi Ihsan, M.Kes, Asisten Direktur II, Prof. Dr. Ruslan, M. Pd, Ketua Program Studi Penelitian dan Evaluasi Pendidikan dan seluruh dosen, staf dan pegawai Program Pascasarjana UNM. 2. Bapak Prof. Dr. Mansyur, M.Si. dan Dr. Patahuddin, M.Pd selaku pembimbing atas kesediaannya untuk membimbing dan meluangkan waktu dalam memberikan arahan-arahan pada penulis sehingga tesis ini dapat diselesaikan. 3. Bapak Prof. Dr. Sidin Ali, M.Pd. dan Prof. Dr.Ruslan,M.Pd serta. Prof. Dr. H. Andi Ihsan, M.Kes, selaku penguji yang juga telah banyak memberikan koreksi-koreksi yang bermanfaat dalam perbaikan tesis ini. 4. Bapak Kepala Sekolah SMK Negeri 1 Galesong Selatan dan Kepala Sekolah SMK Samudera Nusantara Makassar, yang telah memberikan dukungan dan kesempatan kepada penulis untuk menempuh pendidikan Program Pascasarjana UNM. 5. Para Kepala Sekolah SMK Se Kabupaten Takalar yang telah memberi izin dalam pengumpulan data tesis ini. 6. Teman-teman mahasiswa Program Pascasarjana UNM angkatan 2011 khususnya jurusan Penelitian dan Evaluasi Program. 7. Kedua orang tuaku tercinta Alm. M. Asiri dan Alm. Nunju Abdul Hafid, Istri tercinta Rosmiaty S.Pd, M.Pd dan ananda tersayang Tegar Ramadhan Heros dan Teguh Sanjaya Heros, saudara dan lainnya yang telah memberikan dukungan, semangat dan doa kepada penulis dalam melanjutkan pendidikan hingga selesainya penulisan tesis ini. Semoga Allah SWT yang Maha Pengasih dan Penyayang senantiasa melimpahkan rahmat dan taufiknya serta ganjaran yang berlipat ganda atas segala dukungan, dorongan, dan bantuan serta pengorbanan dari semua pihak hingga selesainya penulisan tesis ini. Penulis menyadari bahwa tesis ini mempunyai keterbatasan-keterbatasan sehingga memerlukan perbaikan pada penelitian-penelitian selanjutnya. Oleh karena itu setiap saran dan kritikan yang mengarah kepada penyempurnaan tesis ini dengan kebesaran hati penulis akan menerimanya. Akhirnya, penulis berharap semoga tesis ini dapat bermanfaat bagi yang berkepentingan dan dapat memberikan nilai ibadah serta mendapatkan ridho dari Allah SWT. Amin. Makassar, Juli 2013 Herwelis PERNYATAAN KEORISINALAN TESIS Saya, Herwelis, Nomor Pokok : 11B12003, Menyatakan bahwa tesis yang berjudul : “Analisis Kualitas Soal Ujian Akhir Sekolah (UAS) Mata Pelajaran Matematika Tingkat SMK Kabupaten Takalar Tahun Pelajaran 2012/2013”. merupakan karya asli. Seluruh ide yang ada dalam tesis ini, kecuali yang saya nyatakan sebagai kutipan, merupakan ide yang saya susun sendiri. Selain itu tidak ada bagian dari tesis ini yang telah saya gunakan sebelumnya untuk memperoleh gelar atau sertifikat akademik. Jika pernyataan di atas terbukti sebaliknya, maka saya bersedia menerima sanksi yang ditetapkan oleh PPs Universitas Negeri Makassar. Tanda tangan ................................, Tanggal .................................... ABSTRAK HERWELIS. Analisis Kualitas Soal Ujian Akhir Sekolah (UAS) Mata Pelajaran Matematika Tingkat SMK Kabupaten Takalar Tahun Pelajaran 2012/2013. (Dibimbing oleh Mansyur dan Fatahuddin). Tujuan penelitian ini adalah (i) untuk mengetahui : validitas, reliabilitas, tingkat kesukaran, daya beda, efektif tidaknya pengecoh soal UAS Mata Pelajaran Matematika tingkat SMK Kabupaten Takalar menurut teori klasik; (ii) untuk mengetahui tingkat kesukaran, daya beda, peluang menebak soal UAS Matematika tingkat SMK Kabupaten Takalar menurut teori respon butir; (iii) untuk mengetahui perbandingan kualitas soal berdasarkan teori klasik dan teori respon butir. Penelitian ini bersifat ex-post facto. Data dalam penelitian ini berupa : tahapan pembuatan soal UAS, kisi-kisi soal UAS, kartu soal, soal UAS dan lembaran hasil jawaban siswa. Teknik pengumpulan data diperoleh dalam bentuk dokumentasi. Teknik analisis data dalam mengungkap kualitas soal ; secara kualitatif dilakukan penelaan oleh pakar, analisis secara kuantitatif berdasarkan teori tes klasik dan teori respon butir. Hasil penelitian menunjukkan bahwa (i) validitas butir soal kategori cukup (ii) reliabilitas soal tinggi dengan koefisien reliabilitas sebesar 0,912; (iii) tingkat kesukaran berdasarkan analisis klasik tidak proporsional; (iv) daya beda butir soal berdasarkan analisis klasik, dari 40 butir soal 31 atau 77,50% butir soal kategori sangat baik, 5 atau 12,50 % butir soal kategori baik dan 4 atau 10 % butir soal kategori cukup dan jelek; (v) pengecoh butir soal berdasarkan analisis klasik dari 40 butir soal 28 atau 70 % butir soal berfungsi efektif dan 12 atau 30 % butir soal tidak berfungsi efektif; (vi) tingkat kesukaran butir soal dalam analisis respon butir 1PL berkisar antara soal termudah -0,85 s/d soal tersulit 1,13, tingkat kesukaran dapat diamati dari estimasi kurva karakteristik masing-masing butir soal; (vii) daya beda butir soal pada analisis model logistik 2PL, dari 40 butir soal yang telah dianalisis, 32 butir soal masuk kategori daya beda yang baik dengan indeks daya beda antara 0 s/d 2, sedangkan sisanya 8 butir soal dengan daya beda kurang baik. Sedangkan pada analisis model 3PL, 15 butir soal baik dengan indeks daya beda antara 0 s/d 2 dan 25 butir soal yang masuk daya beda kurang baik. Daya beda dari setiap butir soal dapat diamati pada kurva karakteristik masing-masing butir soal; (viii) peluang menebak dari 40 butir soal, sebanyak 30 butir soal kategori faktor quessing baik, dengan indeks berkisar 0 s/d 0,24 dan 10 butir soal kategori faktor quessing kurang baik dengan indeks di atas 0,25; (ix) pada analisis butir soal secara klasik tingkat kesukaran dan daya beda butir soal sangat bergantung kepada kelompok peserta tes sedangkan pada analisis respon butir dalam menganalisis butir soal berdasarkan kemampuan individu peserta tes. Kualitas butir soal pada teori klasik dengan memperhatikan proporsional perbandingan tingkat kesukaran butir soal, kemampuan daya beda soal dan efektif tidaknya pengecoh soal, sedangkan kualitas butir soal pada teori respon butir berdasarkan nilai parameter yang mendukung dan mengamati kurva karakteristik butir soal. DAFTAR ISI Halaman PRAKATA iv PERNYATAAN KEORISINALAN TESIS vii ABSTRAK viii ABSTRACT ix DAFTAR TABEL xi DAFTAR GAMBAR xiii DAFTAR LAMPIRAN xiv BAB I PENDAHULUAN 1 A. Latar Belakang 1 B. Rumusan Masalah 7 C. Tujuan Penelitian 8 D. Manfaat Penelitian 9 BAB II TINJAUAN PUSTAKA 11 A. Kajian Teoretis 11 1. Evaluasi Pendidikan 11 2. Tes 15 3. Teori Tes Klasik 20 4. Teori Respon Butir 37 5. Perbandingan Teori Klasik dan Teori Respon Butir 49 6. Kualitas Soal melalui Analisi Butir 51 B. Kajian Penelitian Relevan 55 C. Kerangka Pikir 56 BAB III METODE PENELITIAN 60 A. Lokasi dan Waktu Penelitian 60 B. Jenis dan Desain Penelitian 60 C. Populasi dan sampel 61 D. Batasan Istilah 62 E. Data dan Teknik Pengumpulan Data 64 F. Teknik Analisa Data 64 BAB IV HASIL PENELITIAN DAN PEMBAHASAN 69 A. Hasil Penelitian 69 B. Pembahasan 108 BAB V KESIMPULAN DAN SARAN 118 A. Kesimpulan 118 B. Saran 119 DAFTAR PUSTAKA 121 LAMPIRAN – LAMPIRAN 124 DAFTAR TABEL Nomor Halaman 3.1. Distribusi respon peserta didik kelas XII SMK Se Kabupaten Takalar dalam UAS 4.1. Validasi isi Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013. 4.2. Persentase Penelaan Butir Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.3. Kategori Validasi Butir Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.4. Reliabilitas Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.5. Tingkat Kesukaran Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.6. Persentase Tingkat Kesukaran Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.7. Daya Beda Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.8. Persentase Tingkat Daya Beda Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.9. Efektifitas Pengecoh (Distractor) Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.10. Persentase Kualitas Butir Soal Berdasarkan Teori Klasik Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.11. Hasil Estimasi Kesesuaian Model dengan Test Item Fit 4.12. Hasil Estimasi Tingkat Kesukaran Butir Soal Pada Model 1PL Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.13. Hasil Estimasi Tingkat Kesukaran dan Daya Beda Butir Soal Pada Model 2PL, Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.14. Hasil Estimasi Tingkat Kesukaran, Daya Beda dan Peluang Menebak Butir Soal Pada Model 3PL, Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.15. Hasil Analisis Kategori Butir Soal Berdasarkan Analisis Model Logistik 3PL, Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.16. Persentase Kualitas Butir Soal Berdasarkan Teori Respon Butir 3PL, Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013 4.17. Hasil Estimasi Fungsi Informasi Butir Pada Model 3PL, Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013. 4.18. Kualitas Butir Soal Berdasarkan Teori Klasik dan Teori Respon Butir Soal Ujian Akhir Sekolah Mata Pelajaran Matematika Tingkat SMK Se Kabupaten Takalar TP. 2012/2013. 361 670 73 675 676 678 679 7 781 782 784 985 886 9 988 989 1 992 195 197 1100 1104 1107 1 1 DAFTAR GAMBAR Nomor Halaman 2.1 Kurva Karakteristik Butir untuk Model Satu Parameter dengan b = 1.0 2.2. Kurva Karakteristik Butir untuk Model Dua-Parameter dengan b = 1.0, a = 1.5 2.3. Kurva Karakteristik Butir untuk Model Tiga-Parameter dengan b = 1.5, a = .3, c = .2 2.4. Skema Kerangka Pikir 3.1 Desain Penelitian 4.1. Kurva karakteristik 40 butir soal estimasi model logistik 1PL 4.2. Kurva karakteristik butir soal 2 (tersulit) dan butir soal 4 (termudah) estimasi model logistik 1PL 4.3. Kurva karakteristik 40 butir soal estimasi model logistik 2PL 4.4. Kurva Karakteristik butir soal nomor 6, 19 dan 35 estimasi model logistik 2PL 4.5. Kurva karakteristik 40 butir soal estimasi model logistik 3PL 4.6. Kurva karakteristik butir soal nomor 5, 19 dan 35 estimasi model logistik 3PL 4.7. Kurva karakteristik Fungsi Informasi Butir 4.8. Kurva karakteristik Fungsi Informasi Butir soal 3,14 dan 16 4.9. Kurva karakteristik Fungsi Informasi Soal 4.10. Kurva karakteristik Fungsi Informasi Soal Kategori Baik 1 342 444 445 559 961 990 91 193 94 198 199 799 102 105 1106 DAFTAR LAMPIRAN Nomor Halaman 1 Instrumen Validasi Isi 2 Skor Penelaan validasi isi oleh validator 3 Respon Siswa terhadap Ujian Akhir Sekolah 4 Skor Respon Siswa terhadap Ujian Akhir Sekolah 5 Analisis validitas butir soal dan reliabilitas soal 6 Proporsi menjawab benar kelompok atas 7 Proporsi menjawab benar kelompok bawah 8 Analisis tingkat kesukaran dan daya beda butir soal UAS 9 Uji persyaratan independen lokal respon butir 10 Uji Unidimensi respon butir 11 Uji test item fit respon butir 12 Perintah kunci R Program dalam analisis butir secara modern 13 Estimasi kurva karakteristik butir soal dengan 1PL 14 Estimasi kurva karakteristik butir soal dengan 2PL 15 Estimasi kurva karakteristik butir soal dengan 3PL 16 Perintah kunci program R dalam analisis butir soal secara Modern, estimasi kurva fungsi informasi butir tes 17 Estimasi kurva karakteristik fungsi informasi butir 18 Efektivitas Pengecoh Soal Pilihan Ganda 19 Izin Penelitian dari PPs UNM 20 Izin Penelitian dari Kesbang Kabupaten Takalar 21 Surat keterangan validasi instrumen penelitian dari HEPI Sul-Sel 22 Surat Keterangan Telah Meneliti dari Kepala SMK Takalar 23 Surat Keterangan Perbaikan Hasil Seminar 24 Surat Keterangan Perbaikan Ujian Tesis 25 Daftar Riwayat Hidup 1 3128 1142 1143 1160 1177 1179 1187 1196 1197 1198 2201 2204 2 2207 2215 2222 2229 2230 2237 2254 255 2256 7 257 2262 2263 2264 BAB I PENDAHULUAN A. Latar Belakang Pendidikan merupakan sebuah program yang melibatkan sejumlah komponen dan bekerja sama dalam sebuah proses untuk mencapai tujuan yang diprogramkan. Sebagai sebuah program, pendidikan merupakan aktivitas sadar dan sengaja yang diarahkan untuk mencapai suatu tujuan. Untuk mengetahui apakah penyelenggaraan program dapat mencapai tujuannya secara efektif dan efisien, maka perlu dilakukan evaluasi. Untuk itu, evaluasi dilakukan atas komponen-komponen dan proses kerjanya sehingga apabila teriadi kegagalan dalam mencapai tujuan maka dapat ditelusuri komponen dan proses yang menjadi sumber kegagalan. Evaluasi adalah pengambilan keputusan berdasarkan hasil pengukuran dan standar kriteria. Pengukuran dan evaluasi merupakan dua kegiatan yang berkesinambungan. Pengambilan keputusan dilakukan dengan membandingkan hasil pengukuran dengan kriteria yang ditetapkan. Oleh karena itu, terdapat dua kegiatan dalam melakukan evaluasi yaitu melakukan pengukuran dan membuat keputusan. Gronlund & Linn dalam Kusairi & Suprananto (2012:10) menggolongkan evaluasi kedalam empat kelompok, yaitu evaluasi penempatan (placement evaluation), evaluasi formatif (formatif evaluation), evaluasi diagnostik (diagnostic evaluation), dan evaluasi sumatif (summative evaluation). Evaluasi penempatan dimaksudkan untuk menentukan kemampuan peserta didik di awal pembelajaran. Evaluasi untuk mendapatkan informasi awal tentang pengetahuan dan keterampilan yang dimiliki untuk mengikuti pembelajaran yang akan direncanakan dan mengetahui minat dan karakteristik peserta didik. Evaluasi formatif dimaksudkan untuk memantau kemajuan belajar selama pembelajaran. Tujuan evaluasi formatif untuk memberikan umpan balik secara kontinu kepada peserta didik maupun guru terkait dengan keberhasilan dan kegagalan pembelajaran. Evaluasi diagnostik ditujukan untuk mendiagnosis berbagai kesulitan peserta didik selama pembelajaran. Tujuan utama evaluasi diagnostik adalah untuk menentukan penyebab kesulitan belajar dan merumuskan suatu rencana tindakan remidiasi. Sedangkan evaluasi sumatif ditujukan untuk mengevaluasi prestasi peserta didik di akhir pembelajaran. Evaluasi jenis ini didesain untuk menentukan seberapa jauh tujuan pembelajaran telah dicapai. Evaluasi jenis ini umumnya digunakan untuk menetapkan nilai suatu mata pelajaran atau menyatakan penguasaan peserta didik terhadap tujuan pembelajaran yang telah ditetapkan. Evaluasi jenis inilah yang biasanya dilakukan setiap satuan pendidikan di sekolah sebagai acuan kenaikan kelas atau penyelesaian studi. Dalam Undang-Undang RI Nomor 20 Tahun 2003 Tentang Sistem Pendidikan Nasional, evaluasi diatur dalam Bab XVI Pasal 57, 58, dan 59. Pelaksanaan evaluasi bertujuan untuk mengukur dan mengendalikan mutu pendidikan. Penjabaran lebih lanjut tentang pelaksanaan evaluasi dinyatakan dalam Peraturan Pemerintah RI Nomor 19 Tahun 2005 Tentang Standar Nasional Pendidikan. Pada pasal 63 ayat (1) menyebutkan bahwa penilain pendidikan pada jenjang pendidikan dasar dan menengah terdiri atas: (a) penilaian hasil belajar oleh pendidik, (b) penilaian hasil belajar oleh satuan pendidikan, dan (c) penilaian hasil belajar oleh pemerintah. Penilaian hasil belajar oleh pendidik dan satuan pendidikan merupakan bentuk evaluasi internal (internal evaluation). Berkenaan dengan evaluasi oleh pemerintah, sifatnya sebagai evaluasi eksternal (external evaluation) yang sasarannya adalah peserta didik, termasuk di dalamnya hasil belajar peserta didik. Realisasi hal tersebut di atas terlihat pada setiap akhir tahun akademik di setiap satuan pendidikan melaksanakan evaluasi hasil belajar peserta didik dalam bentuk Ujian Nasional (UN) dan Ujian Akhir Sekolah. Dalam Peraturan Menteri RI no. 4 tahun 2010 dijelaskan Tentang Ujian Nasional dan Ujian Sekolah. Ujian Nasional yang selanjutnya disebut UN adalah kegiatan pengukuran pencapaian kompetensi peserta didik pada beberapa mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi dalam rangka menilai pencapaian Standar Nasional Pendidikan. Adapun Ujian sekolah/madrasah adalah kegiatan pengukuran pencapaian kompetensi peserta didik yang dilakukan oleh satuan pendidikan untuk memperoleh pengakuan atas prestasi belajar dan merupakan salah satu persyaratan kelulusan dari satuan pendidikan. Mata pelajaran yang diujikan adalah mata pelajaran kelompok mata pelajaran ilmu pengetahuan dan teknologi yang tidak diujikan dalam ujian nasional dan aspek kognitif dan/atau psikomotorik kelompok mata pelajaran agama dan akhlak mulia serta kelompok mata pelajaran kewarganegaraan dan kepribadian yang akan diatur dalam Prosedur Operasi Standar (POS) Ujian Sekolah/Madrasah. Evaluasi hasil belajar peserta didik tersebut pada Sekolah Menengah Kejuruan berdasarkan Permen Diknas RI Nomor 4 tahun 2010 Tentang Ujian sekolah/ madrasah pasal 1.1. Ujian sekolah adalah kegiatan penilaian dalam bentuk ujian tulis/dan/atau praktek untuk mengetahui pencapaian standar kompetensi lulusan pada semua mata pelajaran yg tdk diujikan dalam UASBN dan Ujian Nasional. Ditingkat sekolah ujian ini biasa disebut Ujian Akhir Sekolah (UAS). Ujian Akhir Sekolah pada tingkat Sekolah Menengah Kejuruan disingkat SMK berupa ujian dalam bentuk tes tertulis. Tes ini dilakukan untuk mengukur kemampuan peserta didik dalam setiap mata palajaran yang diujikan. Tes merupakan salah satu alat untuk melakukan pengukuran, yaitu alat untuk mengumpulkan informasi karakteristik suatu objek. Dalam pembelajaran objek ini bisa berupa kecakapan peserta didik, minat motivasi dan sebagainya. Tes merupakan bagian tersempit dari penilaian. Menurut Djemari dalam Widoyoko, E. P. (2011:45) tes merupakan salah satu cara untuk menaksir besarnya kemampuan seseorang secara tidak langsung, yaitu melalui respons seseorang terhadap stimulus atau pertanyaan. Tes dapat juga diartikan sebagai sejumlah pertanyaan yang harus diberikan tanggapan dengan tujuan untuk mengukur tingkat kemampuan orang atau mengungkap aspek tertentu dari orang yang dikenai tes. Respons peserta tes terhadap sejumlah pertanyaan maupun pernyataan menggangbarkan kemampuan dalam bidang tertentu. Tes digunakan untuk mengukur hasil belajar yang bersifat hard skills. Tentu saja tes yang digunakan untuk mengukur kemampuan peserta didik tersebut haruslah berkualitas, memenuhi unsur-unsur yang dipersyaratkan. Untuk soal Ujian Nasional penulis mengangngap tidaklah bermasalah karena proses pembuatannya langsung dilakukan oleh Kementrian Nasional. Namun untuk soal ujian akhir sekolah, soal tersebut diberi kewenangan satuan pendidikan untuk membuatnya. Hal ini sesuai Permen Diknas RI nomor 4 tahun 2010 Tentang Ujian sekolah/ madrasah pasal 1.1. Ujian sekolah adalah kegiatan penilaian dalam bentuk ujian tulis/dan/atau praktek untuk mengetahui pencapaian standar kompetensi lulusan pada semua mata pelajaran yang tidak diujikan dalam UASBN dan UN. Pasal ayat 1 dan 2 menyatakan ; bahan ujian sekolah disusun oleh satuan pendidikan berdasarkan kurikulum yg berlaku pada satuan pendidikan. Soal ujian sekolah disusun berdasar : kisi-kisi, mengikuti kaidah-kaidah penulisan soal sesuai dengan kompetensi yang dituntut dan materi yang sudah diajarkan, menggunakan bahasa indonesia yang benar, mempertimbangkan waktu mengerjakan soal. Adanya kewenangan satuan pendidikan untuk membuat sendiri soal ujian akhir sekolah dikawatirkan kurang berkualitas dan syarat-syarat kualitas soal yang baik sangatlah sulit untuk terpenuhi. Ini bisa terjadi karena unsur-unsur yang terlibat dalam pembuatan soal tersebut belum memiki kemampuan dan kapasitas untuk membuat soal yang baik. Ini terjadi karena minimnya kegiatan-kegiatan pengembangan guru dalam hal pembuatan instrumen tes selama ini. Seperti SMK di Kabupaten Takalar, soal ujian akhir sekolah biasanya dibuat guru secara bersama dari utusan SMK Se Kabupaten Takalar untuk setiap mata pelajaran yang akan diujikan. Namun guru-guru yang menjadi utusan dalam membuat soal tersebut, tidaklah semuanya mempunyai kemampuan atau kapasitas untuk membuat soal yang baik. Hal yang sama diungkapkan oleh Ali, S & Khaeruddin (2012:65) “kenyataan di sekolah banyak praktek yang keliru dalam penyusunan instrumen tes. Banyak kasus menunjukkan bahwa guru tidak mengikuti prosedur baku dalam penyusunan dan pengembangan instrumen tes”. Hasil observasi awal tentang jenis soal ujian akhir sekolah SMK di Kabupaten Takalar selama dua tahun terakhir yakni tahun pelajaran 2010/2011 dan tahun pelajaran 2011/2012 berbentuk soal pilihan ganda. Soal yang digunakan khusus untuk mata pelajaran matematika seragam untuk semua SMK di Kabupaten Takalar. Soal dibuat seragam karena jurusan atau program studi SMK yang ada berada dalam Bidang Studi Keahlian Teknologi dan Rekayasa. Soal pilihan ganda yang baik haruslah memenuhi beberapa kaidah sehingga soal yang tersusun bermutu. Kaidah-kaidah tersebut diantaranya memperhatikan 3 aspek, yakni ; aspek materi, konstruksi dan bahasa. Diduga minimnya pengetahuan guru dalam menyusun soal dapat menyebabkan soal UAS yang dihasilkan kurang bermutu. Kualitas soal, termasuk bentuk soal pilihan ganda (dikotomi) dapat diungkap melalui analisis butir soal secara teoretis (telaah) dan analisis empiris. Analisis butir soal secara kualitatif dilakukan untuk menilai butir soal ditinjau dari aspek materi, konstruksi, dan bahasa. Analisis secara kuantitatif menekankan pada analisis karakteristik butir soal secara empiris. Karakteristik butir soal antara lain meliputi indeks kesukaran (p), daya beda (d), dan distribusi respons. Di Kabupaten Takalar, kegiatan penelahaan dan analisis butir-butir soal selama ini jarang dilakukan. Itulah sebabnya materi, konstruksi soal, bahasa, validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan distraktor soal yang diujikan pada UAS perlu dipertanyakan. Apakah soal ujian akhir sekolah (UAS) yang selama ini dibuat oleh utusan guru-guru SMK Se Kabupaten Takalar sudah memenuhi syarat-syarat soal yang baik. Hal ini terkait dengan tidak dilakukannya uji teoritik dan empirik terhadap naskah soal UAS, menyebabkan karakteristik dan kualitas soal belum diketahui. Faktor kualitas soal yang belum diketahui, tentu saja ini akan berpengaruh terhadap kemampuan peserta didik dalam mengerjakan soal. Kelemahan ini akan berdampak pada sulitnya menentukan kemampuan peserta didik yang sebenarnya. Berdasarkan uraikan di atas, penulis tertarik untuk meneliti kualitas soal ujian akhir sekolah SMK Se Kabupaten Takalar untuk tahun pelajaran 2012/2013. B. Rumusan Masalah Berdasarkan latar belakang yang telah diuraikan sebelumnya, maka akan dikemukakan beberapa masalah dalam penelitian ini. 1. Apakah soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 telah memenuhi kriteria validitas isi? 2. Apakah soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 telah memenuhi kriteria validasi butir soal? 3. Apakah soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 telah memenuhi kriteria reliabilitas soal? 4. Bagaimanakah tingkat kesukaran, daya beda dan pengecoh soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 menurut teori tes klasik? 5. Bagaimanakah tingkat kesukaran, daya beda dan peluang menebak soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 menurut teori respon butir? 6. Bagaimanakah perbandingan kualitas soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 berdasarkan teori klasik dan teori respon butir? C. Tujuan Penelitian Bertitik tolak dari permasalahan di atas, secara umum penelitian ini bertujuan untuk mengetahui kualitas soal UAS Mata Pelajaran Matematika tingkat SMK se Kabupaten Takalar. Beberapa tujuan diharapkan dapat dicapai dalam penelitian ini. 1. Untuk mengetahui validitas isi soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013. 2. Untuk mengetahui tingkat validasi butir soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013. 3. Untuk mengetahui tingkat reliabilitas soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013. 4. Untuk mengetahui tingkat kesukaran, daya beda dan efektif tidaknya pengecoh soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 menurut teori tes klasik 5. Untuk mengetahui tingkat kesukaran, daya beda dan peluang menebak soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 menurut teori respon butir. 6. Untuk mengetahui perbandingan kualitas soal UAS Mata Pelajaran Matematika SMK Kabupaten Takalar Tahun Pelajaran 2012/2013 berdasarkan teori klasik dan teori respon butir D. Manfaat Hasil Penelitian Secara teoritis penelitian ini diharapkan dapat memberi sumbangan bagi pengembangan kemampuan pendidik dalam menentukan kualitas soal, baik dengan analisis secara kualitatif maupun analisis secara kuantitatif dengan menggunakan teori klasik dan teori modern. Manfaat praktis yang diharapkan dalam penelitian ini. 1. Bagi Peneliti, menjadi media dalam aplikasi ataupun penerapan ilmu pengetahuan dalam menganalisis kualitas suatu soal. 2. Bagi Pendidik, dapat menjadi rujukan bagi para pendidik dalam melakukan evaluasi pembelajaran, terkhusus analisis-analisis tentang : validitas, reliabilitas, tingkat kesukaran soal, daya beda soal, faktor pengecoh soal baik analisis secara klasik maupun analisis secara modern. 3. Bagi Pemerintah dalam hal ini Dinas Pendidikan Pemuda dan Olahraga Kabupaten Takalar. Memberi informasi yang akurat tentang kualitas soal UAS yang selama ini dibuat oleh guru-guru di Kabupaten Takalar. BAB II TINJAUAN PUSTAKA A. Kajian Teoretis 1. Evaluasi Pendidikan Dalam kehidupan sehari-hari, setiap orang sering dihadapkan pada masalah pengambilan keputusan. Demikian pula dalam kegiatan belajar mengajar, guru haruslah mengambil keputusan apakah seorang peserta didik harus mengulang materi tertentu, apakah peserta didik pantas naik kelas ataukah harus tidak lulus. Tentu saja bukan pekerjaan mudah untuk membuat keputusan tersebut. Diperlukan berbagai pertimbangan yang matang agar diperoleh keputusan yang benar dan tepat sehingga tidak merugikan peserta didik. Untuk mendapatkan keputusan yang tepat, diperlukan informasi yang memadai tentang peserta didik, seperti penguasaan mereka terhadap materi, sikap dan perilakunya. Dalam kontes inilah, evaluasi memegang peran yang cukup penting. Dari sini pula, evaluasi diharapakan dapat memberikan umpan balik yang objektif tentang apa yang dipelajari peserta didik, bagaimana peserta didik belajar dan bagaimana pula efektivitas pembelajaran. Pendidikan merupakan sebuah proses kegiatan yang disengaja atas input peserta didik untuk menimbulkan suatu hasil yang diinginkan sesuai tujuan yang ditetapkan. Sebagai sebuah proses sengaja maka pendidikan harus dievaluasi hasilnya untuk melihat apakah hasil yang dicapai telah sesuai dengan tujuan yang diinginkan dan apakah proses yang dilakukan efektif untuk mencapai hasil yang diinginkan. Pendidikan mencakup sebuah rentang kawasan yang terdiri atas beberapa komponen yang bekerja dalam sebuah sistem. Evaluasi pendidikan yang komprehensif harus dilakukan terhadap seluruh komponen dan sistem kerjanya. Pendidikan melibatkan peserta didik, guru, metode, tujuan, kurikulum, media, sarana, kepala sekolah, pemerintah, masyarakat, pengguna lulusan, lingkungan fisik dan manusia dan sebagainya. Oleh karenanya evaluasi pendidikan dilakukan atas komponen-komponen pendidikan tersebut. Evaluasi yang komprehensif menghasilkan informasi yang lengkap sebagai dasar perbaikan dalam pendidikan. Evaluasi berasal dari kata evaluation (bahasa Inggris) yang berarti penilaian. Menurut Weis dalam Purwanto (2011:24) “evaluasi menerjemahkan bukti menjadi pengertian kuantitatif dan membandingkan hasil dengan kriteria yang telah ditetapkan, kemudian ditarik kesimpulan mengenai keefektifan, kegunaan, keberhasilan dan segalanya”. Menurut Ali, S dan Khaeruddin (2012:3) “secara umum penilaian dan evaluasi adalah suatu proses sistematik untuk mengetahui tingkat keberhasilan dan efisiensi suatu program”. Salah satu yang menjadi masalah utama di dalam penilaian pembelajaran adalah pengukuran hasil belajar. Pengukuran tersebut merupakan landasan yang terpenting di dalam penilaian pembelajaran. Hanya penilaian yang berdasar pada hasil pengukuran yang dapat dipercaya sehingga dapat dijadikan landasan yang kuat bagi pengambilan keputusan atau kebijakan tentang pembelajaran. Evaluasi yang dikaitkan dengan pembelajaran di sekolah merupakan suatu usaha untuk mengukur beberapa atribut atau tingkah laku individu seperti pengetahuan, sikap, dan keterampilan guna membuat keputusan tentang status atribut tersebut. Keputusan yang didasarkan atas pengukuran atribut-atribut tersebut kemudian menentukan tingkat penguasaan peserta didik atau keberhasilan mengajar seorang guru setelah dibandingkan dengan standar yang telah dibuat sebelumnya. Pendapat lain dalam konteks pendidikan, khususnya berkaitan dengan hasil kerja peserta didik, Nitko & Brookhart dalam Mansyur dkk. (2009:7) mendefinisikan evaluasi sebagai suatu proses penetapan nilai yang berkaitan dengan kinerja dan hasil karya peserta didik. Fokus evaluasi dalam kontes ini adalah individu, yaitu prestasi belajar yang dicapai kelompok peserta didik atau kelas. Sudut pandang ini melihat bahwa evaluasi merupakan suatu proses penentuan sejauh mana tujuan pendidikan telah tercapai. Konsekuensi logis dari pandangan ini, mengharuskan evaluator untuk mengetahui betul tentang tujuan yang ingin dievaluasi. Beberapa hal yang dapat dijadikan sebagai objek evaluasi dalam konteks ini yaitu prestasi belajar, sikap, prilaku, motivasi, minat, tanggungjawab dan lainnya. Dari beberapa definisi di atas tentang evaluasi maka dapat disimpulkan bahwa evaluasi adalah suatu proses penilaian yang sistematis terhadap suatu objek yang dievaluasi untuk menentukan suatu keputusan. Adapun pengertian evaluasi pendidikan biasanya dikaitkan dengan prestasi belajar peserta didik. Munurut Wirawan (2011:5), pada awal tahun 1930-an Ralph Winfred Tyler – yang kemudian disebut sebagai Bapak Evaluasi, menciptakan istilah educational evaluation (evaluasi pendidikan). Tyler menerbitkan pandangannya yang inovatif mengenai kurikulum dan evaluasi. Ia mengemukan definisi dan teorinya mengenai evaluasi yang mengfokuskan pada menilai apakah tujuan suatu program tercapai atau tidak yang kemudian dikenal sebagai Goal based evaluation model. Teorinya mengenai evaluasi tersebut dapat membantu menentukan objektif perilaku yang diperlukan dalam pengembangan kurikulum dan testing. Menurutnya evaluasi pendidikan merupakan sebuah proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah tercapai. Jika belum, bagaimana yang belum dan apa penyebabnya. Definisi yang lebih luas dikemukakan oleh dua ahli lain, yakni Cronbach, L. J. (1984) menyatakan bahwa proses evaluasi pendidikan bukan sekedar mengukur sejauh mana tujuan tercapai, tetapi digunakan untuk membuat keputusan. Evaluasi merupakan proses memperoleh, menyajikan, dan menggambarkan informasi yang berguna untuk menilai suatu alternatif pengambilan keputusan tentang suatu program. Astin dalam Mansyur dkk. (2009:9), menyarankan tiga komponen yang harus dievaluasi agar hasilnya dapat meningkatkan kualitas pembelajaran. Ketiga komponen tersebut adalah : masukan, lingkungan sekolah dan keluarannya. Selama ini yang dievaluasi adalah prestasi belajar peserta didik, khususnya ranah kognitif saja. Ranah afektif meskipun penting karena sulit mengukurnya maka masih jarang dilakukan oleh lembaga pendidikan. Demikian juga dengan kondisi lingkungan sekolah ikut menentukan kualitas pendidikan. Berdasarkan beberapa definisi tentang evaluasi pendidikan, maka dapat disimpulkan bahwa evaluasi pendidikan adalah proses penilaian yang bertujuan mengukur apakah hasil belajar sudah mencapai tujuan yang telah ditentukan oleh kurikulum pendidikan dan menjadi dasar pengambilan keputusan . Evaluasi pendidikan mulai berkembang di Indonesia dengan didirikannya Badan Penelitian dan Pengembangan Pendidikan, Departemen Pendidikan dan Kebudayaan (Balitbang Dikbud) pada masa orde baru pada tahun 1980-an. Pada tahun 1980 - 2000, untuk mengendalikan, mengevaluasi, dan mengembangkan mutu pendidikan, Ujian sekolah disebut Evaluasi Belajat Tahap Akhir Nasional (EBTANAS). Dalam EBTANAS ini, dikembangkan perangkat ujian paralale untuk setiap mata pelajaran yang diujikan. Sedangkan yang menyelenggarakan dan monitoring soal dilaksanakan oleh daerah masing-masing, kemudian pada tahun 2001-2004 EBTANAS diganti menjadi Ujian Akhir Nasional (UNAS). Hal yang menonjol dalam peralihan dari EBTANAS menjadi UNAS adalah dalam penentuan kelulusan peserta didik, yaitu ketika masih menganut sistem Ebtanas kelulusan berdasarkan nilai 2 semester raport terakhir dan nilai EBTANAS murni, sedangkan dalam kelulusan UNAS ditentukan oleh mata pelajaran secara individual, selanjutnya tahun 2010 - Sekarang UNAS diganti menjadi Ujian Nasional (UN). Untuk UN tahun 2012 peserta didik yang melaksanakan UN dapat mencapai nilai standar minimal UN sehingga mendapatkan lulusan UN dengan baik. Perubahan evaluasi ini untuk meningkatkan kualitas pendidikan Indonesia. Hasil evaluasi pendidikan merupakan informasi yang sangat berguna bagi pengelola pendidikan baik ditingkat pusat, provinsi, kabupaten/kota, maupun sekolah. Salah satu tujuan evaluasi pendidikan adalah untuk meningkatkan kualitas pendidikan. 2. Tes Tes merupakan suatu instrumen yang digunakan untuk mengukur kemampuan seseorang atau peserta tes dalam suatu bidang ilmu tertentu. Tes biasanya dibuat dalam bentuk beberapa pertanyaan yang akan mendapatkan tanggapan atau jawaban dari responden atau peserta tes. Dari tanggapan atau jawaban responden atau peserta tes inilah kita akan diketahui sejauh mana kemampuannya dalam bidang ilmu tertentu yang diujikan. Menurut Mansyur dkk. (2009:21) tes diartikan sebagai sejumlah pertanyaan yang membutuhkan jawaban, atau sejumlah pernyataan yang harus diberikan tanggapan dengan tujuan mengukur tingkat kemampuan seseorang atau mengungkap aspek tertentu dari orang yang dikenai tes (testee). Hal yang sama tentang tes diungkapkan oleh Ali, S dan Khaeruddin (2012:16) bahwa tes merupakan salah satu bentuk instrumen yang terdiri atas sejumlah pertanyaan, atau butir-butir soal yang digunakan untuk memperoleh data atau informasi melalui jawaban responden atau peserta tes. Selanjutnya Cronbach, L. J. (1984:26) mendefinisikan tes sebagai “... a systematic procedure for observing a person’s behavior and describing it with the aid of a numerical scale or category system’’ Dalam definisi ini tes merupakan suatu presedur sistematis, dilakukan berdasarkan tujuan dan tata cara yang jelas untuk mengamati prilaku seseorang dapat dijelaskan dalam bentuk skala angka atau sistem kategori. Menurut Djemari dalam Widoyoko, E. P. (2011:45) tes merupakan salah satu cara untuk menaksir besarnya kemampuan seseorang secara tidak langsung, yaitu melalui respons seseorang terhadap stimulus pertanyaan. Dari beberapa pengertian atau definisi tentang tes di atas, maka dapat disimpulkan bahwa tes adalah salah satu bentuk instrumen dalam bentuk pertanyaan atau pernyataan yang disusun secara sistematis untuk mengetahui kemampuan seseorang dari hasil respon atau tanggapan yang diberikannya. Bentuk tes yang pada umumnya digunakan di lembaga pendidikan dilihat dari sistem penskorannya dikategorikan menjadi dua, yakni tes obyektik dan tes subjektif. Tes objektif dapat diartikan bahwa siapa saja yang memeriksa lembar jawaban tes akan menghasilkan skor yang sama, sedangkan tes subjektif penskorannya sangat dipengaruhi oleh pemeriksa. Secara umum kita mengenal tiga tipe tes objektif yakni : benar salah (true false), menjodohkan (matching) dan pilihan ganda (multiple choice), sedangkan tes subjektif salah satunya dikenal dengan tes uraian atau essay. Dari beberapa tipe tes tersebut, yang akan dikupas lebih dalam dalam penelitian ini adala tes objektif dalam bentuk pilihan ganda karena tes tipe inilah yang digunakan dalam Ujian Akhir Sekolah di SMK se- Kabupaten Takalar yang menjadi sasaran penelitian ini. a. Soal Pilihan Ganda (Multiple Choice Test) Soal bentuk pilihan ganda merupakan soal yang jawabannya harus dipilih dari beberapa kemungkinan jawaban yang telah disediakan. Secara umum , setiap soal pilihan ganda terdiri dari pokok soal (stem) dan pilihan jawaban (option). Pilihan jawaban terdiri dari kunci jawaban dan pengecoh (distractor). Kunci jawaban adalah jawaban yang benar atau paling benar. Pengecoh merupakan jawaban yang tidak benar atau kurang tepat, namun memungkinkan seseorang terkecoh untuk memilihnya apabila ia tidak menguasai materi dengan baik. Menurut Sudaryono (2012:110) di berbagai satuan pendidikan banyak menggunakan tes pilihan ganda. Hal ini disebabkan : (a) tipe tes disusun dan digunakan untuk mengukur semua standar kompetensi, mulai yang paling sederhana sampai yang paling kompleks; (b) jumlah alternatif jawaban (option) lebih dari dua sehingga mengurangi keinginan peserta didik untuk menebak (quessing); (c) tipe tes ini menuntut kemampuan peserta didik untuk membedakan berbagai tingkatan kebenaran sekaligus; dan (d) tingkat kesukaran butir soal dapat dikendalikan dengan hanya mengubah tingkat homogenitas alternatif jawaban. Bentuk tes formatif pilihan ganda di skor secara objektif, karena pemeriksaannya atau penskorannya tidak selalu dilakukan oleh manusia, tapi dapat dilakukan mesin misalnya mesin scanner. Kemudian oleh Kusaeri & Suprananto (2012:108) menyatakan bahwa : soal bentuk pilihan ganda memiliki beberapa kelebihan, diantaranya : (a) mampu mengukur berbagai tingkatan kognitif (dari ingatan sampai dengan evaluasi) (b) penskorannya mudah, cepat, objektif dan dapat mencakup ruang lingkup bahan atau materi yang luas dalam suatu tes untuk suatu kelas, dan (c) lebih tepat untuk ujian yang pesertanya banyak atau massal, tetapi hasilnya harus segera diumumkan, seperti ulangan akhir semister, ulangan kenaikan kelas, dan ujian akhir sekolah. Namun demikian, bentuk ini juga memiliki beberapa keterbatasan, antara lain : (a) memerlukan waktu yang relatif lama untuk menulis soalnya, (b) sulit membuat pengecoh yang homogen dan berfungsi dengan baik, dan (c) terdapat peluang untuk menebak tes. b. Kaidah Penulisan Tes Pilihan Ganda Dalam penulisan tes pilihan ganda, ada beberapa kaidah yang harus dipenuhi agar soal yang tersusun bermutu. Kaidah-kaidah tersebut dilihat dari 3 aspek, yakni ; aspek materi, konstruksi dan bahasa. (Kusaeri & Suprananto, 2012 : 165) Pada aspek materi, soal harus sesuai indikator. Artinya, soal harus menanyakan perilaku atau materi yang hendak diukur sesuai dengan tuntutan indikator, kemudian materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian sehari-hari tinggi). Selanjutnya pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Artinya, semua pilihan jawaban harus berasal dari materi yang sama seperti yang terkandung dalam pokok soal, penulisannya harus setara dan semua pilihan jawaban harus berfungsi. Setiap soal harus mempunyai satu jawaban yang benar atau yang paling benar. Artinya satu soal hanya mempunyai satu kunci jawaban yaitu pilihan jawaban yang paling benar. Pada aspek konstruksi, pokok soal harus dirumuskan secara singkat, jelas dan tegas. Artinya, kemampuan atau materi yang hendak diukur atau ditanyakan harus jelas, tidak menimbulkan pengertian atau penafsiran yang berbeda (multi taksir) dari yang dimaksud penulis, dan hanya mengandung satu persoalan untuk setiap nomor. Pokok soal tidak memberi petunjuk ke kunci jawaban, kemudian pokok soal bebas dari pernyataan yang bersifat negatif ganda dan pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya. Pada aspek bahasa, setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. Jangan menggunakan bahasa yang berlaku setempat/tabu, jika soal akan digunakan untuk daerah lain atau nasional. Bahasa yang digunakan harus komunikatif sehingga mudah dimengerti peserta didik. Bila peserta didik tanpa melihat terlebih dahulu pilihan jawaban sudah dapat mengerti pertanyaan atau maksud pokok soal, maka dapat disimpulkan bahwa pokok soal sudah jelas. Kemudian pilihan jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian. 3. Teori Tes Klasik (Classical Test Theory / CTT) Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Pemakaian teori tes klasik dalam kontruksi dan interpetasi skor telah berjalan beberapa dekade lamanya. Menurut Mardapi, D. (2005) teori tes klasik menggunakan model pengukuran yang sangat sederhana, yakni skor yang tampak terdiri dari skor sebenarnya dan skor kesalahan. Orang cenderung memberi skor lebih atau kurang terhadap subjek yang menempuh tes termasuk pada kesalahan spesifik. Selain itu kesalahan spesifik ini bisa disebabkan estimasi kemampuan dari suatu alat ukur yang cenderung lebih besar dari kemampuan sebenarnya atau sebaliknya. Menurut Naga, D. S. (1992:4) pada ujites atau kuesioner klasik, ciri klasik ditunjukkan oleh kenyataan bahwa kelompok butir pada ujites atau kuesioner tidak dapat dipisahkan dari kelompok peserta yang menempuh ujites atau yang mengisi kuesioner. Dalam artian pada pengukuran klasik, kelompok butir yang sama ditempuh atau diisi oleh kelompok peserta yang sama. Jika kelompok butir ujites atau kuesioner yang sama ditempuh atau diisi olek kelompok peserta yang berbeda, maka ciri atau karakteristik kelompok butir itu pada umumnya berubah. Dengan kata lain, taraf kesukaran dan daya beda kelompok butir itu berubah semata-mata karena mereka ditanggapi oleh kelompok peserta yang berbeda. Untuk butir yang sama, kelompok peserta berbeda menunjukkan ciri butir (taraf kesukaran dan daya beda) yang berbeda. Dengan demikian, pada uji tes klasik, sekor sangat bergantung kepada butir dan peserta. Menurut Kartowagiran, B. (2009:12) skor sebenarnya (true score = T) dan skor kesalahan (error score = E) adalah konstruk teoritik yang tidak dapat diamati. Hanya skor amatan (observed score = X) yang dapat diperoleh, dan skor amatan = skor sebenarnya + kesalahan (X = T + E). Jika kita berbicara skor sebenarnya, penting diingat bahwa skor sebenarnya yaitu skor rata-rata yang diperoleh dari pengulangan tes secara independen dengan menggunakan tes yang sama, adalah teoritis belaka. Skor ini tidak menunjukkan dengan lengkap karakteristik sebenarnya dari peserta tes kecuali kalau tes tersebut memiliki validitas sempurna, yaitu bahwa tes tersebut mengukur dengan tepat apa pokok isi yang diukur. Menurut para ahli, ada beberapa kelemahan yang ada pada pendekatan teori klasik. Beberapa di antaranya adalah Hambleton, dkk (1991) dan Lord (1980) dalam Kartowagiran, B. (2009:12) mereka menjelaskan bahwa kelemahan-kelemahan tes teori klasik adalah: (1) statistik butir tes sangat tergantung pada karakteristik subjek yang dites; (2) taksiran kemampuan peserta tes sangat tergantung pada butir tes yang diujikan; (3) kesalahan baku penaksir skor berlaku untuk semua peserta tes, sehingga kesalahan baku pengukuran tiap peserta dan butir soal tidak ada; (4) informasi yang disajikan terbatas pada menjawab benar atau salah saja tidak memperhatikan pola jawaban peserta tes; dan (5) asumsi tes paralel susah dipenuhi. Walaupun teori klasik ini memiliki beberapa kelemahan namun masih banyak yang menggunakan, hal ini karena pada teori klasik tidak menuntut responden besar dan mudah mengaplikasikannya. Oleh karenanya, untuk pengukuran yang melibatkan responden kecil misal pada pengukuran melalui tes ulangan harian pada sekolah-sekolah untuk tingkat kelas atau pengukuran pada bidang psikologi pada umumnya masih menggunakan pendekatan teori tes klasik. Analisis kuantitatif menurut pendekatan teori tes klasik menghasilkan karakteristik butir yang meliputi tingkat kesukaran (p), daya pembeda (d), dan efektivitas distraktor. Selain itu, dengan analisis kuantitatif pendekatan teori klasik juga dapat diketahui reliabilitas tes, dan kesalahan baku pengukuran. Untuk melihat tingkat kesukaran, daya pembeda, dan efektivitas distraktor dilakukan analisis setiap butir soal, sedangkan reliabilitas dan kesalahan pengukuran baku dapat dilihat dengan cara menganalisis soal secara keseluruhan. Menurut Kartowagiran, B. (2009:12) teori tes klasik berpegang pada 3 asumsi dasar, yakni: tidak ada korelasi antara skor sebenarnya dan skor kesalahan, tidak ada korelasi antara kesalahan acak pada pengukuran yang dilakukan berulang-ulang dan rerata kesalahan acak pengukuran sama dengan nol. Berdasarkan asumsi di atas diperoleh bahwa varians skor sebenarnya (Vx) dan varians skor kesalahan (Ve) dan varians skor tampak (Vt) dapat ditulis sebagai: Vx = Vt + Ve ............ Badrun Kartowagiran ( 2009:12) Berdasarkan asumsi-asumsi tersebut diatas dikembangkan sejumlah formula untuk menghitung besarnya indeks reliabilitas, tingkat kesukaran, daya pembeda dan dugaan. Formula yang banyak digunakan dalam menghitung indeks reliabilitas menurut teori tes klasik adalah Spearman-Brown dan Cronbach-alpha. Keunggulan teori tes klasik terletak pada kemudahan dalam pemahaman konsepnya. Teori yang dibutuhkan untuk memahami konsep teori tes klasik relatif lebih mudah perhitungannya dibandingkan teori respon butir. Ukuran sampel pada teori tes klasik tidak perlu besar, minimum 30 orang. Teori ini sudah berkembang sehingga cukup banyak peneliti yang memahaminya dan menggunakannya. Keunggulan lainnya adalah analisis butir soal dengan teori ini bisa dilakukan perhitungan menggunakan kalkulator yang sederhana sehingga mudah diterapkan pada skala kecil seperti kelas-kelas. Disamping memiliki keunggulan, teori tes klasik juga memiliki beberapa kelemahan. Menurut Mardapi, D. (2005) model teori tes klasik didasarkan pada asumsi yang lemah, yakni asumsi yang dapat dipenuhi dengan oleh kebanyakan data tes. Pertama, kebanyakan statistik yang digunakan model teori tes klasik ini seperti tingkat kesukaran, daya pembeda dan lainnya sangat bergantung pada sampel yang digunakan dalam analisis. Rerata kemampuan , rentang, dan sebaran kemampuan subjek yang dijadikan sampel sangat mempengaruhi nilai statistik yang diperoleh. Sebagai contoh: tingkat kesukaran soal akan tinggi bila sampel yang digunakan mempunyai kemampuan lebih tinggi dari rerata tingkat kemampan subjek. Daya Pembeda soal akan tinggi apabila tingkat kemampuan sampel yang digunakan sangat bervariasi atau mempunyai rentang kemampuan yang besar. Demikian pula koefisien reliablilitas sangat berkaitan dengan variabilitas skor yang dijadikan sampel. a. Validitas (Validity) Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang diinginkan diukur. Menurut Anastasi, A. & Urbina, S. (1997:113), validitas berhubungan dengan apakah tes mengukur apa yang mesti diukurnya dan seberapa baik dia melakukannya. Sedangkan oleh Cozby, P. C. (2009:138) validitas merujuk pada kebenaran dan representasi akurat dari nformasi. Sehingga tes yang valid adalah tes yang dapat mengukur dengan tepat keadaan yang ingin diukur. Menurut Atkin dkk. dalam Mansyur dkk. (2009:235) mengatakan sahih atau valid memiliki banyak dimensi, diantaranya kesahihan isi (content validity), kesahihan konstruk (construct validity) dan kesahihan instruksional (instructional validity). Kesahihan isi mengacu pada tingkatan dimana suatu penilaian mampu mengukur area isi yang diharapkan. Kesahihan konstruk mengacu pada tingkatan dimana penilaian mengukur konstruk teori atau kemampuan yang diharapkan, Kesahihan instruksional apabila materi atau isi sepadan dengan apa yang benar-benar diajarkan. Sedangkan oleh Kusaeri & Suprananto (2012:77) mengklasifikasikan validitas atas 3, yakni validitas isi (content validity), validitas konstruk (construct validity) dan validitas kriteria (criteria validity). Validitas isi berkaitan dengan derajat kemampuan tes mengukur cakupan substansi yang ingin diukur. Dua aspek penting yaitu valid isi dan valid teknik samplingnya. Valid isi mencakup hal-hal yang berkaitan dengan apakah butir-butir tes itu menggambarkan pengukuran dalam cakupan yang ingin diukur. Valid teknik sampling umumnya berkaitan dengan bagaimanakah baiknya suatu sampel tes mempresentasikan total cakupan isi. Menurut Sudijono, A. (2005:164) validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisaan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu ; sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isinya dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Jadi validitas isi sebenarnya identik dengan pembicaraan populasi dan sampel. Kalau saja keseluruhan materi pelajaran yang telah diberikan kepada peserta didik kita anggap sebagai sebagai populasi dan isi tes hasil belajar dalam mata pelajaran yang sama kita anggap sebagai sampelnya, maka tes hasil belajar dalam mata pelajaran tersebut dapat dikatakan telah memiliki validitas isi, apabila tes tersebut (sebagai sampel) dapat menjadi wakil yang representatif bagi seluruh materi pelajaran yang telah diajarkan atau telah diperintahkan untuk dipelajari sebagai populasi. Agar validitas ini dapat dicapai maka selama pengonstruksian atau pengembangan butir-butir tes perlu dibuat butir-butir tes itu sesuai dengan kisi-kisi. Artinya perlu adanya keselarasan antara butir-butir tes yang sedang dikembangkan dengan kisi-kisi tes. Oleh karena itu, penting kiranya mengembangkan kisi-kisi yang cermat sehingga cakupan isi yang dibidik benar-benar terwujud. Menurut Purwanto (2011:121) pengujian validitas isi dapat dilakukan dengan meminta pertimbangan ahli (expert judgement). Orang yang memiliki kompetensi dalam suatu bidang dapat dimintakan pendapatnya untuk menilai ketepatan isi butir soal. Pertimbangan juga dapat dimintakan kepada profesional (profesional judgement). Selain itu penilaian validitas isi juga dapat dimintakan pertimbangan kepada beberapa orang yang memiliki kompetensi untuk memberikan penilaian (interrater judgement). Pertimbangan yang dimintakan kepada ahli, profesional atau rater menyangkut isi dari butir soal dan kisi-kisinya. Pertimbangan menyangkut materi yang akan diukur menggunakan butir-butir soal. Butir-butir yang mengukur materi sebagaimana dipahami dan disepakati oleh ahli, profesional atau penilai dapat dinyatakan sebagai butir-butir soal yang valid. Menurut Mansyur dkk. (2009:240) terdapat dua macam tipe content validity, yaitu face validity dan logikal validity. Face validity tercapai apabila pemeriksaan terhadap butir-butir tes memberi kesimpulan bahwa tes tersebut mengukur aspek yang relevan. Dasar penyimpulannya lebih banyak diletakkan pada common sense dan akal sehat. Kesimpulannya ini dapat diperoleh oleh siapa saja walaupun tentu tidak semua orang diharapkan setuju menyatakan bahwa tes A, misalnya memiliki content validity yang baik. Akan tetapi, seseorang yang ingin menggunakan tes tersebut harus punya keyakinan terlebih dahulu bahwa dari segi content, tes itu valid. Kalau tidak, maka tidak ada alasan yang kuat untuk memakainya. Sedangkan logical validity disebut juga sampling validity. Tipe validitas ini menuntut batasan yang seksama terhadap kawasan (domain) perilaku yang diukur dan suatu desain logis yang dapat mencakup bagian-bagian kawasan prilaku tersebut. Sejauhmana tipe validitas ini telah terpenuhi dapat dilihat dari cakupan butir-butir yang ada dalam tes. Apakah keseluruhan butir tersebut telah merupakan sampel yang representative bagi seluruh butir yang mungkin dibuat, ataukah butir-butir tersebut berisi hal-hal yang kurang relevan dan meninggalkan hal-hal yang seharusnya menjadi isi tes. Adapun menurut Arifin, Z. (2012:248) validitas muka menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement yang mendalam. Validitas terkait konstruk didefinisikan sebagai proses menentukan derajat kemampuan tes diinterpretasikan ke dalam satu atau lebih konstruk psikologi. Konstruk merupakan sifat psikologis yang diasumsikan ada, diperlukan untuk menjelaskan beberapa aspek tingkah laku. Penalaran matematika merupakan sebuah konstruk. Demikian pula intelegensi, kreativitas, kemampuan membaca dan karakteristik kepribadian (seperti kejujuran dan kecemasan) merupakan sebuah konstruk. Dikatakan konstruk karena semuanya merupakan konstruksi teoritik yang digunakan untuk menjelaskan tingkah laku. Walaupun umumnya berkaitan dengan pengujian teori, validitas ini memiliki implikasi kegunaan praktis terkait hasil tes. Validitas ini dilakukan selama pengembangan dan uji coba tes yang didasarkan pada sekumpulan bukti dari berbagai macam sumber yang berbeda. Secara umum, proses yang digunakan dalam validitas ini mencakup : (1) mengidentifikasi dan mendeskripsikan melalui kerangka teoritis makna konstruk yang diukur, (2) menyusun dugaan/hipotesis dengan mengacu pada teori yang mendasari konstruk dan (3) menguji kebenaran dugaan secara logis dan empiris. Pengujian validitas konstruk dapat dilakukan dengan meminta pertimbangan ahli, profesional atau rater. Prosedur pengujian serupa dengan pengujian dalam uji validitas isi. Perbedaannya adalah pertimbangan dalam pengujian validitas isi adalah kesesuaian butir dengan kisi-kisi dalam hal isi, sedang dalam pengujian validitas konstruk yang dimintakan pertimbangan dalam konstruksi. Instrumen dinyatakan valid apabila penilai menunjukkan kesepakatan dalam menilai konstruksi butir yang ditunjukkan oleh korelasi hitung skor kedua penilai yang signifikan pada taraf signifikansi tertentu. Sedangkan validitas kriteria, misalnya ketika skor tes digunakan untuk memprediksi kemampuan anak di masa mendatang atau mengestimasi kemampuan anak saat ini dengan membandingkan pada hasil dari pengukuran alat ukur lain (disebut kriteria) maka kita berada dalam bahasan validitas berkaitan dengan kriteria. Dari pengertian ini maka pengukuran kemampuan kedua (yang disebut kriteria) mungkin diperoleh diperoleh di masa yang akan datang. Jadi validitas kriteria dapat diartikan sebagai pengujian validitas yang dilakukan dengan membandingkan suatu tes dengan kriteria tertentu di luar tes. Instrumen dapat dinyatakan valid apabila telah mengukur dengan hasil sebagaimana hasil pengukuran kriterianya. Validitas yang telah diuraikan di atas, yakni validitas isi, validitas konstruk dan validitas kriteria adalah validitas tes secara keseluruhan. Disamping itu juga dikenal validitas butir soal. Menurut Arikunto, S. (2009:76) validitas butir soal adalah sebuah butir dikatakan valid apabila mempunyai dukungan yang besar terhadap skor totalnya. Sebuah butir soal memiliki validitas yang tinggi jika skor pada butir soal mempunyai kesejajaran dengan skor total. Kesejajaran dapat diartikan dengan korelasi, sehingga untuk mengetahui validitas butir soal dapat digunakan rumus korelasi product moment atau korelasi point biserial. Hal senada dikemukakan oleh Sudijono dalam Sudaryono (2012:147) bahwa validitas tes sangat dipengaruhi oleh validitas yang dimiliki oleh masing-masing butir item yang membangun tes tersebut. Validitas masing-masing butir soal dapat diketahui dengan jalan melihat besar kecilnya dukungan yang diberikan masing-masing butir terhadap tes secara keseluruhan. Untuk menafsirkan koefisien korelasi menurut Arifin, Z. (2012:257) dapat menggunakan kriteria sebagai berikut : 0,81 – 1,00 = sangat tinggi 0,61 – 0,80 = tinggi 0,41 – 0,60 = cukup 0,21 – 0,40 = rendah 0,00 – 0,20 = sangat rendah Sedangkan oleh Mansyur dkk. (2009:252) cara seleksi butir adalah dengan menguji korelasi antara skor butir dengan skor totalnya. Dalam hal ini, koefisien korelasi yang tinggi menunjukkan kesesuaian antara fungsi butir dengan fungsi ukur tes secara keseluruhan. Prosedur ini disebut validasi butir dengan pendekatan konsistensi internal (internal consistency). Koefisien korelasi antara butir dan skor total merupakan indeks validitas butir dalam arti kesesuaian butir dengan skor total dalam membedakan subjek yang mendapat skor tinggi dan yang mendapat skor rendah. Koefisien korelasi yang relatif tinggi tentu merupakan indikator kualitas butir yang diinginkan. Namun menurut Mansyur dkk. (2009:253) tingginya korelasi antara butir-butir dengan skor total hendaknya jangan sampai memberikan kesimpulan yang keliru bahwa test tersebut telah memenuhi kriteria validitas intrinsiknya.Untuk mengetahui bahwa tes memang mengukur apa yang seharusnya diukur, maka analisis validitas dengan kriteria eksternal tidak dapat ditinggalkan. b. Reliabilitas (Reliability) Keandalan (reliability) berasal dari kata rely yang artinya percaya dan reliabel artinya dapat dipercaya. Kepercayaan berhubungan dengan ketepatan dan konsistensi. Tes dikatakan dapat dipercaya apabila memberikan hasil yang relatif sama secara konsisten. Beberapa ahli memberikan batasan mengenai reliabilitas. Menurut Thorndike dalam Purwanto (2011:154), reliabilitas berhubungan dengan akurasi instrumen dalam mengukur apa yang diukur, kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran ulang. Sedangkan oleh Purwanto (2011:155) reliabilitas berhubungan dengan kemampuan alat ukur untuk melakukan pengukuran secara cermat. Menurut Mansyur dkk. (2009:255) alat ukur yang memiliki sifat reliabel menjamin bahwa alat ukur tersebut konsisten dan stabil untuk mengukur objek ukur yang sama dalam waktu berbeda. Kerlinger dalam Purwanto (2011:155) memberikan beberapa batasan tentang reliablitas yaitu : 1) reliabilitas dicapai apabila kita mengukur himpunan obyek yang sama berulang kali dengan instrumen yang sama atau serupa akan memberikan hasi yang sama atau serupa, 2) reliabilitas dicapai apabila ukuran “yang sebenarnya” untuk sifat yang diukur, dan 3) keandalan dicapai dengan meminimalkan galat pengukuran yang terdapat dalam suatu instrumen pengukur. Dari beberapa definisi tentang reliabilitas maka dapat disimpulkan bahwa reliabilitas adalah alat ukur atau instrumen yang konsisten memberikan hasil yang relatif sama meskipun dilakukan pengukuran berulang dalam waktu yang berbeda. Besarnya nilai koeefisien reliabiltas yang sesungguhnya, sulit untuk diketahui secara pasti. Yang dapat dilakukan adalah dengan mengistimasi realibilitas berdasarkan dari skor amatan melalui metode-metode oleh para ahli dianggap sebagai suatu metode yang tepat sehingga memberikan nilai yang hampir mendekati nilai sebenarnya. Menurut Linn (1989) dalam Mansyur dkk. (2009:269) batas minimal suatu tes dikatakan memiliki sifat ajeg (konsisten dan stabil) adalah 0,70. Metode yang gunakan untuk mengestimasi koefisien reliabilitas dari suatu tes oleh Mansyur dkk. (2009:275), yang. Pertama, metode Test-Retest dilakukan dengan menggunakan tes yang sama pada kelompok subjek yang sama dua kali dengan memberikan tenggang yang cukup diantara kedua penyajian tersebut. Kedua, Estimasi reliabilitas dengan menggunakan metode parallel forms dilakukan dengan menghitung korelasi amatan antara dua tes yang parallel yang disajikan pada kelompok yang sama. Ketiga, Metode internal consistency hanya memerlukan penyajian tes saja (dikenal dengan single trial administration) dan arena itu masalah-masalah yang timbul akibat penyajian dapat dihindari. Salah satu prosedur dalam metode internal consistency yang sangat popular adalah yang menghasilkan realibilyas split-half (belah dua). Tes yang diestimasi realibitasnya dibelah dua bagian yang diusahakan pararel. Pembelahan ini dilakukan setelah keseluruhan tes sebagai keselurhan dikenakan pada para subjek. Kemudian dapat diperoleh distribusi skor amatan subjek untuk belahan pertama dan belahan kedua. Untuk mengetahui distribusi masing-masing belahan dapat menggunakan bentuk yang dipakai beberapa ahli pengukuran, diantaranya : Spearman-Brown Formula, Formula Rulon, Koefisien Alpha, Formula Kuder Richardson dan Formula Kristoff untuk Belah Tiga. Dalam hal ini, dalam menentukan tingkat reliabilitas soal, digunakan salah formula yakni Kuder Richardson (KR-20) dengan persamannya sebagai berikut : n S12 - Σ pq r11 = ....................... (Purwanto, 2011:169) n – 1 S12 Dimana : n : jumlah butir soal S12 : varians total P : proporsi skor yang diperoleh Q : proporsi skor maksimum dikurangi skor yang diperoleh c. Tingkat Kesukara

Item Type: Thesis (S2)
Subjects: ILMU PENDIDIKAN > Pendidkan
Divisions: FAKULTAS ILMU PENDIDIKAN
FAKULTAS ILMU PENDIDIKAN
Depositing User: UPT PERPUSTAKAAN UNM
Date Deposited: 09 Dec 2016 07:05
Last Modified: 09 Dec 2016 07:05
URI: http://eprints.unm.ac.id/id/eprint/1727

Actions (login required)

View Item View Item