Konsep Validitas
Menurut Azwar (1986) para ahli psikometri telah menetapkan kriteria bagi suatu alat ukur psikologis untuk dapat dinyatakan sebagai alat ukur yang baik dan mampu memberikan informasi yang tidak menyesatkan. Kriteria itu antara lain adalah valid, reliabel, norma dan praktis.
Sifat reliabel dan valid diperlihatkan oleh tingginya reliabilitas dan validitas hasil ukur suatu tes. Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan merupakan suatu keputusan yang tepat.
Seringkali pula keputusan itu tidak menyangkut individu secara langsung akan tetapi mengenai suatu kelompok. Dalam berbagai studi dan penelitian tidak jarang dipergunakan alat ukur untuk mengetahui keadaan atau status psikologis sekelompok individu tertentu.
A. Pengertian Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986).
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat.
Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat.
B . Istilah Validitas
Istilah validitas ternyata memiliki keragaman kategori. Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity, construct validity, face validity, factorial validity, empirical validity, intrinsic validity, predictive validity, content validity, dan curricular validity.
§ Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
§ Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran.
§ Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
§ Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
§ Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
§ Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur.
§ Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang.
§ Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
§ Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
C. Jenis-jenis Validitas
terdapat perbedaan pengelompokan jenis-jenis validitas, Elazar Pedhazur menyatakan bahwa validitas yang umum dipakai tripartite classification yakni Content, Criterion dan Construct, sementara Kenneth Bailey mengelompokan tiga jenis utama validitas yaitu :
Face validity, Criterion Validity, dan construct validity, dengan catatan face validity cenderung dianggap sama dengan content validity. Berikut ini akan dikemukakan beberapa jenis validitas yaitu :
1. Validitas Rupa (Face validity). Adalah validitas yang menunjukan apakah alat pengukur/instrumen penelitian dari segi rupanya nampak mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat penting dalam pengukuran kemampuan individu seperti pengukuran kejujuran, kecerdasan, bakat dan keterampilan.
2. Validitas isi (Content Validity). Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
3. Validitas kriteria (Criterion validity). Adalah validasi suatu instrumen dengan membandingkannya dengan instrumen-pengukuran lainnya yang sudah valid dan reliabel dengan cara mengkorelasikannya, bila korelasinya signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat dua bentuk Validitas kriteria yaitu :
a.Validitas konkuren (Concurrent validity),
b.Validitas ramalan (Predictive validity),
Validitas konkuren adalah kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran lain untuk
a.Validitas konkuren (Concurrent validity),
b.Validitas ramalan (Predictive validity),
Validitas konkuren adalah kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran lain untuk
konstruk yang sama.
Validitas ramalan adalah kemampuan suatu instrumen pengukuran memprediksi secara tepat dengan apa yang akan terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas ramalan.
Validitas ramalan adalah kemampuan suatu instrumen pengukuran memprediksi secara tepat dengan apa yang akan terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas ramalan.
4. Validitas konstruk (Construct Validity). Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi kriteria.
D. Fungsi Validitas
Validitas dikatakan tinggi bila alat ukur dapat menjalankan fungsi ukurnyayaitu :
1. Memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukurantersebut
2. Dapat memberikan gambaran perbedaan
Pernyataan valid harus diikuti dengan keterangan yang menunjuk kepadatujuan pengukuran, yaitu :
1. Valid untuk mengukur apa
2. Valid untuk mengukur pada kelompok yang mana
TEKNIK PENGUJIAN VALIDITAS TES
Untuk dapat menentukan apakah suatu tes telah memiliki validitas ataudaya ketepatan mengukur, dapat dilakukan dari dua segi yaitu :Dari segi tes itu sendiri sebagai suatu totalitas dan dari segi itemnya, sebagai bagian yang tidak terpisahkan dari tes tersebut.Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapatdilakukan dengan dua cara, yaitu:
1.Pengujian Validitas Tes Secara Rasional
Validitas rasoinal adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang
diperoleh dengan berpikir secara logis. Dengandemikian maka suatu tes hasil belajar dapat dikatakan telah memilikivaliditas rasional apabila setelah dilakukan penganalisisan secara rasionalternyata bahwa tes hasil belajar itu memang (secara rasional) dengan tepattelah dapat mengukur apa yang seharusnya diukur. Untuk dapat menentukan apakah tes hasil belajar memiliki validitas rasional atau belumdapat dilakukan penelusuran dari dua segi.yaitu : validitas isi ,dan validitas konstruksi.
RELIABILITAS
Reliabilitas adalah suatu ukuran yang menunjukkan sejauh mana hasil pengukuran tetap konsisten bila diukur beberapa kali dengan alat ukur yang sama. Misalnya kita ingin mengukur jarak. Alat ukur pertama yang kita gunakan adalah meteran logam, dan alat ukur lainnya adalah dengan menghitung langkah kaki. Pengukuran dengan meteran logam akan mendapatkan hasil yang sama kalau pengukurannya diulang dua kali atau lebih. Namun sebaliknya jika pengukuran dengan tapak kaki, besar kemungkinan akan didapatkan hasil yang berbeda kalau pengukurannya diulang dua kali atau lebih.Jadi dapat disimpulkan bahwa pengukuran dengan meteran logam lebih reliabel dibandingkan dengan kaki.
A. Reliabiltas dalam penelitian
1. Ketergantungan (dependability). Konsep ketergantungan berkaitan erat dengan keterandalan. Hasil dari pengujian awal diharapkan akan konsisten dengan pengujian-pengujian berikutnya.
2. Hasilnya selalu berupa numerik dan tak boleh berubah-ubah, karena merupakan karakteristik dari proses ukuran.Reliabilitas selalu menunjukkan keandalan instrumen penelitian dalan berbagai bentuk, yakni hasil pengujian yang sama jika dilakukan oleh orang yang berbeda (inter-penilai), hasil pengujian yang sama jika dilakukan oleh orang yang sama dalam waktu berbeda (pengetesan ulang), hasil pengujian yang sama jika dilakukan oleh orang yang berbeda dalam
waktu bersamaan dengan tes yang berbeda (bentuk paralel), dan hasil pengujian yang sama dengan menggunakan berbagai pernyataan-pernyataan membangun (konsistensi internal).
B. Jenis
- Reliabilitas stabil (stability reliability)
Mengacu pada waktu untuk menentukan stabilitas, tes dilakukan ulang terhadap variabel yang sama di waktu yang berlainan. Hasil pengujian tersebut akan dibandingkaan dan berkorelasi dengan pengujian awal untuk memberikan stabilitas.
- Reliabilitas terwakili (representative reliability)
Mengacu pada keterandalan masing-masing grup. Menguji apakah penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang berbeda-beda.
- Reliabilitas seimbang (equivalence reliability)
Menerapkan banyak indikator yang dapat dioperasionalisasikan ke semua konsepsi pengukuran. Kesetaraan keandalan akan menggunakan dua instrumen untuk mengukur konsep yang sama pada tingkat kesulitan yang sama. Reliabilitas atau tidaknya pengujian akan ditentukan dari hubungan dua skor instrumen, atau lebih dikenal dengan hubungan antara variabel bebas (independen variable) dengan variabel terikat (dependen variable).
C. Cara meningkatkan
- Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
- Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi
yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh.
- Gunakan lebih dari satu indikator.. Dengan adanya lebih dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual.
- Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan.Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
D. Cara Mengukur
Pertanyaan dikatakan reliabel apabila jawaban seseorang terhadap pertanyaan adalah konsisten atau stabil dari waktu ke waktu.
Pengukuran reliabilitas pada dasarnya dapat dilakukan dengan dua cara :
- Repeated Measure. Pertanyaan ditanyakan pada responden berulang pada waktu yang berbeda, (misalnya sebulan kemudian), dan kemudian dilihat apakah ia tetap konsisten dengan jawabannya.
- One Shot. Disini pengukurannya hanya sekali dan kemudian hasilnya dibandingkan dengan pertanyaan lain. Pada umumnya pengukuran reliabilitas sering dilakukan dengan one shot dengan beberapa pertanyaan. Pengujian reliabilitas dimulai dengan menguji validitas terlebih dahulu. Jika pertanyaannya tidak valid, maka pertanyaan tersebut dibuang. Pertanyaan yang sudah valid baru secara bersama-sama diukur reliabilitasnya.
Ada tiga kategori koefisien reliabilitas, yaitu :
# Reliabilitas test-Retes
Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan yaitu rumus korelasi Pearson.
# Reliabilitas Bentuk-Alternatif
Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). Korelasi antara skor-skor yang didapatakan pada dua bentuk itu merupakan koefisien reliabilitas tes.
# Konsistensi Internal Ukuran Reliabilitas
Reliabilitas Belah-Separuh (Split-Half Reliability).
Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar.
Dilain pihak dalam reliablitas tes-retes dan reliabilitas bentuk-alternatif, tiap skor didasarkan pada jumlah soal penuh pada tes. Jika semua hal sama, semakin panjang sebuah tes, semakin dapat dihandalkan tes itu. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Browon.
E. Test Reliabilitas
Koefisien reliabilitas ( dipercaya ) dan koefisisen validitas ( tepat ) adalahgambaran tentang derajat kualitas tes secara keseluruhan.Koefisien Reliabilitas tes dikenal ada 2 macam, yaitu :
1.Koefisien StabilitasPenting digunakan untuk tes Bakat, IQ, dan tes kepribadian. Biasanya perencanaannya dilakukan dalam jangka panjangParadigma :Tes Retes
2.Koefisien EquivalenBila bahan pelajaran terlalu luas, maka dapat dibuat tes paralel dalam isi, tingkatkesukaran dan kognisi.Paradigma :FORM A FORM
Koefisien reliabilitas tes dihitung dengan rumus berikut :
Sx Sy
Keterangan :
r = koefisien reliabiltas tes
X = skor tes
XY = skor tes
YN = jumlah testi ( peserta tes )
S = Simpangan Baku
Ciri-ciri tes yang baik:
1.Tes memiliki validitas
2.Tes harus memiliki reliabilitas
3.Tes harus memiliki objektivitas
4.Tes harus memiliki praktibabilitas
5.Tes bersifat ekonomis
Methode-Methode Yang Digunakan Untuk Mengetahui Tingakat Reliabilitas
Kandalan suatu tes dinyatakan dengan coefisient of reliability (r), yaitu dengan jalan mencari korelasi
1. Dengan metode dua tes : 2 tes yang paralel dan setaraf (ekuivalue) diberikan kepada sekelompok anak. Hasil kedua tersebut kemudian dicari korelasinya.
2. Dengan metode satu tes : sebuah tes diberikan 2 kali kepada sekelompok murid yang sama tetapi dalam waktu yang berbeda.kedua hasil tes itu kemudian dicari korelasinya.
3. Metode spit half (masih dengan 1 tes) : suatu tes dibagi menjadi 2 bagian yang sama tingakat kesukarannya, sama isi dan bentuknya kemudian dilihat skor masing-masing bagian. Dan dicari korelasinya
Kandalan suatu tes dinyatakan dengan coefisient of reliability (r), yaitu dengan jalan mencari korelasi
1. Dengan metode dua tes : 2 tes yang paralel dan setaraf (ekuivalue) diberikan kepada sekelompok anak. Hasil kedua tersebut kemudian dicari korelasinya.
2. Dengan metode satu tes : sebuah tes diberikan 2 kali kepada sekelompok murid yang sama tetapi dalam waktu yang berbeda.kedua hasil tes itu kemudian dicari korelasinya.
3. Metode spit half (masih dengan 1 tes) : suatu tes dibagi menjadi 2 bagian yang sama tingakat kesukarannya, sama isi dan bentuknya kemudian dilihat skor masing-masing bagian. Dan dicari korelasinya