Tuesday 28 December 2010

Validitas dan Reliabilitas

VALIDITAS DAN RELIABILITAS


1.      Validitas
Validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tetapi tergantung penggunaan dan subyeknya. Validitas dipecah lagi menjadi berbagai jenis yang akan dijabarkan berikut ini :
a.            Validitas Isi
Adalah seberapa besar derajat tes mengukur representasi isi yang dikehendaki untuk diukur. Validitas aitem berkaitan dengan apakah aitem mewakili pengukuran dalam area isi sasaran yang diukur, dan validitas sampling adalah seberapa baik sampel isi tes mewakili keseluruhan isi sasaran yang diukur. Biasanya dinilai dengan menggunakan pertimbangan pakar.
b.           Validitas Konstruk/Teoretik
Adalah seberapa besar derajat tes mengukur konstruk hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.
c.            Validitas Konkruen
Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan kriteria lain yang valid yang diperoleh pada saat yang sama.
d.           Validitas Prediktif
Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkap hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.

2.      Reliabilitas
Reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
a.    Reliabilitas test re-test
Disebut juga teknik “single test double trial”. Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
b.  Reliabilitas  Belah Dua (split halve method)
Disebut juga teknik “single test single trial”.  Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomer ganjil-genap, atas dasar nomer awal-akhir, dan dengan cara undian.
c.       Reliabilitas Rasional Ekuivalen
Reliabilitas ini tidak ditentukan menggunakan korelasi tetapi menggunakan estimasi konsistensi internal. Reliabilitas ini diukur menggunakan Kuder-Richardson, biasanya Formula-20 (KR-20) atau Formula-21 (KR-21). Kedua rumus ini hanya dapat dipakai untuk tes yang aitem-aitemnya diskor dikotomi, yaitu benar atau salah, 0 atau
d.  Reliabilitas Penyekor/Penilai
Adalah reliabilitas dua (atau lebih) penyekor independen. Reliabilitas ini biasa ditentukan menggunakan teknik korelasi, tetapi juga dapat hanya dinyatakan dalam persentase kesepakatan.
e. Reliabilitas Belah Separuh (Split-Half Reliability)
Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Jenis reliabilitas ini kadangkala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes saja. Untuk mendapatkan reliabilitas belah-separuh, masalah pertamanya adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut :
d.      rnn  =        nrtt
e.       1 + (n – 1)rtt
rnn        : koefisien yang diperkirakan
 rtt       : koefisien yang diperoleh
 n        : jumlah waktu tes diperpanjang/diperpendek
Ketika diterapkan pada reliabilitas belah separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut :
f.       rtt =    2rhh
g.      1 + rhh
                             Untuk rhh adalah korelasi dari tes-tes paruhan
Metode alternatif untuk mendapatkan reliabilitas belah separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varians dari perbedaan antara skor-skor tiap orang pada dua tes-tes separuh (SDx2) dan varians skor total (SDd2) dua nilai ini disubstitusikan dalm rumus berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :
h.      rtt =    SDx2        SDd21-
             Menarik    untuk   memperhatikan   hubungan  rumus  ini  dengan   varians   kesalahan. Perbedaan  apapun antara   skor-skor     seseorang       pada       dua     tes   paruhan, menampilkan varians kesalahan atau varians yang tidak relevan. Varians-varians perbedaan-perbedaan ini, dibagi dengan varians skor-skor total, memberikan proporsi varians kesalahan dalam skor-skor itu. Ketika varians skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varians “benar” untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas.
f.   Reliabilitas Kuder-Richardson dan Koefisien Alpha
Metode ini didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan : (1) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah separuh) ; dan (2) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya, semakin tinggilah konsistensi antar soal.Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling luas diterapkan, umumnya dikenal sebagai “rumus 20 Kuder-Richardson”, adalah sebagai berikut :
rtt =       n        SD t2    Σpq
n – 1            SD t2
      rtt     : koefisien reliabilitas seluruh tes
      n      : jumlah soal dalam tes
     SDt   : simpangan baku skor-skor total tes
     p       : proporsi orang-orang yang lulus
     q       : proporsi orang-orang yang tidak lulus
    Σpq    : hasil tabulasi antara p dan q

Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor benar atau salah, atau tergantung pada suatu sistem all or none (semua atau tidak sama sekali) lainnya.

   Reliabilitas dan Validitas (Saifuddin Azwar)

1.       Validitas (halaman 45 -  53)

a.      Validitas Isi

Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validasi ini adalah “sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur” atau “sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur”.

Selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu :

1)       Validitas muka (face validity)

Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi.

2)       Validitas logik (logical/sampling validity)

Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu tercapainya validitas logik.



b.      Validitas Konstrak

Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979).  Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas.

Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai melalui beberapa cara antara lain :

1)      Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda

Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus memiliki skor yang berbeda.

2)      Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes

Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan faktor kematangan.

3)      Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama

Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang mengukur aspek yang berbeda.

4)      Studi mengenai korelasi antaraitem atau antar belahan tes

Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa tes mengukur satu variabel satuan (unitary variable).



c.      Validitas Berdasar Kriteria

Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor tes  dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu rxy, dimana X melambangkan skor tes dan Y melambangkan skor kriteria.

Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu :

1)       Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang.

2)       Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkruen.



2.      Reliabilitas (halaman 36 – 43)

a.      Pendekatan Tes Ulang (test-retest)

Dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu diantara kedua penyajian tersebut.  Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor~tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda.



b.      Pendekatan Bentuk Paralel

Tes yang akan diestimasi reliabilitasnya harus ada paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi aitemnya baik secara kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik.

Untuk membuat dua tes menjadi paralel, penyusunannya haruslah didasarkan pada satu spesifikasi yang sama. Secara empirik, kemudian dua tes yang paralel itu haruslah menghasilkan mean skor dan varians yang setara dan korelasi yang juga tidak berbeda dengan suatu variabel ketiga. Hanya itulah bukti terpenuhinya sifat paralel antara dua tes yang dapat diperoleh dalam penyusunan tes. Untuk membuktikan bahwa kedua tes menghasilkan dua skor murni yang sama bagi setiap subjek serta memberikan dua varians eror yang sama sebagaimana dituntut oleh teori skor murni klasikal, tidaklah dapat dilakukan.



c.      Pendekatan Konsistensi Internal

Dilakukan dengan menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada sekelompok subjek (single trial administration). Dengan menyajikan satu tes hanya satu kali, maka problem yang mungkin timbul pada dua pendekatan reliabilitas terdahulu dapat dihindari.

Pendekatan reliabilitas konsistensi internal bertujuan melihat konsistensi antaraitem atau antarbagian dalam tes itu sendiri. Untuk itu, setelah skor setiap aitem diperoleh dari sekelompok subjek, tes dibagi menjadi beberapa belahan.

Untuk melihat kecocokan atau konkordansi diantara belahan-belahan tes dilakukan komputasi statistik melalui teknik-teknik korelasi, analisis varians antarbelahan, analisis varians perbedaan skor, dan lain-lainnya.



D.    Psychological Testing (Anne Anastasi dan Susana Urbina)

1.       Validitas (halaman 86 – 101)

a.      Prosedur Deskripsi-Isi

Pada dasarnya melibatkan pengujian sistematik atas isi tes untuk menetukan apakah tes itu mencakup sampel representatif dari domain perilaku yang harus diukur.

Validitas isi janganlah dikacaukan dengan validitas nominal (face validity). Validitas nominal bukanlah validitas dalam pengertian teknis; validitas ini merujuk pada apa yang nampaknya diukur. Validitas nominal berhubungan dengan apakah tes itu “kelihatan valid” bagi peserta tes yang mengikutinya.

Validitas nominal kerap kali dapat diperbaiki dengan merumuskan kembali butir-butir soal tes dalam istilah-istilah yang nampak relevan dan masuk akal dalam lingkungan tertentu dimana tes-tes itu akan digunakan.



b.      Prosedur Prediksi Kriteria

Prosedur validasi prediksi kriteria menunjukkan efektivitas sebuah tes untuk memprediksi kinerja seseorang dalam aktivitas-aktivitas tertentu. Ukuran kriteria yang menjadi tolak ukur validasi skor-skor tes divalidasikan bisa diperoleh pada saat yang hampir sama dengan pemberi skor tes atau setelah suatu interval ditetapkan.

Validitas prediksi kriteria kerapkali digunakan dalam studi-studi validasi lokal, yang padanya efektivitas sebuah tes untuk program tertentu harus dinilai. Validitas prediksi kriteria bisa dicirikan sebagai validitas praktis sebuah tes untuk maksud tertentu.



c.      Prosedur Identifikasi Konstruk

Validitas konstruk suatu tes adalah lingkup sejauhmana tes bisa dikatakan mengukur suatu konstruk atau sifat yang teoritis. Tiap konstruk dikembangkan untuk menjelaskan dan mengorganisir konsistensi-konsistensi respons yang teramati. Konstruk-konstruk tersebut berasal dari hubungan-hubungan tetap antara ukuran-ukuran perilaku. Validasi konstruk membutuhkan akumulasi informasi secara bertahap dari berbagai sumber.



2.      Reliabilitas (halaman 63 – 74)

Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda.


a.      Reliabilitas Tes Retes

Metode paling jelas untuk menemukan reliabilitas skor tes adalah dengan mengulang tes yang sama pada kesempatan kedua. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda; makin tinggi reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau lingkungan testing.



b.      Reliabilitas Bentuk Alternatif
Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa ditest dengan satu bentuk pada kesempatan pertama dan dengan bentuk lainnya yang ekuivalen pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan pada dua bentuk itu merupakan koefisien reliabilitas tes. Perlu dicatat bahwa koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap berbagai butir soal contoh (atau bentuk-bentuk tes).


e.. Reliabilitas Belah Separuh (Split-Half Reliability)
Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang ekuivalen. Jenis reliabilitas ini kadangkala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes saja. Untuk mendapatkan reliabilitas belah-separuh, masalah pertamanya adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut :
rnn  =        nrtt
1 + (n – 1)rtt
rnn      : koefisien yang diperkirakan
 rtt       : koefisien yang diperoleh
 n        : jumlah waktu tes diperpanjang/diperpendek
Ketika diterapkan pada reliabilitas belah separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut :
rtt =    2rhh
1 + rhh
                             Untuk rhh adalah korelasi dari tes-tes paruhan
Metode alternatif untuk mendapatkan reliabilitas belah separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varians dari perbedaan antara skor-skor tiap orang pada dua tes-tes separuh (SDx2) dan varians skor total (SDd2) dua nilai ini disubstitusikan dalm rumus berikut, yang menghasilkan reliabilitas seluruh tes secara langsung :
rtt =    SDx2        SDd21-
             Menarik    untuk   memperhatikan   hubungan  rumus  ini  dengan   varians   kesalahan. Perbedaan  apapun antara   skor-skor     seseorang       pada       dua     tes   paruhan, menampilkan varians kesalahan atau varians yang tidak relevan. Varians-varians perbedaan-perbedaan ini, dibagi dengan varians skor-skor total, memberikan proporsi varians kesalahan dalam skor-skor itu. Ketika varians skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varians “benar” untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas.



d.      Reliabilitas Kuder-Richardson dan Koefisien Alpha

Metode ini didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan : (1) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah separuh) ; dan (2) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya, semakin tinggilah konsistensi antar soal.

Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling luas diterapkan, umumnya dikenal sebagai “rumus 20 Kuder-Richardson”, adalah sebagai berikut :



rtt =       n        SD t2    Σpq


          n – 1            SD t2

                                                            rtt         : koefisien reliabilitas seluruh tes


                                                            n          : jumlah soal dalam tes

                                                            SDt      : simpangan baku skor-skor total tes

                                                            p          : proporsi orang-orang yang lulus

q          : proporsi orang-orang yang tidak lulus

Σpq      : hasil tabulasi antara p dan q

Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor benar atau salah, atau tergantung pada suatu sistem all or none (semua atau tidak sama sekali) lainnya.



e.      Reliabilitas Pemberi Skor

Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara subjektif digunakan dalam riset.






ANALISIS BUKU




Sebuah instrumen yang valid belum tentu reliabel, tetapi instrumen yang reliabel sudah tentu valid. Pernyataan ini menandakan bahwa sebuah validitas dan reliabilitas adalah dua hal yang tidak dapat dipisahkan dalam pengkonstruksian sebuah instrumen, jika ingin dikatakan baik.

Hal tersebut secara implisit tergambar pada benang merah yang menjalin antara keempat buku yang telah diuraikan sebelumnya.

Pada buku karya Suharsimi Arikunto, validitas tidak dibahas secara mendalam bila dibandingkan dengan pembahasan reliabilitasnya, karena yang dibahas hanya tentang validitas logis tanpa dibarengi dengan validitas empiris. Namun, pada reliabilitasnya sudah dibahas mengenai tiga jenis reliabilitas, yaitu validitas paralel, ulang dan belah dua.

Sedikit berbeda dengan yang telah diuraikan Arikunto, pada buku karya Soetarlinah Sukardji, pembahasan mengenai validitas dan reliabilitasnya sudah jauh lebih luas. Karena pada bukunya validitas yang dibahas tidak hanya sekedar validitas logis saja, tetapi juga dibahas mengenai validitas isi, konstruk, konkruen, dan prediktif. Sedangkan pada pembahasan reliabilitasnya sama dengan pada pembahasan Arikunto, tetapi pada Sukardji ditambah dengan adanya reliabilitas rasional ekuivalen dan penyekor/penilai.

Pada buku karya Saifuddin Azwar, pembahasannya lebih mendalam sekali, karena bukunya memang secara khusus membahas tentang validitas  dan reliabilitas. Namun, pada dasarnya yang dibahas juga sama, hanya berbeda dari segi nama dan pengelompokkannya saja.

Tidak jauh berbeda dengan buku Azwar, buku karya Anastasi dan Urbina juga membahas secara luas dan mendalam mengenai validitas dan reliabilitas. Karena buku ini memang berisi tentang bagaimana membuat instrumen tes khususnya untuk tes psikologi. Apalagi didalamnya sudah terdapat rumus cara mencari reliabilitas secara komputasi/statistik.

Setelah melihat dan mengulas dari keempat buku yang sudah dijabarkan, maka dapat ditarik kesimpulan bahwa buku terakhir yaitu Psychological Testing karya Anne Anastasi dan Susana Urbina dapat dikatakan telah merangkum mengenai reliabilitas dari ketiga buku yang telah dijabarkan sebelumnya. Tetapi untuk pembahasan mengenai validitas Saifuddin Azwar lebih baik dan mendalam dibanding dengan Anastasi dan Urbina.

Jadi perumusan validitas dan reliabilitas yang baik dari kedua buku tersebut adalah sebagai berikut :

1.      Validitas secara sederhana dapat dikatakan sebagai sejauh mana sebuah instrumen dapat mengukur hal yang seharusnya diukur. Validitaspun dapat dipilah kembali menjadi beberapa jenis, seperti di bawah ini :

a.       Validitas Isi, selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu :

1)       Validitas muka (face validity)

2)       Validitas logik (logical/sampling validity)

b.      Validitas Konstrak

Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979).  Menurut Magnusson, dapat dicapai melalui beberapa cara antara lain :

1)      Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda

2)      Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes

3)      Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama

4)      Studi mengenai korelasi antaraitem atau antar belahan tes

c.       Validitas Berdasar Kriteria

Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan.

Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu  validitas prediktif dan konkruen.


2.      Reliabilitas

Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda. Yang terdiri dari :

a.       Reliabilitas Tes Retes

b.      Reliabilitas Bentuk Alternatif

c.       Reliabilitas Belah Separuh (Split-Half Reliability)

d.      Reliabilitas Kuder-Richardson dan Koefisien Alpha

e.       Reliabilitas Pemberi Skor





KESIMPULAN




Kesimpulan yang dapat ditarik dari penjabaran di atas adalah sebagai  berikut :

1.      Validitas adalah sebuah proses yang harus dilalui instrumen agar dapat diketahui apakah instrumen yang sudah dikonstruksi telah mengukur aitem yang seharusnya diukur. Cara mengetahuinya melalui validitas isi (muka dan logik), konstrak, dan kriteria (prediktif dan konkruen).

2.      Reliabilitas adalah sebuah proses yang harus dilalui instrumen untuk mengetahui keandalan atau keajegan dari sebuah instrumen. Dengan kata lain, instrumen yang baik akan menarik jawaban/data yang sama walaupun diberikan di waktu dan kondisi yang berbeda. Cara mengetahuinya melalui reliabilitas tes retes, bentuk alternatif, belah dua, Kuder-Richardson dan koefisien alpha, dan pemberi skor.

3.      Instrumen adalah titik tolak atau salah satu hal utama yang mempengaruhi hasil akhir sebuah penelitian. Oleh karena itu, penggunaan atau pengkonstruksian yang salah akan berimbas pada penarikan data yang salah. Hal tersebut biasa dikenal dengan “garbage tool garbage result”.

4.      Instrumen yang sudah teruji secara validitas belum tentu teruji secara reliabilitas. Namun, bila instrumen tersebut sudah teruji secara reliabilitas, maka secara tidak langsung instrumen tersebut sudah pasti teruji secara validitas. Secara sederhana dapat dirumuskan valid belum tentu reliabel, tetapi reliabel sudah pasti valid.






DAFTAR PUSTAKA



Anastasi, A & Susana Urbina. Psychological Testing. New Jersey : Prentice-Hall Inc, 1997.


Arikunto, Suharsimi. Manajemen Penelitian. Jakarta : Rineka Cipta, 1995.


Azwar, Saifuddin. Reliabilitas dan Validitas. Yogyakarta : Pustaka Pelajar, 2003.


Sukadji, Soetarlinah. Menyusun dan Mengevaluasi Laporan Penelitian, Jakarta : UI-Press, 2000.

Tags: cuplikan
Prev: Doakan : Saya Menderita Komplikasi
Next: Guru Berargo Esia
Validitas adalah suatu ukuran yang menunjukan tingkat kevalidan atau kesahihan suatu instrumen. Prinsif validitas adalah pengukuran atau pengamatan yang berarti prinsif keandalan instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.

Sedangkan Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama – sama memegang peranan penting dalam waktu yang bersamaan. Dalam penelitian keperawatan, walaupun sudah ada beberapa pertanyaan ( kuisioner ) yang sudah distandarisasi baik nasional maupun internasional ,peneliti harus tetap menyeleksi instrumen yang dipilih dengan mempertimbangkan keadaan sosial budaya dari area penelitian ( Nursalam, 2003 : 108 ).
Konsep Validitas

Menurut Azwar (1986) para ahli psikometri telah menetapkan kriteria bagi suatu alat ukur psikologis untuk dapat dinyatakan sebagai alat ukur yang baik dan mampu memberikan informasi yang tidak menyesatkan. Kriteria itu antara lain adalah valid, reliabel, norma dan praktis.

Sifat reliabel dan valid diperlihatkan oleh tingginya reliabilitas dan validitas hasil ukur suatu tes. Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan merupakan suatu keputusan yang tepat.

Seringkali pula keputusan itu tidak menyangkut individu secara langsung akan tetapi mengenai suatu kelompok. Dalam berbagai studi dan penelitian tidak jarang dipergunakan alat ukur untuk mengetahui keadaan atau status psikologis sekelompok individu tertentu.

Berikut ini akan dibahas antara lain adalah pengertian validitas, koefisien validitas, tipe-tipe umum pengukuran validitas, dan konsep pengukuran validitas.

a. Pengertian Validitas

Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986).

Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.

Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.

Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.

Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986).

Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana?

Istilah validitas ternyata memiliki keragaman kategori. Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity, construct validity, face validity, factorial validity, empirical validity, intrinsic validity, predictive validity, content validity, dan curricular validity.


§ Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.

§ Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran.

§ Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.

§ Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.

§ Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.

§ Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur.

§ Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang.

§ Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.

§ Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.

Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).

b. Koefisien Validitas

Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara tes dan kriteria itu adalah rxy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur.

Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh rxy tersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang lain.

c. Tipe-tipe Umum Pengukuran Validitas

Tipe validitas sebagaimana disajikan sebelumnya, pada umumnya digolongkan dalam tiga kategori, yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).

1). Validitas Isi

Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.

Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur.

Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.



Gambar 3. Validitas Isi


Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.

Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logis).

Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi.

Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan validitasnya yang kuat.




Gambar 4. Validitas Muka



Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur.

Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan.

Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi.

2). Validitas Konstruk

Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam Azwar 1986).

Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.

Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal.

Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.



           











Gambar 5. Validitas Konstruk


3). Validitas Berdasar Kriteria

Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur.

Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan, yaitu rxy, dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria.

Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity).





Gambar 6. Validitas Berdasar Kriteria


Validitas Prediktif. Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya.

Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan oleh atasannya.

Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang.

Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan bukan sekedar pengujian secara deskriptif saja.


Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren.

Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale).

Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren tidak cukup memuaskan dan validitas prediktif merupakan keharusan.

Konsep Pengukuran Validitas


Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan.

Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung.

Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.

Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.

1 comment:

  1. Olah Data Jujur
    Olah Data Yang Jujur
    Olah Data Semarang Merupakan Olah Data Yang Jujur
    https://s.id/Jujur
    Peneliti Boleh Saja Salah, Tapi Ia Tak Boleh Berbohong
    Kualitas Suatu Penelitian Terletak Pada Integritas Dan
    Standar Moral Penelitinya

    ReplyDelete