Etiket arşivi: Geçerlik

Klasik(Geleneksel) Ölçme Değerlendirme Araçları

Bilgi Düzeyi
(Bloom Taksonomisi)
Hazırlama
Uygulama
Puanlama
Puanlama Güvenirliği Şans Başarısı Güvenirlik ve Geçerlik
(Soru Sayısı, Kapsam Geçerliliği ve Duyarlılığı gösterir.
Puanlama Güvenirliğine bakacaksın.Puanlama Güvenirliği Objektifliği hakkında bilgi verir.)
Özellikler
Yazılı Yoklamalar Üst Düzey
Sentez – Değerlendirme hedef alanları ölçülür.
H -> Kolay
U -> Kolay
P -> Zor ve zaman alıcı.
Düşüktür.
Subjektif testtir.
En büyük dezavantajı budur.
Yoktur.
Şişirme ve blöf yeteneği vardır.
Güvenirlik ve Geçerlilik düşüktür.
Soru sayısı düşüktür.Bu yüzden Kapsam Geçerliliği ve Duyarlılık düşüktür.
Puanlama Güvenirliği düşüktür.
  • Puanlama Güvenirliği düşüklüğünü önlemek için ayrıntılı cevap anahtarı olmak zorunda.
  • Seçimlik ve ön koşulluk soru kullanmayacaksın.Yoksa Kapsam Geçerliliği dahada düşer ve puanların kıyaslanabilirliğini engellersin.
Sözlü Yoklamalar Üst Düzey
Sentez – Değerlendirme
H, U ve P -> Zor ve zaman alıcı.Çünkü herkese eş güçlükte soru hazırlanması gerekiyor. Düşüktür.
Subjektiftir.
Yoktur.
Sözlü iletişim becerisi vardır.
Düşüktür.
Soru sayısı azdır.Buda Kapsam Geçerliliğini ve Duyarlılığı düşürür.
Puanlama Güvenirliği düşüktür.
  • İlköğretimin ilk kademesinde not verme amacıyla yapılması yasaklanmıştır.
Kısa Cevaplı – Boşluk Doldurma Alt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır. Yüksektir.
Yarı objektiftir.
Nispeten nesneldir.
Yoktur.
Ezber ve hatırlama yeteneği iyi olanlar başarılı olur.
En büyük dezavantajıdır.
Yüksektir.
Soru sayısı fazla olması Kapsam Geçerliliğini ve Duyarlılığı arttırır.Puanlama Güvenirliği yüksektir.
  • Bir cümlede en fazla iki boşluk bırakılmalı.
  • Başta ve sonda boşluk bırakılmamalı.
Doğru | Yanlış Alt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır. Yüksektir.
Objektiftir.
En yüksek olandır.

  • Düzeltme formülü kullanacaksın.
  • Açıklama istersin.
Yüksektir.
Güvenirliği ve Geçerliliği yüksek, sınav hazırlamak zordur.
  • Olumsuz soru kökü kullanmayacaksın.
  • Öğrenme eksikliği belirlenen(Formatif) değerlendirmede kullanılması önerilmez.
  • Bir öğretmen konuyu anlattıktan sonra ilke ve genellemeleri yoklayacaksa, önerme ya da yargıları yoklayacaksa, neden ve sonuç ilişkilerini yoklayacaksa kullanılır.
Eşleştirme Testi Alt Düzey
Bilgi – Kavrama
H, U ve P -> Kolay Yüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Cevaplar sorulardan fazla olmalıdır.
  • Sorular ve cevaplar tek boyutlu olmalıdır.
Yüksektir.
  • 5N – 1K -> Olgusal bilgileri yoklarız.
Çoktan Seçmeli Testi
(Bilişsel alanların sentez dışındaki diğer alanlarında ölçme yapmaya yarayan araçtır.)
Bilme – Kavrama – Uygulama – Analiz – Sentez – Değerlendirme

Daha çok Uygulama ve Analiz bazlı kullanılır.

Zorlarsak değerlendirme bile yaptırabilirsin.

Lakin Sentez yaptırılamaz.

H -> Zor ve uzmanlık gerektirir.

U ve P -> Kolay

Yüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Seçenek sayısını arttıracaksın.

Seçeneksiz sınavlarda şans başarısından bahsedemezsin.

En yüksek olandır.
  • Kalabalık gruplarda uygulanabilir.
  • Madde analizi yapılabilir.
  • Kritik ve önemli karar verilecekse çoktan seçmeli test kullanılmalıdır.
  • Soru kökünde ipucu olmayacak.
  • Bir soru diğerine cevap olmayacaktır.
  • Bir hikayeye en fazla 3 soru bağlanır, bağlanmalıdır.

Geçerlik Türleri – Kapsam Geçerliliği

Kapsam Geçerliliği

Bir ölçme aracının ölçmek istediği kapsamı tam olarak yansıtıp yansıtmadığıyla ilgilenir.

Ölçme aracının ölçmek istediği konuları, hedef davranışları ya da özellikleri tam olarak örneklemesi ve temsil etmesidir.

  • Özellikler
  • Konular
  • Hedef – Davranışlar

Bunlar tam olarak temsil edilmek ya da tam olarak örneklenmek zorunda.

Örnek olarak, bir öğretmen 5 farklı üniteden sınav hazırlayacaktır.Bu sınavda A, B, C, D ve E ünitelerinden sorular sorulacak olsun.Öğretmenimiz A ve C ünitelerindeki soruların ayrıcılığını düşük bulmuş ve bu soruları testten çıkartmıştır.Eğer bu konular yerine başka soru yazmıyor ve B v D ünitelerinden ayrıcılıkları yüksek soruları teste ekliyorsa uygulanan bu durumda aşağıdaki gibi yorum yaparız.

Eğer bu öğretmen 5 farklı üniteden soru sorması gerekirken, keyfi olarak A ve C sorularını(ünitelerindeki) çıkarıyorsa, bunlar yerine soru yazmıyorsa buradaki kapsamı görmezden geldiği için bu adam kapsam geçerliliğini düşürmüştür.

Yok eğer bu herif, bu sorular yerine B ve D ünitelerinden sorular ekliyorsa bu durumda soruların çoğunluğu B ve D ünitelerinde olacağı için soruların benzerliği artıyordur.Buda iç tutarlılığı arttırır diyebiliriz.

Ünitelerdeki sorulan soruların hedef davranışları birbirine uygun olmalıdırlar.Yani bilişsel hedef alanları aynı olmalıdır.Örneğin, A ünitesinden sorulan sorulardan biri bilme ve diğeri uygulamaysa kapsam geçerliliği düşüktür.

Kapsam Geçerliliği Belirleme Yolları

  • Belirtke tablosu kullanmak.
  • Uzman görüşü almak.
  • Bir ölçütle karşılaştırmak.
    Kapsam Geçerliliği

    Örneğin,

    “Bir öğretmen hazırladığı testi aynı kapsam içeren daha önceden hazırlanmış ve geçerliliği kanıtlanmış bir testle bir öğrenci grubuna uygulamıştır” diye bir ifade görürseniz Paralel Test Yöntemiyle karıştırmayın.

    Paralel Test yönteminde uyguladığım testi aynı anda hazırlarım.Onların güvenirlik ve geçerlilik hakkında bilgim yoktur.

    Fakat soru vurgusunda “Bir öğretmen hazırladığı testi daha önceden hazırlanmış”, “Geçerliliği kanıtlanmış bir test” diyorsa Kapsam Geçerliliğidir.

Kapsam Geçerliliği Başarı Testlerine özeldir.Başarı testlerinde yüksek olması beklenir.

Güvenirlik – Geçerlik Arasındaki İlişki

1-) Güvenirlik, geçerlik için ön koşuldur fakat yeterli değildir.

Yani Geçerlilik için Güvenirlik olması gerekiyor ama her Güvenilir olan Geçerli olmuyor.

Bir ölçme aracı Geçerliyse kesinlikle Güvenirliği sağlamıştır.

Bir soruda eğer bir ölçme aracının güvenilir olduğunu söylüyorsa bu ölçme aracı geçerli olabilir ya da aynı şekilde geçerli olmaya da bilir.

Güvenirlik Nişan ise Geçerlilik Evliliktir.

Şimdi bunu güzelce örneklendirmek gerekirse, 3 nişan tahtasına 5 atış yapıldığını resmedelim.

Geçerlik - Güvenirlik Arasındaki Fark

Şimdi burada birinci nişan tahtasını incelersek eğer, atışların birbirine benzer ve uyumu olmadığı için Tutarlılık ve birbirini tekrarın olmadığını görürüz.Haliyle Güvenirlik yoktur.Amaç hedefi vurmak olduğu için ve görüldüğü üzere amaç gerçekleşmediği için Geçerlilik yoktur.

İkinci nişan tahtasına bakarsak eğer, hedefi vuramasada 5 atışın 5ide aynı noktada olduğu için, yani benzer ve uyumlu yani birbirini tekrarını gördüğümüz için Tutarlılık vardır.Haliyle Güvenilirdir.Lakin amaç hedefi vurmaksa eğer Geçerli değildir.

Üçüncü nişan tahtasına gelirsek eğer, görüldüğü üzere birbinin tekrarı var yani Tutarlılık vardır.Güvenirlik vardır.Amaç hedefi vurmak olduğu için Geçerlilikte vardır.

Şimdi kurgusal bir örnek vermek gerekirse,
Bir hoca her gün derse 15 geç kalıyorsa güvenlidir.Çünkü bir gün sonrada 15 dk geç gelecektir.Haliyle Tutarlılık vardır.Fakat amaca hizmet etmediği için Geçerliliği düşüktür.

Bir ölçme aracında Güvenirlik Geçerliliği sınırlandırır.

Bir şey Güvenirliği olumsuz etkiliyorsa, Geçerliliğide olumsuz etkiler.Fakat tersi doğru değildir.

Geçerlik ≤ √Güvenirlik tir.

Soru
Güvenirliği 0.81 olan bir ölçme aracının Geçerliliği hangisi olamaz?
A)0.60 B)0.70 C)0.80 D)0.90 E)0.95

Geçerlik ≤ √0.81
Geçerlik ≤ 0.9 olacağı için 0.9 a eşit ya da küçük olmak zorundadır.

2-) Ölçme Aracındaki Özellikler(Önem Sırasına Göre)

  1. Amaç -> Geçerlik
  2. Sonuçların Doğruluğu -> Güvenirlik
  3. Maliyet -> Kullanışlık

Geçerlik ve Güvenirlik Sorularında Ne Yapacağız?

Sorularda bir ölçme aracına ne zaman geçerli ne zaman güvenilir diyeceğiz?Bu dersimizde bunu konuşalım.

Geçerlik Güvenirlik
Sorularda hesaplatmayacağı ama hazır olarak vereceği bir Geçerlilik Katsayısı vardır.

Geçerlik katsayısı -1 ile +1 arasında gidip gelen bir sayıdır.

Geçerli diyebilmek için en az 0.30 olmalıdır ve 1’e ne kadar yakın olursa o kadar geçerlilik artacaktır.

Verilen geçerlilik katsayısına bakacaksın.Eğer 0.30 ve üstü ise ölçme aracı geçerlidir.Yok eğer değil ise Geçerlilikle ilgili bütün tanımlar tersine döner.

  • Bu ölçme aracı amacına hizmet etmiyordur.
  • Bu ölçme aracı bilenle bilmeyen ayrımı yapamıyordur.
  • Bu ölçme aracı ölçtüğü özelliğe başka özellikler karıştırıyordur.
  • Bu ölçme aracındaki elde edilen sonuçlardaki Sabit ve Sistematik hatalar çok fazladır.

Yani

Bu ölçme aracının Geçerliliği düşüktür, diyeceksiniz.

Burada da Güvenirlik Katsayısını kullanacağız.Bize bu katsayıyı hesaplatmadan verecektir.

Güvenirlik katsayısı 0 ile 1 arasında gidip gelen bir sayıdır.

Ölçme aracının güvenilir olduğunu söyleyebilmen için minumum 0.70 olmalıdır.1’e ne kadar yakın Güvenirlik o kadar yüksektir.

Peki 0.70 altında ise tanımlar gene tersini uygular.

  • Bu ölçme sonucuna karışan Tesadüfi hata miktarı fazladır.
  • Bu ölçme sonucu gerçeği yansıtmıyordur.Yani gerçeğe yakın değildir.

Yani

Bu ölçme aracının güvenirliği düşüktür.

Geçerlik(Amaç)

  • Bir ölçme aracının amacına hizmet etme derecesidir.
    Örnek olarak,
    Matematik öğretmenin sınav yapmaktaki amacı matematik bilgi ve beceriyi ölçmektir.İşte bu sınav öğrencinin matematik bilgi ve beceriyi ne kadar iyi ölçüyorsa Geçerliliği yüksektir.
  • Geçerlilik bir ölçme aracının hazırlandığı konuyla ilgili bilen bilmeyen ayrımını yapabilme derecesidir.
    Hazırlanan ölçme aracının hazırlandığı konuyla ilgili bilen bilmeyen ayrımını yapabilme derecesidir.
    Örnek olarak,
    Bir Tarih öğretmeni sınav yapmaktaki amacı öğrencinin Tarih ile ilgili bilgi ve becerisini ölçmektir.Aynı zamanda  o konularla ilgili bilen ve bilmeyen öğrencileri ayırmak isteyebilir.
  • Bir ölçme aracının ölçmek istediği özelliğe başka özellik karıştırmamasıdır.
    Örnek olarak,
    Bir matematik öğretmeninin sınav yapmaktaki amacı öğrencinin matematik bilgi ve becerisini yoklamaktır.Giderde bu öğretmen birde o bilgi ve becerisinin yanı sıra yazı güzelliğine puan verirse ölçtüğü özelliğe başka özellikler kattığı için amacının dışına çıkar ve Geçerlilik düşer.
  • Hatırlarsanız eğer Geçerlik Sabit ve Sistematik hatalardan doğrudan etkileniyordu.O halde;
    Geçerlik elde edilen ölçme sonuçlarının Sabit ve Sistematik hatadan arınık olmasıdır.