Etiket arşivi: Güvenirlik

Klasik(Geleneksel) Ölçme Değerlendirme Araçları

Bilgi Düzeyi
(Bloom Taksonomisi)
Hazırlama
Uygulama
Puanlama
Puanlama GüvenirliğiŞans BaşarısıGüvenirlik ve Geçerlik
(Soru Sayısı, Kapsam Geçerliliği ve Duyarlılığı gösterir.
Puanlama Güvenirliğine bakacaksın.Puanlama Güvenirliği Objektifliği hakkında bilgi verir.)
Özellikler
Yazılı YoklamalarÜst Düzey
Sentez – Değerlendirme hedef alanları ölçülür.
H -> Kolay
U -> Kolay
P -> Zor ve zaman alıcı.
Düşüktür.
Subjektif testtir.
En büyük dezavantajı budur.
Yoktur.
Şişirme ve blöf yeteneği vardır.
Güvenirlik ve Geçerlilik düşüktür.
Soru sayısı düşüktür.Bu yüzden Kapsam Geçerliliği ve Duyarlılık düşüktür.
Puanlama Güvenirliği düşüktür.
  • Puanlama Güvenirliği düşüklüğünü önlemek için ayrıntılı cevap anahtarı olmak zorunda.
  • Seçimlik ve ön koşulluk soru kullanmayacaksın.Yoksa Kapsam Geçerliliği dahada düşer ve puanların kıyaslanabilirliğini engellersin.
Sözlü YoklamalarÜst Düzey
Sentez – Değerlendirme
H, U ve P -> Zor ve zaman alıcı.Çünkü herkese eş güçlükte soru hazırlanması gerekiyor.Düşüktür.
Subjektiftir.
Yoktur.
Sözlü iletişim becerisi vardır.
Düşüktür.
Soru sayısı azdır.Buda Kapsam Geçerliliğini ve Duyarlılığı düşürür.
Puanlama Güvenirliği düşüktür.
  • İlköğretimin ilk kademesinde not verme amacıyla yapılması yasaklanmıştır.
Kısa Cevaplı – Boşluk DoldurmaAlt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır.Yüksektir.
Yarı objektiftir.
Nispeten nesneldir.
Yoktur.
Ezber ve hatırlama yeteneği iyi olanlar başarılı olur.
En büyük dezavantajıdır.
Yüksektir.
Soru sayısı fazla olması Kapsam Geçerliliğini ve Duyarlılığı arttırır.Puanlama Güvenirliği yüksektir.
  • Bir cümlede en fazla iki boşluk bırakılmalı.
  • Başta ve sonda boşluk bırakılmamalı.
Doğru | YanlışAlt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır.Yüksektir.
Objektiftir.
En yüksek olandır.

  • Düzeltme formülü kullanacaksın.
  • Açıklama istersin.
Yüksektir.
Güvenirliği ve Geçerliliği yüksek, sınav hazırlamak zordur.
  • Olumsuz soru kökü kullanmayacaksın.
  • Öğrenme eksikliği belirlenen(Formatif) değerlendirmede kullanılması önerilmez.
  • Bir öğretmen konuyu anlattıktan sonra ilke ve genellemeleri yoklayacaksa, önerme ya da yargıları yoklayacaksa, neden ve sonuç ilişkilerini yoklayacaksa kullanılır.
Eşleştirme TestiAlt Düzey
Bilgi – Kavrama
H, U ve P -> KolayYüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Cevaplar sorulardan fazla olmalıdır.
  • Sorular ve cevaplar tek boyutlu olmalıdır.
Yüksektir.
  • 5N – 1K -> Olgusal bilgileri yoklarız.
Çoktan Seçmeli Testi
(Bilişsel alanların sentez dışındaki diğer alanlarında ölçme yapmaya yarayan araçtır.)
Bilme – Kavrama – Uygulama – Analiz – Sentez – Değerlendirme

Daha çok Uygulama ve Analiz bazlı kullanılır.

Zorlarsak değerlendirme bile yaptırabilirsin.

Lakin Sentez yaptırılamaz.

H -> Zor ve uzmanlık gerektirir.

U ve P -> Kolay

Yüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Seçenek sayısını arttıracaksın.

Seçeneksiz sınavlarda şans başarısından bahsedemezsin.

En yüksek olandır.
  • Kalabalık gruplarda uygulanabilir.
  • Madde analizi yapılabilir.
  • Kritik ve önemli karar verilecekse çoktan seçmeli test kullanılmalıdır.
  • Soru kökünde ipucu olmayacak.
  • Bir soru diğerine cevap olmayacaktır.
  • Bir hikayeye en fazla 3 soru bağlanır, bağlanmalıdır.

Güvenirlik – Geçerlik Arasındaki İlişki

1-) Güvenirlik, geçerlik için ön koşuldur fakat yeterli değildir.

Yani Geçerlilik için Güvenirlik olması gerekiyor ama her Güvenilir olan Geçerli olmuyor.

Bir ölçme aracı Geçerliyse kesinlikle Güvenirliği sağlamıştır.

Bir soruda eğer bir ölçme aracının güvenilir olduğunu söylüyorsa bu ölçme aracı geçerli olabilir ya da aynı şekilde geçerli olmaya da bilir.

Güvenirlik Nişan ise Geçerlilik Evliliktir.

Şimdi bunu güzelce örneklendirmek gerekirse, 3 nişan tahtasına 5 atış yapıldığını resmedelim.

Geçerlik - Güvenirlik Arasındaki Fark

Şimdi burada birinci nişan tahtasını incelersek eğer, atışların birbirine benzer ve uyumu olmadığı için Tutarlılık ve birbirini tekrarın olmadığını görürüz.Haliyle Güvenirlik yoktur.Amaç hedefi vurmak olduğu için ve görüldüğü üzere amaç gerçekleşmediği için Geçerlilik yoktur.

İkinci nişan tahtasına bakarsak eğer, hedefi vuramasada 5 atışın 5ide aynı noktada olduğu için, yani benzer ve uyumlu yani birbirini tekrarını gördüğümüz için Tutarlılık vardır.Haliyle Güvenilirdir.Lakin amaç hedefi vurmaksa eğer Geçerli değildir.

Üçüncü nişan tahtasına gelirsek eğer, görüldüğü üzere birbinin tekrarı var yani Tutarlılık vardır.Güvenirlik vardır.Amaç hedefi vurmak olduğu için Geçerlilikte vardır.

Şimdi kurgusal bir örnek vermek gerekirse,
Bir hoca her gün derse 15 geç kalıyorsa güvenlidir.Çünkü bir gün sonrada 15 dk geç gelecektir.Haliyle Tutarlılık vardır.Fakat amaca hizmet etmediği için Geçerliliği düşüktür.

Bir ölçme aracında Güvenirlik Geçerliliği sınırlandırır.

Bir şey Güvenirliği olumsuz etkiliyorsa, Geçerliliğide olumsuz etkiler.Fakat tersi doğru değildir.

Geçerlik ≤ √Güvenirlik tir.

Soru
Güvenirliği 0.81 olan bir ölçme aracının Geçerliliği hangisi olamaz?
A)0.60 B)0.70 C)0.80 D)0.90 E)0.95

Geçerlik ≤ √0.81
Geçerlik ≤ 0.9 olacağı için 0.9 a eşit ya da küçük olmak zorundadır.

2-) Ölçme Aracındaki Özellikler(Önem Sırasına Göre)

  1. Amaç -> Geçerlik
  2. Sonuçların Doğruluğu -> Güvenirlik
  3. Maliyet -> Kullanışlık

Güvenirliği Arttıran Ya da Azaltan Etmenler

  • Soru sayısını arttırmak.
    HomojenHeterojen
    Benzer hedef davranışlardan soru ekleme.Farklı hedef davranışlardan soru ekleme.
    • Benzer hedef davranışlar.
    • Benzer kapsamdan.

    Benzerlik artar, haliyle iç tutarlılık artar.

    Soru sayısının artması duyarlılığı arttırır.

    Yani, haliyle Güvenirlik artacaktır.

    • Farklı hedef davranışlardan.
    • Farklı kapsamdan.

    Soru sayısı arttığı için duyarlılık artacaktır.

    Ama farklı hedef davranışlardan farklı kapsamdan soru eklemek demek sorular arasındaki uyumu azaltacaktır, haliyle iç tutarlılık azalacaktır.

    Güvenirlik bir miktar artacaktır.Ama kesinliği hakkında konuşamayız.

    Güvenirlikten ziyade kapsam geçerliliğini arttıracaktır.

    Güvenirlik - Soru Sayısı Grafiği

    Güvenirlik – Soru Sayısı Grafiği

  • Ranj, Standart Sapma, Varyans güvenirliği arttırır.
    Bunlar bir dağılımda yükse çıkabilir.Bunlar bir dağılımda düşük çıkabilir.
    • Farklılaşma fazla.
    • Grup heterojen.
    • Öğrenme düzeyleri farklıdır.

    Güvenlik yüksek.

    • Farkllaşma azalır.
    • Grup homojen.
    • Öğrenme düzeyleri benzer.

    Güvenirlik düşük.

  • Sınavdaki soruların güçlüğü.
    Sorular çok zor ya da çok kolay olursa güvenirliği düşürür.Güvenilik en yüksek değerini madde güçlüğü 0.50(orta güçlük)’te alır.
  • Ayrıcılık
    Bilen bilmeyen ayrımını yapabilme derecesidir.
    Ayrıcılık arttıkça, güvenirlik artar.
  • Kopya
    Güvenirliği düşürür.
  • Şans Başarısı
    Şans başarısı önlenmesinin en iyi yolu düzeltme formülüdür.
    Ya da
    Seçenek sayısını arttıracaksın.
  • Sınav süresi
    Gereğinden fazla uzun ya da kısa olması güvenirliği düşürür.
  • Açık, net ve anlaşılır bir dil kullanılırsa ve yönerge varsa, sorular kolaydan zora sıralanırsa
    Güvenirlik artar.

Geçerlik ve Güvenirlik Sorularında Ne Yapacağız?

Sorularda bir ölçme aracına ne zaman geçerli ne zaman güvenilir diyeceğiz?Bu dersimizde bunu konuşalım.

GeçerlikGüvenirlik
Sorularda hesaplatmayacağı ama hazır olarak vereceği bir Geçerlilik Katsayısı vardır.

Geçerlik katsayısı -1 ile +1 arasında gidip gelen bir sayıdır.

Geçerli diyebilmek için en az 0.30 olmalıdır ve 1’e ne kadar yakın olursa o kadar geçerlilik artacaktır.

Verilen geçerlilik katsayısına bakacaksın.Eğer 0.30 ve üstü ise ölçme aracı geçerlidir.Yok eğer değil ise Geçerlilikle ilgili bütün tanımlar tersine döner.

  • Bu ölçme aracı amacına hizmet etmiyordur.
  • Bu ölçme aracı bilenle bilmeyen ayrımı yapamıyordur.
  • Bu ölçme aracı ölçtüğü özelliğe başka özellikler karıştırıyordur.
  • Bu ölçme aracındaki elde edilen sonuçlardaki Sabit ve Sistematik hatalar çok fazladır.

Yani

Bu ölçme aracının Geçerliliği düşüktür, diyeceksiniz.

Burada da Güvenirlik Katsayısını kullanacağız.Bize bu katsayıyı hesaplatmadan verecektir.

Güvenirlik katsayısı 0 ile 1 arasında gidip gelen bir sayıdır.

Ölçme aracının güvenilir olduğunu söyleyebilmen için minumum 0.70 olmalıdır.1’e ne kadar yakın Güvenirlik o kadar yüksektir.

Peki 0.70 altında ise tanımlar gene tersini uygular.

  • Bu ölçme sonucuna karışan Tesadüfi hata miktarı fazladır.
  • Bu ölçme sonucu gerçeği yansıtmıyordur.Yani gerçeğe yakın değildir.

Yani

Bu ölçme aracının güvenirliği düşüktür.

Güvenirlik(Sonuç)

  • Hatırlarsanız eğer sadece Tesadüfi hatadan doğrudan etkileniyordu.Ölçme sonuçlarının tesadüfi hatadan arınıklılığıdır.
    Senin yaptığın ölçüm sonuçları tesadüfi hatadan ne kadar arınıksa güvenirlik o kadar yüksektir.
  • Ölçme sonuçlarının gerçeğe yakınlık derecesidir.Gerçeği yansıtma derecesidir.
  • Ölçme sonuçlarının duyarlı, hassas, objektif ve kararlı olmasıdır.

Ölçme Aracında Bulunması Gereken Özellikler

Bir ölçme aracında bulunması gereken özelliklerden en önemlisi ölçme aracının amacıyla ilgilenen Geçerliliktir.

Daha sonra ikinci olarak ölçme araçlarında elde edilen sonuçlarının doğruluğuyla ilgilenen Güvenirliktir.

Üçüncü olarak ise ölçme aracının maliyet kısmıyla ilgilenen Kullanışlılıktır.

  • Geçerlilikte temel vurgu, ölçme aracının amacıyla ilgilendiği için tum vurgularımız amaç üzerinden olacaktır.
  • Güvenirlikte temel vurgumuz, ölçme araçlarından elde edilen sonuçların doğruluğuyla ilgileneceği için tamamen sonuç üzerine gidecektir.
  • Kullanışlılıkta ise maliyettir.

Amaç(Geçerlilik), Sonuç(Güvenirlik) ve Maliyet(Kullanışlılık) ilişkisi gözüyle bakacağız.

Örneğin,

Sen bir araba alacaksın.Arabayı almaya gittiğinde bir Amacın(Geçerlilik) vardır.Spor arabadır, ticaretle uğraşıyorsan ticari arabadır veya aileye yönelik bir arabadır.Velhasıl öncelikle bir amacın vardır.Daha sonra arabayı almaya gittiğinde sana verilen katalogda yazan verilerin doğrulunu merak edersin.Yani 100 km hızda şu kadar yakar, bu kadar gider şeklinde…Bunun doğruluğunu araştırdığın kısım Güvenirliğidir.Son olarak Maliyet(Kullanışlık) bakarsın.

Şimdi bu üç özelliği sonraki yazılarımda sırasıyla inceleyeceğiz…