Yıllık arşivler: 2015

Güvenirlik Belirleme Yöntemleri – Testi Yarılama(Eşdeğer Yarılar) Yöntemi

Bir test önce öğrenci grubuna uygulanır.

Testi Yarılama(Eşdeğer Yarılar) Yöntemi

Test gruba uygulanır.

I. YarıII. Yarı
Soruların 1. – 3. – 5. – 7. …. numaralıları yani tek numaralıları buraya.Soruların 2. – 4. – 6. – 8. . …. numaralıları yani çift numaralıları buraya.
Uygulamadan sonra, puanlamadan önce oluşturulur.

İki yarıdan elde edilen puanlara bakacaksın.Kolerasyon yüksek ve pozitif çıkar ise Güvenirlik yüksektir demektir.

Sorular arası uyuma bakıldığı için iç tutarlığı yüksektir.Dolayısıyla Güvenirlik yüksektir.

Bu yöntem sana doğrudan İç Tutarlılığı veriyor.(Testin Yarı Güvenirliği)

Testi Yarılama(Eşdeğer Yarılar) Yöntemi, İç Tutarlılığı veriyor.Güvenirliği değil, İç Tutarlılığı verdiği için Güvenirlik hakkında yorum yapıyoruz.Yani Doğrudan İç Tutarlılığı verirken, Dolaylı yoldan Güvenirlikle ilgili bilgi veriyor.

Güvenirlik Belirleme Yöntemleri – Paralel Test(Eş Değer Formlar) Yöntemi

Paralel Test(Eşdeğer Formlar Yöntemi)

Birbirine eşdeğer olacak iki form hazırlanır.

  • Soruları farklı olacak.
  • Soru sayıları eşit olacak.
  • Sorduğu soruların kapsamları yani hedef ve davranışları aynı olacak.
  • Soruların güçlüğü eşit olacak.

işte bu nitelikleri benzer iki form olacak.

Bu soruları bir öğrenci grubuna iki farklı şekilde uygularız.

Öğrenciler
Ardarda Uygularız1 – 3 gün arayla ya da 1 haftada olabilir uygularız.
Eş değerlik katsayısı elde edilir.Tutarlık katsayısı elde ederiz.

İki formdan elde edilen puanlar karşılaştır, kolerasyon pozitif ve yüksekse güvenirlik yüksektir.

Kolerasyonu düşüren ve etkileyen faktörler?

  1. Soru sayısı eşit değilse.
  2. Kapsamlar aynı değilse.
  3. Soruların güçlükleri eşit değilse.

Yani soruların nitelikleri benzer değilse kolerasyon düşük çıkacaktır.

Paralel Test(Eş Değer Formlar) Yönemi, Eşdeğerlik ve Tutarlılığı veriyor.Haliyle doğrudan Güvenirliği veriyor.

Güvenirlik Belirleme Yöntemleri – Test Tekrar Test

Bir test aynı öğrenci grubuna iki defa uygulanır.

Öğrenciler
I. UygulamaII. Uygulama
1 – 3 hafta ise Tutarlılık Katsayısına bakarız.
3 – 6 hafta arası ise Kararlılık Katsayısına bakarız.
Elde edilen puanlar karşılaştırıyorsun ve aradaki kolerasyona bakıyorsun.Pozitif ve yüksek çıkmışsa bu ölçme aracı iki uygulamada da benzer sonuçlar verdiği için Güvenirliği yüksektir.

Test Tekrar Test yönteminde kolerasyonu düşüren etkenler.

  1. Unutmanın etkisi.
  2. Hatırlamanın etkisi.
  3. Sürenin uygun ayarlanamaması.
  4. Koşulların standart olmaması.
  5. Ölçülen özelliğin çabuk değişmesi.
  6. Yoruma açık ifadelerin kullanılması.

Test Tekrar Test başarı testlerinin güvenirliğini belirlemede kullanılmaz ve önerilmez.

Çünkü başarı testlerinde bizler bilgi ölçeriz.Bilgi unutulur, hatırlanır, çabuk değişir.

Test Tekrar Test, Tutarlılık ve Kararlılık katsayılarını veriyor.Haliyle Güvenirliği doğrudan veriyor.

Güvenirlik – Geçerlik Arasındaki İlişki

1-) Güvenirlik, geçerlik için ön koşuldur fakat yeterli değildir.

Yani Geçerlilik için Güvenirlik olması gerekiyor ama her Güvenilir olan Geçerli olmuyor.

Bir ölçme aracı Geçerliyse kesinlikle Güvenirliği sağlamıştır.

Bir soruda eğer bir ölçme aracının güvenilir olduğunu söylüyorsa bu ölçme aracı geçerli olabilir ya da aynı şekilde geçerli olmaya da bilir.

Güvenirlik Nişan ise Geçerlilik Evliliktir.

Şimdi bunu güzelce örneklendirmek gerekirse, 3 nişan tahtasına 5 atış yapıldığını resmedelim.

Geçerlik - Güvenirlik Arasındaki Fark

Şimdi burada birinci nişan tahtasını incelersek eğer, atışların birbirine benzer ve uyumu olmadığı için Tutarlılık ve birbirini tekrarın olmadığını görürüz.Haliyle Güvenirlik yoktur.Amaç hedefi vurmak olduğu için ve görüldüğü üzere amaç gerçekleşmediği için Geçerlilik yoktur.

İkinci nişan tahtasına bakarsak eğer, hedefi vuramasada 5 atışın 5ide aynı noktada olduğu için, yani benzer ve uyumlu yani birbirini tekrarını gördüğümüz için Tutarlılık vardır.Haliyle Güvenilirdir.Lakin amaç hedefi vurmaksa eğer Geçerli değildir.

Üçüncü nişan tahtasına gelirsek eğer, görüldüğü üzere birbinin tekrarı var yani Tutarlılık vardır.Güvenirlik vardır.Amaç hedefi vurmak olduğu için Geçerlilikte vardır.

Şimdi kurgusal bir örnek vermek gerekirse,
Bir hoca her gün derse 15 geç kalıyorsa güvenlidir.Çünkü bir gün sonrada 15 dk geç gelecektir.Haliyle Tutarlılık vardır.Fakat amaca hizmet etmediği için Geçerliliği düşüktür.

Bir ölçme aracında Güvenirlik Geçerliliği sınırlandırır.

Bir şey Güvenirliği olumsuz etkiliyorsa, Geçerliliğide olumsuz etkiler.Fakat tersi doğru değildir.

Geçerlik ≤ √Güvenirlik tir.

Soru
Güvenirliği 0.81 olan bir ölçme aracının Geçerliliği hangisi olamaz?
A)0.60 B)0.70 C)0.80 D)0.90 E)0.95

Geçerlik ≤ √0.81
Geçerlik ≤ 0.9 olacağı için 0.9 a eşit ya da küçük olmak zorundadır.

2-) Ölçme Aracındaki Özellikler(Önem Sırasına Göre)

  1. Amaç -> Geçerlik
  2. Sonuçların Doğruluğu -> Güvenirlik
  3. Maliyet -> Kullanışlık

Güvenirliği Arttıran Ya da Azaltan Etmenler

  • Soru sayısını arttırmak.
    HomojenHeterojen
    Benzer hedef davranışlardan soru ekleme.Farklı hedef davranışlardan soru ekleme.
    • Benzer hedef davranışlar.
    • Benzer kapsamdan.

    Benzerlik artar, haliyle iç tutarlılık artar.

    Soru sayısının artması duyarlılığı arttırır.

    Yani, haliyle Güvenirlik artacaktır.

    • Farklı hedef davranışlardan.
    • Farklı kapsamdan.

    Soru sayısı arttığı için duyarlılık artacaktır.

    Ama farklı hedef davranışlardan farklı kapsamdan soru eklemek demek sorular arasındaki uyumu azaltacaktır, haliyle iç tutarlılık azalacaktır.

    Güvenirlik bir miktar artacaktır.Ama kesinliği hakkında konuşamayız.

    Güvenirlikten ziyade kapsam geçerliliğini arttıracaktır.

    Güvenirlik - Soru Sayısı Grafiği

    Güvenirlik – Soru Sayısı Grafiği

  • Ranj, Standart Sapma, Varyans güvenirliği arttırır.
    Bunlar bir dağılımda yükse çıkabilir.Bunlar bir dağılımda düşük çıkabilir.
    • Farklılaşma fazla.
    • Grup heterojen.
    • Öğrenme düzeyleri farklıdır.

    Güvenlik yüksek.

    • Farkllaşma azalır.
    • Grup homojen.
    • Öğrenme düzeyleri benzer.

    Güvenirlik düşük.

  • Sınavdaki soruların güçlüğü.
    Sorular çok zor ya da çok kolay olursa güvenirliği düşürür.Güvenilik en yüksek değerini madde güçlüğü 0.50(orta güçlük)’te alır.
  • Ayrıcılık
    Bilen bilmeyen ayrımını yapabilme derecesidir.
    Ayrıcılık arttıkça, güvenirlik artar.
  • Kopya
    Güvenirliği düşürür.
  • Şans Başarısı
    Şans başarısı önlenmesinin en iyi yolu düzeltme formülüdür.
    Ya da
    Seçenek sayısını arttıracaksın.
  • Sınav süresi
    Gereğinden fazla uzun ya da kısa olması güvenirliği düşürür.
  • Açık, net ve anlaşılır bir dil kullanılırsa ve yönerge varsa, sorular kolaydan zora sıralanırsa
    Güvenirlik artar.

Güvenirliğin Temel Kavramları

Duyarlılık(Hassaslık)

Ölçme sonuçlarının hassaslığıdır.

Duyarlılığı arttırmak istiyorsak, birimler arası mesafeyi küçültürüz.Yani birimler arası mesafeyi küçültürüz.Yani birimleri yaklaştırırız.

  • Birim sayısını arttırırız.
  • Birimler arasının küçük olmasıdır.
  • Birim sayısının fazla olmasıdır.

Duyarlılığı arttırmak ne işe yarar?

Duyarlılık artıyorsa hata oranı azalır.Yani gerçeğe yakınlık artar.Gerçeği yansıtma oranı artacaktır.

Eğitimde duyarlılığı arttırmak için soru sayısını arttıracaksın.

Ama burada dikkat etmemiz gereken bir husus var.Soru sayısını arttırırken abartmamak gerekiyor.Belli bir limiti vardır.Soru sayısını gereğinden fazla arttırmak öğrencileri yoracaktır, bezdirecektir, uykularını getirecektir.Dolayısıyla Tesadüfi Hatayı arttırır.Buda güvenliği düşürür.

Objektiflik(Puanlama Güvenirliği)

Tarafsızlık demektir.

Farklı ya da aynı puanlayıcılar bir kağıda benzer puanlar veriyorsa bu puanlayıcların objektif davrandığı söylenir.

Birbirinden bağımsız puanlayıcılar, bir kağıdı puanlarsa ve puanlar benzer çıkıyorsa, objektif davranılmıştır.Puanlama güvenirliği yüksektir diyeceğiz.

Bir ölçme aracının objektifliğini yani puanlama güvenirliğini arttırmak istiyorsak ne yapacağız?

  1. Ayrıntılı cevap anahtarı hazırlanır.
  2. İsimler kapatılıp puanlama yapılır.
  3. Aynı kağıdı iki defa puanlarsın.Bu puanların ortalamasını alırsın.
  4. Aynı kağıdı zümredeki başka bir öğretmene puanlatır ve puanların ortalamasını alırsın.
  5. Kağıdın tümü yerine soru soru okuma yapılır.Yani tüm öğrencilerin önce 1. sorusu, ardından 2. sorusu …… böyle gider.

Tutarlılık

Tutarlılık iki durumda incelenir.

Bir testteki maddelerin birbiriyle uyumlu olduğunu gösteren İç TutarlılıkKısa zaman aralıklı ölçümler
Bir testteki maddelerin birbiriyle uyumlu olmasıdır ya da testin bütünüyle uyumlu olmasıdır.

  • Eğer bir öğretmen hazırladığı sınavda benzer konulardan benzer hedef davranışlardan soru sayısını fazlalaştırıyorsa, soru syısındaki benzerliği arttıracağı için yani uyumu arttırdığı için iç tutarlık yüksektir.
  • Fakat bu öğretmen farklı konulardan, farklı hedef davanışlardan soru sayısını arttırıyorsa, sorular arasındaki uyumu azaltacak, farklılığı arttıracaktır.Buda iç tutarlılığı azaltır.

İç tutarlılığı arttırmak için,

  • Benzer hedef davranışlardan soru soracaksın.
  • Benzer konulardan soru soracaksın.
  • Benzer kazanımlardan soru soracaksın.

Peki bir testin iç tutarlılığı yüksekse nasıl yorum yaparız?

  1. Sorular benzer hedef davranışlara yöneliktir.
  2. Sorular benzer kapsamdan geliyor.
  3. Sorular arasındaki uyum yüksektir dersin.Yani madde madde kolerasyonu yüksektir dersin.
  4. Eğer psikolojik test ise yapı geçerliliği yüksek olduğunu söyleyebilirsin.
  5. Eğer başarı testiyle kapsam geçerlliliğinin üdşük olduğunu söyleyebilirsin.
Yaptığın ölçme işlemini 1-3 hafta arasında yani kısa zaman aralığında tekrar ettiğinde benzer sonuçlar elde ediyorsan burada tutarlılık vardır denir.

Kararlılık

Tutarlılığın ikinci anlamının uzun süreli versiyonudur.

Eğer bir ölçme işlemini uzun zaman aralığında tekrar edersen yani ölçüm yaparsan (3-6 hafta arasında tekrar edersen) bu ölçme sonuçları benzerse, bu ölçme sonuçları zaman içinde değişmiyordur.Yani kararlık gösteriyordur.

Kararlılığın faydası nedir?

Eğer ölçtüğün özellik kararlılık gösteriyorsa, ölçülen özelliğin zaman içinde direncini gösterir.Ölçtüğün özelliğin zaman içinde değişmezliğini gösterir.

Geçerlik ve Güvenirlik Sorularında Ne Yapacağız?

Sorularda bir ölçme aracına ne zaman geçerli ne zaman güvenilir diyeceğiz?Bu dersimizde bunu konuşalım.

GeçerlikGüvenirlik
Sorularda hesaplatmayacağı ama hazır olarak vereceği bir Geçerlilik Katsayısı vardır.

Geçerlik katsayısı -1 ile +1 arasında gidip gelen bir sayıdır.

Geçerli diyebilmek için en az 0.30 olmalıdır ve 1’e ne kadar yakın olursa o kadar geçerlilik artacaktır.

Verilen geçerlilik katsayısına bakacaksın.Eğer 0.30 ve üstü ise ölçme aracı geçerlidir.Yok eğer değil ise Geçerlilikle ilgili bütün tanımlar tersine döner.

  • Bu ölçme aracı amacına hizmet etmiyordur.
  • Bu ölçme aracı bilenle bilmeyen ayrımı yapamıyordur.
  • Bu ölçme aracı ölçtüğü özelliğe başka özellikler karıştırıyordur.
  • Bu ölçme aracındaki elde edilen sonuçlardaki Sabit ve Sistematik hatalar çok fazladır.

Yani

Bu ölçme aracının Geçerliliği düşüktür, diyeceksiniz.

Burada da Güvenirlik Katsayısını kullanacağız.Bize bu katsayıyı hesaplatmadan verecektir.

Güvenirlik katsayısı 0 ile 1 arasında gidip gelen bir sayıdır.

Ölçme aracının güvenilir olduğunu söyleyebilmen için minumum 0.70 olmalıdır.1’e ne kadar yakın Güvenirlik o kadar yüksektir.

Peki 0.70 altında ise tanımlar gene tersini uygular.

  • Bu ölçme sonucuna karışan Tesadüfi hata miktarı fazladır.
  • Bu ölçme sonucu gerçeği yansıtmıyordur.Yani gerçeğe yakın değildir.

Yani

Bu ölçme aracının güvenirliği düşüktür.

Güvenirlik(Sonuç)

  • Hatırlarsanız eğer sadece Tesadüfi hatadan doğrudan etkileniyordu.Ölçme sonuçlarının tesadüfi hatadan arınıklılığıdır.
    Senin yaptığın ölçüm sonuçları tesadüfi hatadan ne kadar arınıksa güvenirlik o kadar yüksektir.
  • Ölçme sonuçlarının gerçeğe yakınlık derecesidir.Gerçeği yansıtma derecesidir.
  • Ölçme sonuçlarının duyarlı, hassas, objektif ve kararlı olmasıdır.

Geçerlik(Amaç)

  • Bir ölçme aracının amacına hizmet etme derecesidir.
    Örnek olarak,
    Matematik öğretmenin sınav yapmaktaki amacı matematik bilgi ve beceriyi ölçmektir.İşte bu sınav öğrencinin matematik bilgi ve beceriyi ne kadar iyi ölçüyorsa Geçerliliği yüksektir.
  • Geçerlilik bir ölçme aracının hazırlandığı konuyla ilgili bilen bilmeyen ayrımını yapabilme derecesidir.
    Hazırlanan ölçme aracının hazırlandığı konuyla ilgili bilen bilmeyen ayrımını yapabilme derecesidir.
    Örnek olarak,
    Bir Tarih öğretmeni sınav yapmaktaki amacı öğrencinin Tarih ile ilgili bilgi ve becerisini ölçmektir.Aynı zamanda  o konularla ilgili bilen ve bilmeyen öğrencileri ayırmak isteyebilir.
  • Bir ölçme aracının ölçmek istediği özelliğe başka özellik karıştırmamasıdır.
    Örnek olarak,
    Bir matematik öğretmeninin sınav yapmaktaki amacı öğrencinin matematik bilgi ve becerisini yoklamaktır.Giderde bu öğretmen birde o bilgi ve becerisinin yanı sıra yazı güzelliğine puan verirse ölçtüğü özelliğe başka özellikler kattığı için amacının dışına çıkar ve Geçerlilik düşer.
  • Hatırlarsanız eğer Geçerlik Sabit ve Sistematik hatalardan doğrudan etkileniyordu.O halde;
    Geçerlik elde edilen ölçme sonuçlarının Sabit ve Sistematik hatadan arınık olmasıdır.

Kullanışlılık(Maliyet)

Bir ölçme aracının belli başlı özellikleriyle ilgilenir.

  • Hazırlanması
  • Uygulanması
  • Puanlanması

Kolay ve ekonomik olmasıdır.

Eğer kolay ve ekonomik değilse o ölçme aracı Kullanışlı değildir.

Bir ölçme aracının belli başlı özellikleriyle ilgilenir.

  • Zaman
  • Emek
  • Para

Getirine götürüsüne bakar.

Para minimum, verim maximum olması beklenir.