Kategori arşivi: Ölçme ve Değerlendirme

Stadart Hata

Her ölçme işlemi başına düşen tesadüfi hataya standart hata denir.

Günlük hayattan örnek vermek gerekirse, şeker kutuları üzerinde

1 kg -> +- 10g

yazar.Burada demek istenen “Sebebini bilmediğimiz kaynaklardan ötürü bir hata vardır.” işte biz buna standart hata diyoruz.

Eğitimde Standar Hatayı Nasıl Kullanırız?

Bir öğrenci 70 puan almış olsun.Standart hatasına +- 2 dersek bu öğrenci (70-2 = 68) – (70+2 = 72) puan aralığında puan almıştır deriz.

Standart hatayı matematiksel olarak hesaplamak için aşağıdaki formülü şey edebilirsiniz.

Standart Hata = Standart Sapma√1-Güvenlik Katsayısı

Lakin yukarıdaki formülü çokta şey etmenize gerek yok.Çünkü ben sizlere pratik bilgiyle Standart Hata sorularıyla nasıl baş edeceksiniz göstereceğim.

Standart Hatanın En Yüksek Olduğu Test SorulursaStandart Hatanın En Düşük Olduğu Test Sorulursa
Seçeneklerde Standart Sapma ve Güvenlik Katsayısını verecektir.Seçeceklerde Standart Sapma ve Güvenlik Katsayısını verecektir.
Cevabı yapıştırmanız için, seçeneklere göz atınız ve Standart Sapması en yüksek olan, Güvenirlik Katsayısı en düşük olana acımayın.Cevabı yapıştırmanız için, seçeneklere göz atınız ve Standart Sapması en düşük olan, Güvenirlik Katsayısı en yüksek olana acımayın.

Ya peki öğrencilerin gerçek puan aralığı üzerinden soru sorarsa?

Sana sınavda öğrencinin sınavdan aldığı öğrenci puanını vermişse, birde standart hatayı vermişse bir kaç soru tipi mevcuttur;

Soru TipiÖğrencinin %68 olasılıkla gerçek puan aralığı nedir?Öğrencinin %32 hata payı ile gerçek puan aralığı nedir?
Öğrenci Puanı +- 1x Standart Hata
Soru TipiÖğrencinin %95 olasılıkla gerçek puan aralığı nedir?Öğrencinin %5 hata payı ile gerçek puan aralığı nedir?
Öğrenci Puanı +- 2x Standart Hata
Soru TipiÖğrencinin %99 olasılıkla gerçek puan aralığı nedir?Öğrencinin %1 hata payı ile gerçek puan aralığı nedir?
Öğrenci Puanı +- 3x Standart Hata
ÖRNEKLER
SoruBir öğrenci bir sınavdan 70 puan almıştır.Bu sınavın standart hata miktarı 2 puan bulunmuştur.
1. Tip
Soru
Öğrencinin %68 olasılıkla gerçek puan aralığı nedir?Öğrencinin %32 hata payı ile gerçek puan aralığı nedir?
Çözüm70 +- 1×2 -> 68 – 72
2. Tip
Soru
Öğrencinin %95 olasılıkla gerçek puan aralığı nedir?Öğrencinin %5 hata payı ile gerçek puan aralığı nedir?
Çözüm70 +- 2×2 -> 66 – 74
3. Tip
Soru
Öğrencinin %91 olasılıkla gerçek puan aralığı nedir?Öğrencinin %1 hata payı ile gerçek puan aralığı nedir?
Çözüm70 +- 3×2 -> 64 – 76

Son olarak bir örnek durum üzerinden güzel bilgi verip konuyu noktalayalım.

Serpil öğretmen uygulayacağı sınavda geçme barajını 60 puan olarak belirlemiştir.Fakat sınav sonucunda 59 puan alan öğrencileride dersten geçirmiştir.Serpil öğretmenin 59 alan öğrencileri dersten geçirmesini neye dayandırırsa ölçme değerlendirme ilkelerine aykırı davranmamış olur?

Hatırlarsanız eğer, mutlak ölçüt kullanılıyorsa eğer buna aykırı davranılmazdı.Yani kimse mutlak ölçüt üzerinde not alamasada durum değişmez, kimse geçemezdi.Anlayacağınız aykırı karar alamazsınız.Yukarıdaki örnek durumda 60 puanlık mutlak ölçüt var.Serpil öğretmen mutlak ölçüte aykırı davranmış ve gitmiş 59 alan öğrencileride geçirmiştir.Burada temel dayanağı ölçmenin standart hatası olacaktır.

Eğer derse ki, “59 puan alan öğrenci standart hatayla birlikte 60 puanı geçebilirdi.Bu yüzden ölçmenin standart hatasını göz önünde bulundurdum.” işte o zaman ölçme değerlendirme ilkelerine aykırı davranmamış olur.

Güvenirlik Belirleme Yöntemleri – Cronbach Alpha Yöntemi

Her zaman testlerde doğru ve yanlış cevap net değildir.Anketler, dereceli ölçekler, “Katılıyorum, Katılmıyorum, Başarılı” vs gibi testler.

Bu tarz sınavlarda doğru ve yanlış cevap kişiye göre değişir.Bu tarz sınavların Güvenirliğini belirlemede Cronbach Alpha Yöntemi kullanılır.

Daha çok psikolojik yapıların ölçüldüğü testlerde kullanırız.

  • İlgi
  • Tutum Ölçeği
  • Kişilik Testi
  • Zeka Testi
  • Likert Tipi Ölçekler
  • Dereceli Ölçekler(Lubrik, Dereceli Puanlama Anahtarı)

Bilişsel ve duyuşsal zihin süreçlerinin araştırıldığı durumlarda kullanılır.

Ek olarak,
Cronbach Alpha katsayısı elde edilir.Bu katsayı sorular arsında uyumu gösterdiği için İç Tutarlılığı verecektir.

Yani İç Tutarlılık = Cronbach Alpha katsayısıdır.

Cronbach Alpha Yöntemi İç Tutarlılığı verir.Doğrudan İç Tutarlılığı verdiği için Dolaylı yoldan Güvenirliği verir.

Güvenirlik Belirleme Yöntemleri – Kuder – Richardson Yöntemi

KR – 20KR – 21
Ortak Noktaları

  • Doğru cevaplara 1 puan
  • Yanlış cevaplara 0 puan verilir.
  • Sorulan soruların %90-95 i cevaplanmış olmalıdır.
  • Düzeltme formülü kullanulmamalıdır.

Çoktan Seçmeli ve Doğru Yanlış testlerinde kullanılan yöntemlerdir.

Soruda verilen Çıktan Seçmeli ve Doğru – Yanlış Testi değilse KR – 20 ve KR – 21 yöntemini ele.Çünkü bu yöntemler bu iki testte kullanılırlar.

Hazırlanan testte ayrıntılı Madde Analizi yapılabildiğini söylüyorsa;

    Madde analizi,

  • Madde güçlüğü(PJ)
  • Madde ayrıcılığı(RJ)
  • Madde Varyansı
  • Puanlar

hesaplanabiliyorsa, yani Madde Analizi ayrıntılı yapılabiliyorsa ve bunlar hesaplanabiliyorsa KR – 20 kullanılmalıdır.

Verilen soruda öğretmenin ya da uzmanın ayrıntılı Madde Analizi yapamadığını söylüyorsa;

    Madde analizi,

  • Madde güçlüğü(PJ)
  • Madde ayrıcılığı(RJ)
  • Madde Varyansı
  • Puanlar

hesaplanamıyorsa gereken yöntem KR – 21 dir.

Test istatistikleri hesaplanabilir.

KR – 20 ve KR – 21 katsayıları testin İç Tutarlılığı hakkında bilgi verir.Çünkü testi Testi Yarılama yönteminde olduğu gibi bize testteki soruların uyumu hakkında bilgi verir.
Bir testte madde güçlüğü eşit değilse KR – 20 > KR – 21 dir.
Bir testte madde güçlüğü eşitse KR – 20 = KR – 21 dir.
Tek istisna budur.

 KR – 20 ve KR – 21 İç Tutarlılığı verir.Doğrudan İç Tutarlılığı verdiği için Güvenirliği dolaylı yoldan etkiler.

Güvenirlik Belirleme Yöntemleri – Testi Yarılama(Eşdeğer Yarılar) Yöntemi

Bir test önce öğrenci grubuna uygulanır.

Testi Yarılama(Eşdeğer Yarılar) Yöntemi

Test gruba uygulanır.

I. YarıII. Yarı
Soruların 1. – 3. – 5. – 7. …. numaralıları yani tek numaralıları buraya.Soruların 2. – 4. – 6. – 8. . …. numaralıları yani çift numaralıları buraya.
Uygulamadan sonra, puanlamadan önce oluşturulur.

İki yarıdan elde edilen puanlara bakacaksın.Kolerasyon yüksek ve pozitif çıkar ise Güvenirlik yüksektir demektir.

Sorular arası uyuma bakıldığı için iç tutarlığı yüksektir.Dolayısıyla Güvenirlik yüksektir.

Bu yöntem sana doğrudan İç Tutarlılığı veriyor.(Testin Yarı Güvenirliği)

Testi Yarılama(Eşdeğer Yarılar) Yöntemi, İç Tutarlılığı veriyor.Güvenirliği değil, İç Tutarlılığı verdiği için Güvenirlik hakkında yorum yapıyoruz.Yani Doğrudan İç Tutarlılığı verirken, Dolaylı yoldan Güvenirlikle ilgili bilgi veriyor.

Güvenirlik Belirleme Yöntemleri – Paralel Test(Eş Değer Formlar) Yöntemi

Paralel Test(Eşdeğer Formlar Yöntemi)

Birbirine eşdeğer olacak iki form hazırlanır.

  • Soruları farklı olacak.
  • Soru sayıları eşit olacak.
  • Sorduğu soruların kapsamları yani hedef ve davranışları aynı olacak.
  • Soruların güçlüğü eşit olacak.

işte bu nitelikleri benzer iki form olacak.

Bu soruları bir öğrenci grubuna iki farklı şekilde uygularız.

Öğrenciler
Ardarda Uygularız1 – 3 gün arayla ya da 1 haftada olabilir uygularız.
Eş değerlik katsayısı elde edilir.Tutarlık katsayısı elde ederiz.

İki formdan elde edilen puanlar karşılaştır, kolerasyon pozitif ve yüksekse güvenirlik yüksektir.

Kolerasyonu düşüren ve etkileyen faktörler?

  1. Soru sayısı eşit değilse.
  2. Kapsamlar aynı değilse.
  3. Soruların güçlükleri eşit değilse.

Yani soruların nitelikleri benzer değilse kolerasyon düşük çıkacaktır.

Paralel Test(Eş Değer Formlar) Yönemi, Eşdeğerlik ve Tutarlılığı veriyor.Haliyle doğrudan Güvenirliği veriyor.

Güvenirlik Belirleme Yöntemleri – Test Tekrar Test

Bir test aynı öğrenci grubuna iki defa uygulanır.

Öğrenciler
I. UygulamaII. Uygulama
1 – 3 hafta ise Tutarlılık Katsayısına bakarız.
3 – 6 hafta arası ise Kararlılık Katsayısına bakarız.
Elde edilen puanlar karşılaştırıyorsun ve aradaki kolerasyona bakıyorsun.Pozitif ve yüksek çıkmışsa bu ölçme aracı iki uygulamada da benzer sonuçlar verdiği için Güvenirliği yüksektir.

Test Tekrar Test yönteminde kolerasyonu düşüren etkenler.

  1. Unutmanın etkisi.
  2. Hatırlamanın etkisi.
  3. Sürenin uygun ayarlanamaması.
  4. Koşulların standart olmaması.
  5. Ölçülen özelliğin çabuk değişmesi.
  6. Yoruma açık ifadelerin kullanılması.

Test Tekrar Test başarı testlerinin güvenirliğini belirlemede kullanılmaz ve önerilmez.

Çünkü başarı testlerinde bizler bilgi ölçeriz.Bilgi unutulur, hatırlanır, çabuk değişir.

Test Tekrar Test, Tutarlılık ve Kararlılık katsayılarını veriyor.Haliyle Güvenirliği doğrudan veriyor.

Güvenirlik – Geçerlik Arasındaki İlişki

1-) Güvenirlik, geçerlik için ön koşuldur fakat yeterli değildir.

Yani Geçerlilik için Güvenirlik olması gerekiyor ama her Güvenilir olan Geçerli olmuyor.

Bir ölçme aracı Geçerliyse kesinlikle Güvenirliği sağlamıştır.

Bir soruda eğer bir ölçme aracının güvenilir olduğunu söylüyorsa bu ölçme aracı geçerli olabilir ya da aynı şekilde geçerli olmaya da bilir.

Güvenirlik Nişan ise Geçerlilik Evliliktir.

Şimdi bunu güzelce örneklendirmek gerekirse, 3 nişan tahtasına 5 atış yapıldığını resmedelim.

Geçerlik - Güvenirlik Arasındaki Fark

Şimdi burada birinci nişan tahtasını incelersek eğer, atışların birbirine benzer ve uyumu olmadığı için Tutarlılık ve birbirini tekrarın olmadığını görürüz.Haliyle Güvenirlik yoktur.Amaç hedefi vurmak olduğu için ve görüldüğü üzere amaç gerçekleşmediği için Geçerlilik yoktur.

İkinci nişan tahtasına bakarsak eğer, hedefi vuramasada 5 atışın 5ide aynı noktada olduğu için, yani benzer ve uyumlu yani birbirini tekrarını gördüğümüz için Tutarlılık vardır.Haliyle Güvenilirdir.Lakin amaç hedefi vurmaksa eğer Geçerli değildir.

Üçüncü nişan tahtasına gelirsek eğer, görüldüğü üzere birbinin tekrarı var yani Tutarlılık vardır.Güvenirlik vardır.Amaç hedefi vurmak olduğu için Geçerlilikte vardır.

Şimdi kurgusal bir örnek vermek gerekirse,
Bir hoca her gün derse 15 geç kalıyorsa güvenlidir.Çünkü bir gün sonrada 15 dk geç gelecektir.Haliyle Tutarlılık vardır.Fakat amaca hizmet etmediği için Geçerliliği düşüktür.

Bir ölçme aracında Güvenirlik Geçerliliği sınırlandırır.

Bir şey Güvenirliği olumsuz etkiliyorsa, Geçerliliğide olumsuz etkiler.Fakat tersi doğru değildir.

Geçerlik ≤ √Güvenirlik tir.

Soru
Güvenirliği 0.81 olan bir ölçme aracının Geçerliliği hangisi olamaz?
A)0.60 B)0.70 C)0.80 D)0.90 E)0.95

Geçerlik ≤ √0.81
Geçerlik ≤ 0.9 olacağı için 0.9 a eşit ya da küçük olmak zorundadır.

2-) Ölçme Aracındaki Özellikler(Önem Sırasına Göre)

  1. Amaç -> Geçerlik
  2. Sonuçların Doğruluğu -> Güvenirlik
  3. Maliyet -> Kullanışlık

Güvenirliği Arttıran Ya da Azaltan Etmenler

  • Soru sayısını arttırmak.
    HomojenHeterojen
    Benzer hedef davranışlardan soru ekleme.Farklı hedef davranışlardan soru ekleme.
    • Benzer hedef davranışlar.
    • Benzer kapsamdan.

    Benzerlik artar, haliyle iç tutarlılık artar.

    Soru sayısının artması duyarlılığı arttırır.

    Yani, haliyle Güvenirlik artacaktır.

    • Farklı hedef davranışlardan.
    • Farklı kapsamdan.

    Soru sayısı arttığı için duyarlılık artacaktır.

    Ama farklı hedef davranışlardan farklı kapsamdan soru eklemek demek sorular arasındaki uyumu azaltacaktır, haliyle iç tutarlılık azalacaktır.

    Güvenirlik bir miktar artacaktır.Ama kesinliği hakkında konuşamayız.

    Güvenirlikten ziyade kapsam geçerliliğini arttıracaktır.

    Güvenirlik - Soru Sayısı Grafiği

    Güvenirlik – Soru Sayısı Grafiği

  • Ranj, Standart Sapma, Varyans güvenirliği arttırır.
    Bunlar bir dağılımda yükse çıkabilir.Bunlar bir dağılımda düşük çıkabilir.
    • Farklılaşma fazla.
    • Grup heterojen.
    • Öğrenme düzeyleri farklıdır.

    Güvenlik yüksek.

    • Farkllaşma azalır.
    • Grup homojen.
    • Öğrenme düzeyleri benzer.

    Güvenirlik düşük.

  • Sınavdaki soruların güçlüğü.
    Sorular çok zor ya da çok kolay olursa güvenirliği düşürür.Güvenilik en yüksek değerini madde güçlüğü 0.50(orta güçlük)’te alır.
  • Ayrıcılık
    Bilen bilmeyen ayrımını yapabilme derecesidir.
    Ayrıcılık arttıkça, güvenirlik artar.
  • Kopya
    Güvenirliği düşürür.
  • Şans Başarısı
    Şans başarısı önlenmesinin en iyi yolu düzeltme formülüdür.
    Ya da
    Seçenek sayısını arttıracaksın.
  • Sınav süresi
    Gereğinden fazla uzun ya da kısa olması güvenirliği düşürür.
  • Açık, net ve anlaşılır bir dil kullanılırsa ve yönerge varsa, sorular kolaydan zora sıralanırsa
    Güvenirlik artar.

Güvenirliğin Temel Kavramları

Duyarlılık(Hassaslık)

Ölçme sonuçlarının hassaslığıdır.

Duyarlılığı arttırmak istiyorsak, birimler arası mesafeyi küçültürüz.Yani birimler arası mesafeyi küçültürüz.Yani birimleri yaklaştırırız.

  • Birim sayısını arttırırız.
  • Birimler arasının küçük olmasıdır.
  • Birim sayısının fazla olmasıdır.

Duyarlılığı arttırmak ne işe yarar?

Duyarlılık artıyorsa hata oranı azalır.Yani gerçeğe yakınlık artar.Gerçeği yansıtma oranı artacaktır.

Eğitimde duyarlılığı arttırmak için soru sayısını arttıracaksın.

Ama burada dikkat etmemiz gereken bir husus var.Soru sayısını arttırırken abartmamak gerekiyor.Belli bir limiti vardır.Soru sayısını gereğinden fazla arttırmak öğrencileri yoracaktır, bezdirecektir, uykularını getirecektir.Dolayısıyla Tesadüfi Hatayı arttırır.Buda güvenliği düşürür.

Objektiflik(Puanlama Güvenirliği)

Tarafsızlık demektir.

Farklı ya da aynı puanlayıcılar bir kağıda benzer puanlar veriyorsa bu puanlayıcların objektif davrandığı söylenir.

Birbirinden bağımsız puanlayıcılar, bir kağıdı puanlarsa ve puanlar benzer çıkıyorsa, objektif davranılmıştır.Puanlama güvenirliği yüksektir diyeceğiz.

Bir ölçme aracının objektifliğini yani puanlama güvenirliğini arttırmak istiyorsak ne yapacağız?

  1. Ayrıntılı cevap anahtarı hazırlanır.
  2. İsimler kapatılıp puanlama yapılır.
  3. Aynı kağıdı iki defa puanlarsın.Bu puanların ortalamasını alırsın.
  4. Aynı kağıdı zümredeki başka bir öğretmene puanlatır ve puanların ortalamasını alırsın.
  5. Kağıdın tümü yerine soru soru okuma yapılır.Yani tüm öğrencilerin önce 1. sorusu, ardından 2. sorusu …… böyle gider.

Tutarlılık

Tutarlılık iki durumda incelenir.

Bir testteki maddelerin birbiriyle uyumlu olduğunu gösteren İç TutarlılıkKısa zaman aralıklı ölçümler
Bir testteki maddelerin birbiriyle uyumlu olmasıdır ya da testin bütünüyle uyumlu olmasıdır.

  • Eğer bir öğretmen hazırladığı sınavda benzer konulardan benzer hedef davranışlardan soru sayısını fazlalaştırıyorsa, soru syısındaki benzerliği arttıracağı için yani uyumu arttırdığı için iç tutarlık yüksektir.
  • Fakat bu öğretmen farklı konulardan, farklı hedef davanışlardan soru sayısını arttırıyorsa, sorular arasındaki uyumu azaltacak, farklılığı arttıracaktır.Buda iç tutarlılığı azaltır.

İç tutarlılığı arttırmak için,

  • Benzer hedef davranışlardan soru soracaksın.
  • Benzer konulardan soru soracaksın.
  • Benzer kazanımlardan soru soracaksın.

Peki bir testin iç tutarlılığı yüksekse nasıl yorum yaparız?

  1. Sorular benzer hedef davranışlara yöneliktir.
  2. Sorular benzer kapsamdan geliyor.
  3. Sorular arasındaki uyum yüksektir dersin.Yani madde madde kolerasyonu yüksektir dersin.
  4. Eğer psikolojik test ise yapı geçerliliği yüksek olduğunu söyleyebilirsin.
  5. Eğer başarı testiyle kapsam geçerlliliğinin üdşük olduğunu söyleyebilirsin.
Yaptığın ölçme işlemini 1-3 hafta arasında yani kısa zaman aralığında tekrar ettiğinde benzer sonuçlar elde ediyorsan burada tutarlılık vardır denir.

Kararlılık

Tutarlılığın ikinci anlamının uzun süreli versiyonudur.

Eğer bir ölçme işlemini uzun zaman aralığında tekrar edersen yani ölçüm yaparsan (3-6 hafta arasında tekrar edersen) bu ölçme sonuçları benzerse, bu ölçme sonuçları zaman içinde değişmiyordur.Yani kararlık gösteriyordur.

Kararlılığın faydası nedir?

Eğer ölçtüğün özellik kararlılık gösteriyorsa, ölçülen özelliğin zaman içinde direncini gösterir.Ölçtüğün özelliğin zaman içinde değişmezliğini gösterir.

Geçerlik ve Güvenirlik Sorularında Ne Yapacağız?

Sorularda bir ölçme aracına ne zaman geçerli ne zaman güvenilir diyeceğiz?Bu dersimizde bunu konuşalım.

GeçerlikGüvenirlik
Sorularda hesaplatmayacağı ama hazır olarak vereceği bir Geçerlilik Katsayısı vardır.

Geçerlik katsayısı -1 ile +1 arasında gidip gelen bir sayıdır.

Geçerli diyebilmek için en az 0.30 olmalıdır ve 1’e ne kadar yakın olursa o kadar geçerlilik artacaktır.

Verilen geçerlilik katsayısına bakacaksın.Eğer 0.30 ve üstü ise ölçme aracı geçerlidir.Yok eğer değil ise Geçerlilikle ilgili bütün tanımlar tersine döner.

  • Bu ölçme aracı amacına hizmet etmiyordur.
  • Bu ölçme aracı bilenle bilmeyen ayrımı yapamıyordur.
  • Bu ölçme aracı ölçtüğü özelliğe başka özellikler karıştırıyordur.
  • Bu ölçme aracındaki elde edilen sonuçlardaki Sabit ve Sistematik hatalar çok fazladır.

Yani

Bu ölçme aracının Geçerliliği düşüktür, diyeceksiniz.

Burada da Güvenirlik Katsayısını kullanacağız.Bize bu katsayıyı hesaplatmadan verecektir.

Güvenirlik katsayısı 0 ile 1 arasında gidip gelen bir sayıdır.

Ölçme aracının güvenilir olduğunu söyleyebilmen için minumum 0.70 olmalıdır.1’e ne kadar yakın Güvenirlik o kadar yüksektir.

Peki 0.70 altında ise tanımlar gene tersini uygular.

  • Bu ölçme sonucuna karışan Tesadüfi hata miktarı fazladır.
  • Bu ölçme sonucu gerçeği yansıtmıyordur.Yani gerçeğe yakın değildir.

Yani

Bu ölçme aracının güvenirliği düşüktür.