Kategori arşivi: Ölçme ve Değerlendirme

Alternatif Ölçme Değerlendirme Araçları

  1. Tanılayıcı Dallanmış Ağaç
    • Doğru yanlış testlerine alternatiftir.
    • Sorular birbiriyle bağlantılıdır ve bir konu derinlemesine ayrıntılandırılır.Yani sorular genelden özele hazırlanır.Ya da temelden ayrıntıya hazırlanır.Ya da basitten karmaşığa hazırlanır.
    • Şans başarısı oldukça düşüktür.
    • Öğrenme eksikliği belirlenebilir.(Formatif)

    Tanılayıcı Dallanmış Ağaç

  2. Yapılandırılmış Grid(Izgara)
    • Çoktan seçmeli testlere ve eş seçtirme testlerine alternatiftir.
    • Şans başarısı yok denecek kadar azdır.
      Çünkü;
      seçenek sayısı fazla,
      bir sorunun birden fazla cevabı,
      bir cevap birden fazla soruya yanıt olabilir.
    • Öğrenme eksikliğini belirleyebiliriz.
    • Daha çok fen ve teknoloji ve ingilizce derslerinde kullanılır.
  3. Kelime İlişkilendirme Testi
    • Temel kavram verirsin ve 3’er saniye içinde bu temel kavramın öğrenci zihninde yaptığı çağrışımlara bakarsın.
    • Anlamlı öğrenmeyi sağlar.
  4. Poster
    • Verilen hedef davranış ya da kazanım ile ilgili renkli ve resimli etkinlik yapacaklar, poster hazırlayacaklar ve sunacaklar.
    • Amaç, öğrencilerin üst düzey düşünme becerilerini geliştirmekse(yaratıcılık) ve sunum yaptıracak sözlü iletişim becerileri geliştirmek.
  5. Proje
    • Her proje bir performans görevidir.
    • Her performans ödevi bir proje değildir.
  6. Jurnaller
    • Bir öğrenci bir soruyu çözerken, neler düşündüğünü, neden o yolu izlediğini, neden o yoldan gittiğini ayrıntılı olarak anlatmasını istersiniz.
    • Neler düşündüğü,
    • Neden o yolu izlediğini,
    • Neden o yoldan gittiğini
  7. Anektodlar
    • Öğretmenlerin tuttukları günlüklerdir.
    • En önemli durumu, Anektod yazarı tarafsız ve objektif davranmak zorundadır.

Puanlama Araçları

Çağdaş ölçme araçlarının çoğunun puanlama güvenirliği düşüktür.Bu puanlama güvenirliği arttırmak için belli başlı puanlama araçları kullanacağız.

Kontrol Listesi

  • En basit ölçektir.
  • Eğer senin amacın performans değerlendirme sürecinde belli başlı davranışları, belli sırada yapılıp yapılmadığını kontrol etmekse kullanılan ölçüt kontrol listesidir.
  • Bize belli başlı davranışların yapılıp yapılmadığını yani var ya da yok olduğunu verir.
  • Davranışın düzeyini vermez.İyi mi yapıyor?Kötü mü yapıyor?Orta düzey de mi yapıyor bilemezsin.
  • Davranışlar arası hiyerarşi vardır.Yani davranışları hangi sıra ile yapılacağını kontrol listesi gösterir.
  • Öğretim amaçlıda kullanılır.
  • Bireyin davranışlarından kaç tanesine sahip olduğu bilgisine cevap verir.

Süreç + Sonuç ölçmede etkilidir.

Daha çok süreç ölçmede etkilidir.

Derecelendirme Ölçeği

  • Bir uygulama sırasında yapılması gereken davranışların varlığından yokluğundan ziyade birey o davranışa iyi mi sahip? kötü mü sahip? bilgisini verir.
  • Davranış düzeyi hakkında bilgi verir.(İyi – Kötü – Orta)
  • Bireyin davranışlardan kaç tanesine sahip iyi mi sahip, kötü mü sahip yorum yapabiliriz.

Süreç + Sonuç ölçmede etkilidir.

Daha çok sonuç ölçmede etkilidir.

Rubrik(Dereceli Puanlama Anahtarı)

Bir öğrenciye performans görevi verildiğinde yanında verilen ve öğrenciye ne yaparsa ne kadar puan alacağını gösteren ölçek.

Performans görevi varsa yanında Rubrik verilmelidir.

  1. Değerlendirme sürecindeki belirsizliği giderir.
  2. Motivasyonu arttırır.
  3. Kendi öğrenme sorumluluğunu öğrenciye verir.
  4. En önemli faydası puanlamada objektifliği sağlar.
  • Rubriklerde hazırlanan puanlamada kullanılan ölçütler mutlak olmalıdır.Değiştirilemez.
  • Değerlendirme aşamasında(puanlama sırasında) öğrencilerin ilgi, ihtiyaç ve gelişimleri göz önüne alınmaz.
  • Daha çok psikomotor becerilerin puanlanmasında kullanılır.Bilişsel, duyuşsal durumlarda da kullanılabilir.

Analitik Rubrik

Bir performans değerlendirme sürecinde yapılan performansın her bir adımı ayrıntılı olarak puanlanıyorsa analitiktir.

Her bir adım ayrıntılı olarak puanlanıyorsa analitiktir.

Daha çok süreç ölçmede etkilidir.

Holistik(Bütüncül) Rubrik

Her bir adım ayrıntılı olarak puanlanmaz.

Belli başlı adımlar + oluşturulan bütün puanlanır.

Daha çok sonuç ölçmede etkilidir.

Çağdaş Ölçme Araçları

Tamamlayıcı, Süreç Temelli, Tümel, Otantik, Uzlaştırıcı, Eklektik yaklaşım…

Portfolyo(Öğrenci Ürün/Seçki/Gelişim Dosyası)

Belli bir dönemde(1 yıl/1 dönem) yapılan öğrenci çalışmalarının toplandığı dosyadır.

Amaç, süreçteki gelişimi belgelerle izlemektir.

Faydaları;

  1. Öğrencilerin çok yönlü gelişimini(Psikomotor, Duyuşsal, Bilişsel) sağlar.
  2. Gelecekteki öğretmenlere ve kurumlara öğrenci hakkında bilgi sağlar.Yani Arşiv niteliği vardır.
  3. Değerlendirme sürecinde öğretmene alternatif sağlar.
  4. Otantik değerlendirmeyi sağlar.Otantikten kasıt, yaşama yakın veya günlük hayattan beceridir.
  5. Öğretmen + Öğrenci + Veli değerlendirme sürecine dahildir.
  6. Üst düzey düşünme becerilerini geliştirir.

Dezavantajları;

  1. Öğrenme eksikliği belirlenemez.
  2. Rekabet yoktur.Başarı karşılaştırması yoktur.
  3. Bireysel ölçüt geliştirmek zordur.Çünkü gerekli.En önemli sınırlılığıdır.
  4. Puanlama güvenirliği düşüktür.
  5. Maliyetli ve zaman alıcıdır.Kullanışlı değil.

Performans Değerlendirme(Performans Görevi)

Öğrenciye bir performans görevi verilir.Hem süreç hemde sonuçtaki ürün değerlendirilir.

Amaç, anında dönüt düzeltme vermektir.

Faydaları;

  1. Daha çok psikomotor beceri ölçülür.Tabi ki de bilişsel ve duyuşsalda ölçülür.
  2. Yaparak – Yaşayarak öğrenmeyi sağlar.Aktif öğrenmeyi sağlar.
  3. Otantik değerlendirmeyi sağlar.
  4. Üst düzey düşünme becerisi geliştirir.
  5. Hem grupla hemde bireysel değerlendirilebilir.

Portfolyo’da yapamadığımız öğrenme eksikliğini burada belirleyebiliriz.

Dezavantajları;

  1. Puanlama güvenirliği düşüktür.

Bir yerde performans değerlendirmesi(görevi) varsa bunun puanlama güvenirliğini arttırmak için yanında Rubrik(Dereceli Puanlama) anahtarı verilmelidir.Zaten Rubrik kullanmıyorsa bu performans görevinin puanlama güvenirliği kesinlikle düşüktür.

Bir soruda performans görevi diyebilmek için bu süreçte öğrencilerin şu yaptıklarına dikkat çekmek gerekir.

Öğrencilerin; Uygulamalar, İncelemeler ya da Araştırmalar yaptığını söylüyorsa performans değerlendirmedir.

Öz Değerlendirme

Amaç, öğrenci kendi çalışmalarını değerlendirsin.Öğrenci kendi güçlü ve zayıf yanlarını görsün ve kendini tanısın.

Metabilişsel düşünmeyi sağlar.

Yaşam boyu öğrenmeyi sağlar.

Değerlendirme kültürünü oluşturur.

Puanlama güvenirliği düşüktür.

Akran Değerlendirme

Birbirinin yaptıkları çalışmaları değerlendirmek.

Amaç, olumlu ve yapıcı eleştiri yapmayı geliştirme ve eleştiriye açık olma.

Demokrasi bilinci gelişmiştir.

Değerlendirme kültürünü oluşturur.

Puanlama güvenirliği düşüktür.

Klasik(Geleneksel) Ölçme Değerlendirme Araçları

Bilgi Düzeyi
(Bloom Taksonomisi)
Hazırlama
Uygulama
Puanlama
Puanlama GüvenirliğiŞans BaşarısıGüvenirlik ve Geçerlik
(Soru Sayısı, Kapsam Geçerliliği ve Duyarlılığı gösterir.
Puanlama Güvenirliğine bakacaksın.Puanlama Güvenirliği Objektifliği hakkında bilgi verir.)
Özellikler
Yazılı YoklamalarÜst Düzey
Sentez – Değerlendirme hedef alanları ölçülür.
H -> Kolay
U -> Kolay
P -> Zor ve zaman alıcı.
Düşüktür.
Subjektif testtir.
En büyük dezavantajı budur.
Yoktur.
Şişirme ve blöf yeteneği vardır.
Güvenirlik ve Geçerlilik düşüktür.
Soru sayısı düşüktür.Bu yüzden Kapsam Geçerliliği ve Duyarlılık düşüktür.
Puanlama Güvenirliği düşüktür.
  • Puanlama Güvenirliği düşüklüğünü önlemek için ayrıntılı cevap anahtarı olmak zorunda.
  • Seçimlik ve ön koşulluk soru kullanmayacaksın.Yoksa Kapsam Geçerliliği dahada düşer ve puanların kıyaslanabilirliğini engellersin.
Sözlü YoklamalarÜst Düzey
Sentez – Değerlendirme
H, U ve P -> Zor ve zaman alıcı.Çünkü herkese eş güçlükte soru hazırlanması gerekiyor.Düşüktür.
Subjektiftir.
Yoktur.
Sözlü iletişim becerisi vardır.
Düşüktür.
Soru sayısı azdır.Buda Kapsam Geçerliliğini ve Duyarlılığı düşürür.
Puanlama Güvenirliği düşüktür.
  • İlköğretimin ilk kademesinde not verme amacıyla yapılması yasaklanmıştır.
Kısa Cevaplı – Boşluk DoldurmaAlt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır.Yüksektir.
Yarı objektiftir.
Nispeten nesneldir.
Yoktur.
Ezber ve hatırlama yeteneği iyi olanlar başarılı olur.
En büyük dezavantajıdır.
Yüksektir.
Soru sayısı fazla olması Kapsam Geçerliliğini ve Duyarlılığı arttırır.Puanlama Güvenirliği yüksektir.
  • Bir cümlede en fazla iki boşluk bırakılmalı.
  • Başta ve sonda boşluk bırakılmamalı.
Doğru | YanlışAlt Düzey
Bilgi – Kavrama
H, U ve P -> Kolaydır.Yüksektir.
Objektiftir.
En yüksek olandır.

  • Düzeltme formülü kullanacaksın.
  • Açıklama istersin.
Yüksektir.
Güvenirliği ve Geçerliliği yüksek, sınav hazırlamak zordur.
  • Olumsuz soru kökü kullanmayacaksın.
  • Öğrenme eksikliği belirlenen(Formatif) değerlendirmede kullanılması önerilmez.
  • Bir öğretmen konuyu anlattıktan sonra ilke ve genellemeleri yoklayacaksa, önerme ya da yargıları yoklayacaksa, neden ve sonuç ilişkilerini yoklayacaksa kullanılır.
Eşleştirme TestiAlt Düzey
Bilgi – Kavrama
H, U ve P -> KolayYüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Cevaplar sorulardan fazla olmalıdır.
  • Sorular ve cevaplar tek boyutlu olmalıdır.
Yüksektir.
  • 5N – 1K -> Olgusal bilgileri yoklarız.
Çoktan Seçmeli Testi
(Bilişsel alanların sentez dışındaki diğer alanlarında ölçme yapmaya yarayan araçtır.)
Bilme – Kavrama – Uygulama – Analiz – Sentez – Değerlendirme

Daha çok Uygulama ve Analiz bazlı kullanılır.

Zorlarsak değerlendirme bile yaptırabilirsin.

Lakin Sentez yaptırılamaz.

H -> Zor ve uzmanlık gerektirir.

U ve P -> Kolay

Yüksektir.
Objektiftir.
Vardır.

  • Düzeltme formülü kullanacaksın.
  • Seçenek sayısını arttıracaksın.

Seçeneksiz sınavlarda şans başarısından bahsedemezsin.

En yüksek olandır.
  • Kalabalık gruplarda uygulanabilir.
  • Madde analizi yapılabilir.
  • Kritik ve önemli karar verilecekse çoktan seçmeli test kullanılmalıdır.
  • Soru kökünde ipucu olmayacak.
  • Bir soru diğerine cevap olmayacaktır.
  • Bir hikayeye en fazla 3 soru bağlanır, bağlanmalıdır.

Ek Bir Bilgi

Eğer bir öğretmen;

  • Her sene aynı soruları soruyorsa,
  • Soru kökünde ipucu veriyorsa,
  • Cevabı art arda aynı olan dört seçenek bulunduruyorsa,
  • Kopya çekebilmesine izin veriyorsa,
  • Şans başarısı varsa

öncelikle geçerliliği düşürür.

Geçerlik Türleri – Sonuçsal Geçerlilik

Bu geçerlilik türü, çağdaş değerlendirmeyle hayatımıza girmiştir.

Senin amacın öğrencilerin, problem çözme gücünü geliştireceksin, aynı zamanda öğrencilerin üst düzey düşünce becerilerini geliştireceksin, aynı zamanda yaşama yakın beceri kazandıracaksın.

  • Problem çözme gücü
  • Üst düzey düşünce becerisi
  • Yaşama yakın beceri

Bunlar tamamsa, Sonuçsal Geçerlik yüksektir.

Geçerlik Türleri – Görünüş Geçerliliği

Görünüş Geçerliliği, bir sınav hangi alanla ilgili hazırlanıyorsa o soruları görenler hem o alanı bilmeli hemde amacı görebilmelidir der.

Yani, matematik sınavı hazırladın diyelim.Öğrenci soruları gördüğünde şunları diyebilmelidir.

  • Bu bir matematik sorusudur.
  • İşçi havuz sorusudur.
  • vs. vs.

Öğrenci soruya baktığında bunları çıkarabiliyorsa, yani sınav hangi konudan olduğunu, amacının ne olduğunu çıkarabiliyorsa bu sınav amacını yansıtıyordur.

Görünüş Geçerliliğinde, ne ise öyle görülecektir!!!

Eğer bir matematik problemi içinde kimya terimleri var diye kimya sorusu gibi görünüyorsa bunun görünüş geçerliliği düşüktür.

Ek olarak, psikolojik testlerde düşük olsun istenir.

Geçerlik Türleri – Yapı Geçerliliği

Bir ölçme aracının ölçmek istediği kuramsal temeli, teorik yapıları tam olarak yansıtabilmesidir.

Evet biliyorum…Yukarıdaki açıklamadan bi b*k anlamadınız.O halde şöyle demekte fayda var.

Soruda ne demek istediğini anlamadıysanız, Yapı Geçerliliğini yapıştırınız.

Yapı geçerliliği bir teste puzzle gibi bakar.Yani bir puzzledaki mantık gibi sorular birbiriyle uyumlu olacak.Yani parçalar birbirini tamamlayacak.Anlamlı bir bütün olacak ve her bir parça o bütünü yansıtacak.

Yapı geçerliliğinde,

  • İç Tutarlılık önemlidir.
  • Amaca uygun olacak.
Yapı Geçerliliği

Yapı Geçerliliğinde sorular birbirleriyle uyumlu olacak ve bu sorular amacı yansıtacak.

  1. Sorular birbirleriyle uyumlu olacak.Yani bu sorular birbirini tamamlayacak ve anlamlı bir bütünü yansıtacak.
  2. Bu sorular amacı yansıtacak.
  • Daha çok psikolojik testlerde kullanılır.
  • Likert tipi(Derecelendirme Ölçeği) ölçeklerde aranır.
  • Bilişsel ve duyuşsal süreçlerin araştırıldığı durumlarda aranır.

Yapı geçerliliği bilen bilmeyen ayrımıyla ilgilenir.

Bir ölçme aracına sistematik hatanın girmesi en çok yapı geçerliliğini etkiler.

Yapı Geçerliliğini Belirleme Yöntemleri

  • Faktör Analizi
    Testi oluşturan alt boyutların yani özelliklerin uyumu aranır.
  • Uzman görüşü.
  • Bir ölçütle karşılaştırma.
  • Cevaplayıcılarla görüşme.
  • Farklı gruplar yöntemi.
  • Test Tekrar Test

Geçerlik Türleri – Ölçüt Geçerliliği(Uygunluk Geçerliliği – Yordama Geçerliliği)

Bir testin geçerliliğini araştırıyorsam ya bunu sonraki bir şeyle karşılaştırırım ya da bunu önceki bir şeyle karşılaştırırım mantığıyla hareket eden, saçma sapan gereksiz bi şey..

Ölçüt Geçerliliği

Eğer bir testi önceki ya da sonraki bir testle karşılaştırıyorsa ölçüt geçerliliğini araştırıyordur.

Sen eğer hazırladığın testi önceki bir şeyle karşılaştırıyorsan buradaki baktığın geçerlilik türü Uygunluk Geçerliliğidir.

 

Sen eğer hazırladığın testi sonraki bir şeyle karşılaştırıyorsan buradaki baktığın geçerlilik türü Yordama Geçerliliğidir.

Şimdi %100 geçerli olan süper bir pratik bilgi vereceğim sizlere.

Bir soruyu okuduğunda baktın ki öğretmen hazırladığı testi ya da aracı herhangi bir şeyle karşılaştırıyor.Uygunluk mu? Yordama mı?

Böyle bir soruda sorunun altına aşağıdaki gibi bir doğru çiz.

Ölçüt Geçerliliği Pratik

 

Örnek olarak,

Bir uzman öğrencilerin üniversite 1. sınıfda ki genel akademik notlarıyla YGS ‘de ki sınav puanlarını karşılaştırmıştır.Bu süreçte YGS sınavının geçerliliğini araştıran uzman falan filan… gibi bir soru üzerinde yukarıdaki pratiği uygulayalım…

Burada geçerliliği araştırılan durum YGS sınavı öyle değil mi?

Soruda anlaşıldığı üzere YGS’yi üniversite 1. sınıfta ki genel akademik notlarıyla karşılaştırıyorsa demek ki doğrumuzu aşağıdaki gibi çizeceğiz.

Ölçüt Geçerliliği Örnek

Soruda YGS sınavındaki puanlarıyla lisedeki notlarını karşılaştırdığını söyleseydi eğer,

Ölçüt Geçerliliği Örnek 2

Ölçüt Geçerliliği seçme sınavlarında önemlidir.

Bir soruda Yordama veya Uygunluğu işaretleyebilmen için kesinlikle bu adamın hazırladığı ölçme aracını bir şeyle karşılaştırması gerekiyor.Eğer bir karşılaştırma söz konusu değilse bu soruda Yordama ve Uygunluktan bahsedemezsin.

Geçerlik Türleri – Kapsam Geçerliliği

Kapsam Geçerliliği

Bir ölçme aracının ölçmek istediği kapsamı tam olarak yansıtıp yansıtmadığıyla ilgilenir.

Ölçme aracının ölçmek istediği konuları, hedef davranışları ya da özellikleri tam olarak örneklemesi ve temsil etmesidir.

  • Özellikler
  • Konular
  • Hedef – Davranışlar

Bunlar tam olarak temsil edilmek ya da tam olarak örneklenmek zorunda.

Örnek olarak, bir öğretmen 5 farklı üniteden sınav hazırlayacaktır.Bu sınavda A, B, C, D ve E ünitelerinden sorular sorulacak olsun.Öğretmenimiz A ve C ünitelerindeki soruların ayrıcılığını düşük bulmuş ve bu soruları testten çıkartmıştır.Eğer bu konular yerine başka soru yazmıyor ve B v D ünitelerinden ayrıcılıkları yüksek soruları teste ekliyorsa uygulanan bu durumda aşağıdaki gibi yorum yaparız.

Eğer bu öğretmen 5 farklı üniteden soru sorması gerekirken, keyfi olarak A ve C sorularını(ünitelerindeki) çıkarıyorsa, bunlar yerine soru yazmıyorsa buradaki kapsamı görmezden geldiği için bu adam kapsam geçerliliğini düşürmüştür.

Yok eğer bu herif, bu sorular yerine B ve D ünitelerinden sorular ekliyorsa bu durumda soruların çoğunluğu B ve D ünitelerinde olacağı için soruların benzerliği artıyordur.Buda iç tutarlılığı arttırır diyebiliriz.

Ünitelerdeki sorulan soruların hedef davranışları birbirine uygun olmalıdırlar.Yani bilişsel hedef alanları aynı olmalıdır.Örneğin, A ünitesinden sorulan sorulardan biri bilme ve diğeri uygulamaysa kapsam geçerliliği düşüktür.

Kapsam Geçerliliği Belirleme Yolları

  • Belirtke tablosu kullanmak.
  • Uzman görüşü almak.
  • Bir ölçütle karşılaştırmak.
    Kapsam Geçerliliği

    Örneğin,

    “Bir öğretmen hazırladığı testi aynı kapsam içeren daha önceden hazırlanmış ve geçerliliği kanıtlanmış bir testle bir öğrenci grubuna uygulamıştır” diye bir ifade görürseniz Paralel Test Yöntemiyle karıştırmayın.

    Paralel Test yönteminde uyguladığım testi aynı anda hazırlarım.Onların güvenirlik ve geçerlilik hakkında bilgim yoktur.

    Fakat soru vurgusunda “Bir öğretmen hazırladığı testi daha önceden hazırlanmış”, “Geçerliliği kanıtlanmış bir test” diyorsa Kapsam Geçerliliğidir.

Kapsam Geçerliliği Başarı Testlerine özeldir.Başarı testlerinde yüksek olması beklenir.