- Tanılayıcı Dallanmış Ağaç
- Doğru yanlış testlerine alternatiftir.
- Sorular birbiriyle bağlantılıdır ve bir konu derinlemesine ayrıntılandırılır.Yani sorular genelden özele hazırlanır.Ya da temelden ayrıntıya hazırlanır.Ya da basitten karmaşığa hazırlanır.
- Şans başarısı oldukça düşüktür.
- Öğrenme eksikliği belirlenebilir.(Formatif)
- Yapılandırılmış Grid(Izgara)
- Çoktan seçmeli testlere ve eş seçtirme testlerine alternatiftir.
- Şans başarısı yok denecek kadar azdır.
Çünkü;
seçenek sayısı fazla,
bir sorunun birden fazla cevabı,
bir cevap birden fazla soruya yanıt olabilir. - Öğrenme eksikliğini belirleyebiliriz.
- Daha çok fen ve teknoloji ve ingilizce derslerinde kullanılır.
- Kelime İlişkilendirme Testi
- Temel kavram verirsin ve 3’er saniye içinde bu temel kavramın öğrenci zihninde yaptığı çağrışımlara bakarsın.
- Anlamlı öğrenmeyi sağlar.
- Poster
- Verilen hedef davranış ya da kazanım ile ilgili renkli ve resimli etkinlik yapacaklar, poster hazırlayacaklar ve sunacaklar.
- Amaç, öğrencilerin üst düzey düşünme becerilerini geliştirmekse(yaratıcılık) ve sunum yaptıracak sözlü iletişim becerileri geliştirmek.
- Proje
- Her proje bir performans görevidir.
- Her performans ödevi bir proje değildir.
- Jurnaller
- Bir öğrenci bir soruyu çözerken, neler düşündüğünü, neden o yolu izlediğini, neden o yoldan gittiğini ayrıntılı olarak anlatmasını istersiniz.
- Neler düşündüğü,
- Neden o yolu izlediğini,
- Neden o yoldan gittiğini
- Anektodlar
- Öğretmenlerin tuttukları günlüklerdir.
- En önemli durumu, Anektod yazarı tarafsız ve objektif davranmak zorundadır.
Kategori arşivi: Ölçme ve Değerlendirme
Puanlama Araçları
Çağdaş ölçme araçlarının çoğunun puanlama güvenirliği düşüktür.Bu puanlama güvenirliği arttırmak için belli başlı puanlama araçları kullanacağız.
Kontrol Listesi
- En basit ölçektir.
- Eğer senin amacın performans değerlendirme sürecinde belli başlı davranışları, belli sırada yapılıp yapılmadığını kontrol etmekse kullanılan ölçüt kontrol listesidir.
- Bize belli başlı davranışların yapılıp yapılmadığını yani var ya da yok olduğunu verir.
- Davranışın düzeyini vermez.İyi mi yapıyor?Kötü mü yapıyor?Orta düzey de mi yapıyor bilemezsin.
- Davranışlar arası hiyerarşi vardır.Yani davranışları hangi sıra ile yapılacağını kontrol listesi gösterir.
- Öğretim amaçlıda kullanılır.
- Bireyin davranışlarından kaç tanesine sahip olduğu bilgisine cevap verir.
Süreç + Sonuç ölçmede etkilidir.
Daha çok süreç ölçmede etkilidir.
Derecelendirme Ölçeği
- Bir uygulama sırasında yapılması gereken davranışların varlığından yokluğundan ziyade birey o davranışa iyi mi sahip? kötü mü sahip? bilgisini verir.
- Davranış düzeyi hakkında bilgi verir.(İyi – Kötü – Orta)
- Bireyin davranışlardan kaç tanesine sahip iyi mi sahip, kötü mü sahip yorum yapabiliriz.
Süreç + Sonuç ölçmede etkilidir.
Daha çok sonuç ölçmede etkilidir.
Rubrik(Dereceli Puanlama Anahtarı)
Bir öğrenciye performans görevi verildiğinde yanında verilen ve öğrenciye ne yaparsa ne kadar puan alacağını gösteren ölçek.
Performans görevi varsa yanında Rubrik verilmelidir.
- Değerlendirme sürecindeki belirsizliği giderir.
- Motivasyonu arttırır.
- Kendi öğrenme sorumluluğunu öğrenciye verir.
- En önemli faydası puanlamada objektifliği sağlar.
- Rubriklerde hazırlanan puanlamada kullanılan ölçütler mutlak olmalıdır.Değiştirilemez.
- Değerlendirme aşamasında(puanlama sırasında) öğrencilerin ilgi, ihtiyaç ve gelişimleri göz önüne alınmaz.
- Daha çok psikomotor becerilerin puanlanmasında kullanılır.Bilişsel, duyuşsal durumlarda da kullanılabilir.
Analitik Rubrik
Bir performans değerlendirme sürecinde yapılan performansın her bir adımı ayrıntılı olarak puanlanıyorsa analitiktir.
Her bir adım ayrıntılı olarak puanlanıyorsa analitiktir.
Daha çok süreç ölçmede etkilidir.
Holistik(Bütüncül) Rubrik
Her bir adım ayrıntılı olarak puanlanmaz.
Belli başlı adımlar + oluşturulan bütün puanlanır.
Daha çok sonuç ölçmede etkilidir.
Çağdaş Ölçme Araçları
Tamamlayıcı, Süreç Temelli, Tümel, Otantik, Uzlaştırıcı, Eklektik yaklaşım…
Portfolyo(Öğrenci Ürün/Seçki/Gelişim Dosyası)
Belli bir dönemde(1 yıl/1 dönem) yapılan öğrenci çalışmalarının toplandığı dosyadır.
Amaç, süreçteki gelişimi belgelerle izlemektir.
Faydaları;
- Öğrencilerin çok yönlü gelişimini(Psikomotor, Duyuşsal, Bilişsel) sağlar.
- Gelecekteki öğretmenlere ve kurumlara öğrenci hakkında bilgi sağlar.Yani Arşiv niteliği vardır.
- Değerlendirme sürecinde öğretmene alternatif sağlar.
- Otantik değerlendirmeyi sağlar.Otantikten kasıt, yaşama yakın veya günlük hayattan beceridir.
- Öğretmen + Öğrenci + Veli değerlendirme sürecine dahildir.
- Üst düzey düşünme becerilerini geliştirir.
Dezavantajları;
- Öğrenme eksikliği belirlenemez.
- Rekabet yoktur.Başarı karşılaştırması yoktur.
- Bireysel ölçüt geliştirmek zordur.Çünkü gerekli.En önemli sınırlılığıdır.
- Puanlama güvenirliği düşüktür.
- Maliyetli ve zaman alıcıdır.Kullanışlı değil.
Performans Değerlendirme(Performans Görevi)
Öğrenciye bir performans görevi verilir.Hem süreç hemde sonuçtaki ürün değerlendirilir.
Amaç, anında dönüt düzeltme vermektir.
Faydaları;
- Daha çok psikomotor beceri ölçülür.Tabi ki de bilişsel ve duyuşsalda ölçülür.
- Yaparak – Yaşayarak öğrenmeyi sağlar.Aktif öğrenmeyi sağlar.
- Otantik değerlendirmeyi sağlar.
- Üst düzey düşünme becerisi geliştirir.
- Hem grupla hemde bireysel değerlendirilebilir.
Portfolyo’da yapamadığımız öğrenme eksikliğini burada belirleyebiliriz.
Dezavantajları;
- Puanlama güvenirliği düşüktür.
Bir yerde performans değerlendirmesi(görevi) varsa bunun puanlama güvenirliğini arttırmak için yanında Rubrik(Dereceli Puanlama) anahtarı verilmelidir.Zaten Rubrik kullanmıyorsa bu performans görevinin puanlama güvenirliği kesinlikle düşüktür.
Bir soruda performans görevi diyebilmek için bu süreçte öğrencilerin şu yaptıklarına dikkat çekmek gerekir.
Öğrencilerin; Uygulamalar, İncelemeler ya da Araştırmalar yaptığını söylüyorsa performans değerlendirmedir.
Öz Değerlendirme
Amaç, öğrenci kendi çalışmalarını değerlendirsin.Öğrenci kendi güçlü ve zayıf yanlarını görsün ve kendini tanısın.
Metabilişsel düşünmeyi sağlar.
Yaşam boyu öğrenmeyi sağlar.
Değerlendirme kültürünü oluşturur.
Puanlama güvenirliği düşüktür.
Akran Değerlendirme
Birbirinin yaptıkları çalışmaları değerlendirmek.
Amaç, olumlu ve yapıcı eleştiri yapmayı geliştirme ve eleştiriye açık olma.
Demokrasi bilinci gelişmiştir.
Değerlendirme kültürünü oluşturur.
Puanlama güvenirliği düşüktür.
Klasik(Geleneksel) Ölçme Değerlendirme Araçları
Bilgi Düzeyi (Bloom Taksonomisi) | Hazırlama Uygulama Puanlama | Puanlama Güvenirliği | Şans Başarısı | Güvenirlik ve Geçerlik (Soru Sayısı, Kapsam Geçerliliği ve Duyarlılığı gösterir. Puanlama Güvenirliğine bakacaksın.Puanlama Güvenirliği Objektifliği hakkında bilgi verir.) | Özellikler | |
Yazılı Yoklamalar | Üst Düzey Sentez – Değerlendirme hedef alanları ölçülür. | H -> Kolay U -> Kolay P -> Zor ve zaman alıcı. | Düşüktür. Subjektif testtir. En büyük dezavantajı budur. | Yoktur. Şişirme ve blöf yeteneği vardır. | Güvenirlik ve Geçerlilik düşüktür. Soru sayısı düşüktür.Bu yüzden Kapsam Geçerliliği ve Duyarlılık düşüktür. Puanlama Güvenirliği düşüktür. |
|
Sözlü Yoklamalar | Üst Düzey Sentez – Değerlendirme | H, U ve P -> Zor ve zaman alıcı.Çünkü herkese eş güçlükte soru hazırlanması gerekiyor. | Düşüktür. Subjektiftir. | Yoktur. Sözlü iletişim becerisi vardır. | Düşüktür. Soru sayısı azdır.Buda Kapsam Geçerliliğini ve Duyarlılığı düşürür. Puanlama Güvenirliği düşüktür. |
|
Kısa Cevaplı – Boşluk Doldurma | Alt Düzey Bilgi – Kavrama | H, U ve P -> Kolaydır. | Yüksektir. Yarı objektiftir. Nispeten nesneldir. | Yoktur. Ezber ve hatırlama yeteneği iyi olanlar başarılı olur. En büyük dezavantajıdır. | Yüksektir. Soru sayısı fazla olması Kapsam Geçerliliğini ve Duyarlılığı arttırır.Puanlama Güvenirliği yüksektir. |
|
Doğru | Yanlış | Alt Düzey Bilgi – Kavrama | H, U ve P -> Kolaydır. | Yüksektir. Objektiftir. | En yüksek olandır.
| Yüksektir. Güvenirliği ve Geçerliliği yüksek, sınav hazırlamak zordur. |
|
Eşleştirme Testi | Alt Düzey Bilgi – Kavrama | H, U ve P -> Kolay | Yüksektir. Objektiftir. | Vardır.
| Yüksektir. |
|
Çoktan Seçmeli Testi (Bilişsel alanların sentez dışındaki diğer alanlarında ölçme yapmaya yarayan araçtır.) | Bilme – Kavrama – Uygulama – Analiz – Daha çok Uygulama ve Analiz bazlı kullanılır. Zorlarsak değerlendirme bile yaptırabilirsin. Lakin Sentez yaptırılamaz. | H -> Zor ve uzmanlık gerektirir. U ve P -> Kolay | Yüksektir. Objektiftir. | Vardır.
Seçeneksiz sınavlarda şans başarısından bahsedemezsin. | En yüksek olandır. |
|
Ek Bir Bilgi
Eğer bir öğretmen;
- Her sene aynı soruları soruyorsa,
- Soru kökünde ipucu veriyorsa,
- Cevabı art arda aynı olan dört seçenek bulunduruyorsa,
- Kopya çekebilmesine izin veriyorsa,
- Şans başarısı varsa
öncelikle geçerliliği düşürür.
Geçerlik Türleri – Sonuçsal Geçerlilik
Bu geçerlilik türü, çağdaş değerlendirmeyle hayatımıza girmiştir.
Senin amacın öğrencilerin, problem çözme gücünü geliştireceksin, aynı zamanda öğrencilerin üst düzey düşünce becerilerini geliştireceksin, aynı zamanda yaşama yakın beceri kazandıracaksın.
- Problem çözme gücü
- Üst düzey düşünce becerisi
- Yaşama yakın beceri
Bunlar tamamsa, Sonuçsal Geçerlik yüksektir.
Geçerlik Türleri – Görünüş Geçerliliği
Görünüş Geçerliliği, bir sınav hangi alanla ilgili hazırlanıyorsa o soruları görenler hem o alanı bilmeli hemde amacı görebilmelidir der.
Yani, matematik sınavı hazırladın diyelim.Öğrenci soruları gördüğünde şunları diyebilmelidir.
- Bu bir matematik sorusudur.
- İşçi havuz sorusudur.
- vs. vs.
Öğrenci soruya baktığında bunları çıkarabiliyorsa, yani sınav hangi konudan olduğunu, amacının ne olduğunu çıkarabiliyorsa bu sınav amacını yansıtıyordur.
Görünüş Geçerliliğinde, ne ise öyle görülecektir!!!
Eğer bir matematik problemi içinde kimya terimleri var diye kimya sorusu gibi görünüyorsa bunun görünüş geçerliliği düşüktür.
Ek olarak, psikolojik testlerde düşük olsun istenir.
Geçerlik Türleri – Yapı Geçerliliği
Bir ölçme aracının ölçmek istediği kuramsal temeli, teorik yapıları tam olarak yansıtabilmesidir.
Evet biliyorum…Yukarıdaki açıklamadan bi b*k anlamadınız.O halde şöyle demekte fayda var.
Soruda ne demek istediğini anlamadıysanız, Yapı Geçerliliğini yapıştırınız.
Yapı geçerliliği bir teste puzzle gibi bakar.Yani bir puzzledaki mantık gibi sorular birbiriyle uyumlu olacak.Yani parçalar birbirini tamamlayacak.Anlamlı bir bütün olacak ve her bir parça o bütünü yansıtacak.
Yapı geçerliliğinde,
- İç Tutarlılık önemlidir.
- Amaca uygun olacak.
- Sorular birbirleriyle uyumlu olacak.Yani bu sorular birbirini tamamlayacak ve anlamlı bir bütünü yansıtacak.
- Bu sorular amacı yansıtacak.
- Daha çok psikolojik testlerde kullanılır.
- Likert tipi(Derecelendirme Ölçeği) ölçeklerde aranır.
- Bilişsel ve duyuşsal süreçlerin araştırıldığı durumlarda aranır.
Yapı geçerliliği bilen bilmeyen ayrımıyla ilgilenir.
Bir ölçme aracına sistematik hatanın girmesi en çok yapı geçerliliğini etkiler.
Yapı Geçerliliğini Belirleme Yöntemleri
- Faktör Analizi
Testi oluşturan alt boyutların yani özelliklerin uyumu aranır. - Uzman görüşü.
- Bir ölçütle karşılaştırma.
- Cevaplayıcılarla görüşme.
- Farklı gruplar yöntemi.
- Test Tekrar Test
Geçerlik Türleri – Ölçüt Geçerliliği(Uygunluk Geçerliliği – Yordama Geçerliliği)
Bir testin geçerliliğini araştırıyorsam ya bunu sonraki bir şeyle karşılaştırırım ya da bunu önceki bir şeyle karşılaştırırım mantığıyla hareket eden, saçma sapan gereksiz bi şey..
Sen eğer hazırladığın testi önceki bir şeyle karşılaştırıyorsan buradaki baktığın geçerlilik türü Uygunluk Geçerliliğidir.
Sen eğer hazırladığın testi sonraki bir şeyle karşılaştırıyorsan buradaki baktığın geçerlilik türü Yordama Geçerliliğidir.
Şimdi %100 geçerli olan süper bir pratik bilgi vereceğim sizlere.
Bir soruyu okuduğunda baktın ki öğretmen hazırladığı testi ya da aracı herhangi bir şeyle karşılaştırıyor.Uygunluk mu? Yordama mı?
Böyle bir soruda sorunun altına aşağıdaki gibi bir doğru çiz.
Örnek olarak,
Bir uzman öğrencilerin üniversite 1. sınıfda ki genel akademik notlarıyla YGS ‘de ki sınav puanlarını karşılaştırmıştır.Bu süreçte YGS sınavının geçerliliğini araştıran uzman falan filan… gibi bir soru üzerinde yukarıdaki pratiği uygulayalım…
Burada geçerliliği araştırılan durum YGS sınavı öyle değil mi?
Soruda anlaşıldığı üzere YGS’yi üniversite 1. sınıfta ki genel akademik notlarıyla karşılaştırıyorsa demek ki doğrumuzu aşağıdaki gibi çizeceğiz.
Soruda YGS sınavındaki puanlarıyla lisedeki notlarını karşılaştırdığını söyleseydi eğer,
Ölçüt Geçerliliği seçme sınavlarında önemlidir.
Bir soruda Yordama veya Uygunluğu işaretleyebilmen için kesinlikle bu adamın hazırladığı ölçme aracını bir şeyle karşılaştırması gerekiyor.Eğer bir karşılaştırma söz konusu değilse bu soruda Yordama ve Uygunluktan bahsedemezsin.
Geçerlik Türleri – Kapsam Geçerliliği
Kapsam Geçerliliği
Bir ölçme aracının ölçmek istediği kapsamı tam olarak yansıtıp yansıtmadığıyla ilgilenir.
Ölçme aracının ölçmek istediği konuları, hedef davranışları ya da özellikleri tam olarak örneklemesi ve temsil etmesidir.
- Özellikler
- Konular
- Hedef – Davranışlar
Bunlar tam olarak temsil edilmek ya da tam olarak örneklenmek zorunda.
Örnek olarak, bir öğretmen 5 farklı üniteden sınav hazırlayacaktır.Bu sınavda A, B, C, D ve E ünitelerinden sorular sorulacak olsun.Öğretmenimiz A ve C ünitelerindeki soruların ayrıcılığını düşük bulmuş ve bu soruları testten çıkartmıştır.Eğer bu konular yerine başka soru yazmıyor ve B v D ünitelerinden ayrıcılıkları yüksek soruları teste ekliyorsa uygulanan bu durumda aşağıdaki gibi yorum yaparız.
Eğer bu öğretmen 5 farklı üniteden soru sorması gerekirken, keyfi olarak A ve C sorularını(ünitelerindeki) çıkarıyorsa, bunlar yerine soru yazmıyorsa buradaki kapsamı görmezden geldiği için bu adam kapsam geçerliliğini düşürmüştür.
Yok eğer bu herif, bu sorular yerine B ve D ünitelerinden sorular ekliyorsa bu durumda soruların çoğunluğu B ve D ünitelerinde olacağı için soruların benzerliği artıyordur.Buda iç tutarlılığı arttırır diyebiliriz.
Ünitelerdeki sorulan soruların hedef davranışları birbirine uygun olmalıdırlar.Yani bilişsel hedef alanları aynı olmalıdır.Örneğin, A ünitesinden sorulan sorulardan biri bilme ve diğeri uygulamaysa kapsam geçerliliği düşüktür.
Kapsam Geçerliliği Belirleme Yolları
- Belirtke tablosu kullanmak.
- Uzman görüşü almak.
- Bir ölçütle karşılaştırmak.
Örneğin,“Bir öğretmen hazırladığı testi aynı kapsam içeren daha önceden hazırlanmış ve geçerliliği kanıtlanmış bir testle bir öğrenci grubuna uygulamıştır” diye bir ifade görürseniz Paralel Test Yöntemiyle karıştırmayın.
Paralel Test yönteminde uyguladığım testi aynı anda hazırlarım.Onların güvenirlik ve geçerlilik hakkında bilgim yoktur.
Fakat soru vurgusunda “Bir öğretmen hazırladığı testi daha önceden hazırlanmış”, “Geçerliliği kanıtlanmış bir test” diyorsa Kapsam Geçerliliğidir.
Kapsam Geçerliliği Başarı Testlerine özeldir.Başarı testlerinde yüksek olması beklenir.