Teil 4 - Informelle und formelle Schulleistungstests Flashcards
Schulleistungstests
Ingenkamp
Definition Schulleistungstests von Ingenkamp:
Schulleistungstests sind Verfahren, mit deren Hilfe Ergebnisse
geplanter und an Curricula orientierter Lernvorgänge möglichst
objektiv, zuverlässig und gültig gemessen und durch Lehrende oder
Beratende ausgewertet, interpretiert und für pädagogisches Handeln
nutzbar gemacht werden können.
- Formelle Leistungstests: von Experten entwickelte Tests: PISA; VERA
- Informelle Leistungstests: von Lehrkräften nach festen Aufbaukriterien konzipiert
- Informelle Tests: von Lehrkräften entwickelte Tests, orientier am Lehrstoff, zur Überprüfung des Leistungsstandes meist einer Klasse
Problemfall informeller Schulleistungstest
- Unterscheidet sich vom formellen Schulleistungstest “vor allem die Art der
Konstruktion der Testaufgabe. Eine Klassenarbeit gilt eher als ein informeller
Test, weil die Aufwendungen zur Konstruktion eher gering sind. Ein formeller
Test ist dagegen nur dann zu realisieren, wenn eine Reihe von
Konstruktions-schritten durchgeführt wurde und die sogenannten
Gütekriterien erfüllt sind”. (Jäger 2001) - „…ein sorgfältig entwickelter informeller Test hat mehr Gemeinsamkeiten mit
den formellen Testverfahren als mit Lehrerurteilen und anderen
“subjektiven” Verfahren (Gaude und Teaschner, 1970) - „ Informelle Tests dagegen sind für bestimmte Testzwecke ad hoc
zusammengestellte Instrumente. Sie sind zwar nicht geeicht, können aber
dennoch auf einer Testtheorie basieren und müssen nicht notwendig reduzierten Güteransprüchen entsprechen (Leutner)
Formelle Schulleistungstests
- Ziel: Ergebnis am Ende eines Kurses,
Lehrgangs, Schuljahrs etc. - Erstellung zentral
- Lernstoff eines Unterrichtszyklus
- kein Bezug auf eine bestimmte und
begrenzte Gruppe - Gütekriterien
- offizielle Bewertungskriterien
- objektive Aussagen über Wissen und
Können der Getesteten - Vorbereitung und terminliche
Festlegung
Zur Platzierung geeignet:
Orientiert an der Sozialnorm (a) oder kriterialen Norm (b):
a) Sozialnorm: Leistungen von Schülern werden mit den Leistungen einer großen
repräsentativen Stichprobe verglichen
(wie gut ist Schüler A verglichen mit allen
Schülern seines Jahrgangs) z.B:.
Jahrgangsstufentests, PISA, IGLU.
b) Kriteriale Norm: Wie gut ist der Schüler in
Bezug auf eine Kriterium. (Hat der
Schüler das Leistungsziel erreicht,
dichotom)
informelle Tests
- Ziel: Feststellung des Lernfortschritts
im Laufe des Unterrichts - Erstellung durch Lehrende bei Bedarf
- Bezogen auf begrenzten Lernstoff
- Bezug auf eine bestimmte, begrenzte
Gruppe - keine Gütekriterien
- keine offiziellen Bewertungskriterien
- nur subjektive Aussagen bezogen auf
Gruppe und Unterrichtssituation - Durchführung ohne besondere Vorbereitung und nach Bedarf
Zur Platzierung ungeeignet;
Orientiert an der kriterialen Norm; Leistungen der Schüler werden
mit dem Inhalt des Curikulums
verglichen.(Beherrscht Schüler A
die Bruchrechnung) z.B. Proben,
Schulaufgaben, Exen.
Konstrukt formeller Schulleistungstests
1.Analyse der Lehrpläne
2.Entwurf von Testitems (Aufgaben)
-Konstruktion von 50-100% mehr Aufgaben als für Endfrom nötig
-Beurteilung der Aufgaben durch erfahrene LehrerInnen (EspertInnenratings)
3.Verprobung an wenigen Fällen
-Überprüfung der Verständlichkeit der Aufgabenformulierung
4. Testdurchführung an einer ersten Stichprobe (200 – 400 SS)
5. Aufgaben- und Testanalyse mit den Daten der ersten Stichprobe.
- Ermittlung der Aufgabenschwierigkeit
- Trennschärfenberechnung
- Erste Reliabilitätsschätzung
6. Testvalidierung an kleineren Stichproben
7. Testeichung und Validierung an einer repräsentativen Stichprobe
- Berechnung von Normwerten (Wie viele von den Aufgaben können die Schüler lösen?-> Mittelwerte aufstellen)
Einsatzmöglichkeiten formeller sozialnormorientierter Schulleistungstests in der Schule
- Vergleich des Leistungstandes der Klass mit der Eichstichprobe
- Überprüfung des eigenen Benotungssystems durch den Vergleich mit den Testwertklassen
- Einteilung nach Leistungsgruppen
- Als Ersatz für Klassenarbeiten
Vor- und Nachteile von formellen Schulleistungstest
Vorteile:
* Erfüllung der Gütekriterien
* Gerechtere Selektion
* erlaubt Überprüfung des eigenen Benotungssystems
* Hilfe bei der Entdeckung individueller Schwächen und Stärken
Nachteile:
* Negative motivationale Folgen (bes. für leistungsschwache Schüler)
* Erstarrung des Unterrichts und Verarmung der Lehrpläne
* Haufig veraltet
* Unfair bei mangelnder Lerngelegenheit
Grundsätzlich bei der Auswahl von Tests zu beachten:
- Gütekriterien
- Normierung aktuell
- Ausreichend große Eichstichprobe
- Aktualität des Materials
- Durchführungsdauer / Ökonom
Konstruktion von informellen Tests (Wilson)
1. Konstrukt: Was wird gemessen?
- Lehrziele:
- Viele Synonyme wie z.B. Instruktionsziele, Lernziele usw …
- Hier: Lehrziele, da es zunächst um Ziele geht, die Sie als Lehrende setzen und deren Erreichung Sie überprüfen
- Umschreibungen von bestimmten Persönlichkeitseigenschaften (Fähigkeiten, Fertigkeiten, Neigungen, Gesinnungen, Haltungen), die es bei einem Schüler zu verwirklichen gilt
Lehrziele sind relevant:
- weil Sie den Unterricht danach ausrichten können.
- um „an der Schule mittelbar und unmittelbar Beteiligten“
(SchülerInnen, Eltern,…) zu kommunizieren, was gelehrt werden soll. - um eine konkrete Basis für die Leistungsüberprüfung bei
Schüler/Innen zu haben
Dazu muss man wissen:
* was die SchülerInnen lernen sollen (Inhalte),
* welche Schüleraktivitäten zeigen, dass gelernt wurde,
* welche Aufgaben / Methoden sich am besten eignen, um eine
bestimmte Lernleistung von SchülerInnen zu erfassen und zu
bewerten
Probleme von Lehrzielen
Oft zu vage formuliert: Lehrziel sei „Verstehen“ oder
„Beherrschen“ eines Stoffes … aber:
- was genau bedeutet das?
- wann genau habe ich z.B. etwas verstanden?
Lehrziele = hypothetische, nicht beobachtbare Konstrukte.
Sie müssen spezifizieren, wann genau welches Verhalten der Schüler/Innen Rückschlüsse auf „Kenntnis“, „Verständnis“ etc. zulässt = Operationalisierung der Konstrukte
Lernzieltaxonomie
Klassifikation zur Unterteilung von Lehrzielen (Bloom):
Bewerten (Evaluation):
Halten Sie die Umweltpolitik der aktuellen Regierung für sinnvoll?
Synthese (Synthesis):
Pflanzen können sich nur ernähren wenn sie gerade gewachsen sind. Wie lässt
sich diese Aussage beweisen?
Analyse (Analysis):
Wenn eine Pflanze wenig Wasser verdunsten kann….
a) Wächst sie langsamer,
b) erzeugt sie mehr Nährstoffe,
c) bildet sich die Wurzel besser aus
Anwendung (Application):
Welche Folgen haben Entlaubungsmittel für eine Pflanze?
Verstehen (Comprehension):
Warum gedeihen Pflanzen auf verschiedenen Böden unterschiedlich gut?
Wissen (Knowledge):
Nennen Sie die verschiedenen Bestandteile einer Pflanz
Die Aufgaben: Wie wird gemessen?
Konstruktion von informellen Schulleistungstests
Informelle Tests lassen sich unterteilen in…
* Performanzaufgaben
* Langantwort (offene Aufgaben): Kurzaufsätze und Essays
* Kurzantwort: (frei; gebunden: richtig/falsch, Mehrfachwahl, Zuordnung)
Performanzaufgaben
Vor- und Nachteile
„Show how“ statt „Know how“: nicht zeigen, was man weiß, sondern
tun, was man weiß (INGENKAMP & LISSMANN)
Vorteile:
* für einige Fertigkeiten (Musikinstrumente etc) alternativlos
* hohe ökologische Validität
* höhere kognitive Lehrziele können erfasst werden
Nachteile:
* zeitaufwendig in Konstruktion, Durchführung und Auswertung
* Erstellung von Bewertungskriterien oft nicht einfach
* (Auswerungs-) Objektivität gering
Langantwort
Vor- und Nachteile
Beispiel:
freie Gestaltung: Sind Multiple Choice Aufgaben ihrer Meinung nach geeignet, um Verständnis zu erfassen? Begründen Sie kurz (max. 5 Sätze) Ihre Antwort.
freie Assoziation/Brainstorming:Schreiben Sie die Namen möglichst vieler Bands auf, die mit “P” beginnen
Kreativität: Wie könnten Sie bei der Klausur “spicken”? Überlegen sie sich originelle Antworten
Vorteile:
* Höhere kognitive Prozesse (Analyse, Synthese) und kreativer testen
* Kein Raten möglich
* Qualitative Auswertung möglich
* geringer Aufwand beim Vorbereiten/Erstellen der Aufgaben
Nachteile:
* Hoher Zeit- und Arbeitsaufwand beim Bewerten
* Reliabilität und Objektivität unter Umständen sehr gering
* Geringe Anzahl von Inhaltsbereichen und Messungen pro Testzeitpunkt realisierbar
* (Un)bewusster Einfluss durch Orthografie/Handschrift