13 Noten Flashcards
Welche Befunde gibt es zum Gütekriterium “Objektivität” in Bezug auf Noten?
- Dieselbe Schülerinnenleistung wird teilweise von unterschiedlichen Lehrerinnen sehr unterschiedlich bewertet
- Typischerweise liegen die vergebenen Noten aber relativ eng beieinander
- Keine Unterschiede in der Beurteiler*innenübereinstimming in verschiedenen Fächern
Welche Ursachen gibt es für abweichende Beurteilungen (bei Noten)? Nenne mind. 5.
- Beobachtungsmängel (z.B. selektive Aufmerksamkeit)
- Erinnerungsfehler (z.B. letztes Ergebnis besonders präsent)
- Urteilstendenzen (z.B. Tendenz zu Strenge und Milde Unterschiede bei Lehrkräften)
- Fehlerhafte Ursachenzuschreibung (z.B. Begabungsmangel (Erklärung der Leistung))
- Erwartungseffekte (bestimmte SuS haben RuF, z.B. Pygmalion-Effekt)
- Kontrasteffekte
- Fehlerhafte Datenintegration (z.B. Fehler beim Punkte zusammenzählen)
- Sympathie/ Antipathie
- Subjektive Gewichtung einzelner Leistungsaspekte (wenn man zwischen 2 Noten ist)
Welche Befunde gibt es zum Gütekriterium “Reliabilität” in Bezug auf Noten?
- Hohe zeitliche Konsistenz von Noten im Schulalltag (r = .70)
- Für gemittelten Noten ergeben sich höhere Stabilitäten als für Fachnoten
- Durchschnittsnote in der 4. Klasse korreliert zu r = .78 mit dem Notendurchschnitt in Klasse 8
Welche Befunde gibt es zum Gütekriterium “Validität” in Bezug auf Noten?
- Fachnoten korrelieren stärker mit fachspezifischen (r = .6) als mit fachunspezifischen (z.B. Intelligenz) Leistungstests
- Noten korrelieren um r = .5 mit Maßen der Intelligent
- Gemittelten (Abitur-) Noten sagen den Studienerfolg gut voraus (r = .5)
- Haupt- und Realschulabschluss korrelieren mit Ausbildungsergebnissen zu r = .4
Sind Noten insgesamt so schlecht wie ihr Ruf?
Nein
Was ist die Definition von Zensierungsmodellen?
Ein Zensierungsmodell ist eine Funktion, die Schüler*innenleistungen einer Bezugsnorm Noten zuordnet
Was sind Input und Output bei Zensierungsmodellen? Welche Anforderungen gibt es an sie? (4)
- Input: z.B. Lösungsprozent, Punkte
- Output: Noten
- Anforderungen:
o Das Modell muss logisch eindeutig und begründbar sein
o Es sollte die Anzahl an relevanten Entscheidungen minimieren
o Es muss mit der gewählten Bezugsnorm verträglich sein
o Es muss konsistent verwendet werden
Welche 3 Skalen gibt es in Bezug auf Noten?
- lineare Skalen
- nicht-lineare Skalen
- partiell lineare Skalen
Sollte man eher lineare Skalen oder eher nicht-lineare Skalen verwenden?
-> lineare Skalen
Wie lautet die Formel bei Linearen Zensierungsmodellen?
Note = 6-5*(Pj/Pmax)
Pj: Punkte von Schüler*in j
Pmax: Maximale Punktzahl
Welche 3 Bereiche werden in einem partiell linearen Zensierungsmodell unterschieden?
- Oberhalb von Po
- Unterhalb von Pu
- Oberhalb von Pu
- Po: oberer Grenzwert, der der Note 1 entspricht
- Pu: unterer Grenzwert, der der Note 5 entspricht
Welche Note hat man oberhalb von Po?
Note 1
Wie berechnet man die Note oberhalb von Pu?
Note = 4 - ((Pj-Pu)/((Po-Pu)/3))
Wie berechnet man die Note unterhalb von Pu?
Note = 6 - (Pj/(Pu/2))
Wie sieht der Graph eines partiell linearen Zensierungsmodells aus?
Kombination von zwei linearen Zensierungsmodellen ober- und unterhalb von Pu
- Pmax =100
- Po = 95
- Pu = 50
Was sollte man bei Notenrechnern im Internet beachten?
Viele Rechner im Internet sind schlecht und nicht alle machen unbedingt das, was Sie haben wollen!
Warum ist eine Benotung nach sozialer Bezugsnorm bzw. nach Normalverteilung (grading unter the curve) nicht zugelassen?
- Die Leistung des einzelnen wird in Bezug zur Leistung der anderen SuS definiert
- Bewertung hängt von der Leistung der anderen ab
- Unterschätzung guter SuS in starken Klassen
o Würde dazu führen, dass man bei einer Klasse mit lauter Einsteins den schlechtesten 5% eine 6 geben würde, obwohl die Ergebnisse auch super sind, und in einer Klasse aus lauter Volldeppen den 5% besten Leistungen eine 1 geben würde
Welche formalen Vorgaben gibt es in Bezug auf Zensierungsmodelle?
- Bewertung sollte kriterial vorgenommen werden
- in manchen Bundesländern/Schulen gibt es Vorgaben für Mindest- und Maximalwert (z.B. 4 erst ab 50% richtig)
Wie lautet die Definition eines Indifferenzbereichs? (sog. das Konfidenzintervall bei Noten)
Der Indifferenzbereich ist eine rechnerische Abschätzung eines Intervalls um die geforderte Mindestkompetenz in dem die „unsicheren Fälle“ liegen
Je größer die Aufgabenzahl, desto kleiner oder größer ist der Messfehler?
Kleiner
Werden mittlere Noten oder Extremnoten sicherer beurteilt?
- Extremnoten werden sicherer beurteilt. Die Messfehler sind bei mittleren Noten am größten
Je breiter man den Bereich für eine bestimmte Note auf einer Skala anlegt, umso sicherer oder unsicherer kann diese Note beurteilt werden?
sicherer
Wann entstehen Bezugsgruppeneffekte und was ist die wichtigste Bezugsgruppe in der Schule?
Bezugsgruppeneffekte entstehen, wenn der Bewertungsprozess durch die Leistung einer Bezugsgruppe beeinflusst wird
Wichtigste Bezugsgruppe ist die Klasse, die besucht wird
Was ist das Problem bei der Klasse als Bezugsnorm?
Die Klasse ist keine unverzerrte Stichprobe aus einer Gesamtprobe
SuS in der gleichen Klasse sind sich typischerweise ähnlicher
Was ist der Big-fish-little-pond-Effekt?
o In starken Klassen erscheint eine durchschnittliche Leistung relativ schwach und wird deswegen schlechter bewertet
o In schwachen Klassen erscheint die gleiche Leistung stärker und wird deswegen besser bewertet
Wie nennt man es, wenn es eine negative Beziehung zwischen der Einzel- und der Gruppenleistung gibt
Kontrast-Effekte
Welchen Befund gibt es in Bezug auf SuS mit der gleichen objektiven Leistung im Abitur?
erhalten unterschiedliche Noten, abhängig von der Durchschnittsleistung einer Schule
Welche möglichen Moderatoren gibt es, die die Verzerrungen, die bei der Notengebung durch Kontrast-Effekt entsteht, beeinflussen können?
- Wissen und Erfahrung der Lehrkraft
- Allgemeine Fähigkeiten einer Lehrkraft (z.B. Beobachtungsgabe, Aufmerksamkeit)
- Motivation
- Vertrautheit einer Lehrkraft mit der Klasse
Richtig oder falsch:
Bezugsgruppeneffekte sind unabhängig von allgemeiner Lehrerfahrung
richtig -> passiert Profis genauso wie Anfänger*innen
Richtig oder falsch:
Wenn Lehrkräfte eine Klasse länger kennen, orientieren sie sich eher an allg. Leistungsstandards
falsch!
Wenn sie die Klasse besser kennen, können sie die relativen Fähigkeiten der SuS besser einschätzen und verwenden diese als zusätzliche soziale Bezugsnorm -> Problem
Welche Implikationen kann man in Bezug auf Noten und Bezugsgruppeneffekte ableiten? (2)
- Ein substanzieller Anteil von Studierenden über- oder unterschätzt wird
- Noten sind nur bedingt zwischen Gruppen mit unterschiedlichen Leistungsniveaus ver-gleichbar
Wirkt sich eine Unterschätzung günstig auf die Lernentwicklung aus?
nein! Führt zu Unterforderung
Welche globale Konsequenz hat es, wenn Lehrkräfte eine möglichst faire Benotung innerhalb einer Klasse realisieren wollen?
Führt zu Ungleichheiten zwischen den Klassen
Wie groß war 2018 der Anteil der SuS, die in der 9. Kl. mind. 1x sitzengeblieben sind?
18%
Wer hat bei gleicher Leistung eine höhere Wahrscheinlichkeit, sitzen zu bleiben?
Jungen, SuS mit niedrigem SES und SuS mit Migrationshintergrund
Wo ist das Sitzenbleiben bereits abgeschafft worden?
Hamburg, Berlin
Welche Pro-Argumente gibt es für das Sitzenbleiben?
- Schwache SuS können Lernstoff wiederholen und sind dadurch besser auf komplexere Lerninhalte vorbereiten
- Wiederholer*innen haben in versetzten Klassen einen Vorsprung -> wirkt sich günstig auf Motivation aus
- Maßnahmen, um Leistungsniveau der Klasse zu homogenisieren
Welche Kontra-Argumente gibt es gegen das Sitzenbleiben?
- Einfache Wiederholung des Lernstoffes führt noch nicht zu verbessertem Lernen
- Betrifft auch Lerninhalte von Fächern, die unproblematisch sind
- Wiederholer*innen werden aus Klassen und Peer Gruppen herausgerissen
- Motivationaler Rückschlag und Gefühl, versagt zu haben
- Zusätzlicher Stress durch gefährdete Versetzung, die sich negativ auf den Lernprozess auswirkt
- Hohe Kosten für Gesellschaft und Familie (ca. 2 Mrd. Euro jährlich)
Warum ist es schwierig, die Effektivität von Versetzungen zu untersuchen?
o Kann nicht experimentell untersucht werden
o Selbstselektion: Wiederholerinnen haben spezielle Eigenschaften (Leistungen, Motivation, SES etc.)
o Eigentlich kontrafaktischer Einzelvergleich notwendig: Wie hätte sich Schü-lerin X entwickelt, wenn er versetzt worden wäre -> geht nicht
Welche Ansätze gibt es um die Effektivität von Versetzungen zu untersuchen?
o Vergleich Wiederholerinnen mit versetzten SuS, die die gleichen Eigenschaften haben (Matching oder Kontrolle) -> gleiche Leistung, Motivation etc.
o Klassenvergleich: Vergleich mit neuen Mitschülerinnen nach wiederholtem Jahr
o Altersvergleich: Vergleich mit versetzten SuS der alten Klasse im nächsten Jahr
Welche zentralen Ergebnisse gibt es zur Effektivität von Versetzungen in Bezug auf die Leistung?
- Wiederholung führt nicht zu besserer Leistungsentwicklung
o Keine starken positiven oder negativen Effekte, durchschnittlich leichter Nachteil (d = -0,04)
o Wiederholer*innen zeigen keine vorteilhaftere Entwicklung
o Gegliedertes Schulsysteme (z.B. BRD) zeigen negativere Effekte.
o Kein Zusammenhang mit Zeitpunkt der Wiederholung (z.B. Primar- vs. Sekundarstufe)
Welche zentralen Ergebnisse gibt es zur Effektivität von Versetzungen in Bezug auf die Motivation und das Selbstkonzept?
o Effekte sind eher negativ (d = -0,4 bis -0,6)
o Peers werden erst nach ca. 2 Jahren eingeholt
o Selbstkonzept verbessert sich nicht durch Leistungsvorsprung
o Motivationale Einbußen gehen der Wiederholung voraus, d.h. die Versetzungsgefährdung hat keine aktivierende Wirkung
Klausurfrage: Nennen Sie zwei Gründe, warum es problematisch ist bei Schulnoten innerhalb einer Klasse von einer Normalverteilung auszugehen
- Bewertung hängt von der Leistung der anderen ab.
- Unterschätzung guter Schüler:innen in starken Klassen