DE: Grundlagen & Gütekriterien Flashcards

1
Q

Ziele von Diagnostik & Evaluation

A
  • Diagnose von Stärken und Schwächen der SuS
  • Planung & Verbesserung des Unterrichts
  • Evaluation von Leistung: Platzierung und Selektion
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Platzierung vs Selektion

A
  • Platzierung: für alle Bewerber:innen gibt es einen Platz
  • Selektion: x freie Plätze => Suche nach den x geeignetsten Bewerber:innen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Arten von Diagnostik

A
  • standardisiert vs. nicht-standardisiert
  • norm- vs kriteriumsorientiert: Orientierung an Bezugsgruppe (Eichstichprobe) vs. Orientierung an Punktskala (Unabhängig von der Verteilung in der Bezugsgruppe)
  • Individual- vs. Umweltdiagnostik: einzelne Person vs. soziale Gruppe
  • Status- vs. Prozessdiagnostik
  • Schulleistungsdiagnostik
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Funktionen von Schulleistungsdiagnostik

A
  • Didaktische Funktion: Überprüfung unterrichtlicher Maßnahmen, Bewertung des Unterrichtserfolge => Feedback für LK
  • Evaluative Funktion: Orientierung über Schulleistung => Feedback für SuS/Eltern
  • Entscheidungsfunktion: Schullaufbahnberatung => äußere/ innere Differenzierung im Schulsystem
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Diagnostizieren als Prozess

A

1. Problem/Anlass (“Profitiert Anna von meinem Unterricht?”
2. Ziel/Fragestellung (Ziel: Messung der indiv. Schulleistung)
3. Hypothesenbildung (“Durch den Unterricht erwirbt Anna neue Kentnisse”)
4. Methodenauswahl und -anwendung (Gespräch, Beobacktung, Test)
5. Hypothesenprüfung/ Interpretation der Ergebnisse
6. Diagnostisches Urteil
7. Gutachten bzw. Intervention/Beratung

Bei Schritt 4 & 5 sind messtheortische Grundlagen einzuhalten!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Klassische Testtheorie

A

Grundlage für die Konstruktion & Interpretation jedes psychologischen Tests!

1. Axiom: X = W(T) + e ; die beobachteten testwerte setzen sich immer aus dem wahren Wert des Merkmals W(T) und einem zufällig verteilten Messfehler e zusammen
2. Axiom: erwarteter Mittelwert des Messfehlers ist 0; Korrelation des Messfehlers mit dem Test ist 0
3. Axiom: Messfehler bei versch. Personen sind unkorreliert; je häufiger man misst, desto näher kommt man dem wahren Wert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Gütekriterien

A
  • Objektivität
    => Durchführung
    => Auswertung
    => Interpretation
  • Reliabilität
    => Restestrel.
    => Split - Half - Rel.
    => Paralleltestrel.
    => Konsistenz-Analyse
  • Validität
    => Inhaltsvalidität
    => Empirische Val.
    => Konstruktval.
    => Kriteriumsval.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Objektivität

A

= Grad, in dem Ergebnisse eines Tests unabhängig vom Untersucher sind

Objektivität ist (wie Reliabilität) ein formales Kriterium, es sagt nichts über den Inhalt aus!

Ohne Objektivität keine Relaibilität oder Validität!!

  • Durchführungsobjektivität: Maß für Unanh. des Testergebnissses vom Versuchsleiter
  • Auswertungsobjektivität: Unabh. des Testergebnisses von der ausführenden Person
  • Interpretationsobjektivität: Unabh. des Testergebnisses von den interpretativen Schlüssen eines Diagnostikers
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Durchführungsobjektivität

A

Herstellung von Durchführungsobjektivität:
- Vereinheitlichung der Aufgabenstellung, der Bearbeitungszeit, der Erläuterung der Aufgaben, der zulässigen Hilfsmittel („Bedingungskonstanz“)
- Gleichheit der Instruktionen für alle Prüflinge (z.B. schriftlich oder mit Tonband).
- Vergleichbare situative Faktoren
- Reduktion der sozialen Interaktion zwischen Proband und Untersucher auf Minimum
- Strikte Beachtung von Verfahrensregeln

Schwierigkeiten:
- Personale Faktoren nur schwer beeinflussbar (z.B. Prüfungsangst, Tagesform)
- Verstehensprobleme bei formelhaftem Vortragen der Anweisungen
- Bei mündlichen Prüfungen ist Durchführungsobjektivität automatisch niedriger, da keine Gleichzeitigkeit gegeben ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Auswertungsobjektivität

A

Herstellung von Auswertungsobjektivität:
- Beurteilungsverfahren mit **festgelegten Kriterien **
- Kriterienkatalog → Nur Auszählung (z.B. Diktatfehler)
- Beurteilungsverfahren mit geschlossenen Antwortformen

Schwierigkeiten:
- Bei Aufsätzen o. ä. ist die Auswertungsobjektivität eher schwierig zu erreichen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Interpretationsobjektivität

A

Herstellung von Interpretationsobjektivität
- Existenz von festen Regeln für diagnostische Schlussfolgerungen (z.B. normierte Leistungstests, Fragebögen, Rohwerte aus Tabellen ablesen…)
- Möglichst umfassende Dokumentation von Datenerhebungen und –analysen

Schwierigkeiten:
- Je unterschiedlicher die zu verarbeitenden Informationen und je zahlreicher sie sind, desto schwieriger ist es, sie objektiv zu interpretieren (z.B. bei Übertrittsgutachten: neben Schulnoten werden auch außerleistungsmäßige Faktoren wie Lernbereitschaft, Unterstützung der Eltern etc. in die Diagnose mit einfließen)
- Affektive Beziehungen
- „Intuition“ des Diagnostikers oder Meinung, dass Diagnostik eine nicht schulmäßig erlernbare Kunst sei

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Reabilität

A

Reliabilität ist (wie Objektivität) ein formales Kriterium, es sagt nichts über den Inhalt aus!

  • Retest-Reliabilität: Zeitliche Stabilität des Messwerts
  • Split-half-Reliabilität: Gleichwertigkeit von 2 Testhälften
  • Paralleltest-Reliabilität: Gleichwertigkeit von 2 Paralleltests
  • Konsistenz-Analyse: Homogenität von Testitems
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Restestreliabilität

A

Nach einiger Zeit wird die gleiche Personengruppe mit dem gleichen Test erneut gemessen. Es wird mit den Ergebnissen der ersten Messung verglichen.

Wird nicht durch Veränderungen beeinflusst, die alle Probant:innen betreffen.

→ Bildung eines Reliabilitätskoeffizienten: Koeffizient der zeitlichen Stabilität

Schwierigkeiten:
- Bei Lernleistung handelt es sich nicht um ein zeitstabiles Merkmal
- Bei großen Zeitabständen zwischen den Messvorgängen können mehrere nichtvorhersagbare Veränderungen auftreten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Split-Half-Reliabilität

A

Die Aufgabenzusammenstellung wird halbiert und getrennt ausgewertet. Die Ergebnisse der beiden Hälften werden korreliert und es ergibt sich der Koeffizient der internen Konsistenz.

Herausforderung: Bildung von Ite-Paaren mit gleicher Schwierigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Paralleltestreliabilität

A

Hier werden zwei oder mehrere verschiedene, aber gleichwertige (parallele) Aufgabensammlungen verwendet, die sich inhaltlich möglichst ähnlich sind. Sie werden gleichzeitig, unmittelbar nacheinander oder mit einigem zeitlichen Abstand von der gleichen Personengruppe bearbeitet.

“Königsweg zur Schätzung der Reabilitäz”, ABER in Realität ist die Gleichwertigkeit mehrerer versch. Tests ist kaum möglich

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Konsistenzanalyse

A

Ein Test wird in seine einzelnen Items, die dazu die gleichen Fähigkeiten messen müssen, zerlegt und aus dem Zusammenhang zwischen den Itembeantwortungen wird auf die Messgenauigkeit rückgeschlossen.

  • sinnvoll: wenn ein diagnostisches Verfahren aus mehreren Items besteht, die alle
    dieselben Fähigkeiten messen
  • nicht sinnvoll: wenn ein diagnostisches Verfahren aus strukturunähnlichen, heterogenen Items besteht
17
Q

Validität

A

Die Validität eines Verfahrens sagt etwas darüber aus, ob tatsächlich das gemessen wird, was man messen will und nicht irgendetwas anderes

Validität ist (im Gegensatz zu Objektivität und Reliabilität!) ein inhaltliches Kriterium!

  • Inhalts-Validität (Augenscheinvalidität)
  • Empirische Validität
  • Konstruktvalidität
  • Kriteriumvalidität
18
Q

Inhaltsvalidität

A

Zentral in der Schule: Ein valider Test muss eine repräsentative Stichprobe derjenigen Unterrichtsinhalte umfassen, deren Kenntnis es zu prüfen gilt.

Methode: Bewertung durch Expertenurteil, keine empirische Überprüfungsmöglichkeit

Inhalts- vs. Augenscheinvalidität: Augenscheinvalidität gibt an, inwieweit der Validitätsanspruch eines Tests vom bloßen Augenschein her einem Laien gerechtfertigt erscheint; Inhaltsval. ist von Experten geprüft

19
Q

Empirische Validität

A
  • divergent: Testdaten, die verschiedene Merkmale abbilden, korrelieren nur gering
  • konvergent: Testdaten, die dasselbe Merkmal abbilden, korrelieren hoch

=> Kriteriumsvalidität: wenn ein messbares Kriterium für das zu messende Merkmal vorliegt, kann man die Validität aus der Korrelation zw. den Kriteriumswerten und den Testwerten schätzen
=> Konstruktvalidität: ein Test soll hoch mit den Indikatoren korrlieren, die mit dem zu messenden Merkmal verbunden sind (konvergent) und niedrig mit denen, die nicht mit dem Merkmal verbunden sind (diskriminant)

20
Q

Kriteriumsvalidität

A
  • konkurrente: Verhalten, auf das geschlossen wird, in der Zukunft liegt im selben zeitraum wie der Test
  • prädikative: Verhalten, auf das geschlossen wird, in der Zukunft liegt
    .
  • innere: Vergleichskriterium ist ein (alter) Test, der dasselbe misst
  • äußere: Vergleichkriterium ist ein anderer Test, der ein hoch korreliertes Merkmal misst

z.B.
konkurrente innere Validität: Intelligenztest A sollte Ergebnisse von Intelligenztest B vorhersagen können
konkurrente äußere Validität: Gültigkeit von Schultests wird mit dem Grad der Übereinstimmung ihrer Ergebnisse mit Schulnoten ermittelt

21
Q

Herstellung von Validität

A
  • Übereinstimmung von Test- und Unterrichtsinhalt
  • Eindeutige Arbeitsanweisungen und klar formulierte Aufgaben
  • Operationalisierung der Lernziele
  • Lehrer sollte inhaltliche Analyse durchführen
  • Genaue Festlegung, welches Verhalten als Kriterium fungieren soll
22
Q

Nebengütekriterien

A
  • Normierung
  • Nützlichkeit & Zumutbarkeit
  • Ökonomie
  • Vergleichbarkeit
  • Akzeptanz
  • Testfairness
23
Q

Beziehungen der Gütekriterien

A
  • ohne Objektivität keine Reliabilität oder Validität
  • ein Test, der nicht reliabel ist, kann auch nicht valide sein; ein reliabler Test kann aber auch invalide sein