Psychologische Test-Theorie Flashcards
Klassische Testtheorie
Die klassische Testtheorie geht von drei Axiomen aus
- Axiom (Existenzaxiom): Zu jedem beobachteten Testwert existiert ein „wahrer“ Wert (T), dessen Merkmalsausprägung über die Zeit konstant ist.
- Axiom (Fehleraxiom): Der Messfehler einer Messung ist eine Zufallsvariable, für die gilt, dass die Summe bzw. Das arithmetische Mittel 0 ist, wenn hinreichend viele Messungen vorgenommen worden sind (MˇE = 0). Messfehler und wahre Werte sind nicht miteinander korreliert (rˇE = 0). (Labil, kann an Gegenstand, Messinstrument oder Beurteiler liegen)
- Axiom (Verknüpfungsaxiom): Der beobachtete Wert setzt sich additiv aus wahrem Wert und Fehlwert zusammen (X = T + E)
Skalen für gemessene Größen
- Nominalskala
> Bestimmung von Gleichheit oder Verschiedenheit
> Einteilung in verschiedene Gruppen
> „mittlerer“ statistischer Wert: Modalwert, d.h. Der am häufigsten gemessene Wert
> Bsp.: Einteilung von Schüler in Klassen, Modalwert: größte Klasse - Ordinal- oder Rangskala
> Bestimmung der Rangordnung (Hierarchie)
> Zeigt nur Reihenfolge und Richtung des Ausprägungsgrades
> Zeigt nur größer, kleiner bzw. besser - schlechter an! (Keine Aussage über „wie viel größer bzw. Besser“)
> mittlerer statistischer Wert: Median, d.h. Der Wert, der in der Mitte der Messreihe liegt
> Bsp.: Ranglisten bei Sportwettbewerben; Zensuren - Intervallskala (Bsp.: Temperaturskala)
> Gleiche Skalenabstände (Gleichheit von Intervallen)
> aber keine Aussage über Proportionen zwischen Skalenwerte, da der Nullpunkt willkürlich festgelegt ist
> Bsp.: 50°C ist nicht doppelt so heiß wie 25°C, denn dann wäre wegen des gleichen Abstands ja auch 125°C doppelt so heiß wie 100°C
> mittlerer statistischer Wert: arithmetisches Mittel, also Durchschnitt - Verhältnis- oder Proportionalskala
> Besitzen einen natürlichen Nullpunkt (z.B. Gewichtsmaße)
> Aussagen über Proportionen möglich
> In der Psychologie nicht anzutreffen
Prinzip der Normierung
Um das Verhalten des Lernenden besser vergleichen zu können und damit auch objektiver beurteilen zu können, werden die Verfahren, die das Verhalten erfassen sollen, normiert.
Bei der Standardisierung (=Eichung) wird das Diagnoseverfahren auf alle Personen einer ausgewählten, genau beschriebenen Stichprobe in der gleichen Weise und unter vergleichbaren Bedingungen angewendet. Diese Erhebung an einer repräsentativen Stichprobe unter konstant gehaltenen Bedingungen ermöglicht die Aufstellung von Normen. Das sind statistische Vergleichsdaten, die es ermöglichen, den spezifischen individuellen Wert einer Person mit Resultaten anderer Personen einer definierten Gruppe zu vergleichen.
Ein konkretes Testergebnis ist nicht aus sich heraus interpretierbar, sondern jedes Testergebnis muss in ein Bezugssystem eingeordnet werden. Dafür stehen drei Möglichkeiten zur Verfügung.
Bezugsnormen allgemein
Um die gesammelte Lernergebnisse des Lernenden zu beurteilen, brauchen wird Vergleichsmöglichkeiten (Bezugsnormen).
Bezugsnormen sollen folgende Aufgaben erfüllen:
1. Anschauliche und angemessene Wiedergabe der Leistung in Ziffernnote 2. Möglichkeiten eines sozialen Vergleichs zwischen Schülern 3. Möglichkeit eines intraindividuellen Vergleichs, also der Analyse des Fortschritts
Arten von Bezugsnormen
- Soziale (interindividuelle) Bezugsnorm:
Vergleich der individuellen Leistung mit dem Leistungsdurchschnitt der Klasse oder Vergleich in einer best. Bezugsgruppe —> Normalverteilung mit Mittel-/Durchschnittswert (meist auf Note 3)
> Betonung der Leistungs- und Fähigkeitsunterschiede zwischen Schülern
> legen stabile, internale Attributionen (beim Schüler und Lehrer) nahe: Begabung
> Egozentrische Orientierung (im Vergleich zu anderen gut dastehen) statt Aufgabenorientierung
> Betonung der Selektionsfunktion von Schulnoten
—> normorientierte Leitungsbewertung
Beachte: Der Schulgesetzgeber fordert die sachliche Bezugsnorm! Bei Intelligeztests beispielsweise ist aber das Ergebnis des Einzelnen im Vergleich zum Durchschnitt interessant - (Intra-) Individuelle Bezugsnorm.
Vergleich der aktuellen Leistung eines Schülers mit seinen früheren Leistungen, z.B. „pädagogische Zensuren“ oder individuelle Lernfortschritte
—> Der individuelle Leistungsfortschritt wird bewertet, nicht die absolute Leistungshöhe
> Legen variable, internale Attributionen nahe: Anstrengung
> Aufgabenorientierung wahrscheinlicher
> Betonung einer förderdiagnostischen Funktion von Noten
—> ipsative Leistungsbewertung - Sachliche (Objektive, lernzielbezogene zw. ideal-) Bezugsnorm:
Vergleich der aktuellen Leistung des einzelnen Schülers mit einem vorher genau definierten und den Schülern mitgeteilten Anforderungskatalog (z:B. Vom Lehrer)
> Rückmeldefunktion
> Qualifikation von Noten
—> kriteriumsorientierte Leistungsbewertung
Beachte: Diese Norm ist vom Schulgesetzgeber vorgeschrieben!
Interindividuelle Normskalen: Prozentrangskala
Prozentrangskala:
Der Prozentrang definiert die Stellung eines Schülers innerhalb einer Gruppe bezgl. eines Merkmals. Er gibt an, welcher Anteil der Mitschüler genauso gut oder schlechter abgeschnitten hat. Hat ein Schüler beispielsweise einen Prozentrangplatz von 75, dann sind seine Leistungen gleich oder besser als die von 75% aller Schüler dieser Gruppe.
Interindividuelle Normskalen: T-Wert-Skala
Diese Skala ist besonders nützlich für Werte, die normalverteilt sind. Bei solchen Verteilungen kann man die Messwerte so „verschieben“, dass man ein Experiment mit einem beliebigen Mittelwert und beliebiger Standardabweichung erhält.
Für Tests hat sich die T-Wert-Skala als sehr praktische Normskala weitgehend durchgesetzt (Lienert 1969). Bei ihr wurden der Mittelwert mit 50 und die Standardabweichung mit 10 festgelegt. Die Werte können direkt aus den Prozenträngen übertragen werden, Psychologen verwenden dazu den Taschenrechner.
Bsp.: Ein Proband mit T-Wert 48 hat Prozentrang 42, seine Leistungen sind also besser als oder gleich wie die von 42% aller Teilnehmer
Interindividuelle Normskalen: Fähigkeitsorientierte Norm
Da eine Person eine bestimmte Leistung mit größter Wahrscheinlichkeit dann erbringen kann, wenn sie sie anhand konkreter Aufgaben auch bringt, kann eine Normierung auch dadurch vorgenommen werden, dass man Aufgaben aus didaktischer Sicht bestimmten Schwierigkeitsgrad zuweist.
Dazu bildet man zunächst Kompetenzbereiche (etwa I: rudimentäres schulisches Wissen bis V: Problemlösen bei inner- und außenmathematischem Kontext) und ordnet diesen Aufgaben mit einem bestimmten Schwierigkeitsgrad zu. Löst ein Schüler eine Aufgabe mit Schwierigkeit 287, fällt er bspw. In Kompetenz I.
Großer Vorteil: spiegeln tatsächliches Können der Schüler wieder, nicht nur Vergleich mit anderen
Anwendung: z.B: bei der TIMSS-Studie
Interindividuelle Normskalen: Allgemeines zur Normierung
Bei jedem normierten Test ist die Stichprobe zu beachten, an der diese Normierung vorgenommen wurde. Folgende Grundlinien sollten eingehalten sein
> Stichprobe sollte ein verkleinertes Bild der Gesamtheit sein, also nach Geschlecht, Bundesland etc. Der Population entsprechen, für die Gültigkeit beansprucht wird
> Stichprobe muss randomisiert ausgewählt werden
> Normierung sollte aktuell sein
Rechnerisches: Bestimmung von Cut-Off-Werten
Ergebnisse aus diagnostischen Verfahren werden im Rahmen von Selektionsentscheidungen zur Zuweisung der Probanden zu verschiedenen Gruppen verwendet.
Bsp.: Noch nicht schulpflichtige Kinder werden als Folge eines Einschulungsverfahrens bereits früher eingeschult (oder eben nicht)
—> Bestimmung des „besten“ Cut-Off-Werts, ab dem eine Person als geeignet oder als nicht geeignet angesehen wird. (Auch hier Fehler möglich!)
geeignet (Diagnose) Nicht geeignet (Diagnose) geeignet (wahrer Zustand) A B Nicht geeignet (wahrer Zustand) C D
> Effektivität: Prozentsatz der richtigen Entscheidung E= [(A + D) ÷ (A + B + C + D)] · 100
Spezifität: Anteil der als richtig klassifizierten Geeigneten S= [A ÷ (A + B)] · 100 · 100
Sensivität: Anteil der als richtig klassifizierten Nicht-Geeigneten Z= [D ÷ (C + D)] · 100
Rechnerisches: Der Korrelationskoeffizient
Statistisches Hilfsmittel, um Zusammenhänge zwischen Werten zu messen bzw. Zu überprüfen. Die Daten werden paarweise zusammengesetzt und mit einem Durchschnitt verglichen.
Ergebnis ist ein Koeffizient zwischen -1 und 1
a) r = + 0.45 Positive Korrelation: Je größer/kleiner Wert x, desto größer/kleiner ist Wert y (z.B. Körpergröße - Schuhgröße) 0.45: mittlerer Zusammenhang b) r = 0 kein Zusammenhang zwischen x und y c) r = - 0.80 Negative Korrelation: Je größer/kleiner Wert x, desto kleiner/größer Wert y. (z.B. Anzahl/Regentage - Sonnentage, Leistung - Notenwert!) 0.80: hoher Zusammenhang
Korrelation machen jedoch keine Aussagen über kausale Zusammenhänge!