4. Kapitel Flashcards
In welcher Skala sollte pädagogische Diagnostik stattfinden?
- intervallskallierte Skalen, um Personenunterschiede zu vergleichen/interpretieren
- jedoch Realität: selten solche Noten-Vergebungen, dass sie intervallskaliert interpretiert werden können -> Verrechnungen der Lehrer nicht empirisch geprüft -> Abständen zwischen Noten unterschiedlich groß
Wie werden in der pädagogischen Diagnostik einzelne SuS betrachtet?
- individuell als einzelne Person in Hinblick auf eine diagnostische Fragestellung
- neben der Entwicklung (individuelle Bezugsnorm) wird der Vergleich zu einem erreichten Kriterium (kriteriale Bezugsnorm) oder der Vergleich zu allen SuS der Altersstufe oder Klassenstufe (soziale BN) verwendet
(- oft Lehrkräfte aber nur Bewertung der SuS als Teil einer Klasse -> implizit miteinbezogen)
Was sind quantitative Informationen/qualitative Informationen?
- quantitativ: Zahlen, welche mithilfe von Beobachtungen, Aufgaben, informelle oder standardisierten Tests gebildet werden
- qualitativ: aus Gutachten, Zeugnissen, Einschätzungen, Beobachtungen, Gesprächen; liegen in Form von gesprochenen oder geschriebenen Worten vor
-> diese Infos sollen herangezogen werden, gewichtet, interpretiert & eine DBDM getroffen werden
Auf was achten qualitative Instrumente noch?
- betrachten Art der Lösung & Analyse des Lösungswegs
- welche Strategie hat SuS verwendet & bei falscher Antwort, welche Denk- & Handlungsmuster hatte SuS
Sind Diktate sinnvoll?
- oft kritisch betrachtet, v.a. Wenn ohne systemischen Regeln & Auswertungen
- kann jedoch auch anhand eines Grundwortschatzes & konkreter Rechtschreibschwierigkeiten entwickelt werden -> in welchem Bereich hat Kind noch Schwierigkeiten? (Alphabetische Rechtschreibstrategien, morphematische Strategien, orthographische Rechtschreibstrategien)
Was können für Probleme bei Proben & Klausuren auftreten, die nichts mit dem latenten Konstrukt zu tun haben?
- oft scheitern Kinder an Aufgabenformaten, versteckten Tricks oder sehr nah formulierten Antwortalternativen -> messen eher Vorwissen & genaues Arbeitsverhalten als gewünschtes latentes Konstrukt
-> sinnvoll: Strategien einzuüben
Was sind latente Konstrukte?
- anhand von mehreren Beobachtungen oder Aufgaben messbar (Körpergewicht ist manifest; körperliche Fitness ist latent)
- schulische Leistungen sind latente Konstrukte
- Test mit psychometrischen Gütekriterien -> mit hoher Wahrscheinlichkeit „wahrer Wert“ des latenten Merkmals (Konfidenzintervall -> in dessen Bereich der latente Wert mit 95% liegt)
- latente Variablen werden als Ellipsen in theoretischen Strukturmodellen dargestellt
- wird mit mehreren Aufgaben (Items) gemessen, die einzelnen Aufgaben werden als manifest betrachtet
Wie funktionieren Schulleistungstests?
- sind meist multidimensional & bestehen aus mehreren Subtests
- mit gesamten Test wird Kompetenz gemessen & mit einzelnen Tests eine Teilkompetenz (Demat 2+)
- je mehr Dimensionen der Test, desto breiter misst er das latente Merkmal
- oft aber zeitintensiv (eher für Gutachten, oder wenn wenig Infos über Profil des SuS)
Was für eine Rolle spielen Normen?
- Vergleich zur Klassenstufe & Altersgruppe soll ermöglicht werden
- oft in Schulleistungstest soziale Bezugsnorm
- um Vergleich aber zu ermöglichen müssen Tests anhand größerer Studien normiert werden
- für Interpretation von Werten ist immer Abstand zur Mitte (Prozentrang 50) der Verteilung entscheidend (entweder Leistung durchschnittlich oder über/unterd.)
- Konfidenzintervall entscheidend (Standardfehler wird vom normierten Wert abgezogen oder addiert) -> 95% der wahrte Wert der Person
Was bedeutet E + T = X (erste Axiom der klassisschen Testtheorie)?
- E: zufälliger Messfehler
- X: beobachtete Merkmalsausprägung
- T: wahre Merkmalsausprägung (true score)
-> wird erwartet, dass Messfehler irgendwann 0 entspricht
- muss Messfehler bei Auswertungen von psychometrischen Instrumenten meist in Form des Konfidenzintervalls beachten
Was sind Item-Response-Modellen?
- Testverhalten wird nicht mit dem gemessenen Verhalten gleichgesetzt, sondern beobachtete Variable wird als Indikator gesehen, welches ein Auftreten erhöhrt
Wie funktioniert ein IRT Modell?
- zuerst werden die Schwierigkeiten der Items (Itemparameter) geschätzt und dann die Werte der Personen (Personenparameter) -> Personen-Item-Map
Was sind Gütekriterien?
- Objektivität (Testergebnis ist unabhängig von TestleiterIn, Ort, Durchführung,… )
- Reliabilität (Grad der Genauigkeit der Messung eines latenten Konstrukts des Instruments, ohne jedoch über Gültigkeit eine Aussage zu treffen)
- Validität (latente Konstrukt; Konstruktvalidität: Ladungsstruktur auf latenter Ebene entspricht theoretischen Struktur des Konstrukts; Kriteriumsvalidität: Test stimmt möglichst hoch mit einem als relevant erachteten Außenkriterium überein)
- Eichung/Normierung (große repräsentative Erhebung wird benötigt)
- Skalierung (Verrechnungs- & Auswertungsvorschriften entsprechen auch dem gemessenen empirischen Modell & Testwerte bilden empirische Verhaltensrelation)
- Ökonomie (diagnostische Informationsgewinn in Bezug zu eingesetzten Ressourcen (Zeit, Kosten, Arbeitsaufwand)
- Nützlichkeit (mehr nutzen, sodass sich Anstrengungen & Nachteile rechtfertigen)
- Zumutbarkeit (zumutbar & Testung möglichst schonend durchgeführt)
- Unverfälschbarkeit (möglichst nicht von Testperson bewusst/unbewusst verfälscht werden können)
- Fairness (keine Diskriminierungen oder Nachteile für bestimmte Gruppe & misst alle Personen der Zielgruppe ähnlich fair)
Was ist im Bezug auf Gütekriterien für den sonderpädagogischen Bereich wichtig?
- ist Fairness auch für meine Schülergruppe gegeben?
- Anpassung & Adaption im sonderpädagogischen Bereich muss begründet sein
- von manchen Tests werden Kinder mit SPFB außen vor gelassen
- v.a. Instruktion vor der Aufgabe & Beispielaufgaben können verändert werden (Durchführung eher kritisch)
-