Mujer Diagnostik Klausur 2024 Flashcards

1
Q

VL Einführung

01 - Was ist pädagogisch-psychologische Diagnostik und welche Ziele sind damit verbunden?

A

Diagnose: Bewertung, Schlussfolgerung. Sammeln und Aufbearbeitung von Infos anhand eines Klassifikationssystem

Funktion: versuchen, die richtige entscheidung treffen

Ziele:
Diagnostik im Pädagogischen Kontext: dient der Optimierung von pädagogischen Handeln. Optimierung durch Entscheidunggrundlage)
Optimierung des individuellen Lernens durch:
Ermittlung der Voraussetzungen
Analyse von Lernprozessen
Festellung von Lernergebnisse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beschreiben Sie zentrale Entscheidungsbereiche der pädagogisch-psychologischen Diagnostik.

A

a) Sschullaufbahnentscheidungen (Selektion/Auswahl)

b) Interventionsentscheidungen PLACEMENT (Bei Hochbegabung, wie sollten man reagieren, wohhin sollte das Kind gehen)

c)Beurteilung von Lern- und Entwicklungsumwelten (um zu sehen, wie wohl sich die S in der Schule fühlen)
+ Überwachung des Lernverlaufs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Geben Sie je ein Beispiel für den Einsatz von Selektions und Modifikationsdiagnostik sowie von Status- und Prozessdiagnostik und erläutern Sie jeweils das diagnostische Vorgehen

  • Selektionsdiagnostik: Auswahl, Klassifikation, Platzierung von Personen. Ein geeigneter Lernumwelt wird ausgewählt. Statusdiagnostik ist eine Voraussetzung für die Selektionsdiagnostik
  • Modifikationsdiagnostik: entscheidungen über Maßnahmen zur Veränderung der Person. Ein spezifische geeignete UMWELT für die Person wird hergestellt. Prozessdiagnostik ist eine Voraussetzung für die Modifikationsdiagnistik.
  • Statusdiagnostik: registro des zustands einer Person, die für die pedagogische Entscheidung wichtig sind. Merkmal ist stabil. SUMMATIVE DIAGNOSTIK

Prozessdiagnostik: registro der Veränderung einer Person, die für die pädagogische entscheidung wichtig sind. FORMATIVE DIAGNOSTIK

___________________________________________________

  1. Die Auswahl von Studierenden für einen Universitätsstudiengang durch Eignungstests ist
    ein Beispiel für…
    ❏ Selektionsdiagnostik und Prozessdiagnostik
    ❏ Prozessdiagnostik und Modifikationsdiagnostik
    ❏ Statusdiagnostik und Selektionsdiagnostik «««
    ❏ Modifikationsdiagnostik und Statusdiagnostik
A

-Selektionsdiagniostik BSP:
wechsel eine Schulart. Es wird Diagnostiziert, weil eine Person eine besondere Schulart benötigt (Gymnasium oder realschule)

  • Modifikationsdiagnostik BSp: spezifische Lernhilfe
  • Status BSP: Festellimg, ob eine Person die Kompetenzen für das Abitur hat. Tambien: Feststellung über eine entwicklungsstörung.
    Förderunterricht

Prozessdiagnostik Bsp:
Ein S kann nicht gut lesen, dann diagnostiziere ich wie diese Kompetenz im Laufe der Zeit sich entwickelt hat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Inwiefern stehen die verschiedenen Funktionen pädagogisch-psychologischer Diagnostik in einem Spannungsfeld zueinander?

A

a) individuelle Förderung vs Selektion: wenn die Intelligenz gemessen wird, kann eine Förderung folgen. Seleccionar las cualidades individuales de cada alumno o seleccionarlos

b) Motivierung vs exakte Ruckmeldung: schlechte Noten zu bekommen ist nicht motivierend

c) Individualität von Leistungen vs Vergleichbarkeit. Leistung sind individuelll aber man braucht auch einen Vergleich

d) Diagnostische Anspruch vs diagnostische Kompetenz: hohe anspruche für die Person, die diagnostiziert.

e) Zeitaufwand vs vorhandenen ressourcen

-Leistungsdiagnostik stellt hohe Anforderungen für die LK, weil diese Multifunktional ist.
- Selektion ist eine grosse Verantwortung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Erläutern Sie kurz die folgenden Begriffe:

Messen: Verhalten und Äußerungen werden beobachtet und werden zu Messwerte zugeordnet, Diese bilden due Beziehugen zwischen Beobachteungen durch die Beziehugne zwischen Messwerten ab.

Vaiable: Merkmale (Geschklechtm, Intelligenz). Diese beschreiben Personas. Diese Unterscheiden sich in den personen.

A
  • manifeste und latente Variable:
    a) Manifeste Variable: Merkmale können direkt beobachtet werden

b) Latente Variable: Merkmale sind nicht direkt beobachtbar. Diese stehen in der Person selbst. BSP: Leistungsbereitschaft, sozioökonomische Status, disziplin

  • Test: Verfahren. Dies erfasst die Besonderheit eines Konstrukts (Intelligenztest)
  • Item: ein Test oder ein Messverfahren hat Grundbausteine, also Items
  • Konstrukt: sie sind Merkmale, die man messen will.
  • Operationalisierung: ist eine Erfassung von einer abstrakten/ theoretischen Variable mithilfe eines Merkmals, das konkret messbar ist. Z.b Mathematische Kompetenz kann durch einen erreichten Punktzahl operationalisiert werden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welchen Funktionen dienen Leistungsbeurteilungen im pädagogisch-didaktischen Kontext?

A

a) Optimierung con Lehr-Lernprozesse:

  • Informationsfunktion: realistische Selbsteinschätzun des erreichten Zustandes.

. Lehr-Lenr Diagnose: Diagnose des aktuellen Lernstand als Basis für weitere Planung und Gestaltung von Lernprozessen

b) gesellschaftliche, politische und schulorganisatorische funktionen:
- selektions/auswahlfunktion: optimale platzierung
- sozialisierung: Vorbereitung der nachwachsenden Generationen auf eine leistungsorientierte Geselllschaft

c) kontrolfunktion: Überwachung der Bildungsprozesse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

VL Statistische Grundlagen I

Um welche Formen von Diagnostik handelt es sich jeweils?

a) Feststellung von bestimmten Persönlichkeitsmerkmalen

b) Auswahl der Schulform für bestimmte Schüler*innen

c) Erfassung von Schulleistungen mit einem Schulleistungstest im Verlauf eines Schuljahres

d) Sammlung von Informationen über eingesetzte Lernstrategien im Zuge eines Lernstrategietrainings
(- Modifikationsdiagnostik: entscheidungen über Maßnahmen zur Veränderung der Person. Ein spezifische geeignete UMWELT für die Person wird hergestellt.)

A

a) Status

b) Selektion- Auswahl

c) Prozess

d) Modifikation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

1 Bestimmen Sie

  1. die Werte der zentralen Tendenz (Modalwert, Median und arithm.
    Mittel)
  2. sowie Range und Standardabweichung der Verteilung für die Klasse B aus dem Klausurbeispiel.
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erstellen Sie eine Übersicht der verschiedenen Skalenniveaus mit den Aussagen, die jeweils getroffen werden können und geben Sie für jedes Skalenniveau ein Beispiel.

A

a) Nominalskala: niedrigste Nieveau bei einer Messung (keine Messung im Engeren Sinne)
- ES ist eine ZUORDNUNG von Zahlen
- Keine Gross Klein Relation
- es kann eine qualitative Gleichheit vs Verschiedenheit sein
Messung von Onjekten mit gleicher Merkmalausprägung und gleiche Zahlen und Objekte mit VERSCHIEDENER Merkmalsausprägung.
- wie häufig verschiedene Kategorien besetzt sind
Zb: familienstand (ledig, verheiratet, verwitwet)

b) Ordinal-Rangskala: GRADEN von Ausprägungen.
- Objekte mit höhere Ausprägungsgrad bekommen eine grossere Zahl.
Aussage: grosser-kleiner/ mehr-weniger
Keine Aussage: ABstand zwsichen Skalenpunkt 2 und Punkt 4 genausogross wie der Abstand zwischen 6 und 8
BS: Beliebheit der Politiker (1:wenig; 4: viel)
Schulabschluss,
Reihenfolge: ja. ABER: Abstände zwsichen Ranrgplätze ist unterschiedlich groß

c) Intervalskala: ABSTAND uwischen skalenpunkten (
Hat auch eine reihenfolge aber nicht wie Rangskala

Gleichabständigkeit) (METRISCHE VARIABLE)
Aussage: Unterschied zw. Merkmalausprägung 4 genauo groß wie der Unterschied zw. einer Merkmalausprägung 6 und 8.
Anzahl der richtige Antwoerten im Vokabeltest, zufriedenheit auf eine Skala 1-10

Unterschied zu Rangskala: die ABstände zwischen den Ausrpägungen sind interpetierbar

Es gibt keine absoluten Nullpunkt

Bsp: Klausurpunkte (Gleicher Abstand zwischen die Noten1-2 und 3-4, Grados, Einkommen in $, Klausurpunkte, datum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

4- Ordnen Sie den verschiedenen Skalenniveaus die sinnvoll anwendbaren Maße der zentralen Tendenz zu.

  1. Die Schülerinnen und Schüler einer Schule wurden auf einer dreistufigen Skala (1 =
    gering, 2 = hoch, 3 = sehr hoch) zu ihrer Lernfreude befragt. Welches Maß/welche Maße der
    zentralen Tendenz lässt/lassen sich auf die resultierenden Werte inhaltlich sinnvoll
    anwenden?
    ❏ Gar keins
    ❏ Nur der Modalwert
    ❏ Nur der Modalwert und der Median «««
    ❏ Der Modalwert, der Median und das arithmetische Mittel
A

Modalwert: ab nominalskala: In einer Verteilung am häufigsten vorkommende Wert. El que mas se repite. En un grafico, la mayoría.
- Breitgipfelige Verteilung: wenn 2 Modalwerte nebeinander liegen.

median: ab Ordinal/Rangskala: halbiert eine Verteilung in 2 Hälften
Median muss der Grosse nach sortiert werden
Medien einfach zu berechnene mit ungerade Zahlen. 1, 7,10 (7 Median)
Gerade Zahle: 1,2,5,7,9,10: 5,7 in der Mitte: Muss man arithmetische Mittel berechnen: 5+7/2: 12/2= 6

arithmetische Mittel: Intervalskala: DURCHSCHNITTWERT einer VERTEILUNG

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

5- Was drückt die Standardabweichung einer Verteilung aus? Illustrieren Sie dies anhand eines Beispiels.

Beispiel: um die Varianz zu berechnen, braucht man:
1- Den Mittelwert für die Messwerte. Es decir el promedio. Promedio nos dio 5.
2-von jedem einzelnen Messwert den Mitellwert abzuziehen. En este sentido se resta el Punktzahl del Promedio: 1-5=-4. LOS NEGATIVOS SE DAN, estos estan bajo el Promedio (Mittelwert)
La summa der Abweichung da 0.
3- Las Diferencias (los resultados de la resta del Punktzahl y el promedio) werden quadriert. (todas son positivas)
4- Quadrierte Abweichungen werden summiert.
Diese Summe se DIVIDE por el N (18 que es el Anzahl der Untersuchungsobjekte)

A

Dispersionsmaße: vermitteln einen Eindruck von der Unterschiedlichkeit (Variabilität) von Messwerten. Wichtigste sind:

Range: ^gibt die gesamte Streubreite einer Verteilung an. Differenz zwsichen dem höchsten und dem niedrigsten Messwert. Extremwerten werden vermieden (nur die mittleren 90%

Abstände zwischen Perzentilen:
Perzentil: die nutzt man, um zu beschreiben, wieviele Daten unter einer bestimmten Schwelle liegen. (15%)

Varianz: durchschnittliche quadrierte Abweichung der einzelnen Messwerte von arithmetischen Mittel der Messwertreihe.
Bei der Berechnung von Varianz werden alle Werte einer Verteilung in die Berechnung einbezogen

Standardabweichung: sie zeit, wie weit sich die Verteilung um das srimtesche Mittel streut.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  1. Welche Vorteile hat die Standardabweichung gegenüber der Varianz? Und gegenüber dem Range?

Respuesta de Marianna:

  • SA besitzt gleiche Einheit wie Messwerte. Kann mit Werten in Bezuiehung gesetzt werden
  • SA hat weniger Einfluss von Ausreißerwerten.
A

Varianz: statistisches Maß, das beschreibt, wie groß die QUADRIERTE aBWEICHUNG EINZELNER wERTE VOM MITTELWERT einer Datenmenge ist:
Dh: sie informiert:
Wie sehr die einzelne Werte einer Datenmenge um den Mittelwert herum variiiren= STREUNG UM DEN MITTELWERT: Wie variiren die Datenmenge um den MITTELWERT
- Berechnung der Varianz: Ermittlung des Abstand jedes einzelnen Wertes zum Mittelwert. por ejemplo: el dato de una persona y se resta al promedio. Los que estan bajo el promedio tienen un negativen Abstand zzum Mittelwert.
- Para seguir calculando los valores deben ser POSITIVOS. Por eso hay que hacer que los valors sean positivos: ESTO SE HACE QUADRANDO los valores.
Ahora para wer CUANTO ES LA ABWEICHUNG IM DURCHSCHNITT: de estos valores,q ue se han quadrado, se les saca el promedio (aritschmetishe Mittel, durchschnittwert). Importante: en la formula de varianz se divide no solo por el numeero de personas, sino que el número de personas MENOS 1 (N-1)
En algunos casos la Varianz da un numero, que no se puede interpretar muy bien, porque lo hemos QUADRADO (queriamos poner los valores positivos), por eso se usa la Varianz como Basiswert für weitere Berechung, como la STANDARDABWEICHUNG

STANDARDABWEICHUNG: sirve para mostrar, wie stark die einzelne Werte um den Mittelwert in der richtigen Einheit streuen.
Sie ist die Quadratwurzel der Varianz. Se usa Raiz, para sacarle el quadrado a la varianz que le pusimos antes, para hacer positivos los valores. Muestra tmb wie repräsentativ der Durchschnitwert ist, also wie gut ist der mittelwert geeignet um die Datenzeihe zu gestalten.

je höher das Ergenis der Standardabweichung ist, desto mehr schwanken die einzelne Werte. Großere Standarabweichung bedeutet dass die Werte stärker schwanken (sie sind weiter vom Mittelwert entfertn)

Man kann besser die Zusammenhöngen zw. verschiedenen Variablen untersuchen.
Man kann erkennen wie homogen oder heterogen die daten sind

geringe standardabweichung bedeutet , dass due Werte DICHT beieinander liegen.

Standardabweichung besitzt gleiche einheit wie Messwerte
- Kann mit Werten in Beziehung gesetzt werde .
-weniger Einfluss von Aureißerwerten

Mit varianz und standarabweichung kann man wiessen wie unterschiedlich sind die Antworten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

VL STATISTISCHE GRUNDLAGEN II

Wodurch sind Normalverteilungen gekennzeichnet?

_____________________________

  1. Welche der folgenden Aussagen trifft nicht auf alle Normalverteilungen zu?
    ❏ Sie haben alle die gleiche Streuung «««««
    ❏ Modalwert, Median und arithmetisches Mittel fallen zusammen
    ❏ Sie sind symmetrisch
    ❏ Zwischen den beiden Punkten, die nach unten bzw. nach oben eine
    Standardabweichung vom Mittelwert entfernt liegen, liegen rund 68% der Fälle
A

Nur metrische Variablen (Intervalskala bzw verhältisskala können normal verteilt werden.
Viele der Merkmalen, die in sozialwissenschaften gemessen werden, sind in der popilation aprox. NORMAL verteilt. (Gaus-Funktion)
Sie Linie der Normalverteilung hat die Form einer Glocke (Kirche)
Die linie ist symetrisch
Die Drei Maße der zentrale Tendez (Modalwert, Median, Arithmetisches Mittel) fallen zusammen, übereinstimmen.
Recordatorio: Modalwert( ist die häufigste vorkommende Wert in einer Verteilung), Median ( halbiert eine Verteiling in der Hälfte), arithmetisches Mittel (Durchschnittswert in einer Verteilung, promedio)
- Die Verteilung erreicht die X-Achse nie.
- Zwischen den Wendepunkte (standardabweichung unter den Mittelwert und die Standardabweichung über dem Mittelwert) liegen rund 68% der Fälle
- 95% der Fälle sind zwischen den Punkte, die zwei Standardabweichungen von Mittelwert entfernt sind.
Normalverteilung nur für Populationswerte oder grosse Stichproben. Nicht für kleinere Gruppen

Mittelwert (griechische Buchstabe como la U) und Standardabweichung (griechische Buchstabe como la O) bestimmten welche art von normalverteilung ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Zwischen der Anzahl an Schülerinnen und Schülern in einer Klasse und ihrer Aufmerksamkeit im Unterricht besteht eine Korrelation von r = -0,80. Beurteilen Sie folgende Aussage: “Die steigende Klassengröße verursacht geringere Aufmerksamkeit bei
Schülerinnen und Schülern“

konvention von cohen:

r= 0,10: kleiner Effekt
r: 0,30 mittlerer Effekt
r= 0,50 = großer Effekt.

A

r: 1: perfekter positiver Zusammenhang zwischen x und y
Aussage: je größer x, desto größer y

r: -1: perfekter negativer Zusammenhang zw. x und y
Aussagen: je größer x, desto kleiner y

r= 0: kein Zusammenhang zwsche x und y

Respuesta: Bei korrelation von -0,80 großer Effekt; Korrelation impliziert jedoch nicht Kausalität; daher die Klassengröße NICHT UNBEDINGT für geringe Aufmerksamkeit ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

In der Zeitung lesen Sie, dass ein negativer Zusammenhang zwischen der Zeit, die Kinder wöchentlich mit Hausaufgaben verbringen, und ihren Noten in Mathematik (reguläre Notenskala von 1=sehr gut bis 6=ungenügend) besteht. Was könnte für diesen Zusammenhang verantwortlich sein? Überlegen Sie sich drei mögliche Ursachen.

A

Es besteht eine Korrelation zwsichen der Zeit der Hausaufgaben und der Mathematiknoten
- negativer zusammenhang: je mehr Zei für Hausaufgaben, desto weniger ……………… folios de zusammenfassung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

VL 4 - GÜTERKRITERIEN I

Erklären Sie die Konzepte „beobachteter Messwert“, „wahrer
Wert“ und „Fehlerwert“ und verdeutlichen Sie diese anhand
eines Beispiels.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Nennen Sie die drei Aspekte der Objektivität und geben Sie je
ein Beispiel für Maßnahmen zur Sicherstellung der Objektivität.

A

objektivität: se trata de ir directo al grano y de sacar los elementos que peudan distraer

Durchführungsobjektivität: die Durchführung sollte stabil sein zwsichen LK und SuS
Gewährleistet durch
-Gleiche Rahmenbedingungen während der erhebung (Prüfung): Alle regeln während derDurchführung gelten für alle gleich.
Bsp:Ein S hat eine Frage. Man erklärt die Aufgabe für alle.
- wenige soziele Interaktionen währen der Prüfung.

Auswertungsobjetivität: Leistung sollte die Punktzahl entsprechen. Abhängig von dem Schuler (Vorliebe?).

geährleitet durch:
klare regeln ür öffene fragen

Überprüfung durch Übereinstimmung von Auswertungsergenisse von unabhängigen Bewerterinen.

Interpretation: nach der Auswertung kommt die interpretation. Dies geschieht im bezig auf Vergleichmassstäbe

  • es ist die übersetzung der Leistungen und punkte

es geht um die frage: inwiewiet aus den gleichen ausgewerteten Ergebnissen, unabhängig von der auswertenden personene, die die gleichen diagnostische Schlusse gezogen werden.

Gewährliestet durch kriterialle standars.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q
  1. Worauf sollte nach Sacher (2009) bei der Planung und Durchführung einer Prüfungssituation geachtet werden?
    ❏ Die Prüfung sollte allgemein nach Möglichkeit nicht länger als 90 Minuten dauern
    ❏ Hinweise über die noch verbleibende Bearbeitungszeit sollen vermieden werden
    ❏ Hilfsmittel, die im Unterricht verwendet wurden, sollten auch in der Prüfung erlaubt sein «««
    ❏ Die Prüfung sollte möglichst im selben Raum stattfinden wie der reguläre Unterricht

Respuesta: Diagnostig Vl 4, S. 17

  1. Eine Kollegin aus der Grundschule berichtet ihnen, dass sie bei der Durchführung von VERA ihren SuS kleine Hilfestellungen bei der Bearbeitung der Aufgaben gegeben hat, um den Test in der vorgesehenen Zeit zu schaffen. Was antworten Sie ihr folgerichtig?
    ❏ „Das verringert die Auswertungsobjektivität.“
    ❏ „Das verringert die Durchführungsobjektivität.“«««<
    ❏ „Das verringert die Testökonomie.“
    ❏ „Das verringert die Interpretationsobjektivität.“

Respuesta: nicht ganz so klar: Diagnostig Vl 4, S. 17

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wie lässt sich die Auswertungsobjektivität bestimmen?

A

Auswertungsobjetivität: Leistung sollte die Punktzahl entsprechen. Abhängig von dem Schuler (Vorliebe?).

geährleitet durch:
klare regeln ür öffene fragen

Überprüfung durch Übereinstimmung von Auswertungsergenisse von unabhängigen Bewerterinen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Die interne Konsistenz eines Mathematiktests beträgt  = 0,62.
Erläutern Sie, was dies bedeutet. Nennen Sie eine Maßnahme,
durch die sich Cronbachs Alpha erhöhen ließe.

A
  • Reliabilität – interne Konsistenz – durchschnittliche Korrelation aller Items einer Skala // gibt Auskunft über die Homogenität eines Tests oder einer Skala // Verwendung sinnvoll, wenn alle Items eines Tests das gleiche Merkmal messen sollen
    ● Je größer das Alpha, desto höher die interne Konsistenz - perfekter interner Konsistenz beträgt Alpha +1,00
    ● Formel: n = Zahl der Items im Test // r= Mittelwert aller Korrelationen zwischen den Items
  • Erhöhung von Cronbachs Alpha durch Erhöhung der Anzahl der Items (n) bei gleicher Korrelation (r)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Erläutern Sie die Begriffe „Standardmessfehler“ und
„Vertrauensintervall“. In welchem Zusammenhang stehen diese
Maße zur Reliabilität eines Tests?

der Standardmessfehler (SE, standard error) ist ein Maß für die Ungenauigkeit von Messungen

A

En Messfehler ist ein Maß für die Ungenauigkeit. Geringe reliabilität bedeutet hohe Messfehler
Messfehler ist das Gegenteil von Präzision (relliabilität)

Messfehler wird mit dem Standard Messfehlöer quantifiziert.

Mariana:
kein vollkommen messfehlerfreies Testverfahren ¦ beobachteter Wert ist nur Schätzung des wahren Wertes ¦ Vertrauens- bzw. Konfidenzintervalle zur Beurteilung der Präzision dieser Schätzung ¦ wahrer Wert liegt innerhalb der Grenzen dieses Intervalls

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Reliabilität: existen 5 tipos:
Wiederholungs, Pralleltest, split-half, innere/interne reliabilität

Innere/interne ist wichtig für uns: Cronbachs Alpha

Cronbachs Alpha: Maß zur Berechnung der internen Konsistens einer aus mehreren Items zusammengesertzen Skala eiens testes,

JE GRÖ?ER DAS AlPHA; DESTO HÖHER DIE INEERNE KONSISTENZ
Perfekter interne Konsistenz ist: alpha +1,00 (1 como en standarabweichung)

je großer die anzahlö der items, desto reliabler (präuzis) der test.
no olvidad que todas las Messungen, tienen errores, por lo tanto, mientras mas items tenga, entionces es mayor la Reliabiliät, es decir la precision. y se reducen los Messfehlöer

Störeinflusse (Objektivität) reduziert duch mehr Items.

je mehr gut konstruierte Items eine Messinstrument hat, desto präziser wir die Messung sein

___________________________________________________________

  1. Wie kann die Reliabilität einer Klausur am ehesten gesteigert werden?
    ❏ Indem man den Themenbereich der Klausur erweitert.
    ❏ Indem man die schwierigen Aufgaben in der Mitte der Klausur platziert.
    ❏ Indem man die Zahl der Klausuraufgaben erhöht.«««
    ❏ Indem man die zur Klausurbearbeitung vorgegebene Zeit erhöht.
A

Reliabilität bedeutet: man kommt zu den gleichen Ergebnissen, so das wir sicher sind, dass das Verfahren funktioniert.

Interne reliabilität lässt sich bestimmen, indem ein test nur einmal eingesetzt wird.

  • jedes ITEM ist nur eine als eigene Messung zu tebrachten. test muss in einzelne Bestandteile (Items) zerlegen.

Frage ist:Ob die Messung mmit den einzelnen Items zu ähnlichen Ergebnissen führen. >Bsp: SuS, die auf dem 1 Item hohe Messwerte erzielt haben, tendenziell auch auf dem 2 Item, dem 3, etc, hohe Messwerte erzielen
Und umgekehrt. niedirge Messwerte in den 1 und in den folgenden erzielt haben

Ich gebe den Test nur einmal vor, und schaue, inwieweit die Messwerte der einzelnen Items untereinander korrelieren. Dann berechne die durschnittliche Korrelation der Messwerte aller Items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

VL 5 Güterkriterien der lesitungsüberprüdung II

Welche Arten von Validität kennen Sie? Erläutern Sie diese kurz
anhand eines Beispiels.

konstruktsvalidität:

bei der entwiclung eines messverfahrens muss ich erstmal genau definieren, welches konstrukt ich erfassen will und wie diese konstrukt beschaffen ist.
Aufgrund dieser Defininrion werden items entwickelt, die das konstrukt möglichst gut abdeken sollen.
Bei der Validierung des Messverfahrens überprüfe ich: inwieweit dies gelungen ist,.

anhand von diesem kreislauf Blum 2005. Für d ie Validierung des testverfahrens zur erfassung mathematischer modellierungsfähigkeit bedeutet:

dass es ist zu überprüfen, inwieweit die aufgaben in diesem test diese theorethisch Schritte erfordern.

Durch experten prüfen lassen: die sagen dann, inwieweit die modellierungsfähigkeit mit diesen aufgaben erfasst wird.

esxperten geben ein indikator für inhaltsvalidität

man kan auch die Kriteriumsvalididtät überprüfen.
Dann kann man besser wissen, inwieweit das kosntrukt mit dem test erfasst wird und alles gemeinsam würde die konstruktvalidität konstituieren

  1. Eine Lehrerin prüft zu Beginn der 5. Klasse mit einem Kurztest die Grammatikkenntnisse der Schülerinnen und Schüler in Englisch. Direkt im Anschluss nach dem Kurztest lässt sie
    die Schülerinnen und Schüler angeben, wie sie selbst ihre Grammatikkenntnisse in Englisch einschätzen. Am Ende der 5. Klasse notiert sie außerdem noch die Noten der Schülerinnen
    und Schüler in den Fächern Englisch und Mathematik. Welche Art der Kriteriumsvalidität kann sie für den Kurztest anhand dieser Daten nicht untersuchen? (VL 5: F15 ff)

❏ Die konkurrente, divergente Kriteriumsvalidität
❏ Die konkurrente, konvergente Kriteriumsvalidität
❏ Die prognostische, divergente Kriteriumsvalidität ««
❏ Die prognostische, konvergente Kriteriumsvalidität

A

Frage der Validität:

messen wir mit unserem Insrtument das, was wir messen wollen.
Nicht Validität wäre: wir erfassen ungewollt etwas anderes.
Wird das Zielkosntrukt (Prufung?) inhaltlich erfasst?

Arten von Validität:

Inhaltsvalidität: Aufgaben (items) erfassen das Konstrkt vollständig. Orientierung am Lehrplan. Empirisch belegbar anhand Experten.

Kriteriumsvalidität: empirische Validität.
Idee: Zusammenhänge zwischen den Ergebnissen der Personen in ihren Test und externen Daten, die die LK mit ANDEREN Verfahren erhebt. Diese ANDEREN VERFAHREN sind Kretierien von woanders.

Es gibt 3 Dimensionen innerhalb der Kriteriumsvalidiätt:
1- nnere vs äußere
-innere: se comparan los resultados de los alumnos en los items mediante la comparacion con otros estudios comprobados que tienen items similares. Si todo sale bien, entonces es kriterial.

-äußere: Einschätzung de Leistung durch Lehrkräfte
Konstruktsvalidität.

2 - konvergente vs divergente
- Konvergent: wird mit dem Kriterium der gleiche Merkmalsbereich erfasst, wie mit meinem <test. Sollte man nachweisen, dass eine übereinstimmung gibt.

  • divergent: anderer Merkmalsbereich:
    es könnte der Verdacht bestehen, dass der test nicht spezifisch mathematische modellierungsfähigkeiten erfasst, sondern etwas wie allgemein intelligenz. Man muss prufen, ob einen intelligentsets einzestz als auch den test zur erfassung mathematischen modellieroungsfehigkeiten.
    Durch eine korrelation, es sollte nich so hoch sein (nocht nur intelligenztets). bzw nicht ein test der spezifisch mathematische modellföhigkeiten erfasst

3 - konkurrente vs prognostische

konkurrent: hier wird das Verfahren eingesetzt, das zu validieren ist, und gleichzeitig das Kriterium erhioben.

prognostisch: zu einem spätrem Zeitpunkt erhoben. Relevanz bei: ich will mit meinem test (Messverfahren) etwa zu erfassen, welche für die Zukunft relevant ist

Bsp: dann mein Messverfahren in der 10 klasse einsetzen (mittelere Abschluss) und zu einem späteren Zeitpunkt. (abtirur note in mathe)
Dann sollte ein Zusammenhang geben zwischen den im test erzielten leistungen in der 10 Klassen und der ezielten Noote in der Abiturnote im Mathe. bzw OIndikatoren bei berufsabschluiss.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Welche Zusammenhänge bestehen zwischen Objektivität, Reliabilität
und Validität?

A

es gibt einen zumsammenhang

Validität: das wichtigste. Wenn das Messverfahren nicht misst, was er messen sollte, dann egal reliabilität und objektivität (inhaltlihe Hierarchie)

bei der überprüfung der Güterkriterien (messtechnischch) geht man so vor:
1- objektivität: 2 unabhängige personen kommen nicht zu gleichen ergebniss. dann keinen sinn mehr

dann reliabilität: inwieweit das Verfahren präzise misst. Bei hohe Präzision, dann kann man Validität überprüfen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Welche Nebengütekriterien kennen Sie? Erläutern Sie diese kurz.

___________________________________

  1. In einer Mathematikklausur, die überwiegend aus Sachaufgaben besteht, erzielen neuzugewanderte SuS mit geringen Deutschkenntnissen systematisch schwächere Leistungen als ihre Mit-SuS ohne Zuwanderungshintergrund. Worauf könnten diese Leistungsunterschiede zurückzuführen sein? Die Matheklausur…

❏ … hat eine differenzielle Auswertungsobjektivität.
❏ … hat eine differenzielle Validität.«««««««
❏ … verfügt über eine zu geringe Kriteriumsvalidität.
❏ … ist nicht ausreichend reliabel.

A

-Zeitökonomie

-Zumutbarkeit (lo exigible)

-velgelicbarikeit: (Differenzielle Validität)
la prueba debe ser para todos igugal. medir para todos lo mismo.
Ein test, der differentiel valide ist, misst bei bestimmten teilgruppen von S etwas anders als bei anderen Teilgruppen von S
Wenn ein Test bestimmte Teilgruppen systematisch benachteiligt, ist
dieser Test „differenziell valide“.

-Unverfälschbarkeit: sozial erwünschte Antworten bei der Untersuchung

-praktische Nutzlichkeit: praktische Bedarf, das für etwas genutzt werden kann.

26
Q

Sie wollen die Lesefähigkeiten der Schüler*innen einer
6. Klasse mit einem Schulleistungstest erfassen. In der Klasse haben
Sie einen Schüler aus Italien, der erst kürzlich nach Deutschland
gekommen ist und in dem Lesetest schlecht abschneidet. Welches
Gütekriterium dürfte der eingesetzte Leistungstest verletzt haben?
Begründen Sie Ihre Antwort.

A
27
Q

Überlegen Sie sich für ein Fach, das Sie später unterrichten werden,
inwiefern bei Klassenarbeiten differenzielle Validität entstehen
könnte und beschreiben Sie diese.

A

-velgelicbarikeit: (Differenzielle Validität)
la prueba debe ser para todos igugal. medir para todos lo mismo.
Ein test, der differentiel valide ist, misst bei bestimmten teilgruppen von S etwas anders als bei anderen Teilgruppen von S
Wenn ein Test bestimmte Teilgruppen systematisch benachteiligt, ist
dieser Test „differenziell valide“.

28
Q

6 - Arten der Leistungsüberprüfung I

Was versteht man unter Normierung und wozu dient sie? Was
ist bei der Auswahl der Normierungsstichprobe zu beachten?

Norma de un Test: sistema de referencia para relativizar el rendimiento (capacidad, resultado) de un test individual (relativieren: zu etwas anderem in Beziehung setzen und dadurch in seinem Wert o. Ä. einschränken). Se utiliza para poner un test individual en la norma de los test.

Curriculumsinhalte bzw. Bildungsstandards und
Kompetenzstufenmodelle können Anforderungen im Sinne
einer kriterialen Bezugsnorm definieren.

los contenidos de los bildungstandars pueden definir las Exigencias en relacio a una kriteriale Bezugsnorm.
Sin embargo se en algunos test de rendimiento se usa la soziakle Bezugsnorm.
- Para la interpretacion de un test se utilizan NORMSKALEN (IQ Weert, T-wert)

ist bei der Auswahl der Normierungsstichprobe zu beachten?
- Las personas deben ser representativas

Normienrungssichprobe:

Referenzpoulation: Grupo de personas, a las cuales se les hace Proceso

Normierungsstichprobe: Grupo de personas que son representativas para la Referenzpopulation. A ese grupo de personas se les pone bajo prueba para sacar Normwerte

Wozu dient sie?
Se utiliza para emitir Valores de COmparacion

________________________________________

  1. Welches ist eines der offiziellen Ziele, die mit der Einführung von Bildungsstandards
    verbunden sind?
    ❏ Eine höhere Vergleichbarkeit von Abschlüssen «««
    ❏ Eine bessere Vorbereitung von Schülerinnen und Schülern auf die PISA-Studien
    ❏ Eine stärkere Input-Orientierung des Unterrichts
    ❏ Eine stärkere Motivierung der Schülerinnen und Schüler
A
  • Normierung: dient zur Ermittlung von Vergleichskennwerten
  • Normierungsstichprobe: Gruppe von Personen, die repräsentativ für
    die Referenzpopulation ist

otra respuesta:

Unter Normen versteht man ein repräsentatives Bezugssystem zur Relativierung einer
individuellen Testleistung.
- individueller Bezug (frühere Leistungen)
- kriterialer Bezug (Lernziel/Kriterium)
- sozialer Bezug (repräsentative Vergleichsgruppe) (Referenzpopulation: Personengruppe, für die das Verfahren konzipiert ist)
Normierungsstichprobe / Eichstichprobe: Gruppe von Personen, die repräsentativ für die Referenzpopulation ist und zur Gewinnung von Normwerten getestet werden (dient zur Ermittlung von Vergleichskennwerten)

_________________________________________________

  1. Welchen besonderen Vorteil bietet die Anwendung einer individuellen Bezugsnorm im
    Vergleich zur sozialen bzw. kriterialen Bezugsnorm?
    ❏ Die Validität der Grundschulempfehlung für die weiterführende Schulform lässt sich besser abschätzen
    ❏ Veränderungen der Stärken und Schwächen der jeweiligen Schülerin bzw. des jeweiligen Schülers werden sichtbar «««
    ❏ Überdauernde Leistungsunterschiede zwischen Schülerinnen und Schülern werden
    sichtbar
    ❏ ​Der Anteil der Schülerinnen und Schüler, die die Mindestkompetenz erreichen, lässt
    sich erfassen
29
Q

22.Um zu überprüfen, inwieweit SuS über die in den Bildungsstandards der KMK beschriebenen Kompetenzen verfügen, werden neben Testaufgaben auch Kompetenzstufenmodelle entwickelt. Welche der folgenden Aussagen über die verschiedenen Kompetenzstufen trifft zu?

❏ Die Regelstandards sind vorab festgelegte kriteriale Normen zur Beurteilung von Kompetenzen.
❏ Die Mindeststandards beschreiben Kompetenzen, die von den SuS bis zu einem bestimmten Bildungsabschnitt im Durchschnitt erreicht werden sollen.««««<
❏ Die Optimalstandards beschreiben Kompetenzen, über die alle SuS nach Abschluss der gymnasialen Oberstufe verfügen sollten.
❏ Die Regelstandards Plus beschreiben Kompetenzen, denen eine individuelle Bezugsnorm zugrunde liegt

A
30
Q
  1. Grenzen Sie norm- und kriteriumsorientierte Tests in 2-3 Sätzen voneinander ab.
A

Tests mit sozialer Bezugsnorm: ermöglichen Beurteilung individueller
Testleistungen im Vergleich mit Testleistungen einer Referenzpopulation;
Vergleiche mit sozialer Bezugsnorm erfolgen über Standardnormen (T-Wert,Z-Wert) oder Prozentrangnormen

  • Tests mit kriterialer Bezugsnorm: liefern Messwerte, die direkt in Bezug auf einen spezifischen Leistungsstandard interpretierbar sind

_____________________________________________________________________________
otra respuesta

Tests die sich an der sozialen Bezugsnorm orientieren (Normalverteilung Leistungen), beurteilen die individuelle Testleistung im Vergleich mit Testleistungen einer Referenzpopulation (über Standardnormen z-/T- Werte, oder Prozentrangnormen).
Bei Tests, die sich an der kriterialen Bezugsnorm orientieren (Lehr-Lernziele, Standards) wird die Festlegung, wie viele Aufgaben für die Erreichung einer Ziffernnote nötig sind, VOR der Durchführung vorgenommen

31
Q
  1. Nennen Sie je ein Beispiel für einen formellen,
    kriteriumsorientierten Schulleistungstest und einen
    informellen, normorientierten Schulleistungstest. Was sind die
    zentralen Eigenschaften dieser beiden Typen von Tests?
A

formelle, kriteriumsorientierte Schullelistungstest:

  • Die Entwicklung eines Tests basiert auf eine TestTHEORIE
  • Die haben eine systematische Auswahl von Aufgaben: zuerst konstrukt definieren und festlegen, welche aspekte das konstrukt umfasst. Dann potenziele Aufgabeuniversum definieren, aus dem wir eine systematische auswahl treffen, um zu gewährleisten, dasss das kosntrukt gut erfasst ist
  • hohes Maß an Standardisierung bzgl. Testdurchführung, Testauswertung und Interpretation: Trifft das Merkmal der Objektivität
  • Überprüfung der Testgütekriterien (zumindest Objektivität und Reliabilität): bei objektivität ist wichtig hier, zu prüfen, inwieweit bei offenen Antwortformate unterschiedliche Beurteiler zu den gleichen Urteilen kommnen
  • häufig an großen Stichproben normiert / geeicht

______________________________________________________________________________
informelle, normorientierte Schulleistungstest (trotz informal: sollten sie
objektiv, präzis, reliable sein)

  • selbst entwickelte Verfahren von Pädagog*innen in der
    Schulpraxis
  • basieren zwar implizit oft auch auf testtheoretischen
    Annahmen, die Gütekriterien bleiben jedoch meist ungeprüft
  • Auswahl von Aufgaben sollte ebenfalls systematisch, gut
    begründet erfolgen (systematisch: was will man genau erfassen?
    Konstruktbereich bestimmen)
  • psychometrische Qualität ist häufig gering (objektivität ist auch eingeschräkt)
  • nicht normiert / geeicht
  • in der Regel unterrichtsnah, direkt auf Lehr-Lernziel bezogen: wichtig für formative Lerndiagnostik
  • insbesondere für formative Lerndiagnostik geeignet:
    man will hier wissen:
    Inwieweit die S die Ziele erreichen und an welchen Stellen noch nachzubessern ist.
  • können in der Summe aber durchaus auch für Selektionsentscheidungen geeignet sein: Diese informelle testungen, die werden zusammengefasst zu einer gesamtnote. Abiturnote predektiert eine guten Studienerfolg.

________________________________
formellen, kriteriumsorientierten Schulleistungstest: Abitur, MSA, DeMat, Vera

Beispiel formell, kriteriumsorientierter Schulleistungstest: Mathematik - DEMAT
Beispiel informell, normorientierter Schulleistungstest: meistens Klassenarbeiten

32
Q
  1. Eine Schülerin Ihrer Klasse schneidet in einem standardisierten
    Grammatiktest schlecht ab. Wie interpretieren Sie das
    Ergebnis, wenn es sich um einen Test mit sozialer Bezugsnorm
    handelt? Wie bei einem Test mit kriterialer Bezugsnorm?
    Erklären Sie den Unterschied.
A

sozialer Bezugsnorm: nicht nur ihre Leistungen, sondern auch der Gruppe
müssen beachtet werden ->
- kriterialer Bezugsnorm: als Individuum schneidet sie schlecht ab

_______________________________
otra respuesta

  • bei sozialer Bezugsnorm: Niveau der Klasse möglicherweise sehr hoch
  • bei kriterialer Bezugsnorm: Schülerin hat noch nicht die nötigen Kompetenzen erreicht
33
Q

Sitzung 7 – Arten der Leistungsüberprüfung II

1 - Ein neuer Referendar an Ihrer Schule muss demnächst seine
erste Klassenarbeit im Fach Englisch schreiben lassen. Er
bittet Sie, ihm einige Hinweise zu geben, was er bei der
Erstellung der Klassenarbeit zu beachten hat. Skizzieren Sie in
2-3 Sätzen, welche Aspekte der Referendar berücksichtigen
sollte.

Grundsatz der proportionale Abbildung:
-nicht alle Themen sind gegenstand der Prüfung.
- man sollte eine Stichprobe ziehen.
- Auswahl sollte ein repräsentative QUerschnitt des vorangegangenes Unterrichts darstellen (verkleinteres Abbild von dem Behandelte themen Im Unterricht
das heißt:
- Die Prüfungsinhalte sollen das implementierte Curriculum valide repräsentieren.
- wichtige Inhalte sollten im Unteerricht intensiver thematisert werden

Grundsatz der Bedeutsamkeit:
Bedeutsamkeit bezogen auf das weitere Lernen im Fach, also Inhalte, die grundlegend sind für das weitere Lernen sollten INTENSIVER behandelt werden.

Grundsatz der Variabilität:
- Es bezieht sich auf die Form der Prüfung
- Prüfung sollte abcheslungsreich gestaltet sein, um differenzielle Validität zu vermeiden (Also um Benachteiligung Einzelner abzumildern)
- Einige S sind besser im mündlichen Prüfungen, andere schriftlich

A

Prüfungskonzeption:
- Inhalt der Prüfung & Form der Prüfung (Form: Propoirtionale Abbildung (Aufgabetypen in der Prüfung, die im Unterricht auch vorkommen worden sind))

  • Grundsatz der Bedeutsamkeit - Bedeutsamere Inhalte sollten weniger bedeutsamen (wichtige Inhalte sollten stärker berücksichtigt werden) vorgezogen werden
  • Grundsatz der proportionalen Abbildung - Prüfungsinhalte und -formen müssen das implementierte Curriculum valide repräsentieren
  • Grundsatz der Variabilität - Prüfungen sollten abwechslungsreich gestaltet sein, um differentielle Validität zu vermeiden
  • Auswahl der: Prüfungsinhalte, Aufgabenform, Anforderungsbereichs, Aufgaben- und Prüfungsumfang, Formulierung der Aufgaben, Reihung der Aufgaben
34
Q
  1. Was müssen Sie bei der Wahl von Aufgabenformaten für schriftliche Prüfungen beachten?

❏ Geschlossene Aufgaben weisen grundsätzlich einen höheren Messfehler auf als offene Aufgaben, sind aber einfacher auszuwerten.
❏ Halboffene Aufgaben sind grundsätzlich nicht reliabel und inhaltsvalide.
❏ Offene Aufgaben eignen sich grundsätzlich für die Erfassung kreativer Leistungen, eine objektive Auswertung ist aber oftmals schwer zu erreichen.««««««<
❏ Mit geschlossenen Aufgaben lässt sich ein tieferes Verständnis von Inhalten grundsätzlich nicht prüfen.

Respueta: Diagnostik VL 7, S. 26

A
35
Q
  1. Im Fach Biologie wollen Sie prüfen, inwieweit Ihre
    Schüler*innen Aufbau und Funktionen der Zelle verstanden
    haben. Welche Prüfungsform würden Sie wählen? Begründen
    Sie Ihre Entscheidung.

porportionalität: es sollten die Aktivitäten im Unterricht entsprechen

Variabilität: es sollten möglichst vielfältige Prüfungsformen verwendet
werden, um unterschiedlichen Präferenzen gerecht zu werden

__________________________________________________________

  1. Bei der Konzeption von Prüfungen sollten verschiedene Grundsätze beachtet werden.

Welcher der nachfolgenden Grundsätze gehört nicht dazu?
❏ ​Prüfungen sollten bedeutsamere Inhalte weniger bedeutsamen vorziehen (Grundsatz der Bedeutsamkeit)
❏ Prüfungen sollten in Inhalt und Form abwechslungsreich gestaltet sein (Grundsatz der Variabilität)
❏ Prüfungen sollten aus der Vielfalt behandelter Themen ein Thema fokussieren (Grundsatz der Spezifik)««««
❏ Prüfungen sollten in Inhalt und Form das Curriculum repräsentieren (Grundsatz der
Proportionalität)

A

Schriftlich
● Anforderungsbereich II möglich : Reorganisation und Transfer von Zellarten
● Tiefenprüfung(wenige umfangreiche Aufgaben): “Grundkönnen” geschlossene
Aufgabe den Aufbau einzeichnen, halboffen die Funktion beschreiben ( Variabilität für Begabungstypen)
● Proportionalität zum Unterrichtsstoff

36
Q
  1. Wie lässt sich die Auswertungsobjektivität bei der
    Aufsatzbeurteilung erhöhen?
A

Entwicklung eines differenzierten Kriterien- und Bewertungsrahmens

37
Q
  1. Was versteht man unter dem Reliabilitäts-Validitäts-Dilemma?
  • es ist schwieriger hohe Zuverlässigkeit und höhere Reliabilität zu erreichen.
  • es ist schwieriger hohe Zuverlässigkeit und höhere Reliabilität zu erreichen.

_____________________________________________

A

● Prüfungen mit vielen kleinen Aufgaben sind reliabler.
- Prüfungen mit komplexen Aufgaben sind (bei gleicher Reliabilität) in der Regel valider, wenn es um die Erfassung anspruchsvoller Kompetenzen und anzheitlicher Fähigkeiten geht.
● Prüfungen mit vielen kleinen Aufgaben sind in der Regel valider, wenn es um die Erfassung der gesamten Breite eines Kompetenzbereichs geht.
● zu beachten: Stichprobenfehler bei der Aufgabenauswahl

38
Q
  1. Wie lässt sich der Messfehler bei schriftlichen Prüfungen
    reduzieren?

Probleme von Aufsatzarbeiten
geringe Zahl von Aufgaben (reliabilität bzw. Messfehler)

  • Nicht vergessen je großer die Anzahl der Messung, die ich durchführee um ein konstrkt zu erfassne, desto g eringer der Messfehler (präziser ist der Ergebniss)
A

Mehrfachbeurteilung, Bewertungsschemata ( Auswertungs- und Interpretationsobjektivität)
Analyseeinheiten und Dimensionen anhand Kriterien- und Bewertungsrahmen beurteilen

39
Q
  1. Einer Ihrer Kollegen nimmt das erste Mal als Beisitzer an den
    mündlichen Abiturprüfungen im Fach Physik teil, bei der Sie der
    Prüfer/die Prüferin sind. Vorab treffen Sie sich, um die Prüfung
    angemessen organisieren zu können. Welche Punkte müssen
    Sie dabei beachten? Geben Sie Ihrem Kollegen Beispiele für
    eine gelungene Umsetzung der Organisation mündlicher
    Prüfungen.
A

● Ziel: Komplexität reduzieren, Mindestmaß an Vereinheitlichung erzielen
● Raster festlegen: wie viele Fragen aus welchen Teilbereichen, welches Niveau, Ausprägungsgrade definieren und über Punktzuweisungen bewerten
● Aufbau: fester Anteil vorgefertigter Fragen, die in der Situation nur leicht variiert werden, sowie fester Anteil improvisierter Fragen
● adaptiver Charakter: Reihung der Fragen offen lassen und angemessene
Hilfestellungen geben
● Basis der Bewertung: kriteriale Bezugsnorm
● Flüchtigkeit: wichtigste Schülerantworten sowie improvisierte Fragen umgehend protokollieren
● Vorgreifend: Förderung der kommunikativen Kompetenz der Schülerinnen und Schüler

40
Q
  1. Eine Kollegin, die das Fach Deutsch unterrichtet, hat einen
    Aufsatz zum Thema „Sollten Noten abgeschafft werden?“
    schreiben lassen. Bei der Auswertung des Aufsatzes hat sie je
    eine Teilnote für Inhalt und Form des Aufsatzes vergeben und
    daraus die Gesamtnote für jeden Schüler errechnet (Mittelwert). Würden Sie ein ähnliches Vorgehen wählen? Warum (nicht)?
A

Nein, einen differenzierteren Kriterien- und Bewertungsrahmen ( kleinere Analyseeinheiten:
Aufbau, Stil, Grammatik) + Transparenz in verbaler Beschreibung bei Rückmeldung
Mittelwert der Note zeigt sonst kein Leistungsprofil an ( informiert nur über Gesamtleistung - wenn Inhalt sehr gut und Form sehr schlecht Mittelwert nicht sinnvoll), keine Hinweise für zukünftige Lernprozesse

41
Q

08 - Arten der Leistungsbewertung

  1. Was versteht man unter einem Benotungsmodell?

Benotungsmodell: Regel oder Regelsystem, das Schülerleistungen Bewertungen zuweist

Anforderungen

  1. Eindeutigkeit → gleiche Noten für gleiche Leistungen
  2. Bezugsnormorientierung → Verträglichkeit (Compatibilidad) mit der jeweiligen Bezugsnorm (i.d.R. kriterial):
    - bei schulen, wo die Eingangsvoraussetzungen ungünstig sind, dann kann es passieren, dass wenn man eine kriteriale bezugsnorm anwendet, dass 1 oder 2 nie vergeben werden. Nicht gut für die Motivatin

man braucht eine gewise flexibilität bei der anwendung der kriterialen bezugsnorm

  1. Entscheidungsökonomie → Anzahl der Entscheidungen zur
    Notenfindung sollte nicht zu groß sein, regelgeleitete
    Differenzierung
    - übersetzung von Leitungen in Noten sollte nicht zu kompliziert sein
  2. Fehlerkontrollierte Zuweisung von Noten zu Leistungen
    → Vergabe von Noten sollte im Bewusstsein der damit
    verbundenen Messfehler geschehen:
  • messung der leistung selbst als auch die Übersetzung der gemessenen noten sind mit Fehlern verbunden.

also der Anzahl der Punkte ergeben eine bestimmte note (diese sind mit Felhern verbunden)

Man sollte dies ausnutzen: z.b: ein Punktmittelwert wäre ein 4 aber es ist nah am 3, diese S hat sich gut entwicklent, dann ich vergebe ihm eine 3, obwohl mein Betonungsmodel ein 4 sagt.

  1. Flexibilität bei kriterialer Bezugsnorm → Anforderungen müssen in gewissem Maße an das Leistungsniveau der
    Schüler*innenschaft angepasst werden

______________________________________________________

  1. In der Lehrkräftekonferenz Ihrer Schule haben Sie die Vereinheitlichung der Benotungsmodelle vereinbart. Nach der Sitzung kommt ein neuer Referendar auf Sie zu und
    fragt Sie, was man unter einem Benotungsmodell versteht. Was antworten Sie?
    ❏ Ein Benotungsmodell bezeichnet die Kompetenz, über die einer Schülerin bzw. ein Schüler mindestens verfügen muss, um die Note 4 zu erreichen
    ❏ Ein Benotungsmodell definiert, welche Bezugsnormen bei der Bewertung von Schülerleistungen zu welchem Zweck bzw. zu welchem Zeitpunkt im Unterricht
    angewendet werden.
    ❏ Ein Benotungsmodell ist eine Benotungsskala, die weitgehend von Messfehlern bereinigt ist
    ❏ Ein Benotungsmodell ist eine Regel oder ein Regelsystem, anhand dessen den individuellen Schülerleistungen Bewertungen zugewiesen werden. «««<
A

● Benotungsmodell = Regel oder Regelsystem, das Schülerleistungen Bewertungen zuweist

● Basisbenotung: Zielerreichung versus Zielverfehlung: ab wann ist ein Ziel erreicht bzw. verfehlt?

● differenzierte Benotung:
- Schulnoten: sehr gut (1) bis ungenügend (6)
- Punktwerte: 0 bis 15 Punkte
- amerikanische „grades“: A bis D und F (failed)

42
Q
  1. Bei einem Elterngespräch erklärt ein Lehrer die schwachen
    Leistungen eines Schülers in einer Klausur zum Thema
    Stochastik damit, dass er in der Klasse allgemein zu den
    schwächsten Schüler*innen gehört. Auf welche
    Bezugsnormorientierung weist diese Erklärung des Lehrers
    hin? Inwiefern ist dies problematisch?
A

● soziale Bezugsnorm
● problematisch, weil Leistungsmessung an inhaltlicher Anforderung statt an Niveau der Klasse stattfinden sollte ( individuell oder am besten kriterial)
● Normalverteilung nur theoretisch und nicht Ziel pädagogischer Förderung

43
Q
  1. Welche Schwierigkeiten ergäben sich, wenn man für die
    schulische Leistungsbewertung ausschließlich die
    individuelle Bezugsnorm zugrunde legen würde?
A

Benotung sollte letztlich auf kriterialer Bezugsnorm basieren.

Zeigt zwar individuellen Lernzuwachs, kann aber zufallsbedingt schwanken + Ungleichgewicht der Veränderungsmöglichkeiten

“Mindestkompetenz” durch krit. Bezugsnorm festgelegt - Kompetenzgrad für erfolgreiches Weiterlernen auf dem Gebiet

44
Q
  1. Worin bestehen Vor- und Nachteile von Ziffernnoten?
A

● mit sechs Abstufungen sind als Raster zu grob. … sind starr, unflexibel. … sind weniger aussagekräftig als verbale Beurteilungen.
● informieren nur über Gesamtleistungen, nicht über Leistungsprofile.
● informieren nur über Endleistungen, nicht über Lernprozesse.
● erlauben keinen Rückschluss auf die zugrundeliegende Bezugsnorm.
● enthalten keine Hinweise für zukünftige Lernprozesse

45
Q
  1. Eine Lehrerin aus Ihrem Kollegium hat eine Klassenarbeit
    entworfen und dafür einen Erwartungshorizont erstellt.
    Nach Korrektur aller Arbeiten stellt sie fest, dass die
    Klassenarbeit sehr schlecht ausgefallen ist und beschließt,
    die Zuordnung der in der Arbeit erzielten Punkte zu den
    einzelnen Noten zu ändern. Was könnte an diesem
    Vorgehen problematisch sein?
A

kriteriale Bezugsnorm hat vorher die Mindestkompetenz festgelegt - diese sollte sich nicht plötzlich ändern (Kriterium Lernbedeutsamkeit)

46
Q
  1. Sie wollen die in Ihrem Unterricht in Mathematik
    angestrebte Mindestkompetenz definieren. Beschreiben Sie
    kurz, wie Sie dabei vorgehen könnten und worauf Sie
    achten müssen.
A

● Mindestkompetenz als das Können, das man von allen Lernenden erwartet, und dem gerade noch die Note 4 zugewiesen werden kann.
● Empirisch fundierte Definitionen sind bisher nur bedingt verfügbar (siehe Kompetenzstufenmodelle des IQB, die aber stark an der sozialen Bezugsnorm orientiert sind).
● Orientierung an Lehrplänen, Schulbüchern für nachfolgende Jahrgänge und andere Schularten.
● Vergleichsarbeiten, Abschlussprüfungen
● Austausch mit Kolleginnen und Kollegen, die Schülerinnen und Schüler übernehmen werden.
● Eines Tages vielleicht: kriterial definierte Mindeststandards

47
Q
  1. In Schweden erhalten Schüler*innen bis zur 8. Klasse
    keine Noten, sondern eine schriftliche Dokumentation ihrer
    Leistungen. Beschreiben Sie kurz, welche Vorteile und
    welche potenziellen Probleme damit verbunden sind und
    worauf beim Erstellen der Dokumentation geachtet werden
    sollte.
  2. Worauf sollte bei der Formulierung von Verbalzeugnissen nach Arnold (1997) geachtet
    werden?
    ❏ Verhaltensnahe Formulierungen sollten vermieden werden
    ❏ Die Lehrkraft sollte sich bemühen, die Persönlichkeitseigenschaften des Kindes möglichst präzise zu beschreiben
    ❏ Zur genauen Einschätzung des Leistungsstands sollten Vergleiche mit anderen Schülerinnen und Schülern herangezogen werden.

❏ Das Lern- und Arbeitsverhalten sollte getrennt vom Lernerfolg beschrieben werden«««««

A

+ informieren über Leistungsprofile und Lernprozesse
+ erlauben Rückschlüsse auf zugrundeliegende Bezugsnorm
+ Hinweise für zukünftige Lernprozesse
- Verständlichkeit fraglich (kann durch Erläuterung verbessert werden)
- Probleme in Messgüte, ähnlich wie bei Ziffernnoten
Formulierungshinweise:
-Verhaltensweisen statt Persönlichkeitsmerkmale
-keine interpersonellen Vergleiche
- möglichst präzise Verben, konkrete und verhaltensnahe Formulierungen
- quali + quanti Aussagen mit Angabe Bezugsnorm
- präzise Lernempfehlungen, Lern- /Arbeitsweisen und Lernerfolg getrennt adressatInnengerechter Stil

48
Q

9 - Diagnostische Kompetenz von Lehrkräften und Urteilsfehler

  1. Klassenmerkmale sowie Merkmale von Lernenden können die
    Genauigkeit von Lehrkrafturteilen entscheidend beeinflussen.
    Nennen Sie aus jedem Bereich jeweils ein Beispiel für einen
    Faktor, der die Diagnosegenauigkeit einschränkt.

____________________________________

  1. Klassenführung ist eines der Merkmale von Unterrichtsqualität. Durch welches der folgenden Merkmale zeichnet sie sich vor allem aus?

❏ Durch einen gut geplanten Unterrichtsablauf ««<
❏ Durch einen konstruktiven Umgang mit Fehlern
❏ Durch die Ermöglichung selbstgesteuerten Lernens
❏ Durch den Einsatz vielfältiger Methoden

________________________________________________________________

  1. Mit welcher Maßnahme dürfte sich die diagnostische Kompetenz von Lehrkräften einer
    Schule in sinnvoller Weise erhöhen lassen?

❏ Indem sich das Kollegium einer Schule über gemeinsame Ziele verständigt und diese überprüft ««««<
❏ Indem im Unterricht ausschließlich Beispielaufgaben zu den Bildungsstandards Verwendung finden
❏ Indem die Lehrkräfte vorwiegend informelle Diagnosen erstellen
❏ Indem die Ergebnisse externer Evaluationen veröffentlicht werden

A

Lehrkraft und Urteil:
- ExpertInnen können besser zwischen (nicht) wichtigen Informationen entscheiden
- ExpertInnen neigen dazu, getroffene Urteile zu revidieren, wenn sie neue gegenteilige Infos erhalten (“flexiblere DenkerInnen”)
Klassenmerkmale:
- “Big Fish Little Pond” Effekt: Leistungsniveau der Klasse beeinflusst Einzelbeurteilung Lernendenmerkmale:
- SuS mit höherem sozioökonomischen Status werden als leistungsfähiger eingestuft

49
Q
  1. Nennen Sie die beiden Arten von Urteilsfehlern, die in der
    pädagogischen Diagnostik eine Rolle spielen, und beschreiben
    Sie jeweils zwei Maßnahmen, die getroffen werden können,
    um diese Fehler zu vermeiden. Begründen Sie Ihre Antwort.
A

Urteilstendenzen in Bezug auf die Ausschöpfung des Beurteilungsspektrums:
- Referenzfehler
- Tendenz zur Mitte
- Tendenz zum Extrem
- Milde-Effekt
- Strenge-Effekt
Urteilsfehler durch Voreingenommenheit und Interferenzen
- Reihungsfehler
- logischer Fehler
- Halo-Effekt
- Perseverationsfehler
- Projektionsfehler
- Wissen-um-die-Folge-Fehler
Was kann man tun?
- Erkenne dich selbst, Einsicht eigene Subjektivität
- Kollegialer Austausch/ Zweitkorrektur
- Klarheit über Fachtradition
- klar definierte Kriterien- Trennung Beobachtung & Bewertung
- Gesamtbewertung erst nach Einzelbewertung
- Vorinfos mangelnder Güte kritisch beurteilen
- “blinde” Bewertung, Reihenfolge variiert, kolleg. Austausch

50
Q
  1. Die Beurteilungen schulischer Leistungen können durch Urteilsfehler verzerrt werden.
    Was kennzeichnet im Kern einen Halo-Effekt?
A

❏ Von einem bereits gefällten Urteil wird nicht mehr abgerückt.
❏ Ein Globaleindruck wir verallgemeinert.««<
❏ Von Eigenschaften der eigenen Person wird auf die einer SuS geschlossen.
❏ Von einem Schülermerkmal wird auf ein anderes Schülermerkmal geschlossen.

51
Q
  1. Welche Maßnahmen können Sie ergreifen, um die Messgüte
    von Schulnoten zu erhöhen, und auf welche Gütekriterien
    beziehen sich die einzelnen Maßnahmen?
A
  • Noten an kriterialer Bezugsnorm messen (vorher Mindeststandard festlegen, danach transparent festhalten, welcher Bereich welche Note widerspiegelt)
  • Auswertungs und Interpretationsobjektivität
  • Inhalts und Kriteriumsvalidität
52
Q

21.Sie möchten überprüfen, ob Sie eine präzise Vorstellung davon haben, wie stark die
Leistungen der SuS in ihrer Klasse streuen. Nachdem Sie die Konzeption der nächsten
Klassenarbeit abgeschlossen haben, schätzen Sie, wie groß die Leistungsstreuung in etwa
sein wird. Ihre Schätzung vergleichen Sie später mit der tatsächlichen Streuung der
Ergebnisse ihrer SuS in der Klassenarbeit. Welche Komponente der diagnostischen
Kompetenz haben Sie damit überprüft?
❏ Niveaukompetente
❏ Rangkompetente
❏ Differenzierungskompetente««««««<
❏ keine der genannten Kompetenzen

A

Drei Komponenten der Diagnosegenauigkeit

Rangkomponente (diagnostische sensitivität)
* Fähigkeit von Lehrkräften, Fähigkeits- bzw. Leistungsabstufungen zwischen Schüler*innen akkurat einzuschätzen (sozialer Vergleich)

Niveaukomponente
* Absolute Einschätzung der Ausprägung der Fähigkeit oder der
Leistung der Lernenden bei einer Aufgabe
* Berechnung des Urteilsfehlers (absoluter Betrag der Abweichung zwischen Lehrkrafturteil und Kriterium) oder der Urteilstendenz (Grad der Über- oder Unterschätzung des Kriteriums)

Differenzierungskomponente
* Vergleich zwischen der Streuung von Fähigkeitsausprägungen bzw. Leistungen von Lernenden und der Streuung der Lehrkrafturteile

53
Q

10 - diagnostik von Hochbegabung und teilleistungsstörungen

  1. Wie kann Hochbegabung diagnostiziert werden und
    wozu könnte eine Hochbegabungsdiagnose sinnvoll
    sein?
  • Übergabung wird mit unterforderung verbunden, langeweile

-unterforderung: zu geringen anforderungen an jemanden, etwas stellen.
-wichtig: genannt wurde: sozilae Fähigkeiten

A

Wert in Intelligenztest, der min. 2 SD über Mittelwert liegt - IQ min. 130, PR>=98
Diagnose ermöglicht Einordnung und Auswahl passender Förderung, weiterer Diagnostik

Diese Konvention.

-man spricht von Hochbegabung wenn eine Person 130+ IQ hat

-Sakala hat ein Mittelwert von 100 mit einer Standardabweichung von 15

  • Personen, deren Intelligenz midestens 2 Standardabweichungen über dem Mittelwert liegt, gelten als Hochbegabt
  • entspricht: 2% der Menschen in einer Population
54
Q

Was ist „Underachievement“, wie kann es diagnostiziert
werden und inwiefern ist das relevant?

A

= erwartungswidrige Minderleistung: schulische Leistungen
(Noten, standardisierte Schulleistungstests) sind deutlich geringer,
als man aufgrund der Begabung erwarten würde.

55
Q
  1. Am Elternsprechtag spricht die Mutter eines Schülers Sie
    an. Anhand einer Checkliste habe sie einige Merkmale
    hochbegabter Kinder bei ihrem Sohn identifizieren
    können und frage sich nun, ob ihr Kind womöglich
    hochbegabt sei. Was antworten Sie?
A

nach zusätzlicher Beobachtung/ Screening durch Lehrkräfte kann gerne ein standardisierter
Test durch qualifiziertes Personal durchgeführt werden

56
Q
  1. Warum wird das Diskrepanzkriterium zur Diagnose von LRS
    kritisch diskutiert?
A

IQ-Werte korrelieren nur mittelhoch mit LR-Leistungen
Unabhängigkeit der Symptomatik und des Fördererfolgs von Intelligenz
-> Forderung, nur bereichsspezifische Minderleistung als Kriterium für Identifikation zu
nutzen

57
Q
  1. Spielt das Diskrepanzkriterium bei der Diagnose von LRS
    gemäß der Berliner Grundschulverordnung eine Rolle?
A

Doppeltes Diskrepanzkriterium umstritten: kein Kriterium gem. DSM 5 315.00, 315.2 =>
leistungsbezogene Definition (Diskrepanz zum schulaltersentsprechenden Leistungsniveau);leistungsbezogene Definition gilt auch für das schulische Feststellungsverfahren in Berlin und Brandenburg

58
Q
  1. Sie sind eine Deutschlehrkraft in einer 4. Klasse. Sie
    vermuten, dass ein Junge in Ihrer Klasse besondere
    Schwierigkeiten im Lesen und Rechtschreiben hat, da er a) für
    das Lesen von Texten im Vergleich zu seinen
    Klassenkamerad*innen sehr lange braucht und deren Inhalte
    nur grob versteht und b) seine Aufsätze inhaltlich gut sind (d.
    h. Sie können den Inhalt verstehen und bewerten, da er die
    Wörter stark lautorientiert/lautgetreu schreibt), aber sehr
    viele orthographische Fehler enthalten. Welche Verfahren
    würden Sie einsetzen, um Ihre Vermutung zu objektivieren?
A

Diagnostik (z.B. ILea - Individuelle Lernstandsanalysen Deutsch 2-6, ELFE II Lesetest, Hamburger Schreibprobe 1-10)

59
Q
  1. Um abzuklären, ob bei einem SuS eine Hochbegabung vorliegt, kann es sinnvoll sein, die Einschätzung der Lehrkraft zu berücksichtigen. Warum?

❏ Um Referenzgruppeneffekte zu minimieren.
❏ Um unterschiedliche subjektive Konzepte von Hochbegabung angemessen zu berücksichtigen.
❏ Weil standardisierte Intelligenztests nicht valide sind.
❏ Weil Lehrkräfte über umfangreiche Erfahrungen mit Schülerleistungen verfügen.«««««<

respuesta: Diagnostik Vl 10. S. 40.
R: LK hat viel Erfahrung mit Einschätzen und Bewerten von Leistungen

A
60
Q

Respusta Diagnostil VL 11, S 62

  1. In einer Fortbildung erlernen Sie Strategien um ihren Unterricht kognitiv aktivierender zu
    gestalten. Geben Sie ausgehend von den Befunden der COACTIV-Studie (Kunter und Voss,
    2011) an, was Sie durch den Einsatz der neu erlernten Strategien bei ihren SuS vermutlich
    am ehesten bewirken.
    ❏ eine Leistungssteigerung«««<
    ❏ eine Steigerung der Schulfreude
    ❏ eine Steigerung des fachbezogenen Selbstkonzepts
    ❏ eine Reduktion der Leistungsängstlichkeit
A