Klausur Flashcards

Question

Bitte erklären Sie, was mit Reliabilität eines Testverfahrens gemeint ist.

Answer 1

Zuverlässigkeit des Tests Der Test misst das, was er misst, genau und zuverlässig, unabhängig von anderen, z.B. zufälligen Einflüssen. **Also frei von Messfehlern.**

Answer 2

Korrelation zwischen einer Erstmessung und Zweitmessung bei derselben Personen und diese sollte hoch sein.

Answer 3

Misst die Konsistent. Zwei Verfahren: Split-half und Cronbachs-alpha

Answer 4

Korrelation von Ergebnissen paralleler Formen der Tests (bei Persönlichkeitsfragebögen ist eine Erstellung einer parallelen Form eher schwierig, von daher eher bei Mathetests oder so sinnvoll)

Answer 5

Misst der Tests das, was er zu messen vorgibt.

Answer 6

Augenschein: Akzeptanz von nicht Fachleuten Inhalt: außenstehende Experten sollen eine Einschätzung geben

Answer 7

Korrelation der Selbsteinschätzungen mit einem entsprechenden Außenkriterium. Korrelation zwischen Mathetest und Mathenote sollte zum Beispiel hoch sein

Answer 8

**Konvergente und divergente Konstruktvalidität** Korrelationen mit inhaltlich verwandten/nicht verwandten Merkmalen. **1. Konvergente Validität** **Hohe Korrelation** der Merkmalserfassung durch unterschiedliche Methoden (z.B. valide Tests, die die gleiche Eigenschaft messen) **2. Diskriminante Validität** **Geringe Korrelation** unterschiedlicher Merkmale durch die gleiche Methode (Unterschiedliche Eigenschaften – geringe Korrelation)

Answer 9

▪Nicht beobachtbarer Sachverhalt ▪Theoretisches Konzept ▪Wird aus messbaren Indikatoren ( = Merkmal, Anzeichen) erschlossen

Answer 10

**Verhältnisskala:** ▪ Wie Intervallskala, aber: ▪ Absoluter Nullpunkt ist gegeben, alle Rechenfunktionen sinnvoll *▪ Bsp.: Körpergröße, Alter* ***Intervallskala*** ▪ Intervalle zwischen den einzelnen Abstufungen sind gleichmäßig verteilt ▪ Nullpunkt ist willkürlich gesetzt *▪ Bsp.: Intelligenzquotient* ***Ordinalskala*** ▪ Ausprägungen werden hinsichtlich ihrer Wertigkeit in eine Rangfolge gebracht ▪ Die Abstände zwischen den Rängen sind nicht definiert *▪ Bsp.: Podiumsplätze, Sterne für Hotel-Kategorien* **Nominalskala** ▪ Unterschiede zwischen den Ausprägungen sind rein nominell ▪ Ausprägungen haben keine unterschiedlichen Wertigkeiten *▪ Bsp.: Blutgruppen, Trikotnummern*

Answer 11

Neigung von Menschen, vage und allgemeingültige Aussagen über die eigene Person als zutreffende Beschreibung zu akzeptieren. Pseudovorhersagen von Eigenschaften

Answer 12

▪ Diese Verfahren werden u.a. genutzt, um die **Qualität eines diagnostischen Instruments** zu beurteilen ▪ Sie geben z.B. Auskunft, **wie viele Konstrukte** durch den Fragebogen/Test gemessen wurden

Answer 13

* setzt untereinander korrelierende Variablen voraus * Viele Variablen werden auf wenige Faktoren reduziert * Faktoren entsprechen zusammenfassenden, übergeordneten Kategorien. * Ziel: möglichst wenige, voneinander unabhängige Variablen

Answer 14

**Implizite Motive:** ▪ Manche Motive entstehen in der vorsprachlichen Entwicklung ▪ Ihre Anreize sind nonverbal, betreffen eher bildhafte Reize und Körperreaktionen ▪ Sie sind unbewusst – implizite Motive **Explizite Motive:** ▪ Andere Motive entstehen später, bei der Entwicklung der Sprache und des Selbstkonzepts ▪ Ihre Anreize sind verbal ▪ Sie sind bewusst und gehören zum Selbstkonzept – explizite Motive

Answer 15

**1. Eigene Erfolgserlebnisse** * werden übertragen auf ähnliche Aufgaben * Führen evtl. zu selbsterfüllenden Prophezeiungen bzw. in ein Teufelskreis **2. Stellvertretende Erfahrung** * aus einer Vergleichsgruppe (in einer ähnlichen Situation) * Wenn Versagen bei anderen beobachtet wird, sinkt die Selbstwirksamkeit * weniger Einfluss als persönliche Erfolgserfahrungen **3. Verbale Ermutigung** * Bekommt eine Person viel Ermutigung, steigt die Selbstwirksamkeit * Je nach Vertrauen in die ermutigende Person starker oder geringer Einfluss **4. Umgang mit emotionaler Erregung** Je nach Interpretation des Stressreaktionen wie z.B. Herzklopfen, Schweißausbrüche, Händezittern, Frösteln, Übelkeit Wenn als Schwäche interpretiert – Selbstzweifel Wenn Abbau von Stressreaktionen gelingt – mehr Selbstwirksamkeit

Answer 16

➢ Glauben einer Person zur eigenen Kontrolle über die Ereignisse in ihrem Leben.

Answer 17

1. Mittelwert 2. Varianz bzw. Standardabweichung

Answer 18

**Kristalline Intelligenz:** - z.B. Wortschatz, Allgemeinwissen, Erfahrung ... Stark wissens- und kulturabhängig - umfasst erworbene kognitive Fähigkeiten und die Fähigkeit erworbenes Wissen auf Problemlösungen anzuwenden - Kristalline Intelligenz bleibt bis ins hohe Alter intakt und kann sogar mit dem Alter noch zunehmen **Fluide Intelligenz:** - Schnelligkeit der Wahrnehmung, Reaktionszeit und induktives Denken - bezieht sich auf Basisfähigkeit des Denkens, die Fähigkeit, sich neuen Situationen anzupassen und neuartige Probleme zu lösen - Fluide Intelligenz nimmt mit zunehmendem Alter ab

Answer 19

Cohens Kappa 𝒌

Answer 20

* *\< 0,4:** schlechte Interrater-Reliabilität * *0,4 – 0,6:** mittelmäßige (moderate) Übereinstimmung * *\> 0,6:** gute Übereinstimmung * *\> 0,75:** sehr gute Übereinstimmung

Answer 21

Ein hohes Maß an interner Validität erreicht man am besten durch hochkontrollierte und deshalb recht **künstliche (Labor-) Bedingungen.** Hoher Grad, wenn: * wenn **Alternativerklärungen** für die gefundenen Effekte **weitestgehend ausgeschlossen** werden können * wenn also die Veränderung der abhängigen Variable eindeutig auf die Variation der unabhängigen Variable zurückgeführt werden kann (keine Alternativerklärung)

Answer 22

**Retest-Reliabilität (Intrarater-Reliabilität) – misst Stabilität** Korrelation zwischen Erst- und Zweitmessung (nicht immer sinnvoll, z.B. bei Lerntests - Übungseffekte) * *Interne Reliabilität (Interne Konsistenz) - misst Konsistenz** * *1. Split-Half-Reliabilität:** ein Test wird in 2 Teile geteilt und die Ergebnisse der beiden Subtests werden miteinander korreliert * *2. Cronbachs Alpha:** Korrelation zwischen allen Items eines Tests/Skala **Paralleltest-Reliabilität - misst Gleichwertigkeit von Messungen** * Korrelation zwischen Ergebnissen paralleler Formen des Tests beidenselben Personen (z.B. bei Leistungstests) * Die Herstellung einer vergleichbaren Parallelversion ist manchmal problematisch und aufwändig bzw. gar nicht möglich

Answer 23

**➢ Elimination** ▪ Falls eine bestimmte Variable in einem Experiment als Störvariable auftritt, versucht man, diese auszuschalten. **➢ Konstanthaltung der Versuchsbedingungen** ▪ Ist es nicht möglich, eine Störvariable zu eliminieren, versucht man, diese Einflussgröße konstant zu halten. ▪ Es wird angenommen: Störvariable verändert in allen Versuchsgruppen die Messwerte nur um denselben (konstanten) Betrag **➢ Randomisierung** ▪ die Versuchspersonen werden unter Verwendung eines Zufallsprinzips unterschiedlichen Gruppen zugeordnet **➢ Parallelisierung** ▪ Zusammenstellung von möglichst vergleichbaren Untersuchungsgruppen ▪ für wichtige beeinflussende Merkmale (z. B. Alter, Geschlecht, Bildungsstand, Einkommen) sorgt man in Stichproben für annähernd gleiche Verteilungen (z. B. gleiche Anzahl von Frauen, gleicher Altersdurchschnitt usw.).

Answer 24

**Within-Subject Design:** ▪ Für die Manipulationen der unabhängigen Variable wird die gleiche Gruppe eingesetzt ▪ z.B.: die gleichen Angestellten arbeiten unter verschiedenen Managern und werden nach jedem hinsichtlich ihrer Arbeitszufriedenheit befragt

Answer 25

**Primärvarianz** Einfluss der uV auf die aV **Sekundärvarianz** Systematische Einflüsse auf die Werte der aV, die vom Messinstrument oder Versuchsleiter verursacht sind (z.B. Versuchsleiterartefakt) **Fehlervarianz** Unsystematische, zufällige Einflüsse auf die Werte der aV

Answer 26

**1. Maximiere die Primärvarianz („Signal")** * Wahl von extremen bzw. optimalen Werten der unabhängigen Variable (oder mehrere Stufen der uV) * Umwandlung eines Störfaktors in eine weitere experimentelle uV („Kontrollvariable“) **2. Kontrolliere die Sekundärvarianz (systematische Fehler)** * **Eliminierung** eines Störfaktors * **Konstanthaltung** eines Störfaktors für alle Versuchsgruppen und experimentellen Bedingungen * **Randomisierung** der Probanden und der Bedingungen * **Parallelisierung:** gleiche Verteilung der Störvariablen * **Within-Subject-Designs**: wiederholte Messung an denselben Personen * **Umwandlung eines Störfaktors** in eine weitere experimentelle UV („Kontrollvariable“) * Nachträgliche **statistische Kontrolle** **3. Minimiere die Fehlervarianz („Rauschen“) nicht vollständig kontrollierbar!** * **Parallelisierung:** Versuchs- und Kontrollgruppe mit gleicher Verteilung der Störvariable * **Within-Subject-Designs:** wiederholte Messung an denselben Personen * **Standardisierung** der Untersuchungssituation * nach Probeläufen: Erhöhung der Zuverlässigkeit und Gültigkeit des Messinstruments * (statistische Auswertung)

Answer 27

Prüft: Sind die Ergebnisse der Studie **übertragbar/generalisierbar?** **➢Versuchspersonen** (Qualität der Stichprobe: wodurch kam es zur Teilnahme? Was ist ihre Motivation? z.B. besonderes Interesse am Thema etc.) Erhöht sich, wenn: Replizierbarkeit der Ergebnisse mit verschiedenen Stichproben (Altersgruppe, Geschlecht usw.) * *➢Versuchssituation** (z. B. Künstlichkeit von Laborexperimenten) Erhöht sich, wenn: Replizierbarkeit der Ergebnisse unter verschiedenen Bedingungen

Answer 28

Prüft: Führen die Auswertungsmethoden keine Verzerrung ein? z.B. durch Erfüllung der Voraussetzungen für statistische Verfahren

Answer 29

➢ Der theoretische Hintergrund muss empirisch belegt sein ➢ Haupt- und Nebengütekriterien sollten immer überprüft werden * **normiert** (bezugsbezogene Bewertbarkeit) * **vergleichbar** (zu anderen Tests mit gleichen Inhalten) * **ökonomisch (**zeitlich, materiell, Handling etc.) * **nützlich** (nützlich im Einsatz; kürzer, zuverlässiger, kostengünstiger prädiktiver als bereits bestehende Verfahren)

Answer 30

➢ Optimierung der Auswahl von Personen und/oder Bedingungen ➢ Findung einer optimalen Person-Bedingungs-Konstellation Methode: Querschnittsuntersuchung • ein Messzeitpunkt, Statusdiagnostik ➢ dann Entscheidung

Answer 31

Ziel: Optimierung durch Verhaltenstraining und/oder Bedingungen * Verhaltensmodifikation durch Training * Bedingungsmodifikation durch z. B. neue Lehrmethoden Methode: Längsschnittuntersuchung • mindestens zwei Messzeitpunkte, • Status - Modifikation - Status

Answer 32

Erhebung der Datenbasis und Ableitung entsprechender Vergleichswerte. Normierung, E**ntwicklung des Bezugssystem** eines Tests für die Einordnung individueller Testergebnisse. Die Verteilung der Testwerte einer Grundgesamtheit wird oft normaltransformiert (Normalverteilung) und mit Verteilungsparametern ausgestattet (z.B. bei Intelligenztests ein Durchschnittswert von 100 und eine Standardabweichung von 15). Zu jedem Testrohwert gehört ein bestimmter Teststandardwert, der die Position eines Probanden im Vergleich zur Grundgesamtheit eindeutig festlegt. Normierungen können für Gesamt- oder Teilpopulationen vorgenommen werden.

Answer 33

Auf Basis des Rohwertes abgeleiteter Normwert der Normwertskala - z. B. IQ-Normwert = 110 Der Normwert dient dazu, die **Eigenschaften eines Individuums in Bezug zur Gesamtheit aller Individuen einzuordnen**. Normwerte werden gewonnen, indem ein Forscher mit einer Messmethode eine ausreichend große Stichprobe der zu untersuchenden Grundgesamtheit untersucht und dadurch eine individuelle Eigenschaftsausprägung einordbar wird. In der Regel wird hierbei eine quasi kontinuierliche Verteilung der Ausprägung einer Eigenschaftsqualität unterstellt. **Der ursprüngliche Messwert wird Rohwert genannt.**

Answer 34

definierte Vergleichsskala - z. B. IQ-Normwertskala

Answer 35

evaluiert festgelegte Leistungsmaßgrenze - z. B. Eignungsgrenze

Answer 36

1. z-Skala 2. Z-Skala 3. C-Skala 4. Stanine-Skala 5. IQ-Skala

Answer 37

PR-Skala (Prozentrang)

Answer 38

* Ab 1 SD: überdurchschnittliche Werte (Extreme) * Ab 2 SD: weit überdurchschnittliche Werte (sehr seltene Extreme)

Answer 39

Mediannormen, Quartile

Answer 40

Berechnung der Prozentränge, z-Transformation

Answer 41

**... ist die Standardisierung aller Werte** d.h. Umrechnung so, dass bei allen gemessenen Eigenschaften der **Mittelwert = 0 ist und Standardabweichung = 1.** ➢Möglichkeit, Werte vergleichbar zu machen: •Bei zwei / mehreren Eigenschaften •selbst wenn diese Eigenschaften ganz verschieden gemessen wurden ➢z.B. Zusammenhang zwischen der Intelligenz im Vorschulalter und der Intelligenz im Erwachsenenalter 20 Jahre später (notwendigerweise durch völlig unterschiedliche Tests gemessen).

Answer 42

Die Standardnormalverteilung ist eine Normalverteilung, bei der Mittelwert und Erwartungswert = 0 und die Varianz sowie Standardabweichung = 1 sind.

Answer 43

1. Alle linearen Normskalen setzen voraus, dass die Werteverteilung einer Normalverteilung entspricht 2. Ist die nicht der Fall, so müssen Prozentrangwerte bestimmt werden (Flächen-Normen)

Answer 44

**Einfachnormen** * Gesamttestnormen * Normen der gesamten (repräsentativen) Stichprobe **Gruppennormen** * Gesamt- und Gruppennormen * Normen, die für bestimmte Gruppen zusammengefasst wurden: z.B. Geschlecht, Alter, Einkommen etc.

Answer 45

* Interne Validität * Externe Validität * Statistische Validität Bei der Erkenntnistheorie werden die Gütekriterien nur diskutiert und nicht geprüft!

Answer 46

Erhöht sich, wenn: Replizierbarkeit der Ergebnisse mit verschiedenen Stichproben (Altersgruppe, Geschlecht usw.) Erhöht sich, wenn: Replizierbarkeit der Ergebnisse unter verschiedenen Bedingungen Zufallsstichproben Kann man die Personen und die Situation auf das übertragen, was man später haben will?

Answer 47

Prüft: Führen die Auswertungsmethoden keine Verzerrung ein? z.B. durch Erfüllung der Voraussetzungen für statistische Verfahren Wenn die Voraussetzungen für die eingesetzten Verfahren gegeben sind.

Answer 48

Differenzierungsfähigkeit **= „die Fähigkeit, Unterschiede messbar zu machen“** „Der beobachtete Wert [X] setzt sich aus dem wahren Wert [t] und dem Fehlerwert [e] zusammen.“ X = t+ e Um den wahren Wert [t] der Eigenschaftsausprägung innerhalb des beobachteten Wertes [X] schätzen zu können, wird eine Information über den Messfehler [e] benötigt.

Answer 49

Korrelation zwischen 𝑰𝒕𝒆𝒎𝒊 und dem Gesamtrohwert des 𝑻𝒆𝒔𝒕𝒔𝒕 bzw. 𝑻𝒆𝒊𝒍𝒕𝒆𝒔𝒕𝒔𝒕 Also für **ein Item**

Answer 50

Korrelation zwischen Gesamtrohwert des 𝑻𝒆𝒔𝒕𝒔𝒕 und eines 𝑷𝒂𝒓𝒂𝒍𝒍𝒆𝒍𝒕𝒆𝒔𝒕𝒔𝒕 bzw. 𝑻𝒆𝒊𝒍𝒕𝒆𝒔𝒕𝒔𝒕 Beispiel: „Das Testverfahren misst die curricularen Inhalte mathematischerKenntnisse der Sekundarstufe I und weist in Bezug auf den Gesamttest eine innere Konsistenz von rtt = .95 auf.“ Cronbach‘s 𝜶 (bereits bekannt) Korrelation zwischen den Rohwerten aller Items einer Skala Also für **alle Items** eines Testverfahrens

Answer 51

Standardmessfehler Konfidenzintervall Kritische Differenz

Answer 52

1. Man setzt den Mittelwert aller Mittelwerte für eine der Gruppen (z.B. Frauen) fest 2. Man berechnet die Varianz/Standardabweichung der Stichprobenverteilung der Mittelwerte für diese Gruppe (z.B. Frauen) 3. Dann rechnet man aus, wie wahrscheinlich es ist, dass der andere Mittelwert auch zur gleichen Stichprobenverteilung der Mittelwerte gehört

Answer 53

Konfidenzintervalle beschreiben die Irrtumswahrscheinlichkeit einer Messung (Trefferwahrscheinlichkeit) Sie WERDEN GEWÄHLT- je nachdem, welche Irrtums-bzw. Trefferwahrscheinlichkeit man bei der Messung zulassen möchte

Answer 54

* wenn Alpha **einseitig** getestet wird dann **90%** Konfidenzintervall * wenn Alpha **zweiseitig** getestet wird dann **95%** Konfidenzintervall

Answer 55

Die kritische Differenz definiert die Differenzpunktzahl, die mindestens erreicht werden muss, um in Bezug auf eine definierte Irrtumswahrscheinlichkeit annehmen zu können, dass sich zwei Messwerte bedeutsam voneinander unterscheiden. Regel: KritDiff \> tatsächliche Messwertdifferenz = kein bedeutsamer Unterschied

Answer 56

**Selektion:** zu einem Zeitpunkt aus einer Gruppe einen selektieren **Modifikation:** zu mehr als einem Messzeitpunkt bei einer Person den Stand erfassen, um Entwicklungen aufzuzeigen

Answer 57

Normalverteilung

Answer 58

Wenn keine Normalverteilung vorliegt

Answer 59

Prozentrangnorm, Median und Quartile Fläche wird in 100/100 geteilt, die Prozentränge haben auf der x-Achse nicht die gleichen Abstände Die **Fläche der Wertefunktion** ist von Bedetung

Answer 60

**Standardmessfehler:** Anteil an der Streuung eines Tests, der auf die nicht perfekte Zuverlässigkeit des Tests zurückzuführen ist. **Der Standardfehler** ist ein Maß für die mittlere Abweichung des aus einer Stichprobe berechneten Mittelwerts von dem tatsächlichen Mittelwert der Grundgesamtheit. Um den wahren IQ zu messen, müssten wir mathematisch betrachtet unendlich viele IQ-Tests mit der Person durchführen und mitteln. Der Mittelwert all dieser Testwerte wäre dann der beste Schätzer des wahren Intelligenzquotienten der Person. Die Standardabweichung all dieser Messungen wäre der Standardmessfehler.

Answer 61

MW = 0 und SD = 1

Answer 62

MW = 100 und SD = 10

Answer 63

MW = 5 und SD = 2

Answer 64

MW = 5 und SD = 2

Answer 65

MW = 100 und SD = 15

Answer 66

MW = 50 und SD = 10

Answer 67

4, 5 und 6