Vorlesung 2: Messen Flashcards

1
Q

Nachtrag zur Deduktion

A

Deduktion aus 2 Faktoren-Theorie Schachter/Singer 1962

Operationalisierung Erregung UV:

  • Hohe/niedrige Brücke
  • Geschlecht Interviewer

AV: -TAT
-Anrufe bei der attraktiven
Studentin
Achtung: Quasiexperiment

 Vermutung herstellen mit Erklärungsmodell

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Messen: Grundlagen -Mathematisierung
Nenne die Definition von Messen
Nenne die Merkmale vom Messen

A

Messen: Bestimmung einer Zahl als das Vielfache einer Einheit
Merkmale: -Messen ist präzise, -Messen ist etabliert
(Regelwerk der Mathematik)
-> Je nach Art der Regel, wird ein anderer Informationsgehalt unserer Messung ausgenutzt → Die Skalenniveaus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nenne die einzelnen Skalenniveaus

prüfungsrelevant

A

Nominalskala
• Geschlecht (männlich, weiblich)
• Farbe (blau, gelb, grün, rot usw.)

Ordinalskala
• Art des Wohnorts (Einzelhaus, Dorf, Kleinstadt, Großstadt)
• Fahrzeugklasse (Kleinwagen, unterer Mittelklassewagen, oberer Mittelkassewagen, Oberklassewagen)

Intervallskala
• Temperatur in Celsius
• IQ-Skala

Ratioskala
• Körpergröße
• Monatseinkommen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Definieren den Begriff: die formale Axiomatisierung

was ist isomorph?

A

Definition: Zuordnung von Zahlen zu Objekten und Personen zu einem bestimmten Zeitpunkt nach bestimmten Regeln
Homomorphe Abbildung eines empirischen in ein numerisches Relativ -> Ohne diese Zuordnung :
Isomorph= wenn es mehrere Zuordnungen gibt. Wichtig, dass es eine eindeutige Zuordnung gibt, also nicht isomorph

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Beschreibe die Variabilität

A

Variabilitiät ist die Grundvoraussetzung jeglichen Messens
Unterschiede Begriff der Variable

-> Vorbedingung jeder Datenerhebung: Mindestens 2 oder mehr Ausprägungen der Quantität und/oder Qualität = variables Merkmal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beschreibe Beispiele der Variabilität

A

Bsp. 1 Variabiliät von Verhaltensweisen (Bild verschiedener Arten von Pulli ausziehen)
Bsp.2 mit Mitteleuropa: blond zentral in Mitteleuropa. Die Präferenzen innerhalb einer Population wurden untersucht : welche Präferenz von Geschlecht bzgl. Haarfabre. (-> Ausprägung eines Merkmals, mindestens zwei Bedingungen; hier zwei Farben)

Ergebnis: Männer haben gerne rote Haare bei Frauen, Frauen nicht bei Männern, aber diese Präferenz ist allgemein tiefer als bei den anderen Farben wie blond, braun schwarz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nenne die Kritik an der Messbarkeit

und nenne insbesondere der wichtigste Kritikpunkt der Wissenschaft an die Psychologie

A

Messbarkeit Messbarkeit des Menschen wird in Frage gestellt. Grundsätzlich berechtigte Kritikis, besondere wegen grober Vereinfachung. Versuchsteilnehmer haben immer eigene Vorstellungen
das moralisch vertretbar einen menschen zu messen, kommt drauf an was

wichtigster Kritikpunkt aus Wissenschaft: Auswahl der vpn in Psychologie, vpn haben auch immer eigene Einstellung, dadurch gibts Variabilität, die man eigentlich vermeiden möchte
90% der Arbeiten in Psychologie werden mit vpn untersucht, die in Ppopulation nur eine Minderheit von 10% sind, nämlich studentische Stichprobe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Erkläre die Werturteilsproblematik

A

Werturteil ist Synonym von Vorurteil.
Präskriptive Aussagen, die eine Handlung/Umstand vorschreiben oder einen Sachverhalt bewerten
Buch The Bell Curve, 1996, gauss’sche Normalverteilung: gab Aufschrei, Autoren haben postuliert, dass ethnisches Herkommen und erbliche Intelligenz korrelieren ( genetische Grundlage für IQ) -> Afroamerkaner tiefere IQ aufgrund ihres Erbmaterials

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erkläre das Repräsentationsproblem

A

Ist ein Merkmal überhaupt messbar?

z.B: Ästhetik: Bewertungsskla für diese Kunstwerke: gefällt mir bis gefällt mir nicht
zb Klee vs Giacometti. Viele Bewertungsurteile führen nicht zu einem logischen, direkten Schluss!
Wenn wir etwas messen, tut die Messskala die wir anlegen, ist die Frage wichtig, dieses Merkmal überhaupt ausreichend repräsentieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erkläre das Bedeutsamkeitsproblem

A

Welche mathematische Transformationen sind zulässig und auch inhaltlich sinnvoll?

Bsp. Populationskarte von Geburtenrate in Schweiz. Sinnvoll 1,2 Kinder anzugeben?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Erkläre das Eindeutigkeitsproblem

A

Repräsentativ ≠ eindeutig (eine repräsentative Zuordnung muss noch lange nicht eindeutig sein)
Bei der Eindeutigkeit muss ich das Messniveau beachten, welches Messnivau interessiert mich?

Wie eindeutig ist die Zuordnung? Was kann man mit den Relationen machen ?
Bis zu welchem Transformationsgrad bleibt die relevante Information erhalten?
Gewicht 3kg : 2kg Multiplikation ja, Addition nein
Gewichtsinformation und Relationsinformation

Begriff der Eindeutigkeit: Auf welchem Niveau?
→ Durch die Skalenniveaus wird Entscheidung getroffen, welche Aussagen aus den Messwerten zulässig sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Messen - nenne die Anforderungen an Psychologisches Forschen

und nenne ein Bsp. dieser Anforderungen

A

Alltagswissen ist begrenzt und muss vereinfachen um
schnell zu orientieren (reduzieren Infos, diese werden bewusst bzw. unbewusst gefiltert, merken nicht immer welche)

Forschung: Konsensfähige Grundlage für Entscheidungen im persönlichen Einzelfall und im sozialen Umfeld.
Bsp: konsensfähige Grundlage bedeutet, dass man nachvollziehbare Kriterien, hat um zu entscheiden, ob Therapieform den gewünschten Effekt hat (auch Krankenkasse)
-> Grawe: hat psychotherapeutische Ansätze wissenschaftlich bewertet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Nenne den Vergleich von Alltagserfahrungen und wissenschaftlichen Erkenntnis

A
Alltagserfahrung  vs Wissenschaftliche Erkenntnis
-Systematik/Dokumentation+
-Präzision der Terminologie+
-Art der Datenauswertung+
-Test an Gültigkeitskriterien+
-Bezug zu Theorie+
\+ = vorhanden, - = nicht vorhanden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Messen- Nenne die unterschiedlichen Objektivitätsformen

Definiere Objektivität

A

Objektivität =Das Ergebnis ist von der Durchführung unabhängig
A. Durchführungsobjektivität
Unabhängigkeit der Messung von Verhaltensvariationen des Testleiters
(Bedingungskonstanz, Bedeutung der Testinstruktion)

B. Auswertungsobjektivität
Gleiche Antwort –gleicher Testwert
Fragebogen relativ unproblematisch, jedoch Verhaltensbeobachtung ?
Multiple Choice, Freie Antworten, schriftliche Äusserungen? (schriftliche Antworten schwieriger als MC, freie noch schwieriger)

C. Interpretationsobjektivität
Grad der Eindeutigkeit der Zuordnung von Testscores zu Merkmalsausprägungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Beschreibe die Reliabilität (I/II)

A

Wiederholte Messung führt zum gleichen Ergebnis
→ Ohne Objektivität keine Reliabilität
Störvariablen der Messung: Wetterlage, Ernährung, Vor-Verhalten, Motivation, Hormonstatus, Schlaf
unsystematisch und unkontrollierbar (?)

Daraus folgt:
Messwert = Wert (Messvariable)+ Wert (Störvariable)
Testtheoretische Grundannahme: Der Messfehler variiert zufällig
→ keine systematische Fehleinschätzung
wiederholte Messung führt zur Reduktion der Fehlerrate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Beschreibe die Reliabilität (II/II)

A

Wiederholtes Messen gleicht Über und Unterschätzen aus
Mehrfaches Messen führt zu Eliminierung des Messfehlers
„Schön ist die Theorie“
Mass für die Unterschiedlichkeit = Varianz (s²)
(s²) Messwerte= (s²) Wahrer Wert + (s²) Messfehler
Mass für die Reliabilität r(tt) = Anteil der Varianz der wahren
Werte an der Varianz Messwerte
Messfehler gegen 0 dann Reliabilität gegen 1
Wahrer Wert gegen 0 bzw. Fehler →∞
dann Reliabilität gegen 0

17
Q

Nenne wissenschaftliche Kriterien

A

Bei der wiederholten Anwendung einer Methode ergeben sich gleiche oder für den Erfolg ausreichende Resultate = Reliabilität
Das Resultat der Methode ist unabhängig vom Anwender =Objektivität
Das Resultat der Methode beantwortet die Frage Validität

18
Q

Beschreibe die Bestimmung der Reliabilität

A

Basis: Erhebung mehrerer Messwerte für eine Versuchsperson einer Stichprobe
Bedingung: Merkmalsstabilität
Aber: Schlechter Test oder schlechtes Merkmal?

Bei grosser Ähnlichkeit: Hohe Reliabilität, geringer Einfluss eines Messfehlers

Bei geringer Ähnlichkeit: Geringe Reliabilität

-> Wittgensteins Zeitungsleser: Wiederholter Kauf der gleichen Zeitung : Alles ist wahr, aber Verwechslung von Reliabilität und Validität

19
Q

Beschreibe Retestreliabilität und ihre Probleme

A

Wiederholte Testung mit dem gleichen Test
Numerisches Relativ: Korrelationskoeffizient
R * 100= Prozentanteil der wahren Wertes an der Messung
Probleme:
-Übungseffekte
-Erinnerungseffekte (Intertrialzeit verlängern)
-Längere Zeitraum erhöht die Wahrscheinlichkeit für Veränderungen (Erkrankungen, Vorbereitung, Kurse)
-ungeeignet für instabile Merkmale
-relativ hoher Aufwand
-Gefahr des Drop-out

20
Q

Beschreibe die Paralleltestreliabilität und ihre Vorteile

A

Eine Stichprobe wird zweimal an eng beieinander liegenden
Zeitpunkten getestet,
mit equivalenten aber nicht identischen Fragen
Test1: 3 + 5 = ? Test2 2 + 4 = ?
Vorteil :
-Übungseffekte auch hier, jedoch keine Erinnerungseffekte → der zeitliche Abstand kann verringert werden
-Tatsächliche Kompetenzen werden besser erfasst

21
Q

Paralleltestreliabilität: Nachteile

A

Nachteil
-Erheblicher Aufwand
-formale Ähnlichkeit
(gleiche Anzahl, gleiche Formulierung etc.)
-inhaltliche Ähnlichkeit
-identische Itemschwierigkeit
-Geringe Reliabilität lässt keinen eindeutigen Schluss auf das Problem zu : Grosser Messfehler ? oder Schlechter Paralleltest?

22
Q

Beschreibe die Testhalbierungsmethode (Split-half)

A

Ein Test wird einmal bearbeitet, Aufteilung der Items in 2 Hälften, die miteinander korreliert werden
Vorbedingung: Keine systematische Itemverteilung
Denken Sie viel an Krankheiten? Testhälfte 1
Beschäftigen Sie sich viel mit Krankheiten? Testhälfte 2
Mehtoden: Odd-even-Methode, Zufallsauswahl, erste vs. letzte Testhälfte
-> Split-half unterschätzt die tatsächliche Reliabilität

23
Q

Bewertungskriterien der Reliabilität

A

-Gute Reliabilität > 0,80 > 0,9
-Reliabilitäten > 0,90 gelten als hoch
Cave: -Fragestellung beachten
Differentielle Anwendung der Berechnung ist zu beachten:
Merkmals mit hoher zeitlicher Fluktuation
→Hohe Paralleltestreliabilität ist günstig
Merkmals mit zeitlicher Stabilität
→Hohe Retestreliabilität ist günstig

24
Q

Beschreibe die Variabilität

was macht eine hohe Variabilität aus?

A

Validtät: Wert der Messgenauigkeiteines Tests für die
Messung der Zielvariable
Schulnoten in der Primarschule:
-warum sind Mädchen fast immer besser?
Messung der kognitiven Leistungsfähigkeit
oder Anpassungsfähigkeit, Ausdauer, schöne Handschrift, Sozialverhalten

Hohe Validität = Die Operationen, von denen angenommen wird, dass sie die Ausgangshypothese überprüfbar machen, stellen eine gelungene Operationalisierung der latenten Variablen, die gemessen werden soll, dar.

25
Q

Inhaltsvalidität (I/II)

A

Merkmal definiert durch Itemuniversum–Bestimmbar?
(ist wie weit ist Itemuniversum für relevantes Merkmal bestimmbar, muss repräsentative Auswahl treffen
aus Itemuniverum,sodass besteht Beziehung zwischen Merkmalsmessung und Aussenverhalten, ist also auch Grauzone ob ein Test inhaltsvalide ist )
repräsentative Auswahl im Test
„Rechenkompetenz in der 2.Klasse“ vs „Paarbindungsverhalten bei Homniden“

Das Problem definiert den Test, IQ ist was der IQ misst
Subjektiv und von Konventionen bestimmt
(s. Bortz 2007 und Sedlmeier/Renkewitz2013)

Weniger Testgütekriterium als Zielvorgabe:
Ist ein Rechentest ohne Multiplikationsitem inhaltsvalide ?
Ist Freizeitverhalten ein wichtiges Item für Paarbindung?
Kann man Berufseignung ohne IQ erfassen?

26
Q

Inhaltsvalidität (II/II)

A

Inhaltsvalidität:

  • Mathematik-Probe prüft nicht Englischvokabeln
  • IQ-Test testet nicht 50m Sprint
  • FPI misst nicht die Pupillenweite

Face validity–Augenscheinvalidität
Verwendung zwiespältig: Trivial (und oder aber) angemessen
-> inhaltsvalide ist Test wenn er dem Itemuniversum entspricht

27
Q

Kriteriumsvalidität

A

Der Testwert wird auf ein Aussenkriterium bezogen

Bsp.: Erfassung des Neurotizismus
Aussenkriterium: Häufigkeit des Arztbesuches
Quantifizierbarkeit: Korrelation von Testwertund Kriterium
Grundannahme und gleichzeitig Schwierigkeit:
Enger Zusammenhang zwischen Testwert und Kriterium
Wegen Fehlervarianz (Test)+ Fehlervarianz (Kriterium)
ist eine verringerte Kriteriumsvaliditätzu erwarten

-> Fehlervarianz des Tests und des Kriteriums gehen in Bewertung der Kriteriumsvalidität mit ein.
grundsätzlich ist zu erwarten, dass berechnete Kriteriumsvalididtät hat relativ gesehen immer etwas geringerer wert hat als iInhaltsvalidität
→ Verwendung mehrerer Aussenkriterien
-> wenn Aussenkriterien hoch korrelieren mit Testergebnis: Kriteriumsvalidität erreicht

28
Q

Typen der Validität

A

Bezug zu einem etablierten Test des Merkmals
(innere Validierung, aber: Messen zwar das gleiche, aber was?)
Übereinstimmungsvaliditä: Unterscheidung nach dem Zeitpunkt der Messung des Kriteriums (am selben Tag)
Vorhersagevalidität: Bei zeitgleichem / nahen Messen
Bei grösserem zeitlichen Abstand (zB.eine Woche)

Auf der Basis des Tests wird eine Vorhersage gemacht
die an einem später erhobenen Kriterium dann validiert wird. Persönlichkeitstest → Psychoseinzidenz
Freizeitverhalten → Suchtmittelmissbrauch

29
Q

Konstruktvalidität

A

Bei schwer zu operationalisierenden Merkmalen ist es schwierig eindeutige Aussagen über die Inhalte der Messung zu machen → Konstruktvalidierung
Überprüfung ob der Test mit möglichst vielen Hypothesen über das Merkmal zusammenhängt.

30
Q

Interne Validität

A

Vorbedingung für die Kausalitätsaussage:
Merkmal A wirkt sich auf Merkmal B aus
1)Ursache geht Wirkung voraus
2) Kovariationvon Ursache und Wirkung ist reliabel
3) Plausible Alternativerklärungen sind ausgeschlossen
Ist die Kausalität (Ursächlichkeit) gegeben
(diese 3 Faktoren ergeben Inhaltsvalidität)
→Interne Validität ist gegeben

31
Q

Externe Validität

A

Generalisierbarkeit der Befunde? Relevanz? (bei so vielen Störvariablen der Aussenbedingungen sollte man sich darauf beschränken, die Situation zu kontrollieren)

Extern valide Bedingung: Beziehung zwischen Test und Realität
je mehr umso besser z.B. Schlaflabor?
Hauptkritik an der psychologischen Forschung:
-Zu artifizielle Bedingungen
-Nicht ausreichende Repräsentativität der Stichprobe
-Die Bedeutung der externen Validität wird ambivalent diskutiert

32
Q

Externe Validität

A

Generalisierbarkeit der Befunde? Relevanz? (bei so vielen Störvariablen der Aussenbedingungen sollte man sich darauf beschränken, die Situation zu kontrollieren)

Extern valide Bedingung: Beziehung zwischen Test und Realität
je mehr umso besser z.B. Schlaflabor?
Hauptkritik an der psychologischen Forschung:
-Zu artifizielle Bedingungen
-Nicht ausreichende Repräsentativität der Stichprobe
-Die Bedeutung der externen Validität wird ambivalent diskutiert

33
Q

Störvariablen der Validität (I/II)

A

1.)Situation/Setting
z.B.: raumzeitliche Umstände: Untersuchungsort und -zeit
Atmosphäre (“setting”): Leistung oder Erleben im Vordergrund, Ordnung, Technik
2)Versuchsperson/Teilnehmer
z.B.:hatimmer eine “eigene” Hypothese,
Motivation: “intelligent” erscheinen, sozial erwünscht darstellen, „wertvoller Mitarbeiter sein“

34
Q

Störvariablen der Validität (II/II)

A

3)Studienleiter/Datenerheber
z.B.:Vl-Erwartungseffekt (Rosenthal-Effekt), Halo-Effekt, Teilnehmer-Interaktion: Sicherheit, Nervosität, Mann-Frau, Verständlichkeit
4)AussergewöhnlicheEreignisse zwischen
Datenerhebungen
z.B. Persönliche Erlebnisse
5) Probleme durch Wiederholungsmessung
(Prozesse in der Zeit, Ermüdung, Erste Messung beeinflusst zweite Messung: z.B. Übungseffekte)

35
Q

Externe ohne interne Validität

A

Operationalisierung: Sendezeit von Countrymusic in 43 städtischen
Arealen in den USA
Kontrolle von Störvariablen: Scheidungsrate, Armut, Verfügbarkeit
von Waffen und „Southernness“.
Auswertung: Multiple Regressions Analyse auf Basis vorhandener Daten
Ergebnis: 51% Varianz Aufklärung der „urban white suicide rates

Korrelation von Suizid und Countrymusik r=.07
Hypothese: aufgrund von depressivem Inhalt der Countrymusik erhöht häufiges hören dieser Musik die Suizidrate

36
Q

Objektivität, Reliabilität, Validität

A

Keine Gleichberechtigung der Gütekriterien
sondern eine sich bedingende, hierarchische Struktur
Die Objektiviät ist eine notwendige, aber
nicht hinreichende Bedingung der Reliabilität
Die Reliabilität ist eine notwendige, aber
nicht hinreichende Bedingung der Validität
O>R>V