10. VL - Güterkriterien Flashcards
Welche Datenquellen zur Datengewinnung gibt es?
→ Subjektive Daten (Fragebögen, Interview → Befragungsmethoden)
→ Verhaltensdaten (objektive Daten) (Reaktionszeitmessungen, Augenbewegung → Verhaltensbeobachtung)
→ Physiologische Daten (Pulsmessung, Hirnaktivität → Physiologische Messungen)
Was sind grundsätzliche Probleme von Selbstauskünften? (subjektive Daten)
oder: Nennen Sie drei Probleme, die die Gültigkeit des verbalen Selbstberichtes einschränken
→ Aspekte evtl. nicht zugänglich (z.B Wie viel km sind sie letztes Jahr gefahren?)
→ Selbstbeobachtung beeinflusst beobachteten Gegenstand
→ Selbstdarstellungstendenzen (soziale Erwünschtheit)
→ Antworttendenzen (Ja-Sage-Tendenz)
→ Careless Responding
Wofür sind die Ratingskalen gut? (Fragebogen)
Um Antworten gerated abzugeben:
- ohne/ mit Nummerierung
- Deskriptoren an den Eckpunkten oder überall
Mit Dimensionen kann man Fragen oder Aussagen beurteilen, wie heißen diese? (Items)
→ Grad der Zustimmung
→ Häufigkeiten
→ Intensität
Was sind Likert-Skalen und was kann man damit messen?
- Messung der persönlichen Einstellung
- Mehrere Items sollen Gegenstand erfassen (werden gemittelt)
- Items werden in positiver und negativer Formulierung kombiniert
Was sind die Vorteile des Interviews, gegenüber des Fragebogens?
- weniger Entwicklungskosten
- Adaptivität der Durchführung (anpassungsfähig)
- stärkere Motivierung der Vp
- keine Schreib- und Lesefähigkeit gefordert
- Vermeiden fehlender Daten
Was sind Vorteile des Fragebogens, gegenüber dem Interview?
- weniger VL-Effekte
- Anonymität
- leichte Auswertbarkeit
- Objektivität
- Standardisierung
- größere Stichproben, regional verteilt
- wenig Trainingsaufwand
- wenig Zeitaufwand
- weniger Durchführungskosten
Wozu ist die Methode des Interviews besonders wichtig?
Zur Prüfung von Hypothesen
→ man greift auf strukturierte & standardisierte Verfahren zurück
Bei Interviews unterscheidet man zwischen zwei Dimensionen: - welches Format nutzt man am häufigsten zur Hypothesengewinnung?
→unstrukturiert, nondirektiv (offene Gesprächsführung, ohne Anleitung)
→stukturiert (standardisiert), direktiv (jemand leitet das Gespräch, ziel im Hintergrund) -> Bei Hypothesentestung
Man wählt die nondirektive Interviewtechnik (offene Gesprächsführung)
Welche Vorteile hat das wissenschaftliche Beobachten?
→ Objektivierbar = mehrere Beobachter unabhängig voneinander denselben Sachverhalt beobachten
→ Ziel eine zunächst interpretationsfreie Erfassung des Verhaltens
Wann liefern Verhaltensbeobachtungen reliable (zuverlässige) und objektive Daten? (Schema mit den Kategorien, Rasen mähen)
- Kategoriesystem möglichst einfach und klar definiert ist
- Häufigkeit des zu beobachtenden Verhaltens ausreichend ist
- Nicht zu viele Kategorien gleichzeitig kodiert werden müssen
- Beobachtendes Personal gut trainiert ist und ggf. ausgewählt ist
Worin unterscheiden sich psychologische Tests von anderen Fragebögen?
Sie sollen Messwerte für psychologische Konstrukte ermitteln
→ werden normiert, um einzelne Person mit einer großen Gruppe vergleichen zu können
Es werden zwei psychologische Tests unterschieden:
→Persönlichkeitstests → z.B. PE messen
→ Leistungstests → Erfassen Arten v. Fähigkeiten
Nenne die Hauptgütekriterien eines Fragebogens:
Objektivität
Reliabilität (Zuverlässigkeit)
Validität (Gültigkeit) → Test valide, wenn er misst, was er messen soll
Drei Aspekte der Objektivität
→ Durchführungsobjektivität (Präzise Anweisungen z.B. Antworten auf Nachfragen, standardisierte Instruktionen und relativ standardisierte Situationen erhöhen die Objektivität)
→ Auswertungsobjektivität
(Verschiedene Personen müssen aufgrund der Testantworten zum gleichen Punktwert gelangen. Dies ist bei geschlossenen Antworten einfach, bei offenen Antworten müssen klare Klassifikations- und Auswertungsanweisungen gegeben werden)
→ Interpretationsobjektivität
(Aus demselben Ergebnis sollten verschiedene Personen dieselben Schlüsse ziehen. Dies kann durch eine gute und umfassende Normierung an einer Eichstichprobe erreicht werden)
Was sind die Annahmen der Reliabilität?
→ Jede Messung = unsystematische Messfehler. Je geringer der Fehler, desto höher die Genauigkeit (=Reliabilität)
→ Klassische Testtheorie (KKT) → Messwert X = wahrer Wert True + Fehler Error
→ Reliabilität ist der Anteil wahrer Varianz in der Gesamtvarianz der Messwerte
Welche zwei Prinzipien beinhaltet die Reliabilität?
→ innere Konsistenz (Messen mehrere Fragebogenteile dasselbe? → Ergebnis gleich? → Reliab. steigt mit der Testlänge)
→ Retest-Reliabilität (Misst derselbe Fragebogen zu mehreren Zeitpunkten dasselbe?)
Um die Paralleltest-Reliabilität zu testen, geht man wie vor? (Innere Konsistenz messen)
Korrelation zweier Parallelformen über die gleichen VPs)
Was korreliert man bei der Split-Half-Reliabilität? (Innere Konsistenz messen)
- Korrelation zweier Testhälfte;
- ist daher nur die Reliabilität der Testhälfte und muss daher noch für die Testlänge korrigiert werden
Was und wofür brauchen wir das Cronbach’s Alpha und was bedeutet die Trennschärfe in diesem Zusammenhang?
- Um die Innere Konsistenz zu messen
- Maß für den Zusammenhang aller Items (mittlere Korrelation aller Items)
- Methode der Wahl, seit es Computer gibt
- Trennschärfe = Korrelation eines Items mit dem Rest der Skala
- Man kann die Reliabilität verbessern, indem man ein/ oder mehrere Items mit niedriger Trennschärfe ausschließt
Wie nennt sich der Vorgang, wenn wir eine Korrelation desselben Fragebogen-Gesamtwerts zu verschiedenen Zeitpunkten mit denselben Probanden durchführen? (Welche Probleme können auftreten?)
- Retest-Reliabilität
- Kurze Zeiträume: Personen können sich Antworten merken, Reliabilität überschätzt
- Lange Zeiträume: Merkmal kann sich geändert haben
- Leistungstests haben Reliabilitäten von .90, Persönlicheitstests
eher .80, bei sehr kurzen Fragebogen ist noch .70 akzeptabel.
- Leistungstests haben Reliabilitäten von .90, Persönlicheitstests
Items eines Tests repräsentieren das, was der Test messen soll. Was ist hier gegeben?
Inhaltsvalidität (auch Augenscheinvalidität)
→ Test ist inhaltsvalide
Ich erstelle einen Fragebogen zu Messung von den Persönlichkeitseigenschaften Neurotizismus und Extraversion. Wie kann ich prüfen, ob dieser interne Validität aufweist?
→ Faktorenanalyse der Fragebogen-Items
→ Es sollten 2 Faktoren herauskommen und die Items sollten auf dem Faktor laden, zu dem sie gehören sollen
Unterschied zu internen Validität eines Experiments
Um die Kriteriumsvalidität zu testen geht man wie vor? → Nenne Arten von Außenkriterien
- Eine oder mehrere Variablen werden erhoben, die dasselbe Konstrukt messen soll, und mit den Fragebogen korreliert
- z.B: Fragebogen zur Durchsetzungsfähigkeit wird korreliert mit dem Verhalten in einer Gruppendiskussion
- → Arten:
- Verhaltensbeobachtung
- Fremdeinschätzungen oder
- weitere Fragebögen
Um die Konstruktvalidität zu testen werden..?
- mehrere Hypothesen formuliert
- über Zusammenhänge zwischen dem und anderen Konstrukten
- mit denen der Test theoretisch zusammenhängen müsste
- ⇒ Gesamtheit der bestätigten Zusammenhänge = Ausmaß der Konstruktvalidität
Unterschied zwischen Kriteriums und Konstruktvalidität?
- Beim ersteren wird ein externes Merkmal ermittelt, das dasselbe Konstrukt misst,
- beim letzteren eins, das ein anderes Konstrukt misst
Bei der Validität überprüft man..?
Inhaltsvalidität, interne Validität, Kriteriums- und Konstruktvalidität
Die drei Gütekriterien sind voneinander abhängig, denn..
ein Test, der nicht objektiv ist, kann nicht reliabel sein. Ein unreliabler Test kann nicht valide sein
Was sagen konvergente und diskriminante Validität aus, mache ein Beispiel:
konvergente Validität → Hypothesen, die mit Fragebogenwert korrelieren sollen
diskiminante Validität → Hypothesen, mit welchen er NICHT korrelieren soll
Beispiel: Die Bindungssicherheit sollte hoch mit der Paarbeziehungszufriedenheit korrelieren, aber nicht mit der Zufriedenheit mit der Wohnsituation (um auszuschließen, dass nur sozial erwünschtes Antworten gemessen wird).