Klausur Flashcards
Bitte Erklären sie die Bedeutung der Bezeichnungen „Persönlichkeitspsychologie“, „Persönlichkeitsforschung“ und „Differentielle Psychologie“.
Persönlichkeitspsychologie:
▪ empirische Wissenschaft
▪ von individuellen Besonderheiten von Menschen
(Körperliche Erscheinung, Verhalten, Erleben)
Differentielle Psychologie:
▪ Differenzen zwischen Personen, Merkmalen
▪ Zeitliche Stabilität ignoriert
Persönlichkeitsforschung:
▪ intraindividuelle Unterschiede
▪ stabil und konsistent
▪ menschliches Erleben und Verhalten
▪ Entstehungsbedingungen
▪ Einfluss auf das aktuelle Erleben und Verhalten
▪ Langfristige Konsequenzen
Bei diesen Begriffen handelt es sich um Synonyme, die sich auf den gleichen Forschungszweig beziehen.
Bitte erläutern Sie die Begriffe „State“ und „Trait“ in Bezug auf Persönlichkeitsdimensionen.
State
- aktueller Zustand einer Person
- nicht stabil
- verändert sich
Beispiele: Angst, Aufmerksamkeit, Befindlichkeit, Extraversion in einer bestimmten Situation
Trait
auch „Disposition“ genannt
- überdauernde persönliche Eigenschaften oder Attribute,
- die das Verhalten über verschiedene Situationen hinweg beeinflussen
Beispiele: Ängstlichkeit, Intelligenz, Extraversion
Erklären Sie, was manifeste und latente Variablen sind.
Latente Variablen sind Konstrukte, die nicht direkt gemessen werden können
(z.B. Persönlichkeitseigenschaften, Lernerfolg).
Manifeste Variablen können direkt gemessen werden
(z.B. Alter, Gewicht oder andere physikalische Messwerte).
Was geschieht in der Operationalisierung? Was sind die zwei Ziele, die diese verfolgt?
▪ Latente Variablen werden operationalisiert um sie messbar zu machen (z.B. Persönlichkeitsfragebögen, Klausuren).
1. Ziel: Objektivität
die Messung soll also zu gleichen / ähnlichen Ergebnissen führen (unterschiedliche Beurteiler unabhängig voneinander Beurteilung gleich anwenden), also möglichst objektiv sein.
2. Ziel: Wiederholbarkeit
Die Operationalisierung ist somit Grundlage dafür, dass Messungen mit wiederholbar sind.
Denn nur so kann die Ausprägung einer Persönlichkeitsdimension zuverlässig geprüft werden.
Bitte erklären Sie die Vor- und Nachteile quantitativer und qualitativer Messverfahren.
Quantitative Methoden
- Es werden Daten in Form von Zahlen gesammelt
- Dadurch können große Gruppen befragt werden
- Statistische Auswertung
- Erkenntnisse verallgemeinbar
- (große Gruppen)
- Ergebnisse gut darzustellen (z.B. in Diagrammen)
Nachteil: was nicht abgefragt wurde, kann nicht gemessen werden
Qualitative Methoden
- Es werden Erklärungen, Begründungen oder Beschreibungen in Textform gesammelt
- Bestimmte Fälle oder ein bestimmter Kontext kann offen untersucht werden
- Auf diese Weise können vorher unbekannte Informationen gewonnen werden
Nachteil: Erkenntnisse können oft nicht auf andere Gruppen oder Kontexte übertragen werden.
Bitte erläutern Sie, was mit Reaktivität, sozial erwünschtem Antworten und Täuschung gemeint ist und was man jeweils tun kann, um diese zu verringern.
Reaktivität:
Veränderung bzw. Verzerrung der erhobenen Daten allein aufgrund der Kenntnis der untersuchten Personen darüber, dass sie Gegenstand einer Untersuchung sind.
- Untersuchte in Unkenntnis darüber lassen, dass sie untersucht werden
- Anonymität zusichern
- Coverstory über den Untersuchungszweck
- Messverfahren, die nicht kontrolliert und beeinflusst werden können (z.B. Messung des Kortisolspiegels, MRT)
- Indirekte, implizite Messverfahren (z.B. Reaktionszeit beim IAT)
Sozial erwünschtes Antwortverhalten:
▪ Bei diagnostischen Messungen sind Variablenwerte in der Regel annähernd normalverteilt (weil durch viele unabhängige Faktoren beeinflusst)
▪ Es gibt jedoch Variablen, bei denen hohe oder niedrige Werte erwünscht:
➢ Schiefe Verteilung
➢ Personen beschreiben sich unbewusst in eine sozial erwünschte Richtung
Täuschung
Wenn Personen sich Belohnungen oder negative Folgen in Abhängigkeit von einem bestimmten Ergebnis versprechen, neigen Menschen zu absichtlichen Täuschung. (z.B. bei Einstellungstests)
➢Leistungestests
(z.B. Intelligenztests, MSCEIT Mayer-Salovey-Caruso Test zur Emotionalen Intelligenz)
▪ kann man nicht nach oben täuschen
▪ Eine Täuschung nach unten ist möglich
▪ Durch Übung kann man das Ergebnis verbessern
Was ist der Unterschied zwischen Fragebögen und Leistungstests? Wann sind diese Messverfahren geeignet bzw. nicht geeignet?
❖ Fragebogen (Selbsteinschätzung / Fremdeinschätzung), z.B.:
- Personalentwicklung: Persönlichkeitsfragebögen
- Führungskräfteentwicklung: 360-Grad-Feedback mit Selbsteinschätzung, Einschätzung des Vorgesetzten, der Kollegen eigener Mitarbeiter
❖ Leistungstest (Selbsteinschätzung / Fremdeinschätzung), z.B.:
- Bewerberauswahl: Tests für bestimmte Fähigkeiten, Assessment Center,
- simulierte Stresssituationen in Interviews
Bitte recherchieren Sie im Internet die vollständigen Bezeichnungen für die folgenden typenorientierten Testverfahren: DISG, MBTI, GPOP.
DISG
Das Akronym DISG (engl. DISC) bezeichnet einen auf Selbstbeschreibung beruhenden Persönlichkeitstest (auch Profil oder Inventar genannt) mit den vier Grundtypen Dominanz, Initiative, Stetigkeit und Gewissenhaftigkeit.
MBTI
Der Myers-Briggs-Typenindikator ist ein Instrument, mit dessen Hilfe die von Carl Gustav Jung entwickelten psychologischen Typen erfasst werden sollen.
GPOP
Der Golden Profiler of Personality (GPOP) ist ein psychologisches Testverfahren zur Selbsteinschätzung der Persönlichkeitsstruktur eines Menschen. Er basiert auf einer Weiterentwicklung des Myers-Briggs-Typenindikators,
Wie hoch sollte bei der Faktorenanalyse laut dem Eindeutigkeitskriterium die Faktorladung auf eigenem Faktor und wie hoch auf jedem anderen Faktor sein?
Eindeutigkeitskriterium:
- Faktorladung auf eigenem Faktor >.30,
- auf jedem anderen Faktor <.30
Wie wird Persönlichkeit im eigenschaftsorientierten Paradigma gesehen? Wie wird hier das Verhältnis zwischen Traits und Verhalten des Menschen gesehen?
Das eigenschaftsorientierte Paradigma:
Mithilfe von mathematisch-statistischen Verfahren erstellte Persönlichkeitsmodelle
Zuerst: Personen zu den Eigenschaften befragt (Fragebogen)
Danach: statistische Auswertung der Daten: kann man die Eigenschaften auf wenige zentrale Eigenschaften zusammenfassen?
Grundsätzliche Annahmen:
▪ Eigenschaften (traits) sagen Verhalten voraus
▪ Persönlichkeit: Summe von Eigenschaften (traits)
= charakteristische Regelmäßigkeiten im Verhalten und Erleben
▪ also situationsübergreifend, zeitlich überdauernd ▪ z.B. Hilfsbereitschaft, Aufgeschlossenheit etc.
▪ man kann traits nicht direkt beobachten, jedoch durch Messung erschließen (z.B. Fragebogen, Beobachtung des Verhaltens etc.)
▪ Eigenschaften können mehr oder weniger ausgeprägt sein z.B. „sehr aufgeschlossen“ / „wenig aufgeschlossen“
Wichtigstes Messinstrument: Fragebogen Messergebnisse: numerische Daten (Zahlen)
Bitte erläutern Sie, was mit Strukturmodellen bzw. dimensionalen Modellen der Persönlichkeit gemeint ist.
Faktorenanalyse
▪ setzt untereinander korrelierende Variablen voraus
▪ reduziert Variablen auf wenige einzelne, voneinander unabhängige Faktoren
▪ Ergebnis: Strukturmodelle / dimensionale Modelle
(einzelne, voneinander unabhängige Faktoren / Eigenschaften)
Bitte erläutern Sie die Entwicklung der Big-Five-Traits.
Das gesamte Lexikon einer Sprache wird nach Eigenschaftsworten durchsucht
Ungebräuchliche Worte werden weggelassen, von Worten sehr ähnlicher Bedeutung wird nur eines behalten
•ca. 100 Eigenschaftsworten: BEFRAGUNG ➢ große Gruppe von Personen
➢ Selbstbeurteilung durch Eigenschaftsworte
Jedes Wort = Eigenschaftsvariable
z.B. „ich bin meistens entspannt“: auf einer Skala 1-5
100 Kern-Eigenschaftswörter
Diese Eigenschaftsvariablen werden dann mit Hilfe der Faktorenanalyse auf möglichst wenige Faktoren reduziert
Sie beschreiben auf effiziente Weise alltagspsychologisch wahrnehmbare Persönlichkeitsunterschiede
(Fünf Faktoren bei germanischen Sprachen: Englisch, Deutsch, Holländisch)
Raymond B. Cattell entwickelte mithilfe der Faktorenanalyse ein Persönlichkeitsmodell mit 16 Faktoren. Erläutern Sie, in welchem Zusammenhang dieses Faktorenmodell zu dem Big Five Persönlichkeitsmodell steht.
Die erste Stufe: Es sind nicht mehr oder weniger als 171 Persönlichkeitsmerkmale bekannt. All diese Eigenschaften hat Cattell aus einer noch längeren Liste von Allport und Odbert ausgewählt. In diese spezielle Liste hatten diese beiden Forscher alle Begriffe, die in den beiden wichtigsten englischen Wörterbüchern der damaligen Zeit zu finden waren und einen Bezug zur Persönlichkeit zu haben schienen, aufgenommen.
Die zweite Phase: Er konzentrierte sich auf die Informationen, die über Interviews zu erhalten waren, um diesen Merkmalen einen Inhalt zuzuweisen.
Die dritte Stufe: Er nutzte die Informationen aus den Fragebögen (Q) und den objektiven Tests (T). Nach all den inhaltlichen und mathematischen Analysen kam er zu dem Schluss, dass es 16 Persönlichkeitsfaktoren gebe. Das sind Dimensionen, in die wir alle Menschen einordnen können. Mathematisch gesehen sind sie das Produkt einer Faktorenanalyse erster Ordnung. Dieses wird bipolar dargestellt:
Die oben genannten Persönlichkeitsfaktoren sind nicht unabhängig voneinander. Stattdessen korrelieren sie positiv und negativ miteinander, was zu anderen grundlegenden Faktoren, sogenannten Faktoren zweiter Ordnung führt:
Bitte benennen Sie die zwei bekanntesten Big-Five-Persönlichkeitsfragbögen im deutschsprachigen Raum und erläutern Sie den Unterschied zwischen diesen.
NEO Fünf-Faktoren-Inventar (NEO-FFI)
- von Borkenau u. Ostendorf (2008)
- 60 Items (12 für jeden Faktor)
NEO Persönlichkeitsinventar, revidierte Form (NEO-PI-R)
- von Ostendorf u. Angleitner (2003)
- 240 Items (5 Faktoren x 6 Facetten, je 8 Items)
differenziert jeden der Big Five in sechs Unterfaktoren (Facetten)
Wird nur wichtig, wenn jemand z.B. in einer Führungsposition NICHT: □ ordentlich (Ausgleich durch Assistenz) oder
□ pflichtbewusst (manchmal hinderlich im Zeitmanagement),
JEDOCH: ► selbstdiszipliniert, kompetent und besonnen (Gewissenhaftigkeit)
Welche Big-Five-Traits haben einen Zusammenhang mit Führungserfolg? Statistisch kann ein wechselseitiger Zusammenhang durch Korrelation/Pearson‘s r berechnet werden. Was lässt sich hier zur Kausalität sagen? Was bedeutet dies für die Wechselbeziehung von Führungsqualität und den Big-Five-Eigenschaften?
- Extraversion (0.31)
- Gewissenhaftigkeit (0.28)
- Offenheit für Erfahrungen (0.24)
Was sind Motive und welche physiologischen Auswirkungen haben diese?
▪ Disposition, nach einem bestimmten wertgeladenen Zielzustand zu streben
▪ Überdauernde Handlungsbereitschaft bei einer bestimmten Person
▪ verwandte Konzepte: “Instinkt”, “Trieb”, “Bedürfnis” oder “Interesse“
▪ Motive betreffen die intrinsische Motivation
Physiologische Auswirkungen:
1. Energetisierung!!!
Physisch
Psychisch
2. Selektive Informationsverarbeitung / Verhaltenssteuerung
Konzentration auf relevante Gedächtnisinhalte und Problemlösevorgänge
Verhaltensweisen, die in ähnlichen Situationen zum Erfolg geführt haben, werden bereitgestellt
Wie werden explizite und implizite Motive gemessen? Was sind projektive Tests?
Explizite Motive: Fragebogen
Implizite Motive: Projektive Tests
- Unstrukturiertes Reizmaterial (z.B. Bilder)
- freie Deutung, kurze Bildbeschreibung
- Die Antworten werden durch inhalts-analytische Kodierung ausgewertet.
- Aufgrund der Themennennung wird auf ein Motiv des Erzählers rückgeschlossen.
Wenn eine Messung bei vielen Menschen vorliegt, wie entscheidet man, welche Werte extrem niedrig, durchschnittlich oder extrem hoch sind?
Man geht davon aus, dass Werte normalverteilt sind und berechnet dann Mittelwert und Standardabweichung.
Was sagt das Kompetenz-Performance-Problem aus? Wie können Ergebnisse in Leistungstests unabhängig von der gemessenen Fähigkeit beeinflusst werden?
Fähigkeiten sind Persönlichkeitseigenschaften, die Leistungen ermöglichen.
-> Die Leistungen hängen nicht nur von der Fähigkeit sondern auch der Anstrengung und Übung ab.
1. Lernen
Die Fähigkeit, Probleme und Aufgaben aller Art zu lösen kann auch erlernt und eingeübt werden. (Intelligenteren Menschen wird dies jedoch leichter fallen)
2. Motivation /Interesse
Das Lösen von Problemen und Aufgaben hängt auch stark mit der Motivation zur Anstrengung zusammen.
Mögliche Lösungen:
Leistungsfördernde Gestaltung der Situation
- Leistungsanregung z. B: durch Instruktion
- Keine Über- oder Unterforderung
- Belohnung von Leistung
Testwiederholung
- Die jeweils beste Leistung wird berücksichtigt
- Leistungsschwankungen zwischen Testungen sind Anstrengungs-Unterschiede.
Reicht es aus, nur die allgemeine Intelligenz zu messen, um den wahren IQ einer Person herauszufinden, oder muss man Untertests wie z.B. Tests zur Messung der mathematisch-logischen oder verbalen Fähigkeiten verwenden? Bitte begründen Sie.
Allgemeiner Intelligenztest mit g-Faktor reicht aus
(General intelligence factor)
Wenn man wissen will, in welchen Bereichen die Person Intelligenz hat, reicht das nicht aus
Bitte erläutern Sie die Konstrukte kristalline und fluide Intelligenz und wie sich diese jeweils im Laufe des Lebens verändern.
Fluide Intelligenz nimmt mit dem Alter leicht ab. Die Verarbeitung und das Denken werden langsamer. Kristalline Intelligenz steigt oder stagniert (durch Bildung und Erfahrung im Laufe des Lebens). Intelligenz entwickelt sich bis 17 ganz stark und ab 26 entwickelt sich nicht mehr so viel.
Stimmt es, dass „die Jugend immer dümmer wird“?
Flynn-Effekt = Jugend wird eher immer schlauer, als die Generation davor und IQ Skala muss immer angepasst werden (neu normiert werden)
Welcher Effekt wird als Flynn-Effekt bezeichnet?
Aufstieg des IQs um 3 Punkte/Jahrzehnt, sodass die Skalen immer neu normiert werden müssen. Kurz: Menschen werden immer intelligenter
In den 90er Jahren gab es eine Stagnation in den Industrieländern, tendenziell aber Wachstum
Welche drei Arten der Objektivität müssen durch Operationalisierung gesichert werden?
- Durchführungsobjektivität
- Auswertungsobjektivität
- Interpretationsobjektivität
Das muss durch Standardisierung sichergestellt werden
Bitte erklären Sie, was mit Reliabilität eines Testverfahrens gemeint ist.
Zuverlässigkeit des Tests
Der Test misst das, was er misst, genau und zuverlässig, unabhängig von anderen, z.B. zufälligen Einflüssen.
Also frei von Messfehlern.
Bitte erläutern Sie den Begriff Retest-Reliabilität und wie diese berechnet wird.
Korrelation zwischen einer Erstmessung und Zweitmessung bei derselben Personen und diese sollte hoch sein.
Erklären Sie, was mit interner Reliabilität gemeint ist sowie die zwei Verfahren, durch die diese berechnet wird.
Misst die Konsistent.
Zwei Verfahren: Split-half und Cronbachs-alpha
Was ist mit Paralleltest-Reliabilität gemeint und wie wird diese berechnet?
Korrelation von Ergebnissen paralleler Formen der Tests (bei Persönlichkeitsfragebögen ist eine Erstellung einer parallelen Form eher schwierig, von daher eher bei Mathetests oder so sinnvoll)
Bitte definieren Sie den Begriff Validität.
Misst der Tests das, was er zu messen vorgibt.
Bitte erläutern Sie, was Inhalts- und Augenscheinvalidität jeweils bedeuten und wie diese gemessen werden.
Augenschein: Akzeptanz von nicht Fachleuten
Inhalt: außenstehende Experten sollen eine Einschätzung geben
Was ist Kriteriumsvalidität und wie wird diese berechnet?
Korrelation der Selbsteinschätzungen mit einem entsprechenden Außenkriterium.
Korrelation zwischen Mathetest und Mathenote sollte zum Beispiel hoch sein
Bitte erläutern Sie, durch welche zwei Arten der Validität die Konstruktvalidität bestimmt wird. Wie heißt das Verfahren, in dem diese ermittelt werden? Wie werden diese zwei Validitätsarten jeweils berechnet?
Konvergente und divergente Konstruktvalidität
Korrelationen mit inhaltlich verwandten/nicht verwandten Merkmalen.
1. Konvergente Validität
Hohe Korrelation der Merkmalserfassung durch unterschiedliche Methoden (z.B. valide Tests, die die gleiche Eigenschaft messen)
2. Diskriminante Validität
Geringe Korrelation unterschiedlicher Merkmale durch die gleiche Methode (Unterschiedliche Eigenschaften – geringe Korrelation)
Was ist ein Konstrukt?
▪Nicht beobachtbarer Sachverhalt
▪Theoretisches Konzept
▪Wird aus messbaren Indikatoren ( = Merkmal, Anzeichen) erschlossen
Was gibt es für unterschiedliche Skalen?
Verhältnisskala:
▪ Wie Intervallskala, aber:
▪ Absoluter Nullpunkt ist gegeben, alle Rechenfunktionen sinnvoll
▪ Bsp.: Körpergröße, Alter
Intervallskala
▪ Intervalle zwischen den einzelnen Abstufungen sind gleichmäßig verteilt
▪ Nullpunkt ist willkürlich gesetzt
▪ Bsp.: Intelligenzquotient
Ordinalskala
▪ Ausprägungen werden hinsichtlich ihrer Wertigkeit in eine Rangfolge gebracht
▪ Die Abstände zwischen den Rängen sind nicht definiert
▪ Bsp.: Podiumsplätze, Sterne für Hotel-Kategorien
Nominalskala
▪ Unterschiede zwischen den Ausprägungen sind rein nominell
▪ Ausprägungen haben keine unterschiedlichen Wertigkeiten
▪ Bsp.: Blutgruppen, Trikotnummern
Was ist der Barnum Effekt (Forer-Effekt)?
Neigung von Menschen, vage und allgemeingültige Aussagen über die eigene Person als zutreffende Beschreibung zu akzeptieren.
Pseudovorhersagen von Eigenschaften
Was ist der Nutzen der Korrelation und Faktorenanalyse?
▪ Diese Verfahren werden u.a. genutzt, um die Qualität eines diagnostischen Instruments zu beurteilen
▪ Sie geben z.B. Auskunft, wie viele Konstrukte durch den Fragebogen/Test gemessen wurden
Was sind Grundlagen und was ist das Ziel der Faktorenanalyse?
- setzt untereinander korrelierende Variablen voraus
- Viele Variablen werden auf wenige Faktoren reduziert
- Faktoren entsprechen zusammenfassenden, übergeordneten Kategorien.
- Ziel: möglichst wenige, voneinander unabhängige Variablen
Unterschied zwischen impliziten und expliziten Motiven?
Implizite Motive:
▪ Manche Motive entstehen in der vorsprachlichen Entwicklung
▪ Ihre Anreize sind nonverbal, betreffen eher bildhafte Reize und Körperreaktionen
▪ Sie sind unbewusst – implizite Motive
Explizite Motive:
▪ Andere Motive entstehen später, bei der Entwicklung der Sprache und des Selbstkonzepts
▪ Ihre Anreize sind verbal
▪ Sie sind bewusst und gehören zum Selbstkonzept – explizite Motive
Wie entsteht Selbstwirksamkeit?
1. Eigene Erfolgserlebnisse
- werden übertragen auf ähnliche Aufgaben
- Führen evtl. zu selbsterfüllenden Prophezeiungen bzw. in ein Teufelskreis
2. Stellvertretende Erfahrung
- aus einer Vergleichsgruppe (in einer ähnlichen Situation)
- Wenn Versagen bei anderen beobachtet wird, sinkt die Selbstwirksamkeit
- weniger Einfluss als persönliche Erfolgserfahrungen
3. Verbale Ermutigung
- Bekommt eine Person viel Ermutigung, steigt die Selbstwirksamkeit
- Je nach Vertrauen in die ermutigende Person starker oder geringer Einfluss
4. Umgang mit emotionaler Erregung
Je nach Interpretation des Stressreaktionen wie z.B. Herzklopfen, Schweißausbrüche, Händezittern, Frösteln, Übelkeit
Wenn als Schwäche interpretiert – Selbstzweifel
Wenn Abbau von Stressreaktionen gelingt – mehr Selbstwirksamkeit
Was ist die Kontrollüberzeugung?
➢ Glauben einer Person zur eigenen Kontrolle über die Ereignisse in ihrem Leben.
Um normalverteilte Diagramme zu beschreiben, braucht man zwei Angaben, welche?
- Mittelwert
- Varianz bzw. Standardabweichung
Was ist kristalline Intelligenz und was ist fluide Intelligenz?
Kristalline Intelligenz:
- z.B. Wortschatz, Allgemeinwissen, Erfahrung … Stark wissens- und kulturabhängig
- umfasst erworbene kognitive Fähigkeiten und die Fähigkeit erworbenes Wissen auf Problemlösungen anzuwenden
- Kristalline Intelligenz bleibt bis ins hohe Alter intakt und kann sogar mit dem Alter noch zunehmen
Fluide Intelligenz:
- Schnelligkeit der Wahrnehmung, Reaktionszeit und induktives Denken
- bezieht sich auf Basisfähigkeit des Denkens, die Fähigkeit, sich neuen Situationen anzupassen und neuartige Probleme zu lösen
- Fluide Intelligenz nimmt mit zunehmendem Alter ab
Wie kann man die Interrater-Reliabilität messen?
Cohens Kappa 𝒌

Wann spricht man von einer schlechten Interrater-Reliabilität und wann von einer mittelmäßigen und wann von einer guten bzw. auch sehr guten?
- *< 0,4:** schlechte Interrater-Reliabilität
- *0,4 – 0,6:** mittelmäßige (moderate) Übereinstimmung
- *> 0,6:** gute Übereinstimmung
- *> 0,75:** sehr gute Übereinstimmung
Wie erreicht man einen hohen Grad an interner Validität?
Ein hohes Maß an interner Validität erreicht man am besten durch hochkontrollierte und deshalb recht künstliche (Labor-) Bedingungen.
Hoher Grad, wenn:
- wenn Alternativerklärungen für die gefundenen Effekte weitestgehend ausgeschlossen werden können
- wenn also die Veränderung der abhängigen Variable eindeutig auf die Variation der unabhängigen Variable zurückgeführt werden kann (keine Alternativerklärung)
Was misst die Retest Reliabilität, die Interne Reliabilität (Interne Konsistenz) und die Paralleltest Reliabilität?
Retest-Reliabilität (Intrarater-Reliabilität) – misst Stabilität
Korrelation zwischen Erst- und Zweitmessung
(nicht immer sinnvoll, z.B. bei Lerntests - Übungseffekte)
- *Interne Reliabilität (Interne Konsistenz) - misst Konsistenz**
- *1. Split-Half-Reliabilität:** ein Test wird in 2 Teile geteilt und die Ergebnisse der beiden Subtests werden miteinander korreliert
- *2. Cronbachs Alpha:** Korrelation zwischen allen Items eines Tests/Skala
Paralleltest-Reliabilität - misst Gleichwertigkeit von Messungen
- Korrelation zwischen Ergebnissen paralleler Formen des Tests beidenselben Personen (z.B. bei Leistungstests)
- Die Herstellung einer vergleichbaren Parallelversion ist manchmal problematisch und aufwändig bzw. gar nicht möglich
Wie kann man den Einfluss von Störvariablen kontrollieren?
➢ Elimination
▪ Falls eine bestimmte Variable in einem Experiment als Störvariable auftritt, versucht man, diese auszuschalten.
➢ Konstanthaltung der Versuchsbedingungen
▪ Ist es nicht möglich, eine Störvariable zu eliminieren, versucht man, diese Einflussgröße konstant zu halten.
▪ Es wird angenommen: Störvariable verändert in allen Versuchsgruppen die Messwerte nur um denselben (konstanten) Betrag
➢ Randomisierung
▪ die Versuchspersonen werden unter Verwendung eines Zufallsprinzips unterschiedlichen Gruppen zugeordnet
➢ Parallelisierung
▪ Zusammenstellung von möglichst vergleichbaren Untersuchungsgruppen
▪ für wichtige beeinflussende Merkmale (z. B. Alter, Geschlecht, Bildungsstand, Einkommen) sorgt man in Stichproben für annähernd gleiche Verteilungen (z. B. gleiche Anzahl von Frauen, gleicher Altersdurchschnitt usw.).
Wie können Versuchsbedinungen konstant gehalten werden?
Within-Subject Design:
▪ Für die Manipulationen der unabhängigen Variable wird die gleiche Gruppe eingesetzt
▪ z.B.: die gleichen Angestellten arbeiten unter verschiedenen Managern und werden nach jedem hinsichtlich ihrer Arbeitszufriedenheit befragt
Was sind Einflüsse auf die Varianz?
Primärvarianz
Einfluss der uV auf die aV
Sekundärvarianz
Systematische Einflüsse auf die Werte der aV, die vom Messinstrument oder Versuchsleiter verursacht sind (z.B. Versuchsleiterartefakt)
Fehlervarianz
Unsystematische, zufällige Einflüsse auf die Werte der aV
Was ist das Max-Kon-Min-Prinzip?
1. Maximiere die Primärvarianz („Signal”)
- Wahl von extremen bzw. optimalen Werten der unabhängigen Variable (oder mehrere Stufen der uV)
- Umwandlung eines Störfaktors in eine weitere experimentelle uV („Kontrollvariable“)
2. Kontrolliere die Sekundärvarianz (systematische Fehler)
- Eliminierung eines Störfaktors
- Konstanthaltung eines Störfaktors für alle Versuchsgruppen und experimentellen Bedingungen
- Randomisierung der Probanden und der Bedingungen
- Parallelisierung: gleiche Verteilung der Störvariablen
- Within-Subject-Designs: wiederholte Messung an denselben Personen
- Umwandlung eines Störfaktors in eine weitere experimentelle UV („Kontrollvariable“)
- Nachträgliche statistische Kontrolle
3. Minimiere die Fehlervarianz („Rauschen“) nicht vollständig kontrollierbar!
- Parallelisierung: Versuchs- und Kontrollgruppe mit gleicher Verteilung der Störvariable
- Within-Subject-Designs: wiederholte Messung an denselben Personen
- Standardisierung der Untersuchungssituation
- nach Probeläufen: Erhöhung der Zuverlässigkeit und Gültigkeit des Messinstruments
- (statistische Auswertung)
Was ist externe Validität und wie kann diese sichergestellt werden?
Prüft: Sind die Ergebnisse der Studie übertragbar/generalisierbar?
➢Versuchspersonen
(Qualität der Stichprobe: wodurch kam es zur Teilnahme? Was ist ihre Motivation? z.B. besonderes Interesse am Thema etc.)
Erhöht sich, wenn: Replizierbarkeit der Ergebnisse mit verschiedenen Stichproben (Altersgruppe, Geschlecht usw.)
- *➢Versuchssituation**
(z. B. Künstlichkeit von Laborexperimenten)
Erhöht sich, wenn: Replizierbarkeit der Ergebnisse unter verschiedenen Bedingungen
Was macht die statistische Validität?
Prüft: Führen die Auswertungsmethoden keine Verzerrung ein?
z.B. durch Erfüllung der Voraussetzungen für statistische Verfahren
Was sind Anforderungen an Anforderungen an diagnostische Testverfahren?
➢ Der theoretische Hintergrund muss empirisch belegt sein
➢ Haupt- und Nebengütekriterien sollten immer überprüft werden
- normiert (bezugsbezogene Bewertbarkeit)
- vergleichbar (zu anderen Tests mit gleichen Inhalten)
- ökonomisch (zeitlich, materiell, Handling etc.)
- nützlich (nützlich im Einsatz; kürzer, zuverlässiger, kostengünstiger prädiktiver als bereits bestehende Verfahren)
Ziele der Selektionsstrategie in der Diagnostik?
➢ Optimierung der Auswahl von Personen und/oder Bedingungen
➢ Findung einer optimalen Person-Bedingungs-Konstellation
Methode: Querschnittsuntersuchung
• ein Messzeitpunkt, Statusdiagnostik ➢ dann Entscheidung
Ziele der Modifikationsstrategie in der Diagnostik?
Ziel: Optimierung durch Verhaltenstraining und/oder Bedingungen
- Verhaltensmodifikation durch Training
- Bedingungsmodifikation durch z. B. neue Lehrmethoden
Methode: Längsschnittuntersuchung
• mindestens zwei Messzeitpunkte,
• Status - Modifikation - Status
Was meint Normierung?
Erhebung der Datenbasis und Ableitung entsprechender Vergleichswerte.
Normierung, Entwicklung des Bezugssystem eines Tests für die Einordnung individueller Testergebnisse. Die Verteilung der Testwerte einer Grundgesamtheit wird oft normaltransformiert (Normalverteilung) und mit Verteilungsparametern ausgestattet (z.B. bei Intelligenztests ein Durchschnittswert von 100 und eine Standardabweichung von 15). Zu jedem Testrohwert gehört ein bestimmter Teststandardwert, der die Position eines Probanden im Vergleich zur Grundgesamtheit eindeutig festlegt. Normierungen können für Gesamt- oder Teilpopulationen vorgenommen werden.
Was meint Normwert?
Auf Basis des Rohwertes abgeleiteter Normwert der Normwertskala
- z. B. IQ-Normwert = 110
Der Normwert dient dazu, die Eigenschaften eines Individuums in Bezug zur Gesamtheit aller Individuen einzuordnen. Normwerte werden gewonnen, indem ein Forscher mit einer Messmethode eine ausreichend große Stichprobe der zu untersuchenden Grundgesamtheit untersucht und dadurch eine individuelle Eigenschaftsausprägung einordbar wird. In der Regel wird hierbei eine quasi kontinuierliche Verteilung der Ausprägung einer Eigenschaftsqualität unterstellt. Der ursprüngliche Messwert wird Rohwert genannt.
Was mein Normmaßstab?
definierte Vergleichsskala
- z. B. IQ-Normwertskala
Was ist der CUT-OFF-Wert?
evaluiert festgelegte Leistungsmaßgrenze
- z. B. Eignungsgrenze
Nenne lineare Normen
- z-Skala
- Z-Skala
- C-Skala
- Stanine-Skala
- IQ-Skala
Nenne Flächennorm
PR-Skala (Prozentrang)
Wann spricht man bei der SD von überdurchschnittlichen Werten und wann von weit überdurchschnittlichen Werten?
- Ab 1 SD: überdurchschnittliche Werte (Extreme)
- Ab 2 SD: weit überdurchschnittliche Werte (sehr seltene Extreme)
Was sind Grobnormen?
Mediannormen, Quartile
Was sind Feinnormen?
Berechnung der Prozentränge, z-Transformation
Was passiert bei der z-Transformation?
… ist die Standardisierung aller Werte
d.h. Umrechnung so, dass bei allen gemessenen Eigenschaften der Mittelwert = 0 ist und Standardabweichung = 1.
➢Möglichkeit, Werte vergleichbar zu machen:
•Bei zwei / mehreren Eigenschaften
•selbst wenn diese Eigenschaften ganz verschieden gemessen wurden
➢z.B. Zusammenhang zwischen der Intelligenz im Vorschulalter und der Intelligenz im Erwachsenenalter 20 Jahre später (notwendigerweise durch völlig unterschiedliche Tests gemessen).
Was ist die Standardnormalverteilung?
Die Standardnormalverteilung ist eine Normalverteilung, bei der Mittelwert und Erwartungswert = 0 und die Varianz sowie Standardabweichung = 1 sind.
Voraussetzungen zur Verwendung linearer Normen?
- Alle linearen Normskalen setzen voraus, dass die Werteverteilung einer Normalverteilung entspricht
- Ist die nicht der Fall, so müssen Prozentrangwerte bestimmt werden (Flächen-Normen)
Was sind Einfach- und Gruppennormen?
Einfachnormen
- Gesamttestnormen
- Normen der gesamten (repräsentativen) Stichprobe
Gruppennormen
- Gesamt- und Gruppennormen
- Normen, die für bestimmte Gruppen zusammengefasst wurden: z.B. Geschlecht, Alter, Einkommen etc.
Wie werden Gütekriterien der Erkenntnistheorie geprüft?
- Interne Validität
- Externe Validität
- Statistische Validität
Bei der Erkenntnistheorie werden die Gütekriterien nur diskutiert und nicht geprüft!
Wie kann externe Validität erhöht werden?
Erhöht sich, wenn: Replizierbarkeit der Ergebnisse mit verschiedenen Stichproben (Altersgruppe, Geschlecht usw.)
Erhöht sich, wenn: Replizierbarkeit der Ergebnisse unter verschiedenen Bedingungen
Zufallsstichproben
Kann man die Personen und die Situation auf das übertragen, was man später haben will?
Was ist statistische Validität und wie kann diese gesichert werden?
Prüft: Führen die Auswertungsmethoden keine Verzerrung ein? z.B. durch Erfüllung der Voraussetzungen für statistische Verfahren
Wenn die Voraussetzungen für die eingesetzten Verfahren gegeben sind.
Was ist die Differenzierungsfähigkeit?
Differenzierungsfähigkeit
= „die Fähigkeit, Unterschiede messbar zu machen“
„Der beobachtete Wert [X] setzt sich aus dem wahren Wert [t] und dem Fehlerwert [e] zusammen.“
X = t+ e
Um den wahren Wert [t] der Eigenschaftsausprägung innerhalb des beobachteten Wertes [X] schätzen zu können, wird eine Information über den Messfehler [e] benötigt.
Was ist der Trennschärfekoeffizient?
Korrelation zwischen 𝑰𝒕𝒆𝒎𝒊 und dem Gesamtrohwert des 𝑻𝒆𝒔𝒕𝒔𝒕 bzw. 𝑻𝒆𝒊𝒍𝒕𝒆𝒔𝒕𝒔𝒕
Also für ein Item
Was ist der Reliabilitätskoeffizient [𝒓𝒕𝒕]?
Korrelation zwischen Gesamtrohwert des 𝑻𝒆𝒔𝒕𝒔𝒕 und eines 𝑷𝒂𝒓𝒂𝒍𝒍𝒆𝒍𝒕𝒆𝒔𝒕𝒔𝒕 bzw. 𝑻𝒆𝒊𝒍𝒕𝒆𝒔𝒕𝒔𝒕
Beispiel:
„Das Testverfahren misst die curricularen Inhalte mathematischerKenntnisse der Sekundarstufe I und weist in Bezug auf den Gesamttest eine innere Konsistenz von rtt = .95 auf.“
Cronbach‘s 𝜶 (bereits bekannt)
Korrelation zwischen den Rohwerten aller Items einer Skala
Also für alle Items eines Testverfahrens
Was sind häufig eingesetzte Methoden zur Schätzung von Messfehlern?
Standardmessfehler
Konfidenzintervall
Kritische Differenz
Vorgehen beim Hypothesentesten und Modifikationsstrategie in der Diagnostik?
- Man setzt den Mittelwert aller Mittelwerte für eine der Gruppen (z.B. Frauen) fest
- Man berechnet die Varianz/Standardabweichung der Stichprobenverteilung der Mittelwerte für diese Gruppe (z.B. Frauen)
- Dann rechnet man aus, wie wahrscheinlich es ist, dass der andere Mittelwert auch zur gleichen Stichprobenverteilung der Mittelwerte gehört
Was sind Konfidenzintervalle?
Konfidenzintervalle beschreiben die Irrtumswahrscheinlichkeit einer Messung (Trefferwahrscheinlichkeit)
Sie WERDEN GEWÄHLT- je nachdem, welche Irrtums-bzw. Trefferwahrscheinlichkeit man bei der Messung zulassen möchte
Welches Konfidenzintervall wird gewählt, wenn Alpha einseitig bzw. zweiseitig gestest werden soll?
- wenn Alpha einseitig getestet wird dann 90% Konfidenzintervall
- wenn Alpha zweiseitig getestet wird dann 95% Konfidenzintervall
Was ist die kritische Differenz?
Die kritische Differenz definiert die Differenzpunktzahl, die mindestens erreicht werden muss, um in Bezug auf eine definierte Irrtumswahrscheinlichkeit annehmen zu können, dass sich zwei Messwerte bedeutsam voneinander unterscheiden.
Regel:
KritDiff > tatsächliche Messwertdifferenz
= kein bedeutsamer Unterschied
Bitte erläutern Sie die Prinzipien der Selektionsstrategie und derModifikationsstrategie in der Diagnostik.
Selektion: zu einem Zeitpunkt aus einer Gruppe einen selektieren
Modifikation: zu mehr als einem Messzeitpunkt bei einer Person den Stand erfassen, um Entwicklungen aufzuzeigen
Welche Werteverteilung setzen lineare Normskalen voraus?
Normalverteilung
Wann werden Flächennormen angewendet?
Wenn keine Normalverteilung vorliegt
Welche Flächennorm haben wir im Unterricht kennen gelernt und warum wird diese als „Flächennorm“ bezeichnet? Welche „Fläche“ ist hier von Bedeutung?
Prozentrangnorm, Median und Quartile
Fläche wird in 100/100 geteilt, die Prozentränge haben auf der x-Achse nicht die gleichen Abstände
Die Fläche der Wertefunktion ist von Bedetung
Was ist der Standardfehler und wie lautet die Formel zur Berechnung des Standardmessfehlers?
Standardmessfehler: Anteil an der Streuung eines Tests, der auf die nicht perfekte Zuverlässigkeit des Tests zurückzuführen ist.
Der Standardfehler ist ein Maß für die mittlere Abweichung des aus einer Stichprobe berechneten Mittelwerts von dem tatsächlichen Mittelwert der Grundgesamtheit.
Um den wahren IQ zu messen, müssten wir mathematisch betrachtet unendlich viele IQ-Tests mit der Person durchführen und mitteln. Der Mittelwert all dieser Testwerte wäre dann der beste Schätzer des wahren Intelligenzquotienten der Person. Die Standardabweichung all dieser Messungen wäre der Standardmessfehler.
Nach welchen Formeln werden 99%- und 95%- Konfidenzintervalle berechnet?
Wie sind der Mittelwert und die SD bei der z-Skala?
MW = 0 und SD = 1
Wie sind der Mittelwert und die SD bei der Z-Skala?
MW = 100 und SD = 10
Wie sind der Mittelwert und die SD bei der C-Skala?
MW = 5 und SD = 2
Wie sind der Mittelwert und die SD bei der STANINE Skala?
MW = 5 und SD = 2
Wie sind der Mittelwert und die SD bei der IQ Skala?
MW = 100 und SD = 15
Wie sind der Mittelwert und die SD bei der T-Skala?
MW = 50 und SD = 10
Was ist der Durchschnittsbereich bei SANINE Werten?
4, 5 und 6