3 Vorlesung Flashcards
Messen
Vorläufige Definition: „Messen besteht in der Zuordnung
von Zahlen zu Objekten oder Personen“
Formale Definiton: „Messen ist eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ.“
Messen: Pro und Contra
Contra:
- Die menschliche Psyche ist einfach zu komplex, um sie auf Zahlen reduzieren zu können.
Pro:
- Nicht der Mensch als Ganzes, sondern nur kleine Ausschnitte werden betrachtet
- Zahlen müssen nicht die gesamte Information des Merkmals wiedergeben
Empirisches Relativ
- Ein empirisches Relativ besteht aus einer Menge von Objekten und einer oder mehreren beobachtbaren Relationen zwischen diesen Objekten
- Objekte: z.B. Ihre Kohorte Semester
- Relationen („Information“): Beziehungen zwischen Objekten in Hinblick auf ein Merkmal, z.B. Größe
> Äquivalenzrelation (gekennzeichnet mit ~): Verschiedene Objekte sind hinsichtlich eines Merkmals gleich (oder nicht gleich)
> oder Ordnungsrelation (gekennzeichnet mit ≺ ): Merkmal ist bei einem Objekt stärker ausgeprägt als bei einem anderen Objekt
Numerisches Relativ
- Ein numerisches Relativ besteht aus einer Menge von Zahlen und einer bestimmten Anzahl an definierten Relationen zwischen diesen Zahlen
> Gleichheitsrelation (=)
> Größer-Kleiner-Relation (>)
Homomorphe Abbildung
- Abbildung = Funktion
> Ordnet jedem Objekt genau eine Zahl zu. - Homomorph = Strukturerhaltend
> Die Relationen zwischen den Zahlen entsprechen den Relationen zwischen den Objekten. - Bsp.: Ist die Ausprägung in einem Merkmal größer, so muss auch die zugeordnete Zahl größer sein.
A ≺ B ≺ C -> 1
Skala
Numerisches Relativ, das bei einer homomorphen Abbildung des empirischen Relativs entsteht.
Ergebnis einer homomorphen Abbildung
Erschöpfendes System einander ausschließender
Äquivalenzklassen
- jedes Element kann einer Klasse zugeordnet werden (erschöpfend)
- ein Element kann nicht gleichzeitig mehreren Klassen angehören (einander ausschließend)
- Äquivalenzklassen: Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen (z.B. Geschlecht) als gleich betrachtet (z.B. Frauen)
Messtheoretische Probleme
Repräsentationsproblem: Ist ein Merkmal überhaupt messbar, bzw. homomorph abbildbar? Unter welchen
Bedingungen trägt die Skala welche Informationen?
Eindeutigkeitsproblem: Wie flexibel bzw. eindeutig festgelegt ist die Skala?
Bedeutsamkeitsproblem: Welche Analysen bzw. mathematischen Operationen sind bei einer Skala
möglich?
Repräsentationsproblem
Nicht jedes empirische Relativ lässt sich einfach in einem
numerischen Relativ strukturerhaltend abbilden!
Bsp.: Spielstärke von Fußballmannschaften (A, B und C)
- A hat gegen B gewonnen
- B hat gegen C gewonnen
- A trägt anscheinend die höchste Ausprägung des Merkmals Spielstärke und sollte daher die höchste Zahl zugewiesen bekommen
- > Aber!: Was, wenn A gegen C verloren hat?
Für die Abbildung des empirischen Relativs müssen bestimmte Axiome gelten.
Bsp.: Ordnungsrelation
- Transitivität: Wenn A ⊱ B und B ⊱ C, dann A ⊱ C
- Gilt Transitivität nicht, dann kann die Ordnungsrelation des empirischen Relativs nicht im numerischen Relativ abgebildet werden.
In Abhängigkeit der Gültigkeit verschiedener Axiome können verschiedene Relationen abgebildet werden.
Es gilt: Je spezifischer die Relation, desto mehr Axiome müssen gelten.
- Spezifischere Relationen (z.B. Ordnung) erfordern jeweils auch die Gültigkeit der Axiome für weniger spezifische Relationen (z.B. Äquivalenz).
- Bsp.: Damit eine Ordnungsrelation abgebildet werden kann, müssen auch die Axiome der Äquivalenzrelation gültig sein.
-> Verschiedene Skalenniveaus (Messniveaus)
Nominalskala
- Unterstes Skalenniveau - qualitativ
- Es wird nur die Äquivalenzrelation abgebildet.
> Gleiche Ausprägungen bekommen gleiche Zahlen, verschiedene Ausprägungen unterschiedliche Zahlen.
Beispiele:
- Skala für die Religion: atheistisch=1, evangelisch=2, römisch-katholisch=3, muslimisch=4, sonstiges=5.
- Skala für das Geschlecht: männlich=1, weiblich=2
Ordinalskala
- Unterste quantitative Skala
- Nominalskala plus Ordnungsrelation
- Gleiche Ausprägungen bekommen gleiche Zahlen, verschiedene Ausprägungen unterschiedliche Zahlen.
- Kleinere Ausprägungen bekommen kleinere Zahlen, vice versa
Beispiel:
Skala für den Bildungsgrad der Mutter: kein Schulabschluss=1, Hauptschulabschluss=2, Mittlere Reife=3, Abitur=4, Abgeschlossenes Studium=5
Intervallskala
- Quantitativ
- Ordinalskala plus(!) Ordnungsrelation der Unterschiede zwischen Ausprägungen.
> Gleiche Ausprägungen bekommen gleiche Zahlen, verschiedene Ausprägungen unterschiedliche Zahlen.
> Und Kleinere Ausprägungen bekommen kleinere Zahlen, vice versa.
> Unterscheiden sich zwei Ausprägungen stärker als zwei andere Ausprägungen, so müssen die zugeordneten Zahlen eine größere Differenz ergeben.
Beispiele: Celsius-Temperaturskala, Fragebogen (> Ranking)
Aber! Sind Starke Ablehnung (1) und Ablehnung (2) genauso weit voneinander entfernt wie Ablehnung (2) und Neutral (3)?
Verhältnisskala
Quantitativ
Intervallskala plus Verknüpfungsrelation
- Gleiche Ausprägungen bekommen gleiche Zahlen, verschiedene Ausprägungen unterschiedliche Zahlen.
- Und kleinere Ausprägungen bekommen kleinere Zahlen, v.v.
- Unterscheiden sich zwei Ausprägungen stärker als zwei andere Ausprägungen, so müssen die Zahlen eine größere Differenz ergeben, v.v.
- Entspricht eine Ausprägung der Verknüpfung zweier anderer Ausprägungen, so
muss die die zugeordnete Zahl der Addition der beiden anderen entsprechen.
Verhältnisskala entspricht einer Intervallskala mit einem festen Nullpunkt.
> Fester Nullpunkt erlaubt Aussagen über Verhältnisse
Beispiele: Länge, Gewicht, Kelvin-Temperaturskala
Absolutskala
Höchste quantitative Skala
Verhältnisskala plus natürliche Einheit.
- Gleiche Ausprägungen bekommen gleiche Zahlen, verschiedene Ausprägungen unterschiedliche Zahlen.
- Und Kleinere Ausprägungen bekommen kleinere Zahlen, v.v.
- Unterscheiden sich zwei Ausprägungen stärker als zwei andere Ausprägungen, so müssen die Zahlen eine größere Differenz ergeben, v.v.
- Entspricht eine Ausprägung der Verknüpfung zweier anderer Ausprägungen, so muss die die zugeordnete Zahl der Addition der beiden anderen entsprechen.
- Einer Ausprägung wird diejenige Zahl zugeordnet, die der Menge, bzw. der Anzahl der natürlichen Einheiten entspricht.
Eindeutigkeitsproblem
- Abgesehen von der Absolutskala, ist die Zuordnung der Zahlen durch die Axiome eingeschränkt, aber nicht festgelegt.
- Beispiel: Wettrennen A: 1, 0, -5 B: 2, 60, 87 C: 3, 100, 88 D: 4, 1000, 109 -> Im Sinne einer Ordinalskala wären alle drei Zuordnungen identisch.
- Beispiel: Gewicht
A: 1, 1000, 1000000
B: 2, 2000, 2000000
C: 3, 3000, 3000000
D: 4, 4000, 4000000
-> Im Sinne einer Verhältnisskala wären auch hier die Zuordnungen identisch: verschiedene Einheiten: Kg, g, mg.
-> Verglichen mit der Ordinalskala gibt es weniger Freiraum.
Die Eindeutigkeit einer Skala wird praktisch negativ über die Menge der erlaubten Transformationen bestimmt.
- Erlaubte Transformation: Umrechnung der ursprünglichen Skalenwerte, die die Eigenschaften der Abbildung nicht verändert.
- Beispiel Verhältnisskala: Multiplikation mit 1000 ändert nichts!
Erlaubte Transformationen
Nominal: Alle ein-eindeutigen Funktionen
-> Bedingung: Gleiche Zahlen müssen gleich sein, verschiedene verschieden, alles andere egal.
Ordinal: Alle monoton steigenden Funktionen
-> Bedingung: Reihenfolge muss erhalten bleiben.
Intervall: Alle linearen Funktionen y=ax+b
-> Bedingung: Alle Werte müssen gleichartig
verändert, damit die Ordnung der Abstände gleich bleibt.
Verhältnis: Alle proportionalen Funktionen y=ax
-> Bedingung: Wie Intervall, nur ohne Verschiebung des Nullpunktes.
Absolut: Keine
-> Bedingung: Zahlen sind natürlich festgelegt.
Bedeutsamkeitsproblem
- Zahlen sind nicht gleich Zahlen!
- In Abhängigkeit des Skalenniveaus, bzw. der enthaltenen Information (Relationen) sind nur bestimmte Aussagen sinnvoll.
- Entsprechend sind auch nur bestimmte mathematische Operationen sinnvoll.
- Beispiel: Addieren einer dichotomen Variablen wie Geschlecht (1=Frau, 2=Mann) -> Addition möglich, aber dies führt zu keiner bedeutsamen Aussage
- Verrechnung nur sinnvoll, wenn sie invariant gegenüber den zulässigen Transformationen ist.
- Beispiel Mittelwert: Mindestens Intervallskalenniveau!
- Konsequenz: Unterschiedliche statistische Analysen setzten unterschiedliche Skalenniveaus voraus.
- > Es ist daher entscheidend, welches Skalenniveau vorliegt
- Problem: Die Axiome der Skalenniveaus lassen sich schwer überprüfen.
- > Messung „per fiat“
- Problematisches Beispiel: Notendurchschnitt bei einer Klausur
Objektivität
Grad der Unabhängigkeit des Testergebnisses vom Testleiter, von Situationsmerkmalen, vom Testauswerter, etc.
- Durchführungsobjektivität: Unabhängigkeit vom Verhalten des Versuchsleiter
- > Standardisierung der Instruktion und Testdurchführung
- Auswertungsobjektivität: Unabhängigkeit vom Testauswerter
- > Geschlossenes Antwortformat mit algorithmischer Auswertung
- Interpretationsobjektivität: Unabhängigkeit der Schlussfolgerung aus Testergebnis
- > Relative Einordnung anhand von Normwerten
->Feststellbar durch Übereinstimmung (Korrelation) zwischen unterschiedlichen Untersuchern
Reliabilität
Grad der Präzision oder Genauigkeit, mit der ein Test ein Merkmal misst, unabhängig davon, welches Merkmal er erfasst.
-> Ein Test ist dann reliabel (zuverlässig), wenn er das Merkmal, das er misst, exakt, d.h. ohne Messfehler, misst.
Methoden zur Bestimmung (Schätzung) der Reliabilität
- Paralleltest-Reliabilität –Reproduzierbarkeit des Testergebnisses durch anderen Test, der auch das Merkmal misst
- Retest-Reliabilität –Reproduzierbarkeit des Testergebnisses bei Wiederholung
desselben Tests
- Testhalbierung –Reproduzierbarkeit des Testergebnisses zwischen Testhälften (split-half-Methode)
- Interne Konsistenz –Konsistenz multipler Testteile/Items (Cronbach‘s α)
Formale Definition:
Die Reliabilität eines Tests ist der Anteil der wahren Varianz (Varianz der wahren Werte) an der Gesamtvarianz der Testwerte in einer Population.
Validität
Grad der Gültigkeit oder Aussagefähigkeit hinsichtlich des Merkmals, die der Test messen oder vorhersagen soll.
-> Ein Test gilt dann als valide, wenn er das Merkmal, das er messen soll, auch wirklich misst und nicht irgendein anderes.
Validitätsaspekte
- Inhaltliche Validität: Testitems bilden repräsentative Auswahl aus Verhaltenskriterien des Merkmals
- Kriteriumsvalidität: Aus dem Verhalten einer Testperson innerhalb derTestsituation kann erfolgreich auf ein Kriterium außerhalb der Testsituation geschlossen werden
- Konstruktvalidität: Theoretische Einbettung und empirische Prüfung des Testverhaltens anhand eines nomologischen Netzwerks