Testtheorie_Messen Flashcards

1
Q

Messen - Definition

A

Messen bedeutet:

  • den Ausprägungsgrad bestimmter Merkmale von Personen oder Objekten (empirisches Relativ)
  • durch die Angabe von Zahlen (numerisches Relativ) so zu repräsentieren,
  • dass bestimmte mathematische Vergleiche oder Operationen im Zahlensystem Aussagen über die tatsächlichen Verhältnisse im Merkmalsbereich ermöglichen.
  • Die Zulässigkeit dieser Operationen wird durch den Informationsgehalt der Zahlen determiniert
  • Messen ist: Zuordnung von Zahlen zu Objekten, wobei die Zuordnung eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Empirisches Relativ

A

Menge von Objekten, zwischen denen Beziehungen (Relationen) gelten

  • Ein empirisches Relativ {A,R1,…,Rn} besteht aus einer definierten Menge von Objekten (A), zwischen denen verschiedene Relationen (R1,..,Rn) bestehen. Diese Relationen beziehen sich jeweils auf definierte Merkmale der Objekte

A = Menge der zu messenden Objekte
R1…Rn = endliche Folge von Relationen
auf der Objektmenge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Numerisches Relativ

A

Symbolsystem (Zahlen), auf dem ebenfalls gewisse Relationen gelten

N = {B; S1, S2, … Sn}
B = Wertevorrat
S1-Sn = endliche Folge von Relationen
auf dem Wertevorrat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Homomorphe Abbildung

A

Jedes Objekt wird vom empirischen in das numerische Relativ abgebildet, und die Relationen bleiben erhalten

  • Die Existenz einer derartigen homomorphen Abbildung ist das Kriterium dafür, ob eine Eigenschaft messbar ist
  • Die Abbildungsfunktion zusammen mit dem zugehörigen empirischen und numerischen Relativ wird als Skala bezeichnet, die Funktionswerte als Skalenwerte oder Messwerte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was unterscheidet eine Variable von einem Merkmal?

A
  • Eine Eigenschaft eines Objektes im empirischen Relativ wird als Merkmal bezeichnet
  • Sobald es eine Messvorschrift (Abbildungsfunktion) gibt, welche dieses Merkmal in Zahlen überführt (quantifiziert), spricht man von einer Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qualitative Merkmale

A
  • beschreiben die Zugehörigkeit zu der Kategorie eines Merkmals (z.B. Geschlecht; Haarfarbe)
    –> es gibt nur die Möglichkeit, in einer der jeweiligen Kategorien zu sein (weiblich oder männlich; blond, braun-, schwarzhaarig).
  • Zwischenwerte oder Ausprägungsgrößen gibt es hier nicht. Jede Person gehört einfach zu genau einer Kategorie bzw. Gruppe.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quantitative Merkmale

A
  • Sie beschreiben die Stärke der Ausprägung eines Merkmals. Jede gemessene Person hat z.B. einen Wert für ihre Körpergröße, ihr Gewicht, ihren IQ, ihre Schulnote etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Beispiele für Relationen

A

Äquivalenzrelation (=)
Die Menge von Objekten wird bezüglich eines Merkmals zum Zwecke einer qualitativen Zuordnung in Klassen gleicher Ausprägung unterteilt.

Ordnungsrelation ()
Die Objekte werden bezüglich der Ausprägung eines Merkmals in eine Rangordnung gebracht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Relative und Relationen: Beispiele

A

A aktuell lebende Menschen
R ‚älter als‘, ‚früher geboren als‘

A Töne
R (a b c d) ∈ R: subjektiver Unterschied zwischen a und b nicht größer als zwischen c und d

A Helligkeiten
R (a b c) ∈ R : b ist die subjektive Mitte zwischen a und c

A P × O^2 Personen × Aussagenpaare
R (p a b): Person p kann eher Aussage a als b zustimmen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Messtheorie - welche “Probleme” hat sie?

A

Repräsentationsproblem:
Wie kann das jeweilige empirische Relationssystem auf ein numerisches Relationssystem homomorph abgebildet werden?

Eindeutigkeitsproblem:
Welche Transformationen sind innerhalb des numerischen Relationssystems möglich, ohne die homomorphe Abbildung zu verletzen?

Bedeutsamkeitsproblem:
Welche numerischen Vergleiche und Statistiken sind auf welchem Skalenniveau sinnvoll?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Skalenniveau

A
  • Es muss geklärt werden, ob und wie genau das numerische Relativ das empirische Relativ abbildet
  • Qualität der Messung: Je höher das Skalenniveau, desto besser
  • Viele mathematische Operationen sind erst ab einem gewissem Skalenniveau definiert
  • Beispiel: Mittelwert nur bei mindestens Intervallskalenniveau
  • je höher das Skalenniveau, desto weniger Transformationen sind erlaubt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nominalskala (Stevens, 1946)

A

Ein Merkmal heißt nominal (von lateinisch nomen = „Name“), wenn seine möglichen Ausprägungen zwar benannt und unterschieden, nicht aber in eine Rangfolge gebracht werden können.

  • Bei nominalskalierten Merkmalen wird der Untersuchungseinheit für die entsprechende Ausprägung (genau) ein Name bzw. (genau) eine Kategorie zugeordnet.
Beispiele:
- Psychiatrische Diagnosen (Kategorie: Depression, Schizophrenie...)
- Geschlecht (Kategorie: männlich, weiblich, divers)
- Marke (Kategorie: BMW, Audi, VW...)

Mögliche Aussagen:
- gleich, ungleich

erlaubte Transformationen:
- alle eineindeutigen Transformationen
  • Die einzig zulässige Schlussfolgerung aus einer Nominalskala lautet:
  • -> Gleiche Zahlen bedeuten gleiche Merkmalsausprägungen, unterschiedliche Zahlen bedeuten unterschiedliche Merkmalsausprägungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ordinalskala (Stevens, 1946)

A

Bei der Verwendung von ordinal(skaliert)en Merkmalen wird jede Merkmalsausprägung der Untersuchungseinheit genau einer Kategorie zugeordnet

  • Kategorien lassen sich in eine Rangfolge bringen und mit Namen oder Zahlen bezeichnen
  • Abstände zwischen den einzelnen Kategorien müssen jedoch nicht gleich groß sein

Beispiele:
Schulnoten (1 bis 6)
Einkommen (hoch > mittel > niedrig)
Dienstrang (General > Oberst > Gefreiter)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Intervallskala (Stevens, 1946)

A

Bei intervallskalierten Merkmalen lassen sich zusätzlich zu den Eigenschaften der Ordinalskala die Abstände zwischen den verschiedenen Merkmalsausprägungen bestimmen (Differenzen).

- Allerdings existiert kein natürlicher Nullpunkt für die Skala

Beispiele für eine Intervallskala sind Temperaturmessungen in Celsius und Fahrenheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Verhältnisskala (Stevens, 1946)

A

Bei einer Verhältnisskala (auch: Ratioskala) werden Objekten eines empirischen Relativs Zahlen derart zugeordnet, dass die Zahlen im selben Verhältnis zueinander stehen wie die Merkmalsausprägungen der Objekte

- Bei Verhältnisskalen entsprechen also die Zahlen der Stärke der Merkmalsausprägungen

- Für die Zahlenwerte existiert ein natürlicher Nullpunkt

- Die Maßeinheit ist jedoch willkürlich definiert

Zulässige Aussagen sind z. B. „Herr X ist um 15% gewachsen“.

Beispiele für eine Verhältnisskala sind Länge, Gewicht, Temperatur (aber nur in Kelvin wg. des absoluten Nullpunkts, nicht Grad Celsius), Winkel, Preise, sowie der elektrische Widerstand in Ohm.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Absolutskala (Stevens, 1951)

A
  • Merkmalsausprägungen werden als Zahl dargestellt
  • Für die Zahlenwerte existiert ein natürlicher Nullpunkt
  • Maßeinheit natürlich vorgegeben (d. h. im weitesten Sinne ‘Stück’). Sie kann lediglich noch unterschiedlich benannt werden (z.B. Personen = Seelen = Nasen = Einwohner).
Beispiel:
Merkmal                               Nullpunkt
Einwohner eines Landes    keine
Anzahl Fehler                      0
Wahrscheinlichkeit             0%
17
Q

Nominalskala - Voraussetzungen und Eigenschaften

A
  • Kategorien müssen disjunkt und erschöpfend sein
  • Möglich sind alle homomorphen Transformationen, in der eine Kategorie ein-eindeutig einer anderen Kategorie zugeordnet ist; die Gleich- und Ungleichheitsbeziehungen dürfen sich dabei nicht verändern.

    Beispiele: Umbenennung, Permutation.
  • Eine sinnvolle Rechenoperation ist die Angabe eines Modalwerts (Kategorie mit der größten Häufigkeit).
  • Median und Mittelwert können jedoch nicht sinnvoll berechnet werden
  • Darstellung sinnvoll in Balken- und Kuchendiagramm
18
Q

Ordinalskala - Voraussetzungen und Eigenschaften

A
  • Eine zulässige Aussage bei einer Ordinalskala ist, dass die Rangfolge der Zahlen gleich der Rangfolge der Stärke der Merkmalsausprägungen ist
  • Jemand mit einem höheren Rang hat auch eine höhere Merkmalsausprägung als jemand mit einem niedrigeren Rang
  • Sämtliche Transformationen mittels streng monoton steigender Funktionen sind jedoch zulässig.
  • Nicht zulässig sind nur Transformationen, welche Größer-Kleiner-Relationen verändern
  • Über die Größe des Merkmalsunterschiedes zwischen Objekten lässt sich bei einer Ordinalskala keine Aussage machen
  • Mittelwertbildung deshalb nicht sinnvoll
  • Angabe von Median und Rängen ist sinnvoll
19
Q

Intervallskala - Voraussetzungen und Eigenschaften

A
  • Quotienten aus Differenzen sind immer gleich. (a-b)/(c-d) ist also für verschiedene Intervallskalen gleich
  • Zusätzlich zu Größer/kleiner-Vergleichen sind Differenzen und Summen aus intervallskalierten Merkmalen sinnvoll, da hier die Abstände zwischen den einzelnen Merkmalsausprägungen sinnvoll interpretierbar sind. Damit lassen sich auch Durchschnittswerte berechnen.
  • Aufgrund des fehlenden Nullpunkts stellt die Multiplikation jedoch keine sinnvolle Operation für intervallskalierte Merkmale dar
  • Eine Intervallskala ist eindeutig bis auf für sie zulässige lineare Transformationen der Art y = ax + b
  • also nur Transformationen zulässig, die entweder die Größe der Intervalle nicht verändern, oder aber alle Intervalle gleichermaßen verändern
  • Berechnung von Mittelwert und Standardabweichung ist möglich und sinnvoll
  • Aussage „Im Sommer ist es 50% wärmer als im Winter“ macht aber keinen Sinn
20
Q

Besonderheit: Differenzskala

A
  • Erlaubt sind nur Transformationen der Art x‘ = x+b (Translation)
  • Das Skalenniveau ist noch etwas höher als bei einer Intervallskala (bei der lineare Transformationen der Art x‘ = ax + b erlaubt sind)
  • Prominentestes Beispiel: die Personen- und Itemparameter im Rasch-Modell (s. Probabilistische Testtheorie), ELO - Ratings
21
Q

Verhältnisskala - Voraussetzungen und Eigenschaften

A
Mit Merkmalen, die auf einer Verhältnisskala messen, lassen sich folgende Operationen durchführen:

- Vergleiche auf Identität (nominal)
- Größenvergleiche (ordinal)
- Additionen, Subtraktionen (intervall)
- Multiplikationen, Divisionen

Zulässig sind multiplikative Transformationen der Art y = ax (a>0).
  • Im empirischen Relativ einer Verhältnisskala sind typischerweise Verknüpfungsoperationen definiert.
  • Dem Verknüpfungsoperator „o“ (z.B. „lege A und B aneinander“) entspricht im numerischen Relativ die Addition (z.B. 3 cm + 5 cm = 8 cm).
  • es ist nur noch eine Multiplikation mit einer Konstanten ungleich Null zulässig; frei ist also die Einheit der Messung (z.B. Kilometer oder Meilen)
22
Q

Verhältnisskala: Geometrisches Mittel

A
  • Auch die Bildung des geometrischen Mittels ist erst ab Verhältnisskalenqualität erlaubt und sinnvoll.
  • Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Messwerte; es ist ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.
  • Das geometrische Mittel wird immer dann benötigt, wenn es um die Analyse multiplikativer numerischer Relationen geht, z.B. bei der Analyse von Empfindungsstärken oder durchschnittlichen prozentualen Veränderungen

Die wichtigste Anwendung des geometrischen Mittels sind durchschnittliche Wachstumsfaktoren.

Jahr Aktienkurs Rendite Wachstumsfaktor
2008 1.000 Euro –
2009 1.200 Euro + 20,0 % 1.2
2010 1.500 Euro + 25,0 % 1.25
2011 1.000 Euro - 33,3 % 0.67

Die Bildung des geometrischen Mittels ergibt einen durchschnittlichen Wachstumsfaktor von 1.00, das Kapital bleibt also genau erhalten; es wächst nicht und es schrumpft nicht.

23
Q

Geometrisches Mittel in der Psychophysik

Wirtz & Nachtigall (2006)

A

Weber-Fechner-Gesetz: Bei der menschlichen Wahrnehmung nimmt die Empfindungsstärke ψ (psi) nicht linear, sondern logarithmisch mit der Reizintensität φ (phi) zu.

Der Empfindungsunterschied zwischen der Lautstärke (dem Gewicht) von ein oder zwei Trompeten (ein oder zwei Tafeln Schokolade) ist größer als der von 49 oder 50 Trompeten (49 oder 50 Tafeln Schokolade).

Welche physikalische Reizstärke löst eine Empfindung aus, die genau der mittleren Empfindung entspricht, die zwei andere physikalische Reize auslösen?
—> Es ist das geometrische, nicht das arithmetische Mittel der Reizstärken.

  • Das arithmetische Mittel der Empfindungsstärken wird durch das geometrische Mittel der Reizstärken erzeugt
24
Q

Absolutskala - Voraussetzungen und Eigenschaften

A

Mit Merkmalen, die auf einer Absolutskala messen, lassen sich folgende Operationen durchführen:

- Vergleiche auf Identität (nominal)
- Größenvergleiche (ordinal)
- Additionen, Subtraktionen (Intervall)
- Multiplikationen, Divisionen (Verhältnis)

25
Q

Beispiele für Variablen und ihre Skalenniveaus

A

Steuerklasse (Nominalskala)
soziale Schicht (Ordinalskala)
Temperatur in Grad Celsius (Intervallskala)
Temperatur in Kelvin (Verhältnisskala)
Schulnoten (Ordinalskala (?))
Körpergröße (Verhältnisskala)
Klausurpunkte (Verhältnisskala)
Handelsklasse (Obst) (Ordinalskala)

26
Q

Abbildung durch das Messinstrument

A
  • Bei einem Merkmal mit hohem Skalenniveau (z. B. Intervallskala) sollte immer versucht werden, ein Messinstrument zu benutzen, welches dieses Skalenniveau auch erfassen kann
  • Kann das Messinstrument nur auf Ordinal- oder Nominalskalenniveau abbilden, schränkt dies die Aussagen ein, die man über das Merkmal treffen kann

–> Beispiel Beaufort-Skala der Windgeschwindigkeit

27
Q

Festlegung des Skalenniveaus

A
  • Bestimmung oft schwierig und aufwendig; die Entscheidung über die Güte der Abbildung und damit über die Skalenqualität lässt sich häufig nur eingeschränkt objektivieren und prüfen
  • Sie wird deshalb oft per fiat und nach Plausibilitätsargumenten getroffen

    Beispiel:
  • Der Lehrer bildet den Mittelwert zweier Arbeiten (Note 1 und Note 3) und errechnet die Note 2. Dabei nimmt er implizit an, dass die Noten Intervallskalenniveau haben, also der Abstand von Note 1 zu Note 2 genauso groß ist wie der Abstand von Note 2 zu Note 3
  • Alltagssprachliche Wahrscheinlichkeitsangaben von Ärzten: Worte wie “möglich”, “hoffentlich”, “ signifikante Chance” werden als unterschiedlich wahrscheinlich von unterschiedlichen Personen wahrgenommen
28
Q

Messstrukturen

A
  • empirisches Relativ mit einer Liste von Axiomen, aus denen sich die Art der Repräsentation sowie die Eindeutigkeit des Skala ableiten lassen
  • Für eine genaue Bestimmung des Skalenniveaus können die als Axiome formulierten Bedingungen, die bei einem bestimmten Skalenniveau erfüllt sein müssen, empirisch überprüft werden.
  • Problem dabei: Unterscheidung zwischen Messfehlern und systematischen Verletzungen eines Axioms

    Beispiel Symmetrieaxiom: wenn a ~ b, dann b ~ a
    (Voraussetzung für eine Nominalskala).

    Beispiel Transitivitätsaxiom: Für drei reelle Zahlen a, b und c gilt: wenn a ≥ b und b ≥ c, ist auch a ≥ c (Voraussetzung für eine Ordinalskala).
29
Q

Westermann, R., & Hager, W. (1983). Eine empirische Untersuchung zum Skalenniveau von Normwerten für die Bildhaftigkeit von Substantiven

A
  • Prüfung des Intervallskalenniveaus von „Imagery“-Ratings (Beurteilungen der Bildhaftigkeit oder Vorstellbarkeit auf der Dimension konkret – abstrakt)
  • Bildhaftigkeit des Lernmaterials ist günstige Voraussetzung für gute Lern- und Behaltensleistungen
  • Prüfbarkeit der genauen Art des Zusammenhangs ist jedoch vom Skalenniveau abhängig

-Ohne Intervallskalenniveau können nur einfache ordinale Hypothesen („je bildhafter, desto leichter lernbar“) und keine komplexeren Hypothesen (z.B. linearer, quadratischer Zusammenhang) geprüft werden

- Deshalb: Empirische Prüfung, ob die für eine Intervallskalenmessung hinreichenden Axiome (insbesondere Gleichabständigkeitsaxiom und Monotonieaxiom) erfüllt sind

30
Q

Prüfung des Gleichabständigkeitsaxioms

A
  • Bei allen Quadrupeln, für die gilt:
    | Sa – Sb | = | Sc – Sd |
    sollte der subjektive Unterschied von a und b als genauso groß empfunden werden wie der subjektive Unterschied zwischen c und d.
  • Daraus lässt sich als prüfbare statistische Hypothese ableiten: Bei der Entscheidung, welcher von zwei gleich großen Abständen der größere ist, sollten bei Gültigkeit der Nullhypothese für alle 20 Quadrupel beide zugelassenen Urteile
    | Sa – Sb | > | Sc – Sd |
    oder
    | Sa – Sb | < | Sc – Sd |
    gleich häufig gefällt werden (Binomialtest mit p=.5).

Bei Bildhaftigkeit:

1) Bildung von Gruppen aus je vier Reizen, für die die absolute Differenz der Skalenwerte von a und b gleich der von c und d ist: | Sa – Sb | = | Sc – Sd | Beispiel: | Seele (2,28) – Eisenbahn (6,52) | = | Hinblick (2,56) – Mutter (6,80) |
2) Relative Häufigkeiten des Urteilens (s.o.) über 54 Urteiler. Wenn viele Urteiler signifikant höher oder niedriger als p=.5 sind, ist das Axiom verletzt.

31
Q

Überprüfung des Monotonieaxioms

A
  • Bezieht sich auf Urteile zu den Unterschieden zwischen sechs verschiedenen Reizen. Diese Reize (z.B. Substantive) seien als e, f, g, e´, f´ und g´ bezeichnet.
  • Wenn der Unterschied zwischen den Reizen e und f subjektiv größer ist als der Unterschied zwischen e´ und f´ und wenn der Unterschied zwischen f und g subjektiv größer ist als der zwischen f´ und g´, dann ist auch der Unterschied zwischen e und g subjektiv größer als der Unterschied zwischen e´ und g´
  • Vorgehen bei der Auswahl der Stimuli: Skalenwertdifferenz zwischen e und f und zwischen f und g jeweils größer als die Differenz zwischen e´ und f´ und zwischen f´ und g´.
32
Q

Skalenniveaus und Testverfahren

A

Unterschiedliche Skalenniveaus erlauben unterschiedliche statistische Testverfahren

Jedes statistische Testverfahren erfordert ein Mindest-Skalenniveau

Mindestskalenniveau für:

- t-Test und Varianzanalyse: Intervallskala
- Regressionsanalyse: Intervallskala
- Produkt-Moment-Korrelation: Intervallskala
- Spearmans Rangkorrelation: Ordinalskala
- Chi-Quadrat-Tests: Nominaldaten

33
Q

Spearmans Rang-Korrelation Voraussetzung: Ordinalskala

A
  • Bei ordinalen Daten
  • Rangreihung der Daten
  • Statt der Originaldaten gehen die Ränge in die Berechnung ein
34
Q

Produkt-Moment-Korrelation Voraussetzung: Intervallskala

A

Vorteil gegenüber der Rangkorrelation nach Spearman: höhere statistische Power (höhere Wahrscheinlichkeit der Zurückweisung der Nullhypothese, also höhere Wahrscheinlichkeit des zufallskritischen Nachweises eines tatsächlich vorhandenen Zusammenhangs)

35
Q

Skalenniveau und statistische Analyse

A
  • Für statistische Auswertungen ist es wichtig, ob die erhobenen Daten den Voraussetzungen des jeweiligen statistischen Verfahrens entsprechen. Viele Verfahren setzten ein bestimmtes Datenniveau voraus.
  • Deshalb sollte man sich immer schon vor der Datenerhebung Gedanken über die Auswertung der Daten machen.
  • Man sollte stets versuchen, bei einer Messung das höchstmögliche Skalenniveau zu erreichen und zu bewahren. Das Skalenniveau entscheidet darüber, welche statistische Auswertung sinnvoll und erlaubt ist und welche nicht.
  • Transformationen auf ein niedrigeres Niveau sind immer möglich; aber je höher das Skalenniveau, desto mehr statistische Verfahren können angewendet werden.