ZUSAMMENFASSUNG WICHTIG Flashcards
Was machen Kennwerte?
stellen die wichtigsten Daten der Stichprobe dar.
Lagemaße (Maße der zentralen Tendenz)
geben durchschnittliche, mittlere oder besonders typische Messwerte einer Verteilung an.
Dispersionsmaße (auch Streuungsmaße
zeigen an, wie gleichmäßig oder ungleichmäßig die Werte der Skala vorkommen
Was bedeutet eine große Dispersion?
Werte der Personen unterscheiden sich stark
minimale Dispersion?
Werte sind sehr ähnlich
Was ist wenn die Dispersion 0 ist ?
alle Personen haben den gleichen Wert.
Was versteht man unter Messen in der Psychologie?
Zuordnen von Zahlen zu Objekten nach bestimmten Regeln, die gewährleisten dass bestimmt Relationen erhalte bleiben.
Nominalskala
erlaubt Aussagen über die Gleichheit oder Verschiedenheit von
Merkmalsträgern.
Ordinalskala
erlaubt zusätzlich die Merkmalsträger in eine Rangordnung zu bringen.
Intervallskala:
erlaubt zusätzlich Aussagen über die Größe der Verschiedenheit zwischen den Merkmalsträgern (also die Intervalle zwischen ihnen).
Verhältnisskala
erlaubt zusätzlich Aussagen über das Verhältnis von Merkmalsausprägungen (z.B. „doppelt so groß“)
Absolutskala
besitzt zusätzlich eine natürliche Maßeinheit.
empirischen Relativ.
empirischen Objekten,
numerischen Relativ
Nummern die zugeteilt werden, sodass die Relationen erhalten bleiben.
Homomorphismus h./strukturerhaltende Abbildung
Zuordnung von Zahlen zu Objekten derart, dass die Relationen im empirischen Relativ im numerischen Relativ erhalten bleiben.
Nominalskala
unterscheidet Objekte danach, ob sie gleich oder ungleich sind.
Merkmalsträger werden in Kategorien eingeteilt. Merkmalsträger überlappen nicht. (disjunkte Menge)
Was für eine Relation muss es in der Nominalskala sein?
Äquvalenrelation
Wann ist eine Relation eine Äquivalenrelation?
Wenn sie reflexiv ist
symmetrisch
transitiv
Welche Transformationen sind in der Nominalskala zugelassen?
alle eindeutigen Transformationen (Konstante addieren, multiplizieren) WICHTIG: nach der Transformation müssen die Gleichheit und Ungleichheitsverhältnisse noch die gleichen sein.
Wann ist eine Aussage in der Nominalskala bedeutsam?
Nur wenn sie über Gleichheit und Verschiedenheit aussagt.
Wan sollte ein Kreisdiagramm gewählt werden?
Nur wenn es nicht so viele Kategorien sind.
Was ist der Modalwert?
entspricht dem Wert derjenigen Kategorie, welcher die meisten Merkmalsträger angehören.
Wann kann der Modus nicht bestimmt werden?
wenn mehrere Kategorien gleich häufig und zugleich am häufigsten besetzt sind.
Was bedeutet der Wert des Relativen Informationsgehalts?
Er drückt die Dispersion in einem Wert aus.
Wie berechnet man den Relativen Informationsgehalt am besten?
Tabelle: Relative Häufigkeit, lnhj, hj*lnhj
Welchen Wertebereich hat der Relative Informationsgehalt?
0-1
Was sind Dichotomie Variablen?
Variablen mit genau 2 Ausprägungen
Ordinalskala
Zusätzlich zur Äquivalenzrelation der Nominalskala wird bei der Ordinalskala noch eine strenge Ordnungsrelation benötigt. Diese Relation ermöglicht es, die Personen in eine Rangordnung zu bringen
Was für eine Relation muss es in der Ordinalskala sein?
Eine strenge Ordnungsrelation
Wann ist eine Relation eine strenge Ordnungsrelation?
wenn die Relation asymmetrisch ist und transitiv
Welche Transformationen sind in der Ordinalskala zulässig?
Alle monotonen Transformationen (addition/multiplikstion mit einer Konstante) WICHTIG: Reihenfolge der Kategorien muss erhalten bleiben.
Welche Arten von Ordinalskalen gibt es?
- Singuläre Daten
2. Kategoriale Daten mit geordneten Kategorien
- Kategoriale Daten mit geordneten Kategorien
geordnete Rangklassen, wobei auch viele Personen in die gleich Kategorie fallen können.
- Singuläre Daten
jeder Person ein Rangplatz zugewiesen, dabei können Rangbindungen zulässig sein
Was ist eine Rangbindung ?
Wenn sich Personen einen Rangplatz teilen
Welche Aussagen sind in der Ordinalskala bedeutsam?
Aussagen über größer und kleiner
Was sind kumulierte Häufigkeiten?
zeigen an wie viele Personen sich in dieser Kategorie oder einer niedrigeren befinden.
Was ist der Median?
ist der Wert, für den gilt:
- Mindestens 50% der Daten sind kleiner oder gleich dem Median.
- Mindestens 50% der Daten sind größer oder gleich dem Median.
- Wert der mittleren Person
Wann ist es sinnvoll den Median zu berechnen?
bei kategorialen Daten mit geordneten Kategorien
Q1
ist der Wert, der von mindestens 25% der Merkmalträger erreicht oder unterschritten wird und der von mindestens 75% der Merkmalsträger erreicht oder überschritten wird.
Q2
ist der Wert, der von mindestens 50% der Merkmalsträger
erreicht oder unterschritten wird und von mindestens 50% der Merkmalsträger erreicht oder überschritten wird, d.h. das zweite Quartil ist der Median.
Q3
ist der Wert, der von mindestens 75% der Merkmalsträger erreicht oder unterschritten wird und von mindestens 25% der Merkmalsträger erreicht oder überschritten wird.
IQB
Der empirische Interquartilsbereich (IQB) ist der Bereich der Werte zwischen dem ersten und dem dritten Quartil.
wie berechne ich Q1 wenn n/4 keine ganze Zahl ergibt?
die nächste ganze Zahl die auf n*0,25 folgt
wie berechne ich Q3 wenn n/4 keine ganze Zahl ergibt?
die nächste ganze Zahl die auf n*0,75 folgt
Kardinalskala (metrische Variablen)
Intervall-, Verhältnis-, und Absolutskala
Intervallskala
beschreiben, wie stark sich Personen in einem
Merkmal unterscheiden.
Merkmalsträgern Zahlen zugeordnet und zwar derart, dass die Verhältnisse der Zahlendifferenzen zwischen je zwei Objekten den Verhältnissen der Merkmalsunterschiede zwischen diesen zwei Objekten entsprechen.
KEOIN ABSOLUTER NULLPUNKT
Welche Transformationen sind in der Intervallskala zulässig?
alle positiv linearen Transformationen zulässig. Dies bedeutet die Addition mit einer Konstanten und/oder die Multiplikation mit einer positiven Konstanten.
Welche Aussagen sind in der Intervallskala bedeutsam?
Aussagen über das Verhältnis der Differenzen einzelner Werte bedeutsam, ebenso wie Aussagen über die Gleichheit und Verschiedenheit und
die Rangordnung der Werte.
Verhältnisskala
entscheidenden Unterschied, dass es einen absoluten Nullpunkt gibt. Dadurch können auch Verhältnisse zwischen Merkmalsausprägungen direkt interpretiert werden
(RZ, Einkommen, Alter)
Welche Aussagen sind in der Verhältnisskala bedeutsam?
Verhältnisse von Skalenwerten bedeutsam und alle Aussagen, die auch bei einer Intervallskala bedeutsam wären. Nicht bedeutsam sind Aussagen über die absoluten Werte.
Absolutskala
natürliche Maßeinheit des Merkmals
Anzahl an richtigen Antworten
Wann ist es sinnvoll den Modus zu interpretieren (metrische Variablen)?
nur bei unimodalen (also eingipfligen) Verteilungen
Was ist eine Eigenschaft des Median bei kardinalskalierten Werten?
Die Summe der absoluten Abweichungen aller Messwerte vom Median ist kleiner als die Summe der absoluten Abweichungen von irgendeinem anderen Wert.
summe xm - MD = min
Wann wird der Mittelwert meist berechnet?
Bei mindestens intervallskalierten Werten
Definition Mittelwert?
Der Mittelwert ist die Summe aller Werte geteilt durch ihre Anzahl:
Eigenschaften des Mittelwerts?
- Summe der Abweichungen aller Messwerte vom Mittelwert =0
- Summe der quadrierten Abweichungen der Messwerte vom Mittelwert < als bei der Summe der quadriere´ten Abweichungen der Messwerte von einem anderen Wert
- wird zu jedem Messwert eine Konstante xm addiert, verändert sich der Mittelwert additiv umgenau diese konstante
- Wird jeder Messwert mit einer Konstanten 𝑏 multipliziert, verändert sich der Mittelwert multiplikativ um eben diese Konstante 𝑏
- -> lineare Transformation von metrischen Skalen in gleicher Weise auf den Mittelwert auswirkt wie auf jeden einzelnen Messwert
Wie kontrollieren wir Ausreißer?
Durch Robuste Kennwerte
Was sind Robuste Kennwerte
- getrimmte Mittel:Prozentsatz der kleinstem&größten Werte ignoriert
- winsorisiertes Mittel: extremen Werte durch nähst annehmbares ersetzt.
Quantile metrische Variablen
Ein p-Quantil ist derjenige Wert 𝑥𝑝(0 < 𝑝 < 1) , für den gilt, dass mindestens 𝑝 ∗ 100% der Daten kleiner oder gleich 𝑥𝑝 und mindestens (1 − 𝑝) ∗ 100% der Daten größer oder gleich 𝑥𝑝 sind.
Definition Varianz
Die (empirische) Varianz 𝑠𝑋2 ist die mittlere quadrierte Abweichung aller Einzelwerte vom Mittelwert
Definition Standardabweichung
Die (empirische) Standardabweichung 𝑠𝑋 ist die (positive) Quadratsumme aus der Varianz
Eigenschaften der Varianz und der Standardabweichung
- V&SD seh sensibel für Ausreißer-> Quadrieren der Abweichungen vom Mittelwert : große abweichungenfallen stark ins Gewicht, mehr als kleine
- Varianz ändert sich nicht wenn eine Konstante addiert wird
- Wird jeder Messwert mit einer Konstante multipliziert, verändert sich die Varianz um dem´n Faktor b”hoch 2& SD um den Faktor b
IQA
Der Interquartilsabstand (IQA) ist die Differenz zwischen dem dritten und ersten Quartil:
Diskrete Variablen
können nur endlich viele oder abzählbar unendlich viele Ausprägungen annehmen (wie bei einer Anzahl). Sie können nominal-, ordinal- oder
kardinalskaliert sein.
Stetige Variab
haben überabzählbar unendlich viele Ausprägungen, d.h. zwischen zwei unterschiedlichen Werten einer stetigen Variablen gibt es immer noch einen weiteren Wert. Streng genommen erreicht fast keine psychologische Variable Stetigkeit, man spricht daher auch von quasi-stetig. Stetige Variablen sind typischerweise kardinalskaliert.
Qualitative Variablen
haben eine beschränkte Zahl von Kategorien, sie sind nominal- oder ordinalskaliert.
Quantitative Variablen
können im Sinne eines Ausmaßes oder einer Intensität interpretiert werden. Sie sind kardinalskaliert
Verteilungsformen
Schmalgipflig, symmetrisch breitgipflig,rechtsgipflig Bimodal,asymmetrisch Unförmig Lförmig Jförmig
Was gilt Bei rechtsgipfligen Verteilungen ?
𝑥strich < 𝑀𝑑 < 𝑀𝑜
Was gilt Bei symmetrischen Verteilungen?
xstrich=MD=Mo
Was ist die Schiefe von symmetrischen Verteilungen?
0
Was für Schieferte haben linksgipflige Verteilungen?
positive
Was für Schieferte haben rechtsgipflige Verteilungen?
negative
Warum ist die Normalverteilung so wichtig?
Die Normalverteilung lässt sich durch zwei Parameter eindeutig
beschreiben. (Erwartungswert & Varianz)
Viele psychologische Variablen (und auch andere) sind normalverteilt.
Zwischen normalverteilten Variablen können Werte leicht verglichen und
transformiert werden.
Was für ein Kurdosis Wert hat die Normalverteilung
0
Was bedeuten positive Kurtosis Werte ?
dass die Verteilung schmalgipfliger (auch: steilgipflig) ist als die Normalverteilung
Was bedeuten negative Kurtosis Werte ?
breitgipfligere Verteilung
Zentrierung
von jedem Wert der Mittelwert abgezogen.
z-standardisierung
zentrierte Wert zusätzlich noch durch die Standardabweichung geteilt.
Was ist der Mittelwert und die Standardabweichung aller z standardisieren Variablen?
Mittelwert von 0 und eine Standardabweichung von 1:
Tschebyscheff‘sche Ungleichung
Anzahl der Standardabweichungen schon etwas über die Seltenheit der Werte ausgesagt.
maximal ein
Anteil von 1/khoch 2 der Werte in einem Abstand von mehr als k
Standardabweichungen vom Mittelwert entfernt.
Standardnormalverteilung
normalverteilte Variablen standardisiert, ergibt sich die Standardnormalverteilung. Das ist eine Normalverteilung mit einem Mittelwert von 0 und einer Varianz von 1. In
Wieviele Werte liegen max 1 Sd bei der Standardnormalverteilung vom Mittelwert entfernt?
68,3%
Wieviele Werte liegen max 2 Sd bei der Standardnormalverteilung vom Mittelwert entfernt?
95,5%
Wieviele Werte liegen max 3 Sd bei der Standardnormalverteilung vom Mittelwert entfernt?
99,7%
Was ist der Prozentrang?
Die Angabe, wie viele Personen der Vergleichsgruppe die gleiche oder eine geringere Merkmalsausprägung haben,
IQ Skala
Mittelwert 100 SD 15
Z Skala
Mittelwert 100 SD 10
T skala
Mittelwert 50 SD 10
Statine
Mittelwert 5 SD 2
wann entsteht normalverteilung?
Normalverteilungen entstehen dann, wenn ein Merkmal von vielen unabhängigen Faktoren beeinflusst wird ohne das ein Faktor alle anderen dominiert.
Bivariate deskriptive Statistik
Zusammenhang zwischen zwei Variablen mit Assoziationsmaßen
Arten von Zusammenhängen
Positiv
Negativ
Bei Zusammenhang
nicht linear
Klovarianz Definition?
Wenn zwei Variablen X und Y einen (linearen) Zusammenhang haben, so
variieren sie gemeinsam.
Klovarianz von 0?
Variablen keinen Zusammenhang haben
Werte über 0 in der Klovarianz?
positiver Zusammenhang
Werte unter 0 kovarianz?
negativer Zusammenhang
Was ist die Klovarianz einer Variable mit sich selber ?
Ihre Varianz
Was ergibt die (Produkt-Moment) Korrelation 𝑟𝑋𝑌 der Variablen X und Y.
Kovarianz geteilt durchProdukt der Standardabweichungen geteilt werden.
Welche werte kann die Korrelation annehmen?
zwischen +1 und -1
Wann ist die Korrelation am schwächsten?
bei 0