Statistik Flashcards
Univariate deskriptive, bivariate, multivariate, Stochastik, Grundlagen der Inferenzstatistik
Was sind statistische Einheiten?
“Objekte”, deren Informationen erhoben werden bspw. Menschen, Gruppen etc.
Was sind Beobachtungen?
Erhobene Informationen (Tests/Ergebnisse).
Was sind Daten?
Alle Beobachtungen zusammengefasst.
Was ist eine Stichprobe?
Gesamtheit der beobachteten Einheiten oder ein Teil der Gesamtheit.
Was ist eine Population?
Gesamtheit aller Merkmalsträger; Stichprobe= Teilmenge einer Population.
Was ist die deskriptive Statistik?
Daten einer Stichprobe werden zusammengefasst.
Was ist die Inferenzstatistik?
Von Daten einer Stichprobe wird auf die Gesamtheit geschlossen.
Was ist ein Merkmal?
Variablen.
Was sind Ausprägungen?
Werte, die eine Variable annehmen kann.
Was ist eine Konstante?
Eine immer gleich bleibende Zahl.
Worin unterscheiden qualitative und quantitative Variablen?
In der Intensität.
Was sind qualitative Variablen?
Endlich viele, nicht geordnete Kategorien bspw. Geschlecht, Farbe, Beliebtheit, es gibt keine Rangfolge.
Was sind quantitative Variablen?
Sie beschreiben das Ausmaß der Intensität eines Merkmals, bspw. Körpergröße, Bruttoverdienst, Körpergewicht, messbar und lassen sich vergleichen.
Worin unterscheiden diskrete und stetige Variablen?
In der Anzahl.
Was sind diskrete Variablen?
Endlich viele Verschiedene Ausprägungen.
Was sind stetige Variablen?
Können alle Werte aus einem Intervall annehmen.
Was sind Skalenniveaus?
Beobachtbarem Verhalten werden Zahlen zugeordnet, so dass man sie auf einer Skala messen/vergleichen kann. Der Informationsgehalt hängt von der Messung ab und wird im Skalenniveau widergespiegelt.
Was ist das Nominalskalenniveau?
Zahlen werden Ausprägungen zugeordnet. Das Ziel ist die Unterscheidung, die Zahlen sind nicht interpretierbar. Bspw.: Geschlecht, Familienstand, Konstitutionstypen.
Was sind die zulässigen Transformationen auf Nominalskalenniveau?
Eineindeutigkeitsabbildungen: f(x)
Was ist das Ordinalskalenniveau?
Ausprägungen werden geordnet. Zahlen spiegeln die Ausprägungen wieder, die Abstände sind allerdings nicht interpretierbar. Rechenoperatoren sind i.d.R nicht sinnvoll. Bspw.: Soziale Schicht, Maslowsche Bedürfnishierarchie, Rangreihe der Arbeitsleistung.
Was sind die zulässigen Transformationen auf Ordinalskalenniveau?
Streng monoton wachsende Abbildungen: f(x)
Was ist das Intervallskalenniveau?
Es gibt keinen natürlichen Nullpunkt, die Höhe der Ausprägungen ist nicht direkt interpretierbar. Allerdings sind die Abstände vergleichbar, ihr Verhältnis zueinander ist unter zulässigen Transformationen konstant. Bspw. Temperatur, IQ, Kalender.
Was ist eine Messung “per fiat”?
Das Intervallskalenniveau wird in Untersuchungen oft “per fiat” angenommen.
Was sind zulässige Transformationen auf Intervallskalenniveau?
Positiv lineare Abbildungen: b+ax, d.h. Verhältnisse der Different bleiben erhalten, wenn b>0, um Ordnung beizubehalten.
Was ist ein anderer Name für die Verhältnisskala?
Ratioskala
Was ist das Verhältnisskalenniveau?
Es definiert eine Einheit und besitzt einen natürlichen Nullpunkt (einziger Unterschied zur Intervallskala). Werte können direkt miteinander verglichen werden, bei Messungen psychischer Merkmale selten vorhanden. Bspw. Größe, Gewicht, Einkommen, Rektionszeit.
Was sind zulässige Transformationen auf Verhältnisskalenniveau?
Ähnlichkeitsabbildungen der Form: bx mit b>0 d.h. Verhältnisse und Ordnung bleiben erhalten.
Wie symbolisiert man den Stichprobenumfang?
n
Wie stellt man einzelne Beobachtungen dar?
y1,…yn
Was gibt die Häufigkeitsverteilung an?
Sie gibt an, wie oft eine Ausprägung in einer Stichprobe beobachtet wurde, sowohl absolute, relative als auch kumulierte Häufigkeiten.
Was ist die absolute Häufigkeit?
Anzahl der statistischen Einheiten, bei denen ein Merkmal betrachte wurde.
Was ist die relative Häufigkeit?
Anteil der statistischen Einheiten, welche das Merkmal aufweisen. Zahlen zwischen 0 und 1 oder %: Anzahl/Stichprobenumfang.
Was ist die kumulierte Häufigkeit?
Summe der Häufigkeiten aller Ausprägungen = a. Bspw. relative Häufigkeiten:1-2=.4, 2-3=.3, 4-5=.3 -> 1-2=.4; 2-3= .4+.3=.7; 4-5= .4+.3+.3=1.0
Was sind die Eigenschaften von Repräsentationsmessungen?
repräsentativ, Zahlen werden Objekten zugewiesen, Eigenschaften der Zahlen spiegeln Beziehungen zwischen den Objekten wider.
Was ist der psychometrische Ansatz?
Zusatz zur Repräsentationsmessung, aggregierte (Zusammengefasste) Daten werden mit externen Hilfsmitteln zur Bewertung der Güte der Messungen herangezogen.
Was ist das Absolutskalenniveau?
Steht noch übe Verhältnisskala, natürliche Einheit, die nicht festlegbar ist, nicht mehr transformierbar, da keine andere Einheit vorhanden ist. Bspw. Anzahl von Personen.
Was ist eine empirische Verteilungsfunktion?
Verteilung der kumulierten Häufigkeit. Sinnvolle Interpretation mindestens auf Ordinalskalenniveau. Punkt kennzeichnet Beobachtung selbst, Strich den Beginn der nächsten Beobachtung.
Wann verwendet man ein Stammblattdiagramm?
quantitative Beobachtungen bei nicht zu vielen Beobachtungen.
Wie ordnet man die Zahlen im Stamm eines Stammblattdiagramms?
Aufsteigend von oben nach unten.
Wann verwendet man Kreis und Balkendiagramme und was bilden sie ab?
Diskrete Merkmale mit nicht all zu vielen Ausprägungen, stellen absolute und relative Häufigkeiten dar.
Wann verwendet man Histogramme und was bilden sie ab?
Bei quantitativen Merkmalen mit vielen Ausprägungen. Stellen absolute und relative Häufigkeiten in Klassen zusammengefasst dar. Die Häufigkeit jeder Klasse wird durch eine Säule dargestellt. Es vermittelt einen Eindruck von Streuung, Lage und Form einer Häufigkeitsverteilung.
Wie wählt man die Klassenbreite für ein Histogramm?
10log(n)
Welche Formen der Häufigkeitsverteilungen gibt es?
unimodale (1 Gipfel), bimodale (2 Gipfel) und multimodale (>2 Gipfel).
Wie nennt man eine schiefe Verteilung?
Lognormalverteilung.
Was sind die Maße der zentralen Tendenz?
Median, Modus, arithmetisches Mittel
Was beschrieben die Maße der zentralen Tendenz?
Die Lage einer Verteilung.
Was sind Eigenschaften des arithmetischen Mittels?
nur ab Intervallskale oder höher sinnvoll, muss nicht mit einer beobachteten Ausprägung übereinstimmen, ist ausreißerempfindlich.
Was ist die Idee des Medians?
Gesucht ist ein Wert, der größer als die eine Hälfte der Beobachtungen und gleichzeitig kleiner als die andere Hälfte der Beobachtungen ist.
Was sind Eigenschaften des Medians?
Lagemaß für auf Ordinalskalenniveau oder höher erfasste Variablen, robust gegenüber Ausreißern. Auch auf Intervallskalenniveau sinnvoll, vor allem bei schiefer Verteilung. Muss nicht mit beobachteten Ausprägungen übereinstimmen.
Was sind die Eigenschaften des Modus?
Lagemaß für Variablen auf Nominalskalenniveau oder höher, ist die am häufigsten vorkommende Ausprägung, bei mehreren Maxima wird die kleinere Zahl angegeben, robust gegenüber Ausreißern.
Was sind zulässige Transformationen für die Maße der zentralen Tendenz?
Alle sind äquivariant gegenüber linearen Transformationen und können retranformiert werden. Modus und Median können auch nach streng monotonen Transformationen retranformiert werden.
Was sind Quantile?
Sie teilen einen Datensatz mit n Beobachtungen in einem bestimmten Verhältnis.
Was sind die Eigenschaften des p-Quantils?
0<p></p>
Was ist, wenn np des Quantils ganzzahlig ist?
yp ist der Mittelwert von np und np+1, in der Liste der geordneten Beobachtungen.
Was ist, wenn np des Quantils nicht ganzzahlig ist?
yp befindet sich in der Liste an der Position, die sich ergibt, wenn man np aufrundet.
Was sind andere Bezeichnungen für das y.25 und y.75 Quantil?
Oberes und Unteres Quartil.
Wie nennt man y.10, y.20, y.30 usw.
Dezile.
Was beschrieben Streuungsmaße?
Die Variabilität der Beobachtungen.
Was ist die Spannweite?
Range: dR=ymax-ymin
Was ist der Interquartilabstand?
dQ= y.75-d.25
Was ist die Fünf-Punkte-Zusammenfassung?
ymin, y.25, ymed, y.75, ymax
Was beschrieben Varianz und Standardabweichung?
Die Streuung bzw. Variabilität von Daten
Was sind Eigenschaften von Varianz und Standardabweichung?
Sind nur für quantitative Variablen sinnvoll, Die Standardabweichung wird zur Beschreibung einer Verteilung oft neben dem Erwartungswert angegeben.
Was beschreibt die Varianz?
Die mittlere quadratische Abweichung der Beobachtungen von ihrem Mittelwert. Sie ist anfällig gegenüber Ausreißern
Was ist die Standardabweichung?
Die positive Wurzel der Varianz. Sie erfasst die Streuung um den Mittelwert. Besteht keine Streuung ist s=0. Je größer die Streuung, desto größer die Standardabweichung. Sie ist anfällig gegenüber Ausreißern.
Wie sind die Merkregeln für den Schiefekoeffizienten?
gm=0: symmetrische Verteilung
gm>0: rechtsschiefe/linkssteile Verteilung
gm<0: linksschiefe/rechtssteile Verteilung
Was ist die Kurtosis?
Dyson-Finucan-Bedingung: Kurtotische Verteilungen schneiden die Normalverteilung mindestens zwei mal auf jeder Seite. Die Kurtosis gibt nicht Steilheit vs. Flachheit an, wird aber ungefähr so interpretiert.
Was sind die Merkregeln für den Kurtosiskoeffizienten?
y=0: Normalverteilung
y>0: steile Verteilung
y<0: flache Verteilung
Was ist die bivariate Statistik?
Gleichzeitige Betrachtung von zwei Variablen. Ziel: Beziehungen und Zusammenhang zwischen den Variablen erkennen.
Wann besteht ein Zusammenhang zwischen Variablen?
Wenn das Auftreten von Werten einer Variablen tendenziell mit dem Auftreten von Werten einer anderen Variable einhergeht.
Was ist eine unabhängige Variable?
Independent variable, UV, beeinflusst AV.
Was ist eine abhängige Variable?
dependent Variable, AV, wird von UV beeinflusst.
Was ist ein Streudiagramm/Scatterplot?
Es zeigt die Beziehung zwischen zwei i.d.R quantitativen Variablen, Jede Variable ist eine Koordinatenachse, wobei die UV meist auf der x-Achse dargestellt wird.
Was sind Kriterien für Zusammenhangskoeffizienten?
Sollten Zsmhang numerisch ausdrücken, Richtung angeben, invariant unter zulässigen Transformationen, einfach interpretierbar.
was sind posititv lineare Zusammenhänge?
Gleichsinnige Zusammenhänge