8. Grundlagen der Statistik Flashcards
was ist Statistik
die Zusammenfassung bestimmter Methoden, um empirische Daten zu analysieren
Deskriptive Statistik:
empirische Verteilung von Merkmalen
Lage- und Streumaße
Induktive/Analytische Statistik:
Schließen von einer Stichprobe auf die Grundgesamtheit.
von etw.(D) auf etw.(A) schließen 从…推断出…
Explorative Statistik
(oder hypothesen-generierende Statistik):
Vorhandene Daten werden empirisch untersucht.
Von Statistiken wird gefordert, dass …
统计的五点要求
- objektiv (unabhängig vom Standpunkt des Statistikerstellers)
- reliabel (verlässlich)
- valide (überkontextuell gültig)
- signifikant (bedeutend)
- relevant (wichtig)
Statistik的三种变量
- univariate (bezogen auf eine Variable)
- bivariate (bezogen auf zwei Variablen)
- multivariate (bezogen auf mehrere)
Vollerhebung
die Daten aller Elemente einer Grundgesamtheit (= Population) werden erhoben
er·he·ben; erhob, hat erhoben; geschr; [Vt]
Teilerhebung
nur eine Teilmenge der Grundgesamtheit untersucht werden
Stichprobe
- die Elemente der Teilerhebung werden durch vor der Untersuchung festgelegte Regeln bestimmt
- Teilerhebung Auswahl
随机选择willkürliche Auswahlen bzw. 有意选择bewusste 的分类标准
Stichproben können danach klassifiziert werden, ob
ob die Auswahl der Elemente der Grundgesamtheit auf einem Zufallsprozess basiert oder nicht.
随机选择
willkürliche Auswahlen
有意选择
bewusste Auswahlen
Zufallsstichproben („random samples“) 意义
- deren Auswahlregeln es dem Untersuchenden ermöglichen
- von der Stichprobe auf die Grundgesamtheit zu schließen
使用Vollerhebungen的两个情形
- der Umfang der interessierenden Grundgesamtheit ist klein 总体数小
- die Grundgesamtheit ist sehr heterogen in Bezug auf ein interessierendes Merkmal ist 总体太杂
(in diesem Fall kann der erforderliche Umfang einer Stichprobe so groß werden, dass nahezu alle Elemente der Grundgesamtheit untersucht werden müssen).
Stichproben 的优点
der Aufwand ist erheblich geringer
einfache Zufallsauswahl 例子
Urnenmodell
Wahl·ur·ne die; 投票箱
geschichtete Zufallsauswahl 的特点
- eine Schichtung der Grundgesamtheit
- die Bildung möglichst homogener Gruppen
geschichtete Zufallsauswahl 的优点
unabhängige Schätzungen für jede Schicht
Klumpenstichprobe (cluster sample)
- 大概念:
eine einfache Zufallsstichprobe (Oberbegriff) - 条件1:
die Auswahlregeln nicht auf die Elemente der Grundgesamtheit, sondern auf zusammengefasste Elemente (Klumpen, Cluster) angewendet werden - 条件2:
jeweils die Daten aller Elemente eines Clusters erhoben werden.
messen
- Merkmalsausprägungen/Objekte werden Zahlen/Werte zugeordnet
- diesen Vorgang
Messung der Merkmalsausprägung Alter: 1, 17, 43, 87 etc.
Messung der Merkmalsausprägung Temperatur: 20 Grad, 50 Grad, 71 Grad etc.
Skala die; -, -s/Ska·len 刻度,标度;刻度尺,刻度盘
eine grafische Darstellung verschiedener Werte, Farben o. Ä., mit denen man etwas messen oder vergleichen kann
Die Achse mit den zugeordneten Ausprägungen bildet eine Skala
Skalenniveaus =Messniveaus das; -s, -s
测量尺度(scale of measure)或称度量水平(level of measurement)、度量类别
Skalen können danach klassifiziert werden, welche Transformationen für sie zulässig sind.
列举四种Skalenniveaus
- Nominalskala
- Ordinalskala
- Intervalskala
- Rationalskala=Verhältnisskala=Ratioskala=Proportionalskala
Nominalskala
- Die Ausprägungen schließen sich logisch aus A≠B
- Die Merkmale können unterschieden, aber nicht in eine Rangfolge gebracht werden
- Häufigkeitsverteilungen
- Familienstand
Ordinalskala
- Die Ausprägungen lassen sich zusätzlich in eine Reihenfolge bringen A<b></b>
Intervalskala
- Die Unterschiede zwischen den Ausprägungen sind zusätzlich gleich groß, d. h. es bestehen gleiche Intervalle z. B. Temperatur, B-A = D-C
- kein natürlicher Nullpunkt
- die Ausprägungen dieses Skalenniveaus lassen sich quantitativ mittels Zahlen .
- Temperatur in °C
- s. o. zzgl. Standardabweichung, Spannweite
Rationalskala
- Es existiert ein natürlicher Nullpunkt A = x · B
- die Zahlen entsprechen der Stärke der Merkmalsausprägung
- Länge, Alter,
Statistische Kennwerte in Abhängigkeit vom Skalenniveau
统计参数和度量水平的关系
Nominalskala: Häufigkeitsverteilungen
Ordinalskala: Häufigkeitsverteilung, Median, Mittelwert
Intervall- und Verhältnisskala: s. o. zzgl. Standardabweichung, Spannweite
测量的信息量
Informationsgehalt einer Messung
频率
Häufigkeiten
算术平均值
Arithmetisches Mittel:
几何平均值
Geometrisches Mittel:
- bei nichtnegativen Zahlen anwendbar
- eignet sich für Verhältnisse oder Wachstumsraten
中位数
Median der; -s, -e
20、21、23、23、25、29、32、33 中位数是24, 如果没有33,则是23
它们的中位数是这样的一种数:这群数据里的一半的数据比它大,而另外一半数据比它小
振幅,摆幅
Spạnn·wei·te die
方差
Varianz
ein Maß für die Streuung um den Mittelwert
方差是各个数据分别与其平均数之差的平方的和的平均数
标准差
Standardabweichung
标准差是方差的算术平方根
频率分布
Häufigkeitsverteilung
基数
eine ungerade Zahl
MATH; eine Zahl wie 1, 3, 5, 7 usw (die man nicht ohne Rest durch 2 teilen kann)
偶数
eine gerade Zahl
众数
- 一组数据中出现次数最多的变量值
- 一组数据可能没有众数或有几个众数。
- 当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。例子:{苹果,苹果,香蕉,橙,橙,橙,桃}的众数是橙
der häufigste Wert einer Häufigkeitsverteilung.
(Wert=das Ergebnis einer Messung, in Zahlen ausgedrückt)
标准差的优点
die gleiche Einheit der ursprünglichen Messwerte zu haben