Praktikum Flashcards
2.1 Begriffsdefinitionen
- Beobachtungseinheit, Merkmal
- Merkmalstypen
- Skalenniveaus
- Die Beobachtungseinheit ist die kleinste Einheit einer statistischen Auswertung, auf der Beobachtungen gemacht werden.
- ein Merkmal ist eine beobachtbare oder messbare Eigenschaft einer Beobachtungseinheit, die gewöhnlich in verschiedenen Ausprägungen vorhanden ist, z. B. Merkmal Geschlecht, Ausprägungen: männlich, weiblich.
2.1 Begriffsdefinitionen
- Beobachtungseinheit, Merkmal
- Merkmalstypen
- Skalenniveaus
Ein Merkmal heißt quantitativ, wenn seine Ausprägungen durch Messen oder Zählen erfasst werden können, z.B. Blutdruck, Kinderzahl.
Alle übrigen Merkmale heißen qualitativ, z.B. Blutgruppe, Geschlecht, ihre Merkmalsausprägungen stellen begriffliche Kategorien dar.
Ein Merkmal heißt diskret, wenn die Werte abgezählt werden können, z.B. die Kinderzahl in einer Familie.
Stetige Merkmale werden gemessen und können theoretisch alle Werte in einem bestimmten Intervall annehmen, z.B. Körpergröße.
2.1 Begriffsdefinitionen
- Beobachtungseinheit, Merkmal
- Merkmalstypen
- Skalenniveaus
- Ein Merkmal skaliert nominal, wenn seine Ausprägungen unterschieden werden können, aber keine natürliche Rangfolge aufweisen. Farbe
- Ein Merkmal skaliert ordinal, wenn es eine Rangordnung zwischen den Ausprägungen gibt. Schulnoten
- metrische Skalen:
- Die Verhältnisskala existiert ein natürlicher Nullpunkt und die willkürlich festgelegte Einheit. Länge und Gewicht.
- bei Invervallskala ist der Nullpunkt willkürlich festgelegt, jedoch die Einheit durch Differenzbildung fest definiert. Temperature
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
Bei einem Flächendiagramm werden Flächen gegenübergestellt, die proportional zu den zu vergleichenden relativen oder absoluten Häufigkeiten gewählt werden.

2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
Das Kreisdiagramm ist eine spezifische Form des Flächendiagramms.
Für die Erstellung eines Kreisdiagramms wird die Winkelsumme des Kreises proportional zu den Häufigkeiten der Ausprägungen aufgeteilt.

2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
In einem Balkendiagramm werden die Merkmalsausprägungen auf der x-achse und die Häufigkeiten auf der y-achse aufgetragen.
Für den grafischen Vergleich mehrerer solcher Häufigkeitsverteilungen empfiehlt es sich, die relativen Häufigkeiten darzustellen.

2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
- Die Häufigkeitsverteilung eines stetigen Merkmals wird grafisch in Form eines Histogramms dargestellt. Dazu wird die Messskala in Klassen eingeteilt.
- Für diese Klassen ist es erforderlich, dass sie den gesamten Wertebereich abdecken und sich nicht gegenseitig überlappen.
- Beim Histogramm wird über die einzelnen Klassen ein Rechteck mit der Breite der Klasse gezeichnet, dessen Fläche proportional zur relativen Häufigkeit der Klasse ist. Es empfiehlt sich, gleichbreite Klassen zu wählen, wodurch dann die Höhe der Rechtecke proportional zur absoluten bzw. relativen Häufigkeit in der jeweiligen Klasse ist.

2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
- Die dem Histogramm zu Grunde liegende Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über die konkreten Daten.
- Eine grafische Veranschaulichung der Original-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion. Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf die Ordinate abgetragen. Die relativen Summenhäufigkeiten zu einem Messwert x ist dabei gegeben durch den Anteil der Werte, die kleiner oder gleich diesem Wert x sind. Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.

Die empirische Verteilungsfunktion enthält die gleichen Informationen wie Rohdaten.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Lagemaße beschreibt die die Lage der Messwerte auf der Messskala und die zentrale Tendenz der Daten.
Sie haben die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
Zu den Lagemaßen zählen Mittelwert, Quantile, Median, und Modalwert.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Der Mittelwert beschreibt den statistischen Durchschnittswert. Für den Mittelwert addiert man alle Werte und teilt die Summe durch die Anzahl aller Werte.

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Ein p-Quantil ist allgemein dadurch charakterisiert, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert und mindestens ein Anteil 1-p größer oder gleich diesem Wert ist. Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quartile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
- Quartile zerlegen eine sortierte Datenreihe von Beobachtungen in vier gleich große Abschnitte.
- Das erste Quartil wird auch unteres Quartil genannt.
- Das dritte Quartil wird auch oberes Quartil genannt.
- Der Median ist der Wert in der Mitte oder das arithmetische Mittel der beiden mittleren Werte. Er wird manchmal auch zweites Quartil genannt.
- Modalwert:
- Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. Er ist nur sinnvoll, wenn er eindeutig ist.

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Zusätzlich zum Lagemaß sollte ein geeignetes Streuungsmaß angegeben werden, das die Breite der Verteilung der Messwerte um dieses Lagemaß herum beschreibt. Die meisten Streuungsmaße bleiben gleich, falls ein konstanter Wert zu allen Messergebnissen addiert wird. Wird mit einem konstanten Faktor multipliziert, dann werden auch die Streuungsmaße mit diesem Faktor multipliziert. Zu den Streuungsmaßen gehören z.B. Spannweite, Standardabweichung, Varianz, Quartilsabstand und Variationskoeffizient.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Spannweite:
Die Spannweite (range) misst den Wertebereich der Messergebnisse. Sie wird als Abstand zwischen dem größten x(n) und dem kleinsten Messwert x(1) berechnet:
range = x(n) - x(1)
Sie hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
- Der Quartilsabstand Q3-Q1 beschreibt die Lage der zentralen 50% der Messwerte
- hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot

变异系数只对由比率标量计算出来的数值有意义。举例来说,对于一个气温的分布,使用开尔文或摄氏度来计算的话并不会改变标准差的值,但是温度的平均值会改变,因此使用不同的温标的话得出的变异系数是不同的。也就是说,使用区间标量得到的变异系数是没有意义的。
unabhängig von der Maßeinheit
es wird als relative Streuungsmaß bzw. normierte Standardabweichung

2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot

Da es nur empirisch begründete Empfehlungen für die zu verwendenden statistischen Maßzahlen gibt, werden vielfach bei der Beschreibung von Merkmalen mehrere Lage- und Streuungsmaße berechnet. Aus der Gegenüberstellung der Maßzahlen sollen Anhaltspunkte über die Verteilung der Daten gewonnen werden. Dem Wunsch nach einer grafischen Veranschaulichung der Daten und Maßzahlen kann in Form eines Box-Whisker-Plots (vgl. Abb. 6) Rechnung getragen werden. Ausgangspunkt dieser Darstellung (bei vertikaler Orientierung) bildet eine Box, deren untere und obere Begrenzungslinie durch das untere und obere Quartil der Messergebnisse festgelegt sind. Innerhalb der Box wird der Median durch einen horizontale Linie und das arithmetische Mittel durch einen Punkt markiert. Die Whiskers werden unterhalb bzw. oberhalb der Box abgetragen. Die Endpunkte sind durch den größten und kleinsten Messwert definiert. Wenn allerdings diese Werte vom oberen bzw. unteren Rand der Box zu weit entfernt liegen (mehr als 1.5(Q3-Q1)), endet die Linie bei dem höchsten bzw. niedrigsten Messwert, der gerade noch innerhalb dieses Bereiches liegt. Alle Messwerte, die extremer sind, werden einzeln dargestellt.

2.4 Verteilungen

2.4 Verteilungen

Normalverteilung
Bei normal verteilten Daten liegen etwa 68% aller Daten innerhalb einer Standardabweichung vom Mittelwert. Etwa 95% liegen innerhalb von 2 Standardabweichung und 99,7% liegen innerhalb von 3 Standardabweichungen.

2.4 Verteilungen

Diskrete Gleichverteilung
Die Gleichverteilung beschreibt eine Wahrscheinlichkeitsverteilung bei der für jeden möglichen Zustand mit die gleiche Wahrscheinlichkeit bzw. Wahrscheinlichkeitsdichte des Zutreffens besteht. Es wird unterschieden in: diskrete Gleichverteilung und stetige Gleichverteilung

2.4 Verteilungen
Binomialverteilung
- beschreibt welcher Experimente?
- welcher Parameter?
- wie berechnet?


2.4 Verteilungen

Exponentialverteilung


















