Praktikum Flashcards
2.1 Begriffsdefinitionen
-
Beobachtungseinheit, Merkmal
- was ist die Beobachtungseinheit?
- was ist Merkmal?
- was ist Auspraegung?
- Merkmalstypen
- Skalenniveaus
- Die Beobachtungseinheit ist die kleinste Einheit einer statistischen Analyse, auf der Beobachtungen gemacht werden.
- ein Merkmal ist eine beobachtbare oder messbare Eigenschaft einer Beobachtungseinheit, die gewöhnlich in verschiedenen Ausprägungen vorhanden ist, z. B. Merkmal Geschlecht, Ausprägungen: männlich, weiblich.
- Die Merkmalsausprägung ist dann der festgestellte Befund des Merkmals
2.1 Begriffsdefinitionen
- Beobachtungseinheit, Merkmal
-
Merkmalstypen
- quantitative vs qualitativ?
- diskrete vs. stetig
- Skalenniveaus
Ein Merkmal heißt quantitativ, wenn seine Ausprägungen durch Messen oder Zählen erfasst werden können, z.B. Blutdruck, Kinderzahl.
Alle übrigen Merkmale heißen qualitativ, z.B. Blutgruppe, Geschlecht, ihre Merkmalsausprägungen stellen begriffliche Kategorien dar.
Ein Merkmal heißt diskret, wenn die Werte abgezählt werden können, z.B. die Kinderzahl in einer Familie.
Stetige Merkmale werden gemessen und können theoretisch alle Werte in einem bestimmten Intervall annehmen, z.B. Körpergröße.
2.1 Begriffsdefinitionen
- Beobachtungseinheit, Merkmal
- Merkmalstypen
-
Skalenniveaus
- was ist nominal?
- was ist ordinal?
- was ist Verhältnisskal?
- was ist Invervallskala?
- Ein Merkmal skaliert nominal, wenn seine Ausprägungen unterschieden werden können, aber keine natürliche Rangfolge aufweisen. Farbe
- Ein Merkmal skaliert ordinal, wenn es eine Rangordnung zwischen den Ausprägungen gibt. Schulnoten
- metrische Skalen:
- Die Verhältnisskala existiert ein natürlicher Nullpunkt und die willkürlich festgelegte Einheit. Länge und Gewicht.
- bei Invervallskala ist der Nullpunkt willkürlich festgelegt, jedoch die Einheit durch Differenzbildung fest definiert. Temperature
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
Bei einem Flächendiagramm werden Flächen proportional zu den relativen oder absoluten Häufigkeiten geteilt werden.
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
Das Kreisdiagramm ist eine spezifische Form des Flächendiagramms.
Für die Erstellung eines Kreisdiagramms wird die Winkelsumme des Kreises proportional zu den Häufigkeiten der Ausprägungen aufgeteilt.
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
In einem Balkendiagramm werden die Merkmalsausprägungen auf der x-achse und die Häufigkeiten auf der y-achse aufgetragen.
Für den grafischen Vergleich mehrerer solcher Häufigkeitsverteilungen empfiehlt es sich, die relativen Häufigkeiten darzustellen.
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
- Empirische Verteilungsfunktion
- Das Histogramm eignet sich sehr gut zur Darstellung der Häufigkeitsverteilung von stetige Merkmalen.
- Die Messskala wird in Klassen eingeteilt, für diese Klassen ist es erforderlich, dass sie den gesamten Wertebereich abdecken und sich nicht gegenseitig überlappen.
- Beim Histogramm wird über die einzelnen Klassen ein Rechteck mit der Breite der Klasse gezeichnet, dessen Fläche proportional zur relativen Häufigkeit der Klasse ist. Es empfiehlt sich, gleichbreite Klassen zu wählen, wodurch dann die Höhe der Rechtecke proportional zur absoluten bzw. relativen Häufigkeit in der jeweiligen Klasse ist.
2.2 Grafische Darstellung
- Flächendiagramm
- Kreisdiagramm
- Balkendiagramm
- Histogramm
-
Empirische Verteilungsfunktion(kumulierten relativen Häufigkeiten der Stichprobe)
- x-achse und y-ache
- was ist die relativen Summenhäufigkeiten?
- Daten verloren order nicht?
- Die Messwerten wird auf der x-Achse abgetragen und die zugehörigen Summenhäufigkeiten wird auf die y-Achse abgetragen.
- Die relativen Summenhäufigkeiten zu einem Messwert x ist dabei gegeben durch den Anteil der Werte, die kleiner oder gleich diesem Wert x sind. Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.
- Die empirische Verteilungsfunktion enthält die gleichen Informationen wie Rohdaten.
2.3 Ausgewählte Kenngrößen
-
Lagemaße
- welche Lagemaße?
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Lagemaße beschreibt die die Lage der Messwerte auf der Messskala und die zentrale Tendenz der Daten.
Sie haben die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
Zu den Lagemaßen zählen Mittelwert, Median, und Modalwert.
2.3 Ausgewählte Kenngrößen
- Lagemaße
-
Mittelwert
- wie berechnet?
- Eigenschaft?
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Der Mittelwert beschreibt den statistischen Durchschnittswert. Für den Mittelwert addiert man alle Werte und teilt die Summe durch die Anzahl aller Werte.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
-
Quantile
- Definition
- Lagemass ?
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Ein p-Quantil ist allgemein dadurch charakterisiert, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert und mindestens ein Anteil 1-p größer oder gleich diesem Wert ist. Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
-
Median
- wie berechnet?
- Eigenschaft?
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quartile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
- Quartile zerlegen eine sortierte Datenreihe von Beobachtungen in vier gleich große Abschnitte.
- Das erste Quartil wird auch unteres Quartil genannt.
- Das dritte Quartil wird auch oberes Quartil genannt.
- Der Median ist der Wert in der Mitte oder das arithmetische Mittel der beiden mittleren Werte. Er wird manchmal auch zweites Quartil genannt.
- Modalwert:
- Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. Er ist nur sinnvoll, wenn er eindeutig ist.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
-
Streuungsmaße
- welche?
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Zusätzlich zum Lagemaß sollte ein geeignetes Streuungsmaß angegeben werden, das die Breite der Verteilung der Messwerte um dieses Lagemaß herum beschreibt. Die meisten Streuungsmaße bleiben gleich, falls ein konstanter Wert zu allen Messergebnissen addiert wird. Wird mit einem konstanten Faktor multipliziert, dann werden auch die Streuungsmaße mit diesem Faktor multipliziert. Zu den Streuungsmaßen gehören z.B. Spannweite, Standardabweichung, Varianz, Quartilsabstand und Variationskoeffizient.
SEM
- Was bedeutet SEM? was ist SEM?
- formel
- wie interpretiren?
- Unterscheidung: Standardfehler und Standardabweichung
- Mit zunehmender Stichprobengröße, wie verändert die SEM?
- Der Standardfehler des Mittels gibt an, wie stark der beobachtete Mittelwert aus der Stichprobe durchschnittlich vom wahren Mittelwert der Grundgesamtheit abweicht.
- Standardabweichung der Messwerte durch die Wurzel der Stichprobengröße
- Durchschnittlich weicht die in der Stichprobe der MW um … von der wahren MW ab.
- Der SEM beschreibt, wie stark beobachtete Mittelwerte um den wahren Mittelwert der Grundgesamtheit schwanken. Es geht um die Streuung der Mittelwerte. Die Standardabweichung ist ein Maß für die Streuung der Messwerte, das heißt wie gleich die Messwerte in der Stichprobe sind.
- Mit zunehmender Stichprobengröße nimmt der Standardfehler des Mittelwerts tendenziell ab. (Mit zunehmender Stichprobengröße wird die Schätzung des wahren Mittelwerts mit dem Stichprobenmittelwert also zunehmend genauer.)
随着你的样本量变大,SEM会变小。因为大样本量的平均值可能比小样本量的平均值更接近真实的总体平均值。在一个巨大样本的情况下,即使数据非常分散,你也能非常精确地知道平均值是多少。
即,SEM是衡量样本平均值和整体平均值差异的指标。
其实际意义即是用来表示样本均值与总体均值的离散程度,标准误越小,样本均值和总体均值差距则越小,反之越大。
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
- Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Spannweite:
Die Spannweite (range) misst den Wertebereich der Messergebnisse. Sie wird als Abstand zwischen dem größten x(n) und dem kleinsten Messwert x(1) berechnet:
range = x(n) - x(1)
Sie hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
2.3 Ausgewählte Kenngrößen
- Lagemaße
- Mittelwert
- Quantile, Median
- Median
- Quartile
- Modalwert
- Streuungsmaße
- Spannweite
-
Standardabweichung, Varianz
- Quartilsabstand
- Variationskoeffizient
- Box-Whisker-Plot
Mit der SD wird die Wurzel der mittelren Abweichung von MW gemessen
Die Varianz gibt den mittleren Abstand der Messwerte vom Mittelwert an, ist also ein Maß für die Breite der Verteilung der Daten. Da sie auf den MW bezogen (zentriert) ist , ist sie von der Lage der Verteilung unabhängig, und heißt daher auch zweites zentrales Moment.