Praktikum Flashcards

1
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
  • Merkmalstypen
  • Skalenniveaus
A
  • Die Beobachtungseinheit ist die kleinste Einheit einer statistischen Auswertung, auf der Beobachtungen gemacht werden.
  • ein Merkmal ist eine beobachtbare oder messbare Eigenschaft einer Beobachtungseinheit, die gewöhnlich in verschiedenen Ausprägungen vorhanden ist, z. B. Merkmal Geschlecht, Ausprägungen: männlich, weiblich.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
  • Merkmalstypen
  • Skalenniveaus
A

​Ein Merkmal heißt quantitativ, wenn seine Ausprägungen durch Messen oder Zählen erfasst werden können, z.B. Blutdruck, Kinderzahl.

Alle übrigen Merkmale heißen qualitativ, z.B. Blutgruppe, Geschlecht, ihre Merkmalsausprägungen stellen begriffliche Kategorien dar.

Ein Merkmal heißt diskret, wenn die Werte abgezählt werden können, z.B. die Kinderzahl in einer Familie.

Stetige Merkmale werden gemessen und können theoretisch alle Werte in einem bestimmten Intervall annehmen, z.B. Körpergröße.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
  • Merkmalstypen
  • Skalenniveaus
A
  • Ein Merkmal skaliert nominal, wenn seine Ausprägungen unterschieden werden können, aber keine natürliche Rangfolge aufweisen. Farbe
  • Ein Merkmal skaliert ordinal, wenn es eine Rangordnung zwischen den Ausprägungen gibt. Schulnoten
  • metrische Skalen:
    • Die Verhältnisskala existiert ein natürlicher Nullpunkt und die willkürlich festgelegte Einheit. Länge und Gewicht.
    • bei Invervallskala ist der Nullpunkt willkürlich festgelegt, jedoch die Einheit durch Differenzbildung fest definiert. Temperature
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

Bei einem Flächendiagramm werden Flächen gegenübergestellt, die proportional zu den zu vergleichenden relativen oder absoluten Häufigkeiten gewählt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

Das Kreisdiagramm ist eine spezifische Form des Flächendiagramms.

Für die Erstellung eines Kreisdiagramms wird die Winkelsumme des Kreises proportional zu den Häufigkeiten der Ausprägungen aufgeteilt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

In einem Balkendiagramm werden die Merkmalsausprägungen auf der x-achse und die Häufigkeiten auf der y-achse aufgetragen.

Für den grafischen Vergleich mehrerer solcher Häufigkeitsverteilungen empfiehlt es sich, die relativen Häufigkeiten darzustellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A
  • Die Häufigkeitsverteilung eines stetigen Merkmals wird grafisch in Form eines Histogramms dargestellt. Dazu wird die Messskala in Klassen eingeteilt.
  • Für diese Klassen ist es erforderlich, dass sie den gesamten Wertebereich abdecken und sich nicht gegenseitig überlappen.
  • Beim Histogramm wird über die einzelnen Klassen ein Rechteck mit der Breite der Klasse gezeichnet, dessen Fläche proportional zur relativen Häufigkeit der Klasse ist. Es empfiehlt sich, gleichbreite Klassen zu wählen, wodurch dann die Höhe der Rechtecke proportional zur absoluten bzw. relativen Häufigkeit in der jeweiligen Klasse ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A
  • Die dem Histogramm zu Grunde liegende Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über die konkreten Daten.
  • Eine grafische Veranschaulichung der Original-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion. Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf die Ordinate abgetragen. Die relativen Summenhäufigkeiten zu einem Messwert x ist dabei gegeben durch den Anteil der Werte, die kleiner oder gleich diesem Wert x sind. Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.

Die empirische Verteilungsfunktion enthält die gleichen Informationen wie Rohdaten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Lagemaße beschreibt die die Lage der Messwerte auf der Messskala und die zentrale Tendenz der Daten.

Sie haben die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

Zu den Lagemaßen zählen Mittelwert, Quantile, Median, und Modalwert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Der Mittelwert beschreibt den statistischen Durchschnittswert. Für den Mittelwert addiert man alle Werte und teilt die Summe durch die Anzahl aller Werte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Ein p-Quantil ist allgemein dadurch charakterisiert, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert und mindestens ein Anteil 1-p größer oder gleich diesem Wert ist. Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quartile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
  • Quartile zerlegen eine sortierte Datenreihe von Beobachtungen in vier gleich große Abschnitte.
    • Das erste Quartil wird auch unteres Quartil genannt.
    • Das dritte Quartil wird auch oberes Quartil genannt.
    • Der Median ist der Wert in der Mitte oder das arithmetische Mittel der beiden mittleren Werte. Er wird manchmal auch zweites Quartil genannt.
  • Modalwert:
    • Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. Er ist nur sinnvoll, wenn er eindeutig ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Zusätzlich zum Lagemaß sollte ein geeignetes Streuungsmaß angegeben werden, das die Breite der Verteilung der Messwerte um dieses Lagemaß herum beschreibt. Die meisten Streuungsmaße bleiben gleich, falls ein konstanter Wert zu allen Messergebnissen addiert wird. Wird mit einem konstanten Faktor multipliziert, dann werden auch die Streuungsmaße mit diesem Faktor multipliziert. Zu den Streuungsmaßen gehören z.B. Spannweite, Standardabweichung, Varianz, Quartilsabstand und Variationskoeffizient.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Spannweite:

Die Spannweite (range) misst den Wertebereich der Messergebnisse. Sie wird als Abstand zwischen dem größten x(n) und dem kleinsten Messwert x(1) berechnet:

range = x(n) - x(1)
Sie hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
  • Der Quartilsabstand Q3-Q1 beschreibt die Lage der zentralen 50% der Messwerte
  • hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
18
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

变异系数只对由比率标量计算出来的数值有意义。举例来说,对于一个气温的分布,使用开尔文或摄氏度来计算的话并不会改变标准差的值,但是温度的平均值会改变,因此使用不同的温标的话得出的变异系数是不同的。也就是说,使用区间标量得到的变异系数是没有意义的。

unabhängig von der Maßeinheit

es wird als relative Streuungsmaß bzw. normierte Standardabweichung

19
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Da es nur empirisch begründete Empfehlungen für die zu verwendenden statistischen Maßzahlen gibt, werden vielfach bei der Beschreibung von Merkmalen mehrere Lage- und Streuungsmaße berechnet. Aus der Gegenüberstellung der Maßzahlen sollen Anhaltspunkte über die Verteilung der Daten gewonnen werden. Dem Wunsch nach einer grafischen Veranschaulichung der Daten und Maßzahlen kann in Form eines Box-Whisker-Plots (vgl. Abb. 6) Rechnung getragen werden. Ausgangspunkt dieser Darstellung (bei vertikaler Orientierung) bildet eine Box, deren untere und obere Begrenzungslinie durch das untere und obere Quartil der Messergebnisse festgelegt sind. Innerhalb der Box wird der Median durch einen horizontale Linie und das arithmetische Mittel durch einen Punkt markiert. Die Whiskers werden unterhalb bzw. oberhalb der Box abgetragen. Die Endpunkte sind durch den größten und kleinsten Messwert definiert. Wenn allerdings diese Werte vom oberen bzw. unteren Rand der Box zu weit entfernt liegen (mehr als 1.5(Q3-Q1)), endet die Linie bei dem höchsten bzw. niedrigsten Messwert, der gerade noch innerhalb dieses Bereiches liegt. Alle Messwerte, die extremer sind, werden einzeln dargestellt.

20
Q

2.4 Verteilungen

A
21
Q

2.4 Verteilungen

Normalverteilung

A

Bei normal verteilten Daten liegen etwa 68% aller Daten innerhalb einer Standardabweichung vom Mittelwert. Etwa 95% liegen innerhalb von 2 Standardabweichung und 99,7% liegen innerhalb von 3 Standardabweichungen.

22
Q

2.4 Verteilungen

Diskrete Gleichverteilung

A

Die Gleichverteilung beschreibt eine Wahrscheinlichkeitsverteilung bei der für jeden möglichen Zustand mit die gleiche Wahrscheinlichkeit bzw. Wahrscheinlichkeitsdichte des Zutreffens besteht. Es wird unterschieden in: diskrete Gleichverteilung und stetige Gleichverteilung

23
Q

2.4 Verteilungen

Binomialverteilung

  • beschreibt welcher Experimente?
  • welcher Parameter?
  • wie berechnet?
A
24
Q

2.4 Verteilungen

Exponentialverteilung

A
25
Q

2.4 Verteilungen

Poisson-Verteilung

A
26
Q

2.4 Verteilungen

x 2 - Verteilung

A
27
Q

2.4 Verteilungen

t-Verteilung

A
28
Q

2.4 Verteilungen

F-Verteilung

A
29
Q

2.5 Statistische Tests

A

„Im medizinisch-biologischen Bereich können wissenschaftliche Hypothesen meist nicht direkt bewiesen werden, da „unbekannte“ Faktoren eventuell vorhandene deterministische Gesetz- mäßigkeiten „stören“. Die Gültigkeit einer wissenschaftlichen Hypothese wird überprüft, indem ein konkretes Experiment benutzt wird, um die Vereinbarkeit der Hypothese mit der Realität zu erklären. Hypothesen der Art „Es besteht kein Unterschied“ oder „Beobachtete Unterschiede weichen nur zufällig von Null ab.“ werden in der Statistik als Nullhypothese (H0) bezeichnet. Ziel ist es die Nullhypothese abzulehnen. Die zu H0 komplementäre Aussage heißt Alternativhypothese (H1). Um die Hypothese „Die beobachteten Unterschiede weichen nur zufällig von Null ab.“ beurteilen zu können, werden Modelle der Wahrscheinlichkeitsrechnung herangezogen.

Die zentrale Bedeutung der Nullhypothese ist, dass sie Annahmen zur Formulierung eines Wahr- scheinlichkeitsmodells festlegt. Lassen sich die tatsächlichen Beobachtungen durch das so festgelegte Modell nur unzulänglich erklären, werden die ursprünglichen Annahmen (H0) als unhaltbar verworfen. Die Denkweise ist dabei folgende: Unter Annahme der Richtigkeit der Nullhypothese ist man in der Lage, die Verteilung der Prüfgröße vor Beginn des Versuchs zu spezifizieren. So können Aussagen über das voraussichtliche Versuchsergebnis gemacht werden. Es wird ein Bereich angegeben, in dem der Wert der Prüfgröße mit einer bestimmten (hohen), vor Versuchsbeginn festzulegenden Wahrscheinlichkeit zu finden sein wird. In den komplementären Bereich fällt bei Zutreffen der Nullhypothese die Prüfgröße nur mit einer geringen Wahrscheinlichkeit von z.B. α=0.05, der sogenannten Irrtumswahrscheinlichkeit (Signifikanzniveau). Fällt der Wert der Prüfgröße in diesen Ablehnbereich, so wird man sich dafür entscheiden, die Nullhypothese zu verwerden. Fällt die Realisation der Prüfgröße nicht in den Ablehnbereich (also in den Annahmebereich), so hat das Experiment keine gewichtigen statistischen Gründe geliefert, die Nullhypothese anzuzweifeln und man wird sich entscheiden, die Nullhypothese nicht zu verwerfen.

30
Q

2.5 Statistische Tests

A

Häufig wird die Entscheidung bei einem statistischen Test an Hand des p-Wertes und nicht des Wertes der Prüfgröße getroffen. Der p-Wert gibt die Wahrscheinlichkeit an, vorliegende oder extreme Versuchsausgänge zu beobachten, wenn die Nullhypothese zutrifft. Die Berechnung erfolgt über den beobachteten Wert der Prüfgröße. Die Entscheidungsregel für bzw. gegen das Verwerfen der Nullhypothese lässt sich dann, analog zum Vergleich des beobachteten Wertes der Prüfgröße mit dem Schwellenwert, an Hand des Vergleiches des p-Wertes mit dem Signifikanzniveaus α (häufig 0.05) in der Form: verwerfe die Nullhypothese, falls gilt: p ≤α bzw. verwerfe die Nullhypothese nicht, falls gilt: p>α formulieren.

31
Q

2.5 Statistische Tests

A

Aus der Theorie ist bekannt, dass sich mit wachsendem Stichprobenumfang die konkurrierenden Wahrscheinlichkeitsmodelle unter der Null- und Alternativhypothese immer mehr unterscheiden. Dies bedeutet, dass bei vorgegebenem Fehler 1. Art und wachsendem Stichprobenumfang die Wahrscheinlichkeit für einen Fehler 2. Art kleiner wird. Mit wachsendem Stichprobenumfang steigt also die Chance, Abweichungen von der Nullhypothese auch zu entdecken. Die Wahrscheinlichkeit für die korrekte Ablehnung der Nullhypothese nennt man die Macht (Power) eines Tests:

POWER = 1-„Wahrscheinlichkeit für einen Fehler 2. Art“ = Wahrscheinlichkeit für die korrekte Verwerfung der Nullhypothese.“[2]

32
Q

2.5 Statistische Tests

  • 1-Stichproben-t-Test
  • Wilcoxon-Test (Rangsummen-Test)
A
33
Q

2.5 Staistictest

A

Zur Durchführung eines statistischen Tests kann diese allgemeine Vorgehensweise Anwendung finden:

  1. Hypothesenbildung
  2. Signifikanzniveau festlegen
  3. Schwellwerte Annahme-/Ablehnungsbereich ablesen
  4. Testgröße berechnen
  5. Prüfen, ob Testgröße im Annahme-/Ablehnungsbereich
  6. Interpretation
34
Q
A
35
Q

2.5 Statistische Tests

  • 1-Stichproben-t-Test
  • Wilcoxon-Test (Rangsummen-Test)
A
36
Q
  1. 6 Analyse stochastischer Signale
  2. 6.1 Stationarität
  • was dedeutet Stationarität?
  • was ist strenge Stationarität?
  • was ist schwache Stationarität?
  • Es gibt keinen starre Test für strenge Stationarität. Es kann lediglich auf schwache Stationarität getestet werden. wie?
A
  • Zeitsignale werden als stationär bezeichnet, wenn Kennwerte und Kennfunktionen unabhängig von der Zeit t bzw. der Frequenz f sind. Wenn man das Zeitfenster verschiebt, diese Kennwerte und Kennfunktionen ändern sich bei stationären Signalen also nicht,
  • Folglich können nur zeitlich unbegrenzte Signale stationär sein.
  • Die strenge Stationaritätsbedingung verlangt, dass alle Signaleigenschaften zeitunabhängig sind.
  • Die schwache Stationaritätsbedingung ist erfüllt, falls nur irgendein Kennwert oder eine Kennfunktion, z.B. der arithmetische Mittelwert zeitunabhängig ist.
  • Es gibt keinen ridigen Test auf strenge Stationarität. Es kann lediglich auf schwache Stationarität getestet werden.
    • Statistischer Test der Daten: meist Run-Test (Wald-Wolfowitz). Testen der zeitlichen Invarianz der statistischen Parameter einer Datenreihe.
    • Reproduzierbarkeit der Datenanalyse: Teilen der Zeitreihe in zwei Teilfolgen und Berechnung verschiedener statisticher Paramer für beide Teilfolge.
37
Q

Aufgabe 2

A
38
Q

Aufgabe 3

A
39
Q

t 检验

A
40
Q

wilcoxon - test

A
41
Q
A