Praktikum Flashcards

1
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
    • ​was ist die Beobachtungseinheit?
    • was ist Merkmal?
    • was ist Auspraegung?
  • Merkmalstypen
  • Skalenniveaus
A
  • Die Beobachtungseinheit ist die kleinste Einheit einer statistischen Analyse, auf der Beobachtungen gemacht werden.
  • ein Merkmal ist eine beobachtbare oder messbare Eigenschaft einer Beobachtungseinheit, die gewöhnlich in verschiedenen Ausprägungen vorhanden ist, z. B. Merkmal Geschlecht, Ausprägungen: männlich, weiblich.
  • Die Merkmalsausprägung ist dann der festgestellte Befund des Merkmals
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
  • Merkmalstypen
    • ​quantitative vs qualitativ?
    • diskrete vs. stetig
  • Skalenniveaus
A

​Ein Merkmal heißt quantitativ, wenn seine Ausprägungen durch Messen oder Zählen erfasst werden können, z.B. Blutdruck, Kinderzahl.

Alle übrigen Merkmale heißen qualitativ, z.B. Blutgruppe, Geschlecht, ihre Merkmalsausprägungen stellen begriffliche Kategorien dar.

Ein Merkmal heißt diskret, wenn die Werte abgezählt werden können, z.B. die Kinderzahl in einer Familie.

Stetige Merkmale werden gemessen und können theoretisch alle Werte in einem bestimmten Intervall annehmen, z.B. Körpergröße.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

2.1 Begriffsdefinitionen

  • Beobachtungseinheit, Merkmal
  • Merkmalstypen
  • Skalenniveaus
    • ​was ist nominal?
    • was ist ordinal?
    • was ist Verhältnisskal?
    • was ist Invervallskala?
A
  • Ein Merkmal skaliert nominal, wenn seine Ausprägungen unterschieden werden können, aber keine natürliche Rangfolge aufweisen. Farbe
  • Ein Merkmal skaliert ordinal, wenn es eine Rangordnung zwischen den Ausprägungen gibt. Schulnoten
  • metrische Skalen:
    • Die Verhältnisskala existiert ein natürlicher Nullpunkt und die willkürlich festgelegte Einheit. Länge und Gewicht.
    • bei Invervallskala ist der Nullpunkt willkürlich festgelegt, jedoch die Einheit durch Differenzbildung fest definiert. Temperature
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

Bei einem Flächendiagramm werden Flächen proportional zu den relativen oder absoluten Häufigkeiten geteilt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

Das Kreisdiagramm ist eine spezifische Form des Flächendiagramms.

Für die Erstellung eines Kreisdiagramms wird die Winkelsumme des Kreises proportional zu den Häufigkeiten der Ausprägungen aufgeteilt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A

In einem Balkendiagramm werden die Merkmalsausprägungen auf der x-achse und die Häufigkeiten auf der y-achse aufgetragen.

Für den grafischen Vergleich mehrerer solcher Häufigkeitsverteilungen empfiehlt es sich, die relativen Häufigkeiten darzustellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion
A
  • Das Histogramm eignet sich sehr gut zur Darstellung der Häufigkeitsverteilung von stetige Merkmalen.
  • Die Messskala wird in Klassen eingeteilt, für diese Klassen ist es erforderlich, dass sie den gesamten Wertebereich abdecken und sich nicht gegenseitig überlappen.
  • Beim Histogramm wird über die einzelnen Klassen ein Rechteck mit der Breite der Klasse gezeichnet, dessen Fläche proportional zur relativen Häufigkeit der Klasse ist. Es empfiehlt sich, gleichbreite Klassen zu wählen, wodurch dann die Höhe der Rechtecke proportional zur absoluten bzw. relativen Häufigkeit in der jeweiligen Klasse ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

2.2 Grafische Darstellung

  • Flächendiagramm
  • Kreisdiagramm
  • Balkendiagramm
  • Histogramm
  • Empirische Verteilungsfunktion(kumulierten relativen Häufigkeiten der Stichprobe)
    • ​x-achse und y-ache
    • was ist die relativen Summenhäufigkeiten?
    • Daten verloren order nicht?
A
  • Die Messwerten wird auf der x-Achse abgetragen und die zugehörigen Summenhäufigkeiten wird auf die y-Achse abgetragen.
  • Die relativen Summenhäufigkeiten zu einem Messwert x ist dabei gegeben durch den Anteil der Werte, die kleiner oder gleich diesem Wert x sind. Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.
  • Die empirische Verteilungsfunktion enthält die gleichen Informationen wie Rohdaten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
    • welche Lagemaße?
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Lagemaße beschreibt die die Lage der Messwerte auf der Messskala und die zentrale Tendenz der Daten.

Sie haben die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

Zu den Lagemaßen zählen Mittelwert, Median, und Modalwert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
    1. ​wie berechnet?
    2. Eigenschaft?
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Der Mittelwert beschreibt den statistischen Durchschnittswert. Für den Mittelwert addiert man alle Werte und teilt die Summe durch die Anzahl aller Werte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile
    1. ​Definition
    2. Lagemass ?
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Ein p-Quantil ist allgemein dadurch charakterisiert, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert und mindestens ein Anteil 1-p größer oder gleich diesem Wert ist. Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
    1. ​wie berechnet?
    2. Eigenschaft?
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quartile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
  • Quartile zerlegen eine sortierte Datenreihe von Beobachtungen in vier gleich große Abschnitte.
    • Das erste Quartil wird auch unteres Quartil genannt.
    • Das dritte Quartil wird auch oberes Quartil genannt.
    • Der Median ist der Wert in der Mitte oder das arithmetische Mittel der beiden mittleren Werte. Er wird manchmal auch zweites Quartil genannt.
  • Modalwert:
    • Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. Er ist nur sinnvoll, wenn er eindeutig ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
    1. ​welche?
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Zusätzlich zum Lagemaß sollte ein geeignetes Streuungsmaß angegeben werden, das die Breite der Verteilung der Messwerte um dieses Lagemaß herum beschreibt. Die meisten Streuungsmaße bleiben gleich, falls ein konstanter Wert zu allen Messergebnissen addiert wird. Wird mit einem konstanten Faktor multipliziert, dann werden auch die Streuungsmaße mit diesem Faktor multipliziert. Zu den Streuungsmaßen gehören z.B. Spannweite, Standardabweichung, Varianz, Quartilsabstand und Variationskoeffizient.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

SEM

  1. Was bedeutet SEM? was ist SEM?
  2. formel
  3. wie interpretiren?
  4. Unterscheidung: Standardfehler und Standardabweichung
  5. Mit zunehmender Stichprobengröße, wie verändert die SEM?
A
  1. Der Standardfehler des Mittels gibt an, wie stark der beobachtete Mittelwert aus der Stichprobe durchschnittlich vom wahren Mittelwert der Grundgesamtheit abweicht.
  2. Standardabweichung der Messwerte durch die Wurzel der Stichprobengröße
  3. Durchschnittlich weicht die in der Stichprobe der MW um … von der wahren MW ab.
  4. Der SEM beschreibt, wie stark beobachtete Mittelwerte um den wahren Mittelwert der Grundgesamtheit schwanken. Es geht um die Streuung der Mittelwerte. Die Standardabweichung ist ein Maß für die Streuung der Messwerte, das heißt wie gleich die Messwerte in der Stichprobe sind.
  5. Mit zunehmender Stichprobengröße nimmt der Standardfehler des Mittelwerts tendenziell ab. (Mit zunehmender Stichprobengröße wird die Schätzung des wahren Mittelwerts mit dem Stichprobenmittelwert also zunehmend genauer.)

随着你的样本量变大,SEM会变小。因为大样本量的平均值可能比小样本量的平均值更接近真实的总体平均值。在一个巨大样本的情况下,即使数据非常分散,你也能非常精确地知道平均值是多少。
即,SEM是衡量样本平均值和整体平均值差异的指标。

其实际意义即是用来表示样本均值与总体均值的离散程度,标准误越小,样本均值和总体均值差距则越小,反之越大。

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Spannweite:

Die Spannweite (range) misst den Wertebereich der Messergebnisse. Sie wird als Abstand zwischen dem größten x(n) und dem kleinsten Messwert x(1) berechnet:

range = x(n) - x(1)
Sie hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
    1. ​为什么除以n-1?
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A

Mit der SD wird die Wurzel der mittelren Abweichung von MW gemessen

Die Varianz gibt den mittleren Abstand der Messwerte vom Mittelwert an, ist also ein Maß für die Breite der Verteilung der Daten. Da sie auf den MW bezogen (zentriert) ist , ist sie von der Lage der Verteilung unabhängig, und heißt daher auch zweites zentrales Moment.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plot
A
  • Der Quartilsabstand Q3-Q1 beschreibt die Lage der zentralen 50% der Messwerte
  • hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
19
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
    1. ​was ist es?
    2. 相对SD,welche Vorteile?
    3. Nachteile
    4. Formel
  12. Box-Whisker-Plot
A
  1. Der Variationskoeffizient ist neben der Varianz und der Standardabweichung ein weiteres Streuungsmaß der deskriptiven Statistik.
  2. Dieser Koeffizient hat gegenüber der Standardabweichung einen großen Vorteil, denn er lässt sich unabhängig von der Maßeinheit der Stichprobe berechnen und interpretieren. Deshalb wird er auch als relatives Streuungsmaß oder normierte Standardabweichung bezeichnet.
  3. wenn der Mittelwert nahe bei Null liegt, können selbst kleine Schwankungen einen großen Einfluss auf den Variationskoeffizient haben
  4. die Standardabweichung durch den Mittelwert der SP
20
Q

2.3 Ausgewählte Kenngrößen

  1. Lagemaße
  2. Mittelwert
  3. Quantile, Median
  4. Median
  5. Quartile
  6. Modalwert
  7. Streuungsmaße
  8. Spannweite
  9. Standardabweichung, Varianz
  10. Quartilsabstand
  11. Variationskoeffizient
  12. Box-Whisker-Plothttps://studyflix.de/statistik/boxplot-1044
    1. ​Definition
    2. wie sieht ein Boxplot aus?
    3. 看网页里的例子
A
  1. Der Boxplot ist eine sehr anschauliche Darstellung der Daten mit menige Parameteren, die die Verteilung der Daten repräsentiert. Die Parameteren sind das Minimum, das untere Quartil, der Median, das obere Quartil und das Maximum.
  2. Er besteht aus der Box, sogenannten „Whisker“, zwei Linien, die das Rechteck mit dem Minimum bzw. Maximum verbinden. Der Median wird als Linien in der Box eingezeichnet. Es gibt eine Besonderheit. Sind die Whiskers länger als das 1,5-fache der Box, werden als Ausreißer gekennzeichnet. Die Whiskers enden dann bei dem letzten Wert, der die 1,5-fache Länge der Box unterschreitet.
21
Q

2.4 Verteilungen

  1. Dichtefunktion:
    1. Diskrete: 叫什么?有什么特点?
    2. Stetig:叫什么?有什么特点?
  2. Verteilungsfunktion:表达了什么?
    1. Diskrete:怎么算的?
    2. stetig:怎么算的?
A
  1. Dichtefunktion
    1. Bei diskreten Zufallsvariablen spricht man der Wahrscheinlichkeitsfunktion. Die Anzahl der Variablen ist endlich ist und jedem dieser Werte hat eine konkrete Wahrscheinlichkeit.
    2. Bei stetigen ZV spricht man der Wahrscheinlichkeitsdichte oder der Dichtefunktion. es handelt sich um unendlich viele mögliche Werte innerhalb eines Intervalls. Je höher die Dichte an dieser Stelle ist, desto höher ist auch die Wahrscheinlichkeit der Realisierung einer Variablen aus diesem Bereich.
  2. Verteilungsfunktion: Die Verteilungsfunktion gibt an, mit welcher Wahrscheinlichkeit das Ergebnis kleiner oder gleich eines bestimmten Wertes ist.
    1. diskrete: Um die diskrete Verteilungsfunktion zu erhalten, werden schrittweise alle Wahrscheinlichkeitswerte kumuliert. Das heißt, man bildet das Integral unter der Wahrscheinlichkeitsfunktion.
    2. stetig: Integration der Dichtefunktion
22
Q

2.4 Verteilungen

Normalverteilung https://matheguru.com/stochastik/normalverteilung.html

  1. wie viele Prozent Daten liegen innerhalb 1/2/3 Standardabweichung?
  2. Definition der ZGWS?
  3. welche Paramteren?
  4. Parameteren von Standardnormalverteilung?
  5. MW,Median,Modus,Vaianz,SD von NV
  6. wenn varianz veraendert, wie veraenert die Grafik der NV?
  7. wenn u veraendert, wie veraenert die Grafik der NV?
A
  1. Bei normal verteilten Daten liegen etwa 68% aller Daten innerhalb einer Standardabweichung vom Mittelwert. Etwa 95% liegen innerhalb von 2 Standardabweichung und 99,7% liegen innerhalb von 3 Standardabweichungen.
  2. Der ZGWS besagt, dass die Summe der unabhängige, identische ZV in Grenzweit normalverteilte ist.
  3. Erwartungswert u und Varianz σ2
  4. Erwartungswert =0, Varianz=1
  5. MW=Median=Modus=u, SD=σ, Varianz=σ2
  6. Je kleiner σ ist, desto steiler ist der Gipfel der Funktion um den Erwartungswert herum; je größer σ, desto flacher ist der Graph.
  7. die Normalverteilung wird entlang der x-Achse verschiebt.
23
Q

2.4 Verteilungen

Diskrete Gleichverteilung

  1. was ist es?
  2. Diskrete Gleichverteilung Beispiel
A
  1. Die Gleichverteilung beschreibt eine Wahrscheinlichkeitsverteilung bei der für jeden möglichen Zustand mit die gleiche Wahrscheinlichkeit bzw. Wahrscheinlichkeitsdichte des Zutreffens besteht.
  2. Beim Würfelwurf hat jedes Ergebnis die Wahrscheinlichkeit 1/6
24
Q

2.4 Verteilungen

  1. Binomialverteilung定义
  2. 描述了什么过程
  3. 公式
  4. 公式中的参数代表什么
A
25
Q

2.4 Verteilungen

Exponentialverteilung

  1. was ist Exponentialverteilung und wann verwendet diese Verteilung?
  2. Exponentialverteilung Formel (dichtfunktion und verteilungsfunktion )und welche Parameter?
  3. Exponentialverteilung Erwartungswert
  4. Gedächtnislosigkeit der Exponentialverteilung
A
  1. Die Exponentialverteilung ist eine Wahrscheinlichkeitsverteilung zur Bestimmung zufälliger Zeitintervalle. Sie wird meist für Warte- oder Ausfallzeiten verwendet, wie zum Beispiel die Länge eines Telefongesprächs, den radioaktiven Zerfall von Atomen oder die Lebensdauer deines Handys.
  2. 1/u ist unser einziger Parameter. 1/u: Anzahl des Auftretens des Ereignisses pro Zeiteinheit.
  3. 看图
  4. man kann aus den aktuellen Eigenschaften auf die Vergangenheit schließen, man braucht kein Gedächtnis.
  5. Eine wichtige Eigenschaft dieser Wahrscheinlichkeitsverteilung ist ihre Gedächtnislosigkeit. Um bei einer gedächtnislosen Verteilung zum Beispiel die restliche Lebensdauer deines Handys zu berechnen, muss man nicht wissen, wie lange das Gerät schon im Einsatz ist. Die Wahrscheinlichkeit, dass es nach 3 Jahren die nächste Zeiteinheit überlebt ist genauso hoch, wie zu Beginn der Benutzung.
26
Q

2.4 Verteilungen : Poisson-Verteilung

  1. was ist und wann benuzte?
  2. Die Formel für die Dichte
  3. Verteilungsfunktion
  4. Erwartungswert der Poisson Verteilung
  5. Varianz der Poisson Verteilung
  6. Voraussetzung
  7. was bedeutet lamda und k?
  8. langfristig ist mit 5 geburten pro Tag, wie große ist die WS für keine Geborten und für 10 Geborten pro Tag?
A
  1. typische für die diskrete ZV mit geringe WS des Auftretens
  2. λ hoch k geteilt durch k Fakultät mal die asche Zahl hoch minus λ
  3. Für die Verteilungsfunktion gibt es leider keine bequeme Formel. Man muss die einzelnen Werte der Dichtefunktion aufsummieren
  4. lamda, da der Erwartungswert den zu erwartenden Wert beschreibt und lamda genau das ausdrückt.
  5. Die Poisson Veteilung Varianz entspricht wieder dem Wert lamda
  6. große n und keine k
  7. Lamda steht für die durchschnittlich zu erwartende Anzahl an Ereignissen. k ist Treffsanzahl
  8. lamda=5, k=0/10
27
Q

2.4 Verteilungen

x 2 - Verteilung Chi Quadrat Verteilung

  1. was ist Chi Quadrat Verteilung?
  2. wann benutzt ?
  3. Chi Quadrat Verteilung Herleitung
  4. was bedeutet Freiheitsgrade? Chi Quadrat Freiheitsgrade?
  5. wie veraendert die chi quadrat verteilung mit zunehmende N ?
A
  1. Die x2 Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die für alle positiven, reellen Zahlen definiert ist.
  2. Die x2 Verteilung wird häufig gebraucht, wenn man in Kreuztabellen auf Unterschiede für kategorielle Daten testen will. Dort werden Unterschiede zwischen beobachteten und hypothetischen Häufigkeiten quadriert und aufsummiert.
  3. Die x2 Verteilung kann aus der Normalverteilung abgeleitet werden. Haben wir n unabhängig und standardnormalverteilt Zufallsvariablen, dann ergibt sich eine Verteilung mit n Freiheitsgraden aus der Summe der quadrierten Zufallsvariablen.
  4. Freiheitsgrade sind die Werte, die frei verändert werden können, ohne den betrachteten Parameter zu verändern.
  5. Mit zunehmendem Umfang der SP ähnelt die χ2-Verteilung immer mehr der Normalverteilung, ab etwa n=100 kann sie als normalverteilt betrachtet werden.
28
Q

2.4 Verteilungen

t-Verteilung

  1. Einstichproben-t-Test: wann benutzt?
  2. Zweistichproben-t-Test: wann benutzt?
  3. Abhängiger t-Test: wann bunuzt?
  4. Statistische Voraussetzungen für den t-Test
A
  1. Bei Einstichproben-t-Test wird ermittelt, ob der Mittelwert von Daten aus einer Gruppe sich von einem angegebenen Wert unterscheidet.
  2. Bei Zweistichproben-t-Test wird untersucht, ob sich die Mittelwerte von zwei unabhängigen Gruppen voneinander unterscheiden.
  3. Der abhängige t-Test wird verwendet, wenn man 2 Mittelwerte von miteinander abhängigen Stichproben vergleichen möchte.
  4. nv
29
Q

2.4 Verteilungen

F-Verteilung

  1. wann benuzte man die F-Verteilung?
  2. koennen negativ sein?
  3. rechtsschiefe oder linksschiefe?
  4. Freiheitsgrade?
A
  1. Man verwendest die F-Verteilung hauptsächlich zum Varianzvergleich zweier Stichproben aus normalverteilten Grundgesamtheiten.
  2. Die F-Verteilung ist entweder Null oder positiv ist , so gibt es keine negativen Werte für F . Dieses Merkmal der F-Verteilung ähnelt der Chi-Quadrat-Verteilung
  3. Die F-Verteilung ist rechtsschiefe Verteilung. Somit ist unsymmetrisch. Dieses Merkmal der F-Verteilung ähnelt der Chi-Quadrat-Verteilung.
  4. Die F-Verteilung setzt sich aus den Quotienten zweier Chi-Quadrat-Verteilter Zufallsvariablen zusammen. Sie besitzt als Parameter zwei unabhängige Freiheitsgrade und bildet so eine eigene zwei-Parameter-Verteilungsfamilie.
30
Q

2.5 Statistische Tests

  1. was bedeutet der p-wert?
  2. was ist die Entscheidungsregel für das Verwerfen der Nullhypothese?
  3. wenn verwerfe die Nullhypothese?
  4. wenn verwerfe die Nullhypothese nicht?
A

Entscheidungen in statistischen Tests werden basierend auf den p-Werten getroffen.

  • Der p-Wert gibt die Wahrscheinlichkeit an, vorliegende oder extreme Versuchsausgänge zu beobachten, wenn die Nullhypothese zutrifft.
  • Die Entscheidungsregel für das Verwerfen der Nullhypothese lässt sich dann, analog zum Vergleich des beobachteten Wertes der Prüfgröße mit dem Schwellenwert, an Hand des Vergleiches des p-Wertes mit dem Signifikanzniveaus α:
  • verwerfe die Nullhypothese, falls gilt: p ≤α
  • verwerfe die Nullhypothese nicht, falls gilt: p>α
31
Q

2.5 Statistische Tests

  1. mit wachsendem Stichprobenumfang, wie verändert Fehler 1. Art und Fehler 2. Art?
  2. Warum?
  3. was ist die Macht (Power) eines Tests?
A

Dies bedeutet, dass bei vorgegebenem Fehler 1. Art und wachsendem Stichprobenumfang die Wahrscheinlichkeit für einen Fehler 2. Art kleiner wird.

Mit wachsendem Stichprobenumfang steigt also die Chance, Abweichungen von der Nullhypothese auch zu entdecken.

Die Wahrscheinlichkeit für die korrekte Ablehnung der Nullhypothese nennt man die Macht (Power) eines Tests:

POWER = 1-„Wahrscheinlichkeit für einen Fehler 2. Art“ = Wahrscheinlichkeit für die korrekte Verwerfung der Nullhypothese.“

32
Q
  1. Analytische Biostatistik
  2. was bedeutet α und ß?
  3. α 一般是多少?was kann man wissen aus α?
  4. ß 可以确定吗?
  5. α und ß的关系?
A
  1. α: Ablehnung, aber die Nullhypothese ist wahr. ß: Annahme, aber die Nullhypothese ist falsch
  2. α in der Biostatistik üblich bei 5%, ausnahmsweise 1%, 0,1% oder 10%.
  3. Aus α ergibt sich der Annahmebereich und der Ablehnungsbereich (kritischer Bereich) der Nullhypothese
  4. Wenn die Alternativhypothese nicht explizit angegeben wird, kann ß nicht bestimmt und nicht angegeben werden.
  5. Je kleiner ist α, umso größer der Annahmebereich der Nullhypothese und umso seltener wird diese abgelehnt. Dies führt aber dazu, dass sie auch angenommen wird, obwohl Alternativhypothese richtig ist.
  • ß kann insbesondere bei kleinen Stichproben sehr groß werden. Daher muss man die Annahme der Nullhypothese – wenn die Alternativhypothese nicht exakt aufgestellt ist – sehr vorsichtig formulieren: “Die Nullhypothese kann auf dem Signifikanzniveau α nicht verworfen werden”. .
  • Zeichnet man α gegen 1-ß auf, so entsteht die sog. ROC-Kurve (Receiver Operating Characteristic), die ein sehr informatives Maß für die Testgüte ist (Abhängigkeit der WS von richtig positiven Entscheidungen vs. Ws von falsch positiven Entscheidungen).
33
Q

2.5 Statistische Tests

  • 1-Stichproben-t-Test
  • Wilcoxon-Test (Rangsummen-Test)
A
34
Q

2.5 Staistictest

A

Zur Durchführung eines statistischen Tests kann diese allgemeine Vorgehensweise Anwendung finden:

  1. Hypothesenbildung
  2. Signifikanzniveau festlegen
  3. Schwellwerte Annahme-/Ablehnungsbereich ablesen
  4. Testgröße berechnen
  5. Prüfen, ob Testgröße im Annahme-/Ablehnungsbereich
  6. Interpretation
35
Q
A
36
Q

2.5 Statistische Tests

  • 1-Stichproben-t-Test
  • Wilcoxon-Test (Rangsummen-Test)
A
37
Q
  1. 6 Analyse stochastischer Signale
  2. 6.1 Stationarität
  • was dedeutet Stationarität?
  • was ist strenge Stationarität?
  • was ist schwache Stationarität?
  • Es gibt keinen starre Test für strenge Stationarität. Es kann lediglich auf schwache Stationarität getestet werden. wie?
A
  • Zeitsignale werden als stationär bezeichnet, wenn Kennwerte und Kennfunktionen unabhängig von der Zeit t bzw. der Frequenz f sind. Wenn man das Zeitfenster verschiebt, diese Kennwerte und Kennfunktionen ändern sich bei stationären Signalen also nicht,
  • Folglich können nur zeitlich unbegrenzte Signale stationär sein.
  • Die strenge Stationaritätsbedingung verlangt, dass alle Signaleigenschaften zeitunabhängig sind.
  • Die schwache Stationaritätsbedingung ist erfüllt, falls nur irgendein Kennwert oder eine Kennfunktion, z.B. der arithmetische Mittelwert zeitunabhängig ist.
  • Es gibt keinen ridigen Test auf strenge Stationarität. Es kann lediglich auf schwache Stationarität getestet werden.
    • Statistischer Test der Daten: meist Run-Test (Wald-Wolfowitz). Testen der zeitlichen Invarianz der statistischen Parameter einer Datenreihe.
    • Reproduzierbarkeit der Datenanalyse: Teilen der Zeitreihe in zwei Teilfolgen und Berechnung verschiedener statisticher Paramer für beide Teilfolge.
38
Q

t 检验

A
39
Q

wilcoxon - test

A
40
Q
A
41
Q
  1. Grundlagen der Wahrscheinlichkeitstheorie

Das Gesetz der kleinen Zahlen (Zwei-Drittel-Gesetz)

A

Ein weit verbreiteter Irrtum in der Deutung der Wahrscheinlichkeit besteht darin, dass man davon ausgeht, dass gleich wahrscheinliche Ereignisse auch gleich häufig auftreten werden. An dieser Stelle möge man sich die vorherige Folie in Erinnerung rufen: Die relative Häufigkeit konvergiert auf die theoretische WS erst im Falle sehr vieler Versuche. Im Umkerschluß heißt das, dass bei einer kleinen Zahl der Versuche die Häufigkeit u.U. ganz anders aussehen kann. Und leider tut sie es auch. Sie entspricht nämliche dem Gesetz der kleinen Zahlen, das sich an die Poisson-Verteilung orientiert (lambda=1). Diese wird später detailliert behandelt. Hier sollen nur die Konsequenzen aus dieser Erkenntnis gezeigt werden: Ein Drittel tritt gar nicht ein (daher auch die Bezeichnung Gesetz des einen Drittels), ein Drittel tritt genau einmal ein und sogar die Hälfte der Eintritte passiert mehrfach. Man kann diesen Effekt auch so interpretieren, dass jede – auch noch so unmöglich erscheinende Kombination – auftreten kann (siehe Wiederholungen von Ziffern im Lotto beim Spiel 77 und Super 6). Hierbei ist die Anzahl der Versuche gleich der Anzahl der möglichen Ereignisse. Lambda ist die theoretische Häufigkeit für das Auftreten einer Zahl. Bei 37 Zahlen und 37 Ziehungen also ist Lambda=1.

42
Q
  1. Grundlagen der Wahrscheinlichkeitstheorie

Das Gesetz der großen Zahlen

A
43
Q

1 Einführung

Umgang mit Wahrscheinlichkeiten

A
44
Q
  1. 为什么periodogramm 是 inkonsistent Schätzer?
  2. Was ist inkonsistente Schätzer ?was ist konsistent Schätzer?
  3. 对于konstant Varianz, was ist die Lösungsansatz?
  4. Was ist unterschied zwischen Bartlett und welch Methode?
  5. Was ist die Voraussetzung von periodogramm?
  6. Vorteile der Bartlett/Welch Methode?
  7. Nachteile der Bartlett/Welch Methode?
  8. Bei gleicher Segmentanzahl, welch 和Bartlett 方法有什么区别?
  9. Mit kürzer Fensterlänge, zeitliche Auflösung, spektrale Auflösung, Varianz分别会怎么变?
A
  1. Vergleicht man dasPeriodogramm für unterschiedliche Längen des Signals, dass die Schwankungen unabhängig von der Länge konstant sind.
  2. Beim konsistenten Schätzer nimmt die Varianz mit zunehmenden N ab.
  3. Lösungsansatz ist Mittelung also Moving Average. Mit Hilfe des MA wird das PG geglättet. Durch die Mittelwertbildung nimmt die Varianz ab. Diese Schätzung des PG ist konsistent, da ihre Varianz mit M abnimmt.
  4. Bartlett: Nichtüberlappende Segmentierung.Welch: Überlappende Segmentierung
  5. notwendige Voraussetungen: Stationarität
  6. Vorteil: Durch die Segmentierung Abnahme der Schätzervarianz, dadurch höhere statistische Sicherheit der Schätzung.
  7. Nachteil: Durch die Segementierung kürzeres Fenster, daher schlechtere Frequenzauflösung
    1. größere Fensterlänge bei Welch gegenüber Bartlett, aufgrund der Überlappung. 2. höhere spektrale Auflösung bei Welch gegenüber Bartlett
  8. Mit kürzer Fensterlänge wird die zeitliche Auflösung besser und die spektrale Auslösung schlechter und Varianz gringer.