Biostatistik Klausur Flashcards

1
Q

Aufgabe 1.

Das Konfidenzintervall gibt den aus n Realisierungen berechneten Wertebereich an, der mit einer vorgegebenen Irrtumswahrscheinlichkeit 𝛼 den zu schätzenden wahren Wert einschließt. Die Breite des Konfidenzintervalls ändert sich in Abhängigkeit von der Anzahl der Realisierungen n und von der Irrtumswahrscheinlichkeit 𝛼. Erläutern Sie diese Abhängigkeit qualitativ. [5P]

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Aufgabe 2.

Die Lage einer empirischen Verteilung kann mit dem arithmetischen Mittelwert (AMW), mit dem getrimmten Mittelwert (GMW) oder mit dem Median (MED) geschätzt werden. Wählen Sie eine empirische Verteilung (Zahlen oder Häufigkeitsdichte) und erläutern sie die Eigenschaften der genannten Lagemaße in Bezug auf ihre Robustheit. Welcher der Maße eignet sich für lineare Analyse und warum? [5P]

A
  • Doppelt exponentielle unsymmetrisch ZG
    • Am besten kommt der Median in die Nähe von das Maximum Allerdings ist der Median ein nichtlineares Maß.
    • Der AWM liegt weit entfernt vom Median und charakterisiert die Lage der Verteilung nur schlecht.
    • getrimmten MW: je höher der Anteil der abgewiesenen Werte ist, umso mehr nähert man sich dem Median.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Aufgabe 3.

Der Korrelationskoeffizient nach Spearman (SPR) kann im Unterschied zu dem nach Pearson (PER) nichtlineare Zusammenhänge schätzen. Erläutern Sie die Voraussetzungen für die Verwendung von SPR, die beim PER nicht erfüllt sind. [5P]

A
  • Die zu korrelierenden Größen sind mindestens ordinal skaliert.
  • Der Zusammenhang ist monoton.
  • Voraussetzungen von KK nach Spearman:
    • Keine Normalverteilung der Daten notwendig
    • Monotone nichtlineare Zusammenhänge erfassbar
    • Die zu korrelierende Daten sind mindestens ordinal skaliert.
  • Voraussetzungen von KK nach Pearson:
    • Normalverteilung der Daten
    • Die Punktwolke sind linearen Zusammenhang
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Aufgabe 4.

Erläutern Sie die Voraussetzungen zur Anwendung des Zentralen Grenzwertsatzes (ZGWS)! Der ZGWS kann auch auf Prozesse angewandt werden (Biosignale). Welche Eigenschaft muss theoretisch ein solcher Prozess aufweisen hinsichtlich seines Spektrums? [5P]

A
  • Voraussetzungen:
    • n ist sehr groß
    • Xi sind unabhängig und identisch verteilt Zufallsvariablen.
  • Sie Summe einer großen Anzahl von Zufallsvariablen ist normalverteilt. Das gilt unabhängig davon, wie die ZV selbst verteilt sind.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Aufgabe 5.

Es ist bekannt, dass 100 von 10000 Personen eine bestimmte Krankheit haben, ohne es zu wissen. Zur Früherkennung dieser Krankheit wird ein Untersuchungsverfahren angewendet, welches folgende Fehlerquellen aufweist: es werden 5 % aller Personen, die krank sind ohne es zu wissen nicht als krank erkannt. Jedoch werden 20 % aller untersuchten Personen als krank eingestuft, obwohl sie nicht krank sind. [10P]

Erstellen Sie ein Baumdiagramm und die Vierfeldertabelle!

Wie groß ist die Wahrscheinlichkeit, dass bei einer Untersuchung eine als krank eingestufte Person nicht an dieser Krankheit leidet und wie groß ist die Wahrscheinlichkeit, dass eine vermeidlich gesunde Person dennoch erkrankt ist.

Wie groß sind Sensitivität, Spezifität und der positive Vorhersagwert? Was sagen diese Werte aus?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Aufgabe 8.

Die Verpackung des Blutfettmedikamentes AntiFett soll einen mittleren Wirkstoffgehalt von 15 mg pro Tablette aufweisen. Es wurde eine Stichprobe von 100 Tabletten getestet. Dabei ergaben sich ein mittlerer Wirkstoffgehalt von 14 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf dem 1%-igen Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Wirkstoffgehalt im Mittel unter 15 mg liegt? Erläutern Sie in Stichpunkten: Welchen Test wählen Sie und warum, wie gehen Sie vor. [10P]

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Aufgabe 6.

Der t-Test einer Stichprobe mit einem Umfang von N=15 lehnt die Nullhypothese ab, ein Rangsummentest lehnt sie nicht ab. Welches Ergebnis ist sicherer? Begründen Sie Ihre Vermutung! [10P]

A
  • Kann man nicht einschätzen, da die Alternativhypothese nicht überprüfbar ist. (N=20)
  • Der Rangsummentest , weil er bei kleinen Stichproben robuster ist (nur wenn N=17 ) (für Husar ist 17 scheinbar eine kleine und 20 eine große Stichprobe)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Aufgabe 7.

Es wurde untersucht, ob die Schlafzeit tatsächlich mit dem Alter zusammenhängt. Dazu wurden jeweils 100 zufällig ausgewählte Probandinnen und Probanden in den Altersgruppen 20 bis 30 Jahre und 60 bis 70 Jahre befragt. Die Schlafzeiten betrugen im Mittel 7 Stunden in der jüngeren Gruppe und 5.5 Stunden in der älteren Gruppe, wobei die Standardabweichung in etwa gleich war und 2 Stunden betrug. Der t-Test ergab, dass zu einem Signifikanzniveau von 5% die Nullhypothese abzulehnen ist, d.h. die Schlafzeiten sind unterschiedlich. Im Ergebnis wurde auch der p-Wert von 0.002 geliefert. Interpretieren Sie diesen Wert in Stichpunkten. Könnte man den t-Test unter dem Signifikanzniveau von 0.002 wiederholen? Begründen Sie Ihre Interpretation. [10P]

A
  • P-Value gibt die WS an, mit der der berechnete t-Wert oder ein größerer Wert auftritt.
  • Ist er niedriger als a, liegt tp rechts (links im negativen Bereich) vom kritischen Wert und die Nullhypothese ist zu verwerfen
  • Der p-Wert kann auch als Signifikanz der Nullhypothese interpretiert werden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

SS2011 7.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

SS2011 8.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

SS2011 9.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

SS2011 10.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

1.

Das Gesetz der kleinen Zahlen besagt, dass bei einer kleinen Anzahl von Versuchen in einer Grundgesamtheit mit gleich wahrscheinlichen Elementarereignissen…

(A) Alle Ereignisse etwa gleich häufig eintreten

(B) Etwa ein Drittel der Ereignisse nicht eintritt

(C) EtwadieHälftederEreignissenichteintritt

(D) Etwa zwei Drittel der Ereignisse nicht eintritt

A

B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

2.

Der Median als Lageschätzer einer empirischen Verteilung ist sehr robust, weil:

(A) Er aus dem arithmetischen Mittelwert durch 10%iges Trimmen berechnet wird

(B) Er aus dem arithmetischen Mittelwert durch 80%iges Trimmen berechnet wird

(C) Er nur aus den Vorzeichen der empirischen Daten ermittelt wird
(D) Er aus der Rangfolge der empirischen Daten ermittelt wird

A

D

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

3.

Der zentrale Grenzwertsatz wird angewandt, um aus den Realisierungen von Zufallsvariablen eine normalverteilte Statistik zu erhalten. Die zu erfüllenden Vorraussetzungen lauten: Die Zufallsvariablen müssen:

(A) Normalverteilt und unabhängig

(B) Unabhängig und identisch verteilt

(C) Symmetrischverteiltundabhängig

(D) Abhängig und diskret sein.

A

B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Das Konfidenzintervall gibt den aus n Realisierungen berechneten Wertebereich an, der mit einer vorgegebenen Irrtumswahrscheinlichkeit α den zu schätzenden wahren Wert einschließt. Die Breite des Konfidenzintervalls nimmt mit…

(A) n und α zu

(B) n ab und α zu

(C) n und α ab

(D) n zu und α ab

A

C

19
Q

Der getrimmte Mittelwert mit 75%igem Trimmen als Lageschätzer einer empirischen Verteilung ist:

(A) robuster als ein getrimmter MW mit 95%igem Trimmen

(B) robuster als ein getrimmter MW mit 66%igem Trimmen

(C) robuster als der Median
(D) weniger robust als der arithmetische MW.

A

B

20
Q

Mit welchem statistischen Maß kann eine exponentiell verteilte Messgröße unter Anwendung des Zentralen Grenzwertsatzes auf eine normalverteilte Statistik überführt werden?

(A) Standardabweichung
(B) Median
(C) 75%igesQuantil
(D) Arithmetischer Mittelwert

A

D

21
Q

Der Korrelationskoeffizient nach Spearman kann nichtlineare Zusammenhänge identifizieren. Dabei muss die Bedingung erfüllt sein, dass…

(A) Der Zusammenhang nichtlinear ist
(B) Die Zufallsgrößen logarithmisch gleichmäßig verteilt sind (C) DerZusammenhangmonotonist
(D) Die Zufallsgrößen diskret sind

A

C

22
Q

Ein Konfidenzintervall hängt mit seinen Parametern von der aktuellen empirischen Stichprobe ab. Die Breite des Intervalls nimmt ab, wenn…

(A) Der Stichprobenumfang zunimmt und die Streuung abnimmt

(B) Die Streuung und die Schätzunsicherheit abnehmen
(C) Die Streuung zunimmt und der Stichproben umfang abnimmt
(D) Der Stichprobenumfang zunimmt und die Schätzunsicherheit abnimmt

A

A

23
Q

Ein t-Test, einer Stichprobe mit dem Umfang N=20 lehnt die Nullhypothese ab, ein Rangsummentest nimmt sie an. Welcher der beiden Tests ist sicherer?

(A) Der t-Test, weil er nach dem zentralen Grenzwertsatz zuverlässig ist.

(B) Kann man nicht einschätzen, da die Alternativhypothese nicht überprüfbar ist. (N=20)

(C) Der Rangsummentest, weil er bei kleinen Stichproben robuster ist (nur wenn N=17 )( für Husar ist 17 scheinbar eine kleine und 20 eine große Stichprobe)

(D) Beide sind zuverlässig, die Entscheidung liegt im Ermessen des Analytikers.

A

BC

24
Q

Normierung ist notwendig, um Daten und ihre Maße vergleichen zu können. Sie kann aber zu Falschinterpretationen führen, weil…

A

C

(A) Physikalische Einheiten nicht berücksichtigt werden
(B) Man den Bezug zum Wertebereich der Originaldaten verliert,
(C) Einzelne absolute Änderung in Originaldaten auf allen normierten Daten wirkt.

(D) Die Auflösung zwischen 0 und 1 zu grob ist.