Extra Flashcards
Wenn man bei einem Test alpha = 0 wählt, kann man niemals einen Fehler begehen.
Richtig/Falsch?
Falsch
Ein einseitiger Test wird- wenn möglich - so aufgebaut, dass die Hypothese, die statistisch zu beweisen ist, als Nullhypothese formuliert wird.
Richtig/Falsch?
Falsch
In den Hypothesen eines statistischen Parametertests wird eine Annahme über die bekannten Verteilungsparameter der Grundgesamtheit formuliert.
Richtig/Falsch?
Falsch
—> UNBEKANNTEN
Die Gütefunktion ist eine Funktion des zu testenden Parameters.
Richtig/Falsch?
Richtig
Wenn bei einem Test auf müh in Wahrheit die Gegenhypothese richtig ist, so ist die Wahrscheinlichkeit für die Verwerfung der Nullhypothese gleich 1 - Beta.
Richtig/Falsch?
Richtig
—> P(„H1“, H1) entspricht 1 - Beta
Bei der Durchführung eines statistischen Tests kann man stets den Fehler 1.Art und den Fehler 2.Art begehen.
Richtig/Falsch?
Falsch
Die Gütefunktion eines Tests lässt sich erst berechnen, wenn die Testentscheidung vorliegt.
Richtig/Falsch?
Falsch
Die Festlegung der Hypothese H0 und H1 beim Signifikanztest muss abhängig vom Stichprobenereignis erfolgen.
Richtig/Falsch?
Falsch
P(„H1“|H0) = ??
alpha
P(„H0“|H1) = ?
beta
P(„H1|H1) = ?
1 - beta
P(„H0“,H0) = ?
1 - alpha
Testergebnis inhaltlich interpretieren.
Standardbeginn: ?
Basierend auf einer Zufallsstichprobe von n=20/z.B. 20 Käse
konnte bei einem Signifikanzniveau von alpha = … statistisch nicht bewiesen/bewiesen werden, dass ….
—> immer auf H1 bezogen!
Welche Gründe könnte es für die Wahl einer verbundenen Stichprobe bei einem Test auf Vergleich zweier Mittelwerte geben? (3)
- weniger Probanden nötig —> weniger Erhebungskosten
- Prüfung auf Varianzhomogenität entfällt
- je stärker beide Untersuchungsgrößen positiv korreliert sind, um so Stärke wird die Varianz der Differenzvariablen reduziert
Var(X-Y) = Var(X) + Var(Y) - Cov(X,Y)
Zweistichprobentest?
Falsch!
Differenztest (abhängig/verbundene Stichproben)
Var(X-Y) = Var(X) + Var(Y)
Zweistichprobentest?
Wahr (unabhängig)
Cov(X,Y) < 0
—> sollte man Zweistichprobentest oder Differenzentest durchführen?
Differenzentest: Var(X,Y) = Var(X) + Var(y) - Cov(X,Y)
Zeichstichprobentest: Var(X,Y) = Var(X) + Var(Y)
Var(X,Y) Zweist. < Var(X,Y) Differenzent.
—> weil bei negativer Cov(X,Y): -(-) = +
Somit: Zweistichprobentest, weil vorhandener Unterschied zwischen µx und µy folglich schneller beim Zweistichprobentest erkannt wird
Cov(X,Y) > 0
—> sollte man Zweistichprobentest oder Differenzentest durchführen?
Differenzentest: Var(X,Y) = Var(X) + Var(y) - Cov(X,Y)
Zeichstichprobentest: Var(X,Y) = Var(X) + Var(Y)
Var(X,Y) Zweist. > Var(X,Y) Differenzent.
—> weil bei positiver Cov(X,Y): -(+) = -
Somit: Differenzentest, weil vorhandener Unterschied zwischen µx und µy folglich schneller beim Differenzentest erkannt wird(?)
Falls Testfunktionen unter H0 des Zweistichprobentests und des Differenzentests jeweils t-Verteilt sind und nx = ny = nD < 16
Welcher Annahmebereich ist dann größer?
Zweistichprobentest f= nx + ny -2
Differenzentest f= nD -1
—> also Anzahl der Freiheitsgrade beim Zweistichprobentest doppelt so groß wie beim Differenzentest
—> alpha Fraktile der t-Verteilung werden mit wachsenden Freiheitsgraden kleiner!
—> daher:
Annahmebereich (Zweist.) < Annahmebereich (Diff.)
Welchen Test sollte man wählen?, wenn…
Annahmebereich Zweistichprobentest
<
Annahmebereich Differenzentest
—> Zweistichprobentest
—> denn kleinerer Annahmebereich = kleineres Fehlerrisiko 2.Art
Die Summe von zwei unabhängigen und gleichverteilten Zufallsvariablen ist nicht wieder gleichverteilt
Wahr/Falsch?
Wahr
Eine Zufallsvariable heißt stetig, wenn ihr Wertebereich abzählbar unendlich ist.
Wahr/Falsch?
Falsch!
Sei X eine stetige Zufallsvariable mit der Verteilungsfunktion F(x), die für x <= 0 gleich Null ist.
Dann gilt F(x = 0,75) - F(0) = 0,75
Wahr/Falsch?
Wahr
Während der Erwartungswert einer stetigen Zufallsvariable durchaus negative Werte annehmen kann, können sich für die Standardabweichung einer stetigen Zufallsvariable niemals negative Werte ergeben.
Wahr/Falsch?
Wahr
Der allgemeine Fall eines zweistufigen Auswahlverfahren lässt sich folgendermaßen charakterisieren: Teilerhebung im 1. und 2. Auswahlvorgang.
Wahr
Die TSCHEBYSCHEFF’sche Ungleichung lässt sich auch dann anwenden, wenn die betrachtete Zufallsvariable normalverteilt ist.
Wahr
—> beliebig verteilt
((—> beliebig verteilt auch Stichwort für Ungleichung von Tschebyscheff, bzw. gar keine Angaben zur Verteilung —> beliebig verteilt))
Maximum-Liklihood-Methode (ML)
Welcher Parameter klein teta wird zur Schätzung gewählt?
der Parameter klein teta für den (vornherein) das Zustandekommen der vorliegenden Stichprobe am plausibelsten ist
Maximum-Likelihood-Methode
L = (entspricht)
Eintrittswahrscheinlichkeit der vorliegenden Stichprobe in Abhängigkeit von klein teta
Voraussetzungen für Maximum-Likelihood-Methode? (2)
- einfache Stichprobe
- Verteilungstyp in Abhängigkeit von klein teta muss bekannt sein
Eigenschaften des Maximum-Likelihood-Schätzers: ?
3
- mindestens asymptotisch erwartungstreu
- konsistent, suffizient
- asymptotisch wirksamst
Vorgehensweise Maximum-Likelihood-Methode: ?
—> 5 Schritte
1) L-Fkt.- aufstellen
2) Logarithmieren
3) ableiten nach klein teta
4) umstellen nach teta Dach
5) ML Schätzer (groß teta Dach) aufstellen
KQ (Kleinste Quadrate Methode)
Voraussetzungen: ? (2)
- einfache Stichprobe
- Erwartungswert müh(klein teta) in Abh. von klein teta ist bekannt
Eigenschaften der KQ-Methode: (2)
- erwartungstreu
- unter allen linearen, erwartungstreuen Schätzfkt. wirksamst
Vorgehensweise KQ-Methode: (5)
1) Q-Fkt. aufstellen
2) Ableiten nach klein teta
3) nach klein teta umstellen
4) KQ-Schätzer(groß teta Dach KQ) bestimmen
gängige Schätzfunktionen(von groß Teta Dach):
Müh =
Pi =
Omega^2 =
Lambda (Poissonverteilung) =
Lambda (Exponentialverteilung =
müh = X quer
Pi = Y / n
Omega^2 = S^2 (ungleich Z^2)
Lambda (PV) = X quer
Lambda (EV) = 1 / X quer
—> beste Schätzfkt. um Parameter zu schätzen
—> wenn Parameter eh schon bekannt, dann nicht X quer verwenden
Var(a * x) =
Var( Summenzeichen x) =
Var(n * x) =
Var(X +a) =
Var(a * x) = a^2 Var(x)
Var( Summenzeichen x) = Summenzeichen * Var(x)
—> … = n* Var(x)
Var(n * x) = n* Var(X)
Var(X +a) = Var(x) mit a Element von R
Die Frage der „Güte“ lässt sich stets für Schätzfunktionen, aber nicht für Schätzwerte beurteilen.
Wahr
Klein teta = r^2 * pi
E(groß teta Dach) = (pisigma^2) / n + pir^2
- erwartungstreu?
- asymptotisch erwartungstreu?
Nicht erwartungstreu, da ungleich r^2* pi
ABER: asymptotisch erwartungstreu, da:
lim E(groß teta Dach) = r^2* pi = klein teta n —> unendlich
Alle Schätzfunktionen unterschätzen die wahren Parameter!
Wahr
ln(a*b) =
ln(a) + ln(b)
ln a^1/n =
1/n ln a
Stichprobenfunktion
Teta Dach = 1/3 * ( 2*X1 + X3)
Was entspricht dies?
———————-
erwartungstreu? (Rechenweg)
X quer gewichtet
(X* = 2 < n )
——————-
E(1/3*(2X1 + X2)) = E(2/3X1 + 1/3X2) =(identisch) E(X) = müh
—> erwartungstreue Schätzfunktion auf müh
E(Xi) = E(x) , falls?
falls Xi identisch
oft Xi i.i.d
Var( 1/3 Summenzeichen Xi) =
(1/3)^2 * Summenzeichen (i=1 bis n) * Var(Xi)
=(falls unabhängig + identisch, oft Xi ~ i.i.d) =
1/9 * 3 * Var(X) = omega^2 / 3
Var(Xi) = Var(X), falls ?
falls unabhängig + identisch
Oft Xi ~ i.i.d
1/4 Var(X2) + 1/4 Var(X3) = falls unabhängig und identisch = ?
1/2 Var(x)
Wie kann man Konsistenz überprüfen?
Voraussetzung?
Voraussetzung: asymptotisch erwartungstreu
Lim(n—> unendlich) MSE(groß teta Dach)
= lim(n —> unendlich) von berechneter Varianz bzw. Var(groß Teta Dach)
= 0
(siehe zum Bsp. J2 und mehr Block J)
Ist Xquer gewichtet konsistent?
kommt wohl drauf an
Eine Schätzfunktion ist umso effizienter , je kleiner die Streuung(VARIANZ!) der Schätzwerte um den Parameter ist
Varianten vergleichen, kleinste Varianz
—> ?? am effizientesten
Schätzfunktion
X quer wirksamster Schätzer für müh, aber nicht ?
robust, weil Schwäche für Ausreißer
Man kann robuste und effiziente Statistik gut miteinander vereinen
Falsch oft Frage ob man effiziente oder robuste Statistik will
Beste Schätzfunktion mit den Eigenschaften?
Erwartungstreue, Konsistenz, Effizienz(wirksamst), Suffizienz
Wann ist ein Schätzwert suffizient (erschöpfend)?
Wenn er alle in den Daten einer Stichprobe enthaltenen Informationen berücksichtigt.
δ (unbekannte Gesamtzahl) =
N * pi
N*pi = ?
δ
δ/N =
pi
Groß Teta Dach1= N/n Summenzeichen(i=1 bis n) Xi
Groß Teta Dach2 = N/2 * (X1 + Xn)
Welche der beiden Stichprobenfunktionen ist suffizient?
Groß Teta Dach1
—> weil beinhaltet alle Informationen der Stichprobe
—> anderer beinhaltet nur X1 und Xn
Welcher von beiden ist der bessere Schätzwert?
Die Frage der Güte lässt sich nicht für Schätzwerte beurteilen!
—> nur für SchätzFUNKTIONEN
Die Frage der „Güte“ bzw. welcher ist besser lässt sich nur für Schätzfkt. nicht aber für Schätzwerte beurteilen
Wahr
Wie konstruiere ich Schätzfunktion?
- Maximum Likelihood
- Kleinste Quadrate
- Momentenmethode
asymptotische Erwartungstreue überprüfen
vs.
Konsistenz überprüfen
Wie?
asymptotisch:
lim (n —> unendlich) E(groß Teta Dach) = klein teta
—> Erwartungswert der Schätzfkt. konvergiert gegen echten Parameter klein teta
Konsistenz:
lim(n —> unendlich) Var(groß Teta Dach) = 0
Varianz der Schätzfunktion möglich gering (gegen Null)
z.B. MSE (X quer) = 0
Maximum-Likelihood + KQ-Schätzer
—> Aufgabe J6 machen!!!!!!
….
Wie überprüft man ob Schätzfunktionen unverzerrt sind?
Man überprüft ob sie erwartungstreu sind.
Löse Var(U + 2V) falls U und V nicht unabhängig:
Var(U) + Var(2V) + Cov (U,2V) (+ Cov weil +2V)
= Var(U) + 2^2 Var(V) + 2^2 Cov(U,V)
Wenn man schauen will welche Schätzfunktion wirksamer ist. Auf den ersten Blick ist es allerdings nicht direkt erkennbar welche Varianz kleiner ist.
—> Was tun?
Var(groß Teta Dach) - Var(groß Teta Dach)
—> schauen ob negativer Wert rauskommt oder nicht
J8 Aufgabe rechnen
—> leicht + Maximum-Likelihood mit Exponential
…
Man entscheidet sich stets für diejenige Verteilung unter der die vorliegenden Beobachtungswerte am ehesten zustande kommen (am wahrscheinlichsten ist)
—> Maximierung der Likelihood
Wahr/Falsch
Wahr
—> schaue unbedingt J10 an!
—> perfektes Beispiel, da auch tabellarische Wahrscheinlichkeitsverteilung damit gemeint!
—> bei kleinste Quadrate nimmt man die kleinste aufsummierte quadratische Abweichung zws. Beobachtungswert und geschütztem Wert(Verteilung mit kleinster errechneter Wert)
MC:
Das „Mean Square Error - Konzept“ betrachtet den mittleren tatsächlichen Schätzfehler einer Schätzfunktion.
Wahr/Falsch?
Falsch !
Eine Likelihoodfunktion L(teta) kann auch negative Werte annehmen.
Wahr/Falsch?
Falsch!
Kann KEINE negativen Werte annehmen!
Eine Schätzfunktion, die weder erwartungstreu noch asymptotisch erwartungstreu ist, ist auch nicht konsistent.
Wahr/Falsch?
Wahr
Wegen Bias im MSE ?
Die Maximum – Likelihood - Methode besagt, dass zu einem festen Stichprobenergebnis (x1, x2, … ,xn) derjenige Schätzwert für den unbekannten (zu schätzenden) Parameter θ zu wählen ist, unter dem im Nachhinein die Wahrscheinlichkeit für das Eintreten dieses Stichprobenergebnisses am größten ist.
Wahr/Falsch?
Falsch!
—> ohne Beachtung des oberen: die Verteilung für welche die vorliegenden Beobachtungswerte am wahrscheinlichsten sind
(Likelihood am größten ist!)