Statistik Flashcards
Stetige Verteilung (Bezeichnung) und Bedeutung
Bezeichnung: Wahrscheinlichkeitsverteilung; Dichtverteilung; Dichtefunktion; WS-Dichte
Bedeutung: Die Ergebnismenge besteht aus unendlich vielen möglichen Ergebnissen (Einzelne Ergebnisse nicht bestimmbar)
Die Gesamtfläche unter der Kurve (Stetige Verteilungen) ist.. . Was bedeutet das?
1 - Das ein Ergebnis mit einer Wahrscheinlichkeit von 1 eintritt
Die Fläche über (zwischen) einem Intervall gibt an..
Mit welcher Wahrscheinlichkeit Werte innerhalb dieses Intervalls eintreten
a bis b = deltaX
Stetige Verteilungen werden in Kurven symbolisiert:
Gleichverteilung
Normalverteilung
Exponentialverteilung
Wie nennt man den griechischen Buchstaben vom Mittelwert, Standardabweichung in einer Normalverteilung und was bedeutet Pi
Sigma 𝜎 (Standardabweichung) und Mu 𝜋 (Mittelwert)
Pi ist die Kreiszahl (3,14..)
Anders als in der Binomialverteilung
Die Normalverteilung dient im theoretischen Modell für die Verteilung von.. . Welche Verteilungen lassen such von ihr herleiten und welche konvergieren gegen sie?
Stichprobenkennwerten
Zufallsfehlern
(manchen) empirischen Merkmalen
-> X² , t, F
->Binomial, Poisson konvergieren gegen sie (nähern sich ihr an)
Wie kann man die Normalverteilung in eine Standardnormalverteilung bringen?
Was verändert sich?
Welche Formel wendet man da an?
Mithilfe der z-Transformation
Sigma 𝜎 nimmt 1 an und
𝜇 = 0.
z=(x-𝜇)/𝜎
Wie wird die Dichtefunktion angegeben?
f(z)
Wie wird Verteilungsfunktion angeben?
F(z) –> Fläche von -∞ bis z
Perzentil - definition
Ein Wert, der p% der Fläche einer Verteilung links abschneidet
Was ist das 50%-Perzentil?
der Median (zp= 0)
Perzentil 95% =? der Standardnormalverteilung
zp = 1,65
Perzentil 97,5% =? der Standardnormalverteilung
zp = 1,96
In einem Experiment mit einer stetigen Variable besteht die Ergebnismenge aus..
unendlich vielen möglichen Ergebnissen.
Die Wahrscheinlichkeit einzelner Ergebnisse lässt sich nicht bestimmt
Warum nimmt die Normalverteilung eine zentrale Stellung unter den theoretischen Verteilungen an?
Weil sich verschiedene Verteilungen von ihr herleiten und andere gegen sie konvergieren (binomial, poisson)
Nenne eine diskrete und eine stetige Verteilung und erläutere wozu sie dienen!
Stetig : Normalverteilung
Diskret: Binomialverteilung
Sie dienen als Modelle für Stichprobenverteilungen
Quantitative Variablen
Messbar (Zahlen), Angstskala,
Qualitative Variablen
Medium der Sprache (Kategorien), Wie fühlt sich Angst an?
Operationalisieren
Prozess, latente Konstrukte messbar machen
Per-fiat Messung
Messen durch Glauben, Vertrautheit auf die geeignete Wahl des Skalenniveaus
Modus, Modi
Wert, der am häufigsten vorkommt
Median
Teil die nach Größe geordneten Merkmalsverteilungen in zwei gleich große Teile
Streuungsmaße - worüber geben sie Auskunft?
Geben Auskunft über die Variabilität der Werte
Varianz
Streuung der Daten um einen Mittelwert
Korrelation
Kausale Bezeichnung zwischen zwei Variablen. Je mehr von dem einen, desto mehr von dem anderen. Haben wir eine Korrelation r=1, ist der Zusammenhang perfekt
Formel der Regressionsgeraden
y-dach i= a+b x xi
Die Regressionsgerade liegt dort, …
wo die Summe der quadrierten Abweichungen minimal ist (Um Möglichst genaue Vorhersagen treffen zu können) = Kriterium der kleinsten Quadrate
Wozu benutzen wir die bivariate lineare Regression?
Um Vorhersagen treffen zu können
Was bezeichnet man als den Laufindex?
Die Variable die vorhergesagt wird oder vorhersagt
Was sind Residuen?
Wie werden sie angegeben?
Residuen sind die Schätzfehler. Der Wert, um den die Vorhersage, den echten Wert über oder unterschätzt.
y* = Residuen
Was ist die Fehlervarianz? Wie gibt man diese an?
Die Summe aller Schätzfehler
= s^2y*
Wie gebe ich die Regressionsvarianz an
s^2y-dach
Wie gebe ich die Gesamtvarianz an?
s^2y
Welchen Wert kann der Determinationskoeffizient maximal annehmen?
R^2 = 1
Aufgeklärte Varianz. Formel und Definition
R^2 = Regressionsvarianz/ Gesamtvarianz
Der Determinationskoeffizient ist ein Maß dafür, wie viel der Varianz der AV durch die UV “aufgeklärt” werden kann.
Je höher der Wert, umso besser”
F-Statistik
Regessionsvarianz/ Fehlervarianz > 1 = gutes Modell (weniger Fehler)
Wovon sprechen wir bei Stichproben, wenn wir Mittelwert &Co. benennen?
Kennwerte ( h; x-quer; s^2, r)
Wovon sprechen wir bei einer Population, wenn wir Mittelwert & Co. benennen?
Parameter
Eigenschaften von einer Normalverteilung
- x= 𝜇±𝜎
- Glockenförmiger Verlauf
- symmetrie (Modus, Median, Mittelwert fallen zusammen)
- 2/3 der Gesamtfläche zwischen Wendepunkten
- Die Verteilung nähert sich asymptotisch der x-Achse (schneidet niemals die x-Achse) (WICHTIG MERKEN!!)
Was ist der Standardfehler?
Ein Gütemaß/ Standardschätzfehler - Streuung (Standardabweichung ) der Stichprobenkennwerteverteilung des Kennwertes
Der Mittelwert des Standardfehlers hängt wovon ab und berechnet man mit welcher Formel?
Von der Populationvarianz und der Stichprobengröße
𝜎=√𝜎²/n
Nenne die Formel: Standardfehler des Schätzers des Mittelwerts
𝜎̂=√∑ (𝑥𝑖 −𝑥̅)²/ 𝑛 ∙ (𝑛 − 1) –> also den Varianzparamerter des erwartungstreuen Schätzers (Population)
“Schätzungen eines Wertes” nennt man
Punktschätzung
“Schätzungen eines Wertebereiches”
Intervallschätzung
Was ist die wesentliche Eigenschaft von Schätzern und wann ist ein Schätzer erwartungstreu?
Was sollte bestmöglich ein Schätzer aufweisen?
Die Erwartungstreue (Unverzerrtheit) –> E(𝜃) = 𝜃 dann ist der Schätzer erwartungstreu
Eine möglichst kleine Varianz
Das Schwankungsintervall (Definition)
Ist ein Lage und Breite fester Bereich und gibt an, wie ein Stichprobenkennwert mit einer bestimmten Wahrscheinlichkeit 1-ɑ fällt
Konfidenzintervall des Mittelwerts (Definition)
Ist ein in Lage (oder Lage und Breite) zufälliges Intervall, welches den unbekannten Parameter (z.B. den Populationsmittelwert) mit Wahrscheinlichkeit 1 − 𝛼 überdeckt
Was bezeichnet man als Konfidenzniveau?
1-ɑ
Wann wird die H0 zurückgewiesen?
Wenn die Wahrscheinlichkeit unter der Annahme der H0 sehr gering ist. Dann wird H1 angenommen
Wann konvergiert die Binominalverteilung gegen die Normalverteilung?
Mit steigendem n
Wie lautet der zentrale Grenzwertsatz?
Verteilungen von Summen bzw. Mittelwerten aus Stich- proben des Umfangs n, die sämtlich derselben Grundge- samtheit entnommen werden, gehen mit wachsendem Stichprobenumfang in eine Normalverteilung über.
-> Nicht Teil des Grenzwertsatzes = n ≥ 30 hinreichend