Daten & Zufall: Definitionen Flashcards
Kombinatorik
Die Kombinatorik beschäftigt sich mit der Anzahl der möglichen Anordnungen bei einem Versuch, wobei sie unterscheidet, ob die Reihenfolge von Bedeutung ist oder nicht und ob Wiederholungen (Zurücklegen) zugelassen werden oder nicht.
Grundsituationen
2 Fragen:
1. Spielt die Reihenfolge eine Rolle? (Ja/Nein)
2. Ist die wiederholung erlaubt? (Ja/Nein)
-> Daraus entstehen die 4 Grundsituationen
Binominalkoeffizient
n über k
(zur Lösung von Aufgaben vom Grundtyp “ohne Reihenfolge, ohne Wiederholung”)
Permutation
Unter einer Permutation versteht man die verschiedenen Anordnungen von Elementen einer Grundmenge, wobei in jeder Anordnung alle Elemente der Grundmenge berücksichtigt werden müssen.
Fakultät
n! = n * (n-1) * (n-2) * …
k-Menge
Notation:
In geschweiften Klammern {} werden mit Komma getrennt die Möglichkeiten angegeben.
-> Reihenfolge spielt keine Rolle
Bsp. {3, 2, 1} ist dieselbe Menge wie {1, 2, 3}
Mehrstufige Zufallexperimente
Mehrstufige Zufallsexperimente sind Zufallsexperimente, die aus mehreren Schritten bestehen, die für sich selbst auch Zufallsexperimente sind.
Ergebnisraum
Menge aller möglichen Ergebnisse aus einem Zufallsexperiment. Wird mit Ω bezeichnet.
Ereignis
Man betrachte ein Zufallsexperiment mit der Ergebnismenge Ω. Unter einem Ereignis E versteht man eine beliebige Teilmenge von Ω.
Vereinigung
Das zusammengesetzte Ereignis A ∪ B lässt sich also sprachlich durch A oder B tritt ein ausdrücken.
Schnittmenge
Das Ereignis A ∩ B lässt sich also sprachlich durch A und B treten beide zusammen ein ausdrücken.
Gegenereignis
Ereignis das dem zu erreichenden widerspricht. z.B. wird beim Münzwurf anstelle des gewünschten Ereignisses “Kopf” das Gegenereignis “Zahl” abgefragt.
Zum Ereignis A wird das Gegenereignis mit Ā bezeichnet.
Laplace-Experiment
Zufallsexperimente, bei dem jedes Ergebnis mit gleicher Wahrscheinlichkeit eintritt heissen Laplace-Experimente.
Wahrscheinlichkeitsmodell
Wir nutzen für eine reale Situation ein W-Modell, indem wir den Wahrscheinlichkeitsraum festlegen. Es gibt verschiedene Modelle (Laplace, Bernoulli, …)
Laplace-Modell
Ein Laplace-Modell ist ein Wahrscheinlichkeitsraum, bei dem das Wahrscheinlichkeitsmass genau der Anteilsregel entspricht (Anzahl der Günstigen durch möglichen) und man davon ausgeht, dass jedes Ergebnis gleichwahrscheinlich eintritt
Wahrscheinlichkeitsverteilung
Eine Wahrscheinlichkeitsverteilung gibt an, wie sich die Wahrscheinlichkeit auf die verschiedenen Ereignisse Verteilt. Die Funktion P wird gleichbedeutend als “Wahrscheinlichkeitsmass” oder “Wahrscheinlichkeitsverteilung” bezeichnet
Tupel-Schreibweise
Notation: In Klammer mit | getrennt wird geschrieben was Person 1 gewählt / gezogen etc. hat, was Person 1 gewählt / gezogen etc. hat usw.)
Bsp:
(B|D|C|A)
k-Tuple: (ὦ1| ὦ2 | ὦ3…)
Ω = Menge aller k-Tuple
|Ω| = Anzahl aller k-Tuple
-> Reihenfolge spielt hier eine Rolle
Anteilsregel
Betrachten wir die Ergebnisse aus Ω als gleichwahrscheinlich, dann ordnen wir jedem Ereignis E Ω zu -> P(E) = E/Ω
Zählprinzip
Hat man n1 Möglichkeiten die 1. Stelle zu besetzen, n2 Möglichkeiten, die 2. Stelle usw.. schliesslich nk Möglichkeiten die k-te Stelle zu besetzen, dann ist die Anzahl möglicher k-Tupel gliech dem Produkt n1 * n2 * … * nk.
k-Tupel
Tupel sind in der Mathematik neben Mengen eine wichtige Art und Weise, mathematische
Objekte zusammenzufassen. Ein Tupel ist eine Liste endlich vieler, nicht
notwendigerweise unterschiedlicher Objekte. Dabei spielt, im Gegensatz zu Mengen, die Reihenfolge der Objekte eine Rolle.
Wahrscheinlichkeit
Mass das bestimmt, wie sehr erwartet wird das ein bestimmtes Ereignis eintritt.
Statistischer Wahrscheinlichkeitsbegriff
Statistisch ist Wahrscheinlichkeit einen Wert der sich als relative Häufigkeit empirisch bestimmen lässt.
Der Schätzwert heisst statistische Wahrscheinlichkeit des Ereignisses E.
Mathematischer Wahrscheinlichkeitsbegriff
Mathematisch ist “Wahrscheinlichkeit” ein Mass/eine Funktion, die jedem Ereignis einen Wert zwischen 0 und 1 zuordnet und bestimmte Eigenschaften (gemäss der Axiome) besitzt.
Relative Häufigkeit
Das Verhältnis „(absolute) Häufigkeit, mit der das Ereignis E auftritt, im Verhältnis zu der Anzahl n der Versuche“
heisst relative Häufigkeit von E und wird mit hₙ(E) bezeichnet.
Kolmogorow-Axiome
Gegeben ist eine endliche Menge Ω und eine Funktion P, die jeder Teilmenge E von Ω eine reelle Zahl P(E) zuordnet. Erfüllt die Funktion P für beliebige E; E1; E2 C Ω folgende drei Eigenschaften:
- P (E) grösser gleich 0 -> Egal welche Teilmenge eingesetzt wird, die Zahl ist grösser oder gleich 0
- P (Ω) = 1 -> Wenn die Teilmenge eingesetzt wird, die alle Elemente enthält (Omega) ist das Ergebnis = 1
- Wenn E1 ∩ E2 = nicht null dann P(E1 ∪ E2)= P(e1) + P(E2) -> Wenn man zwei Teilmengen nimmt, die disjunkt sind (ohne Überschneidung), dann erhalte ich den Wert bei der Funktion für dieses zusammengesetzte Ereignis als Summe der beiden Teilergebnisse.
dann heisst P Wahrscheinlichkeitsmass , das Paar (Ω P) Wahrscheinlichkeitsraum
Bedingte Wahrscheinlichkeit
Sei (Ω|P) ein Wahrscheinlichkeitsraum und A ein Ereignis mit P(A) > 0. Dann heisst
PA(B) = P(A ∩ B) / P(A)
die bedingte Wahrscheinlichkeit des Ereignisses B unter der Bedingung A.
Stochastische Unabhängigkeit
Sei (Ω|P) ein Wahrscheinlichkeitsraum und für zwei Ereignisse A,B ⊆ Ω
gelte
P(A ∩ B) = P(A) * (P(B).
Dann sind diese Ereignisse stochastisch unabhängig.
-> Information dass Ereignis B eingetreten ist, beeinflusst die Wahrscheinlichkeit des Eintretens von Ereignis A nicht.
Totale Wahrscheinlichkeit
Diese Summe von Pfadwahrscheinlichkeiten P(B) wird auch als totale Wahrscheinlichkeit
von B bezeichnet.
=> Summe aller Pfadwahrscheinlichkeiten für B
Erwartungswert
Sei (Ω|P) ein endlicher Wahrscheinlichkeitsraum und W = {x1; x2; : : : ; xm} die Wertemenge einer Zufallsgrösse X, so heisst μ = E(X) Erwartungswert von X und wird
berechnet durch
E(X) = x1 · P(X = x1) + x2 · P(X = x2) + . . . + xm · P(X = xm)
-> Der Erwartungswert ist die Zahl, die deine Zufallsgröße X (z.B. Augenzahl eines Würfels) im Durchschnitt annimmt
Zufallsgrössen (diskret / stetig)
Eine Zufallsgrösse X ist eine Funktion, die jedem Ergebnis ω eines Zufallsexperiments
eine reelle Zahl X(ω) zuordnet. Das Ereignis {X = k} enthalte alle Ergebnisse, für
die X(ω) = k gilt:
{X = k} := {ω ∈ Ω | X(ω) = k}
Die Wahrscheinlichkeiten P(X = k) für alle k aus der Wertemenge von X bestimmen die Verteilung der Zufallsgrösse X.
- diskrete Zufallsgrössen: Werte lassen sich abzählen
- stetigen Zufallsgrössen: alle Werte eines reellen Zahlenintervalls sind möglich
Faires Spiel
„Fair“ heisst, die Gewinnerwartung von A entspricht gerade dem eingesetzten Betrag.
Varianz
Die Varianz ist ein Maß für die Streuung einer Wahrscheinlichkeitsdichte um ihren Schwerpunkt. Mathematisch wird sie definiert als die mittlere quadratische Abweichung einer reellen Zufallsvariablen von ihrem Erwartungswert.
Standardabweichung
Die Standardabweichung ist ein Maß für die Streuung von Daten. Sie gibt an, in welchem Umfang erhobene Werte von ihrem Durchschnittswert abweichen.
Bernoulli-Experiment
Ein Zufallsexperiment, das durch den Wahrscheinlichkeitsraum (Ω|P) modelliert
wird, heisst Bernoulli-Experiment, wenn
Ω = {0; 1}:
-> Zufallsvariablen mit einer Bernoulli-Verteilung benutzt man zur Beschreibung von zufälligen Ereignissen, bei denen es nur zwei mögliche Versuchsausgänge gibt. (z.B. ich Würfle eine 6 oder ich würfle keine 6)
Bernoulli-Kette
Die n-malige unabhängige Wiederholung eines Bernoulli-Experiments heisst
Bernoulli-Kette der Länge n.
Binominalverteilung
Beschreibt die Anzahl der Erfolge in einer Serie von gleichartigen und unabhängigen Versuchen, die jeweils genau zwei mögliche Ergebnisse haben („Erfolg“ oder „Misserfolg“).
Normalverteilung
Zufallsgrössen, deren Verteilung der Gausschen Glockenkurve entsprechen, nennen wir normalverteilt.
“Gaussche Glockenkurve”
Symmetrischer Kurvenverlauf, Medien und Mittelwert sind identisch.
Gaussche Glockenkurve
Die Gausssche Glockenkurve, auch als Normalverteilung bekannt, ist ein Konzept in der Statistik und in der Wahrscheinlichkeitstheorie. Die Kurve beschreibt die Verteilung von Daten in vielen natürlichen Prozessen und Messungen
Gaussintegral
Es berechnet den Inhalt der Fläche unter der Gausskurve mit den Parametern μ und σ im
Intervall von −∞ bis x und damit näherungsweise auch die Wahrscheinlichkeit P(X kleiner gleich x) einer binomialverteilten Zufallsgrösse X.
Stetigkeitskorrektur
Die Näherung durch das Gaussintegral kann verbessert werden, wenn die obere Integralgrenze
um +0.5 vergrössert wird.
Signifikanztest
Ein Signifikanztest ist ein statistisches Verfahren, mit dem die Signifikanz oder Relevanz von Unterschieden oder Zusammenhängen in Daten untersucht wird. Dabei wird geprüft, ob die beobachteten Unterschiede oder Zusammenhänge auf Zufall oder echte Effekte zurückzuführen sind.
Konfidenzintervall
Man spricht von einem Konfidenzintervall für die gesuchte Erfolgswahrscheinlichkeit.
Das Konfidenzniveau 1 − α beträgt im Beispiel 90%. Entsprechend ist die Rede
auch von einem „90%- (95%-, 99%-)Konfidenzintervall“.
Signifikanzniveau
Stichprobenergebnisse, die unter den getroffenen Annahmen nur mehr eine Wahrscheinlichkeit
kleiner gleich 5% besitzen, werden als signifikant erachtet. Ergebnisse mit einer
Wahrscheinlichkeit kleiner gleich 1% heissen hochsignifikant. Die Wahl der Prozentzahl α, ob
5% oder 1%, bestimmt das sogenannte Signifikanzniveau unseres Tests.
Fehler 1. Art
Wir verwerfen die Nullhypothese, obwohl sie richtig ist, weil das Stichprobenergebnis
mit H0 nicht verträglich ist. In diesem Fall spricht man vom Fehler 1. Art.
Fehler 2. Art
Wir behalten die Nullhypothese bei, obwohl sie falsch ist , weil das Stichprobenergebnis
mit H0 verträglich ist. In diesem Fall spricht man vom Fehler 2. Art.
Hypothesentest
Das Ziel des Hypothesentests besteht darin, aufgrund einer Stichprobe zu prüfen, ob eine vermutete Wahrscheinlichkeit (die Hypothese) als wahr angenommen werden
kann oder ob sie verworfen werden muss.
Man spricht von einem zweiseitiger Hypothesentest, falls es einen linken und rechten
Verwerfungsbereich gibt. Gibt es nur einen Verwerfungsbereich handelt es sich um einen einseitigen Hypothesentest
Nullhypothese
Alternativhypothese
Nullhypothese: Der untersuchte Effekt besteht nicht (z.B. der Würfel ist fair).
Alternativhypothese: Der untersuchte Effekt besteht (z.B. Würfel ist nicht fair).