Cheat Sheet Quantitative Methods Flashcards
Arithmetic, geometric and harmonic mean returns
Arithmetic Mean > Geometric Mean > Harmonic Mean
(Geometric Mean)2 = Arithmetic Mean x Harmonic Mean
Arithmetic: Additive Mittelung, am häufigsten.
Geometric: Multiplikative Mittelung, für Wachstumsprozesse.
Harmonic: Durchschnitt von Raten oder Verhältnissen.
Normal distribution
- 68% of observations lie in between μ +/- 1σ;
- 90% of observations lie in between μ +/- 1.65σ;
- 95% of observations lie in between μ +/- 1.96σ;
- 99% of observations lie in between μ +/- 2.58σ;
The properties of lognormal distributions are:
- It cannot be negative
- The upper end of its range extends to infinity
- It is positively skewed.
For these reasons, lognormal distribution is suitable for model asset prices, not asset returns (since returns can be negative).
If X follows a lognormal distribution, then ln(X) follows a normal distribution.
Central Limit Theorem
Der Zentrale Grenzwertsatz besagt, dass der Durchschnitt (oder die Summe) von vielen zufälligen Werten, egal wie diese ursprünglich verteilt sind, näherungsweise eine Glockenkurve (Normalverteilung) bildet, wenn genug Werte betrachtet werden.
Das bedeutet: Wenn du oft genug eine Stichprobe ziehst und die Mittelwerte anschaust, werden diese immer mehr einer Normalverteilung ähneln – egal, wie die Daten ursprünglich verteilt waren.
Assumptions of simple linear regression
Lineare Beziehung zwischen X und Y:
Zwischen der unabhängigen Variablen (X) und der abhängigen Variablen (Y) besteht eine lineare Beziehung.
Homoskedastizität (Konstante Varianz der Residuen):
Die Varianz der Residuen (ϵ) ist für alle Werte von X gleich.
Das bedeutet, dass die Streuung der Residuen unabhängig vom Wert der unabhängigen Variable X ist.
Unabhängigkeit (Independence):
Die Residuen (ϵϵ) sind nicht korreliert.
Es gibt keine Abhängigkeit zwischen den Fehlern der Beobachtungen.
Normalverteilung der Residuen:
Die Residuen (ϵ) sind normal verteilt, mit einem Mittelwert von 0.
Dies ist wichtig für statistische Tests und Konfidenzintervalle.
real risk-free interest rate
The real risk-free interest rate is the single-period interest rate for a completely risk-free security if no inflation were expected.
In economic theory, the real risk-free rate reflects the time preferences of individuals for current versus future real consumption.
The sum of the real risk-free interest rate and the inflation premium is the nominal risk-free interest rate.
Many countries have governmental short-term debt whose interest rate can be considered to represent the nominal risk-free interest rate in that country.
The interest rate on a 90-day US Treasury bill (T-bill), for example, represents the nominal risk-free interest rate over that time horizon.
Diskrete Zufallsvariablen vs. Stichprobenwerte
Eine diskrete Zufallsvariable (discrete random variable) beschreibt eine theoretische Verteilung von Ereignissen mit einer festen Wahrscheinlichkeitszuordnung. Sie ist keine Stichprobe, sondern die gesamte Population aller möglichen Werte.
Eine Stichprobe ist eine Teilmenge von Beobachtungen, die aus einer Population gezogen wird. Hier wird die Stichproben-Standardabweichung verwendet, um die Population auf Basis der Stichprobe zu schätzen.
Mode (Modalwert)
Mode: Gibt den Wert an, der am häufigsten vorkommt. Eine Datenreihe kann einen Mode, keinen Mode oder mehrere Modes haben (bimodal, multimodal).
Beispiel:
Datenreihe: {1,2,2,3,4} → Mode: 2 (kommt am häufigsten vor).
Cluster Sampling
- Die Population wird in Gruppen (Cluster) unterteilt, die die Population repräsentieren.
- Einige Cluster werden zufällig ausgewählt, und alle Mitglieder dieser Cluster werden untersucht.
Beispiel: Auswahl einiger Stadtteile, um alle Haushalte darin zu befragen.
Systematic Sampling
Es wird ein Startpunkt zufällig gewählt, danach wird jedes k-te Mitglied der Population ausgewählt.
Beispiel: Auswahl jedes 10. Kunden aus einer Liste.
Stratified Random Sampling
Die Population wird in Subpopulationen (Strata) mit ähnlichen Merkmalen unterteilt.
Aus jedem Stratum wird eine zufällige Stichprobe proportional zur Größe gezogen.
Beispiel: Auswahl von Befragten aus Altersgruppen entsprechend ihrer Häufigkeit in der Population.
Dependent, Independent Variable
Abhängige Variable (Y) (Dependent Variable):
Diese wird auch als response variable oder outcome variable bezeichnet. Sie ist die Variable, die erklärt oder vorhergesagt werden soll.
Unabhängige Variable (X) (Independent Variable):
Diese wird auch als predictor variable, explanatory variable, oder regressor bezeichnet.
Sie wird verwendet, um die abhängige Variable zu erklären oder vorherzusagen.
simple linear regression
Koeffizienten
simple linear regression
R2 (R-squared, Bestimmtheitsmaß)
Coefficient of Determination
Beispiel: Zusammenhang zwischen Einkommen und Ausbildung. Wenn r2 0.75 ist, bedeutet das, dass 75% der Varianz des Einkommens durch den Bildungsgrad erklärt werden. Die restlichen 25% werden durch andere Faktoren beeinflusst, die das Modell nicht abbildet.
simple linear regression
t-test