Properties of Data Flashcards
Was ist der Unterschied zwischen experimental data
und observational data
?
experimental data
: entsteht unter kontrollierten Bedingungenobservational data
: unkontrollierte Datenansammlung
Wie bestimmt man den geometrischen Durchschnitt?
Im Bezug auf Lagewerte, welche Eigenschaft hat eine symmetrische Verteilung?
Median = Mean = Modus
Wie berechnet man die Varianz?
Wie berechnet man die Standardabweichung?
sqrt(Varianz^2)
Was ist der L1-Loss?
minimized by the median m
Was ist der L2-Loss?
minimized by the mean μ
Was besagt das Central Limit Theorem?
the sum
of many random variables converges to a Gaussian
Wie viel Prozent beinhaltet der Bereich unter der Funktion der Normalverteilung von -σ
bis +σ
?
~68%
Wie viel Prozent beinhaltet der Beich unter der Funktion der Normalverteilung von -2σ
bis +2σ
?
~95%
Wie viel Prozent beinhaltet der Bereich unter der Funktion der Normalverteilung von -3σ
bis +3σ
?
~99.7%
Beschreib Boxplots
Beschreib die Curse of Dimensionality
- we need exponentially more data for constant density,
- a hypercube of larger edge length covers same subspace,
- distance between points increases,
- distance to an edge decreases,
- every point becomes an outlier.
Wie löst man den Curse of Dimensionality?
If high-dimensional, we need more data for density estimation