Vorlesung 2 Flashcards

1
Q

Welche Charakteristika existieren bei Daten?

A

Dimensionalität, Aufläsung, Spärlichkeit, Verteilung (Zentrum, Dispersion), Ähnlichkeit (Outlier)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Gib die Skalenniveaus an. Welche sind quantitativ, welche qualitativ. Welche Relationen existieren. Gib außerdem an wo diese Beispiele hingehören: Haarfarbe, Postleitzahl, Größe, Noten, Temperatur in °C, Körpergröße, Temperatur in K

A
  1. Nominalskala (qualitativ): Haarfarbe, Postleitzahl; Relation ist (Un)Gleichheit
  2. Ordinalskala (qualitativ): Größe, Noten; hat natürliche Rangfolge und somit Größer/Kleiner Relation
  3. Intervallskala (quantitativ): Temperatur in °C; Abstand kann quantifiziert werden; Relation somit auch Differenz
  4. Verhältnisskala (quantitativ): Körpergröße, Temperatur in K; hat absoluten Nullpunkt; Relation auch Verhältnis c=A/B
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Größen existieren um die Zentrumtendenz zu beschreiben? Was gilt für symmetrische Verteilungen und welche Daumenregel gibt es für moderat asymmetrische Kurven

A

Modus, Mean, Geometrisscher Mean, Median
Symm: Median = Mean = Mode
Assym: mean - mode = 3 (mean - median)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie werden Outlier in der Varianz betrachtet?

A

Überproportional durch das Quadrieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was macht die Gauss-Verteilung bezüglich der Entropie?

A

maximierte Entropie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist die Possion-Verteilung?
Welche Bedingung wird an die Ereignisse gestellt?
Zusammenhang zu Gauss?

A

Wahrscheinlichkeit k Ereignisse in bestimmten Intervall zu haben
Ereignisse müssen unabhängig sein
großes k -> Gauss

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beschreibe den Fluch der Dimensionalität

A

Objekte in hoher Dim. haben große Oberfläche gegenüber Volumen
für gleiche Datendichte für Punkt in d Dim. benötigt man n^d Datenpunkte
Hypercube-Kantenlänge: e(p) = p^(1/3)
durchschnittliche Distanz nimmt mit steigender Dimension zu
Abstand zu Kante nimmt ab mit höherer Dim

How well did you know this?
1
Not at all
2
3
4
5
Perfectly