Datenanalyse und -interpretation Flashcards

1
Q

Lage- und Streuungsparameter

A
  • arithmetisches Mittel
  • Median
  • Varianz
  • Standardabweichung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Korrelationsanalyse

A

Verfahren zur Bestimmung der Stärke linearer Zusammenhänge zwischen zwei metrisch skalierten Variablen

Logik:

  • kann Werte von -1 bis 1 annehmen
  • positive Werte: gleichgerichteten Zusammenhang
  • negative Werte: gegenläufiger Zusammenhang
  • fehlende Korrelation: Unabhängigkeit der Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Regressionsanalyse

A

Analyse einer einseitigen Abhängigkeit zwischen einer unabhängigen Variablen (x) und einer abhängigen Variablen (y)

Logik:

  • Ermittlung eines linearen Schätzfunktion: y= a+bx
  • Ermittlung der Koeffizienten a und b zur möglichst guten Anpassung der Regressionsgeraden
  • Minimierungsproblem
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Güte der Regressionsfunktion

A

Variation der abhängigen Variablen= erklärte + nicht erklärte Streuung

-Wertebereich (0;1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Multiple Regressionsanalyse

A

Analysiert den einseitigen Einfluss mehrerer unabhängiger Variablen x auf eine abhängige Variable y

Logik:

  • Ermittlung einer linearen Schätzfunktion y= a+ b1x1 + … + bjxj + e
  • Schätzung der Regressionskoeffizienten die den relativen Einfluss der unabhängigen auf die abhängigen Variablen ausdrücken
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Standardisierung der Regressionskoeffizienten

A

Um die Wirkungsstärke der einzelnen Variablen vergleichen zu können, müssen diese standardisiert werden
–> Beta-Koeffizient (standardisierter Koeffizient): unabhängig von der Skalierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Clusteranalyse

A

Fasst Objekte auf Basis von ausgewählten Variablen zu Gruppen/ Clustern zusammen

Vorgehen:

  1. Auswahl Clustervariablen, Aufstellen Datenmatrix
  2. Aufstellen Distanzmatrix (Berechnung der quadrierten euklidischen Distanz D(A,B))
  3. Auswahl des Clusteralgorithmus
    (hier: Zusammenfassung der beiden Objekte mit der geringsten Distanz (Single Linkage) und Aufstellen einer neuen Distanzmatrix)
  4. Bestimmung der Clusterzahl (“Elbow” Methode)
  5. Interpretation und Benennung der Cluster anhand der Merkmalsmittelwerte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly