Datenanalyse und -interpretation Flashcards

1
Q

Deskriptive und induktive Verfahren

A

Deskriptiv
–> Stichprobe

Induktiv
–> Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Arithmetisches Mittel (Mittelwert)

A

x = 1/n * (x1+x2+x3+…+xn)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Median (Zentralwert)

A
  • -> Werte n der Größe nach ordnen
    (z. B. 1,1,1,2,3,3,4)

falls ungerade:
• Wert von Me= xn+1 / 2

falls gerade:
• Wert von Me= 0.5* (xn/2 + xn/2 +1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Varianz

A

s^2 = 1/n-1 * ∑(xi- X)^2 mit X=Mittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Standardabweichung

A

s = √s^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Korrelationsanalyse

A

Verfahren zur Bestimmung der Stärke linearer Zusammenhänge zwischen zwei metrisch skalierten Variablen.

Logik:
• Der Korrelationskoeffizient kann Werte von -1 bis +1 annehmen.
• Positive Werte beschreiben einen gleichgerichteten Zusammenhang,
negative Werte einen gegenläufigen Zusammenhang.
• Eine fehlende Korrelation deutet auf eine Unabhängigkeit der Variablen hin.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Berechnung des Korrelationskoeffizienten

A

r = ∑ (xi-X) * (yi-Y) / √[(∑(xi-X)^2 * ∑(yi-Y)^2]

mit X,Y = Mittelwerte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Regressionanalyse

A

Analyse einer einseitigen Abhängigkeit zwischen einer unabhängigen Variablen (x) und einer abhängigen Variablen (y).

Logik:
• Ermittlung einer (linearen) Schätzfunktion: y = a + b∙x
• Ermittlung der Koeffizienten a und b zur möglichst guten Anpassung der Regressionsgeraden an die empirischen Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Berechnung der Regressionsfunktion

A
  • Allg. Funktion: y = a+bx
  • b = n * ∑(xi*yi) - ∑xi * ∑ yi / n * [∑ xi^2 - (∑ xi)^2]
  • a = Y - b*X mit X,Y = Mittelwerte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Güte der Regressionsfunktion

A

Bestimmtheitsmaß r^2
• Wertebereich zwischen [0;+1]
• Beurteilung der Güte der Regressionsfunktion

r^2 = __∑(¥i-Y)^2__
∑(yi-Y)^2
mit ¥i : geschätzter Wert mit der Regressionsfunktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Clusteranalyse

A

Die Clusteranalyse fasst Objekte (z.B. Kunden) auf Basis von ausgewählten Variablen zu Gruppen/Clustern (z.B. Kundensegmente) zusammen.

Vorgehen:
1. Auswahl der Clustervariablen und Aufstellen der Datenmatrix

  1. Aufstellen einer Distanzmatrix
  2. Clusteralgorithmus
  3. Bestimmung der Clusterzahl
  4. Interpretation und Benennung der Cluster anhand der Merkmalsmittelwerte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Multiple Regressionsanalyse

A

Analysiert den einseitigen Einfluss mehrerer unabhängiger Variablen xj (j = 1, …J) auf eine abhängige Variable (y).

Logik der multiplen Regressionsanalyse:

• Ermittlung einer (linearen) Schätzfunktion: y = a + b1 ∙x1 + b2 ∙x2 +…+ bj ∙xj + e

• Schätzung der Regressionskoeffizienten, a, b1, …, bj , die den relativen Einfluss
der unabhängigen Variablen auf die abhängige Variable ausdrücken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Standardisierung der Regressionskoeffizienten

A

• Um die Wirkungsstärke der einzelnen Variablen vergleichen zu können, müssen diese standardisiert werden.

ßi = bi * [Standardabweichung xi / Standardabweichung yi ]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly