Datenanalyse und Interpretation Flashcards
Median
Diejenige Merkmalsausprägung, die in einer der Größe nach geordneten Reihe von
Beobachtungswerten in der Mitte steht (d.h.die Beobachtungswerte halbiert).
Korrelationsanalyse
Verfahren zur Bestimmung der Stärke linearer Zusammenhänge zwischen zwei
metrisch skalierten Variablen.
Logik der Korrelationsanalyse
• Der Korrelationskoeffizient kann Werte von -1 bis +1 annehmen.
• Positive Werte beschreiben einen gleichgerichteten Zusammenhang,
negative Werte einen gegenläufigen Zusammenhang.
• Eine fehlende Korrelation deutet auf eine Unabhängigkeit der Variablen hin.
Regressionsanalyse
Analyse einer einseitigen Abhängigkeit zwischen einer unabhängigen Variablen
(x) und einer abhängigen Variablen (y).
Logik der Regressionsanalyse
• Ermittlung einer (linearen) Schätzfunktion: y = a + b∙x
• Ermittlung der Koeffizienten a und b zur möglichst guten Anpassung der
Regressionsgeraden an die empirischen Daten
Multiple Regressionsanalyse
Analysiert den einseitigen Einfluss mehrerer unabhängiger Variablen xj
(j = 1, …J)
auf eine abhängige Variable (y).
Logik der Regressionsanalyse
• Ermittlung einer (linearen) Schätzfunktion: y = a + b1
∙x1 + b2
∙x2 +…+ bj
∙xj + e
• Schätzung der Regressionskoeffizienten, a, b1
, …, bj
, die den relativen Einfluss
der unabhängigen Variablen auf die abhängige Variable ausdrücken
Clusteranalyse
Die Clusteranalyse fasst Objekte (z.B. Kunden) auf Basis von ausgewählten Variablen zu Gruppen/Clustern (z.B. Kundensegmente) zusammen.
Geeignet für Segementierungm da Teile der Gruppe sehr änhlich sind, die Gruppen untereinander jedoch sehr verschieden.
Vorgehen Clusteranalyse
1.Auswahl der Clustervariablen und Aufstellen der Datenmatrix
2.Aufstellen einer Distanzmatrix
3.Clusteralgorithmus
4.Bestimmung der Clusterzahl
5.Interpretation und Benennung der Cluster anhand der
Merkmalsmittelwerte