4_ Datenanalyse/-interpretation Flashcards
Deskriptive Verfahren
Stichproben Auswertung
Induktive Verfahren
Von Stichproben auf Grundgesamtheit schließen
Median
Zentralwert
Korrelationsanalyse
Verfahren zur Bestimmung wie stark die linearen Zusammenhänge zwischen zwei metrisch skalierbaren Variablen ist
Regressionsanalyse
Analyse einer einseitigen Abhängigkeit zwischen einer unabhängigen und einer abhängigen Variablen
Zusammensetzung der Streuung der abhängigen Variable
erklärte Streuung+ nicht erklärte Streuung
Multiple Regressionsanalyse
Analysiert den einseitigen Einfluss mehrerer unabhängiger Variablen auf eine abhängige Variable
Clusteranalyse
Fasst Objekte auf Basis von ausgewählten Variablen zu Gruppen/Clustern zusammen
Logik Korrelationsanalyse
- Korrelationskoeffizient kann Werte von -1 bis 1 annehmen
- Positive Werte beschreiben gleichgerichtete Zusammenhänge
- fehlende Korrelation deutet auf Unabhängigkeit der Variablen hin
Standardisierung Regressionskoeffizienten
- Variablen standardisieren um die Wirkungsstärken zu vergleich
- > Resultat sind Beta-Koeffizienten, welche unabhängig von Skalierung unabhängiger Variblen sind
Vorgehen Clusteranalyse
- Auswahl Clustervariablen und Aufstellen Datenmatrix
- Aufstellen Distanzmatrix
- Clusteralgorithmus
- Bestimmung Clusterzahl(Elbow)
- Interpretation und Benennung Cluster anhand Merkmalsmittelwerte
Single Linkage Verfahren
Zusammenfassung geringster Distanz
Complete Linkage Verfahren
Zusammenfassung größter Distanz
Elbow (Cluster)
Ellbogen ,..,
ne Spaß ist die optimale Anzahl Cluster (grafisch lösen)
Faktoranalyse
Reduziert eine größere Anzahl an beobachteten Variablen (=Indikatorvariablen) auf wenige nicht direkt messbare (=latente) Faktoren
-> Komplexitätsreduktion durch Merkmalsverdichtung