Univariante, Bivariante und Multivariante Datenanalyse Flashcards

1
Q

Definition diskreter Merkmale/ Variablen

A

Die Menge der angenommenen Werte ist albzählbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definition von stetigen Variablen

A

Die Menge der angenommenen Werte ist nicht albzählbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Definition von quasistetigen Variablen/Merkmalen

A

De Menge der angenommenen Werte ist nur aufgrund der mangelnden Auflösung des Messgeräts nicht abzählbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie können Merkmale Kategorisiert werden?

A

*in der Anzahl ihrer Ausprägungen
*im Bezug auf das Skalenniveau
*als qualitative oder qualitative Merkmale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definition eines normalskalierten Merkmals

A

Die Ausprägungen sind Namen oder Kategorien die NICHT in eine Ordnung gebracht werden können.

Beispiel: Haarfarben, Geschlecht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Definition eines ordinaklskalierten Merkmals

A

Die Ausprägungen des Merkmals können in eine Ordnung gebracht werden.

Beispiel: Schulnoten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definition eines intervalskalierten Merkmals

A

Die Ausprägungen können in eine lineare Ordnung mit einheitlichen Abständen gebracht werden.

Beispiel: Grad Celsius

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Definition eines verhältnisskalierten Merkmals

A

Die Ausprägungen des Merkmals können quotiert und inhaltlich interpretiert werden.

Beispiel: Währungswerte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definition eines kardianlsskalierten Merkmals

A

Die Ausprägung der Merkmale sind sowohl intervallskalierte als auch verhältnisskalierte Merkmale. - also in linearer Ordnung mit einheitlichen Abständen und quotierter und interpretierbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Definition quantitativer Merkmale

A

Messbare Merkmale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Deviation qualitativer Merkmale

A

Der Zustand der Merkmale ist NICHT messbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Womit Beginnt die empirische Auswertung der gesammelten Daten?

A

Mit einer Exploration zur Übersicht. Dabei werden die Daten nach Ausprägung und Häufigkeit z.B. in einer Tabelle dargestellt.
Die tabellarische Darstellung erlaubt außerdem die Erfassung nicht erlaubter Werte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die “absolute Häufigkeit”?

A

Die Verteilung der Antworten in Nennungen, also absoluten Zahlen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist die “relative Häufigkeit”?

A

Die Verteilung der Häufigkeit in Prozenten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Womit wir die Gesamtzahl aller Fälle bezeichnet?

A

n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind “gültige Prozentwerte”?

A

Anders als bei der relativen Häufigkeit, werden hier nur gültige Werte berücksichtigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welchen Wert muss die letzte Ausprägung der Häufigkeitstabelle in der Spalte “kumulative Häufigkeit” aufweisen?

A

100

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Wann ist es sinnvoll Ausprägungen zu Kategorien zusammenzufassen, bevor man sie in einer Häufigkeitstabelle darstellt?

A

Bei intervallskalierten Variablen oder ordinalsaklierten Variablen mit vielen Ausprägungen (z.B. Gehalt)
Dabei werden Merkmalsausprägungen systematisch gruppiert. Ziel ist eine bessere Übersicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wonach richtet sich die Merkmalskategorisierung?

A

Nach deme gewünschten Differenzierungsgrad und der Größe der Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wofür ermittelt man die Kategorienbreite?

A

Wenn man bleichgroße Kategorien bilden möchte. Dazu ermittelt man zunächst die Variationsbreite als Differenz aus den größten und kleinsten Wert und dividiert diesen durch die Gewünschte Anzahl an Kategorien.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welche sechs Kriterien müssen bei der Bildung von Kategorien beachtet werden?

A

*die Anzahl der Kategorien soll eine Differenzierung ermöglichen, aber nicht zu hoch sein
*Kategorien sollten die gleiche Breite haben
*jede Kategorie sollte zumindest eine gewisse Anzahl an Fällen aufweisen
*“Natürliche” Schwellwerte müssen berücksichtigt werden
*Kategoriebildung unabhängig von Ausreißerwerte
*Grenzen der Kategorien müssen plausibel sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welche sechs Kriterien müssen bei der Bildung von Kategorien beachtet werden?

A

*die Anzahl der Kategorien soll eine Differenzierung ermöglichen, aber nicht zu hoch sein
*Kategorien sollten die gleiche Breite haben
*jede Kategorie sollte zumindest eine gewisse Anzahl an Fällen aufweisen
*“Natürliche” Schwellwerte müssen berücksichtigt werden
*Kategoriebildung unabhängig von Ausreißerwerte
*Grenzen der Kategorien müssen plausibel sein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wie wird die Analyse eines einzelnen Merkmals genannt?

A

Univariante Analyse?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was ist eine Bivariante Analyse?

A

Die Analyse von zwei Merkmalen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wie wird die Analyse von mehreren Merkmalen genannt?

A

Multvariante Analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was ist das arithmetische Mittel und wie wird es gebildet?

A

Der Mittelwert bei Merkmalen mit Intervall- und Ratioskala - nur dann ist er interpretierbar!

Berechnet durch die Summe aller gültigen Werte, dividiert durch die Anzahl der Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Wann kann der Median genutzt werden?

A

Der Median ist der Mittelwert bei Merkmalen mit Ordinalskala.
Er kann immer dann angerannt werden, wenn Merkmale in einer Rangfolge existieren.

Es ist der Merkmalswert, den mindestens 50% alle Werte einer Stichprobe vom Umfang unterschreiten oder erreichen und den mindestens 50% alerter Werte überschreiten oder erreichen

Der Median muss nicht ein Wert des vorliegenden Datenmaterials sein, sondern der, der dieses in zwei gleichgroße Hälften teilt

Der Median ist robust gegenüber Ausreißern (Extremwerten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Wofür verwendet man den Modus?

A

Der Modus ist der Mittelwert bei Merkmalen mit Nominalskala.
Hier wird auch von “modalen Klassen” gesprochen.
Es ist die am häufigsten Auftretende Ausprägung oder Merkmalswert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Was ist Dispersion?

A

Die unterschiedliche Streuung, die zwei Verteilungen auch bei ähnlichen zentralen Tendenzen aufweisen können.

Das Dispensionsmaß informiert über den Unterschied dieser Werte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was ist die Variationsbreite oder Range?

A

Die Gesamtbreite aller Messwerte.
Sie gibt an in welchem Bereich sich die Messwerte befinden.
Zur Berechnung wird der kleinste Wert vom größten abgezogen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Was ist ein Quantil?

A

Ein Quantil definiert einen bestimmten Teil einer Datenmenge. In diesem Fall ein viertel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was ist ein Perztil?

A

Der häufigste Perztil ist der Median.
Für das untere und obere viertel einer Verteilung (25% und 75%) wird auch der Begriff “unteres bzw. oberes Quantil” verwendet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Was ist der Interdezilbereich?

A

Die inneren 80% eines Perztils - also begrenzt durch P10 und P90.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Was ist die empirische Varianz?

A

Die Summe der quadrierten Abweichungen vom Mittelwert

Sie ist gleich Null, wenn keine Differenz zwischen den Werten besteht - also nur ein Merkmalswert vorhanden ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Was ist die empirische Standartabweichung?

A

Die Wurzel der empirischen Varianz. Sie ist inhaltlich interpretierbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Wann wird eine Kreuztabelle verwendet?

A

Wenn eine Hypothese als Wenn-Dann-Frage aufgestellt wurde.
Die einfachste Form der Kreuztabelle ist die 2x2 Tabelle zur Überprüfung einer unabhängigen und einer abhängig Variable. Dabei werden Aussagen über das Vorhanden- bzw. Nichtvorhandensein getroffen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Wie sieht eine 2x2 Tabelle aus?

A

Eine 2x2 Tabelle vergleicht eine unabhängige mit einer abhängigen Variable. Dabei wird die unabhängige Variable in den Spalten, die abhängig in den Zeilen dargestellt. Die einzelnen Felder werden nach der Position der unabhängigen + abhängigen Variable benannt.

Zusätzlich wird die 2x2 Tabelle in der Regel um die Randhäufigkeit ergänzt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Was ist die Randhäufigkeit?

A

Die Randhäufigkeit beschreibt die Ausprägung eines Merkmals im Bezug auf die gesamte Messung. - Also wie oft dieses Merkmal in der Messung vorhanden ist. - Dabei werden die Werte einer Zeile bzw Spalte zusammengefasst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Was ist die Spaltenrandsumme?

A

Die Gesamte Randhäufigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Was ist die Ausprägungshäufihkeit?

A

Die Prozentuale Darstellung der Randhäufigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Was ist der Chi-Quadrat-Test?

A

Der Chi-Quadrat-Test untersucht die Häufigkeitsunterschiede von Merkmalsausprägungen und analysiert deren Kombinationen.
Dabei wird die Häufigkeit der vorhandenen Werte mit der erwarteten Häufigkeit verglichen. Ziel ist es eine Aussage über die Signifikanz der Abweichung zu treffen. Ist die Abweichung Zufall oder nicht?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Was ist die Korrekationsanalyse?

A

Die Korrelationsanalyse untersucht wechselseitige Zusammenhänge.
Dabei ist sie Abhängig von der Erscheinung der Variablen sowie dem Grad und der Art des Zusammenhangs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Wovon hängt die Korrelationsanalyse ab?

A

*von der Erscheinung der Variablen
*vom Grad und der Art des Zusammenhangs der Variablen

44
Q

Welche Ausprägungen kann eine Korrelationsanalyse bei zwei Variablen haben?

A
  • X bewirkt Y
  • Y bewirkt X
  • X und Y bewirken Z
45
Q

Was ist der Korrelationskoeffizient r?

A

Der Korrelationskoeffizent beschreibt die Stärke des Zusammenhangs zwischen zwei Variablen
Er kann den Wertebereich -1 bis +1 annehmen

Er unterscheidet sich nach dem Skalenniveau
Ermöglicht die interpretation von Werten

46
Q

Welche Wert kann der Korrelationskoeffizient annehmen?

A

-1 bis+1

47
Q

Was ist das Bestimmtheitsmas r2?

A

Es stellt die Stärke des Zusammenhangs zwischen zwei Variablen da.
Der Wertebereich des Bestimmungsmas liegt zwischen 0 und +1 - je näher der Wert an 1 liegt, desto höher ist der Zusammenhang. Ist der Wert = 0 gibt es keinen Zusammnehang

Das Betsimmtheitsmaß ist das Gütemaß der Anpassung einer Regression

48
Q

Erkläre den Pearson-Korrelationseffiziemten

A

Der Pearson-Korrelationseffizient findet bei normalverteilten Daten mit linearem Zusammenhang zwischen den Variablen Anwendung.
Er ist bei normainalskalierten Daten anwendbar

49
Q

Erkläre die Spearman-Korrelation

A

Der Spearman-Korrelationseffizente findet bei nicht normalverteilten Daten und nicht linearen Zusammenhängen Anwendung. Dabei ist er nicht auf norminalskalierte Daten beschänkt

50
Q

Was ist Kundalls Tan?

A

Kundalls Tan ist ein Model zur Berechnung des Korrelationskoeffizienten. Es ist vielseitig und ein Vergleich aller Wertepaare unteteinander ist möglich.
Dabei ist das Model auf beliebig viele Werte anwendbar und nicht auf Wertepaarreihen beschränkt.

51
Q

Was ist Partialkorrelation?

A

Partialkorrelation ist der Wert für die Stärke des Zusammenhangs von zwei Variablen unter Herausrechnung einer dritten.

Auch: herauspartialisieren

Beispiel: Verheiratete Paare - Alter

52
Q

Was ist die Regressionsanalyse?

A

Die Regressionsanalyse erklärt Zusammenhänge zwischen abhängigen und unabhängigen Variablen. Dabei können unbekannte Werte der abhängigen Variablen geschätzt werden. Dazu werden Zeit, Wirkung oder Ursache prognostiziert.

53
Q

Welche Prognossen können mit Hilfe der Regressionsanalyse für unbekannte Werte von abhängigen Variablen getroffen werden?

A

*Zeitreihungsanalysen: wie verändert sich die Variable im Laufe der Zeit?
* Wirkungsprognossen: wie verändert sich die abhängige Variable, wenn die unabhängige verändert wird?
* Ursachenanalyse: Welchen Einfluss hat die unabhängige auf die abhängige Variable?

54
Q

Wie sieht die Regressionsgleichung aus?

A

Y= f (x)

55
Q

Wie sieht der Regressionsgrad aus?

A

Y=b0+b1

56
Q

Was ist das Ziel der linearen Regressionsanalyse?

A

Ziel ist die Schätzung bzw.Berechnung der Regressionsgleichung. Das heißt die Darstellung eines Zusammenhangs (Je niedriger der Preis, desto höherer der Verkauf) anhand von Datenpunkten.

57
Q

Was ist die Regressionsgreade?

A

Die Grade durch Datenpunkte, bei der der Abstand der Datenpunkte zur Geraden minimal ist.
Perfektion diese Gerade wenn alle Abstände minimal sind.

58
Q

Was ist das Residuum?

A

Residuum ist der Abstand des Datenpunkts zur Regressionsgreaden in einer Regression.

59
Q

Wie wird der Regressionsgrad ermittelt?

A

Durch das Verfahren des kleinsten Quadrats = Quadriesierung, Summierung, Minimierung der Residuuen aller Datenpunkte. Dabei werden größere Abstände stärker gesichtet und positive und negative Abstände heben sich nicht auf.

60
Q

Was ist das Bestimmtheitsmaß R2?

A

Das Bestimmtheitsmaß gibt an, wie gut ein Model durch den Regressionsgrad erklärt wird
Der Wertebreich liegt zwischen 0 und +1
Bei 0 liegt keine Varianz vor, 1 erklärt die gesamte Varianz.

61
Q

Was ist eine Regression?

A

Die Regression beschreibt den Zusammenhang von mindestens zwei Variablen zueinander. Dargestellt auf einem Grafen.

62
Q

Was ist ein F-Test? Was ist der F-Wert?

A

Der ist ein Mittel der Varianzanalyse. So kann mit einer gewissen Konferenz entschieden Werdern, ob zwei Stichproben aus unterschiedlichen normalverteilten Populationen hinsichtlich ihrer Varianz Unterschiede aufweisen.

63
Q

Was ist ein T-Test

A

Mit einem T-Test wird die Verteilung vom Mittelwert der Stichprobe zum wahren Mittelwert der Grundgesamtheit berechnet.

Wenn Sie die Daten untersuchen, erkennen Sie, dass die durchschnittliche Bewertung von männlichen Befragten bei 9 liegt, während die durchschnittliche Bewertung von weiblichen Befragten bei 12 liegt. Woher sollen Sie nun wissen, ob sich 9 signifikant von 12 unterscheidet? Genau hier kommt der t-Test ins Spiel.
Der t-Test ist eine Möglichkeit, zu ermitteln, ob sich zwei Zahlen signifikant voneinander unterscheiden. Es gibt verschiedene Arten von t-Tests, und jeder wird mit einer anderen Formel berechnet.

64
Q

Wozu dient eine Faktorenanalyse?

A

Die Fakorenanalyse wird zur Komplexitätzreduzierung bei einer großen Menge an Variablen eingesetzt.
Sie hat zwei Formen: explorativ und konfirmativ

Bei der Faktorenanalyse können interessante Variablen zunächst wehrlos erhoben werden und dann mit der Faktorenanalyse auf ihre Relevanz überprüft werden. - Diese extrahiert abhängige Beschreibung- und Erklärungsfaktoren.

65
Q

Was sind die Merkmale der explorativen Faktorenanalyse?

A

Die explorative Faktoenanalyse dient der Datenerhebung.
Sie ist ohne Vorwissen über die Zusammenhänge der verschiedenen Variablen möglich

66
Q

Was ist die Funktion einer konfirmativen Faktorenanalyse?

A

Die konfirmative Faktorenanalyse überprüft eine Hypothese. Die hierfür relevanten Variablen müssen bekannt sein.

67
Q

Worin besteht der Zielkonflikt der Faktorenanalyse?

A

In der Problematik, das einerseits
* extrahierte Faktoren Variablen zusammenfassen und vereinfachen sollen
andererseits
*ein Informationsverlusst dadurch entsteht wenn die extrahierten Faktoren viele Variablen zusammenfassen

Es muss daher eine “goldene Mitte” gefunden werden

68
Q

Was ist die multiple Regressionsanalyse?

A

Die Untersuchung von Kausalzusammenhängen (Ursache-Wirkung) zwischen unabhängigen Variablen. Kennt man diese Beziehung kann eine Aussage über de Güte getroffen werden.
Außerdem lassen sich abhängige Variablen schätzen.

69
Q

Worin liegt der unterschied zwischen der linearen und der multiplen Regression?

A

Während du bei der einfachen linearen Regression nur eine Variable betrachtest, verwendest du bei der multiplen linearen Regression also mehrere Variablen, um das Kriterium zu schätzen. Das hat den Vorteil, dass du mehrere Einflussfaktoren gleichzeitig in deiner Vorhersage berücksichtigen kannst.

70
Q

Was ist bei der mutiblen Regressionsanalyse zu beachten?

A

*Die Regressionskoeffizienten müssen einzeln darauf überprüft werden welche unabhängige Variable den größten Einfluss hat?
(Dazu wird ein T-Test durchgeführt)
*linearität muss gegeben sein
*Homoskelastizität (Identische Varianz bei den Residuen)
*keine Autokorrelation
*keine Multikolliearität

71
Q

Was ist Multikolliearität?

A

Multikolliearität liegt vor, wenn sch eine unabhängige Variable als lineare Funktion einer anderen unabhängigen Variable darstellen lässt.

72
Q

Was ist Autokorrelation?

A

Autokorrelation liegt vor, wenn zwei Residuuen miteinander korrelieren.
Das wird mit den Durbin-Watson-Test überprüft. Wenn hier der Wert 2 herauskommt liegt keine Autokorrelation vor.

73
Q

Was überprüft der Durbin-Watson-Test?

A

Die Autokorrelation von zwei Risiduen.
Der Wert zwischen 0 und 4 gibt Auskunft über den Grad der Korrelation.
0 = positive Autokorrelation
4 = negative Autokorrelation
2 = keine Autokorrelation

74
Q

Was ist Homoskelastizität?

A

Homoskelastizität bedeutet, dass es unter den Risiduen identische Varianzen gibt.
Das Gegenteil ist hetroskelastizität.

75
Q

Welche Funktion hat die Varianzanalyse?

A

Die Funktion der Varianzanalyse ist das finden von Mittelwertunterschieden.
Dabei kann die Varianzanalyse einfaktorisch oder mehrfaktorsch sein.
Wichtig: Das Wirkungsmodel (Welche Variable ist welche) muss bekannt sein.

76
Q

Was ist der Mittelwert?

A

Der Mittelwert stellt den zentralen Wert einer Merkmalsverteilung dar. Je nach Skalenniveau sind dies Modus, Median oder arithmetisches bzw. getrimmtes Mittel.

77
Q

Die Formen der Varianzanalyse unterscheiden sich nach…

A

… der Anzahl der zu überprüfenden Variablen.
Typisch sind: ANOVA (analysiert eine abhängige Variable)
MANOVA (analysiert mehrere Variablen gleichzeitig)

78
Q

Welche drei Schritte sind bei der Varianzanalyse zu beachten?

A
  1. Definition des Erklärungsmodels - welche unabhängigen und abhängigen Variablen werden betrachtet - und Abklärung der methodischen Voraussetzungen (Skalenniveau, Homoskelasitizität, Verteilungsformen)
  2. Varianzanalyse: ermitteln der Gesamtvarianz des Models und der Varianzen innerhalb der Gruppen - das Verhältnis gibt Auskunft über den Erklärungsgrad der Faktoren
  3. Bei Unterschieden zwischen den Guppenmittelwerten (t-Test) wird überprüft, ob es sich um echte Unterschiede in der Grundgesamtheit handelt
    Dazu wird auch ein Post-Hoc-Test durchgeführt.
79
Q

Was ist ein Post-Hoc-Test?

A

Ein Test zur Feststellung welcher der wahren Faktorenstuffenmittelwerte sich unterscheidet.
2 Formen

  1. Paarvergleichstest: Dabei werden alle möglichen Faktornestufenpaare auf Signifikanz getestet
  2. Spanweitentest
80
Q

Was ist der Schaffe-Test?

A

Eine mistangewendete Form des Post-Hoc-Tests.
Dabei ist der Schaffe-Test sicher, birgt aber die Gefahr, dass Differenzen die im T-Test oder F-Test aufgefallen sind, hier nicht erkannt werden

81
Q

Wie definieren Weiber und Mühlenhaus Struckturgleichungsmodelle?

A

Strukturgleichungsmodelle (SGM) bilden a priori formulierte und theoretisch und/oder sachlogisch begründete komplexe Zusammenhänge zwischen Variablen in einem linearen Gleichungssystem ab und dienen der Schätzung der Wirkungskoeffizienten zwischen den betrachteten Variablen sowie der Abschätzung von Messfehlern“ (Weiber/Mühlenhaus 2014, S. 7)

82
Q

Welche sind die allgemeinen Charakteristika des Strukturgleichungsmodels?

A

*Zielsetzung: Prüfung eines theoretisch oder sachlogisch erstellten Hypothesensystems.
*Typen von Variablen: Analyse von Ursache-Wirkungs-Zusammenhängen zwischen manifesten und/oder latenten Variablen.
*Variablenbeziehungen: Eine Variable kann im Hypothesensystem sowohl eine abhängige (endogene) als auch eine unabhängige (exogene) Größe darstellen, wodurch Interdependenzen zwischen Variablen erfasst werden können.
*Vorgehensweise: Abbildung der Variablenbeziehungen in einem sog. Strukturmodell (Pfaddiagramm) und Überführung in ein lineares Mehrgleichungssystem. Eine SGA besteht aus mindestens zwei Regressionsbeziehungen, durch die das Strukturmodell abgebildet wird.
*Schätzmethodik: Die Wirkungskoeffizienten (Pfadkoeffizienten) des Strukturmodells werden simultan oder sukzessive so geschätzt, dass mithilfe der Parameterschätzungen und der a priori unterstellten Variablenstruktur die zu den Variablen erhobenen Ausgangsdaten möglichst genau reproduziert werden können

83
Q

Was ist “Signifikanz” in der Marktforschung?

A

Wenn etwas mit einer bestimmten Wahrscheinlichkeit nicht auf Zufälligkeit beruht. (min. 95%)

84
Q

Wozu dient eine Cluster-Analyse?

A

Sie dient zur Einteilung einer Menge von Objekten in Cluster (Gruppen);
Voraussetzung dabei ist, dass die Objekte einer Gruppe möglich homogen sind.
So können mehrere Merkmale parallel Betrachtet erden und Ähnlichkeite/Unterschiede über mehrere Dimenssionen.
Die Herausforderung: die Ähnlichkeit der Objekte muss genau gemessen werden - das besten Verfahren dazu ist die hirachische Clusteranalyse

85
Q

Was ist bei der hierarchischen Custeranalyse zu beachten?

A

Die hierarchische Cuteranalyse ist fast immer anwendbar, doch ihr Informationsgehalt ist geringer als bei anderen multivarianten Analyseverfahren

86
Q

Wie funktioniert die hierachsche Clusteranalyse?

A

über den Prozess des Agglomerierens.
Dazu werden zunächst alle Objekte als einzelne Cluster betrachtet, bevor die zwei Objekte mit der geringsten Distanz zu einem Cluster zusammengefasst werden.
Dann beginnt der Prozess von vorne. Am Ende steht ein Megercluster in dem alle Objekte zusammengefasst sind. Das Ergebnis ist allerdings die optimale Cluterverteilung, die durch die Untersuchung der einzelnen Schritte und Teilstufen gefunden werden muss. Das braucht Erfahrung.

87
Q

Wann kann eine Cluster-Analyse angewendet werden?

A

Eigentlich immer. Bei metrisch skalierten Merkmalen auch ohne weitere Arbeit. Nominal und ordinal skalierte Merkmale müssen erst codiert werden (0/1)

Zu beachten ist, das keine Korrelation zwischen den Merkmalen vorliegen sollte

88
Q

Nach was richteten sich die Maße bei der Durchführung einer Clusteranalyse?

A

Nach dem Skalenniveau des Merkmals

89
Q

Wie lassen sich die Ergebnisse der Clusteranalyse darstellen?

A

Als Tabelle oder Grafik

*Distanzmatrix: sämtliche Distanzwerte aller Einzelobjektpaare werden dargestellt
*Agglomerationstabelle: Abbildung des Verlaufs (denn bei jeder Zusammenfassung werden de Distanzwerte (Koeffizienten) größer
*Eiszapfendiagram
*Dendrogramm

90
Q

Warum ist die Analyse von Merkmalen in der Praxis oft komplexer?

A

*weil mehrere Hypothesen gleichzeitig untersucht werden müssen
*weil eine Wechselwirkung zwischen den Variablen bestehen kann (das heißt eine Variable kann gleichzeitig abhängig und unabhängig sein, je nach Untersuchung) = intervenierende Variable

91
Q

Was ist eine intervenierende Variabel?

A

Bei einer intervenierenden Variable besteht eine Wechselwirkung, das heißt eine Variable kann gleichzeitig abhängig und unabhängig sein, je nach Untersuchung) =

92
Q

Was ist die Funktion eines Strukturgleichungsmodels?

A

Verwobene Konstrukte in Strukturen zu überführen und einzelne Hypothesen testen zu können
(bei der Annahme, dass Wechselwirkungen ausschließlich linear sind)

  • Kann auch Richtung und Stärke der Wechselbeziehung schätzen
    *kann Messfehler herausfiltern und reduzieren
93
Q

Was ist das Hauptmerkmal der Strukturgleichungsanalyse?

A

Das Herausfiltern von Messfehlern

94
Q

Es gibt zweiunterschiedliche Verfahren der Strukturgleichungsanalyse. Wonach reichten sie sich?

A

Nach den Variable.
1. manifeste Variablen (empirisch direkt zu Beobachten)
2. latente Variablen ( empirisch nicht zu beobachtend, sondern nur du h ein geeignetes Messmodel)

95
Q

Was ist eine manifeste Variable?

A

Eine Variable die empirisch Direktübertragung beobachten ist

96
Q

Was ist eine latente Variable?

A

Eine latente Variable kann nicht empirisch beobachtet werden. Man nutzt hier eingeeignetes Messmodel

97
Q

Die Strukturgleichungsanalyse kombiniert viele Methoden unter anderem…

A

*Regressionsanalyse
*Pfardanalyse (quasi mehrere Regressionsanalysen)
*LISREL-Modelle (linear Struktur Relations)
*Varianzanalyse

98
Q

Was ist der Standartfehler?

A

Die Abweichung des Mittelwerts um den eigentlichen Mittelwert der Grundgesamtheit bei unterschiedlichen Stichproben.
Ein Maß für die Größe der Streuung

99
Q

Was ist die Standartabweichumg?

A

Streuung einzelner Werte einer Stichprobe um den Stichprobenmittelwert

100
Q

Bei welcher Verteilung stimmen arithmetisches Mittel, Median und Modalwert überein?

A

Bei der eingipfligen symmetrischen Verteilung

101
Q

Wie unterscheidet sich die mehrgipflige symmetrische Verteilung von der eingipfeligen?

A

Während aretmetisches Mittel und Median gleich bleiben, können bei dieser Verteilubg mehrere Modalwerte auftreten. Das nennt man auch Bimodale Verteilung

102
Q

Wie verhalten sich die Werte zueinander, wenn die Verteilung linkssteil ist?

A

Das arithmetische Mittelist größer als derMedian. Der Median ist größer als der Modalwert

Linkssteile Verteilungen werden auch rechtsschief oder positiv schief genannt.

103
Q

Wie verhalten sich die Werte bei einer Rechtsstreiten Verteilung zueinander?

A

Das arethmetische Mittel ist kleiner als der Median. Der Median ist kleiner als der Modalwert.

Solche Kurven werden auch Linksschwüngen oder negativ steil genannt

104
Q

Wie wird eine linksschife Verteilung noch genannt

A

Rechtsstreit oder negativ schief

105
Q

Wie wird eine rechtsschiefe Verteilung noch genannt?

A

Linkssteil oder positiv schlief

106
Q

Wie läuft eine Fakorenanalyse ab?

A

In vier Schritten

  1. Auswahl de Variablen die einbezogen werden sollen
    Dafür wird eine Korrelationsmatrix erstelltund mit Hilfe dieser eine engere Auswahl getroffen
    Variablen die minimal miteinander korrelieren werden herausgenommen
  2. Faktoren werden extrahiert. Dabei werden Fakoren ermittelt, was zur Clusterbildung führt
    Anhand statistischer Kennzahlen wird überprüft ob das gefundene Faktorenmodel passend ist

3.Transformation der Faktoren um sie zu interpretieren. Auch: Faktoration

  1. inhaltliche Interpretation: Welche Variablen können welchen Faktoren zugeordnet werden? Wie gut erklärt sich damit das Model?
107
Q

Welche Werte können Faktoren annehmen und wie lassen sich diese interpretieren?

A

Faktoren können negative Werte oder positive Werte annehmen oder nahezu bei 0 liegen
Negative Werte bedeutet, dass im Vergleich zu Anderen, hier ein unterdurchschnittlicher Zusammenhang zwischen Objekt und Faktor besteht
Positive Werte deuten auf einen überdurchschnittlichen Zusammenhang zwischen Objekt und Faktor
Ein Wert der nahezu 0 ist zeigt hingegen, dass der Zusammenhang zwischen Objekt und Faktor im Vergleich durchschnittlich ist