Univariante, Bivariante und Multivariante Datenanalyse Flashcards
Definition diskreter Merkmale/ Variablen
Die Menge der angenommenen Werte ist albzählbar.
Definition von stetigen Variablen
Die Menge der angenommenen Werte ist nicht albzählbar.
Definition von quasistetigen Variablen/Merkmalen
De Menge der angenommenen Werte ist nur aufgrund der mangelnden Auflösung des Messgeräts nicht abzählbar.
Wie können Merkmale Kategorisiert werden?
*in der Anzahl ihrer Ausprägungen
*im Bezug auf das Skalenniveau
*als qualitative oder qualitative Merkmale
Definition eines normalskalierten Merkmals
Die Ausprägungen sind Namen oder Kategorien die NICHT in eine Ordnung gebracht werden können.
Beispiel: Haarfarben, Geschlecht
Definition eines ordinaklskalierten Merkmals
Die Ausprägungen des Merkmals können in eine Ordnung gebracht werden.
Beispiel: Schulnoten
Definition eines intervalskalierten Merkmals
Die Ausprägungen können in eine lineare Ordnung mit einheitlichen Abständen gebracht werden.
Beispiel: Grad Celsius
Definition eines verhältnisskalierten Merkmals
Die Ausprägungen des Merkmals können quotiert und inhaltlich interpretiert werden.
Beispiel: Währungswerte
Definition eines kardianlsskalierten Merkmals
Die Ausprägung der Merkmale sind sowohl intervallskalierte als auch verhältnisskalierte Merkmale. - also in linearer Ordnung mit einheitlichen Abständen und quotierter und interpretierbar.
Definition quantitativer Merkmale
Messbare Merkmale
Deviation qualitativer Merkmale
Der Zustand der Merkmale ist NICHT messbar.
Womit Beginnt die empirische Auswertung der gesammelten Daten?
Mit einer Exploration zur Übersicht. Dabei werden die Daten nach Ausprägung und Häufigkeit z.B. in einer Tabelle dargestellt.
Die tabellarische Darstellung erlaubt außerdem die Erfassung nicht erlaubter Werte.
Was ist die “absolute Häufigkeit”?
Die Verteilung der Antworten in Nennungen, also absoluten Zahlen
Was ist die “relative Häufigkeit”?
Die Verteilung der Häufigkeit in Prozenten
Womit wir die Gesamtzahl aller Fälle bezeichnet?
n
Was sind “gültige Prozentwerte”?
Anders als bei der relativen Häufigkeit, werden hier nur gültige Werte berücksichtigt.
Welchen Wert muss die letzte Ausprägung der Häufigkeitstabelle in der Spalte “kumulative Häufigkeit” aufweisen?
100
Wann ist es sinnvoll Ausprägungen zu Kategorien zusammenzufassen, bevor man sie in einer Häufigkeitstabelle darstellt?
Bei intervallskalierten Variablen oder ordinalsaklierten Variablen mit vielen Ausprägungen (z.B. Gehalt)
Dabei werden Merkmalsausprägungen systematisch gruppiert. Ziel ist eine bessere Übersicht.
Wonach richtet sich die Merkmalskategorisierung?
Nach deme gewünschten Differenzierungsgrad und der Größe der Stichprobe
Wofür ermittelt man die Kategorienbreite?
Wenn man bleichgroße Kategorien bilden möchte. Dazu ermittelt man zunächst die Variationsbreite als Differenz aus den größten und kleinsten Wert und dividiert diesen durch die Gewünschte Anzahl an Kategorien.
Welche sechs Kriterien müssen bei der Bildung von Kategorien beachtet werden?
*die Anzahl der Kategorien soll eine Differenzierung ermöglichen, aber nicht zu hoch sein
*Kategorien sollten die gleiche Breite haben
*jede Kategorie sollte zumindest eine gewisse Anzahl an Fällen aufweisen
*“Natürliche” Schwellwerte müssen berücksichtigt werden
*Kategoriebildung unabhängig von Ausreißerwerte
*Grenzen der Kategorien müssen plausibel sein
Welche sechs Kriterien müssen bei der Bildung von Kategorien beachtet werden?
*die Anzahl der Kategorien soll eine Differenzierung ermöglichen, aber nicht zu hoch sein
*Kategorien sollten die gleiche Breite haben
*jede Kategorie sollte zumindest eine gewisse Anzahl an Fällen aufweisen
*“Natürliche” Schwellwerte müssen berücksichtigt werden
*Kategoriebildung unabhängig von Ausreißerwerte
*Grenzen der Kategorien müssen plausibel sein
Wie wird die Analyse eines einzelnen Merkmals genannt?
Univariante Analyse?
Was ist eine Bivariante Analyse?
Die Analyse von zwei Merkmalen