VL 8 - MANOVA & logistische Regression Flashcards
Wann wird eine multivariate Varianzanalyse (MANOVA) berechnet?
Einfluss /Zusammenhang mind. 1 kategorialen UV mit mehreren metrischen AVs
Was ist der wesentliche Unterschied zwischen einer ANOVA und MANOVA?
ANOVA: immer nur 1 metrische AV und bei MANOVA mehrere metrische AVs –> eine Stufe höher als ANOVA
Was überprüft die MANOVA?
sehr globales Verfahren das überprüft, ob es zwischen irgendwelchen Stufen einer UV und einer Kombination der AVs einen Unterschied gibt
Wozu eignet sich die MANOVA nicht gut?
zum Überprüfen von Hypothesen, da sehr allgemeines Verfahren
Was wird automatisch bei der Berechnung einer MANOVA berücksichtigt?
es werden automatisch die Beziehungen (Korrelationen) zwischen den AVs berücksichtigt
Welches Verfahren hat (fast) immer eine größere Power - MANOVA o. mehrere ANOVAs, und wieso?
MANOVA hat (fast immer) eine größere Power als mehrere ANOVAS zusammengenommen, da die optimale Kombination der AVs gebildet wird
Was bezeichnet die “optimale Linearkombination” bei der MANOVA?
AVs werden automatisch so kombiniert, dass sie einen maximalen Zusammenhang zur UV aufweisen, d.h. dass sich maximale Gruppenunterschiede ergeben
Was ist ein großer Vorteil von der MANOVA im Unterschied zu mehreren ANOVAs?
dass nicht für jede AV ein eigener Signifikanztest durchgeführt wird –> keine alpha-Fehler-Kumulierung
Was sind 4 Eigenschaften der MANOVA? (Wdh.)
- Analyse eines globalen Zusammenhangs zwischen einer oder mehreren UVs und mehreren AVs
- Beziehungen zwischen den AVs werden berücksichtigt.
- alpha-Fehler-Kumulierung wird (zunächst) vermieden
- (meist) höhere Power als ANOVA wg. optimaler Linearkombinationen der AVs
Was sind Nachteile der MANOVA?
sehr globales Ergebnis –> möchte man wissen, auf welchen AVs dieser Unterschied vorhanden bzw. besonders groß ist, muss man ANOVAs durchführen o. eine Diskriminanzanalyse
–> da werden Beziehungen zwischen AVs aber NICHT mehr berücksichtigt
–> evtl. alpha-Fehler-Kumulierung
Wann ist der Einsatz der MANOVA sinnvoll?
gemeinsame Analyse von Variablen, die zum selben theoretischen Rahmen gehören
Was ist eine Diskriminanzfunktion (auch: Diskriminanzfaktor)?
eine gewichtete Summe der AVs
Wieviele Diskriminanzfunktionen gibt es bei der MANOVA bei k Stufen der UV?
k-1
Wie werden die Gewichte zweier Diskriminanzfunktionen berechnet bei der MANOVA?
- Gewichte der 1. Diskriminanzfunktionen werden so berechnet, dass die 1. Diskriminanzfunktion maximal zwischen den Gruppen ( z.B. Therapieformen) trennt
- Gewichte der 2. Diskriminanzfunktion werden so bestimmt, dass sie in Bezug auf die noch verbleibenden Unterschiede maximal trennt
Was sind Eigenwerte, und wie hängen diese mit Diskriminanzfunktionen zusammen?
Varianzaufklärung durch die jeweilige Diskriminanzfunktion
–> es gibt also für jede Diskriminanzfunktion einen Eigenwert
Je höher der Eigenwert einer Diskriminanzfunktion…
…desto besser trennt die Diskriminanzfunktion zwischen den Gruppen
Was sind 4 Prüfgrößen der MANOVA?
- Wilks lambda
- Pillai-(Bartlett)-Spur
- Hotelling-Spur
- Roys größte Wurzel
Aus was werden die Prüfgrößen der MANOVA berechnet?
aus den Diskriminanzfunktionen
Welche Prüfgröße d. MANOVA wird am ehesten signifikant?
Roys größte Wurzel
Welche Prüfgröße d. MANOVA ist am robustesten?
Pillai-(Bartlett)-Spur
Wann sollte der Pillai-Test d. MANOVA verwendet werden?
wenn die Erfüllung der Voraussetzungen zweifelhaft oder grenzwertig ist (kleine und/oder ungleich große Stichproben)
Was ist das gebräuchlichste Maß d. MANOVA?
Wilks Lambda
Was sind 3 Voraussetzungen d. MANOVA?
- Unabhängigkeit d. Fehlerkomponenten
- multivariate Normalverteilung der AVs
- Homogene Varianz-Kovarianz-Matrizen
Wie wird die Voraussetzung d. homogenen Varianz-Kovarianz-Matrizen d. MANOVA überprüft?
über Box-Test
Auf Verletzung welcher beiden Voraussetzungen reagiert die MANOVA wann robust?
- multivariate Normalverteilung der AVs
- homogene Varianz-Kovarianz-Matrizen
WENN die Stichproben groß und gleich groß sind
Wann kann der Box-Test ignoriert werden?
bei gleich großen Stichproben
Was sind 2 Anschlussverfahren d. MANOVA?
- ANOVAs
- Diskriminanzanalyse
Worüber gibt die ANOVA als Anschlussverfahren d. MANOVA Auskunft?
ob die UV einen Zusammenhang mit einer bestimmten AV zeigt
–> ABER die Beziehungen zwischen den AVs werden dann nicht berücksichtigt
Worüber gibt die Diskriminanzanalyse als Anschlussverfahren d. MANOVA Auskunft?
welche der AVs im Rahmen der MANOVA besonders starkes Gewicht haben
Was macht die Diskriminanzanalyse?
- Verfahren, um anhand der Ausprägung auf metrischen Prädiktorvariablen Gruppenzugehörigkeit (AV) vorherzusagen
- Prädiktoren werden so kombiniert, dass eine optimale Klassifikation gelingt
- Diskriminanzfunktionen werden zunächst anhand von bekannter Gruppenzugehörigkeit berechnet
- um danach unbekannte Gruppenzugehörigkeit vorherzusagen –> Klassifikation
Wieso sind Diskriminanzanalyse und MANOVA zwei Seiten desselben Sachverhaltes?
geht um den Zusammenhang zwischen mehreren metrischen Variablen (=AV bei der MANOVA, =UV bei der Diskriminanzanalyse) und einer (oder mehreren) kategorialen Variablen (Gruppen)
Was sind 3 Varianten d. MANOVA?
- mehrfaktoriell (mehrere UVs) –> Interaktion berücksichtigt
- f. abhängige Stichproben
- multivariate ANCOVA (=MANCOVA) –> metrische und dichotome Prädiktoren
Welchen Zusammenhang überprüft die logistische Regression?
Zusammenhang metrischer Prädiktoren mit 1 kategorialen AV
Was wird bei der log. Regression untersucht?
ob die Wahrscheinlichkeit für jede der beiden Kategorien von der Ausprägung der Prädiktorvariablen abhängt
Was sind 3 Gründe wieso ein anderes Verfahren (log. Regression) benötigt wird als bei der multiplen Regression?
- Form d. Funktion ungeeignet (wir brauchen einen Wertebereich von 0 bis 1)
- Voraussetzung der Normalverteilung nicht erfüllt (AV dichotom)
- Voraussetzung der Homoskedastizität nicht erfüllt
Was sind 3 Darstellungsweisen der logistischen Regression?
- Bedingte Wahrscheinlichkeiten
- Wettquotienten (Odds Ratio)
- Logit
Was ist bei den 3 Darstellungsweisen der logistischen Regression gleich, und was unterschiedlich?
- Für jede Darstellungsweise ergibt sich eine andere Form der Funktion zwischen Prädiktoren und Kriterium
- Interpretation d. Regressionsparameter ist unterschiedlich
- Regressionsparameter sind jeweils GLEICH
Welche Form hat die Funktion der Wahrscheinlichkeit im logistischen Regressionsmodell?
Ogive
Wie werden die Koeffizienten d. log. Regression berechnet?
Diese werden für einen bestimmten Datensatz anhand der Daten berechnet (geschätzt)
–> NICHT Kleinste-Quadrate-Kriterium
Was ist die Bedeutung von ß0 in der logistischen Regression?
„Wie wahrscheinlich ist ein Wert von Y=1, wenn X den Wert Null hat?“
(p=0,5)
Was ist die Bedeutung von ß1 in der logistischen Regression?
- bestimmt die Steigung der Wahrscheinlichkeitsfunktion
- “Wie stark wirken sich Unterschiede in X auf die Wahrscheinlichkeit aus?”
Wie verläuft die Kurve d. log. Regression je höher ß1 ist?
Je größer ß1, desto stärker wirken sich Unterschiede in X auf die Wahrscheinlichkeit von Y aus
–> Kurve verläuft dann steiler
Wie ist der Zusammenhang von X und Y in der log. Regression wenn ß1 =0 ist?
- dann gibt es keinen Zusammenhang von p(Y=1) und X
- Variablen X und Y sind dann unabhängig
Wie wirken sich die Regressionskoeffizienten ß0, ß1 und das Vorzeichen auf die Kurve d. log. Regression aus?
- Veränderung in b0: nach rechts oder links verschoben
- Veränderung in b1: Steilheit d. Kurve
- Vorzeichen: ob die Wahrscheinlichkeiten
mit zunehmenden x-Werten größer oder
kleiner werden
Mit welchem Verfahren werden die Parameter der log. Regression geschätzt?
Maximum-Likelihood-Verfahren
Was beschreibt die Likelihoodfunktion?
die Wahrscheinlichkeit für das Auftreten der in der Untersuchung vorliegenden Daten in Abhängigkeit von verschiedenen Ausprägungen der Regressionsparameter
Was ist eine weitere Annahme bei Berechnung der Likelihoodfunktion?
Das zugrundegelegte Modell passt überhaupt auf die Daten (keine überflüssigen Prädiktoren)
Welche verschiedenen Signifikanztests zur Überprüfung der Modellanpassungsgüte d. log. Regression existieren? (2 Bsp.)
- Devianztest
- Hosmer-Lemeshow-Test
Was ist der Wettquotient (odds ratio) bzw. stellt er dar?
entspricht dem Verhältnis einer Wahrscheinlichkeit und ihrer Gegenwahrscheinlichkeit
Was ist der logit und was ist ein Vorteil des logits?
- Logit = logarithmierter Wettquotient
- Vorteil: Analogie zur linearen Regression (der Logit von Y ist eine lineare Funktion von X)
Was ist die Bedeutung der Regressionskonstanten bei der multiplen logistischen Regression?
Wahrscheinlichkeit, Wettquotientenverhältnis bzw. Logit, wenn alle Prädiktoren die Ausprägung 0 haben
Was ist die Bedeutung der Regressionsgewichte bei der multiplen logistischen Regression?
Auswirkung der Änderung einer Prädiktorvariablen, wenn die anderen Prädiktoren konstant gehalten werden
Was sind drei Möglichkeiten des Signifikanztests in der log. Regression?
- z-Test
- Wald-Test/Statistik
- Likelihood-Ratio-Test
Was prüft der Likelihood-Ratio-Test allgemein?
Kann generell die Likelihoods zweier Modelle miteinander vergleichen, wenn die Modelle ineinander geschachtelt
sind
Welcher der 3 Signifikanztests d. log. Regression ist vorzuziehen, und warum?
- Likelihood-Ratio-Test
- hat meist eine höhere Teststärke
Welche MANOVA Prüfgröße unterscheidet sich von allen anderen
Prüfgrößen und warum?
Roys größte Wurzel, basiert nur auf einem Eigenwert (hat
weniger Freiheitsgrade)
Auf welcher Größe basieren alle MANOVA Prüfgrößen?
Auf den Eigenwerten (der Diskriminanzfunktionen)
Warum sind die F-Werte aller MANOVA Prüfgrößen gleich, wenn man nur zwei Gruppen untersucht?
Da bei nur zwei Gruppen nur eine Diskriminanzfunktion und daher nur ein Eigenwert in der MANOVA resultiert