Vorlesung 8 Manova & Logistische Regression Flashcards
Wann wird eine multivariate Varianzanalyse (MANOVA) berechnet?
Einfluss/zusammenhang mind. 1 kategorialen UV mit mehreren metrischer AVs
Was ist der wesentliche Unterschied zwischen ANOVA und MANOVA?
ANOVA immer nur ein metrische AV und bei MANOVA mehrere metrische AVs
–> eine Stufe höher als ANOVA
Was überprüft die MANOVA?
Sehr globales Verfahren das prüft,ob es zwischen irgendwelchen Stufen einer UV und einer Kombination der AVs einen Unterschied gibt
Wozu eignet sich die MANOVA nicht gut ?
Zum überprüfen von Hypothesen, da sehr allgemeines Verfahren
Was wird automatisch bei der MANOVA berücksichtigt
Es werden automatisch die Beziehungen (Korrelationen) zwischen dem AVS berücksichtigt
Welches Verfahren hat fast immer eine größere Power MANOVA oder mehrere ANOVAS
MANOVA hat(fast immer) eine größere Power als ANOVAS zusammengenommen, da die optimale Kombination der AVs gebildet wird
Was bezeichnet die „optimale Linearkombination“ bei der MANOVA?
AVs werden automatisch so kombiniert, dass sie eine maximalen Zusammenhang zur UV aufwiesen, d.h. dass sich maximale Gruppenunterschiede ergeben
Was ist ein großer Vorteile der MANOVA im Unterschied zu mehreren ANOVAS?
Das nicht für jede AV ein eigener Signifikanztest durchgeführt werden muss
–> keine Alpha –Fehler –Kumulierung
Wa sind Eigenschaften der MANOVA?
- Analyse eines globalen Zusammenhanges zwischen einer oder mehreren UVs und mehreren AVs
- Beziehungen zwischen den AVs werden berücksichtigt
- Alpha– Fehler – Kumulierung wird (zunächst) vermieden
- (meist) höhere Power als ANOVA wegen optimaler Linearkombination der AVs
Was sind Nachteile der MANOVA?
- Sehr globales Ergebnis –> möchte man wissen, auf welchen AVs dieser Unterwchied vorhanden bzw. Besonders groß ist muss man ANOVAS durchführen oder eine Diskriminanzanalyse
–> dann werden Beziehungen zwischen AVs aber nicht mehr berücksichtigt
–> evtl. Alpha Fehler– Kumulierung
Wann ist der Einsatz der MANOVA sinnvoll ?
Gemeinsame Analyse von Variablen, die zum selben theoretischen Rahmen gehören
Was ist eine Diskriminanzfunktion (auch Diskriminanzfaktor)
Eine gewichtete Summe der AVs
Wie viele Diskriminanzfunktionen gibt es bei der MANOVA bei k Stufen der UV
K–1
Wie werden die Gewichte der Diskriminanzfunktionen berechnet bei der MANOVA?
- Gewichte der 1. Diskriminanzfunktionen werden so berechnet, dass die 1. Diskriminanzfunktion maximal zwischen 2 Gruppen trennt
- Gewichte der 2. Diskriminanzfunktionen werden so bestimmt, dass sie in Bezug auf die noch verbleibenden Unterschiede maximal trennt
Was sind Eigenwerte und wie hängen diese mit Diskriminanzfunktionen zusammen ?
Varianzaufklärung durch die jeweilige Diskriminanzfunktion
–> es gibt also für jede Diskriminanzfunktion einen Eigenwert
Je höher der Eigenwert einer Diskriminanzfunktion…
Desto besser trennt die Diskriminanzfunktion zwischen den Gruppen
Was sind 4 Prüfgrößen für die ANOVA
- Wilks lambada
- Pillai–(Bartlett)– Spur
- Hotelling– Spur
- Roys größte Wurzel
Aus was wird die Prüfgröße in der ANOVA berechnet ?
aus der Diskriminanzfunktion
Welche Prüfung der ANOVA wird am ehesten signifikant?
Roys größte Wurzel
Welche Prüfgröße der MANOVA ist am robustesten
Pillai– (Barlett)– Spur
Wann sollte der Pillai–Test der MANOVA verwendet werden ?
Wenn die Erfüllung der Vorraussetzungen zweifelhafte oder grenzwertig ist (klein und /oder ungleich große Stichproben)
Was ist das gebräuchlichste Maß der MANOVA?
Wilks Lambda
Was sind drei Vorraussetzungen der MANOVA?
1.Unabhängigkeit der Fehelerkomponente
2.multivariate Normalverteilung
3.Homogene Varianz–Kovarianz –Matrizen
Wie wird die Voraussetzung der homogenen Varainz–Kovarianz –Matrizen der MANOVA überprüft
Über Box Test
Auf Verletzungen welcher beiden Voraussetzungen reagiert die MANOVA wann robust ?
- multivariate Normalverteilung der AVs
- homogene Varianz–Kovarianz Matritzen
WENN Stichproben gleich groß und gleich groß sind
Wann kann der Box Test ignoriert werden
Bei gleich großer Stichprobe
Was sind 2. Anschussverfahren der MANOVA?
- ANOVAS
- Diskriminanzanalyse
Worüber gibt MANOVA als Anschlussverfahren der MANOVA Auskunft ?
Ob die UV eine Zusammenhang mit einer bestimmten AV zeigt
–> aber Beziehungen zwischen AVs werden dann nicht berücksichtigt
Worüber gibt Diskriminanzanalyse als Anschlussverfahren der MANOVA Auskunft?
Welches der AVs im Rahmen der MANOVA besonders starkes Gewicht haben
Was macht die Diskriminanzanalyse?
- Verfahren, um anhand der Ausprägung auf metrische Prädiktorvariablen Gruppenzugehörigkeit (AV) vorherzusagen
- Prädiktoren werden so kombiniert, dass eine optimale Klassifikation gelingt
- Diskriminanzfunktionen werden zunächst anhand bekannter Gruppenzugehörigkeit berechnet
- um danach unbekannte Gruppenzugehörigkeit vorherzusagen –> Klassifikation
Wieso sind Diskriminanzanalysen und MANOVA zwei Seiten desselben Sachverhalts?
Geht um Zusammenhänge zwischen mehreren Variablem (=AV bei der MANOVA, Uv bei der Diskriminanzanalyse) und einer (oder mehreren) kategorialen Variablen (Gruppen)
Was sind 3 Varianten der MANOVA?
- Mehrfaktoriell (mehrere UVS) –> Interaktion berücksichtigen
- für Abhängige Stichproben
- multivariate ANCOVA (=MANCOVA) –> metrische und dichotomische Prädiktoren
Welche Zusammenhänge überprüft die logistische Regression?
Zusammenhang metrischer Prädiktoren mit 1 kategorialen AV
Was wird bei der logistischen Regression untersucht ?
Ob die Wahrscheinlichkeit für jede der beidem Kategorien von der Ausprägung der Prädiktorvariablen abhängt
Was sind 3 Gründe warum ein anderes Verfahren (log. Regression) benötigt wird als bei der multiplen Regression?
- Form der Funktion ungeeignet (wir brauchen einen Wertebereich von 0 bis 1
- Voraussetzung der Normalverteilung nicht erfüllt
- Voraussetzung des Homoskedastizität nicht erfüllt
Was sind 3 Darstellungsweisen der logistischen Regression?
- Bedingte Wahrscheinlichkeit
- Wettquotienten (Odds Ratio)
- Logit
Was ist bei dem drei Darstellungsweisen der logistischen Regression gleich und was unterschiedlich ?
- für jede Darstellungsweise ergibt sich eine anderem Form der Funktion zwischen dem Prädiktoren
- Interpretation der Regressionsparameter ist unterschiedlich
- Regressionsparameter sind jeweils gleich
Welche Form hat die Funktion der Wahrscheinlichkeit im logistischen Regressionsmodell?
Ogive
Wie werden die Koeffizienten der logistischen Regression berechnet?
Diese werden für einen bestimmten Datensatz anhand der Daten berechnet (geschätzt )
–> nicht kleinste Quadrat Kriterium
Was ist die Bedeutung von ß0 in der logistischen Regression ?
„Wie wahrscheinlich ist ein Wert von Y=1 wenn x den Wert null hat ?
(p=0,5)
Was ist die Bedeutung von ß1 in der logistischen Regression
- bestimmt die Steigung der Wahrscheinlichkeitfunktion
- wie stark wirken sich Unterschiede in X auf die Wahrscheinlichkeit aus ?
Wie verläuft die Kurve der logistischen Regression je höher ß1 ist ?
Je größer ß1 desto stärker wirken sich Unterschiede in X auf die Wahrscheinlichkeit von Y aus
–> Kurve verläuft dann steiler
Wie ist der Zusammenhang von X und Y in der logistischen Regression wenn ß1= 0 ist ?
- dann gibt es keinen Zusammenhang von p(y=1) und X
- Variable x und Y sind dann unabhängig
Wie wirken sich die Regressionskoeffizienten ß0 und ß1 und das Vorzeichen auf die Kurve der Logistischen Regression aus ?
*Veränderung in b0: nach rechts oder links verschoben
* Veränderung in b1: Steilheit der Kurve
* Vorzeichen: ob die Wahrscheinlichkeit mit zunehmenden x Werten größer oder kleiner werden
Mit welchem Verfahren werden die Parameter der logistischen Regression geschätzt?
Maximum– Likelihood– Verfahren
Was beschreibt die Likelihoodfunktion ?
Die Wahrscheinlichkeit für das Auftreten der in der Untersuchung vorliegenden Daten in Abhängigkeit von verschiedenen Ausprägungen der Regressionsparameter
Was ist eine weiter Annahme bei der Berechnung der Likelihoodfunktion?
Das zugrunde liegende Modell passt überhaupt auf die Daten (keine überflüssigen Prädiktoren)
Welche verschieden Signifikanztests zur Überprüfung der Modellanpassungsgüte der logistischen Regression existieren
- Devianztest
- Hosmer– Lemeshow – Test
Was ist der Wettquotient bzw. stellt was stellt er da ?
Entspricht dem Verhältnis einer Wahrscheinlichkeit und ihrer Gegenwahrscheinlichkeit
Was ist der Logit und was ist sein Vorteil ?
- Logit= logarithmierter Wettquotient
- Vorteil: Analogie zur linearen Regression (der Logit von Y ist eine lineare Funktion von X)
Was ist die Bedeutung der Regressionskonstanten bei der multiplen logistischen Regression ?
Wahrscheinlichkeit, Wettquotientenverhältnis bzw. Logit wenn alle Prädiktoren die Ausprägung 0 haben
Was ist die Bedeutung der Regressionsgewichte bei der multiplen logistischen Regression ?
Auswirkungen der Änderung einer Prädiktorvariablen, wenn die anderen Prädiktoren konstant gehalten werden
Was sind drei Möglichkeiten des Signifikanztests in der log Regression?
- z- Test
- Wald – Test / Statistik
- Likelihood– Ratio Test
Was prüft der Likelihood – Ratio – Test
Kann generell die liklihoods zweier Modelle miteinander vergleichen , wenn die Modelle ineinander geschachtet
Welcher der 3 Signifikantestes der logistischen Regression ist vorzuziehen und warum ?
- Likelihood-Ratio- Test
- Hat meist die höchste Teststärke