B&W Multipel regressionsanalys Flashcards
Vad beskriver korrelationer?
Graden av styrka vid linjära samband mellan två variabler.
Vad säger korrelationer ingenting om?
Kausalitet eller vad som är beroende eller oberoende variabel.
Vad användes regressioner till?
Regression används för att predicera/förutse värden på en utfallsvariabel (Y), baserat på värden i en annan variabel (X).
Vilket är ett grundantagande för en regression?
- Det finns ett samband
2. Funktionellt samband mellan X (prediktor) och Y (utfall). Att X beror på Y.
Vad visar linjen vid en korrelation?
Styrkan av sambandet mellan variablerna
Vad visar regressionslinjen?
De predicerade värdevärdena på Y för varje värde på X
Vad baserar man antagandena på angående variabelpåverkan vid regression?
Baserade i teoretiska antaganden eller empiriska resultat.
Hur benämner man Y och X vid en regression?
Y = utfallsvariabel
X = Prediktor
Vad kan vara bra att göra med sin data innan man börjar räkna korellationer?
Plotta ut den.
Vad kallas prediktionsfelet för vid regressioner?
Residualer
Hur räknar man ut resedualerna?
Summerar samtliga punkters avstånd (avvikelse) till linjen och kvadrerar dem.
= SSR
Denna metod kallas för least squares.
Reggressionskoefficienten (b, eller beta) ?
Vilken effekt varje ändring på X har.
Vad menas med r2
Andelen förklarad varians av X.
Vad säger SST?
Andelen total varians mellan mätpunkter och medelvärdet.
Vad säger SSM
Andelen varians som förklaras av modellen.
Vad säger SSR
Andelen oförklarad varians.
Vad är regressionsfelslutet?
Regression to mean
Vad måste finnas bakom de inlagda prediktorerna vid en multipel regression enligt förelösningen?
Teorier
Vad är poängen med en MR?
Att med fler OV predicera en BV
Vad är multikollinearitet?
När man har två OBV som är starkt korrelerade sinsemellan kallas det för kollinearitet.
När det är 3 eller flera OBV som samvarierar starkt kallas det för multikollinearitet.
Vad medför multikollinearitet?
Minsk Minskad tillförlitlighet hos regressionsekvationen: Olika stickprov kan ge olika resultat.
Svårigheter att tolka resultatet: Ju fler prediktorer som starkt korrelerar med varandra vi använder oss av, desto svårare blir det att avgöra det unika bidraget av varje enskild prediktor.
Minskad vinning med ytterligare prediktorer: För varje ytterligare prediktor vi stoppar in i regressionsekvationen minskar sannolikheten att den verkligen bidrar med något nytt som de tidigare prediktorerna inte tagit upp. Till en början ökar prediktionsförmågan när vi använder fler prediktorer men vinsten blir snart mindre och mindre tills nya prediktorer inte bidrar med något alls.
Vad beräknar man för att upptäcka multikol….?
Toleransvärde - Hur stor del av prediktorn som INTE kan flrklaras av variansen i den andra.
VIF
Vad menas med adjusted R2 = 0.5?
Att 50% av variationen i y kan förklaras med variationen av samtliga x
Vilka antaganden finns om MR?
Stora stickprov - Ju fler prediktorer desto fler undersökningsdeltagare.
Undvik multikollinearitet - Undvik Toleransvärde < 0.10
Kontrollera för outliners - Var försiktig att inkludera individer vars standardiserade resedualer är > 3.3 eller < -3.3
Datan ska vara normalfördelad
Vilka tre metoder finns vid MR?
Enter
Hierarkisk
Stepwise
Vad är R
Sambandsstyrkan med samtliga X
Vad är adjusted R2
Förklarad varians i populationen av samtliga X?
Vad är Std. Error of the Estimate?
Prediktionens standardfel = SD för residualerna. Här skillnaden mellan individernas faktiska framgång och predicerade framgång. Ju högre desto osäkrare blir prediktionen.
Vad menas med standardiserade koeffesienter?
Variablerna är z-transformerade så att de är i samma skala. Det går då att uttala sig om effektstyrkeförhållanden mellan prediktorerna.
Här pratar man om ökning i SD
Vad menas det om en koefficient inte är signifikant?
Dennes bidrag i modellen är inte signifikant.
Hur många observationer menar power pointen är önskvärd per BV?
5 minimum och ca 15 är önskvärd.
Vad menas med “moderatoreffet”?
Effekten av X1 på Y beror på X2
Vad säger signifikansprövningen av regressionen?
Predicerar regressionen bättre än slumpen?
SSm ska vara större än SSr.
Vad betyder egentligen korrelationen?
Spridningen i datapunkter.