Föreläsning 5 - regressionsanalys Flashcards
Vad används regressionsanalys till?
För att analysera förhållandet mellan beroende och oberoende variabler.
Regressionsanalys låter oss:
- Räkna ut om en/flera oberoende variabler har en signifikant relation med en beroende variabel.
- Avgöra styrkan på oberoende variablers effekt på en beroende.
- Förutsäga effekter av förändringar i parametervärden.
y = alfa + beta x + e. Vad säger beta?
Indikerar hur mycket den beroende variabeln (y) ändras när den oberoende variabeln (x) ändras med ett steg och resterande hålls konstanta.
Den beroende variabeln måste vara på vilken skala?
Intervall eller kvot. Likert funkar också.
Vilka krav måste uppfyllas för att kunna utföra regression?
- Sample size (104+k eller 30*k)
- Variablerna måste variera, måste ha varians
- Beroende måste vara på intervall, kvot eller likertskala.
- Ingen eller lite kollineratitet.
Hur kan man upptäcka och förhindra kollineratitet?
Upptäcks genom VIF.
Lösning: PCA, ta bort den högst korrelerande, gör inget.
Vad gör man om case saknar data på variabler som mäts?
Exclude cases listwise - tar bort samtliga case som saknar data.
Exclude cases pairwise - tar bort case som saknar data på varje enskild uträkning.
Vilka fem antaganden måste gälla för att resultaten från regressionen ska vara pålitliga?
- Modellen måste vara linjär
- Förväntat medelfel = 0
- Regressionsfelets varians måste vara konstant. (Beta fel)
- Felen oberoende, ej autokorrelation.
- Modellens fel ska vara normalfördelade.
Vad gör F-testet?
Testar om modellen är signifikant genom att kolla om någon av koefficienterna är skild från 0.
Vad beskriver R2?
Förhållandet mellan förklaringsgraden och den totala variansen. R2 är högt om avstegen från medelvärdet är stora i förhållande till hur stora steg de uppmätta värdena är från medelvärdet.
För att se om en koefficient är signifikant, och skild från noll, vad kan användas?
Ett t-test.
Hur kan modellen valideras?
Att lämna 30 % av casen för validering mot slutet är lämpligt.