Allt om Regression Flashcards
Beskriv vad som menas med multikollinearitet, vad det har för implikationer, och hur det kan upptäckas.
Multikollinearitet betyder att två eller fler variabler i en analys är mycket lika varandra. Det blir som att försöka säga vem som gjorde vad i en grupp där alla gör samma saker.
Vad det leder till:
Svårt att veta vem som är vem: Det blir svårt att se vilken variabel som faktiskt påverkar resultatet.
Felaktiga slutsatser: Man kan tro att något har stor effekt när det egentligen inte har det.
Hur man ser det:
VIF: Ett tal över 5-10 betyder oftast att det är multikollinearitet.
Korrelationsmatris: Om variablerna är mycket korrelerade, kan det vara ett tecken.
Tolerance: Ett lågt tal, helst under 0,1, kan också visa på problem.
Vad man kan göra åt det:
Ta bort en variabel: Om två variabler är lika, kan man ta bort en av dem.
Kombinera variabler: Man kan slå ihop två liknande variabler till en.
Använda speciella metoder: Det finns sätt att analysera data som är bättre på att hantera detta problem.
Vad är multipel Regression?
En förklaring: Denna typ av regressionsmodell innehåller mer än en oberoende variabel. Den används för att förutsäga värdet på den beroende variabeln baserat på värdena för flera oberoende variabler.
ChatGPT:
Multipel regression är som att försöka förstå hur flera saker påverkar en annan sak samtidigt. Tänk dig att du försöker lista ut vad som påverkar hur snabbt en bil kan köra, och du tittar på saker som motorstorlek, vikt och luftmotstånd.
Här är det enkla sättet att tänka på det:
Flera variabler: Istället för att bara titta på en sak, tittar du på flera saker samtidigt för att se hur de påverkar en annan sak.
Bästa anpassningen: Modellen försöker hitta den bästa kombinationen av variabler för att förklara det du vill veta.
Koefficienter: För varje variabel får du en siffra som visar hur mycket den påverkar det du mäter. Ju större siffra, desto större påverkan.
Prediktioner: Efter att ha tränat modellen kan du använda den för att göra förutsägelser baserat på dina variabler.
Så, multipel regression hjälper dig att förstå hur flera saker tillsammans påverkar en annan sak.
Vad är regression?
ChatGPT:
Tre punkterna täcker de grundläggande aspekterna av regression:
Samband: Regression hjälper dig att identifiera och förstå sambandet mellan variabler.
Trendlinje: Med hjälp av data ritas en trendlinje för att bäst beskriva sambandet mellan variablerna.
Prediktioner: När trendlinjen är klar kan den användas för att göra förutsägelser baserat på dina variabler.
Så, ja, dessa tre punkter är kärnan i vad regression handlar om.
En annan källa skrev:
Använder regressionsanalysen när du vill ta reda på vilka bakomliggande faktorer som styr ett visst resultat.
När får man räkna en regressionsanalys?
- För varje X värde ska det finnas ett Y värde. (observationerna som talpar).
- Linjära samband
- Extremvärden ska man se upp för. Då det påverkar genomsnittet. Så det blir inte rättvist.
- Homoscedasticitet: Homogen spridning, jämn spridning!
- Normalfördelade residualer: vad är residualer: de som är kvar mellan mätpunkt och linjer. oförklard spridning.
Vad är normalfördelade residualre och snedfördelade residualer?
Normalfördelade residualer: data är normalfördelad
Snedfördelade residualer: data är INTE normalfördelade