F8 Statistisk inferens i regression Flashcards
Hvad er antagelser for lineær regression?
- Potentielle outcomes må ikke korrelere med X, dvs. Fravær af selektionsbias
- Linearitetsantagelsen – der skal mere eller mindre være en lineær sammenhæng ml. X og Y
- Fravær af (indflydelsesrige) outliers
- Der skal være homoskedacitet
Hvad er homoskedacitet?
Når fejlleddets variation er uafhængig af X – det er konstant over X værdier. Fordeler sig jævnt!
Hvad er indflydelsesrige outliers?
En indflydelsesrig outlier er et datapunkt, der afviger markant for resten af datasættet, og derfor har en stor indflydelse på resultaterne af de statistiske analyser.
Hvad er heteroskedacitet?
Når fejlledet spreder sig ujævnt over X og dermed varierer sig på tværs af værdierne på X.
Vi kan tjekke for dette ved at lave et residualplot, og er der heteroskedacitet kan vi imødekomme det vha. Robuste standardfejl.
Hvad er robuste standardfejl?
En type standardfejl, der er justeret for at tage højde for visse problemer i data. Disse justeringer gør estimaterne mere pålidelige.