flashcards_chi2_regression
Hvad er en χ²-test?
En test, der bruges til at sammenligne observerede data med forventede data for at afgøre, om der er statistisk signifikante forskelle.
Hvornår bruges en χ²-test?
Når man vil teste, om en observeret fordeling passer til en forventet, eller om to variable er uafhængige.
Goodness-of-Fit test
Bruges til at teste, om data følger en bestemt fordeling, fx om en terning er fair.
Test for uafhængighed
Tester, om to kategoriske variable er uafhængige, fx om køn og stemmeadfærd hænger sammen.
Frihedsgrader i χ²-test
Antal kategorier minus 1, justeret for antallet af parametre, der estimeres.
Hvad er lineær regression?
En statistisk metode til at modellere og undersøge sammenhængen mellem en afhængig variabel og en eller flere uafhængige variable.
Formålet med lineær regression
At finde en lineær model, der bedst beskriver sammenhængen mellem variable og kan bruges til at forudsige værdier.
Simpel lineær regression
Undersøger sammenhængen mellem én afhængig variabel og én uafhængig variabel, fx løn og erfaring.
Multipel lineær regression
Undersøger sammenhængen mellem én afhængig variabel og flere uafhængige variable, fx huspriser baseret på størrelse, beliggenhed og antal værelser.
Forklaringsgrad (R²)
Måler, hvor stor en del af variationen i den afhængige variabel, der kan forklares af modellen. ( R² = 1 ) betyder, at modellen forklarer al variation.
Forudsætninger for lineær regression
- Lineær sammenhæng, 2. Uafhængige observationer, 3. Normalfordelte residualer, 4. Konstant varians i residualer (homoskedasticitet).
Residualer i regression
Residualer er forskellen mellem de observerede og forudsagte værdier. De bruges til at vurdere modellens nøjagtighed.
Anvendelse af χ²-test i praksis
Bruges fx til at teste, om kundernes køn og købsvaner er uafhængige.
Anvendelse af lineær regression i praksis
Bruges fx til at forudsige boligers salgspriser baseret på størrelse og beliggenhed.