Intro anova Flashcards
Vilken typ av test / statistik kan man använda för att testa samband?
- korrelation
–> om man har två variabler - Regression
–> om man har tre eller flera variabler
Vilket typ av test/ statistik kan man använda om man vill testa skillnad?
- t-test
–> om man har två grupper - Envägs-ANOVA (F-test)
–> om man har tre eller flera grupper - Flervägstest (F-test)
–> om man har två eller fler OBEROENDE variabler
Nämn de viktigaste måtten för beskrivande statistik
- centralmått
–> medelvärde för population eller stickprov
–> median
–> mode (mest frekvent förekommande) - spridningsmått
–> standardavvikelse för population eller stickprov
vad beskriver egentligen medelvärdet?
Medelvärdet beskriver var tyngdpunkten i fördelningen ligger
Vad är ett spridningsmått?
Spridningsmåttet beskriver hur stora felen är i vårt medelvärde
beskriv varians
Varians uttycker genomsnittlig avikelse från medelvärdet. Variansen är kvadrerad för att få med alla värden matematiskt (eftersom avvikelsen kan vara både positiv och negativ och kan ta ut varandra gör man alla värden positiva)
Beskriv standardavvikelse
standardavvikelsen är medelvärdet av avvikelser från medelvärdet. Standardavvikelse anges i samma skala som det vi mäter. (mäter vi t.ex. cm har vi standardavvikelse i cm tillskillnad från varians)
Standardavvikelsen beskriver hur mycket spridning vi har i vår data med utågngspunkt från medelvärdet
Vad är det vi vill veta när vi gör t.ex. variansanalys?
Vi vill veta vilken modell som beskriver vår data med så lite fel som möjligt.
–> Är det nollhypotesen eller alternativhypotesen som beskriver vår data med så lite fel som möjligt?
–> Enligt nollhypotesen beskriver vi vår data med så lite fel som möjligt med ett medelvärde. Inomgruppsvariansen > mellangruppsvariansen
–> Med alternativhypotesen beskriver vi vår data med så lite fel som möjligt med flera medelvärden. Dvs vi kan dela in vår data i två eller flera grupper. Mellangruppsvariansen> inomgruppsvariansen
Vi vill förstå om mellangruppsvariansen är mindre än inomgruppsvariansen
vad är det vi vill veta när vi gör korrelationsanalys elelr regressionsanalys?
Vi vill veta vilken modell som beskriver vår data med så lite fel som möjligt –> nollhypotesen eller alternativhypotesen.
–> nollhypotesen, det finns inget samband mellan våra variabler
–> alternativhypotesen, det finns ett positivt eller negativt samband mellan våra variabler
Vad menas med normalfördelning?
- En normalfördelad variabel antar ofta värden som ligger nära medelvärdet och mycket sällan värden som har en stor avvikelse.
- En normalfördelad kurva påminner om en kulle eller en klocka
- Enligt 68–95–99,7-regeln:
–> 68% är inom en standardavvikelse från medelvärdet.
–> Drygt 95% är inom två standardavvikelser från medelvärdet.
–> Drygt 99,7% är inom tre standardavvikelser från medelvärdet.
Vad menas med negativt skev?
Att svansen är mer negativ och huvudsakliga utfallet är mer positivt.
Hur bra bilförare är du jämfört med andra förare? tenderar ofta att bli negativt skev eftesom folk tror att dom är bättre än medel
Vad menas med positivt skev?
Att svansen är mer åt det positiva hållet och att huvudsakliga fördelningen är åt det negativa hållet
Hur stor risk är det att en specifik katastrof drabbar dig jämfört med andra? Folk tenderar att tro att det är större sannolikhet att en katastrof skall hända dom själva och är då vanligt att man ser en positiv skevhet.
vad menas med negativ toppighet?
Att kurvan är låg och tillplattad, det innebär att det finns stor spridning. Kanske för itet sample eller folk tolkar frågan olika
vad menas med positiv toppighet?
Kurvan är en hög spike. De flesta tycker lika dant, man håller bra precision.
Ju lägre standard error desto större precision i mätningarna, mindre osäkerhet och mindre fel.
vad innebär inferentiell statistik?
När man går från att fokusera på vad som är karaktäristiskt för stickprovet som man kollar på i den beskrivande statistiken och istället kollar på karaktäristiska i populationen
Man kikar då t.ex. på p-värde och konfidensintervall
Dvs när man går från stickprov till population
För att kunna göra uttananden om en hypotetisk population utifrån vårt stickprov måste stickprovet vara normalfördelat