Statistik Flashcards
Vad är skillnaden mellan Paired t-test och Independent t-test?
Paired t-test används för att jämföra två relaterade grupper, medan Independent t-test används för att jämföra två oberoende grupper
Exempelvis kan Paired t-test användas för att jämföra samma individer före och efter en behandling.
Definiera p-värde.
Sannolikheten, givet att nollhypotesen är sann, att observera ett testvärde lika eller mer extremt än det som observerades i stickprovet.
Vad innebär begreppet frihetsgrader?
Antalet värden som är fria att variera i en statistisk beräkning.
Vad används ANOVA för?
För att jämföra medelvärden mellan flera grupper.
Vad är SS, MS, och F-värde inom ANOVA?
SS: Sum of Squares, MS: Mean Square, F-värde: förhållandet mellan varians mellan grupper och varians inom grupper.
Vad är Chi-två Goodness of Fit?
Ett test för att avgöra om fördelningen i ett stickprov följer en viss förväntad fördelning.
Vad innebär Chi-två Test of Independence?
Ett test för att avgöra om två kategoriska variabler är beroende av varandra.
Definiera effektstorlek.
Ett statistiskt mått som anger styrkan eller storleken på en observerad skillnad eller ett samband i en studie, oberoende av stickprovsstorleken. Mao kompletterar effektstorleken signifikansnivåerna (t.ex. p-värden) genom att visa hur stort eller meningsfullt en effekt är i praktiken. Exempelvis Cohen’s d, η², och ω².
Vad är skillnaden mellan Typ I och Typ II fel?
Typ I fel: förkasta nollhypotesen när den är sann. Typ II fel: acceptera nollhypotesen när den är falsk.
Vad innebär korrelation?
Ett mått på hur två variabler rör sig i förhållande till varandra.
Vad är en oberoende variabel?
Den variabel som manipuleras för att observera effekten på den beroende variabeln.
Vad är ett urval?
En delmängd individer dragna från en population, helst slumpmässigt.
Vad är varians?
Snittet av alla kvadrerade avvikelser från medelvärdet.
Definiera normalfördelning.
En symmetrisk, klockformad fördelning kring medelvärdet där medelvärde, median och typvärde är lika.
Vad är en z-fördelning?
Normalfördelning med medelvärde 0 och standardavvikelse 1.
Vad är ett histogram?
Ett grafiskt verktyg för att visa fördelningen av data.
Vad innebär skewness?
Mått på hur mycket en fördelning är sned åt höger eller vänster.
Pos. skewness=lång svans åt höger.
Neg. skewness= lång svans åt vänster.
Ska vara så när 0 som möjligt.
Definiera kurtosis.
Mått på hur spetsig eller platt en fördelning är, svansarnas tjocklek är det viktiga i detta inte hur symmetrisk fördelningen är. Ju närmare 0 desto mer normalfördelad.
Vad är nollhypotesen?
Grundläggande idé inom statistisk hypotesprövning. Antar att ingen verklig effekt, samband eller skillnad finns mellan våra variabler.
Vad är alternativhypotesen?
Ställs mot nollhypotesen. Antar att det finns en verklig effekt, samband eller skillnad mellan våra variabler. Det man vill bevisa med sin studie.
Vad innebär standardiserad normalfördelning?
En normalfördelning med μ=0, σ=1.
Vad är samplingsfördelning?
Fördelning av stickprovsmedelvärden.
Vad är standardfel?
Standardavvikelsen i medelvärdets samplingsfördelning.
Vad betyder p-värde?
Sannolikheten, givet att nollhypotesen är sann, att observera ett testvärde lika eller mer extremt än det som observerades i stickprovet.
Vad är alfa-nivå?
Hur ovanlig en observation måste vara för att förkasta nollhypotesen, vanligtvis 5% (α = .05).
Vad händer om p < α?
Nollhypotesen förkastas, statistisk signifikans.
Vad innebär ett icke-signifikant resultat?
Vi fortsätter anta att nollhypotesen är sann.
Vad är typ I fel?
Falsk positiv slutsats, förkastar nollhypotesen trots att den är sann.
Vad är typ II fel?
Falsk negativ slutsats, behåller nollhypotesen trots att den är falsk.
Vad är power i statistisk testning?
Power (=testets styrka) ett mått på testets förmåga att upptäcka en verklig effekt, det vill säga att korrekt förkasta nollhypotesen när den faktiskt är falsk. Power definieras ofta som:
1−𝛽 (beta)
där β är sannolikheten för att begå ett typ II-fel (att inte förkasta nollhypotesen trots att det finns en sann effekt).
Vad betyder det att stickprovets standardavvikelse är väntevärdesriktigt estimat?
Det är ett bra estimat av populationens standardavvikelse.
Fyll i blank: Nollhypotesen säger att stickprovsmedelvärde = _______.
Populationsmedelvärde.
Fyll i blank: Alternativhypotesen säger att stickprovsmedelvärde INTE = _______.
Populationsmedelvärde.
Vilka faktorer påverkar Power?
- Effektstorlek: En större effekt gör det lättare att upptäcka skillnaden, vilket ökar testets power.
- Stickprovsstorlek: Ett större stickprov ger mer information och minskar osäkerheten, vilket också ökar power.
- Signifikansnivå (α): En högre signifikansnivå (t.ex. 0,05 istället för 0,01) gör det enklare att förkasta nollhypotesen, vilket ökar power, men risken för typ I-fel ökar samtidigt.
- Varians i data: Lägre varians (eller störningsnivå) gör att effekten blir tydligare, vilket ökar testets power.
Power är under kontroll endast när man designar och planerar en studie.
Vad innebär Cohens d?
Cohens d är en standardiserad effektstorlek som mäter skillnaden mellan två medelvärden i enheter av standardavvikelse
Det möjliggör jämförelse av resultat mellan studier.
Vad är önskvärd Power inom psykologi?
Önskvärd power inom psykologi var tidigare .80 nu vill man helst ha .90 eller .95.
Det innebär 80% chans att upptäcka en effekt som finns.
Vad är skillnaden mellan alfanivå och Power?
Alfanivå refererar till risken för att göra ett typ I fel (förkasta nollhypotesen trots att den är sann). Alfanivå på 5% = acceptera en 5% risk för typ I fel.
Power refererar till risken för typ II fel (Behålla nollhypotesen trots att den är falsk).
Power på .90 innebär 90% chans att korrekt förkasta nollhypotesen när den är falsk.
Vad är massignifikansproblemet?
Massignifikansproblemet uppstår när multipla statistiska tester utförs utan korrigering av p-värden, vilket ökar risken för typ I fel.
Det kräver korrigering av p-värden för att bibehålla en konstant risk för typ I fel.
Vad är p-hacking?
P-hacking refererar till att manipulera data tills något signifikant dyker upp utan att avslöja hur analysen utfördes
Det kan inkludera omotiverad analys av undergrupper.
Vad innebär HARK-ing?
HARK-ing står för Hypothesizing After Results are Known, vilket innebär att formulera hypoteser efter att resultaten har analyserats
Det ökar risken för övertolkning av fynd.