statestik 2 Flashcards
t-test:
Testar om medelvärde skiljer sig från ett visst värde (oftast 0). Logiken bakom: Skiljer sig de två medelvärdena vi vill jämföra (H1) eller inte (H0)? Vi vill veta om de två olika observationerna har samma fördelning (i termer av medelvärdet) eller inte. För att göra det räknar vi ut hur osannolika våra observationer vore om H0 stämmer (att de har samma medelvärde). Om vårt resultat är tillräckligt osannolikt (lägre än 5%) ”förkastar” vi H0.
T-fördelning
Handlar om beräkning av konfidensintervall när vi har en okänd standardavvikelse. När standardavvikelsen är okänd använder vi t-fördelningen för att beräkna konfidensintervall, som har samma form men representerar större osäkerhet. t-fördelningens exakta form beror på antalet frihetsgrader (degrees of freedom = df), ju fler frihetsgrader desto mer lik den normalfördelningen. t-värden i en t-fördelning motsvarar z-värden i en normalfördelning. t-fördelningen används för att göra t-test.
stickprov
De deltagare vi faktiskt observerar och gör mätningar på.
Signifikanstesting
Signifikanstestning: Även kallat nollhypotestestning. Handlar om att vi vill testa ett visst populationsmedelvärde definierat av nollhypotesen H0. Vi tittar på hur ovanligt resultatet är i vårt stickprov (eller mer extrema resultat) är om H0 var sann.
scaterplot
Värdet på två variabler samtidigt, bra att se samband.
sampelfördelning
Fördelningen mellan stickprov. Kan även användas för annat än medelvärdet tex korrelation. Handlar om resultatet som helhet, sammanfattat av något estimat som beror på alla observationer – inte om enskilda observationer. Därför vill vi veta hur det estimatet fördelar sig över olika stickprov – är resultatet i vårt stickprov ovanligt under H0 tar vi det som ett tecken på att H0 inte stämmer. Använder även ”stora talens lag” (law of large numbers) som säger att (bra) estimat kommer tendera att hamna närmare det sanna populationsvärdet desto större n är.
Riktad hypotes
Vi säger att effekten kommer gå åt ett visst håll. Tex ”Grupp 2 har högre poäng på variabeln än grupp 1”. Riktade hypoteser har lägre kritiska gränser (som motsvarar alfanivå tex 1,96 för tvåsidig alfanivå 0,05) eftersom de bara gränsar åt ett håll.
Power
Hur ofta testet klassificerar sanna hypoteser som sanna. Påverkas av bland annat alfanivån, typ av test, stickprovets storlek, studiedesignen, effektstorleken i populationen och standardavvikelsen i populationen.
Posterior
Sannolikheten att en effekt vi tror på (alltså en signifikant effekt) är sann på y-axeln.
Population
Alla möjliga ”deltagare” av det vi är intresserade av (tex högskolestudenter i Sverige), ofta omöjligt att studera till fullo.
P-hacking
Ett statistiskt problem som är kopplat till replikationskrisen och massignifikans. Endast signifikanta resultat publiceras.
Percentiel/kvartiler
Hur många procent/kvartiler av värdena som ligger under det värdet.
Pearson’s korrelationskoefficient
arametiskt test. Mäter styrkan på linjära samband mellan variabler. Antaganden: Intervall eller kvotskala, parvisa mätningar (bivariant), normalfördelade populationsvärden, linjärt samband och inga extremvärden. Påverkas mycket av extremvärden. Desto starkare korrelation, desto närmare kommer observationerna följa en rak linje, när korrelationen är svagare kommer observationerna vara mer utspridda utanför linjen. Eftersom det hamnar mellan -1 och +1 är det en standardisering av korrelation. Här vill vi se hur ovanligt det vore att få minst en så pass stark korrelation vi har fått i stickprovet om korrelationen i populationen var lika med noll. Om tillräckligt ovanligt (vanligtvis lägre än 5% chans) så tas detta som en indikation på att korrelationen i populationen inte är noll.
Parametrisk test
Ett typ av test som förutsätter vissa saker hos datan. Exempelvis att datan är på intervall- eller kvotskala samt att det är normalfördelade populationsvärden.
Parameter
Ett ”sant” värde i populationen tex sanna medelvärdet för populationen.
Ryktad hypotes
Om inferentiell statistik: vad är vår hypotes? Oriktad hypotes innebär att man inte specificerar en särskild riktning för effekten. Tex ”det finns skillnad mellan två grupper i variabeln”.
Ordinalskala
Här har vi data där vi kan rangordna och jämföra, men skillnaden mellan varje enhet är inte konstant eller definierad. Exemplet inkluderar betygsskala (tex låg, medel, hög) eller enkäter med svarsalternativ som ”mycket oenig, oenig, neutral, enig, mycket enig”.
Oberoende t-test
Parametiskt test. Vi vill jämföra två olika grupper. Antaganden: Intervall- eller kvotskala, oberoende mätningar, normalfördelade populationsvärden och homogena populationsvarianser. Vi vill se hur många standardfel bort från H0 som vår observation är (differensen mellan våra medelvärden), om tillräckligt många är det ovanligt att observera, och vi tar stöd mot H0. Större t-värde än kritiskt värde = statistiskt signifikant.