Statistik 3, HT-22 Flashcards

Question

Pearsons produktmomentkorrelationskoefficient (r)

Answer 1

● Standardiserat mått på samvarians, på intervallet r = [-1, 1] ● Kom ihåg: z-värden för en variabel är alltid både positiva och negativa ● Om positiva värden multipliceras med positiva och negativa multipliceras med negativa blir r positiv, om positiva värden multipliceras med negativa (och tvärtom) blir r negativ

Answer 2

Parameter: Stickprovets värden kan fungera som estimat av populationsvärden, parametrar, som då är de sanna värdena (tex µ, σ). Dessa kan vi inte mäta upp, så vi estimerar dem.

Answer 3

Om p-värden P = Sannolikheten att du kommer att observera samma effekt eller en mer extrem effekt, givet att nollhypotesen är sann P ≠ Sannolikheten att nollhypotesen är sann P ≠ Sannolikheten att du skulle få ett signifikant resultat vid 95% av framtida mätningar.

Answer 4

Oberoende variansanalys – beroende variansanalys Vid oberoende variansanalys har man olika individer i olika nivåer på den oberoende variabeln (dvs. en mellanindividsdesign). Vid beroende variansanalys har man antingen samma eller matcha- de individer i olika nivåer på den oberoende variabeln (en inom- individsdesign).

Answer 5

● En teoretisk fördelning av data med många användbara egenskaper ● Väldigt många typer av data är (approximativt) normalfördelade (t.ex. längd, reaktionshastighet etc.) ● Många statistiska test kräver (approximativt) normalfördelad data

Answer 6

Mann-Whitney & Wilcoxon Används när data inte uppfyller de parametriska kraven, till exempel vid en sned fördelning eller när data är på ordinalskala. Mann-Whitney används vid oberoende design och Wilcoxon vid beroende design.

Answer 7

● Ett mått på samvariation ● Kan vara positiv eller negativ ● Innebär inte kausalt samband

Answer 8

Konfidensintervall: För att ange den statistiska pricksäkerheten för ett estimat så kan vi ange konfidensintervall kring estimatet. Det vanliga är att intervallet anger 95 % konfidens (anges ibland som ±1,96 SE, se nedan om standardfel, SE). Intervallet anger vår statistiska osäkerhet (i andra sammanhang kan de kallas osäkerhetsintervall, eller felmarginal). Vad säger konfidensintervallet? Svar: Om vi hade tagit ett oändligt antal stickprov av denna storlek och beräknat 95 % KI kring varje stickprovsmedelvärde, då hade 95 % (eller 19 av 20) av alla dessa konfidensintervall täckt populationsmedelvärdet µ. Vi tillåter oss att förenkla detta en aning, och vi kan då säga vi är 95 % säkra på att det sanna värdet ligger inom det 95 %-iga konfidensintervall som vi har beräknat utifrån våra stickprovsdata (mer om sannolikhet och konfidens nedan).

Answer 9

Hypotesprövning: Vid Statistik 1 gör ni även hypotesprövning av korrelation, för att bedöma om ett samband är statistiskt signifikant. Då handlar det om inferentiell statistik, något som vi fördjupar oss mer i vid Statistik 2 (mer om hypotesprövning igen längre ner). Vad du gör vid Statistik 1 är att du beräknar korrelationen i stickprovet (ex. r = -0,11), och du hypotesprövar (signifikanstestar) för att bedöma sannolikheten att denna korrelation (eller en ännu starkare) uppstått givet att nollhypotesen är sann. På så sätt bedömer du om korrelationen är statistiskt signifikant.

Answer 10

Förklarad varians: Korrelationskoefficienten anger graden av samvariation mellan två variabler x och y (ex. r = -0,21). Den kvadrerade korrelationskoefficienten, determinationskoefficienten (ex. r2 = 0, 044 eller 4,4 % delad varians) anger på motsvarande sätt samvariationen mellan variablerna, som andelen förklarad varians. Den anger hur stor andel av variationen på x som kan förklaras av variationen på y (och tvärtom). Det viktiga, och luriga, här är att ”förklaras av” inte alls handlar om kausalitet, utan ska förstås som ”fångas av”, eller ”delas av”. Både r och r2 anger alltså samvariation, inte orsakssamband. Förklarad varians kan helt enkelt förstås som ”delad varians”. Tex. om sambandet mellan extraversion och skostorlek är r = -0,21, så kan 4,4 % av variansen i extraversion förklaras av variansen i skostorlek, de har 4,4 % delad varians. (Vi arbetar inte så mycket med detta inom denna kurs. Determinationskoefficienten, R2, återkommer inom senare metodkurser, i samband med multipel regressionsanalys. Den som är nyfiken och vill förstå detta lite bättre, har bra beskrivningar tex i inledningen av bokens kapitel om multipel regressionsanalys.)

Answer 11

Extremvärde: Eng. outlier. Den exakta definitionen av extremvärde kan variera (och om man har extremvärden i sin studie så anger man hur man valt att definiera extremvärde). Det som är viktigt att förstå, är att ett extremvärde inte är ett värde som ligger i utkanten av en fördelning. Extremvärden är värden som ”verkar fel”, det vill säga värdet avviker så mycket från övriga värden att det tycks tillhöra en annan fördelning, eller tyder på en felinmatning eller liknande. Extremvärden behöver identifieras och hanteras, på ett eller annat sätt, vilket du kan läsa mer om i boken (till Statistik 3).

Answer 12

Estimat: Deskriptiv statistik beskriver stickprovets värden (de värden som vi har mätt upp, tex m, sd). När ett stickprovsvärde används för att estimera, skatta, motsvarande parameter, så kallas det för ett estimat.

Answer 13

Enligt Cohen: r = 0.1 – svag korrelation r = 0.3 – medelstark korrelation r = 0.5 – stark korrelation

Answer 14

Chi2-test används när all data är på nominalskala, det vill säga i kategorier. Vi jämför vårt observerade utfall med det utfall som skulle bli om all data var jämnt fördelat över kategorierna.

Answer 15

When testing we can reach a standard within a sample population. It does not mean that this particular sample reflect the average of a larger population. Ex Height.

Answer 16

-Poor wording of questions, -Volunteer response - Socially desirable answers.

Statistik 3, HT-22 Flashcards

(42 cards)