Föreläsning 1 - p-värde, bayesfaktorn, icke-parametrisk statistik Flashcards

Question

Standardavvikelse

Answer 1

- Avvikelsen mellan individer i ett stickprov - Beskriver spridningen på mätvärden - Förkortas s

Answer 2

- Då stickprovet är tillräckligt stort kommer fördelningen över stickprovsmedelvärden närma sig normalfördelningen oavsett hur stickprovets fördelningen ser ut - Vad tumregel: när n (varje enskilt stickprov) ungefär är större än 30

Answer 3

Fördelning av olika stickprovs medelvärden

Answer 4

- Är en funnen effekt i stickprovet sann i populationen? - Hur säker kan vi vara att en skillnad mellan grupper i ett stickprov är sann i populationen?

Answer 5

Att vi från ett stickprov med storlek n och standardavvikelse s kan beräkna SE över normalfördelade medelvärden (under antagandet att H0 är sann)

Answer 6

Signifikanstestning - Antag att H0 är sann - Beräkna p-värde: sannolikheten att erhålla ett resultat som är minst så extremt som det faktiskt erhållna resultatet om H0 vore sann

Answer 7

Hypotestestning - H1 som motpol till H0 - a-nivå = signifikansnivå är förväntad frekvens av typ I fel (att dra felaktig slutsats att H1 är sann) - B- nivå är förväntad frekvens typ II fel (missa att H1 är sann)

Answer 8

- Antingen har en osannolik händelse inträffat eller så är H0 falsk - Ju mindre p desto starkare evidens mot H0 - P är en egenskap hos data

Answer 9

- Dikotom beslutstrategi för att välja mellan H0 och H1 - Involverar inget p-värde då kriteriet bestäms av alfa-nivån - Typ I- och typ II fel

Answer 10

- Ska vara lika med alfanivån som vi själva väljer - T.ex. 5% vilket innebär att om nollhypotesen är sann så kommer vi av misstag att förkasta den och göra typ I-fel i 5% av fallen (sannolikheten för att göra ett typ I-fel, givet att nollhypotesen är sann, är lika med 5%)

Answer 11

- Sannolikheten för att vi inte får ett signifikant resultat trots att nollhypotesen är falsk - Kallas beta

Answer 12

- En högre alfa-nivå - Fler undersökningsdeltagare - Större styrka på den oberoende variabeln - Mindre felvarians - Beroende mätningar

Answer 13

En hybrid mellan Fisher'ss och Neyman-Pearsons metoder som används numera - Presentera p-värden som ett kontinuerligt index mot H0 - Tillämpa sedan en dikotom beslutsstrategi enl Neyman-Pearson: behåll H0 om p > a, förkasta H0 om p < a

Answer 14

- Positiv kurtosis (tjockare svansar) - Används när man har ett litet stickprov eller inte vet populationens standardavvikelse

Answer 15

Sannolikheten att erhålla ett resultat som är minst så extremt som det faktiskt erhållna resultatet om H0 vore sann

Answer 16

Frekventistiskt mått på den förväntade frekvensen av typ 1-fel i det långa loppet (felaktigt förkasta H0) - Förbestämt tröskelvärde för när man kan förkasta nollhypotesen

Answer 17

Power = sannolikheten att finna en sann effekt Ökar med: - a-nivå (på bekostnad av ökad andel typ 1-fel, felaktigt anta en sann effekt) - effektstorlek (standardiserad effektstorlek kan ökas med ökad mätprecision) - Stickprovsstorlek

Answer 18

Effektstorlekar som är beroende av måttenheter Ex: - Procentuell förändring - Skillnad i medelvärden

Answer 19

Effektstorlekar oberoende av måttenheter (till exempel skillnader mätt i standardavvikelser) som bättre kan jämföras Olika standardiserade effektmått används för olika inferenstest och är inte direkt jämförbara, men kan oftast konverteras Ex: - Cohen's d - Pearsons r - Spearman's rho

Answer 20

Cohens d - Effektstorlek vid t-test - d = 0.2 small, 0.5 medium, 0.8 large Eta2 - Skillnader eller interaktioner vid ANOVA - Eta2 = 0.01 small, 0.06 medium, 0.14 large Pearsons's r - Korrelationer mellan två variabler - r = 0.1 small, 0.3 medium, 0.5 large

Answer 21

- Beskriver ett optimalt sätt att dra slutsatser från osäker information, och beräknar betingade sannolikheter av typen: Vad är sannolikheten för A givet att B inträffat (är sann)? - skrivs formellt p(AIB) Kan också skrivas som P(HIE) - sannolikheten att hypotesen (H) är sann baserat på evidens

Answer 22

- Härledd från Bayes teorem - Ett direkt mått på stödet FÖR eller EMOT en statistisk hypotes (jfr p-värdet som används som evidens/index mot H0) - BF jämför sannolikheten för data under en hypotes med sannolikheten för data under en annan hypotes (ett högt värde på BF indikerar stark stöd för hypotesen i jämförelse med alternativet) Tolkning: - Hur mycket mer sannolikt, eller mindre sannolikt, är resultatet givet H0 relativt H1 - T.ex. BF10 = 5, resultatet är 5 ggr mer sannolikt givet H1 än givet H0 - T.ex. BF10 = 1/5 = 0.2, resultatet är 5 ggr mer sannolikt givet H0 än givet H1 -

Answer 23

Probability - Hur sannolikt det är att något ska inträffa (med en fast fördelning) Likelihood - Specialfall av BF då båda hypoteser är punkthypoteser (fördelning som är rörlig)

Answer 24

- Används inom bayesiansk statistik men inte inom frekventisk - Den sannolika fördelningen som beskriven "the lilelihood" för ett givet värde innan någon data samlats in - T.ex. 50% för klave - Kan baseras på tidigare forskning, subjektiv expertis eller resonabla antaganden som baseras på studiens kontext

Answer 25

- Sannolikheten som kommer ifrån att uppdatera prior probabilitet med ny evidens - Den nya evidens refereras ofta till som likelihood

Answer 26

- BF har en direkt tolkning som kvoten mellan sannolikheter att erhålla resultatet givet de två hypoteserna, medans p-värdet inte har en enkel tolkning (är ett index mot H0) - BF kan variera mellan noll och oändlighet. P-värdet mellan noll och ett.

Answer 27

- Metoder för data som är på nominalskalenivå (kategorier) eller ordinalskala (rangskala) - alltså när medelvärde och standardavvikelse inte är meningsfulla mått - Små stickprov med ej normalfördelad data (skewness och kurtosis avviker mycket från noll) - När variansen skiljer sig stort mellan betingelserna

Answer 28

Fördelar: - I stort sett fria från restriktioner, kan nästan alltid användas - Ex. vi små stickprov med skeva fördelningar - Okänsligt för extremvärden i data Nackdelar: - Mindre power

Answer 29

- Chi2- analys (pearson) - mest använd - Fisher's exakta test - Binomialtest - Odds ratio

Answer 30

Vid skillnader: - Wilcoxon sign rank test (beroendedesign, inomgruppsdesign, ekvivalent med parametrisk inomgrupps t-test) Vid korrelationer: - Kendall's tau - Spearman's p (rho), samma som parametriskt pearson's r, men beräknad på ranker

Answer 31

Ställer frågan: - Skiljer sig stickprovets median från populationens median? - Är det någon skillnad mellan betingelser avs medianer? Inte så känslig för extrema värden Statistika: T- eller W-värde

Answer 32

- Publikationsbias - Låg statistisk power - P-value hacking