statistik Flashcards
vad innebär en diskret variabel?
kan anta diskreta värden i ett intervall (ex, antal godkända elever, antal översvämningar)
vad innebär en kontinuerlig variabel?
kan anta vilka värden som helst i ett intervall (ex, ålder, mängd co2 i atmosfären)
förklara nominalskala
icke-ordnade kategoriska variabler (ex, kön, art, sysselsättning)
förklara ordinalskala
ordnade kategoriska variabler (ex betygskala, utbildningsnivå)
förklara intervallskala
numrerisk skala med ordning mellan mätvärdena (ex, temp, år)
förklara kvotskala
intervallskala med väldefinierad nollpunkt (ex, längd, vikt)
utfallsrum
betecknas Omega, mängden alla möjliga utfall
vad är en diskret slumpvariabel?
en slumpvariabel som antar värden i en diskret mängd
väntevärden E[x] = μ beskriver?
kan tolkas som medelvärde
Variansen Var(x) = σ^2
mått på hur mycket en uppsättning tal varierar från medelvärdet
kvadratroten ur variansen kallas?
standardavvikelsen
Bernoulli-fördelning
när x kan anta två värden med sannolikhet p & 1-p (ex, ja/nej, sant/falskt)
binomialfördelning
används för att beskriva summan av oberoende & likafördelade försök där var o ett har två möjliga utfall (specifik händelse har samma sannolikhet för varje försök)
multinomialfördelning
oändligt antal men fler än två möjliga utfall, används ofta till kategorisk data (ex, antal personer med blodgrupp 0,A,B osv)
poissonfördelning
beskriva antal händelser av ett visst slag, där händelserna inträffar oberoende av varandra.
ex, antal samtal till ett callcenter, antal dödsfall i cancer /år
vad är en kontinuerlig slumpvariabel?
slumpvariabel som kan anta vilket värde som helst inom ett intervall
stora talens lag innebär?
Vid många n, går medelvärdet mot väntevärdet
t-fördelning
“plattare” kurva, tjockare svansar, större risk för extremobservationer, används för små populationer
Chi2 (X^2)-test
används för att se om två kategoriska variabler är beroende av varandra
F-fördelning
kan användas för variansanalys & regressionsanalys
punktskattning
skattning representeras av ett enda värde
intervallskattning
skattning representeras av ett intervall av troliga värden
p-värde
sannolikheten för ett minst lika extremt utfall som det observerade utfallet på testvariablen, givet att nollhypotesen är sann.
kan också tolkas som minska signifikansnivå för vilket nollhypotesen kan förkastas.
enstickprovs t-test
ex, studerar en egenskap i en population
tvåstickprovt t-test
ex, studerar en egenskap i två populationer
welch t-test
en egenskap i två populationer, vill jämföra om väntevärdena är lika
parat t-test
i en population vill vi observera objekt under olika omständigheter, ex före & efter behandling
z-test
känd varians, testar medelvärdet av en fördelning
anpassningstest
utvärdera om en kategorisk variabel följer en given sannolikhetsmodell (ex, tärningskast)
homogenitetstest
utvärdera om fördelningen av en kategorisk variabel skiljer sig mellan två/flera grupper (ex, är poliovaccinet effektivt?)
oberoendetest
utvärdera om det finns samband mellan två kategoriska variabler
parametriska metoder testar –>
skillnad i medelvärde
icke-parametriska metoder testar –>
skillnad i fördelning
korrelationsanalys
visar riktning & styrka i ett samband mellan två variabler
korrelationskoefficienten mäter –>
graden av linjärt samband mellan x & y värdena
okorrelerade = ?
oberoende!
regressionsanalys
vill ta reda på vilka bakomliggande faktorer som styr ett visst resultat
variansanalys
undersöka skillnader i medelvärde & varians mellan två/flera populationer
flervägs-ANOVA
hur två/fler oberoende variabler påverkar den beroende variabeln