Statistik 3, HT-22 Flashcards
● Population
teoretiskt begrepp, det vi är intresserade av (t.ex. alla läkare i Sverige)
● Parameter
– värde som beskriver populationen
● Estimat
värde som vi mätt eller beräknat från stickprovet
Z-Värde
● Ett sätt att skriva om (transformera) data så att varje värde beskriver hur
många standardavvikelser det är från medelvärdet
● Ändrar bara enheten på data, inte värdena (jmfr. att skriva om miles till km)
● z-värden innebär en standardisering av data, så att man enklare kan
jämföra variabler med varandra
Variationsbredd
skillnaden mellan det högsta och lägsta värdet
Variansanalys ANOVA
Variansanalys är en statistisk metod som används för att ta reda på om stickprovsmedelvärden skiljer sig signifikant från varandra. Man är dock inte, som vid t-test, begränsad till endast två stick- provsmedelvärden utan kan ha hur många grupper (nivåer på den oberoende variabeln) som helst.
Varians & Standardavvikelse
värde under vilket en viss andel av fördelningen ligger
Utts 2. The difference between statistical signi cance and practi-cal importance, especially when using large sample sizes.
Utts 3.
The difference between finding “no effect” or “no differ-
ence” and finding no statistically signicant effect or difference,
especially when using small sample sizes.
Utts
- When it can be concludedthat a relationshipis one of cause
and effect, and when it cannot, including the difference between
randomized experiments and observationalstudies.
Resisting the temptation to make a causal conclusion is par-
ticularly dif cult when a causal conclusion is logical, or when
one can think of reasons for how the cause and effect mecha-
nism may work. Therefore, when illustrating this concept for
students, it is important to give many examples and to discuss
how confounding variables may account for the relationship.
Fortunately, examples are easy to nd. Most major newspapers
and Internet newssitesreport observationalstudiesseveral times
a week, and they often make a possibly erroneous causal con-
clusion.
T-test oberoende
T-test Beroende
● Stickprov
Praktiskt begrepp, de värden vi har mätt (t.ex. alla läkare i vår undersökning)
Statistisk power. 2 p
Skriv in ditt svar här
Statistik 1
Vid Statistik 1 ligger fokus på deskriptiv statistik, och vi går in mer på hypotesprövning och inferentiell atistik vid Statistik 2.st
Stickprov:
Stickprovet är ett antal observationer, mätvärden på en variabel (ex. 10 personers reaktionstid när de har druckit en kopp kaffe)
Standarvvikelse
● Roten ur summan av kvadraten av alla observationers avvikelse från
medelvärdet delat med antalet datapunkter minus ett
Spridningmått
innebär olika mått på hur data är fördelad
Spearmans rangkorelationskoefficient (rs)
● Baserad på observationers rangordning istället för deras z-värden
● Används t.ex. när data är på ordinalskala, när data inte är normalfördelad
eller när det förekommer extremvärden
● Kan också användas för monotona icke-linjära samband
Samplingsfördelning.
Sampelvariation:
Statistik 2 och 3
Vid Statistik 2 går vi igenom grunder för statistisk hypotesprövning och inferentiell statistik, och vi återkommer också till en del av dessa resonemang och principer vid Statistik 3
Sampelvariation: (Eng. sampling error. Detta begrepp används inte i litteraturen, men är användbart för att förstå en viktig aspekt av den inferentiella statistiken här.) Det handlar om att slumpmässigt dragna stickprov varierar slumpmässigt. Det är en källa till statistisk osäkerhet som vi kan beräkna, och ange tex som ett 95 % konfidensintervall när vi vill använda m för att estimera µ. Sampelvariationen påverkas av två saker: 1. den sanna variationen i populationen, och 2. storleken på stickprovet (ex. blir vi mer säkra i våra bedömningar av det sanna medelvärdet om 1. människors reaktionstid generellt inte varierar så mycket, och/eller 2. om vi många observationer i vårt stickprov).
Regressionskoefficient. 2 p
Skriv in ditt svar här
Regression
● Används för att förutsäga värdet av en variabel baserat på värdet av en
annan
● Innefattar en (eller flera) regressionskoefficient(er) och ett intercept
● Till skillnad från korrelation är det viktigt att skilja på vilken variabel som är
beroende och oberoende variabel
Population:
Population: Det är alla mätningar som vi är intresserade av i vår undersökning. Inom den inferentiella statistiken är populationen alla möjliga mätningar på en variabel som intresserar oss. Observera att populationen här alltså handlar om något oändligt, i stil med: om vi hade kunnat ta alla möjliga mätningar av det som intresserar oss (ex. alla möjliga mätningar av reaktionstid för människor som druckit en kopp kaffe). Det vanliga inom forskning är ju att vi faktiskt vill lära oss mer om fenomen som gäller större grupper (tex människor generellt, eller gymnasieelever i Sverige). Vid Statistik 2 ägnar ni mer tid åt detta (så begreppet utvecklas mer nedan).
Percentiler & kvartiler
värde under vilket en viss andel av fördelningen ligger