Tentafrågor Flashcards
Vad händer när antalet frihetsgrader ökar?
Då närmar sig t-fördelningen standard normalfördelningen.
Vad är kovariansen för något?
Det är ett mått på linjärt beroende mellan två variabler.
När man skapar ett konfidensintervall för ett populationsmedelvärde i en normalfördelad population med okänd varians kan man vara säker på att konfidensintervallets bredd minskar då stickprovsstorleken ökar. Sant eller falskt?
Falskt
Vad har Empiriska regeln för distanser?
+ - σ 68,26%
+ -σ2 95,44%
+ -σ3 99,72%
Vad är skillnaden mellan att vara symetriskt klockformat fördelad och vara normalfördelad?
Symetriskt klockformat fördelad- kan man använda empiriska regeln.
Normalfördelad- då får man göra om värdet till ett z-värde.
Hur konstruerar man en boxplot?
1.
- arrangera observationerna från minsta till största
- identifiera minsta värdet, 25 percentilen, 50 percentilen, 75 percentilen och det största värdet.
Beräkna en percentil som faller mellan två värden på följande sätt:
ex. Undre värdet+ %(övrevärdet -undrevärdet)
2. identifiera de olika värdena: minsta största och de tre percentilerna.
3. Rita upp diagramet.
4.Identifiera outliers:
Beräkna IQR:Q3-Q1
-dra ett streck från Q1 och ett från Q3 som är IQRx 1.5 långt. Alla värden som hamnar utanför dessa är outliers. och betecknas med en asteriks.
Vad innebär Chebyshev’s Theorem?
Chebyshev’s theorem används för att fastställa proportionen av observationer som faller inom ett viss intervall ex. 2 s mer och 2s mindre än medelvärdet.
K= är antalet standaravvikelser åt man adderar och subbtraherar med.
Formeln är 1-1/k^2 (upphöjt i 2)
Fördelen är att man kan använda denna beräkning även om datasettet inte är normalfördelat.
Vad innebär urvalsbias?
Urvalsbias—systematiskt uteslutande av vissa
grupper.
-Literary Digest begick urvalsbias då man exkluderade
väljare som inte läste deras tidning.
Vad innebär bortfallsbias?
Bortfallsbias—systematisk skillnad i preferenser
mellan respondenter och icke-respondenter i en
undersökning.
- Literary Digest hade bara 24% svarsfrekvens. Detta tyder
på att bara de som var riktigt engagerade i valet tog sig tid
att svara på enkäten. Dessa respondenter kan alltså vara
icke-representativa för hela populationen.
Vad innebär OSU?
OSU är ett stickprov om 𝑛 observationer som har
lika stor sannolikhet att väljas som vilket som
helst annat stickprov av storlek 𝑛.
De flesta statistiska metoder förutsätter OSU.
Vad innebär bernulli processen?
Den består av en serie med n oberoende och identiska händelser av ett experiment:
- För varje händelse finns det bara två resultat: framgång/motgång.
- Sannolikheten för framgånd/motgång förblir den samma från gång till gång.
Vad innebär en Binomial random variable?
Antalet framgångar i n försök i en bernulli process.
Ex. Hur många spelare i start 11:an skadade sig under en match. 2 av 11.
När används den hypergeometriska distributionen?
När vi tar stickprov utan att ersätta något från en population vars storlek N inte är särskilt mycket större än stickprovet. Vid stort N så är sannolikheten knappt förändrad och därmed irrelevant.
Ex. tre klasar bananer a 15 st med 3 dåliga bananer i.
Sanno för att få en dålig är 3/15. Om vi tar upp en dålig så är sanno för att få upp en dålig igen 2/14.
När tillfredställer en poission process?
- Antalet framgångar inom ett tids eller rums interval är lika med 0 och uppåt till oändligheten.
- Alla framgångar som räknas i ett ej överlappande interval är oberoende.
- Sannolikheten för framgång i ett interval är samma för alla intervall av samma storlek och som är propertioneligt till storleken av intervalet.
Vad är en parameter och vad är en statistika?
En parameter ex pop.medelvärdet är en konstant medan
En statistika är en slumpvariabel ex. xbar vars värde beror på det valda stickprovet. Xbar är en typ av estimator erller punktskattning.