Tentafrågor Flashcards

1
Q

Vad händer när antalet frihetsgrader ökar?

A

Då närmar sig t-fördelningen standard normalfördelningen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är kovariansen för något?

A

Det är ett mått på linjärt beroende mellan två variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

När man skapar ett konfidensintervall för ett populationsmedelvärde i en normalfördelad population med okänd varians kan man vara säker på att konfidensintervallets bredd minskar då stickprovsstorleken ökar. Sant eller falskt?

A

Falskt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad har Empiriska regeln för distanser?

A

+ - σ 68,26%
+ -σ2 95,44%
+ -σ3 99,72%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är skillnaden mellan att vara symetriskt klockformat fördelad och vara normalfördelad?

A

Symetriskt klockformat fördelad- kan man använda empiriska regeln.

Normalfördelad- då får man göra om värdet till ett z-värde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hur konstruerar man en boxplot?

A

1.

  • arrangera observationerna från minsta till största
  • identifiera minsta värdet, 25 percentilen, 50 percentilen, 75 percentilen och det största värdet.

Beräkna en percentil som faller mellan två värden på följande sätt:
ex. Undre värdet+ %(övrevärdet -undrevärdet)
2. identifiera de olika värdena: minsta största och de tre percentilerna.
3. Rita upp diagramet.
4.Identifiera outliers:
Beräkna IQR:Q3-Q1
-dra ett streck från Q1 och ett från Q3 som är IQRx 1.5 långt. Alla värden som hamnar utanför dessa är outliers. och betecknas med en asteriks.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad innebär Chebyshev’s Theorem?

A

Chebyshev’s theorem används för att fastställa proportionen av observationer som faller inom ett viss intervall ex. 2 s mer och 2s mindre än medelvärdet.

K= är antalet standaravvikelser åt man adderar och subbtraherar med.

Formeln är 1-1/k^2 (upphöjt i 2)

Fördelen är att man kan använda denna beräkning även om datasettet inte är normalfördelat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad innebär urvalsbias?

A

Urvalsbias—systematiskt uteslutande av vissa
grupper.
-Literary Digest begick urvalsbias då man exkluderade
väljare som inte läste deras tidning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad innebär bortfallsbias?

A

Bortfallsbias—systematisk skillnad i preferenser
mellan respondenter och icke-respondenter i en
undersökning.

  • Literary Digest hade bara 24% svarsfrekvens. Detta tyder
    på att bara de som var riktigt engagerade i valet tog sig tid
    att svara på enkäten. Dessa respondenter kan alltså vara
    icke-representativa för hela populationen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad innebär OSU?

A

OSU är ett stickprov om 𝑛 observationer som har
lika stor sannolikhet att väljas som vilket som
helst annat stickprov av storlek 𝑛.
 De flesta statistiska metoder förutsätter OSU.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad innebär bernulli processen?

A

Den består av en serie med n oberoende och identiska händelser av ett experiment:

  • För varje händelse finns det bara två resultat: framgång/motgång.
  • Sannolikheten för framgånd/motgång förblir den samma från gång till gång.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad innebär en Binomial random variable?

A

Antalet framgångar i n försök i en bernulli process.

Ex. Hur många spelare i start 11:an skadade sig under en match. 2 av 11.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

När används den hypergeometriska distributionen?

A

När vi tar stickprov utan att ersätta något från en population vars storlek N inte är särskilt mycket större än stickprovet. Vid stort N så är sannolikheten knappt förändrad och därmed irrelevant.

Ex. tre klasar bananer a 15 st med 3 dåliga bananer i.
Sanno för att få en dålig är 3/15. Om vi tar upp en dålig så är sanno för att få upp en dålig igen 2/14.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

När tillfredställer en poission process?

A
  • Antalet framgångar inom ett tids eller rums interval är lika med 0 och uppåt till oändligheten.
  • Alla framgångar som räknas i ett ej överlappande interval är oberoende.
  • Sannolikheten för framgång i ett interval är samma för alla intervall av samma storlek och som är propertioneligt till storleken av intervalet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är en parameter och vad är en statistika?

A

En parameter ex pop.medelvärdet är en konstant medan

En statistika är en slumpvariabel ex. xbar vars värde beror på det valda stickprovet. Xbar är en typ av estimator erller punktskattning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad säger Central limit theorem?

A

Att summan eller genomsnittet av ett stort antal oberoende observationer från samma underliggande fördelning har en ungefärlig normal fördelning.

17
Q

När är stickprovsstorleken tillräckligt stor för att stickprovsproportionen skall räknas som Normalfördelad?

A

np≥5 och n(1-p)≥5

18
Q

När ska man använda “The finite population correction#?

A

När stickprovet utgör minst 5% av populationen.

Formeln skrivs: Roten ur N-n/N-1.

Standarderror för Xbar är: den vanliga multiplicerat med ovanstående uträckning.

19
Q

Hur minskar man risken för både typ 1 och typ 2 fel i hypotestest?

A

Ändå sättet att minska båda är att öka stickprovsstorleken.

Om vi minskar risken för ett typ 1 så ökar vi risken för ett typ 2 och tvärt om. Om vi inte har råd att öka stickprovsstorleken så får man försöka minska risken att begå det fel som anses vara mest kostsamt.

20
Q

Vad innebär det att jämföra ett standardiserat µ med xbar i ett hypotestest? H0: =

A

Det innebär att det standardiserade Xbar står för antalet standardavvikelser från µ som är noll.

21
Q

Vad innebär p-värdet?

A

Det är ett värde som är minst ≥ xbar och står för den observerade %-nivån att begå ett typ ett fel. Därför förkastar man H0 om p-värdet < α.

För ett två svans test beräknas det 2 P(Z≥z) om z>0 och 2P(Z≤z) z<0.

För ett T test beräknas det

22
Q

Vad innebär α?

A

Det är den %-nivå vi tillåter oss att räka begå ett “Typ 1fel”

23
Q

Viktigt kritiska värde testet, Z-värden!

A

Vid vänster svans-test och två svans test skall det vara ett minus - innan za.

24
Q

Viktika z-värden för Kritiska värde testet:

A
Z.10: 1.28?
Z.05: 1.645
Z.025: 1.96
Z.01: 2.33?
Z.005: 2.576
25
Q

Vad händer om man får en negativ teststatistika för ett två svans t-test?

A

T intervallet blir precis samma oavsett om det är negativt eller positivt.

26
Q

Är det sant att medianen är mindre än medelvärdet för en exponentielt fördelad slumpvariabel?

A

Ja

27
Q

Vad händer då signifikansnivån ökar i i ett intervall?

A

Då blir konfidensintervallet bredare.