Det vigtigste Flashcards

1
Q

Hvad er binomialfordeling?

A

beskriver sandsynligheden for et bestemt antal successer i en række uafhængige forsøg, hvor hvert forsøg har to mulige udfald (succes eller fiasko) og samme sandsynlighed for succes. Parametrene er antallet af forsøg (n) og sandsynligheden for succes (p).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

hvad er stokastisk variable?

A

er en variabel, der kan tage forskellige værdier med forskellige sandsynligheder. Der findes to hovedtyper: diskrete og kontinuerte stokastiske variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

hvad er standardafvigelse?

A

Et mål for spredningen af data omkring gennemsnittet. Standardafvigelsen er kvadratroden af variansen, og den viser, hvor meget data varierer fra gennemsnittet i gennemsnit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er den kumulativ binomialfordeling funktion?
hvad gør den?

A

Sandsynligheden for at opnå et bestemt antal succeser eller færre i en række af forsøg.

anvendelsen: Bruges til at beregne sandsynligheden for at en binomial variabel ligger inden for et bestemt interval.

Dette er nyttigt, fordi det giver os mulighed for at beregne sandsynligheden for at opnå op til et bestemt antal succeser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

hvad er poissonfordeling?

A

det giver sandsynligheden for at x hændelser sker inden for et givet tidinterval

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

hvad er t-fordeling?
hvornår anvendes fordelingen?

A

en fordeling, der ligner normalfordelingen, men har bredere haler. Den bruges især når standardafvigelsen skal estimeres fra en stikprøve, og den har få frihedsgrader.

Jo flere observationer, desto mere ligner t-fordelingen normalfordelingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

hvad er en standardnormal fordeling?

A

Standardisering af en normalfordeling betyder at omregne til en standard normalfordeling, hvor gennemsnittet er 0 og variansen er 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

hvad er p-værdien?

A

sandsynligheden for at opnå de resultater, som ses i undersøgelsen. Bruges til at vurdere statistisk signifikans.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

hvad er en binær variabel?

A

En binær variabel er en type variabel, der kun kan tage en af to mulige værdier feks. 0 og 1. Disse værdier repræsenterer typisk to modsatte tilstande, muligheder eller kategorier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

hvad er en hypotesetest?

A

En metode til at finde ud af, om en antagelse er rigtig eller ej. Man tester, om en påstand holder ved hjælp af data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

hvad er nulhypoteseH0 og alternative hypotese Ha?

A

Ha: En påstand om, at der er en forskel eller effekt
H0: at der ikke er nogen forskel eller effekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

hvad er en varians?

A

Gennemsnittet af de kvadrerede afvigelser fra gennemsnittet. Det er et mål for, hvor spredt dataene er omkring gennemsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

hvad er ordinary least squares (ols) ?

A

en metode til at estimere koefficienterne i en lineær regressionsmodel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

hvad er en simple lineær regression?

A

metode, der modellerer forholdet mellem to variable ved at tilpasse en lige linje til dataene. Linjen beskriver, hvordan den afhængige variabel ændrer sig, når den uafhængige variabel ændrer sig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad er forskellen mellem t-statistik og en z-statistik?

A

t-statistik bruges, når stikprøvestørrelsen er lille, og/eller populationens standardafvigelse er ukendt.

z-statistik bruges, når stikprøvestørrelsen er stor, og/eller populationens standardafvigelse er kendt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

hvad er en multipel lineær regression?

A

En lineær regression med flere uafhængige variable. Modellen skrives som: y = β₀ + β₁x₁ + … + βₖxₖ + ε, hvor ε repræsenterer tilfældig støj.

16
Q

hvad er en trendlinje?

A

Trendlinjen repræsenterer således den lineære model, der er blevet tilpasset dataene, og den bruges til at forudsige eller estimere værdier af den afhængige variabel (indkomst) baseret på værdier af den uafhængige variabel (arbejdstid).

17
Q

Hvad er determinationskoefficient (R²)

A

En måleenhed, der viser, hvor godt dataene passer til regressionsmodellen; R²-værdien ligger mellem 0 og 1.

18
Q

hvad er en lineære regression?

A

analysere forholdet mellem en uafhængig variabel og en afhængig variabel.

19
Q

hvad er anova?

A

en statistisk metode til at sammenligne gennemsnit mellem flere end to grupper for at se, om der er signifikante forskelle mellem dem.

20
Q

Hvad er between-treatment variability?

A

Between-treatment variability måler, hvor meget variabilitet der er mellem grupper i en ANOVA.

21
Q

Hvad bruges Analysis ToolPak til?

A

Et Excel plug-in, der bruges til at udføre statistiske analyser, herunder lineær regression.

22
Q

Hvad er den centrale grænsesætning (CLT)?

A

Gennemsnit er normalfordelt, selv hvis den variabel
man tager et gennemsnit af ikke er normalfordelt

23
Q

Hvad er en eksponentielfordeling?

A

hvor lang tid der går mellem noget sker.

24
Q

Hvad er en uniform fordeling?

A

En uniform fordeling er en, hvor der er lige stor sandsynlighed for
alle udfald (inden for et interval).

25
Q

Hvad er en normalfordeling?

A

fordeling, er en symmetrisk fordeling omkring gennemsnittet. Kurvens form er klokkeformet, og størstedelen af værdierne ligger tæt på gennemsnittet.

26
Q

Hvad er korrelation?

A

mål for styrken og retningen af en lineær sammenhæng mellem to variable. Korrelationen varierer mellem -1 og 1, hvor 1 angiver en perfekt positiv sammenhæng, -1 angiver en perfekt negativ sammenhæng, og 0 angiver ingen lineær sammenhæng.

27
Q

Hvad er kovarians

A

Et mål for, hvordan to variable varierer sammen.

28
Q

Hvad bruges scatterplot til?

A

graf, der viser forholdet mellem to variable med punkter. Hver punkt repræsenterer en observation, og scatter plots bruges ofte til at identificere korrelationer mellem variable.

29
Q

Hvorfor bruger vi en regressionsanalyse?

A

Regressionsanalyse bruges til at modellere og analysere forholdet mellem en afhængig variabel og en eller flere uafhængige variabler.