Deskriptiv stat Flashcards
Kriterier for stikprøver
- Tilfældig: Hvert observation har samme sandsynlighed for at blive valgt I stikprøven som I populationen.
- Repræsentativ: Tilfældighed sikrer repræsentativitet.
Parameter vs. statistik
Parameter: Et deskriptiv mål for populationen (gennemsnit)
Statistisk: Et deskriptiv mål for stikprøven
Typer af kategorivariable
Nominal: Rækkefølge ingen betydning
Ordinal: Rækkefølge har betydning
Typer af kvantitative variable
Diskrete: Endeligt antal værdier
Kontinuerte: Uendeligt antal værdier
Measures of variability:
- Variance
- Standard deviation
- Coefficient of variation
Variance: S^2 (sigma I anden)
Standrad deviation: Sigma eller s
Coefficient of variation: Sigma / middelværdi
Coefficient of variation (CV):
Sigma / middelværdi (sigma divideret med middelværdi)
- AKA: Relative standard deviation because: standard deviation relative to the mean.
CV is used to compare two or more datasets.
Example: The same prices given in dollars and pesos would give to wildly different standard deviations, but the same CV.
Standardafvigelse
Mål for hvor meget observationerne I snit afviger fra middelværdien.
Afgør kurvens facon. Højere standardafvigelse = lavere toppunkt, tykkere haler.
I formlen står der n-1 I nævneren: “Hvis vi eksempelvis tager en stikprøve for højden for en række personer vil vi “næsten aldrig” få de meget lave eller de meget høje med I stikprøven. Dvs som sådan vil variansen I populationen altdi være højere end I stikprøven. Så for at tage højde for dette I stikprøven dividerer vi med n-1 fremfor n.”
Den empiriske regel
For symmetrisk fordeling:
+-1s: 68,3%
+-2s: 95,5%
+-3s: 99,7%
Correlation coefficient:
How strong is the relationship between the variables? Always from -1 to 1.
- Correlation coefficient = 1: The entire variability of one variable is explained by the other and vice versa.
- A high correlation means that the two variables tend to follow each other, but it doesn’t tell us that x increases because of y.
- Co.coef. = 0: The variables are independent.
- The correlation between x and y is the same as the correlation between y and x. But we have to understand causality: correlation does not imply causation.
- Positive correlation: >0
Negative correlation: <0
Komplementære og disjunkte hændelser
- Den komplementære hændelse til A består af de udfald i udfaldsrummet, som ikke er i A.
Disjunkte hændelser: udfald der udelukker hinanden
Fællessandsynlighed, foreningssandsynlighed, betinget sandsynlighed
- Fælles: Både a og b: P(A) x P(B)
- Forening: a eller b: P(A) + P(B) - P(A+B)
Betinget: A indtræffer givet betingelsen B: (P(A) x P(B)) / P(B)
- Forening: a eller b: P(A) + P(B) - P(A+B)