Viktigste repetisjon! Flashcards
Variansen beskriver […]. Hvordan kan vi gjøre varians (S2) om til standardavvik?
Variansen beskriver hvor langt verdiene avviker fra sentraltendensen.
Vi kan gjøre varians om til standardavvik ved å ta kvadratroten av variansen.
[…] bruker sannsynlighetsteori for å lage prediksjoner og trekke konklusjoner, mens […] ikke involverer sannsynlighetsteori.
Inferensiell statistikk bruker sannsynlighetsteori for å lage prediksjoner og trekke konklusjoner, mens deskriptiv statistikk ikke involverer sannsynlighetsteori.
Hva er forholdet mellom statistikk og parametere?
Vi beregner statistikk fra vårt utvalg for å estimere populasjonens parametere.
Så et parameter er en fast egenskap ved en populasjon, mens en statistikk er en verdi som oppsummerer data fra et utvalg.
Målet med […] er å avgjøre om de observerte dataene gir tilstrekkelig bevis for å forkaste nullhypotesen.
Målet med nullhypotesetesting (NHST) er å avgjøre om de observerte dataene gir tilstrekkelig bevis for å forkaste nullhypotesen.
Kurtose er en måling som forteller oss noe om […].
Kurtose er en måling som forteller oss noe om hvordan verdiene er fordelt i forhold til gjennomsnittet.
Tommelfingerreglene for hva som er “akseptabelt” varierer.
Tommelfingerregel (fra Gabors pp) sier at kurtose over eller under -2 indikerer et problem.
En mer presis estimering: del kurtoseskåren med dens standradfeil (SE) (det gir oss en z-skår). I dette tilfellet er kurtose problematisk hvis z-skåren er enten over 1.96 eller under -1.96.
Hva er uavhengig variabel?
Den variablen du manipulerer/endrer
Hva er avhengig variabel?
Det som måles i et eksperiment. Variabelen som påvirkes av uavhengig variabel.
Hva er statistikks hovedelementer?
Hovedelementene i statistikk er å beskrive, ta avgjørelser, predikere og rapportere.
* Beskrive verden på en forenklet måte (uten å miste relevant informasjon)
* Beslutte ting basert på data i møte med usikkerhet
* Forutsi fremtidige hendelser ved å bruke kunnskap fra tidligere situasjoner
* Rapportere resultater
Hva er hovedmålet til statistikk generelt?
Hovedmålet til statistikk er å forstå den komplekse virkeligheten gjennom enkle begreper som fanger de essensielle aspektene.
Hva er deskriptiv statistikk?
- Deskriptiv statistikk har som mål å beskrive mønster i data, som betyr at den oppsummerer og beskriver de viktigste egenskapene til et datasett.
- Bruker variabler.
- Oppsummerer data med spesielle mål, for eksempel gjennomsnitt.
- Lager grafer for å visualisere data.
Hva er slutningsstatistikk?
Inferensiell statistikk/slutingsstatistikk har som mål å forklare og predikere fenomener.
* Tester hypoteser med statistiske modeller.
* Trekker konklusjonerom “generelle prinsipper” i populasjonen, basert på utvalg.
* Lager prediksjoner for fremtidige hendelser.
Hva er nominal-skala?
Nominal-skala er det mest grunnleggende målenivået. Variabelen kan klassifiseres i gjensidige utelukkende kategorier. Her differensierer vi. Eksempel kan være bosted, blodtype, politisk parti og fylke
Hva er ordinal-skala?
Ordinal-skala har egenskapen med at variabler kan organiseres ut ifra kategorier, og kategoriene kan rangeres, men det er ikke lik avstand mellom kategoriene. Eksempel kan være likert-skala, “uenig- litt uenig-nøytral- litt enig-enig” eller stadier av kreft.
Hva er intervall-skala?
Intervall-skala har egenskapen ved at det er like intervaller mellom verdiene, i tillegg til at de kan kategoriseres og rangeres.
Hva er ratio-skala?
Ratio-skala er det samme som intervall-skala, men de har også et absolutt nullpunkt. Eksempel kan være høydemål eller inntekt målt i kroner.
Hva er kvartiler og kvantiler? Hvorfor er de viktige?
Kvartiler og kvantiler er spredningsmål, og er viktige fordi det sier noe om variasjonen i et datasett.
Kvartiler er verdier vi oppnår ved å dele fordelingen i fire deler som inneholder like mange tilfeller. Fordi vi deler datasettet i 4 deler, vil vi få 3 kvartilverdier (1., 2. og 3. kvartil) som definerer grensene mellom disse delene.
Den første kvatilen representerer skillet mellom de første 25% og de resterende 75%. Andre kvartil tilsvarer medianen og deler datasettet i to med 50% av datasettet på hver side av medianen. Den tredje kvartilen skiller de første 75% av dataene og de siste 25% av datene
Kvantiler tilsvarer kvartiler bare at her velger man et vilkårlig antall kvantiler som deler distribusjonen inn i like store deler. Der hver del inneholder like mange tilfeller. Dette velges ut ifra hva som er hensiktsmessig.
Hva er varians og standardavvik? Hva representerer de?
Variansen og standardavvik sier noe om gjennomsnittlig avvik fra gjennomsnittet, men de gjør dette i ulike enheter.
Variansen er gjennomsnittlig avvik fra gjennomsnittet, men svaret er kvadrert. Problemet med varians er at det representerer kvadratiske enheter (eksempel: kopp * kopp), og derfor er det nyttig å konvertere det til enheten for det opprinnelige målet, som vi gjør ved å regne ut standardavviket.
Hva er Z-transformasjon? Hva kan det bli brukt til?
Z-transformasjon gir standardiserte variabler (z-skår) som reflekterer hvor langt hver verdi i utvalget er fra utvalgets gjennomsnitt, i enheter for standardavvik. Z-transformasjon gir z-skårer.
(“Med hvor mange standardavvik er en poengsum under eller over gjennomsnittet?”)
Z-transformasjon gjør det mulig å sammenligne to eller flere skårer målt i ulike måleskalaer. For eksempel så kan du sammenligne en skår på humør fra 0-20, og en skår på søvn fra 0-50, for å si hvem av de som er mest avvikende fra andre pasienter med depresjon.
Hva er sannsynlighet? Hva er viktige egenskaper?
Sannsynlighet er en del av matematikken som omhandler hendelser eller utfall som involverer et element av usikkerhet.
Sannsynlighet kan uttrykkes som et tall som beskriver sjansen for forekomsten av en bestemt hendelse ut av alle hendelser i utfallsrom (“sample space”). Utfallsrommet er en samling av alle mulige utfall.
Sannsynligheten for et utfall skal alltid være mellom (og inkludert) 0 og 1.
Sannsynligheten for alle utfall innenfor utfallsrommet skal totalt bli 1.
Hva er forskjellen mellom en frekvensfordeling og sannsynlighetsfordeling?
En frekvensfordeling viser hvor hyppig hver av verdiene våre er i vårt utvalg. Mens en sannsynlighetsfordeling viser sannsynligheten for at hvert utfall vil inntreffe. Men en frekvensfordeling og en sannsynlighetsfordeling fra samme datasett vil være proporsjonal og se lik ut, men verdiene på y-aksen endrer fra frekvens til sannsynlighet, mens x-aksen forblir lik.
Hva er en gausskurve/normalfordeling?
Hos mennesker vil man ofte få en normalfordeling av data når man har et stort nok utvalg.
En normalfordelingskurve kjennetegnes ved at den er unimodal (en topp), symmetrisk, asymptotisk (det vil si at halene på normalfordelingskurven aldri kommer helt ned 0 på y-aksen, halene vil i fortsette å nærme seg 0 i det uendelige, men aldri nå det) og fordelingen er klokkeformet (“bell curve”).
Normalfordelingskurven er definert av to parametere: gjennomsnitt (μ) og standardavvik (σ). Gjennomsnittet vil være verdien som tilsvarer toppen av kurven, og standardavviket påvirker bredden på kurven.
I en normalfordeling vil verdiene fordele seg slik: (68-95-99.7-regelen)
* 68,3 % av verdiene vil være innenfor +/- 1 standardavvik fra gjennomsnittet
* 95,4 % av verdiene vil være innenfor +/- 2 standardavvik fra gjennomsnittet
* 99,7 % av verdiene vil være innenfor +/- 3 standardavvik fra gjennomsnittet
Regelen for fordeling av verdier i en normalfordeling
I en normalfordeling vil verdiene fordele seg slik: (68-95-99.7-regelen)
* 68,3 % av verdiene vil være innenfor +/- 1 standardavvik fra gjennomsnittet
* 95,4 % av verdiene vil være innenfor +/- 2 standardavvik fra gjennomsnittet
* 99,7 % av verdiene vil være innenfor +/- 3 standardavvik fra gjennomsnittet
Hvorfor er normalfordeling viktig?
Fordi dersom utvalget er normalfordelt er det mer sannsynlig at det kommer fra en normalfordelt populasjon.
Det betyr at våre statistiske estimater og konklusjoner trolig er mer presise, som vil si at man kan trekke en konklusjon om populasjonen basert på utvalget.
Hva kan man bruke en standardisert normalfordeling til?
Siden vi ofte jobber med et signifikansnivå på 5 % og et utvalg som er normalfordelt , er det nyttig å kjenne Z-skårene som tilsvarer 5 % av “ekstremdata” (data veldig langt fra gjennomsnittet av 0).
Når vi har tatt en z-transformasjon vil gjennomsnittet være på 0 og standardavviket er på 1.
I en standardisert normalfordeling faller 95 % av dataene mellom -1,96 og 1,96.
Dermed er det 5 % sannsynlighet for at en verdi enten er over 1,96 eller under -1,96 (2,5 % sannsynlighet at enhver tilfeldig valgt verdi er under -1,96, og 2,5 % sannsynlighet for over 1,96)
Med andre ord: for standard normalfordeling er -1,96 og 1,96 de kritiske verdiene for 5 % av “ekstrem” data.
Dette er viktig for signifikanstesting på 5 % signifikansnivå, hvis vi har å gjøre med en standardisert normalfordeling.