Statistikk Flashcards
Datainnsamling - analyse og diagram
Numerisk/kvantitative data
Oppgis som tall og kan behandles med tallregning.
Eks: temperaturer, terningkast, høyder på målinger
Datainnsamling - analyse og diagram
Ikke-numerisk/kvalitative data
Datatyper som i utgangspunktet ikke er tallfestet
Eks: bilfarge, valgfag, kjæledyr etc
Datainnsamling - analyse og diagram
Datasett
Mengde utfall av et forsøk, registrerte forekomster av noe man studerer
Datainnsamling - analyse og diagram
Frekvens
Hvor mange ganger en dataverdi forekommer i et datasett
Datainnsamling - analyse og diagram
Relativ frekvens
Frekvens/antall observasjoner. Gir andel av en dataverdi relativt til datasettet (prosent)
Datainnsamling - ulike sentralmål
Middelverdi/Gjennomsnitt
(summen av dataverdier)/(antall observasjoner)
Datainnsamling - ulike sentralmål
Median
“Midten” i et sortert datasett.
- Oddetall antall observasjoner: midterste verdi
- Partall antall observasjoner: gjennomsnitt av de to midterste verdiene
Datainnsamling - ulike sentralmål
Typetall
Den verdien som forekommer oftest i et datasett. Hvis ikke et enkelt verdi peker seg ut er ikke typetallet definert.
Histogram
Et histogram er en grafisk framstilling av data hvor det er fornuftig å samle svarene i forskjellige grupper. Et histogram skiller seg fra et søylediagram ved at det er arealet, og ikke høyden av søylen som sier noe om mengden.
Søylediagram og stolpediagram
Søylediagram og stolpediagram er grafiske framstillinger av en frekvensfordeling der hver verdi på variabelen representeres av en søyle eller stolpe, og der lengden av denne illustrerer hvor stor andel av enhetene som har en bestemt verdi. En særegen type søylediagram er histogrammer, der arealet av søylene angir hyppigheten av variabelverdiene.
Forskjellen på søylediagram og stoplediagram er bredden på søylene/stoplene. Et stolpediagram er et søylediagram hvor søylene ikke har noen bredde
Sektordiagram
Et sektordiagram, som også kalles kakediagram, er velegnet til å vise relative frekvenser, altså en fordeling av en helhet, gjerne som prosentmessig fordeling av data eller klasser av data.
Sektordiagrammer tegnes gjerne som sirkler eller sylindere med lav høyde. Dataene blir fordelt i klasser, eller er naturlig fordelt allerede. Vi regner ut den prosentmessige fordelingen av dataene, kalt den relative frekvensen. Så tenker vi oss at arealet av hele sirkelen representerer alle dataene, det samme som 100 %. Fordelingen av dataene presenteres som sektorer (kakestykker) i sirklene, der sektorenes areal svarer til den relative frekvensen.
Linjediagram
Når vi studerer noe over tid, bruker vi et linjediagram for å vise resultater. Et eksempel på et studie er hvordan salg av smarttelefoner endrer seg over et år.
Et linjediagram tegnes i et koordinatsystem. Et punkt svarer til en observasjon på et bestemt tidspunkt. Det trekkes linjestykker mellom punktene. Linjestykkene kan være krumme eller rette. Siden data avhenger av tid, er det under innsamlingen viktig å registrere disse under riktig tid.
Spredningsmål
Et spredningsmål antyder hvor tett eller spredt observasjonene ligger rundt gjennomsnittet i en fordeling.
Variasjonsbredde
Differansen mellom største og minste forekommende dataverdi
Kvartilbredde
Vi sorterer datasettet og deler i fire deler.
Kvartiler deler datamaterialet i fire like store deler