Kapittel 10 Flashcards
De to måtene å andvende statistikk på
Beskrivende (beskrive resultater fra et utvalg, karakterisere det “typiske” ved en rekke enkeltskårer) og slutningsstatistikk (trekke konklusjoner om en populasjon på grunnlag av data fra et utvalg fra denne populasjonen)
Når brukes stolpediagram
Hvis grafen viser kategoriske data på x-aksen (histogram - karakterskala på x-aksen og antall elever på y-aksen)
Når brukes linje
Hvis x-aksen har kontinuerlige data (eksempel med årstall fra 1930-1980 på x-aksen, penger i dollar på y-aksen)
Diskret og kontinuerlig variabel
Diskret: karakterer for eksempel, mellomverdier er ikke mulig. Kontinuerlig: 1,2,3, mellomverdier kan angis med desimaler. (diktom er en type diskret der kun to variabler er mulig)
Hvordan beskrive diskrete vs kontinuerlige variabler?
Diskret: frekvens - hvor ofte oppstod karakteren A, B, C osv. Kontinuerlig: gjennomsnitt, variasjon, skjevhet (eks gjennomsnittlig karakternivå på en skala fra 1-6 i en klasse)
Når er det meningsfullt å bruke gjennomsnitt som mål på sentraltendens?
Når utvalget har ganske mange skårer, når skårene er tilnærmet normalfordelt og når det ikke er svært avvikende skårer i utvalget. (ellers er median og modus mulig - median deler skåren i to, modus er skåren som inntreffer hyppigst)
Variasjonsbredde
Når skårer i kontinuerlig variabel beskrives er det informativt å angi hvor mye de varierer - forskjell mellom høyest og lavest skåre (et bedre mål på variabilitet er standardavviket)
Standardavvik
Mål på variabilitet i et sett skårer - det er det gjennomsnittlige avviket fra gjennomsnittet. Jo større gjennomsnittlig avvik, desto større variabilitet.
Avvik fra normalfordeling
For eksempel om en avlagt eksamen var veldig vanskelig kan vi finne opphopning av dårlige karakterer og færre gode. Dette fører til en (positiv) skjev fordeling
Bimodal og unimodal fordeling
Bimodal: en fordeling med to topper - eks røyking. Unimodal: normalfordelingskurve med én topp
Persentiler
Angir en rangorden i et sett skårer. For å få mer informasjon om skårer i et utvalg kan man bruke persentiler - hvor mange prosent fikk lik skåre eller lavere, og hvor mange prosent fikk bedre?
Konfidensintervall
Angir et slingringsmonn når vi beregner gjennomsnittet for et utvalg, hensikten er å si noe om populasjonens gjennomsnitt.
Korrelasjon
Statistisk mål på samvariasjon mellom to variabler for å beskrive relasjonen mellom dem.
P-verdi
Probabilitet eller sannsynlighet - hvor sannsynlig er det at resultatene har oppstått tilfeldig? Er den 0 er den observerte samvariasjonen reliabel, og vil høyst sannsynlig vises på nytt med nytt utvalg fra populasjonen
Viktige momenter i korrelasjon (r) 6 stk
Krav til målenivå: variablene er på intervall- eller rationivå pga beregning av r.
Linær relasjon mellom variablene: r gir et misvisende uttrykk for samvariasjon hvis relasjonen ikke kan fremstilles lineært
Effektstørrelse (OBS to definisjoner, én i gruppegjennomsnitt og avvik, en i korrelasjon): i hvilken grad to variabler samvarierer. 0.10= liten. 0.30=medium 0.50=stor effektstørrelse
Uttrykk: r uttrykker styrken av samvariasjon, verdier på ordinalnivå (0.60 er IKKE dobbelt så stor som 0.30)
Er sterk korrelasjon kausalitet? NEI, måler samvariasjon, forskeren må tolke.
Delt varians: kvadrert r - hvor mye varians i en variabel er assosiert med varians i den andre variabelen?