Forelesning 3 Flashcards
Hva er sannsynlighet? Hva er dens viktige funksjoner?
Sannsynlighet er en gren av matematikk som omhandler hendelser eller utfall som involverer et element av usikkerhet. Sannsynlighet kan uttrykkes som et tall som beskriver sjansen for et mulig utfall skal skje ut av alle hendelser i prøverommet.
Sannsynligheten for at en hendelse skal skje burde falle mellom (og inkludere) 0 og 1. Og sannsynligheter av alle hendelsene innenfor prøverommet burde kunne summeres til 1.
Hva er forskjellen mellom en frekvens- og en sannsynlighetsfordeling?
I en sannsynlighetsfordeling får du en oversikt for hva som er sannsynligheten for de ulike utfallene i prøverommet. Ved bruk av en grafisk fremvisning av sannsynlighetsfordelingen, så kan vi finne ut av sannsynligheten for at hendelse x skal skje.
En frekvensfordeling er derimot en oversikt over en variabels verdier og dens tilhørende frekvenser. Variablenes verdier kan så stilles opp i en tabell eller et histogram som viser hvor hyppig hver enkelt verdi forekommer i utvalget.
Så kort sagt, den ene viser sannsynligheten av mulige utfall i prøverommet, imens den andre viser hyppigheten i frekvens på en variabels ulike verdier.
Hva er en Gaussisk (normal) fordeling? Hvorfor er det viktig?
Normalfordelingen kjennetegnes av at den er unimodal (en topp), symmetrisk, asymptotic (når aldri null) og av dens klokkeformede fordeling.
Normalfordelingen er beskrevet i form av to parametere: gjennomsnittet (som du kan tenke på som plasseringen av toppen), og standardavviket (som spesifiserer bredden på fordelingen). Den klokkelignende formen på fordelingen endres aldri, bare dens plassering og bredde.
Normalfordelingen er viktig fordi dersom utvalget er normalfordelt er det mer sannsynlig at det kommer fra en normalfordelt populasjon. Det betyr at våre statistiske estimater og konklusjoner trolig er mer presise.
Hvordan kan vi teste om dataene våre er normalfordelt?
Vi kan teste om dataene våre er normalfordelt ved å:
1.Plot dataen inn i et histogram for visuell inspeksjon. Hvor mange topper? Symmetrisk? Haler?
2.Evaluer skjevhet og kurtose verdier, de skal være lik 0 i en normalfordeling.
3.Gjennomfør en Shapiro-Wilk´s test. Hvis Shapiro-Wilk-testen er signifikant (p < .05), indikerer det at dataene avviker signifikant fra normalfordelingen.