2. Hvordan Beskrive Data Flashcards
Hva er en variabel?
• Kvantitativ metode er basert på at egenskaper i verden kan uttrykkes i form av variabler.
• Egenskaper uttrykt som variabler kan sammenlignes og måles.
• Variabler må ha variasjon.
• To hovedvarianter:
○ Numeriske/skalaer (kvantitative)
○ Nominale/kategoriske (kvalitative)
Fire ulike målenivåer av variabler:
Nominalskala
Ordinalskala
Intervallskala
Ratioskala
Nominalskala
Ulike kategorier eller klasser av observasjoner. (epler og bananer)
○ Diagnoser er på nominalskala.
Ordinalskala
Rangering mellom kategorier i en rekkefølge. (mer eller mindre, men ikke en bestemt avstand mellom kategorier)
Intervallskala
Når det er lik avstand mellom punktene på skalaen. (for eksempel klokken; like langt fra 2-4 som 4-6).
○ Hvis man kombinerer mange spørsmål på en ordinalskala som handler om det samme, kan man si at gjennomsnittet av disse havner på intervallskalaen.
Ratioskala
Absolutt nullpunkt (samme egenskaper som de tidligere, men også et absolutt nullpunkt. Kelvin skala) ○ Mål på personlighet og mennesker er sjelden på ratioskala.
Korrelasjon
Et tall mellom -1 og +1, 0 er ingen korrelasjon, høyere betyr mer korrelasjon (og rettere linje i scatter plot). Negativ er også mer korrelasjon men med motsatt fortegn.
Ulike mål på sentraltendens:
Modalverdi: vanligste observasjon, mest frekvent.
Median: den verdien som deler fordelingen i to like store deler.
Gjennomsnitt: Aritmetisk middelverdi: (X̄)= (Σx)/(N)
Ulike mål på spredning:
Spredning kan være 0, men aldri negativ.
• Variasjonsbredde (range): Høyeste verdi - laveste verdi.
• Interkvartil variasjonsbredde (range):
○ Del opp fordelingen i 4 kvartiler
○ Finn skåren for 25% persentilen og 75%persentilen
○ 75 persentil - 25 persentil
• Standardavvik: ved ratio eller intervall (der en bruker aritmetisk gjennomsnitt)
○ Måler hvor langt unna gjennomsnittet det er vanlig å ligge.
○ Kan tolkes som gjennomsnittlig absolutt avstand til gjennomsnittet.
○ Formelt definert som: kvadratroten av gjennomsnittlig kvadrert avvik fra gjennomsnittet: Men er litt annerledes:
Scatter plot:
Diagram som viser hvert par av verdier (X,Y) i et datasett som et punkt i planet. ○ En tendens til en linje viser samvariasjon.
Sentralgrenseteoremet:
En sum av uavhengige og identisk fordelte tilfeldige variabler går mot en normalfordeling når antallet går mot uendelig.
Store talls lov:
Forskjellen mellom det observerte og forventede gjennomsnittet (av et sett med likt fordelte tilfeldige/stokastiske) variabler går mot null når antall observasjoner går mot uendelig.
Normalfordeling:
En helt bestemt statistisk fordeling i form av en gaussisk kurve. Hvor 34,1% ligger mellom gjennomsnitt og 1 standardavvik, 13,6% ligger mellom 1 og 2 SD.
○ Mange ting er normalfordelt i befolkningen, som høyde.
Z-skårer:
Enstandardskår, en måte å regne ut hvor mangestandardavviken statistikk er fragjennomsnittet.
○ ( i psykologien har vi ingen universell skalaer som C eller cm, derfor bytter vi tilfeldige skalaer ut med z-skårer)
• En omforming av skåren til standardskårer basert på gjennomsnitt og standardavviket kan sammenligne data fra ulike skalaer.
• Beregnes ved formelen: Z=X-X̄/SD
Avvik fra normalfordeling: skjevhet
Positiv skjevhet hvis få lite og mange mye
Negativ skjevhet hvis mange lite og få mye