Uge 41 - forskelle mellem variabler (kontinuerligt) Flashcards
Kontinuerlig data
Hvad er kontinuerlig data?
Der er tale om tre forskellige slags
Interval Måleniveau
Forholdstal / ratio måleniveau
Ordinalt måleniveau
Hvorfor kan man bruge ordinaltal måleniveau når det klassisk bliver karaktiseret som kategorisk data?
Ordinalt måleniveau klassificeres normalt som værende kategorisk data.
Dog kan man også bruge det i en test der anvender kontinuerlig data. Årsagen til dette er, at et gennemsnit i det ordinale måleniveau også er meningsfuldt fordi der er en rangorden.
Der er en forskel på en der score 2 eller 4 fx.
Man skal dog have en minimum skala, som er 5!
Hvad ser sample t-tests overordnet på?
Forskelle i gennemsnit.
Nævn de tre forskellige sample t-tests
One-sample t-test
Independent sample t-test
Paired sample t-test
Forklar One-sample t-test
Formål: Bruges, når du vil undersøge, om gennemsnittet af en enkelt stikprøve er signifikant forskellig fra en kendt eller forventet værdi.
Procedure: Sammenligner det observerede gennemsnit i din stikprøve med det forventede gennemsnit og vurderer, om forskellen er statistisk signifikant.
Eksempel: Forestil dig, at du har en stikprøve af testresultater fra en gruppe studerende, og du vil se, om deres gennemsnit er signifikant forskelligt fra det forventede klassegennemsnit.
Eksempel:
Vi har en eksisterende observation der antager at folk sover i gennemsnit 8 timer om dagen. Det ønsker vi at se om faktisk er rigtigt.
Vi laver 100.000 observationer (N), og observerer at gennemsnittet er 7.31.
Nævn grundantagelserne ved en One-sample t-test
- Tilfældig stikprøve: Alle individer i populationen skal have lige stor chance for at blive udvalgt til stikprøven.
- Uafhængighed af observationerne: Deltagere i undersøgelsen har ikke påvirket hinanden med hensyn til variablerne af interesse.
- Afhængig variable(r) er interval/ratio skala (eller minimum 5- trins skala på den ordinal målestok).
Forklar independent t-test
Formål: Anvendes, når du vil sammenligne de gennemsnitlige værdier af to uafhængige grupper for at afgøre, om der er en signifikant forskel mellem dem.
Procedure: Sammenligner de to grupper og vurderer, om forskellen mellem deres gennemsnit er statistisk signifikant.
Eksempel: Hvis du har to grupper af deltagere, f.eks. 1. semester og 3.semester, og du ønsker at se, om der er en signifikant forskel i deres køb af studiebøger.
Nævn antagelserne for en independent t-test
- Tilfældig stikprøve: Alle individer i populationen skal have lige stor chance for at blive udvalgt til stikprøven.
- Uafhængighed af observationerne: Deltagere i undersøgelsen har ikke påvirket hinanden med hensyn til variablerne af interesse.
- Afhængig variable(r) er interval/ratio skala (eller minimum 5- trins skala på den ordinal målestok).
- Normalt distribuerede data: For at evaluere normalitetsantagelsen undersøge fordelingen af dataene for hver gruppe separat. T-test er i orden:
Hvis henholdsvis skew og kurtosis er mindre end |2,0| og |9.0|
Prøvestørrelsen (i hver gruppe) er 7 eller flere
Skew er samme retning (positive eller negativ) i begge grupper - Homogenitet af Varians (Levene’s test of equality)
Forklar Skew og kurtosis (grundantagelse 4)
Fordelingen af vores data i forhold til gennemsnittet
Vores data kan enten ligge til højre eller til venstre for gennemsnittet
Hvilken retning vores data bevæger sig påvirker, hvor vores gennemsnit er, og hvordan vores data ser ud som helhed.
Vi skal således være opmærksomme på outliers, hvis skew enten er positiv eller negativ. Skew skal ligge indenfor I2I
Til venstre → en positiv skew
Til højre → en negativ skew
Kurtosis omhandler hvor snæver eller hvor bred vores fordeling er
Negativ kurtosis → folk har svaret meget forskelligt
Positiv kurtosis → folk har svaret meget det samm
Kurtosis skal ligge indenfor I9I
Forklar homogenitet af varians (grundantagelse 5)
Levene’s test anvendes til at vurdere ligheden af varianserne mellem to grupper
Hvis en gruppe har en høj varians og en anden gruppe har en lille varians, så er der ikke lighed i variansen.
Hvis der er signifikans kigger vi på en Welch’s t-test og så skal vi kigge på effekt –> Cohen’s D
Forklar Paired sample t-test
Formål: Bruges, når du har parvise observationer eller målinger, og du ønsker at se, om der er en signifikant forskel mellem de to betingelser eller tidspunkter.
Procedure: Sammenligner forskellene mellem de parrede observationer og vurderer, om denne forskel er statistisk signifikant.
Eksempel: Hvis du har målinger fra den samme gruppe deltagere før og efter en intervention og ønsker at afgøre, om der er en signifikant ændring i deres præstationer
Nævn grundantagelserne for en paired sample t-test
- Tilfældig stikprøve: Alle individer i populationen skal have lige stor chance for at blive udvalgt til stikprøven.
- Uafhængighed af observationerne: Deltagere i undersøgelsen har ikke påvirket hinanden med hensyn til variablerne af interesse.
- Afhængig variable(r) er interval/ratio skala (eller minimum 5- trins skala på den ordinal målestok).
- For at evaluere normalitetsantagelsen undersøge fordelingen forskelscore (Tid 2 – Tid 1). T-test er i orden:
Hvis henholdsvis skew og kurtosis er mindre end |2,0| og |9.0|
(Vi ser fx. på forskellen fra før kristians undervisning til efter kristians undervisning) - Homogenitet af Varians (Levene’s test of equality) = der vil altid være homogentiet siger Kristian