Statistiek termen Flashcards
Continue Variabele
Een variabele waar een score gegeven wordt, zoals IQ of extraversie.
Categorische variabele
Een variabele met groepen, zoals geslacht of opleiding.
Binaire/Dichotome variabele
Een categorische variabele met twee groepen, zoals geslacht.
Beschrijvende Statistiek
Statistiek waar niet gegeneraliseerd wordt, maar een reeks gemeten waarden samengevat wordt (gemiddelde, histrogram, SD, mediaan).
Inferentiele Statistiek
Wordt gegeneraliseerd naar een populatie op basis van een steekproef (Significantietoets, Betrouwbaarheidsinterval).
Orthogonaal
Onafhankelijkheid tussen variabelen. Betekent eigenlijk (hoek van 90 graden), wat in de matrix algebra overeenkomt met twee variabelen die los van elkaar staan, omdat een beweging op de horizontale as geen verandering teweeg brengt op de verticale as.
Sequentiële/Hiërarchische analyse
Analyse waar niet alle variabelen in één keer, maar in stappen worden ingevoerd in een model, zodat de toevoeging van een (set) variabele(n) getest kan worden
Lineaire combinatie
Een som van twee of meer getallen. Zelfs 2 + 2 = 4 is een lineaire combinatie. Het is een allesomvattende term waar de scores van twee of meer variabelen samengevat worden in een verwachte waarde (lineaire regressie), functie (MANOVA & discriminantanalyse), of factor (factoranalyse) 7
Effect Size
De sterkte van het gevonden effect bij een bepaalde toets (relatie tussen variabelen, verschil tussen groepen, proportie verklaarde variantie)
Between Group Effect
Het deel van de Sum of Squares Total wat verklaard wordt door verschillen tussen groepen
Within Group Effect (Residuals)
Het deel van de Sum of Squares Total wat niet verklaard wordt door verschillen tussen groepen, en daarom onverklaard blijft
Between-Subjects Effect
Het effect van verschillen tussen losstaande groepen
Within-Subjects
Het effect van verschillen tussen metingen binnen één persoon
IV
Independent variable – Onafhankelijke variabele
DV
Dependent variable – Afhankelijke variabele
CV
Covariate – Covariaat
Fixed Factor
Een categorische variabele die zich in de populatie beperkt tot de genoemde groepen
Random Factor
Een categorische variabele waarvan de gekozen groepen een willekeurige representatie zijn van alle mogelijke groepen in de populatie. Zoals: 10 ziekenhuizen willekeurig selecteren uit alle ziekenhuizen van Nederland. Multilevel analyse kan hier goed mee overweg.
Bivariate r
Mate van lineaire samenhang tussen twee continue of binaire variabelen. Staat aan de basis van veel andere toetsen, zoals MANOVA, regressie, multilevel modelling en factoranalyse. (Statistiek 1A)
Chi-Square (test)
Mate van samenhang tussen twee categorische variabelen. (Statistiek 1B)
Multiple R
Mate van lineaire samenhang tussen een set continue of binaire variabelen (IV), en een enkele continue variabele (DV). Meest bekend van multipele lineaire regressie. De set wordt samengevat in één variabele, zoals de lineaire combinatie van de verwachte waarde bij regressie, zodat uiteindelijk de correlatie tussen twee reeksen van getallen berekend wordt. (Statistiek 2)
Sequential R
Mate van lineaire samenhang tussen een set continue of binaire variabelen (IV), nadat het effect van eerdere variabelen verwijderd is, en een enkele andere variabele (DV). Meest bekend van hiërarchische lineaire regressie. De set wordt samengevat in één variabele, zoals de lineaire combinatie van de verwachte waarde bij regressie, zodat uiteindelijk de correlatie tussen twee reeksen van getallen berekend wordt. (Statistiek 3)
Canonical Correlation
Mate van lineaire samenhang tussen een set continue of binaire variabelen, en een andere set continue of binaire variabelen. Beide sets worden samengevat in één variabele, een lineaire combinatie, zodat uiteindelijk de correlatie tussen twee lineaire combinaties berekend wordt. (Multivariate Models) 8
Multiway Frequency Analysis
Mate van samenhang tussen meerdere categorische variabelen, waar geen enkele echt als DV naar voren komt. (Multivariate Models)
Multilevel Modelling
Overkoepelende term voor meerdere modellen die als doel hebben mate van samenhang te geven tussen variabelen, waarbij rekening wordt gehouden met dat mensen in subgroepen in worden gedeeld. Psychologiestudenten kunnen worden vergeleken met Sociologie-studenten, waarbij ze opgedeeld worden in studiejaar 1, 2, 3, of Master. (Repeated Measures)
T-test
Om het verschil tussen twee groepen, binnen één onafhankelijke variabele, op één afhankelijke variabele te testen. (Statistiek 1B)
Oneway-ANOVA
Om het verschil tussen twee of meer groepen, binnen één onafhankelijke variabele, op één afhankelijke variabele te testen (Statistiek 2)
Oneway-ANCOVA
Om het verschil tussen twee of meer groepen, binnen één onafhankelijke variabele, op één afhankelijke variabele te testen, waarbij een (set) continue variabele(n) aan het model is toegevoegd voor bias of errorreductie (Multivariate & Repeated)
Twoway-ANOVA
(Factorial ANOVA) Om het verschil tussen twee of meer groepen, binnen twee of meer onafhankelijke variabelen, op één afhankelijke variabele te testen (Statistiek 2)
Twoway-ANCOVA
(Factorial ANCOVA) Om het verschil tussen twee of meer groepen, binnen twee of meer onafhankelijke variabelen, op één afhankelijke variabele te testen, waarbij een (set) continue variabele(n) aan het model is toegevoegd voor bias of errorreductie (Multivariate & Repeated)
Hotelling’s T²
(Niet 100% hetzelfde als Hotelling’s Trace van MANOVA) Om het verschil tussen twee groepen , binnen één onafhankelijke variabele, op twee of meer afhankelijke variabelen te testen. (Multivariate & Repeated)
Oneway-MANOVA
Om het verschil tussen twee of meer groepen, binnen één onafhankelijke variabele, op twee of meer afhankelijke variabelen te testen (Multivariate & Repeated)
Oneway-MANCOVA
Om het verschil tussen twee of meer groepen, binnen één onafhankelijke variabele, op twee of meer afhankelijke variabelen te testen, waarbij een (set) continue variabele(n) aan het model is toegevoegd voor bias of errorreductie (Multivariate & Repeated)
Twoway-MANOVA
(Factorial MANOVA) Om het verschil tussen twee of meer groepen, binnen twee of meer onafhankelijke variabelen, op twee of meer afhankelijke variabelen te testen (Multivariate & Repeated)
Twoway-MANCOVA
(Factorial MANCOVA) Om het verschil tussen twee of meer groepen, binnen twee of meer onafhankelijke variabele, op twee of meer afhankelijke variabele te testen, waarbij een (set) continue variabele(n) aan het model is toegevoegd voor bias of errorreductie (Multivariate & Repeated)
Repeated Measures ANOVA
Om het verschil tussen twee of meer groepen, binnen één of meer onafhankelijke variabelen, op één afhankelijke variabele die meerdere keren gemeten is te testen, vooral bij kleine steekproeven en geen missing data (Statistiek 3 & Repeated)
Repeated Measures MANOVA / Profile Analysis
Om het verschil tussen twee of meer groepen, binnen één of meer onafhankelijke variabelen, op één afhankelijke variabele die meerdere keren gemeten is te testen, vooral bij gebrek aan sfericiteit en geen missing data (Repeated Measures)
Discriminant Analysis
Het wiskundige omgekeerde van een MANOVA. Op basis van één of meer continue onafhankelijke variabelen worden één of meer optimale functies gemaakt die de onafhankelijke variabelen combineren zodat ze zo veel mogelijk variantie verklaren met zo min mogelijk functies. Op basis van deze functies wordt voorspeld in welke groep, gesteld in de afhankelijke variabele, mensen thuishoren. Net als bij MANOVA is het uit te breiden naar twee categorische variabelen (Factorial Discriminant Analysis) en net als lineaire regressie is het in stappen te doen (Sequential Discriminant Analysis). (Multivariate Models)
Multiway Frequency Analysis (Logit)
Mate van samenhang tussen meerdere categorische variabelen, waar één als DV gekozen is. (Multivariate Models)
Logistische regressie
Op basis van één of meer categorische of continue onafhankelijke variabelen wordt een kans gegeven om in alle mogelijke groepen van de afhankelijke variabele te zitten. De verwachte groep is de groep met de grootste kans. (Statistiek 2)
Principal Component Analysis
Een analyse waarbij puur statistisch, zonder theorie, voorspeld wordt welke variabelen samenhangen op één of meer onderliggende structuren. (Multivariate Models)
Factor Analysis
Een analyse waarbij een theorie dat bepaalde variabelen een samenhangende onderliggende structuur hebben getest kan worden. (Multivariate Models)
Op basis hiervan zou Multivariate models moeilijker kunnen lijken, omdat 6 in tegenstelling tot 3 losse toetsen genoemd zijn, maar beide vakken zijn gebaseerd op drie hoofdonderwerpen na de basis:
Matrix
Een groep getallen waarvan minstens twee rijen en kolommen.
Vector
Een kolom van getallen, die oneindig lang kan zijn.
Scalar
1 getal
Transposed
Alle rijen worden nu kolommen en alle kolommen worden rijen.
Trace
Som van de hoofddiagonaal van een matrix.
Triangular (driehoekig Matrix)
Een kant van de diagonaal heeft alleen nullen heeft terwijl de andere kant minstens 1 getal anders heeft dan 0.
Symmetric Matrix
De matrix is gelijk aan zijn transpose. Oftewel ze zien er hetzelfde uit.
Diagonal Matrix
Waar alles behalve de hoofddiagonaal 0 is.
Scalar Matrix
Een diagonale Matrix waarbij alle waarden op de hoofddiagonaal hetzelfde zijn en alle andere waarden 0.
Identity matrix
Een speciaal geval van een Scalar matrix, waarbij alle getallen op de hoofddiagonaal 1 zijn en alle andere getallen 0.
Determinant
Is een getal wat de hele matrix samenvat in 1 getal.
Inverse
- Verwissel linksboven met rechtsonder.
- Linksonder en rechtsboven wordt omgeklapt (positief wordt negatief en negatief wordt positief).
- Deel alle getallen door de determinant.
Aannames t- toets
- Onafhankelijkheid (Iedereen wordt onder gelijke omstandigheden gemeten en geen overeenkomsten met elkaar).
- Homoscedasticiteit (Gepoolde std. Dev. Dus dezelfde spreiding).
- Normaliteit =
Aannames ANOVA & MANOVA
- Onafhankelijkheid (Iedereen wordt onder gelijke omstandigheden gemeten en geen overeenkomsten met elkaar).
- Homoscedasticiteit (Gepoolde std. Dev. Dus dezelfde spreiding).
- Normaliteit =
- Geen meetfout
Nulhypothese ANOVA
μ𝟏=μ𝟐=μ𝟑=μ𝟒=⋯=μ𝒌
𝒚𝒊𝒋=μ𝒕𝒐𝒕𝒂𝒍+𝒆𝒊𝒋
Alternatieve Hypothese ANOVA
“Minstens één van de groepsgemiddelden wijkt af van één of meer van de andere groepsgemiddelden”
𝒚𝒊𝒋=μ𝒕𝒐𝒕𝒂𝒍+𝜶𝒋+𝒆𝒊𝒋
Hoe kan je normaliteit checken
- Histogram
- PP-plot van de residuen
- Skewness & Kurtosis (Meer dan twee SE’s boven of onder de 0 dan is er een schending van normaliteit).
Homoscedasticiteit checken
- Grootste std. Dev. Is minder groot dan 2x de kleinste std. Dev.
- LEvene’s toets. Als die Sig is ben je fucked.