Thema 5, 6, 7 Flashcards
Criterium:
binnen de context van regressieanalyse wordt criterium gebruikt om de afhankelijke variabelen aan te duiden. De onafhankelijke variabelen worden dan vaak covariaten genoemd.
Errorvariantie/residuele variantie
in de context van variantieanalyse is de errorvariantie of residuele variantie dat deel van de variantie in de afhankelijke variabele dat niet wordt verklaard door een factor (een onafhankelijke variabele).
F-verdeling:
De verdeling van de F-waarde, bepaald door beide vrijheidsgraden van de F-waarde. De F-waarde die wordt berekend in een steekproef is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven F-waarde te berekenen onder aanname van de nulhypothese (dat is, de p-waarde). Deze verdeling ziet er als volgt uit.
Helling, hellingscoëfficiënt:
de hellingscoëfficiënt drukt uit hoe steil een lijn in een grafiek stijgt. De helling is de toename in de variabele op de y-as (meestal, maar niet altijd, de afhankelijke variabele) als de variabele op de x-as met 1 toeneemt. Deze helling kan ook negatief zijn. In dat geval is de toename in de variabele op de y-as dus een afname, oftewel, de variabele op de y-as neemt met een bepaald getal af als de variabele op de x-as met 1 toeneemt. Binnen regressieanalyse geldt dat de regressiecoëfficiënten de hellingscoëfficiënten zijn die corresponderen met de voorspellers, behalve de eerste regressiecoëfficiënt, het intercept.
Intercept:
in de context van regressieanalyse is het intercept de waarde die de afhankelijke variabele heeft als de onafhankelijke variabele de waarde 0 heeft. Het is de eerste term in het regressiemodel: β0 (in de populatie, of als gestandaardiseerde regressiecoëfficiënt), B0 of b0 (als ruwe oftewel ongestandaardiseerde *regressiecoëfficiënt).
Predictor, predictoren:
met de term predictor of voorspeller wordt gebruikelijk naar onafhankelijke variabelen verwezen in de context van regressieanalyse. Het is belangrijk om te beseffen dat deze termen niet impliceren dat er sprake is van een causaal verband. In tegendeel: voor de analyse van data uit experimenten wordt vaak juist variantieanalyse gebruikt, terwijl data uit observationele studies eerder met regressieanalyse worden geanalyseerd.
R2:
het kwadraat van de multipele correlatie in regressieanalyse. Dit is de proportie verklaarde variantie.
Regressieanalyse:
een statistische analyse waarbij een regressiemodel wordt geschat waarin een of meer predictoren een afhankelijke variabele voorspellen.
Regressiemodel:
het regressiemodel is de verzameling van alle regressiecoëfficiënten in een regressieanalyse. Om voor een gegeven combinatie van waarden van de voorspellers de beste voorspelling van de afhankelijke variabele te krijgen, worden deze waarden in het regressiemodel ingevuld, waardoor die beste voorspelling berekend kan worden
Regressiecoëfficiënt, regressiecoëfficiënten:
het intercept en de hellingscoëfficiënten van de voorspellers in een regressieanalyse. De hoogte van de regressiecoëfficiënten geeft aan hoeveel de afhankelijke variabele (het criterium) toe- of afneemt als de voorspeller waar de regressiecoëfficiënt bij hoort met 1 toeneemt. Als de regressiecoëfficiënten gestandaardiseerd zijn, betreft dit niet de toename van 1 eenheid op de schaal waarop de voorspeller is gemeten, maar drukt de regressiecoëfficiënt uit hoeveel standaarddeviaties de afhankelijke variabele toeneemt als de betreffende voorspeller met 1 standaarddeviatie toeneemt. Regressiecoëfficiënten kunnen zowel positief als negatief zijn en hun waarde is niet begrensd. Dus ook gestandaardiseerde regressiecoëfficiënten kunnen kleiner zijn dan −1 of groter dan 1.
t, t-waarde:
ook wel Student’s t genoemd; de toetsingsgrootheid die gebruikt wordt om de p-waarde van Cohen’s d te berekenen. De t-waarde is verdeeld volgens de t-verdeling.
t-toets:
een toets die gebruikt kan worden binnen de nulhypothese-significantietoetsing om de p-waarde te berekenen voor het verband tussen een dichotome variabele en een continue variabele.
t-verdeling:
een specifieke verdeling; een variatie op de normaalverdeling die rekening houdt met de extra onzekerheid wanneer de data uit een steekproef afkomstig zijn. De t-waarde die berekend wordt in een steekproef is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven t te berekenen onder aanname van de nulhypothese. Deze verdeling ziet er als volgt uit.
Afhankelijke/gepaarde t-toets
de gepaarde t-toets is een t-toets waarbij twee datareeksen vergeleken worden waarin elke datapunt in de ene datareeks te koppelen is aan precies één datapunt in de andere datareeks. Dit gebeurt als beide datareeksen niet onafhankelijk (maar afhankelijk, of gepaard) zijn, bijvoorbeeld als ze herhaalde metingen betreffen bij dezelfde onderzoekseenheden (zoals dezelfde deelnemers), of als de onderzoekseenheden in de twee datareeksen met elkaar in verband te brengen zijn, bijvoorbeeld als ze uit hetzelfde gezin komen.
Cohen’s d
een effectmaat wordt die gebruikt om het verschil tussen twee gemiddelden uit te drukken op een manier die onafhankelijk is van de schaal waarop de afhankelijke variabele gemeten is. Cohen’s d is gedefinieerd als het verschil tussen twee gemiddelden, gedeeld door de standaarddeviatie. De tentatieve kwalitatieve labels die worden gebruikt om Cohen’s d waarden te duiden, zijn:
triviaal: tussen −.20 en .20
klein / zwak: tussen −.20 en −.50 of tussen .20 en .50
middelgroot / middelsterk: tussen −.50 en −.80 of tussen .50 en .80
groot / sterk: tussen −.80 en −1.30 of tussen .80 en 1.30
zeer groot / zeer sterk: kleiner dan −1.30 of groter dan 1.30