Thema 1 longtidunaal onderzoek Flashcards

1
Q

introductie

A

Elke studie begint met een onderzoeksvraag. Een type onderzoeksvraag waar veel onderzoekers mee te maken hebben en die we in deze cursus behandelen, gaat over verbanden tussen twee of meer variabelen. Meestal wil men het effect onderzoeken van een of meer variabelen op een andere variabele. Aan zulke onderzoeksvragen ligt een model ten grondslag dat relaties tussen de variabelen beschrijft.
Om de onderzoeksvraag te beantwoorden formuleert men strikt genomen eerst een model op basis van eerder onderzoek of theoretische overwegingen. Vervolgens verzamelt men data en toetst men het model statistisch. Met zo’n toets wordt de vraag beantwoord of de verbanden tussen de variabelen die in het model zijn beschreven, aannemelijk zijn op basis van de verzamelde data.
In deze cursus bestuderen we modellen met één afhankelijke variabele. Zulke univariate modellen geven het mechanisme aan om de scores op de afhankelijke variabele te verklaren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Longtidunale data

A

Als bij onderzoekseenheden (personen) dezelfde informatie op meerdere tijdstippen wordt gemeten, spreken we van longitudinale data. Een belangrijk voordeel van longitudinale data is dat veranderingen binnen een persoon kunnen worden gemeten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Het panel onderzoek en het cross-lagged- effect

*De verbanden die vooral van belang zijn in een onderzoek, worden cross-lagged-verbanden genoemd. Hierbij gaat het om verbanden tussen verschillende variabelen op verschillende tijdstippen. Ook hier wordt een richting verondersteld. De pijl loopt altijd in de richting van de meest recent gemeten variabele.

A

*Een vorm van longitudinaal onderzoek, het panelonderzoek, werd door Lazerfeld (1940) voorgesteld. Hij twijfelde aan het causale mechanisme achter het cross-sectionele verband tussen het horen van een advertentie over een product en het kopen van dit product. Kopen mensen omdat ze een advertentie horen of luisteren ze meer gericht naar informatie over een product nadat ze het product gekocht hebben? Hij stelde voor om deze variabelen bij een onderzoekspanel herhaaldelijk te meten en de effecten van deze variabelen te bekijken over tijd. Door het zogenaamde cross-lagged-effect van luisteren (gemeten op tijdstip t) op kopen (gemeten op tijdstip t+1) te vergelijken met het cross-lagged-effect van kopen (t) op luisteren (t+1) zou er een uitspraak over het causale effect kunnen worden gedaan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

N =1 studies

A

*Een veel voorkomend longitudinaal design is gebaseerd op herhaalde metingen bij een enkele onderzoekseenheid. Dit worden N=1-studies genoemd (Engels: single case designs). Het doel hierbij is om het verschil op een of meer variabelen voor en na een interventie te vergelijken. Ook kan men geïnteresseerd zijn in de vraag of er sprake is van een trend in de afhankelijke variabelen. Bijvoorbeeld of klachten geleidelijk afnemen gedurende of na een therapie. Vaak zal men de data van verschillende single case-studies willen combineren om toch meer algemeen geldende uitspraken te kunnen doen. Het combineren van verschillende single case-studies gebeurt meestal met multilevel-analyses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

De Experience Sampling method (ESM)

A

*De Experience Sampling Method (ESM) is een andere dataverzamelingsmethode die longitudinale data oplevert. Hier wordt meestal meerdere keren, op willekeurige momenten per dag, bij mensen een kort vragenlijstje afgenomen gedurende een aantal dagen (vaak met een app op bijvoorbeeld de smartphone). Het idee hierachter is dat men zo kan onderzoeken welke psychologische processen zich dagelijks binnen een persoon afspelen. Omdat dit voor de deelnemers een vrij intensieve methode is, worden ESM-designs ook wel intensieve longitudinale designs genoemd. Ook de analyse van ESM-data gebeurt vaak met multilevelanalyses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Causaliteit

A

In veel psychologisch onderzoek wordt verondersteld dat variabelen een causale relatie met elkaar hebben. Dat wil zeggen dat wordt verondersteld dat er sprake is van een of meer onafhankelijke variabelen (predictoren) en een of meer afhankelijke variabelen, waarbij een onafhankelijke variabele effect heeft op de afhankelijke.

Het begrip causaliteit speelt daarom een belangrijke rol bij onderzoek. Strikt genomen moet er aan drie voorwaarden worden voldaan om te kunnen spreken van een causale relatie:

1 De predictor moet in de tijd voorafgaan aan de afhankelijke variabele.

2 Er moet een statistisch significant verband zijn tussen de predictor de afhankelijke variabele.

3 De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt door een derde, mogelijk onbekende, variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

ad voorwaarde 1 De predictor moet in de tijd voorafgaan aan de afhankelijke variabele.

A

Bij de eerste voorwaarde voor causaliteit - de predictor gaat aan de afhankelijke variabele vooraf - kunnen longitudinale modellen hun nut hebben. In deze modellen moet de onderzoeker er dus voor zorgen dat hij de predictor altijd eerder meet dan de afhankelijke variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

2 Er moet een statistisch significant verband zijn tussen de predictor de afhankelijke variabele.

A

Een statistisch significant (voorwaarde 2) resultaat betekent in het algemeen dat de samenhang waarschijnlijk ongelijk is aan nul. Zo’n resultaat zegt niets over de grootte van het verband en dus ook niet over het belang of de relevantie van het verband. Een klein verband kan bij een grote steekproef namelijk ook statistisch significant zijn. Als de steekproef maar groot genoeg is dan wordt elke afwijking van nul, hoe klein ook, in de steekproef significant. Om te zien of een verband voldoende sterk of relevant is, moet er naar de grootte van het effect worden gekeken (Engels: effect size). Bij een regressieanalyse kan de grootte van het effect worden afgelezen aan de gestandaardiseerde regressiecoëfficiënt (beta).

Ook betekent statistische significantie van een verband niet dat er sprake is van een causaal verband. Het causale proces kan namelijk ook omgekeerd zijn of worden veroorzaakt door een derde variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ad. voorwaarde 3; De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt door een derde, mogelijk onbekende, variabele.

A

Aan de andere kant zou er wel een causaal verband kunnen bestaan tussen twee variabelen, terwijl er in de analyse geen sprake is van statistische significantie. De belangrijkste reden hiervoor is dan een te kleine steekproef of te wel de toets heeft te weinig power om de samenhang te ontdekken. Ook kan er sprake zijn van een derde variabele die het verband maskeert. Het probleem van een te kleine steekproef en dus van te weinig power (dat is de kans om een bestaand effect te vinden) doet zich extra sterk voor bij interactie-effecten. Voor het testen van moderatiemodellen moeten er in het algemeen nog grotere datasets worden gebruikt dan bij modellen met alleen een hoofdeffect. Er bestaan gratis programma’s om de vereiste steekproefgrootte en de bijbehorende power te berekenen. Dit is een belangrijke stap bij het opzetten van een onderzoek.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Het zuivere experiment

A

Een geschikte methode van dataverzameling om causale relaties te onderzoeken is een zuiver experiment. In een experiment kunnen we voorwaarde 2 toetsen via een statistische toets. De opzet van een experiment is zo dat de manipulaties die leiden tot de condities van het experiment (die de waarden van een predictor voorstellen) voorafgaan aan het meten van de afhankelijke variabele, waarmee aan voorwaarde 1 wordt voldaan. Door de subjecten willekeurig aan de condities toe te delen (randomisatie) wordt geprobeerd de invloed van onbekende variabelen te reduceren. Bekende storende variabelen kunnen eventueel worden gemeten en statistisch onder controle worden gehouden door deze variabelen als covariaat in de analyse te betrekken. Bij een goed uitgevoerd zuiver experiment kan men daarom vrij zeker zijn dat ook aan voorwaarde 3 is voldaan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Het survey

A

Wanneer de data zijn verzameld via een survey waarbij alle vragen min of meer tegelijk worden verkregen, kan men in principe geen uitspraken doen over causale relaties tussen de variabelen, omdat alleen aan voorwaarde 1 kan worden voldaan. In de praktijk gebeurt dit echter toch vrij vaak en ook in deze cursus wordt regelmatig gesproken over ʻhet effectʼ of ʻde invloedʼ van een variabele op een andere. Bedenk dat het dan gaat over een verondersteld effect dat in de analyse hooguit aannemelijk wordt gemaakt. De veronderstelde causaliteit wordt aannemelijker als er meer onderzoeken in dezelfde richting wijzen en vooral wanneer er sprake is van een goed gefundeerde theoretische onderbouwing.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Longtidunale onderzoeken en causaliteit

A

Bij longitudinale methoden van dataverzameling kan aan de eerste voorwaarde van causaliteit worden voldaan, doordat op de predictor kan worden gemeten voorafgaand aan de afhankelijke variabele. Hoewel bij deze methode niet kan worden vastgesteld of aan de derde voorwaarde is voldaan, lijken causale uitspraken iets gefundeerder dan bij een survey dat op een enkel moment in de tijd is verkregen (cross-sectioneel onderzoek). Maar ook bij longitudinaal onderzoek is het belangrijk dat er een goed gefundeerde theorie ten grondslag ligt aan de veronderstelde causale effecten.

Een ander probleem bij longitudinaal onderzoek is dat het tijdsinterval tussen de metingen (T1, T2 enzovoort) goed moeten worden gekozen. Het effect van de predictor, gemeten op T1, moet zichtbaar zijn in de afhankelijke variabele op T2 of later. De vraag is dus hoe lang het duurt voordat een predictor effect heeft: enkele seconden, dagen, of maanden? Uiteraard is dat afhankelijk van het specifieke effect dat onderzocht wordt. Is het interval te kort gekozen, dan kan er nog geen causaal effect worden gemeten en als het interval te groot is dan kunnen er allerlei verstorende factoren een rol gaan spelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

exploratief onderzoek

A

Het probleem van de causaliteit kan vermeden worden door onderzoek een exploratief karakter te geven. Bij exploratief onderzoek is het toetsen van (causale) verbanden niet het belangrijkste, maar wil men een indruk krijgen over bijvoorbeeld de verdeling van variabelen en welke verbanden er in de data aanwezig zijn. Ook vragen als ʻWat zijn mogelijk belangrijke predictoren voor een bepaalde onafhankelijke variabele en welke covariaten spelen een rol?ʼ zijn exploratief. Ook classificatieproblemen zoals de vraag die sommige bedrijven zich stellen ‘welke potentiële klant wordt een wanbetaler en wie niet’ zijn niet primair gericht op causale verbanden. Er worden dan verschillende modellen met elkaar vergeleken om te zien welke het beste past bij de data. Op basis van exploratief onderzoek en een onderbouwde theorie kan men in een vervolgonderzoek wellicht een experiment ontwerpen waarmee causale relaties kunnen worden getoetst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Moderatie

A

Wanneer een variabele het effect van een andere variabele op een criteriumvariabele beïnvloedt, spreken we van moderatie. In principe is een moderatiemodel een causaal model en moet daarom voldoen aan de eisen die aan causaliteit worden gesteld om valide uitspraken te kunnen doen over de resultaten. De predictor en moderator zijn in principe gemeten op het eerste tijdstip (of zij vormen de experimentele condities) en de afhankelijke variabele op het tweede tijdstip.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Mediatie

A

In het mediatiemodel gaan we in principe uit van drie meetmomenten. Bij mediatie veronderstellen we dat het effect van een variabele op een andere (deels) wordt verklaard door een derde variabele. Mediatiemodellen zijn heel belangrijk omdat ze inzicht kunnen verschaffen hoe bepaalde causale processen verlopen. Met die kennis kunnen idealiter effectieve interventies worden ontwikkeld om bepaald gedrag te stimuleren (bijvoorbeeld gezond leven) of juist te verminderen (bijvoorbeeld criminaliteit). Dit zijn onderzoeksvragen die zeer informatief kunnen zijn, maar ook moeilijk te onderzoeken. De onderzoeksvraag betreft immers drie vragen naar causaliteit:

1 De voorspeller heeft causale invloed op de mediator.
2 De mediator heeft causale invloed op de afhankelijke variabele.
3 De voorspeller heeft causale invloed op de afhankelijke variabele.

Causaliteit speelt dus een belangrijke rol bij mediatie!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Gebruik van mediatie en moderatie modellen bij cross-sectionele data.

A

Ondanks het voortschrijdend inzicht dat moderatie- en mediatiemodellen causale modellen zijn waar een passend onderzoeksopzet bij hoort, waarmee causaliteit kan worden getoetst, worden in de wetenschappelijke praktijk deze modellen nog veel gebruikt bij cross-sectionele data.

Uit het bovenstaande volgt dat een onderzoeker een goede onderbouwing moet hebben om deze modellen bij cross-sectionele data te gebruiken. Deze onderbouwing kan bijvoorbeeld gebaseerd zijn op eerder onderzoek. Wanneer die onderbouwing ontbreekt, is het wellicht beter om geen cross-sectionele data te gebruiken, maar om een andere onderzoeksopzet te kiezen of om de vraagstelling aan te passen.

17
Q

Longtidunale modellen

A

Als bij onderzoekseenheden (personen) dezelfde informatie op meerdere tijdstippen wordt gemeten (bijvoorbeeld hoe gelukkig men zich voelt gedurende de dag), spreken we van longitudinale data. Longitudinale data contrasteren met cross-sectionele data waarbij de informatie op één tijdstip wordt gemeten (bijvoorbeeld algeheel geluksgevoel gebaseerd op een random steekproef uit de Nederlandse bevolking). Ook wanneer dezelfde informatie op meerdere tijdstippen wordt gemeten, maar bij andere steekproeven (bijvoorbeeld wanneer elk jaar een andere random steekproef uit de Nederlandse bevolking wordt gevraagd naar hun algehele geluksgevoel), spreken we van cross-sectionele data. Een belangrijk voordeel van longitudinale data is dat veranderingen binnen een persoon kunnen worden gemeten. Longitudinale studies worden veel gebruikt om het effect van een interventie te evalueren. De interventie vindt dan plaats na één of een aantal metingen en deze zogenaamde voormetingen worden vervolgens vergeleken met metingen tijdens en na de interventie. Een andere toepassing van longitudinale data is om van een fenomeen een patroon of trend in de tijd te ontdekken. Het monitoren van politieke voorkeuren van een groep individuen gedurende de verkiezingstijd is hiervan een voorbeeld.

Hoeveel metingen er nodig zijn bij een longitudinale studie, welke tijdsintervallen er moeten worden gebruikt en hoe lang de gehele studie moet duren, zijn belangrijke vragen bij het ontwerpen van een longitudinale studie. De antwoorden hierop zijn niet eenvoudig en hangen erg af van het onderwerp en het onderzoeksdoel. Er zijn studies die decennia lopen, bijvoorbeeld waarin kinderen worden gevolgd in hun ontwikkeling tot volwassenheid. Maar een studie met drie metingen om het effect van een interventie te beoordelen, kan ook geschikt zijn gegeven een bepaald onderzoeksdoel. Over het algemeen geven meer metingen uiteraard wel meer informatie, maar dit is ook belastender voor de respondenten, wat mogelijk negatieve gevolgen kan hebben, doordat respondenten uitvallen gedurende een studie.

18
Q

conceptueel model van longtidunale data

A

In figuur 1 is een voorbeeld getekend van een longitudinaal panelonderzoek met drie variabelen op drie meetmomenten. De variabelen zijn X (predictor), M (mediator) en Y (de afhankelijke variabele). De cijfers achter de variabelen geven de volgorde in de tijd van de meting aan. X1 is dus variabele X gemeten op tijdstip 1.

In het conceptueel model van figuur 1 kunnen we heel veel pijlen trekken die verbanden representeren.

*Allereerst zijn er dubbele pijlen (verbanden, hier in het rood weergegeven) tussen verschillende variabelen binnen een “wave”, dus op hetzelfde tijdstip gemeten (bijvoorbeeld tussen X1, M1 en Y1). Dit is de situatie in een cross-sectionele studie.
*Ten tweede zijn er verbanden tussen dezelfde variabelen (blauwe pijlen), gemeten op verschillende tijdstippen (bijvoorbeeld tussen X1, X2 en X3). Dit worden auto-regressieve verbanden genoemd, omdat het om een regressie van variabelen met zichzelf (op een ander tijdstip) gaat. Deze verbanden hebben wel een richting, want een effect kan nooit terug in de tijd gaan. Ze worden aangeduid met een enkele pijl.

Wanneer een effect tussen twee opeenvolgende tijdstippen wordt bedoeld, dan wordt dit een lag-1-effect genoemd. Het effect van bijvoorbeeld X1 op X2 is een lag-1-effect. Een lag-2-effect gaat twee stappen vooruit, bijvoorbeeld tussen X1 en X3. In de praktijk wordt vaak alleen met lag-1-verbanden gewerkt.

*De verbanden die vooral van belang zijn in een onderzoek, worden cross-lagged-verbanden genoemd (zwarte pijlen). Hierbij gaat het om verbanden tussen verschillende variabelen op verschillende tijdstippen, bijvoorbeeld tussen X1 en M2. Ook hier wordt een richting verondersteld. De pijl loopt altijd in de richting van de meest recent gemeten variabele.

Figuur 1 is het conceptueel model behorend bij een driedimensionele datatabel. Dimensie 1 zijn de personen of subjecten (N), dimensie 2 wordt gevormd door de variabelen (K), in dit voorbeeld zijn er drie variabelen (K = 3), maar dat kunnen er makkelijk meer zijn. Ten slotte is dimensie 3 de tijdsdimensie, bestaande uit het aantal metingen (waves, T), in dit voorbeeld 3 (T = 3), maar dat kunnen er ook (veel) zijn.

Bij cross-sectioneel onderzoek hebben we een tweedimensionele datatabel van personen bij variabelen (N x K). We zetten dergelijke data meestal in een dataset waarin de rijen de subjecten representeren en de kolommen de variabelen. Als er sprake is van herhaalde metingen, bijvoorbeeld als variabele X drie keer is gemeten, dan worden er meestal kolommen aan het bestand toegevoegd, en komen er dus drie verschillende X variabelen (X1, X2, X3) in het bestand. Als alle variabelen op alle tijdstippen zijn gemeten, dan zijn er N rijen en K x T kolommen in de databestand.