Hoofdstuk 6 Causaliteit

In dit hoofdstuk wordt besproken:
  • de definitie van causaliteit
  • correlatie impliceert geen causatie
  • het pure experiment
  • als een experiment onmogelijk is
Deze stof wordt behandeld in de volgende Open Universiteitscursus(sen):
  • Onderzoekspracticum cross-sectioneel onderzoek (PB0812)

6.1 De definitie van causaliteit

Causaliteit betekent dat er sprake is van een oorzaak-gevolgrelatie: er bestaat een verband tussen een oorzaak, ook wel een causaal antecedent genoemd, en een gevolg, ook wel een causaal consequent genoemd. In de praktijk wordt causaliteit aangenomen als aan de volgende drie voorwaarden wordt voldaan:

  • De oorzaak gaat in de tijd vooraf aan het gevolg.
  • De oorzaak en het gevolg hangen samen.
  • De samenhang tussen de oorzaak en het gevolg kan niet worden verklaard door iets anders.

Begrip van causaliteit is waardevol omdat dit begrip het mogelijk maakt om de wereld om ons heen te veranderen. Een simpel voorbeeld is het causale verband tussen het eten van een appel en een verminderd hongergevoel. Een complexer voorbeeld is het causale verband tussen vaccinatie en de verminderde kans op besmetting met een virus.

Omdat causaliteit zo waardevol is, wordt het binnen onderzoek vaak gezien als een soort heilige graal. Veel psychologische theorieën beschrijven bijvoorbeeld hoe een psychologisch proces leidt tot een ander psychologisch proces, of welke psychologische constructen een causale rol spelen bij het veroorzaken van gedrag.

Tegelijkertijd geldt voor kennis over causaliteit, net als voor veel andere waardevolle zaken, dat deze niet makkelijk te verkrijgen is. Dat komt door de voorwaarden waaraan voldaan moet worden voordat van causaliteit gesproken mag worden.

6.2 Correlatie impliceert geen causatie

De volgende slogan is belangrijk om te onthouden: ‘Correlatie impliceert geen causatie.’ Correlatie wordt hier gebruikt als synoniem voor samenhang of verband, maar het is ook een statistische grootheid: zie hoofdstuk Correlaties. Dit betekent dat als twee factoren met elkaar samenhangen, dat nog niet wil zeggen dat er ook sprake is van een causale relatie, oftewel oorzaak en gevolg.

Anders gezegd, de reden van een correlatie is meestal niet dat de ene factor de andere veroorzaakt. Sterker nog, maar een fractie van alle verbanden is causaal. Als twee dingen samenhangen, dan hebben ze vaak niets met elkaar te maken. Heel soms worden ze beide veroorzaakt door een derde variabele, meestal door een hele set andere variabelen. Maar heel zelden is de ene variabele echt de veroorzaker van de andere variabele. Als je een verband observeert, weet je dus al bijna zeker dat het niet causaal is.

Stel dat je een studie doet waarin je mensen een vragenlijst geeft die een aantal psychologische constructen meet (zie het hoofdstuk Constructen). Vervolgens bereken je verbanden tussen de variabelen in de dataset die informatie geven over die constructen. Je weet dan twee dingen bijna zeker:

  1. Je gaat tussen bijna alle constructen verbanden vinden (zie ook Orben & Lakens, 2020).
  2. Geen van die verbanden is causaal.

Dat is jammer, want dergelijk onderzoek (ook wel cross-sectioneel onderzoek genoemd) is relatief goedkoop en eenvoudig uit te voeren. Omdat de verbanden die in zulk onderzoek worden gevonden meestal niet indicatief zijn voor causale verbanden, is er vaak een andere studieopzet nodig: het pure experiment.

6.3 Het pure experiment

Het pure experiment (hierna: experiment) is een studie ontwerp die uitspraken over causaliteit mogelijk maakt. Bij een experiment worden er twee of meer ‘behandelingen’ onderzocht, waarbij die behandelingen uitsluitend verschillen in de aan- of afwezigheid van de (vermeende) oorzaak. Het idee daarbij is dat het gewenste gevolg alleen plaatsvindt wanneer de behandeling de (vermeende) oorzaak omvat en anders niet. Een effectieve therapie leidt dus tot een vermindering van de klachten; een behandeling waarin het cruciale element van die therapie ontbreekt, zal niet tot vermindering van klachten leiden. Of: de ene behandeling is de procedure om een psychologisch construct te manipuleren, terwijl de andere behandeling de corresponderende controleprocedure is. De variabele die de behandelingen van elkaar onderscheidt, wordt vaak de onafhankelijke variabele genoemd.

Als is vastgesteld welke behandelingen onderzocht gaan worden, krijgen de onderzoekseenheden (in psychologisch onderzoek zijn dit vaak de deelnemers) willekeurig een behandeling toegewezen. Die willekeur is cruciaal: die voorkomt dat er een samenhang is tussen ‘het type’ deelnemers aan de studie en de behandeling die ze krijgen. Nadat de behandeling is toegepast, wordt het (vermeende) gevolg gemeten. De variabele die dit meet wordt vaak de afhankelijke variabele genoemd.

6.3.1 Randomisatie

Zoals aangegeven is de willekeur in toewijzing van de behandeling cruciaal. Alleen als die behandelingen puur door toeval worden toegewezen – en echt alleen verschillen in het vermeende causale antecedent – is het mogelijk om uit een gevonden verband af te leiden dat de onafhankelijke variabele de afhankelijke variabele veroorzaakt. Die willekeurige toewijzing heet randomisatie.

Vaak gebeurt randomisatie met computerprogramma’s die algoritmen gebruiken om willekeurige patronen na te bootsen. Voor echt willekeurige getallen kan gebruikgemaakt worden van bijvoorbeeld https://random.org. De kwaliteit van de randomisatie is een van de factoren die de interne validiteit van een experiment bepaalt.

Hoewel met randomisatie in principe behandelingen willekeurig worden toegewezen aan deelnemers, wordt in de praktijk vaak gesproken over het willekeurig toewijzen van deelnemers aan groepen (vaak condities genoemd).

Het gegeven dat randomisatie garandeert dat niets samenhangt met de toewijzing van de behandelingen, of met de toewijzing van de deelnemers, zorgt ervoor dat de groepen niet systematisch van elkaar verschillen. Het is belangrijk om te beseffen dat dit een eigenschap is van het proces van randomisatie, maar niet van elke individuele toepassing van dit proces.

Als je oneindig vaak \(1000\) mensen willekeurig in twee groepen indeelt, dan weet je zeker dat die randomisatie ervoor zorgt dat gemiddeld genomen beide groepen \(500\) mensen bevatten, de mensen in beide groepen exact even oud zijn, het percentage vrouwen in beide groepen gelijk is, en dat de IQ-scores in beide groepen exact gelijk zijn. Dit moet wel, want de toewijzing van mensen in groepen was volledig willekeurig.

Maar in een studie waarin je randomisatie toepast, doe je dat eenmalig en niet oneindig vaak. Het is dus best mogelijk dat je bij die ene keer \(513\) mensen aan de ene groep toewijst en \(487\) mensen aan de andere groep. Het is ook prima mogelijk dat in de ene groep toevallig drie zeer oude mensen zijn ingedeeld, waardoor de gemiddelde leeftijd in die groep iets hoger is. In je studie zullen er dus waarschijnlijk toevallige verschillen bestaan tussen de twee condities.

Dit principe kun je ook zelf ondervinden. Als je zes keer met een dobbelsteen gooit, is de kans dat deze toevallig precies een keer op elke zijde belandt relatief klein. Maar als je vaker gooit en uitrekent in welk percentage van de gevallen de dobbelsteen op elke zijde belandt, zul je zien dat dat precies even vaak is. De uitkomsten van een toevalsproces worden steeds betrouwbaarder naarmate er meer herhalingen zijn, zijn exact gelijk verdeeld bij oneindig veel herhalingen, en zijn onbetrouwbaar bij weinig herhalingen.

Dit mechanisme is ook van kracht bij een experiment. Randomisatie garandeert dat gemiddeld genomen, over oneindig veel herhalingen, de groepen waarin je deelnemers indeelt equivalent zijn. Maar dat betekent niet dat de groepen in één enkel experiment ook gelijk zijn. In één experiment kan het best zijn dat de ene groep bijvoorbeeld toevallig een hoger IQ heeft, of meer uithoudingsvermogen heeft, of ouder is, of toevallig chagrijnig is.

Als door randomisatie een verschil ontstaat tussen de groepen voorafgaand aan een experiment, kan dit de reden zijn voor een waargenomen verschil op de afhankelijke variabele na het experiment. Zelfs bij een goed uitgevoerd experiment, kan dus niet met zekerheid geconcludeerd worden dat het verschil tussen de condities veroorzaakt wordt door het verschil in de behandelingen, en dat er dus sprake is van een causaal verband. Over meerdere studies verdwijnt dit effect noodzakelijkerwijs. Dit is een van de redenen waarom resultaten uit een enkele studie nooit als definitief moeten worden beschouwd.

6.4 Als een experiment onmogelijk is

Als een experiment niet mogelijk is, is het heel moeilijk om een uitspraak te doen over causaliteit. Bijvoorbeeld, omdat het ethisch niet verantwoord is om via een experiment te onderzoeken of roken longkanker veroorzaakt, heeft het decennia aan onderzoek gekost op veel verschillende terreinen om dit causaal verband toch vast te stellen. Maar decennia aan tijd en miljarden aan financiering zijn in de praktijk meestal niet beschikbaar.

Vaak blijkt, na grondige analyse, dat een experiment in principe wel mogelijk is, maar dat de vereiste middelen niet beschikbaar zijn. Het kan bijvoorbeeld zo zijn dat een experiment alleen goed uitgevoerd kan worden als er heel veel deelnemende scholen of ziekenhuizen geworven worden, als er een dure manipulatie ontwikkeld wordt, als mensen gedurende heel lange tijd gevolgd worden, of als er met een grote groep onderzoekers wordt samengewerkt. In zulke situaties is een experiment dus in principe wel mogelijk, maar misschien niet voor de onderzoekers die op dat moment hun onderzoeksvraag willen beantwoorden.

Dit is vaak de situatie waarin studenten zich bevinden als ze een studie ontwerpen voor hun bachelor- of masterthesis. Onderzoeksvragen over causaliteit zijn namelijk heel interessant, maar de middelen en beschikbare tijd voor de studenten zijn vaak te beperkt om een gedegen experiment uit te voeren waarmee vragen over causaliteit beantwoord kunnen worden.

Meestal is het dan beter om een ‘minder zware’ onderzoeksvraag te onderzoeken met het juiste studieontwerp, dan om een studieontwerp te gebruiken dat niet in staat is om een antwoord te geven op de onderzoeksvraag. Daarmee voorkom je dat je als onderzoeker in een situatie komt dat je op basis van een niet-experimenteel ontwerp graag toch conclusies over causaliteit wilt trekken, waarmee je de gedragscode wetenschappelijke integriteit schendt. Wanneer er onvoldoende middelen zijn voor een passend (dus experimenteel) studieontwerp is het ook mogelijk om een onderzoeksvraag over causaliteit te laten liggen en eerst de tijd nemen om de benodigde middelen te verwerven.

Overigens zie je soms in artikelen dat onderzoekers toch een verkeerd studieontwerp gebruiken (bijvoorbeeld een observationeel ontwerp) voor het beantwoorden van onderzoeksvragen over causaliteit en dit slechts benoemen in de discussieparagraaf over de beperkingen van de studie. Dit schendt nog steeds de gedragscode wetenschappelijke integriteit, die stelt dat wetenschappers Zorgvuldig, Onafhankelijk, Verantwoordelijk, Eerlijk en Transparant dienen te werken. Het is niet zorgvuldig om het verkeerde studieontwerp te kiezen en niet eerlijk om dat probleem te bagatelliseren als slechts een beperking. Door dit te doen suggereren de onderzoekers ten onrechte dat de gevonden correlatie in die studie wel degelijk causatie impliceert, en dat slechts een verificatie met een sterker studieontwerp nodig is om echt zekerheid te krijgen. Bovendien suggereert dit impliciet dat andere onderzoekers ook kunnen volstaan met een ontoereikend studieontwerp.

In sommige gevallen zijn er echter toch voldoende zwaarwegende redenen om toch een onderzoeksvraag over causaliteit te proberen te onderzoeken zonder een experiment, bijvoorbeeld met longitudinaal onderzoek.

Referenties

Orben, A., & Lakens, D. (2020). Crud (Re)Defined. Advances in Methods and Practices in Psychological Science, 3(2), 238–247. https://doi.org/10.1177/2515245920917961