Hoofdstuk 3 Constructen

In dit hoofdstuk wordt besproken:

wat constructen zijn
psychologische constructen
hoe constructen worden gemeten
validiteit en betrouwbaarheid van constructen
meetmodellen

Deze stof wordt behandeld in de volgende Open Universiteitscursus(sen):

Onderzoekspracticum cross-sectioneel onderzoek (PB0812)

3.1 Inleiding

Psychologen bestuderen mensen, of beter gezegd, wat mensen doen, waarnemen, voelen, en denken. Wat mensen doen, wordt bepaald door hun hersenen, en is het gevolg van onder andere waarneming, gevoel en gedachten. Als er vanuit wordt gegaan dat het gedrag van mensen wordt bepaald door hun hersenen, en het gevolg is van zintuigelijke informatie, gevoelens, en gedachten dan zou het informatief zijn om die zintuigelijke informatie, gevoelens en gedachten in het brein te bestuderen. Het probleem hierbij is echter dat de hersenen bestaan uit ongeveer \(90\) miljard neuronen die elk met gemiddeld \(7000\) andere neuronen zijn verbonden. Er bestaat geen manier om rechtstreeks te observeren wat al die neuronen precies doen. Bovendien kunnen neuronen ongeveer \(200\) keer per seconde ‘vuren’ (andere neuronen activeren of inhiberen). Zelfs als het mogelijk zou zijn om alle neuronen te observeren, dan zou het opslaan van de benodigde data heel snel uit de hand lopen.

Zaken als persoonlijkheid, hoe mensen beslissingen nemen, hoe mensen stress ervaren en met stress omgaan, en waarom sommige mensen graag een glas wijn drinken zijn dus niet rechtstreeks, via de neuronen die daarbij betrokken zijn, te bestuderen.

Bij het bestuderen van mensen worden daarom vaak zogenaamde constructen bestudeerd. Maar wat is zo’n construct? Hier zijn allerlei opvattingen over. We bespreken hier vier manieren om naar constructen te kijken: als natuurlijk soorten, sociale soorten, praktische soorten en complexe soorten (Fried, 2017).

3.2 Soorten: vier perspectieven op constructen

Er zijn vier ontologische perspectieven mogelijk op de aard van wat je bestudeert. Die ontologische perspectieven leiden tot een indeling van onderzoeksobjecten in de vier hierboven genoemde ontologische soorten, die we hier kort zullen toelichten.

Natuurlijke soorten bestaan los van de mensheid, los van namen en definities. Atomen en moleculen zijn hier voorbeelden van: de eigenschappen van water, \(H_2O\), veranderen bijvoorbeeld niet als je het anders noemt. Water is een natuurlijke soort. In veel wetenschappen worden vaak natuurlijke soorten bestudeerd, maar meestal worden psychologische constructen niet als natuurlijke soort beschouwd.

Een andere ontologische soort is de sociale soort. Veel dingen bestaan niet los van wat mensen er van vinden en ermee doen, maar worden juist uitgevonden door mensen om de wereld om hen heen overzichtelijker te maken. Zo kun je ook de psychologsiche constructen zien. Persoonlijkheid is hier een voorbeeld van: karaktertrekken zoals extraversie of openheid bestaan niet op dezelfde mens-onafhankelijke manier als water bestaat. Het feit dat er meerdere definities van persoonlijkheid zijn, die soms vijf, soms zes, of soms nog een ander aantal persoonlijkheidstrekken omvatten, is hier al een duidelijke aanwijzing voor.

Je kunt psychologische constructen ook als praktische soort zien. Dan is het niet zo belangrijk meer of ze wel echt als zodanig bestaan: hun waarde wordt dan ontleend aan hoe nuttig ze zijn. We kunnen bijvoorbeeld een construct bedenken dat ‘methostatie’ heet. Dat kunnen we definiëren als het gemiddelde van iemands scores op drie methoden-en-statistiekcursussen. Het moge duidelijk zijn dat methostatie niet werkelijk bestaat in het hoofd van mensen. Tegelijkertijd kan het heel nuttig zijn om iemands methostatie te berekenen als je het cijfer voor de bachelor- of masterthese wil voorspellen.

Tot slot zijn er de complexe soorten. Als je constructen ziet als een complexe soort zie je ze als een verzameling eigenschappen die vaak samen voorkomen omdat ze elkaar wederzijds beïnvloeden. Als iemand bijvoorbeeld van de smaak van koffie houdt, zal diegene waarschijnlijk (maar niet noodzakelijk) ook van de geur van koffie houden; waarschijnlijk (maar niet noodzakelijk) koffie drinken gezellig vinden; en waarschijnlijk (maar niet noodzakelijk) regelmatig koffie drinken. Deze combinatie van eigenschappen zou je bijvoorbeeld samen het construct ‘koffieliefhebber’ kunnen noemen.

Dingen die tot dezelfde complexe soort behoren, hoeven niet altijd precies dezelfde eigenschappen te hebben. Als je een stoel als een complexe soort ziet, dan zou je die kunnen definiëren als de volgende verzameling eigenschappen: een horizontaal vlak van ongeveer \(45\) bij \(45\) centimeter, op ongeveer \(45\) centimeter hoogte, gedragen door vier poten, met een verticaal vlak van ongeveer \(50\) centimeter hoog aan een zijde van het horizontale vlak geplaatst. Maar natuurlijk zijn er ook stoelen met drie poten, of vijf; grotere en kleinere stoelen; en stoelen zonder rugleuning.

Psychologische constructen worden tegenwoordig steeds vaker onderzocht als complexe soorten, waarbij ze worden gezien als een netwerk van eigenschappen. Mensen die extravert zijn, vinden vaak sociaal gezelschap prettig, vinden sociale situaties vaak niet stressvol, praten vaak veel, staan vaak op de voorgrond, en starten vaak gesprekken, om een paar eigenschappen te noemen. En andersom, als mensen sociale situaties stressvol vinden en niet graag op de voorgrond staan, is de kans dat ze veel praten, sociaal gezelschap prettig vinden en vaak op de voorgrond staan al kleiner. Zo bezien beschrijft ‘extraversie’ een set van eigenschappen die vaak samen voorkomen.

3.3 Wat zijn psychologische constructen?

Er is geen correct antwoord op de vraag wat psychologische constructen zijn (behalve dan ‘we weten het niet’). Het is onwaarschijnlijk dat constructen als een soort discrete, modulaire bouwsteentjes onze psyche vormen (G.-J. Y. Peters & Crutzen, 2017). Psychologische constructen zijn niet vergelijkbaar met bijvoorbeeld temperatuur, luchtdruk, of geluid; of met atomen of moleculen; of met cellen of organen; of met soorten planten of onderdelen van een machine of een computerprogramma. Elk van die vergelijkingen kan wel nuttig zijn bij het nadenken over psychologische constructen; maar het is belangrijk te onthouden dat dit metaforen zijn, en dus geen beschrijvingen van de realiteit.

Er is geen ontologisch standpunt dat duidelijk het juiste perspectief biedt op psychologische constructen (zie het hoofdstuk Wetenschap). Dit maakt psychologisch onderzoek natuurlijk niet eenvoudiger. We bestuderen dingen die we niet rechtstreeks kunnen observeren, en waarvan je vaak niet eens kan zeggen dat ze echt bestaan. Toch willen we die dingen meten en proberen we om ze te gebruiken om mensen beter te begrijpen en voorspellen.

Het ontologische perspectief dat je hanteert met betrekking tot een psychologisch construct en de definitie van dat construct bepalen samen hoe je na moet denken over het manipuleren en/of meten van dat construct.

Omdat psychologische constructen niet rechtstreeks observeerbaar zijn (daarom worden ze ook wel latente constructen genoemd), en omdat er allerlei verschillende ontologische posities te verdedigen zijn, en omdat mensen zo goed zijn in patroonherkenning dat ze regelmatig patronen waarnemen die niet bestaan, en omdat mensen zelf de ervaring hebben prima na te kunnen denken over hoe zijzelf werken en hoe anderen werken, is het in de psychologie extra belangrijk om de wetenschappelijke methode rigoreus toe te passen.

3.4 Een metafoor om over constructen na te denken

Een handige metafoor om over constructen te denken is een netwerk van psychologische constructen, dat visueel kan worden weergegeven. Neem bijvoorbeeld ‘het eten van een ijsje’; mensen kunnen gesprekken voeren over ijsjes, ze kunnen er herinneringen over ophalen, en hebben verschillende voorkeuren met betrekking tot ijsjes, en een attitude ten opzichte van het eten van een ijsje; ook bestaan er normen met betrekking tot het eten van een ijsje. Figuur 3.1 verschaft een metafoor om een stukje van de psychologie rondom ‘het eten van een ijsje’ te visualiseren.

Figuur 3.1: Een metafoor voor constructen.

Een persoon bij wie de gedachte aan een ijsje het bovenstaande netwerk van psychologische aspecten activeert, ziet ‘een ijsje eten’ blijkbaar in een bepaalde mate als iets goeds. De persoon ziet het in een bepaalde mate als iets leuks; beschouwt het in een bepaalde mate als iets makkelijks; maar heeft ook een bepaalde associatie met schuldgevoel.

We zouden nu een psychologisch construct kunnen definiëren met behulp van de aspecten van de menselijke psyche die dat construct beschrijven. Stel dat we het construct ‘attitude ten opzichte van het eten van een ijsje’ willen definiëren. We zouden dan bijvoorbeeld kunnen stellen dat die attitude bestaat uit de mate waarin die persoon het eten van een ijsje evalueert als goed, onschadelijk en voordelig. Een ander construct, ‘waargenomen normen met betrekking tot het eten van een ijsje’ kunnen we vervolgens definiëren als onder andere de mate waarin iemand denkt dat diens partner en ouders het zouden goedkeuren als diegene een ijsje zou eten. Dit kunnen we vervolgens visualiseren zoals in Figuur 3.2.

Figuur 3.2: Attitude en Waargenomen Normen geïllustreerd.

Deze visualisatie maakt het makkelijker om grondig na te denken over definities van constructen. Zou bijvoorbeeld de mate waarin een ijsje eten volgens de etiquette is, niet ook deel uit moeten maken van de norm? Of zou de mate waarin een ijsje eten interessant is niet ook deel uit moeten maken van attitude?

Omdat constructen niet rechtstreeks observeerbaar zijn, moeten ze zodanig expliciet gedefinieerd zijn dat de definitie helderheid geeft over de inhoud van het construct. Die definitie geeft daarom antwoord op de vragen zoals in de vorige alinea gesteld.

Elke metafoor, die je kunt inzetten om grip te krijgen op de menselijke psychologie, heeft zijn beperkingen. Zo zijn de hier afgebeelde aspecten in zekere zin arbitrair; er zijn ook heel veel andere te bedenken.

Ook kunnen sommige aspecten zelf nader gespecificeerd worden of wellicht juist worden samen genomen. Hoe gezond iemand iets vindt kan net zo goed worden opgesplitst in ‘fysieke gezondheid’ en ‘geestelijke gezondheid’, en ook die opdeling is arbitrair.

Als het goed is specificeert een theorie die een of meerdere constructen postuleert ook hoe die constructen kunnen worden onderzocht.

3.5 Operationaliseren versus meten

Omdat de menselijke psychologie niet rechtstreeks onderzocht kan worden, worden constructen gedefinieerd die dan vervolgens wel gemeten kunnen worden. Dit proces bestaat uit twee stappen. De eerste stap is operationalisatie van het construct: het specificeren van een of meer dingen die wél rechtstreeks gemeten kunnen worden die informatief zijn voor het construct. De tweede stap is het selecteren of ontwikkelen van een meetinstrument om die operationalisatie te meten. Een gegeven construct met een gegeven definitie kan dus meerdere operationalisaties hebben; en voor een gegeven operationalisatie kunnen meerdere meetinstrumenten bestaan.

Temperatuur, bijvoorbeeld, kun je operationaliseren als “het volume van kwik”. Dit kun je vervolgens meten door een bepaalde hoeveelheid kwik in een dun buisje te stoppen, zodat je kunt zien of de kwik uitzet. Je hebt dan een meetinstrument gemaakt voor die specifieke operationalisatie van temperatuur. Omdat je de afmetingen van je buisje kent, weet je voor een gegeven niveau van kwik hoeveel volume dat is. Je kunt nu bepaalde volumes definiëren als bepaalde temperaturen: je kunt bijvoorbeeld het buisje in water laten zakken, en als het water kookt, besluiten dat het volume dat het kwik op dat moment inneemt staat voor \(100\) graden. Of \(212\) graden (Fahrenheit). Of \(373.2\) graden (Kelvin).

Bij temperatuur heb je het voordeel dat er een “natuurlijke soort” bestaat die je kunt gebruiken om meetinstrumenten te calibreren. Hoewel het waar is dat je verschillende definities kunt hebben van wanneer de temperatuur waarmee water kookt wordt bereikt (bij het eerste luchtbelletje? Als de luchtbelletjes een bepaalde omvang hebben? Als er een bepaalde hoeveelheid damp wordt geproduceerd?), maken die uiteindelijk maar relatief weinig uit voor waar je je markering zet. De kans dat je de markering voor de temperatuur waarmee water kookt bij, bijvoorbeeld, \(0\) graden celcius zet, is verwaarloosbaar. Je komt misschien uit op \(97\) graden celsius, of \(106\) graden celsius, maar dat is tenminste grofweg in dezelfde richting, omdat het kookpunt van water een “natuurlijke soort” is.

In de psychologie bestaan dergelijke natuurlijke soorten niet. Mensen hebben geen kookpunt (tenminste, de meeste mensen niet). Laten we als voorbeeld het psychologische construct “attitude” nemen, specifiek, “attitude ten opzichte van het eten van een ijsje”. Dit kunnen we operationaliseren als “de mate waarin iemand het eten van een ijsje slecht of goed vindt”.

Die operationalisatie maakt het al een stuk concreter, maar om tot een meetinstrument te komen, moeten we meer keuzes maken: we moeten een “buisje” kiezen. Laten we die keuzes zodanig maken dat we een vraag krijgen waarbij mensen een van vijf vakjes aankruisen. Dit is hieronder geïllustreerd:

Voor mij is het eten van een ijsje…

Heel slecht

🔾

Heel goed

We nemen nu aan dat mensen die het eten van een ijsje goed vinden, een vakje aan de rechterkant aankruisen, en mensen die het eten van een ijsje slecht vinden, een vakje aan de linkerkant. Maar we hebben geen manier om deze schaal te ijken. Bij temperatuur kunnen natuurlijke soorten (e.g. het kookpunt van water) worden gebruikt om de schaalverdeling te kalibreren, maar in de psychologie kan dat niet. Daarom worden in de psychologie geen meeteenheden gedefinieerd, zoals graden celsius, grammen, of liters. Wel worden vaak getallen gebruikt om de verschillende mogelijke responsen te representeren: de vijf hokjes hierboven zouden bijvoorbeeld kunnen corresponderen met \(1\) tot en met \(5\).

Het gebrek aan meeteenheden en mogelijkheden om te ijken maken het meten van constructen problematisch. Zonder mogelijkheid om een meetinstrument te calibreren is het niet mogelijk om te weten of twee meetinstrumenten hetzelfde meten of niet, en of ze goed zijn geijkt of niet. Dit maakt het extra belangrijk om bij het meten van psychologische constructen eerst twee zaken kraakhelder te hebben voordat het mogelijk wordt om na te denken over meetinstrumenten.

Ten eerste moet er een duidelijke definitie van het betreffende construct zijn. Die definitie moet duidelijk aangeven welke aspecten van de menselijke psychologie onder dat construct vallen, en welke niet. Zonder duidelijke definitie weet je immers niet waar je het precies over hebt, laat staan dat je een zinnige operationalisatie kunt specificeren.

Dat is het tweede: je moet een duidelijke operationalisatie hebben gedefinieerd. Als je een duidelijke operationalisatie hebt gedefinieerd die helemaal consistent is met de definitie van het construct, kun je gaan nadenken over een meetinstrument om die specifieke operationalisatie te meten.

Het doel van meetinstrumenten is om informatie te krijgen over een construct: het doel is om iets te meten, en niet te veranderen. Dit wordt bereikt door mensen bloot te stellen aan een procedure (en eventueel aan stimuli) en vervolgens een respons te registreren. Een voorbeeld is een vragenlijst, waarbij stimuli worden aangeboden (vragen en antwoordopties) volgens een procedure (bijvoorbeeld in een online vragenlijst, of op papier), waarbij het de bedoeling is dat de procedure en stimuli op een bepaalde manier worden verwerkt door de deelnemers, zodat de respons die de mensen vertonen informatie geeft over een psychologisch construct (meestal is het idee dat de antwoordoptie die mensen aankruisen iets zegt over dat construct). Meetinstrumenten van psychologische constructen bestaan uit een procedure, er kunnen één of meer stimuli zijn maar dat hoeft niet, en bovendien is er een responsregistratie.

In dit boek noemen we een onderdeel van een meetinstrument dat een enkel datapunt oplevert een “item”. Het simpelste meetinstrument bevat maar één item, en levert dus maar één datapunt op. Laten we het voor nu bij zo’n één-item-meetinstrument houden.

3.6 Wat is een item?

We definiëren een item als een enkele responsregistratie, meestal vergezeld van een procedure om die toe te passen, en bovendien bijna altijd vergezeld van een of meerdere stimuli. Voorbeelden van items zijn:

een afbeelding die in een computertaakje wordt getoond en waarbij de reactietijd wordt geregistreerd;
een hartslagmeting;
het antwoord van een deelnemers op een vijf-keuze-vraag.

Hoewel de informatie in dit hoofdstuk over alle soorten items gaat, zijn vragen in een vragenlijst het makkelijkst als voorbeeld. We zullen daarom verder uitgaan van vragen in een vragenlijst. Voor een vraag in een papieren vragenlijst zijn de drie componenten bijvoorbeeld als volgt ingevuld:

De responsregistratie gebeurt door middel van een pen en geprinte vakjes: deelnemers kruisen het vakje aan dat correspondeert met het antwoord dat ze in gedachten hebben. De repons (het gemeten gedrag) is dus het aankruisen van dat vakje.
De stimuli zijn:
- de vraag (gedrukt in een bepaald lettertype, in een bepaalde kleur, op een bepaalde plek op het papier)
- de vakjes die kunnen worden aangekruist om de respons te registreren
- eventuele labels bij die vakjes
- een eventuele inleiding of uitleg bij de vraag
De procedure betreft in dit geval informatie over, bijvoorbeeld, de relatieve positionering van de stimuli, of de manier waarop het item moet worden aangeboden. Zoals hier al duidelijk is, is de indeling in stimuli en procedure soms arbitrair; je zou kunnen stellen dat lettertype onderdeel is van de procedure, of van de stimulus.

Voor een vraag in een online vragenlijst zijn de drie componenten bijvoorbeeld als volgt ingevuld:

De responsregistratie gebeurt door middel van een “human computer interface”, zoals een toetsenbord, muis, of touchscreen. Hiermee selecteren deelnemers een van meerdere opties door de cursor erheen te bewegen en te bevestigen met de spatiebalk, een muisklik, of door op de juiste positie het scherm aan te raken.
De stimuli zijn:
- de vraag (weergegeven in een bepaald lettertype, in een bepaalde kleur, op een bepaalde plek op het scherm)
- de afbeeldingen die aangeven welke respons is geregistreerd
- eventuele labels bij die afbeeldingen
- een eventuele inleiding of uitleg bij de vraag
De procedure betreft weer informatie over de manier waarop het item moet worden aangeboden en informatie over de relatieve positionering van de stimuli.

3.7 Validiteit en betrouwbaarheid van items

De procedure, stimuli, en responsregistratie bepalen samen welke aspecten van de psychologie een rol spelen bij het uiteindelijk produceren van de respons. Deze bepalen daarom de zogenaamde validiteit van het item: of het item het construct ook echt meet. Dit wordt in meer detail besproken in hoofdstuk Validiteit van Meetinstrumenten. Een valide item vereist eerst zogenaamde cognitieve validiteit: dat de stimulus, procedure, en responsregistratie door de deelnemers worden geïnterpreteerd zoals ze zijn bedoeld. Ook dit wordt in meer detail besproken in het hoofdstuk Validiteit van Meetinstrumenten.

Omdat de menselijke psychologie complex en uitgebreid is en omdat een enkel item maar één respons registratie bevat, en vaak maar weinig stimuli (bijvoorbeeld een enkele vraag), is er vaak maar een heel klein aspect van de menselijke psychologie betrokken bij het produceren van de respons. De meeste constructen zijn breder gedefinieerd, dus de meeste meetinstrumenten bevatten meerdere items. Maar voor nu blijven we even bij ons ene item.

Als je uitgaat van een item dat helemaal valide is (dat dus wordt geïnterpreteerd zoals bedoeld, en waarbij de geregistreerde respons afhangt van het betreffende construct, en niet van andere constructen), zal de respons toch nog willekeurig variëren van meting tot meting. Dat komt omdat er net zoals bij een meting van gewicht, lengte, of temperatuur, ook bij het meten van psychologische constructen meetfout is. Door toeval geven mensen soms net een wat ander antwoord. Meetfout is het complement van betrouwbaarheid. Als een item 20% meetfout heeft, wordt gesteld dat de betrouwbaarheid \(.80\) (dus, \(80\%\)) is. Dit wordt uitgebreider besproken in het hoofdstuk Betrouwbaarheid.

Validiteit en betrouwbaarheid zijn geen kenmerken van een item, maar van een specifieke toepassing van dat item. Neem bijvoorbeeld dit item om de attitude ten opzichte van het eten van een ijsje te meten:

Voor mij is het eten van een ijsje…

Heel slecht

🔾

Heel goed

Het idee van dit item is dat mensen het lezen en dan het antwoord aankruisen dat voor hen geldt. Als het goed is speelt in dat proces het relevante construct (de attitude van mensen jegens het eten van een ijsje) een rol, maar ook andere psychologische constructen spelen een rol: een bepaald niveau van Nederlandse taalvaardigheid is nodig om de stimuli te verwerken, en een zekere mate van abstract denken is nodig om de responsregistratie te begrijpen.

Dit item is dus niet voor iedereen even valide. Als dit item wordt ingevuld door iemand die geen Nederlands spreekt, is de validiteit waarschijnlijk heel laag. De validiteit kan ook lager zijn voor mensen die wel Nederlands spreken maar minder geletterd zijn. Net als validiteit, is ook betrouwbaarheid een eigenschap van een gegeven toepassing van het item, niet van het item op zich. Als dit item bijvoorbeeld wordt ingevuld in een zeer rumoerige omgeving is de meetfout wellicht groter.

3.8 Meerdere items: meetmodellen

Veel constructen zijn relatief breed, en hun operationalisaties zijn daarom vaak niet met een enkel item te meten. Daarom bestaan psychologische meetinstrumenten vaak uit meerdere items, bijvoorbeeld meerdere vragen. Als attitude ten opzichte van het eten van een ijsje breder zou zijn gedefinieerd, en dus ook breder zou zijn geoperationaliseerd, dan zou ons meetinstrument bijvoorbeeld kunnen bestaan uit deze twee items:

Voor mij is het eten van een ijsje…	Heel slecht	🔾	🔾	🔾	🔾	🔾	Heel goed
Voor mij is het eten van een ijsje…	Heel onprettig	🔾	🔾	🔾	🔾	🔾	Heel prettig

Elk item levert per toepassing bij een deelnemer een datapunt op, en meerdere items leveren dus meerdere datapunten op. De responsen op de items uit het voorbeeld hierboven kunnen bijvoorbeeld worden gerepresenteerd met \(1\), \(2\), \(3\), \(4\), of \(5\), en elke keer als we dit meetinstrument toepassen op een deelnemer aan een studie krijgen we dus twee getallen. We hanteren hierbij de aanname dat iemand die het eten van een ijsje heel slecht en heel onprettig vindt, twee keer het meest linkse vakje aankruist, waardoor de twee datapunten die we krijgen twee keer een \(1\) zijn; terwijl iemand die het eten van een ijsje heel goed en heel prettig vindt, twee keer het meest rechtse vakje aankruist, waardoor de twee datapunten die we voor die deelnemer krijgen juist twee keer een \(5\) zijn.

Op dit moment wordt de vraag hoe we die twee getallen aggregeren. De simpelste manier is om ze te middelen of op te tellen, maar dat gaat niet zo makkelijk: we zouden dan allerlei aannames maken, en die moeten wel kloppen. Hiervoor wordt een zogenaamd meetmodel opgesteld. Een meetmodel beschrijft wat voor soort construct we meten, op basis van onze ontologische positie ten opzichte van dat construct.

Als wordt aangenomen dat een psychologisch construct een (onobserveerbare oftwel latente) natuurlijke soort of een sociaal geconstrueerde soort is betekent dat vaak dat een zogenaamd reflectief meetmodel wordt gebruikt. Er wordt dan aangenomen dat de scores op de items worden veroorzaakt door dat construct: de aanname is dat de scores op de items een “reflectie” zijn van het onderliggende latente construct, zoals geïllustreerd in Figuur 3.3. Maar, validiteit en betrouwbaarheid kunnen verschillen van item tot item, dus niet elk item telt noodzakelijkerwijs even zwaar mee. Het ‘gewicht’ van elk item moet dus worden bijgesteld afhankelijk van de meetfout en validiteit van dat item.

Figuur 3.3: Een reflectief meetmodel.

Als er geen aannames zijn over een onderliggend latent construct dat de scores op de items veroorzaakt, maar het construct een praktische soort is, dan wordt het meetmodel omgedraaid. In dat geval wordt het construct gedefinieerd als de scores op de items. In het zogenaamde formatieve meetmodel vormen de scores het construct, zoals geïllustreerd in Figuur 3.4. In dat geval worden de gewichten toegekend op basis van het aandeel dat het item in dat construct moet hebben.

Figuur 3.4: Een formatief meetmodel.

Tot slot kan worden aangenomen dat het construct een complexe soort is. In dat geval wordt niet aangenomen dat de scores op de items worden veroorzaakt door een onderliggend latent construct; en het construct wordt ook niet gedefinieerd door de scores op de items. In plaats daarvan wordt gesteld dat het construct bestaat uit een patroon van samenhang tussen verschillende aspecten van de menselijke psychologie die elkaar wederzijds beïnvloeden. In dat geval is het meetmodel een netwerkmodel, waar het construct bestaat uit de relaties tussen de items, zoals geïllustreerd in Figuur 3.5.

Figuur 3.5: Een netwerk-meetmodel.

Hoewel Figuren 3.3 en 3.4 beiden een expliciete representatie van het construct hebben, geldt dat niet voor Figuur 3.5: daar bestaat het construct in de regelmatigheden in de invloeden tussen de items. Een voorbeeld is het construct ‘depressie’. Dit begrip zou gedefinieerd kunnen worden als een netwerk-meetmodel waarbij de items bestaan uit scores op bijvoorbeeld: slaapkwaliteit, suicidale gedachten, gebrek aan interesses, concentratieproblemen, angst, en dergelijke. De samenhang tussen deze items kan dan worden weergegeven als in Figuur 3.5. Het geheel van deze onderlinge verbanden beschrijft in een netwerk-meetmodel het construct ‘depressie’.

3.9 Itemscores samenvoegen

Het meetmodel dat je hanteert bepaalt hoe je de scores op de items samenvoegt. Die samenvoeging representeert de aannames over hoe de items en het construct samenhangen:

Bij een reflectief meetmodel is de aanname dat het construct onafhankelijk van de items bestaat, en dat de scores op de items worden veroorzaakt door dat latente construct;
Bij een formatief meetmodel is het construct gedefinieerd als het aggregaat van de items, en kan dus niet onafhankelijk van de items bestaan;
Bij een netwerk-meetmodel is het construct gedefinieerd als regelmatigheden in hoe de items elkaar beïnvloeden, en bestaat het dus alleen in die verbanden.

Als een netwerk-meetmodel wordt gebruikt wordt er meestal niets samengevoegd, in plaats daarvan wordt juist vaak naar de netwerken zelf gekeken. Netwerk-modellen verschillen fundamenteel van de andere benaderingen in dit boek, en worden in deze versie van het boek daarom verder niet behandeld.¹

Als een reflectief of formatief meetmodel wordt verondersteld is samenvoeging vaak wel gangbaar. Zoals hierboven is uitgelegd heeft elk item een bepaalde validiteit en een bepaalde betrouwbaarheid: in principe kan elk item worden beschouwd alsof het een sub-construct meet.

Als een reflectief meetmodel wordt gebruikt, wordt verondersteld dat het construct voor elk item hetzelfde is, bijvoorbeeld dat elk item in een depressievragenlijst hetzelfde construct ‘depressie’ meet. In dat geval geldt dat de mate waarin elk item samenhangt met de andere items indicatief is voor hoe valide en betrouwbaar het item is. Als een item bijvoorbeeld veel meetfout heeft, en dus een lage betrouwbaarheid, dan worden de scores op dat item voor een groot deel bepaald door toeval. Omdat toeval niet systematisch is, kan zo’n onbetrouwbaar item niet sterk samenhangen met de andere items. Als een item weinig meetfout heeft (en dus betrouwbaar is), maar (voor een deel) een ander construct meet dan de bedoeling is (en dus minder valide is), kan dat item ook niet sterk samenhangen met de andere items.

In zo’n situatie kunnen de verbanden tussen items worden bekeken om te kijken hoe zwaar elk item mee moet tellen om de beste indruk van het construct te krijgen. Dit kan met factoranalyse, een statistische techniek die ook wordt behandeld in dit boek (zie hoofdstuk Factoranalyse). Het idee is dat een item dat sterk samenhangt met de meeste andere items het veronderstelde latente construct beter representereert dan een item dat minder samenhang vertoont. Op basis van de relevante gewichten worden de scores op de items dan samengevoegd tot een score op het construct.

Als een formatief meetmodel wordt gebruikt wordt niet aangenomen dat er een onderliggend construct is: het construct wordt juist gedefinieerd door de items. In dat geval levert de bijbehorende theorie als het goed is een model voor de samenvoeging. Die theorie kan bijvoorbeeld stellen welke items zwaarder moeten tellen, welke lichter moeten tellen, en of de items worden opgeteld of dat er een ander algoritme wordt toegepast (bijvoorbeeld: “het resultaat van de samenvoeging is het gemiddelde van de scores op de items, behalve als er \(1\) wordt gescoord op item \(1\) of op item \(2\), dan is het resultaat altijd \(0\)”).

3.10 Validiteit en betrouwbaarheid van meetinstrumenten

Elke keer dat een meetinstrument wordt toegepast, heeft die toepassing een gegeven validiteit en betrouwbaarheid. In elk studie is het dus nodig om die te schatten om te verifiëren of ze voldoende hoog zijn. Er zijn geen meetinstrumenten die altijd goed werken, dus soms zal dat niet het geval zijn, en in zulke situaties kunnen de scores niet beschouwd worden als informatief voor de desbetreffende constructen.

In dit verband is het handig om onderscheid te maken tussen schalen en indices (G.-J. Y. Peters, 2014). Bij een schaal is de bedoeling dat alle items precies hetzelfde construct meten. Het aggregaat van de items in zo’n schaal worden daarom beschouwd als een maat voor het desbetreffende construct. Als een meetinstrument als schaal wordt gezien wordt dus vaak bedoeld dat er een reflectief meetmodel wordt gebruikt.

Bij een index wordt juist gesteld dat alle items niet hetzelfde construct meten. Dit correspondeert juist eerder met een formatief meetmodel (hoewel er sprake kan zijn van een index zonder dat er een construct bij hoort, of een index die meerdere constructen combineert).

Dat bij een index de items niet hetzelfde meten, en bij een schaal wel, heeft implicaties voor de analyses die uitgevoerd kunnen worden. In hoofdstukken Betrouwbaarheid en Validiteit schatten en verhogen wordt besproken hoe betrouwbaarheid en validiteit van een meetinstrument geschat kunnen worden.

Referenties

Fried, E. I. (2017). What are psychological constructs? On the nature and statistical modeling of emotions, intelligence, personality traits and mental disorders. Health Psychology Review, 11(2), 130–134. https://doi.org/10.1080/17437199.2017.1306718

Peters, G.-J. Y. (2014). The alpha and the omega of scale reliability and validity: Why and how to abandon Cronbach’s alpha and the route towards more comprehensive assessment of scale quality. European Health Psychologist, 16(2), 56–69. https://doi.org/10.17605/osf.io/tnrxv

Peters, G.-J. Y., & Crutzen, R. (2017). Pragmatic nihilism: How a Theory of Nothing can help health psychology progress. Health Psychology Review, 11(2). https://doi.org/10.1080/17437199.2017.1284015

Om meer te lezen over netwerkbenaderingen is https://psych-networks.com/ een uitstekend startpunt. Deze site wordt onderhouden door Eiko Fried, en de nadruk ligt hier op psychopathologie. Jonas Dalege gebruikt netwerken om attitudes te onderzoeken, en zijn publicaties met een korte samenvatting staan op https://jdalege.com/publications/.↩︎