De bewering ‘Hoe groter de steekproef, hoe beter de representativiteit’ klopt niet
Een grote steekproef kan net zoals een kleine steekproef ‘niet’ representatief zijn. Wanneer bepaalde mensen een grotere kans hebben dan anderen om geselecteerd te worden, kan de steekproef een vertekend beeld geven en dus niet representatief zijn.
Bijvoorbeeld, met een onlinesurvey nagaan hoeveel Belgen thuis toegang hebben tot internet, heeft geen zin, zelfs niet met een grote steekproef. Deze onderzoeksmethode betekent dat de niet-internetgebruikers niet kunnen deelnemen aan deze vragenlijst, waardoor het resultaat per definitie een vertekend beeld geeft.
Wat laat een representatieve steekproef toe?
1. Generaliseren van onderzoeksresultaten
Onderzoeksresultaten op basis van een representatieve steekproef voor de Belgische beroepsbevolking, laten toe om uitspraken te doen voor die volledige populatie.
De werknemers in de steekproef voor de white paper ‘Absenteïsme in 2021’ waren gemiddeld 19 dagen afwezig door ziekte of privé-ongeval. Omdat onze steekproef representatief is voor de belangrijkste variabelen, kunnen we daaruit afleiden dat ook de gemiddelde Belgische werknemer 19 dagen afwezig was. Het aantal afwezigheidsdagen blijkt afhankelijk van het statuut van een werknemer, want arbeiders waren gemiddeld 26 dagen afwezig en bedienden 14 dagen. Het is dus belangrijk dat de steekproef representatief is voor statuut.
Mocht onze steekproef niet representatief zijn voor statuut en bijvoorbeeld samengesteld uit 75% arbeiders en 25% bedienden (in plaats van 40% vs. 60%), dan zou een gemiddelde werknemer volgens het onderzoek 23 dagen afwezig zijn in plaats van 19. Dit cijfer toont aan hoe een niet-representatieve steekproef een vertekend beeld – in dit geval een overschatting – van de realiteit kan geven.
2. Vaststellen van trends
De Securex benchmarks op basis van representatieve steekproeven laten toe om de evolutie na te gaan van onder meer absenteïsme, personeelsverloop, tevredenheid, motivatie, burn-outklachten, grensoverschrijdend gedrag, verloopintentie, gewenste pensioenleeftijd.
Niet-representatieve steekproeven kunnen het ene jaar bijvoorbeeld meer oudere werknemers bevatten dan het andere jaar, door in het ene jaar de enquête via Facebook te verspreiden en in het andere jaar via Tik Tok. De toename van bijvoorbeeld burn-outklachten die je op basis van deze steekproeven zou vaststellen, is dan vooral te wijten aan het gedaalde percentage oudere werknemers in de steekproef en heeft niets te maken met een daadwerkelijke trend in de markt. Maar ook wanneer die niet-representatieve steekproeven telkens met dezelfde soort bevraging worden verzameld, kan het aandeel oudere werknemers anders evolueren dan in de arbeidsmarkt, met foute cijfers en evoluties tot gevolg.
3. Vergelijken met andere onderzoeken
Vergelijking van onderzoeksresultaten van verschillende studies kan enkel indien elke studie met een representatieve steekproef werkt.
De steekproef van het Securex onderzoek ‘Absenteïsme in 2021’ is representatief voor de belangrijkste variabelen met impact op absenteïsme: statuut, geslacht, leeftijd, regio en omvang van ondernemingen tot 1000 werknemers. Een ander onderzoek met een steekproef waarin grote ondernemingen oververtegenwoordigd zijn, zal een hoger ziektepercentage publiceren. Want werknemers in grote ondernemingen tellen meer afwezigheidsdagen.
4. Positioneren van ondernemingen
Onderzoeksresultaten op basis van een representatieve steekproef vormen een benchmark of een ijkpunt waartegen ondernemingen zich kunnen positioneren. Een niet representatieve steekproef, hoe groot ook, geeft een onstabiel ijkpunt dat afhankelijk is van de samenstelling van de steekproef. Deze weerspiegelt de werkelijke situatie niet en is niet geschikt als benchmark.
Uit die representatieve steekproef kunnen we een voor de onderneming nog meer relevante steekproef selecteren, bijvoorbeeld enkel de grote ondernemingen. Maar ook dan is het van belang dat die deelsteekproef representatief is voor de andere belangrijke variabelen.
5. Stabiele modellen die algemeen geldende verbanden weerspiegelen
De theoretische modellen waarop de meeste van onze vragenlijsten voor perceptiemetingen zijn gebaseerd (bv. tevredenheid, motivatie, burn-out) werden gebouwd met behulp van data van representatieve steekproeven, zodat ze een aantal algemeen geldende verbanden binnen de arbeidsmarkt weerspiegelen (bv. oorzaakgevolg-relaties). Modelbouw die daar geen rekening mee houdt, levert instabiele modellen op zonder waarde voor de klant.
Een onderneming die met een perceptiemeting de oorzaken van een lage performance in kaart wil brengen, moet dat kunnen doen op basis van een summiere vragenlijst die enkel die domeinen behandelt met een mogelijke invloed op de performance.
Securex hecht veel belang aan de ontwikkeling en hantering van kwalitatief, wetenschappelijk onderzoek. Representativiteit hangt niet af van de steekproefgrootte
Een onderzoek op basis van een grote steekproef kan misschien wel overtuigend lijken, maar is geen garantie voor juiste uitspraken. Ook wij hanteren een minimum aantal respondenten. Dit is afhankelijk van het soort analyses dat we willen uitvoeren, van de deelgroepen waarover we uitspraken willen doen en van de betrouwbaarheid en nauwkeurigheid die we nastreven in onze analyses.