L’affirmation selon laquelle « Plus l’échantillon est grand, meilleure est la représentativité » est fausse
Un grand échantillon, à l’instar d’un petit échantillon, peut « ne pas » être représentatif. Lorsque certaines personnes ont plus de chances que d’autres d’être sélectionnées, l’échantillon peut déformer la réalité et donc donner une image non représentative.
Par exemple, la réalisation d’une enquête en ligne pour déterminer combien de Belges ont accès à Internet à la maison n’a pas de sens, même avec un large échantillon. Cette méthode de recherche implique que les non-internautes ne peuvent pas participer à ce questionnaire, ce qui, par définition, fausse le résultat.
Que permet un échantillon représentatif ?
1. Généralisation des résultats de recherche
Les résultats de recherche basés sur un échantillon représentatif de la population active en Belgique permettent de tirer des conclusions pour l’ensemble de cette population.
Les travailleurs composant l’échantillon du white paper « Absentéisme en 2021 » ont été absents en moyenne 19 jours pour cause de maladie ou d’accident privé. Comme notre échantillon est représentatif des variables clés, nous pouvons en déduire que le travailleur belge moyen a également été absent pendant 19 jours. Le nombre de jours d’absence semble lié au statut du travailleur, car les ouvriers ont été absents en moyenne 26 jours et les employés 14 jours. Il est donc important que l’échantillon soit représentatif.
Si notre échantillon n’était pas représentatif du statut et était composé, par exemple, de 75 % d’ouvriers et de 25 % d’employés (au lieu de 40 % et 60 %), un travailleur moyen serait absent 23 jours au lieu de 19, selon l’étude. Ce résultat montre d’un échantillon non représentatif peut déformer la réalité – dans ce cas-ci une surestimation.
2. Identification des tendances
Les benchmarks Securex basés sur des échantillons représentatifs permettent d’évaluer l’évolution de l’absentéisme, de la rotation du personnel, de la satisfaction, de la motivation. Mais également du burn-out, du comportement abusif, de l’intention de chercher un autre emploi, de l’âge souhaité de départ à la retraite, ...
Des échantillons non représentatifs peuvent contenir des travailleurs plus âgés d’une année à l’autre, en réalisant l’enquête sur Facebook une année et sur Tik Tok l’année suivante. L’augmentation des cas de burn-out, par exemple, que l’on observerait sur la base de ces échantillons est donc principalement due à la baisse du pourcentage de travailleurs plus âgés dans l’échantillon et n’a rien à voir avec une tendance effective du marché. Mais même lorsque ces échantillons non représentatifs sont collectés de manière systématique avec le même type de sondage, la proportion de travailleurs plus âgés peut évoluer différemment du marché du travail, et entraîner des chiffres et des évolutions erronés.
3. Comparaison avec d’autres études
La comparaison des résultats de recherche de différentes études n’est possible que si chaque étude porte sur un échantillon représentatif.
L’échantillon de l’étude Securex « Absentéisme en 2021 » est représentatif des variables clés ayant un impact sur l’absentéisme : statut, sexe, âge, région et taille des entreprises occupant jusqu’à 1 000 travailleurs. Une autre étude avec un échantillon dans lequel les grandes entreprises sont surreprésentées révélera un taux d’absence pour maladie plus élevé. Parce que les travailleurs occupés dans des grandes entreprises comptent plus de jours d’absence.
4. Positionnement des entreprises
Les résultats de recherche basés sur un échantillon représentatif constituent un benchmark ou un point de repère par rapport auquel les entreprises peuvent se positionner. Un échantillon non représentatif, quelle que soit sa taille, donne une référence instable qui dépend de la composition de l’échantillon. Il ne reflète pas la situation réelle et ne peut pas servir de benchmark.
À partir de cet échantillon représentatif, nous pouvons sélectionner un échantillon encore plus pertinent aux yeux de l’organisation, par exemple uniquement les grandes entreprises. Mais là encore, il importe que ce sous-échantillon soit représentatif des autres variables clés.
5. Modèles stables reflétant des relations généralement applicables
Les modèles théoriques sur lesquels reposent la plupart de nos questionnaires de mesure de la perception (par ex. satisfaction, motivation, burn-out) ont été élaborés à partir de données provenant d’échantillons représentatifs afin de refléter un certain nombre de relations généralement applicables sur le marché du travail (par ex. relations de cause à effet). La construction de modèles qui n’en tient pas compte donne des modèles instables sans aucune valeur pour le client.
Une entreprise qui utilise une mesure de la perception pour identifier les causes d’un faible rendement doit procéder sur base d’un questionnaire sommaire. Ceci ne concerne que les domaines susceptibles d’influencer les performances.
Securex attache une grande importance au développement et au traitement d’études scientifiques de qualité. La représentativité ne dépend pas de la taille de l’échantillon.
Une étude basée sur un large échantillon peut sembler convaincante, mais elle ne garantit pas l’exactitude des conclusions. Nous utilisons également un nombre minimum de répondants. Cela dépend du type d’analyses que nous voulons effectuer, des sous-groupes au sujet desquels nous voulons tirer des conclusions, de la fiabilité et de la précision que nous recherchons dans nos analyses.