Le billet d’aujourd’hui nous vient de Chris DeAngelis, un expert en conception de solutions d’échantillonnage pour un large éventail de projets d’études par téléphone et en ligne pour des sociétés d’études commerciales, des gouvernements et des universités.
Lorsque les chercheurs demandent un échantillon représentatif au niveau national (« nat. rep. »), cela signifie que la population concernée est l’ensemble de la population du pays en question et que l’échantillon doit refléter cette réalité dans sa structure. C’est à ce moment-là que l’on trouve le meilleur de la nat. L’échantillon « ressemblera » à la population , quelle que soit la façon dont il est considéré. Le nombre d’hommes et de femmes correspondra aux proportions nationales, le pourcentage dans chaque groupe d’âge ou chaque région correspondra exactement à la population, etc. En ce qui concerne les mesures non démographiques (telles que la possession d’un produit ou les données psychographiques), l’échantillon doit correspondre à la population.
Pour ce faire, la théorie des manuels exige un échantillon aléatoire important et un taux de réponse élevé afin de minimiser l’erreur systématique et de réduire le risque d’erreur non systématique résultant d’un biais d’échantillonnage. Dans le « monde réel » des études de marché, les taux de réponse ne sont pas élevés et les différences de taux de réponse en fonction de la démographie font que la plupart des échantillons purement aléatoires ne ressemblent pas à la population (quelle que soit la sophistication des techniques de stratification). C’est pourquoi les études de marché utilisent généralement des échantillons de type « quota ». Un échantillon par quotas est garanti à 100 % de ressembler à la population sur les critères démographiques que vous avez choisi de cibler. Cependant, tout le reste est sujet à l’erreur d’échantillonnage. Prenons l’exemple de l’âge : si les quotas sont fixés à 16-34 ans, 35-54 ans, 55 ans et plus, l’échantillon sera représentatif dans ces proportions, mais si l’analyse porte sur les tranches d’âge 16-20 ans, 21-30 ans, 31-40 ans, etc.
La mesure dans laquelle il est possible de contrôler un échantillon par quota dépend de la détermination de la taille de l’échantillon et des données de référence disponibles. Six tranches d’âge, deux sexes et 15 régions créent une grille de 180 cellules. Si la taille de l’échantillon n’est que de 100, il n’est pas possible de remplir toutes les cellules. Même avec un échantillon plus important, une cellule peut ne nécessiter que la moitié d’une personne et donc ne pas contenir de données. Pour rendre un échantillon plus représentatif, on peut utiliser la pondération. Au lieu de cellules imbriquées, les cellules de quotas peuvent être structurées de manière indépendante. L’inconvénient est qu’il peut y avoir des « trous » importants dans l’échantillon – si tous les jeunes sont des hommes par exemple – et il ne sera pas possible d’utiliser la pondération pour corriger ces trous.
Quelles sont les variables à utiliser pour obtenir un échantillon « nat rep » ?
Il n’y a pas de réponse unique et définitive – cela dépend de l’objectif de la recherche et de la géographie. Par exemple, l’âge, le sexe, la région et la classe sociale peuvent être utilisés au Royaume-Uni ; l’âge, le sexe, la région et l’appartenance ethnique aux États-Unis ; ou l’âge, le sexe, la région et la langue parlée en Belgique.
L’âge, le sexe et la région géographique sont souvent associés à un facteur de différenciation du bien-être économique. Il peut s’agir du revenu, de l’éducation, de la classe sociale ou de la propriété du logement.
Ce que recommande QuestionPro Audience :
En l’absence d’autres instructions, en Amérique du Nord, QuestionPro Audience utilisera l’âge, le sexe et une variable supplémentaire qui se différencie par le bien-être économique. (En Amérique du Nord, la représentation géographique est naturelle). En Europe, en l’absence d’autres instructions, les audiences utiliseront l’âge, le sexe et la région, étant donné que les données sur le « bien-être économique » ne sont pas disponibles dans le recensement pour toutes les zones géographiques.