Documente Academic
Documente Profesional
Documente Cultură
L’échantillonnage
L’échantillonnage
à l a r e c h e r c h e
Le sommaire
1. Un échantillon biaisé
2. Un échantillonnage illustré
3. Quelques définitions
4. L’échantillon par rapport au recensement
5. Les avantages de l’échantillon.
6. Les principes fondamentaux de la théorie de l’échantillonnage
7. Les étapes de l’échantillonnage
8. Les méthodes d’échantillonnage probabiliste
9. Les méthodes d’échantillonnage non probabiliste
10. Les erreurs d’échantillonnage
11. La taille de l’échantillon
12. Je fais mes exercices
Quelques situations bien concrètes sont présentées de manière à faire ressortir avec plus
d’éclat les erreurs majeures d’échantillonnage.
Votre comité souhaite recueillir la signature des citoyens
!
afin d’appuyer le projet de construction d’un centre
communautaire. Vous recueillez les signatures
à l’entrée de la quincaillerie de votre région.
L’erreur majeure réside dans la sélection des personnes.
X
Les signataires seront en majorité des propriétaires fonciers
d’âge mûr et, probablement, de sexe masculin. Tous les
citoyens ne fréquentent pas la quincaillerie également.
!
alimentaires des familles. Vous logez vos appels en
matinée le plus souvent, puisque c’est la seule période de
la journée où vous êtes disponible.
Une fois de plus le choix des répondants est biaisé. Les
X
personnes qui travaillent à l’extérieur du foyer seront
systématiquement éliminées de votre enquête. Votre
échantillon sera composé de répondants plutôt homogènes.
2. Un échantillonnage illustré
Dans le tableau suivant, une population a été définie en utilisant des icônes
comme unités d’échantillonnage, au lieu d’individus, de régions, de groupes
professionnels, de classes, et ainsi de suite.
Sachant que cette population est constituée de 32 icônes, chacun d’eux a une
probabilité de 1/32, une proportion de 0,0315 ou un pourcentage de 3,125 % de
faire partie de l’échantillon. Ce calcul est exact si l’échantillon est choisi selon la
De plus, vous constatez qu’il existe cinq familles d’icônes dans cette population
et que chacune est présente en nombres différents. La famille d’icônes suivante,
, représente 18,75 % de la population. La probabilité qu’une unité de cette
famille fasse partie de l’échantillon est donc de 18,75 %. En d’autres termes, en
pigeant au hasard 100 icônes dans cette population, vous aurez, de ce nombre,
environ 19 icônes dans votre échantillon (en supposant, bien entendu, que la
population d’icônes soit composée d’au moins 100 icônes…).
La vérification
de la représentativité d’un échantillon
ne peut se faire que
si on connaît bien la population.
Une bonne façon de mettre fin à cette section-ci consiste à vous inviter à
réfléchir sur l’énoncé suivant :
Vous constatez en même temps qu’il est utopique de penser que pour la moindre
expérience ou enquête il faut faire appel à toute la population. Il n’est donc pas
nécessaire de tenir un recensement pour toute enquête. Un échantillon suffit
amplement, car il présente des avantages intéressants et souvent insoupçonnés.
Premier avantage
Par rapport au recensement, l’échantillon permet de réduire les coûts à bien
des égards. Un recensement mobilise tellement de ressources humaines et
matérielles que seul un pays peut se le permettre à intervalles réguliers.
Deuxième avantage
L’échantillon permet de mieux suivre les unités échantillonnées. Si votre
enquête consiste à rejoindre 250 personnes par téléphone, vous pourrez
aisément exécuter des rappels téléphoniques pour les personnes absentes
lors de votre premier appel.
Troisième avantage
Puisque votre échantillon est restreint, vous pourrez poser un plus grand
nombre de questions aux personnes interrogées.
Ainsi, votre recherche gagnera en qualité.
Quatrième avantage
La quantité de données que vous obtiendrez auprès de votre échantillon pourra
être manipulée aisément à l’aide de la technologie informatique courante.
Aussi, les analyses statistiques seront exécutées avec plus de rapidité.
Cinquième avantage
Si votre échantillon a été tiré selon les règles de l’art, il comportera moins
d’erreurs d’échantillonnage que le recensement. N’y a-t-il pas là contradiction
avec le texte précédent ? L’échantillon ne peut être plus exact que le
recensement, en théorie. Mais, en pratique, les experts soutiennent qu’il est
impossible de rejoindre toute la population dans un court lapse de temps pour
l’interroger à fond. Par contre, si l’échantillon est restreint,
bien peu d’individus choisis échapperont à l’enquête.
1. Le principe de validité
Selon ce principe, l’échantillonnage doit permettre d’obtenir une estimation
valide des paramètres de la population. L’estimation des paramètres sera
valide pour autant que soit connue au préalable la probabilité de chaque individu
de faire partie de l’échantillon. Un paramètre est une caractéristique mesurée de
la population, p.ex. la langue parlée au foyer, l’état civil, la scolarité, et ainsi de
suite.
3. Le principe d’optimisation
L’optimisation des résultats consiste à obtenir le maximum d’efficacité avec le
minimum de ressources et de dépenses. Sans jamais perdre de vue la réduction
des erreurs d’échantillonnage, il faut réduire les coûts et éviter les dépenses
inutiles d’énergie pour former un échantillon représentatif.
Ces principes n’ont de valeur que si tout est mis en œuvre pour qu’ils soient
respectés. Ils sont bien plus que des vœux pieux. La technique d’échantillonnage
que vous utilisez doit respecter la loi des probabilités coûte que coûte si vous
voulez être capables de généraliser les résultats obtenus auprès de votre
échantillon à la population générale. Sinon, votre recherche ou votre enquête
aura servi à décrire un groupe quelconque de personnes et non un échantillon.
Former un échantillon n’est pas une tâche simple. Elle n’est pas à prendre à la
légère. Il vaut mieux suivre une démarche systématique car il y a des tâches à
exécuter auxquelles on ne peut se soustraire. Par conséquent, puisque ces tâches
doivent être effectuées, aussi bien les accomplir avec soin.
2. Définir la population
Les caractéristiques qui représentent un intérêt vital doivent être décrites (p. ex.
l’âge des individus, le sexe, leur état civil, leur niveau de scolarité, leur lieu de
résidence, leur statut socioéconomique, et bien d’autres encore). De toute
évidence, plus vous souhaitez que l’échantillon possède des caractéristiques
similaires à la population cible, plus vous devrez augmenter la taille de votre
échantillon afin de diminuer les différences entre les deux.
Une fois que vos objectifs d’échantillonnage ont été éclaircis et que votre
population a été définie, il ne reste plus qu’à choisir les unités d’échantillonnage.
L’échantillonnage probabiliste
1 Quant à ce type d’échantillonnage, on accorde une probabilité
quelconque à chaque unité de faire partie de l’échantillon.
L’échantillonnage non probabiliste
Devant l’impossibilité d’assigner à chaque individu une probabilité d’être
choisi pour faire partie d’un échantillon, il arrive qu’on doive
2
faire une sélection au mieux de notre connaissance.
En général, après un examen de la population cible, la décision est prise de
faire appel à un groupement d’individus considérés comme typiques de cette
population. Cette sélection découle d’un jugement et
comporte des risques d’erreurs imminents.
L’utilité des résultats de la recherche auprès d’un échantillon probabiliste
dépendra de la similitude entre l’échantillon et la population visée.
Pour des informations complètes sur chacune de ces techniques, et sur d’autres
techniques, nous vous conseillons la référence suivante : A. Satin et W. Shastry
(1993). L’échantillonnage : un guide non mathématique. Statistique Canada,
ministère de l’Industrie, des Sciences et de la Technologie. La bibliographie
contient quelques autres références tout aussi utiles. Comme certaines
techniques sont plus utilisées que d’autres, nous les expliquerons plus en détail.
Pour les autres, nous nous contenterons de les définir.
Description : Les unités sont choisies dans une liste selon une séquence
déterminée au préalable. D’abord, vous établissez une liste exhaustive des
unités. Ensuite, vous entamez la sélection avec, comme point de départ, une
unité choisie au hasard. Enfin, vous avancez dans la liste en sélectionnant l’unité
située à une distance fixe de la dernière unité choisie.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
Exemple : Les élèves appartiennent à une classe. Les classes sont regroupées
par niveau. Plusieurs niveaux constituent une école. Plusieurs écoles font partie
du district scolaire. Une grappe, ce peut être une classe, un niveau, une école.
Dans le tableau précédent, les icônes représentent les élèves. Les classes sont
assez semblables entre elles, si bien que vous pourriez choisir une classe au
hasard. Un niveau complet pourrait tout aussi bien servir de grappes. En
choisissant un niveau, toutes les classes appartenant à ce niveau feront alors
partie de l’échantillon.
Cette méthode est plus souvent utilisée qu’on le croit. Pour des raisons
pratiques, les chercheurs décident de tenir un sondage auprès de la population
scolaire d’un seul district. Ils qualifient ce district de typique, en ce sens qu’il
possède les caractéristiques de la majorité des autres.
La méthode des quotas est populaire dans les études de marketing, entre autres.
La sélection des unités est faite de manière à respecter dans l’échantillon les
proportions associées à chacune des caractéristiques observées dans la
population. Les enquêteurs vont s’assurer, par exemple, que chaque groupe
d’âge est bien représenté, c’est-à-dire dans les mêmes proportions que dans la
population. Au contraire de l’échantillon aléatoire qui ne permet pas de prédire
qui fera partie de l’échantillon, la méthode par quotas fait un choix
judicieux des individus selon qu’ils possèdent une ou plusieurs
caractéristiques recherchées.
Description de l’erreur no 1
Accorder une plus grande chance à certaines unités
d’être choisies dans l’échantillon
Exemple
Votre technique d’échantillonnage consiste à frapper aux portes d’une section de votre ville
durant le jour. Nous savons, par ailleurs, que certains quartiers des villes sont habités par des
segments de population plutôt homogènes. Les personnes âgées tendent à demeurer dans un
secteur particulier, tandis que les jeunes familles se trouvent en plus grand nombre dans un
autre quartier. Les personnes âgées ont plus de chance d’être présentes à leur foyer le jour que
les jeunes couples qui occupent des emplois.
Description de l’erreur no 2
Un échantillon en apparence tiré au hasard
Exemple
Les sujets de votre enquête ont été sélectionnés en choisissant un abonné téléphonique à
chaque cent abonnés. Comme c’est le nom du père qui figure le plus souvent dans l’annuaire
téléphonique, vous risquez de vous retrouver avec un échantillon disproportionné quant au
sexe : votre échantillon souffrira d’une sur-représentation des hommes.
De plus, les noms de tous les citoyens ne figurent pas tous dans l’annuaire téléphonique.
Description de l’erreur no 3
Substituer une unité pour une autre
Exemple
Selon votre plan d’échantillonnage, vous devez interroger une femme habitant au 1248, rue
Principale. Comme elle n’est pas présente lors de votre passage, et afin d’éviter de retourner à
cette adresse, vous allez frapper à la porte de sa voisine. Votre critère de sélection devient
alors la proximité géographique et non plus les lois du hasard.
Description de l’erreur no 4
La nature intrinsèque de votre technique d’échantillonnage favorise
certaines unités plus que d’autres
Exemple
Page 15 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Vous expédiez par la poste un questionnaire qui porte sur la venue d’une maison de jeu dans
la région. Les personnes qui s’adonnent déjà aux jeux de hasard vont certainement répondre
en plus grand nombre. Il se peut aussi que les personnes farouchement opposées à ces jeux
fassent des démarches systématiques pour inciter les autres opposants à répondre au
questionnaire. Dans tous ces cas, chaque unité n’a pas la même probabilité d’être choisie dans
l’échantillon. Ce biais d’échantillonnage survient surtout dans les situations où la volonté de
chaque unité entre en jeu : une personne peut choisir de participer à l’enquête,
ou de ne pas y participer.
En fait, ce n’est pas une réponse pratique, mais plutôt un principe directeur à
suivre dans la plupart des cas. La détermination de la taille de l’échantillon se
fait en tenant compte de plusieurs facteurs ; les coûts, la précision désirée dans
les estimations, les ressources humaines et matérielles disponibles, le temps dont
le chercheur dispose et l’accessibilité aux unités d’échantillonnage.
Malgré tout, le principal facteur qui sert à déterminer la taille d’un échantillon
est la précision souhaitée dans l’estimation des valeurs statistiques de
l’échantillon. Ces valeurs de l’échantillon doivent se rapprocher le plus possible
de celles que nous connaissons de la population.
Par exemple, pour une population de 100 000 unités, à un niveau de précision de
0,05, la taille requise de l’échantillon est de 383. Par ailleurs, si votre population
est de 20 000 unités, votre échantillon, lui, diminuera à 377. Si votre population
est de 200 unités, il vous faudra tout de même choisir 132 unités
d’échantillonnage. Assez étonnant, n’est-ce pas ? Et c’est peu dire ! Le tableau
suivant vous aidera à comparer ces valeurs.
Degré de précision
Page 17 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
0,05 0,01
Population 100 000 100 000
Échantillon 383 8 762
Population Échantillon
100 ou moins plus de 50 %
101 à 500 25 à 50 %
501 à 1 000 10 à 25 %
1 001 à 1 000 000 1 à 10 %
La section
Je fais mes exercices
à la page suivante
Bibliographie