I n t r o d u c t i o n - UMoncton

22
I n t r o d u c t i o n L’échantillonnage L L é é c c h h a a n n t t i i l l l l o o n n n n a a g g e e Les objectifs pédagogiques Reconnaître des erreurs d’échantillonnage Connaître les qualités d’un échantillon acceptable Distinguer un échantillon d’un recensement et reconnaître leurs forces et leurs faiblesses respectives Connaître les étapes de l’échantillonnage Connaître les principales méthodes d’échantillonnage probabiliste et non probabiliste Reconnaître les erreurs d’échantillonnage Savoir déterminer la taille d’un échantillon Le sommaire 1. Un échantillon biaisé 2. Un échantillonnage illustré 3. Quelques définitions 4. L’échantillon par rapport au recensement 5. Les avantages de l’échantillon. 6. Les principes fondamentaux de la théorie de l’échantillonnage 7. Les étapes de l’échantillonnage 8. Les méthodes d’échantillonnage probabiliste 9. Les méthodes d’échantillonnage non probabiliste 10. Les erreurs d’échantillonnage 11. La taille de l’échantillon 12. Je fais mes exercices Page 1 Introduction à la recherche Donald Long l[email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Transcript of I n t r o d u c t i o n - UMoncton

I n t r o d u c t i o n

L’échantillonnage à l a r e c h e r c h e LL’’éécchhaannttiilllloonnnnaaggee

Les objectifs pédagogiques

Reconnaître des erreurs d’échantillonnage Connaître les qualités d’un échantillon acceptable

Distinguer un échantillon d’un recensement et reconnaître leurs forces et leurs faiblesses respectives

Connaître les étapes de l’échantillonnage Connaître les principales méthodes d’échantillonnage

probabiliste et non probabiliste Reconnaître les erreurs d’échantillonnage

Savoir déterminer la taille d’un échantillon

Le sommaire

1. Un échantillon biaisé 2. Un échantillonnage illustré

3. Quelques définitions 4. L’échantillon par rapport au recensement

5. Les avantages de l’échantillon. 6. Les principes fondamentaux de la théorie de l’échantillonnage

7. Les étapes de l’échantillonnage 8. Les méthodes d’échantillonnage probabiliste

9. Les méthodes d’échantillonnage non probabiliste 10. Les erreurs d’échantillonnage

11. La taille de l’échantillon 12. Je fais mes exercices

Page 1 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

1. Un échantillon biaisé

La conception qu’on se fait d’un échantillon varie d’un individu à l’autre. Chaque conception s’appuie sur un principe qui la rend juste ou erronée. Avant de déterminer ce qui confère un caractère scientifique à un échantillon, voyons pourquoi certaines conceptions peuvent être fausses ou comporter des risques élevés d’erreurs.

Quelques situations bien concrètes sont présentées de manière à faire ressortir avec plus d’éclat les erreurs majeures d’échantillonnage.

! Votre comité souhaite recueillir la signature des citoyens

afin d’appuyer le projet de construction d’un centre communautaire. Vous recueillez les signatures à l’entrée de la quincaillerie de votre région.

X

L’erreur majeure réside dans la sélection des personnes. Les signataires seront en majorité des propriétaires fonciers

d’âge mûr et, probablement, de sexe masculin. Tous les citoyens ne fréquentent pas la quincaillerie également.

!Vous menez une enquête téléphonique sur les habitudes

alimentaires des familles. Vous logez vos appels en matinée le plus souvent, puisque c’est la seule période de

la journée où vous êtes disponible.

X

Une fois de plus le choix des répondants est biaisé. Les personnes qui travaillent à l’extérieur du foyer seront systématiquement éliminées de votre enquête. Votre

échantillon sera composé de répondants plutôt homogènes.

!Vous êtes chargé par votre conseil municipal d’obtenir l’opinion générale de la population sur la cueillette des

ordures ménagères. Vous expédiez un questionnaire à cet effet par la poste.

X

Les répondants seront plutôt ceux qui sont fortement insatisfaits du service actuel. Un échantillonnage volontaire peut inciter les personnes vivement intéressées au sujet de

l’enquête à répondre en plus grand nombre.

! Vous avez conçu de nouveaux exercices pour votre cours

de français. Vous décidez d’en faire l’essai auprès de quelques élèves de votre classe. Vous choisissez des élèves

qui ont un rendement moyen.

X

Les élèves moyens représentent le groupe des élèves moyens et non l’ensemble

des élèves de la classe. C’est un échantillon sélectif : il n’est pas représentatif.

Page 2 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Il ressort de ces exemples que l’erreur majeure qu’on commet en voulant tirer un échantillon de la population consiste à attribuer aux individus ou aux unités d’échantillonnage des probabilités différentes d’être choisis. Autrement dit, pour qu’un échantillon soit représentatif, il faut que l’échantillon respecte les proportions entre les caractéristiques constatées et mesurées dans la population.

2. Un échantillonnage illustré Dans le tableau suivant, une population a été définie en utilisant des icônes comme unités d’échantillonnage, au lieu d’individus, de régions, de groupes professionnels, de classes, et ainsi de suite. Un premier échantillon a été formé en choisissant la moitié des icônes de chacune des catégories. C’est ainsi que les proportions entre les catégories d’icônes dans l’échantillon 1 sont les mêmes que dans la population. Cependant, pour l’échantillon 2, ces proportions sont loin d’être respectées. On observe que les écarts entre la population et l’échantillon 2 varient de 11,11 % à 33,33 %. Inutile d’insister sur le fait que les proportions entre les catégories d’icônes de l’échantillon 2 diffèrent fortement de celles observées dans la population.

Population % Échantillon 1 % Échantillon 2 %

12,50 18,75 6,25 37,50 25,00

12,50 18,75 6,25 37,50 25,00

22,22 22,22 11,11 33,33 11,11

Faisons un calcul élémentaire en nous référant au tableau ci-dessus. Nous savons qu’il y a cinq différentes catégories d’unités d’échantillonnage dans la population. Chacune possède ses caractéristiques propres. Les voici :

Sachant que cette population est constituée de 32 icônes, chacun d’eux a une probabilité de 1/32, une proportion de 0,0315 ou un pourcentage de 3,125 % de faire partie de l’échantillon. Ce calcul est exact si l’échantillon est choisi selon la

Page 3 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

technique d’échantillonnage aléatoire simple. Il existe d’autres techniques d’échantillonnage que nous expliquerons plus loin. De plus, vous constatez qu’il existe cinq familles d’icônes dans cette population et que chacune est présente en nombres différents. La famille d’icônes suivante,

, représente 18,75 % de la population. La probabilité qu’une unité de cette famille fasse partie de l’échantillon est donc de 18,75 %. En d’autres termes, en pigeant au hasard 100 icônes dans cette population, vous aurez, de ce nombre, environ 19 icônes dans votre échantillon (en supposant, bien entendu, que la population d’icônes soit composée d’au moins 100 icônes…).

? Quelle est la principale qualité d’une unité d’échantillonnage ?

R Le plus petit élément d’une population (p. ex. un individu) ne peut posséder qu’une seule probabilité

d’être choisi dans l’échantillon. Revenons à une population d’êtres humains. Lorsque nous parlons des caractéristiques de la population, nous faisons allusion à la scolarité, à l’état civil, au sexe, à la langue maternelle et à de nombreux aspects de ce genre. La population d’icônes de notre tableau possède, elle aussi, quelques caractéristiques qui distinguent les icônes entre eux : leur forme, leur couleur, et leur taille notamment. La notion de caractéristiques de la population est cruciale dans le domaine de l’échantillonnage. Si vous jugez qu’il est important que la proportion de femmes dans l’échantillon soit respectée, il vous faudra connaître cette proportion dans la population. Si la population est composée de 51 % de femmes, votre échantillon devra être composé, lui aussi, de 51 % de femmes.

La vérification de la représentativité d’un échantillon

ne peut se faire que si on connaît bien la population.

Une bonne façon de mettre fin à cette section-ci consiste à vous inviter à réfléchir sur l’énoncé suivant :

Un échantillon est représentatif s’il respecte les proportions

entre les caractéristiques

Page 4 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

de la population.

3. Quelques définitions

Avant d’aborder d’autres aspects de l’échantillonnage, il conviendrait de définir certains termes associés à la science de l’échantillonnage.

Terme Définition Exemple Unité

d’échantillonnage Élément choisi de la population

pour faire partie de l’échantillon.

Un élève, un électeur, une étudiante, un citoyen, une

ferme, un commerce

Échantillon Regroupement d’éléments d’une

population choisis selon une méthode définie.

Les infirmières de la région, les élèves du secondaire, les

habitants du quartier

Population cible

Partie de la population totale pour laquelle

nous voulons généraliser les résultats de l’échantillon.

Les enseignants, les infirmières, les adolescentes,

les propriétaires de lots boisés privés, les accidentés

du travail

Population générale

La totalité des individus ou des choses partageant certaines

caractéristiques.

Les êtres humains, les fermes du pays, les élèves du primaire,

les citadins

Recensement Dénombrement des habitants d’un pays.

Enquête menée auprès de tous les habitants

Aléatoire Qui tient du hasard. La loterie

Schème ou plan d’échantillonnage

La procédure servant à définir la population cible, la méthode

d’enquête, le choix de l’échantillon, et les caractéristiques des unités.

4. L’échantillon par rapport au recensement

Pour diminuer le risque d’erreurs d’échantillonnage, vous n’avez qu’à inclure toute la population dans votre enquête. Les erreurs de toutes sortes seront réduites à zéro, ou presque. L’erreur d’échantillonnage, c’est l’écart entre les paramètres de la population cible et les valeurs estimées de l’échantillon. Les erreurs d’échantillonnage diminuent à mesure que l’échantillon augmente. Elles atteignent la valeur zéro lorsque l’échantillon se substitue à la population : l’échantillon comprend la population cible au complet. Comme le montre le graphique suivant, la diminution des erreurs est inversement proportionnelle à la racine carrée de la taille de l’échantillon.

Page 5 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

En augmentant le nombre d’individus dans un échantillon,

on diminue ainsi l’erreur d’échantillonnage.

Vous constatez en même temps qu’il est utopique de penser que pour la moindre expérience ou enquête il faut faire appel à toute la population. Il n’est donc pas nécessaire de tenir un recensement pour toute enquête. Un échantillon suffit amplement, car il présente des avantages intéressants et souvent insoupçonnés.

5. Les avantages de l’échantillon

Premier avantage Par rapport au recensement, l’échantillon permet de réduire les coûts à bien des égards. Un recensement mobilise tellement de ressources humaines et matérielles que seul un pays peut se le permettre à intervalles réguliers.

Deuxième avantage L’échantillon permet de mieux suivre les unités échantillonnées. Si votre enquête consiste à rejoindre 250 personnes par téléphone, vous pourrez

aisément exécuter des rappels téléphoniques pour les personnes absentes lors de votre premier appel.

Troisième avantage Puisque votre échantillon est restreint, vous pourrez poser un plus grand

nombre de questions aux personnes interrogées. Ainsi, votre recherche gagnera en qualité.

Quatrième avantage La quantité de données que vous obtiendrez auprès de votre échantillon pourra

être manipulée aisément à l’aide de la technologie informatique courante. Aussi, les analyses statistiques seront exécutées avec plus de rapidité.

Cinquième avantage Si votre échantillon a été tiré selon les règles de l’art, il comportera moins

d’erreurs d’échantillonnage que le recensement. N’y a-t-il pas là contradiction avec le texte précédent ? L’échantillon ne peut être plus exact que le

recensement, en théorie. Mais, en pratique, les experts soutiennent qu’il est impossible de rejoindre toute la population dans un court lapse de temps pour

l’interroger à fond. Par contre, si l’échantillon est restreint, bien peu d’individus choisis échapperont à l’enquête.

Page 6 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

6. Les principes fondamentaux de la théorie de l’échantillonnage

Singh et Chaudhary (1986) soutiennent que

la théorie de l’échantillonnage s’appuie sur les trois principes fondamentaux suivants :

1. Le principe de validité Selon ce principe, l’échantillonnage doit permettre d’obtenir une estimation valide des paramètres de la population. L’estimation des paramètres sera valide pour autant que soit connue au préalable la probabilité de chaque individu de faire partie de l’échantillon. Un paramètre est une caractéristique mesurée de la population, p.ex. la langue parlée au foyer, l’état civil, la scolarité, et ainsi de suite. 2. Le principe de constance statistique La nécessité et l’importance de choisir un individu comme membre de l’échantillon doivent découler de la théorie des probabilités, et non d’autres considérations. Ainsi, on prétend qu’un groupe assez nombreux d’individus choisis au hasard comportera les mêmes caractéristiques que celles de la population d’où il origine. 3. Le principe d’optimisation L’optimisation des résultats consiste à obtenir le maximum d’efficacité avec le minimum de ressources et de dépenses. Sans jamais perdre de vue la réduction des erreurs d’échantillonnage, il faut réduire les coûts et éviter les dépenses inutiles d’énergie pour former un échantillon représentatif. Ces principes n’ont de valeur que si tout est mis en œuvre pour qu’ils soient respectés. Ils sont bien plus que des vœux pieux. La technique d’échantillonnage que vous utilisez doit respecter la loi des probabilités coûte que coûte si vous voulez être capables de généraliser les résultats obtenus auprès de votre échantillon à la population générale. Sinon, votre recherche ou votre enquête aura servi à décrire un groupe quelconque de personnes et non un échantillon.

? Lequel de l’échantillon ou du recensement coûte le plus cher ?

Page 7 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

R Le coût total d’un recensement est plus élevé que celui d’un

échantillon. Par contre, le coût par unité est moins élevé pour un recensement que pour un échantillon.

7. Les étapes de l’échantillonnage

Former un échantillon n’est pas une tâche simple. Elle n’est pas à prendre à la légère. Il vaut mieux suivre une démarche systématique car il y a des tâches à exécuter auxquelles on ne peut se soustraire. Par conséquent, puisque ces tâches doivent être effectuées, aussi bien les accomplir avec soin. Plusieurs auteurs consultés proposent une démarche plus élaborée que la suivante. Nous avons réduit cette démarche aux étapes les plus essentielles. Il n’est pas nécessaire d’utiliser un bulldozer pour remuer la terre de votre potager.

1. Énoncer les objectifs Le but de l’échantillon doit faire état de la raison sociale de l’échantillon, des ressources matérielles et financières qui y seront affectées et des limites qui seront imposées.

2. Définir la population Les caractéristiques qui représentent un intérêt vital doivent être décrites (p. ex. l’âge des individus, le sexe, leur état civil, leur niveau de scolarité, leur lieu de résidence, leur statut socioéconomique, et bien d’autres encore). De toute évidence, plus vous souhaitez que l’échantillon possède des caractéristiques similaires à la population cible, plus vous devrez augmenter la taille de votre échantillon afin de diminuer les différences entre les deux.

3. Déterminer les unités d’échantillonnage Cette fonction est cruciale et déterminante parce qu’elle permet de définir, d’isoler et de choisir chaque membre de l’échantillon selon une probabilité préétablie. C’est l’opérationnalisation de l’échantillon.

4. Choisir un schème d’échantillonnage Comme plusieurs schèmes d’échantillonnage peuvent être adoptés, il suffit de les comparer entre eux afin de déterminer celui qui respecte de plus près le principe d’optimisation.

5. Appliquer le schème d’échantillonnage Il ne suffit pas de planifier avec précision, il faut aussi exécuter avec justesse. La valeur du schème d’échantillonnage tient autant à son application

Page 8 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

qu’à sa conception. Les personnes chargées de faire la collecte des données, par exemple, devront exécuter les tâches requises selon une procédure systématique et uniforme. S’il a été décidé d’interroger les individus au moyen d’un questionnaire écrit, elles ne peuvent en interroger quelques-uns d’entre eux par des entrevues téléphoniques.

8. Des méthodes d’échantillonnage probabiliste Une fois que vos objectifs d’échantillonnage ont été éclaircis et que votre population a été définie, il ne reste plus qu’à choisir les unités d’échantillonnage.

Votre objectif consiste à interroger les directrices et les directeurs d’école de votre province. Ils sont au nombre de 147.

Vous décidez de former votre échantillon à partir de 25 % de cette population,

soit en choisissant 37 d’entre eux. Vous obtenez du ministère de l’Éducation

la liste complète des 147 individus. Quelle méthode d’échantillonnage allez-vous utiliser pour former un

échantillon de 37 d’entre eux ?

Vous utiliserez l’un des deux types de méthodes d’échantillonnage suivants :

L’échantillonnage probabiliste 1 Quant à ce type d’échantillonnage, on accorde une probabilité

quelconque à chaque unité de faire partie de l’échantillon. L’échantillonnage non probabiliste

2Devant l’impossibilité d’assigner à chaque individu une probabilité d’être

choisi pour faire partie d’un échantillon, il arrive qu’on doive faire une sélection au mieux de notre connaissance.

En général, après un examen de la population cible, la décision est prise de faire appel à un groupement d’individus considérés comme typiques de cette

population. Cette sélection découle d’un jugement et comporte des risques d’erreurs imminents.

L’utilité des résultats de la recherche auprès d’un échantillon probabiliste dépendra de la similitude entre l’échantillon et la population visée.

Page 9 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Vous considérez que choisir les directrices et les directeurs d’école au hasard vous amènerait à voyager sur de trop longues

distances. Vous décidez plutôt d’utiliser une technique d’échantillonnage

non probabiliste. Pour ce faire, votre population cible deviendra les directions d’école habitant la partie nord de la province, là

où vous demeurez. Vous établirez la liste de ces individus à partir de laquelle vous en choisirez, au hasard, 37.

Selon vous, les directions d’école du nord sont, à toutes fins utiles, semblables à celles du sud de la province.

Le tableau suivant vous aidera à faire la distinction entre une méthode probabiliste et une méthode non probabiliste d’échantillonnage. Pour chacune de ces deux catégories nous énumérons les techniques les plus courantes.

Méthode d’échantillonnage probabiliste L’échantillonnage aléatoire simple

L’échantillonnage systématique L’échantillonnage stratifié

L’échantillonnage par grappes Méthode d’échantillonnage non probabiliste

L’échantillonnage à l’aveuglette L’échantillonnage de volontaires

L’échantillonnage au jugé L’échantillonnage par la méthode des quotas

Pour des informations complètes sur chacune de ces techniques, et sur d’autres techniques, nous vous conseillons la référence suivante : A. Satin et W. Shastry (1993). L’échantillonnage : un guide non mathématique. Statistique Canada, ministère de l’Industrie, des Sciences et de la Technologie. La bibliographie contient quelques autres références tout aussi utiles. Comme certaines techniques sont plus utilisées que d’autres, nous les expliquerons plus en détail. Pour les autres, nous nous contenterons de les définir.

8.1 L’échantillonnage aléatoire simple

Description : Chaque unité de la population a la même chance d’être choisie dans l’échantillon. Exemple : Vous souhaitez interroger les propriétaires de petites et de moyennes entreprises de votre région. Vous en dressez une liste complète. Par une pige au hasard, vous en choisissez 20 % d’entre eux à qui vous expédiez un questionnaire écrit portant sur les exportations.

Page 10 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Supposons qu’il y ait 10 entreprises de taille moyenne ( ) et 20 petites entreprises ( ) dans votre région. Afin de respecter vos objectifs d’échantillonnage, votre échantillon aléatoire devrait être constitué de deux entreprises moyennes et de quatre petites entreprises. Dans le tableau qui suit, les entreprises choisies sont représentées par les cases colorées .

8.2 L’échantillonnage systématique L’échantillonnage aléatoire simple est la technique préférée entre toutes, mais il est fastidieux à appliquer lorsque la population est nombreuse. On lui préfère souvent l’échantillonnage systématique. Description : Les unités sont choisies dans une liste selon une séquence déterminée au préalable. D’abord, vous établissez une liste exhaustive des unités. Ensuite, vous entamez la sélection avec, comme point de départ, une unité choisie au hasard. Enfin, vous avancez dans la liste en sélectionnant l’unité située à une distance fixe de la dernière unité choisie. Exemple : Comme l’annuaire téléphonique contient la quasi-totalité des individus de votre région, vous en faites votre liste de base. Comme 25 013 noms figurent dans l’annuaire et que votre échantillon sera composé de 1 250 individus, vous devrez choisir un nom dans chaque bloc de 20 individus. Le hasard veut que vous commenciez au septième abonné téléphonique. Votre deuxième unité sera le 27e abonné, la troisième unité sera le 47e, et ainsi de suite.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

8.3 L’échantillonnage stratifié

Page 11 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

L’échantillonnage aléatoire simple ne requiert aucune connaissance des caractéristiques de la population. Au contraire, l’échantillonnage stratifié consiste à regrouper les individus en sous-groupes appelés strates selon une ou plusieurs caractéristiques. Description : La population est subdivisée en groupements homogènes selon une ou plusieurs caractéristiques. Ensuite, un échantillon aléatoire est tiré de chaque groupement ou strate. Cette technique permet d’obtenir des groupements plus homogènes quant à une caractéristiques, réduisant ainsi la variance due à des cas extrêmes. Elle permet surtout de s’assurer de la représentativité de chacun des groupements. Exemple : La population cible de votre enquête est le personnel scolaire. Vous souhaitez interroger les catégories suivantes d’employés : administrateurs (A), directeurs d’école (D), enseignants (E), conducteurs d’autobus (C) et préposés à l’entretien ménager (P). En établissant ces catégories vous voulez vous assurer d’obtenir des données suffisantes pour chacune d’elles sans être obligé d’augmenter fortement le nombre d’individus dans l’échantillon. Un échantillon aléatoire pourrait comprendre un nombre respectable d’enseignants, mais le nombre absolu de préposés à l’entretien ménager ne permettrait pas des analyses statistiques valides. Cette technique d’échantillonnage permet, si vous le désirez, d’imposer à chaque strate une sorte de quota : vous pouvez décider de choisir, pour une strate particulière, 20 % des individus au lieu de 10 % comme dans une autre strate. Dans l’exemple qui suit, les enseignants sont proportionnellement plus nombreux que les employés des autres catégories. Vous parviendrez peut-être à un degré de précision acceptable en choisissant 3 % des enseignants (E). Comme les préposés à l’entretien ménager (P) sont peu nombreux, pour parvenir au même niveau de précision vous serez peut-être obligé de choisir 15 % d’entre eux.

Population Strates Échantillon C P P E E A D C C D E E E C P D A C C E E A

E E E C E D P A C E D E E E C D D E

AAAA DDDDDD

EEEEEEEEEEEEEEEE CCCCCCCCC

PPPP

A DD

EEEE CC A

8.4 L’échantillonnage par grappes

Page 12 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Description : Lorsque des unités de la population sont regroupés selon une hiérarchie quelconque, c’est de l’échantillonnage par grappes. Ce type d’échantillonnage permet d’identifier et de choisir des regroupements homogènes d’individus. Exemple : Les élèves appartiennent à une classe. Les classes sont regroupées par niveau. Plusieurs niveaux constituent une école. Plusieurs écoles font partie du district scolaire. Une grappe, ce peut être une classe, un niveau, une école. L’échantillonnage par grappes offre l’avantage d’avoir accès à peu de frais à un grand nombre d’unités. Le choix des unités d’échantillonnage ne se fait pas à partir des unités, mais en fonction d’une catégorie d’unités. Au lieu d’une liste exhaustive d’élèves du primaire de votre région, vous choisissez quelques classes au hasard. À cause de l’homogénéité des élèves d’une région, l’échantillonnage par grappes est tout aussi efficace que l’échantillonnage aléatoire simple.

Échantillonnage par grappes École XYZ

Niveaux 1 2 Classes A B D E Élèves

Dans le tableau précédent, les icônes représentent les élèves. Les classes sont assez semblables entre elles, si bien que vous pourriez choisir une classe au hasard. Un niveau complet pourrait tout aussi bien servir de grappes. En choisissant un niveau, toutes les classes appartenant à ce niveau feront alors partie de l’échantillon.

9. Les méthodes d’échantillonnage non probabiliste

9.1 L’échantillonnage à l’aveuglette Les méthodes d’échantillonnage non probabiliste, bien que moins coûteuses et plus pratiques, sont moins exactes. Bien des experts dans le domaine recommandent de s’en éloigner. Ces méthodes supposent que les caractéristiques de la population sont distribuées de manière aléatoire. C’est peut-être vrai dans certains cas, mais pas dans tous les cas. Le biologiste qui prend un échantillon d’eau dans un lac exerce l’échantillonnage à l’aveuglette. Il prétend que les produits chimiques sont Page 13 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

répandus également partout dans le lac. Il en est de même pour l’épicier qui goûte à une seule pomme au comptoir de fruits.

9.2 L’échantillonnage de volontaires Certaines recherches ne pourraient s’exécuter autrement qu’en faisant appel à des volontaires. Les compagnies pharmaceutiques font appel à des volontaires qu’ils paient aussi afin de vérifier les effets de leurs nouveaux produits. Un groupe de volontaires risque d’être plus homogène qu’un groupe tiré au hasard dans la population, offrant ainsi moins de variabilité qu’on le souhaite.

9.3 L’échantillonnage au jugé

Cette méthode est plus souvent utilisée qu’on le croit. Pour des raisons pratiques, les chercheurs décident de tenir un sondage auprès de la population scolaire d’un seul district. Ils qualifient ce district de typique, en ce sens qu’il possède les caractéristiques de la majorité des autres. Une conseil municipal choisit de tenir son enquête socioéconomique dans un seul quartier de la ville, prétextant que ce quartier choisi ressemble à la majorité des autres. En considérant le rapport coûts/bénéfices, il n’y a pas d’avantages à étendre leur enquête à un deuxième quartier.

9.4 L’échantillonnage par la méthode des quotas

La méthode des quotas est populaire dans les études de marketing, entre autres. La sélection des unités est faite de manière à respecter dans l’échantillon les proportions associées à chacune des caractéristiques observées dans la population. Les enquêteurs vont s’assurer, par exemple, que chaque groupe d’âge est bien représenté, c’est-à-dire dans les mêmes proportions que dans la population. Au contraire de l’échantillon aléatoire qui ne permet pas de prédire qui fera partie de l’échantillon, la méthode par quotas fait un choix judicieux des individus selon qu’ils possèdent une ou plusieurs caractéristiques recherchées.

10. Les erreurs d’échantillonnage

Page 14 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Pour n’importe quel échantillonnage, des erreurs surviennent. Elles sont inévitables. Par contre, elles peuvent être réduites de plusieurs manières, surtout en augmentant la taille de l’échantillon. Plus on se rapproche de la population, plus les erreurs d’échantillonnage diminuent. Il existe deux catégories d’erreurs : les erreurs systématiques dues à l’échantillonnage et les erreurs dues au hasard, à d’autres facteurs que l’échantillonnage. Voyons d’abord en quoi consistent les erreurs systématiques d’échantillonnage.

Description de l’erreur no 1 Accorder une plus grande chance à certaines unités

d’être choisies dans l’échantillon Exemple

Votre technique d’échantillonnage consiste à frapper aux portes d’une section de votre ville durant le jour. Nous savons, par ailleurs, que certains quartiers des villes sont habités par des segments de population plutôt homogènes. Les personnes âgées tendent à demeurer dans un secteur particulier, tandis que les jeunes familles se trouvent en plus grand nombre dans un

autre quartier. Les personnes âgées ont plus de chance d’être présentes à leur foyer le jour que les jeunes couples qui occupent des emplois.

Description de l’erreur no 2 Un échantillon en apparence tiré au hasard

ExempleLes sujets de votre enquête ont été sélectionnés en choisissant un abonné téléphonique à

chaque cent abonnés. Comme c’est le nom du père qui figure le plus souvent dans l’annuaire téléphonique, vous risquez de vous retrouver avec un échantillon disproportionné quant au

sexe : votre échantillon souffrira d’une sur-représentation des hommes. De plus, les noms de tous les citoyens ne figurent pas tous dans l’annuaire téléphonique.

Description de l’erreur no 3 Substituer une unité pour une autre

ExempleSelon votre plan d’échantillonnage, vous devez interroger une femme habitant au 1248, rue

Principale. Comme elle n’est pas présente lors de votre passage, et afin d’éviter de retourner à cette adresse, vous allez frapper à la porte de sa voisine. Votre critère de sélection devient

alors la proximité géographique et non plus les lois du hasard. Description de l’erreur no 4

La nature intrinsèque de votre technique d’échantillonnage favorise certaines unités plus que d’autres

ExemplePage 15 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Vous expédiez par la poste un questionnaire qui porte sur la venue d’une maison de jeu dans la région. Les personnes qui s’adonnent déjà aux jeux de hasard vont certainement répondre en plus grand nombre. Il se peut aussi que les personnes farouchement opposées à ces jeux

fassent des démarches systématiques pour inciter les autres opposants à répondre au questionnaire. Dans tous ces cas, chaque unité n’a pas la même probabilité d’être choisie dans l’échantillon. Ce biais d’échantillonnage survient surtout dans les situations où la volonté de

chaque unité entre en jeu : une personne peut choisir de participer à l’enquête, ou de ne pas y participer.

Il y a erreur d’échantillonnage lorsque les valeurs de l’échantillon s’écartent de celles de la population. Pour un échantillonnage probabiliste, il est possible de mesurer ce degré d’erreur. Les erreurs d’échantillonnage n’invalident pas l’échantillon. Du moins, lorsque nous pouvons calculer le degré d’erreur, nous pouvons affirmer que les valeurs de l’échantillon se situent à l’intérieur d’une zone de valeurs probables. C’est ainsi qu’on parle des marges d’erreur. Admettons que la moyenne de votre échantillon soit de 73 à une variable quelconque. La science de l’échantillonnage vous indiquera que, en fait, la vraie moyenne se situe entre 70 et 76 dans 95 % des cas. On peut le dire autrement : pour 19 échantillons sur 20, la moyenne sera située parmi les valeurs comprises entre 70 et 76. L’inconvénient d’un échantillonnage non probabiliste, c’est l’impossibilité de calculer ce degré de précision. Pour de la recherche sérieuse, il faut éviter l’échantillonnage non probabiliste.

11. La taille de l’échantillon La sempiternelle question de la taille de l’échantillon finit toujours par surgir. Combien d’unités d’échantillonnage sont nécessaires pour que l’échantillon soit représentatif ? Une réponse facile à donner, mais vague en même temps, s’énonce comme suit : plus grand sera l’échantillon, plus précise sera la généralisation des résultats ! En fait, ce n’est pas une réponse pratique, mais plutôt un principe directeur à suivre dans la plupart des cas. La détermination de la taille de l’échantillon se fait en tenant compte de plusieurs facteurs ; les coûts, la précision désirée dans les estimations, les ressources humaines et matérielles disponibles, le temps dont le chercheur dispose et l’accessibilité aux unités d’échantillonnage.

Page 16 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Encore là, ce n’est pas très clair

ce qu’il faut faire. La raison de cette confusion,

c’est qu’il n’y a pas qu’une seule et unique réponse

à cette question.

11.1 Le degré de précision

Malgré tout, le principal facteur qui sert à déterminer la taille d’un échantillon est la précision souhaitée dans l’estimation des valeurs statistiques de l’échantillon. Ces valeurs de l’échantillon doivent se rapprocher le plus possible de celles que nous connaissons de la population. Il est crucial de savoir qu’en augmentant progressivement la taille de l’échantillon la précision des estimations n’augmente pas de façon proportionnelle. Il existe des tables conçues pour nous indiquer la taille de l’échantillon pour chaque degré de précision que nous souhaitons. Ces tables sont de plus en plus remplacées par des logiciels conviviaux. Par exemple, pour une population de 100 000 unités, à un niveau de précision de 0,05, la taille requise de l’échantillon est de 383. Par ailleurs, si votre population est de 20 000 unités, votre échantillon, lui, diminuera à 377. Si votre population est de 200 unités, il vous faudra tout de même choisir 132 unités d’échantillonnage. Assez étonnant, n’est-ce pas ? Et c’est peu dire ! Le tableau suivant vous aidera à comparer ces valeurs.

Population Échantillon Rapport 200 132 132/200=0,660

20 000 377 377/20 000=0,019 100 000 383 383/100 000=0,004

Si vous désirez augmenter le degré de précision des estimations de 0,05 à 0,01, pour une population de 100 000, votre échantillon devra passer de 383 à 8 762 unités. Votre échantillon devra être plus de 22 fois plus grand pour ajouter 4 points de précision. L’évidence même saute aux yeux ! Il faut donc parfois sacrifier de la précision pour que la recherche se réalise.

Page 17 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Degré de précision

0,05 0,01 Population 100 000 100 000 Échantillon 383 8 762

11.2 La variabilité des caractéristiques dans la population

La qualité principale d’un échantillon réside dans sa représentativité, sa similitude avec la population mère d’où il tire son origine. Plus l’échantillon est grand plus la représentativité augmente. Par ailleurs, plus il y a de variabilité dans la population par rapport aux caractéristiques ciblées, plus grand devra être l’échantillon de sorte que toutes les caractéristiques soient bien représentées.

Le pomiculteur, à l’automne, ne goûte pas à une pomme de chacun de ses pommiers. Quelques-unes cueillies ça et là suffisent amplement, car la variabilité entre le degré de

mûrissement des pommes est réduite. Par contre, lorsqu’il s’agit de mesurer l’intelligence des enfants

de 12 ans, il faudra un échantillon assez nombreux pour que tous les niveaux d’intelligence soient bien représentés.

11.3 Les ressources humaines, financières et matérielles disponibles

Les contraintes en recherche sont nombreuses et bien réelles. Le problème original doit souvent être dégrossi de manière à rendre la recherche faisable. Pour exécuter bien des analyses statistiques, on doit s’assurer d’un nombre minimum d’individus dans l’échantillon. Dans plusieurs de ces cas, il faut calculer 10 individus pour chacune des variables qui fait partie d’une analyse. Il n’est pas rare qu’on doive s’abstenir de faire certaines analyses parce que la taille de l’échantillon ne le permet pas. Chaque variable que vous ajoutez à un questionnaire a un prix. Elle occasionne des dépenses supplémentaires de toutes sortes et souvent insoupçonnées. Une recherche qui se limite à des variables essentielles a plus de chances de se faufiler entre toutes sortes de difficultés liées aux ressources humaines et financières. Il n’est pas étonnant que votre cadre conceptuel doive être tricoté serré si vous voulez que votre recherche soit complétée.

11.4 Quelques règles générales

Page 18 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Quand il s’agit de déterminer la taille d’un échantillon probabiliste, on a recours le plus souvent à des formules mathématiques. En examinant les tables conçues

pour déterminer la taille d’un échantillon, on constate d’emblée qu’à partir d’une population de 1 000 individus il n’est pas nécessaire d’augmenter la taille de l’échantillon pour s’assurer d’un degré de précision supérieur. Le tableau ci-dessous vous aidera à mieux comprendre que la relation entre la taille de l’échantillon ne partage pas une relation linéaire avec la taille de la population.

Population Échantillon 100 ou moins plus de 50 %

101 à 500 25 à 50 % 501 à 1 000 10 à 25 %

1 001 à 1 000 000 1 à 10 %

La section

Je fais mes exercicesà la page suivante

Page 19 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

12. Je fais mes exercices 1. Vous formez un échantillon à l’aide de la technique aléatoire simple. Par conséquent, plus vous augmenterez le nombre de sujets dans l’échantillon plus la représentativité de votre échantillon augmentera. O Vrai O Faux 2. Peu importe la taille de votre échantillon, l’erreur d’échantillonnage est constant. O Vrai O Faux 3. L’échantillonnage aléatoire simple est la seule technique d’échantillonnage valable. O Vrai O Faux 4. L’annuaire téléphonique de votre région constitue une liste valide de la population et il peut servir à choisir un échantillon. O Vrai O Faux 5. Une classe d’élèves choisie pour votre échantillon constitue : O Une strate O Une grappe 6. Lorsque vous demandez à vos collègues de classe de se soumettre à une expérience quelconque, c’est alors un échantillonnage à l’aveuglette. O Vrai O Faux 7. Quand est-ce préférable de faire un recensement plutôt que de choisir un échantillon ?

Page 20 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

8. Vous êtes chargé de mesurer la pureté de l’eau dans votre ville. Élaborez un plan d’échantillonnage. Quels facteurs devrez-vous tenir compte ?

Bibliographie

Angers, Maurice . Initiation pratique à la méthodologie des sciences humaines.

Anjou (Québec): Les Éditions CEC Inc., 1996.

Barnett, Vic. Sample Survey Principles and Methods. New York: Oxford

University Press, 1991.

Dayhaw, Laurence T. Manuel de statistique. Ottawa: Éditions de l’Université

d’Ottawa. 2e édition, 1963.

Ferguson, George A. Statistical Analysis in Psychology and Education. New

York: McGraw-Hill Book Co. 2nd edition, 1966.

Fortin, Marie-Fabienne. Le processus de la recherche: de la conception à la

réalisation. Ville Mont-Royal (Québec): Décarie Éditeur Inc., 1996.

Foucault, Luc, et Lucie Verreault. Guide d’élaboration d’un programme de

formation documentaire. Montréal: Conférences des recteurs et des

principaux des universités du Québec, 1994.

Hair, Joseph F. Jr., Rolph E. Anderson, and Ronald L. Tatham. Multivariate

Data Analysis. 2nd edition. New York: Macmillan Publishing Co., 1987.

Hayduk, Leslie A. Structural Equation Modeling with Lisrel. Baltimore: The

John Hopkins University Press, 1987.

Hays, William L. Statistics for Psychologists. New York: Holt, Rinehart and

Winston, 1963.

List, Carla. Introduction to library research. New York: McGraw-Hill, 1993.

Page 21 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9

Létourneau, Jocelyn. Le coffre à outils du chercheur débutant. Guide d’initiation

au travail intellectuel. 70 Wynford Drive, Don Mills, Ontario M3C 1J9:

Oxford University Press, 1989.

Marcil, Claude, et Robert Chiasson. Comment chercher: les secrets de la

recherche de l’information. Québec: MultiMondes, 1992.

McCall, Chester H. Jr. Sampling and Statistics Handbook for Research. 1st

edition. Ames, Iowa 50010: The Iowa State University Press, 1982.

Nunnally, Jim C. Psychometric theory. New York: McGraw-Hill Book Co. 2nd

edition, 1978.

Ouellet, André. Processus de recherche: une approche systémique. Québec:

Presses de l’Université du Québec, 1981.

Rice, James Jr. Teaching library use: a guide for library instruction. Westport,

Connecticut: Greenwood Press, 1981.

Satin, A., et W. Shastry. L’échantillonnage: un guide non mathématique.

Ottawa: Statistique Canada, ministère de l’Industrie, des Sciences et de la

Technologie, 1993.

Scheaffer, Richard L., William Mendenhall, and Lyman Ott. Elementary Survey

Sampling. Boston: Duxbury Press, 1979.

Singh, Daroga, and F. S. Chaudhary. Theory and Analysis of Sample Survey

Design. New York: John Wiley & Sons, Inc., 1986.

Stuart, Alan. Basic Ideas of Scientific Sampling. High Wycombe: Charles

Griffin & Co. Ltd., 1976.

Tabachnik, Barbara G., and Linda S. Fidell. Using Multivariate Statistics. New

York: Harper & Row, 1983.

Williams, Bill. A Sampler on Sampling. New York: John Wiley & Sons, Inc.,

1978.

Page 22 Introduction à la recherche Donald Long [email protected] (506) 858-4886 Centre de Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9