Documente Academic
Documente Profesional
Documente Cultură
Sondage
Mthodes
Probabilistes
Alatoire simple
Stratifie
Par degrs
Systmatique
Taille
Empiriques
Quotas
Normalit de la population
Nature de linformation :
Quanti (moyenne) ou
Quali (proportion)
Enqute
Ensemble des oprations de collecte et de
traitement de donnes relatives quelques
domaines que ce soit.
Population cible
Rassemblement de tous les cas qui rpondent un
ensemble de caractres spcifiques. Appele aussi
univers ou ensemble statistique, cest lensemble
des lments auxquels on sintresse.
Sondage
Enqute incomplte, enqute partielle ou enqute
par chantillonnage, cest une enqute au cours de
laquelle seulement une partie des units de base
de la population sont observe.
Echantillon
Ensemble des units de base slectionnes et
rellement observes au cours dun sondage.
Echantillonnage
Ensemble des oprations qui permettent de
slectionner de faon organise les lments de
lchantillon.
Base de sondage
Enumration ou prsentation ordonne de toutes
les units de base constituant la population.
Erreur dchantillonnage
Ecart entre les rsultats obtenus auprs dun
chantillon et ce que nous apprendrait un
recensement comparable de la population. Plus la
taille de lchantillon est grande plus lerreur
dchantillonnage diminue.
Dtermination de la taille
de lchantillon
100 2000
100,05
pq
n
0
,
65
0
,
35
n
1820
0,050,05
n Z12
Pr. BOULAHOUAL Adil
n Z12
Pr. BOULAHOUAL Adil
pq
Z1-2 N
n
N Z1-2
Z1-2 p q N
n
N Z1-2 p q
Pr. BOULAHOUAL Adil
Mthodes dchantillonnage
- Mthodes dchantillonnage probabilistes
- Mthodes dchantillonnage empiriques
Mthodes dchantillonnage
probabilistes
- Echantillonnage alatoire et simple
- Echantillonnage stratifi
- Echantillonnage par degrs
- Echantillonnage systmatique
Pr. BOULAHOUAL Adil
Echantillonnage alatoire et
simple
- Constituer la base de sondage qui correspond la liste
complte et sans rptition des lments de la
population ;
- Numroter ces lments de 1 N ;
-
15011
46573
48390
93093
39975
06907
01536
25595
22527
06243
81837
11008
02011
85393
97265
61680
16656
42751
81647
30995
76393
07856
06121
27756
91646
89198
64809
16376
91782
53498
Echantillonnage stratifi
Lchantillonnage stratifi est une technique qui consiste
subdiviser une population htrogne, deffectif N, en
P sous populations ou strates plus homognes
deffectif Ni de telle sorte que N= N1+N2+. +Np.
Un chantillon, deffectif ni, est par la suite, prlev
indpendamment au sein de chacune des strates en
appliquant un plan dchantillonnage au choix de
lutilisateur. Le plus souvent, on procdera par un
chantillonnage alatoire et simple lintrieur de
chaque strate.
Pr. BOULAHOUAL Adil
Echantillonnage stratifi
La stratification peut entraner des gains de
prcision apprciables, elle facilite en outre
les oprations de collecte des donnes et
fournit des informations pour diffrentes
parties de la population.
Echantillonnage stratifi
Pour la rpartition de leffectif total, n, de
lchantillon dans les diffrentes strates, La
premire solution, dite proportionnelle, consiste
conserver la mme fraction dchantillonnage
dans chaque strate. Une seconde solution, dite
optimale, tient compte du budget de lenqute.
Rpartition proportionnelle
La rpartition proportionnelle consiste
rpartir la taille de lchantillon n en
utilisant la mme fraction de sondage f dans
chacune des strates. Cette solution tient
compte dun seul facteur qui est le poids de
chaque strate.
Rpartition proportionnelle
f n
N
Ni
et wi
N
ni w i n f Ni
Rpartition proportionnelle
Exemple :
Dans une population de 10000 entreprises,
rparties en 5000 petites entreprises, 3000
moyennes entreprises et 2000 grandes entreprises,
on souhaite avoir un chantillon de 500
entreprises.
Fraction de sondage constante :
f = 500 / 10000 = 5 %
Pr. BOULAHOUAL Adil
Rpartition proportionnelle
Strate
Effectif
Taille de lchantillon
Petite
Moyenne
Grande
5000
3000
2000
Total
10000
500
Rpartition proportionnelle
Strate
Effectif
Petite
Moyenne
Grande
5000
3000
2000
50%
30%
20%
Total
10000
Rpartition optimale
- Budget total de lenqute, G
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par
lcart type i.
Rpartition optimale
le nombre dunits choisir dans chacune
des strates est donn par :
ni k w i i
ci
G
w i i ci
Rpartition optimale
Exemple :
Dans la population des 10000 entreprises, on a pu avoir les
informations suivantes :
Strate
wi
ci
i.
Petite
Moyenne
Grande
0,5
0,3
0,2
50
75
100
0,8
1,5
2,2
Rpartition optimale
le nombre dentreprises choisir dans chacune des strates
est donn par :
k
G
5000
449,42
wi i ci 0,50,8 50 0,31,5 75 0,22,2 100
Echantillonnage systmatique
Lchantillonnage systmatique est une
technique qui consiste prlever des units
dchantillonnage situes intervalles
gaux. Le choix du premier individu
dtermine la composition de tout
lchantillon.
Echantillonnage systmatique
Si on connat leffectif total de la population
N et quon souhaite prlever un chantillon
deffectif n, lintervalle entre deux units
successives slectionner est donn par :
k N
n
Pr. BOULAHOUAL Adil
Echantillonnage systmatique
Connaissant k, on choisit le plus souvent,
pour dbuter, un nombre alatoire, i,
compris entre 1 et k. le rang des units
slectionnes est alors i, i+k, i+2k,
Echantillonnage systmatique
Lchantillonnage systmatique est facile
prparer et, en gnral facile excuter, il
rduit le temps consacr la localisation des
units slectionnes.
Echantillonnage systmatique
Si les lments de la population se
prsentent dans un ordre alatoire (pas de
tendance) lchantillonnage systmatique
est quivalent lchantillonnage alatoire
et simple. Par contre si les lments de la
population prsentent une tendance,
lchantillonnage systmatique est plus
prcis que lchantillonnage alatoire.
Echantillonnage systmatique
Exemple :
On veut slectionner un chantillon de 30 entreprises au sein
dune population de 1800 entreprises.
k 1800 60
30
Ainsi on va tirer une entreprise toutes les 60 en partant dun
nombre tir alatoirement entre 1 et 60.
Supposons ce nombre est le 15. On va donc slectionner la 15me
entreprise puis la 75me, la 135me. jusqu la 1755me ce qui nous
donnera lchantillon de 30 entreprises.
Pr. BOULAHOUAL Adil
Mthodes dchantillonnage
empiriques
- Echantillonnage accidentel (De convenance)
- Echantillonnage priori
- Echantillonnage Boule de neige
- Echantillonnage par Quotas
Echantillonnage accidentel
Il sagit dun chantillon constitu dindividus qui se
trouvaient accidentellement lendroit et au moment o
linformation a t collecte.
Enqutes ralises dans la rue, les lieux publics, en sortie de
super march
Questionnaires figurant dans les magasines et renvoys
spontanment.
Les chantillons accidentels ne peuvent tre considrs
reprsentatifs daucune population. Il est risqu de
gnraliser une population donne des rsultats obtenus
par un chantillon accidentel.
Pr. BOULAHOUAL Adil
Echantillonnage priori
Cest un chantillonnage par jugement priori. Il
consiste slectionner des individus dont on
pense, avant de les interroger, quils peuvent
dtenir linformation.
Le risque de ce type dchantillonnage est de
considrer des individus, apparemment
reprsentatifs de la population tudie.
Echantillonnage Boule de
neige
Cette mthode est rserve aux populations
composes dindividus dont lidentification est
difficile ou qui possdent des caractristiques
rares.
La mthode consiste faire construire lchantillon
par les individus eux-mmes. Il suffit den
identifier un petit nombre initial et de leur
demander de faire appel dautres individus
possdant les mmes caractristiques.
Pr. BOULAHOUAL Adil
40 %
35 %
25 %
100 %
400
350
250
1000
Sexe
Masculin
Fminin
Total
20 29 ans
48 %
52 %
100 %
30 49 ans
49 %
51 %
100 %
50 60 ans
45 %
55 %
100 %
Sexe
Masculin
Fminin
Total
20 29 ans
192
208
400
30 49 ans
172
178
350
50 60 ans
113
137
250
AGE
Sexe
Sans
Etudiant
Agric
Artisans
Prof
librales
Employs
Ouvriers
Total
10%
30%
5%
6%
9%
25%
15%
100%
15%
25%
2%
10%
8%
30%
10%
100%
8%
5%
15%
22%
15%
15%
20%
100%
20%
4%
10%
16%
14%
24%
12%
100%
6%
2%
25%
22%
18%
17%
10%
100%
35%
1%
20%
20%
6%
13%
5%
100%
CSP
20-29
30-49
50-60
AGE
Sexe
Sans
Etudiant
Agric
Artisans
Prof
librales
Employs
Ouvriers
Total
19
58
10
12
17
48
28
192
31
52
21
17
62
21
208
14
26
38
26
26
33
172
36
18
28
25
43
21
178
28
25
20
19
12
113
48
27
27
18
137
CSP
20-29
30-49
50-60
Test de reprsentativit de
lchantillon
Pour valider les rsultats de l'tude, et pour
minimiser la marge d'erreur, il est
indispensable de vrifier la reprsentativit
de lchantillon.
Test de reprsentativit de
lchantillon
- Mise en tableau des rsultats
- Test de reprsentativit
Test de reprsentativit
Appel test dajustement ou test Khi-deux, ce test est destin
tester si lchantillon observ peut tre considr comme
reprsentatif de la population tudie. Pour cela on a besoin de
connatre les caractristiques de la population. Le test
d'ajustement consiste calculer la valeur de la statistique khideux qui permet d'valuer les carts entre les frquences
observes dans l'chantillon et les frquences thoriques
correspondantes la population tudie. Lorsque les carts
seront petits, on acceptera la reprsentativit, sinon on la
rejettera.
Test de reprsentativit
- Formuler une hypothse nulle
- Calculer la valeur de Khi-deux observ
- Dterminer la valeur de Khi-deux
thorique
- Rsultat du test de reprsentativit
Rsultat du test de
reprsentativit
la valeur de Khi-deux observ est nulle lorsque les
frquences observes sont toutes gales aux
frquences thoriques, cest dire lorsquil y a
une concordance parfaite entre lchantillon
observ et la population tudie. Cette valeur est
dautant plus grande que les carts entre les
frquences observes et thoriques sont plus
grands. Il dcoule de la comparaison du Khi-deux
observ et du Khi-deux thorique :
Rsultat du test de
reprsentativit
- Si Khi-deux thorique est strictement suprieur
au Khi-deux observ, l'hypothse nulle est
accepte. Donc l'chantillon est reprsentatif de
la population tudie.
- Si Khi-deux thorique est infrieur ou gal au
Khi-deux observ, l'hypothse nulle
est
rejete. En d'autres termes, l'chantillon nest pas
reprsentatif. Il faut donc raliser un
redressement d'chantillon.
Pr. BOULAHOUAL Adil
Hommes
Femmes
Total
Niveau dinstruction
Effectifs
Effectifs
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
35
30
15
13
7
672000
576000
288000
249600
134400
50
25
10
10
5
1040000
520000
208000
208000
104000
1712000
1096000
496000
457600
238400
Total
100
1920000
100
2080000
4000000
Hommes
Femmes
Total
Niveau dinstruction
Effectifs
Effectifs
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
32
28
18
14
8
61
54
35
27
15
54
23
12
8
3
112
48
25
17
6
173
102
60
44
21
Total
100
192
100
208
400
Test de reprsentativit :
exemple
Mise en tableau des rsultats
Sexe
Niveau dinstruction
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
Total
Hommes
Femmes
Effectifs
thoriques
Effectifs
observs
Effectifs
thoriques
Effectifs observs
67,2
57,6
28,8
24,96
13,44
61
54
35
27
15
104
52
20,8
20,8
10,4
112
48
25
17
6
192
192
208
208
Redressement de lchantillon
Si l'chantillon slectionn n'est pas reprsentatif
de la population tudie, aprs le test, il est
ncessaire de le redresser. On redressera
l'chantillon
si
par
exemple
certaines
caractristiques
de
la
population
sont
surreprsentes ou sous-reprsentes. On peut
ainsi tirer de l'chantillon original un chantillon
reprsentatif.
Redressement de lchantillon
Pour redresser l'chantillon, il existe deux
mthodes distinctes :
- Redressement par extraction
- Redressement par substitution
FEMMES : 55%
NREP
FEMMES 61
HOMMES 37
DIFFERENCIEL DE REDRESSEMENT=
2%+6%+8%=16%.
Pr. BOULAHOUAL Adil
900 individus.
1100 individus.
Redressement de lchantillon
- la mthode par extraction est intressante si on sonde plus
de 1000 personnes
- la mthode par substitution est valable si le diffrentiel de
redressement est infrieur
30%.
- Si l'chantillon n'est pas reprsentatif, et quon ne peut
utiliser aucune des mthodes, il nous faut administrer de
nouveaux questionnaires. C'est pourquoi il faut vrifier le
plus tt possible la reprsentativit de l'chantillon et tout
de suite le redresser.
Pr. BOULAHOUAL Adil
1. Prsentation de lenquteur et
de lenqute
-
2. Questions dintroduction
leur but est dinitier la conversation et
gagner la sympathie du rpondant et
lintresser au questionnaire qui va suivre. Il
sagit de questions gnrales souvent
ouvertes.
3. Questions qualifiantes
Elles sont utiles si on a besoin de savoir si
lindividu possde linformation recherche.
Elles sont souvent de forme dichotomique.
Elles permettent dorienter le rpondant
des parties spcifiques du questionnaire.
5. Questions spcifiques
Cest le cur du questionnaire, les questions
doivent amener les informations les plus
importantes pour ltude.
A ce stade, le rpondant sest imprgn de lesprit
de ltude et a nou une relation de sympathie avec
lenquteur, on peut donc lui demander des efforts
de rflexion ou des informations personnelles.
6. Questions didentification
Pr-test du questionnaire
Le but du pr-test est de dtecter les erreurs et le
disfonctionnement du questionnaire avant le travail sur
le terrain.
Le pr-test consiste administrer les questionnaires
un chantillon rduit dans les mmes conditions du
terrain.
Pr-test du questionnaire
Le pr-test peut se raliser de deux faons :
- Pr-test dclar
- Pr-test non dclar
Administration des
questionnaire
- Slection des enquteurs
- Formation des enquteurs
- Motivation des enquteurs
- Contrle des enquteurs
Dpouillement des
questionnaires
- SAISIE
- CONTROLE
- ANALYSE DES DONNEES
SAISIE
La saisie consiste reporter les codes sur un
support informatique sous forme dune
matrice de donnes (variables/individus) en
utilisant un programme adquat. Cette
opration ncessite une concentration
extrme et un contrle svre.
CONTROLE
Le contrle consiste dtecter parmi les
donnes saisies ceux jugs errons pour les
corriger ou les liminer. Cette opration est
appele puration des donnes,
Elle
comporte les deux tapes suivantes :
CONTROLE
- Contrle de validit
- Contrle de cohrence
Contrle de validit
Il consiste vrifier pour chaque variable si
les codes ou les donnes saisis
correspondent bien aux codes prvus lors de
la codification ou au domaine de dfinition
de la variable.
Contrle de cohrence
Il consiste vrifier la cohrence des renvois
prvus dans le questionnaire, cest dire vrifier
pour certaines variables si les codes ou les donnes
saisis concordent bien avec les codes ou les
donnes saisis dautres variables.
ANALYSE UNIVARIEE
STATISTIQUE DESCRIPTIVE
Tableaux de frquences
Graphiques
Barres
Donnes discrtes
Secteurs
Btons
Donnes en classes
Dispersion
Polygone
Histogramme
Position
Forme
ANALYSE BIVARIEE
Relation entre deux variables
Corrlation
Coefficient de corrlation
Indpendance
Tests statistiques
Paramtriques
Non paramtriques
Test de signification
Tableau crois
ANALYSE MULTIVARIEE
NON
Y-a-t-il
une variable expliquer et une ou plusieurs
variables explicatives ?
OUI
Mthodes descriptives
Mthodes explicatives
La variable
expliquer est-elle
quantitative ?
OUI
OUI
Les variables
explicatives
sont-elles
quantitatives ?
NON
OUI
NON
Les variables
explicatives
sont-elles
quantitatives ?
NON
OUI
Analyses
factorielles
(A.C.P. et A.F.C.)
Analyse des
correspondances
(A.C.M.)
Typologie
Pr. BOULAHOUAL Adil
Rgression
linaire
Analyse
de la variance
Analyse
discriminante
NON
Analyse
conjointe