Sunteți pe pagina 1din 196

Enqutes et sondages

2003-2004
UV CNAM 18323 - STATISTIQUE B8
Intervenants : G.Saporta (CNAM), O.Marchese (IPSOS), S.Rousseau (INSEE)

Plan :
10 octobre : Introduction GS+OM
17 octobre : sondage alatoire simple GS
24 octobre: sources d'erreur et biais OM
31 octobre: sondages probabilits ingales GS
7 novembre : algorithmes de tirage GS
10 novembre: stratification GS
21 novembre: sondages deux degrs et grappes GS
28 novembre : donnes manquantes et fusions de fichiers GS
5 dcembre: Redressement (quotient, rgression post-strates) GS
12 dcembre: Effets et pratique des redressements OM
9 janvier: la mthode des quotas OM
16 janvier: panels GS
23 janvier: panels OM
30 janvier: mthodes d'enqute OM
6 fvrier : mthodes d'enqute OM
Rfrences
http://cedric.cnam.fr/~saporta/
http://www.agro-montpellier.fr/cnam-lr/statnet/
http://www.ipsos.fr/
http://www.cbs.nl/isi/iass/
P.ARDILLY
Les techniques de sondage (ditions Technip, 1994)
A.M. DUSSAIX, J.M. GROSBRAS Exercices de sondages (Economica, 1992)
A.M. DUSSAIX, J.M. GROSBRAS Les sondages (Que sais-je? N701, 1996)
Y.TILLE
Thorie des sondages (Dunod, 2001)

ENQUETES et SONDAGES
UV 18323 - STATISTIQUE B8
2003-2004
Gilbert SAPORTA
Chaire de Statistique Applique
Conservatoire National des Arts et Mtiers
292 rue Saint Martin
75141 Paris cedex 03
saporta@cnam.fr
http://cedric.cnam.fr/~saporta
1

INTRODUCTION
z Aperu

du secteur

statistique

publique

CNIS
INSEE 7 000 employs
400

Instituts privs
(10 000 employs, dont 4 000 permanents)
CA 2001: 1.275 milliards (+6.25%)
2

INTRODUCTION
Progression du CA des membres de Syntec
Marketing et Opinion

INTRODUCTION
z

Histoire rcente
1895

Kiaer, dnombrements reprsentatifs

1925

Jensen

1934

Neyman, Sondages 2 degrs

1952

Horvitz et Thompson, Sondages


probabilits ingales

1936

Election de Roosevelt

1938

Fondation de lIFOP

1965

Ballottage De Gaulle

INTRODUCTION
Objectifs et
contraintes
Base de sondage
Conception du
questionnaire

chantillonnage
Collecte des
donnes
Codification
Saisie
Contrles
Estimations
Redressement
Analyse des
donnes
Publications
valuations

LES TECHNIQUES DE SONDAGE


z

Mthodes alatoires:
Plans de sondage

Simples: - probabilits gales


- probabilits ingales

Complexes: - stratifi
- en grappe
- plusieurs degrs
6

LES TECHNIQUES DE SONDAGE


z

Mthodes par choix raisonn ou judicieuse:

Quotas;

Itinraires;

Units types;

Volontariat;

chantillonnage sur place;

Sondage chaud .

LES TECHNIQUES DE SONDAGE


z

Problmes essentiels:

Slection de lchantillon;

Agrgation des rponses


9 estimateur;
9 prcision;

SONDAGE ALEATOIRE SIMPLE


z

Notations:
Population

ou base de sondage: N

Identifiant:

i
Variable dintrt: Y (Y1, Y2YN)

1
Y=
N

Yi ;

i =1

i=1

1
2
= (Yi Y) ;
N i=1
2

T = Yi
N

1
N 2
2

S=
(Yi Y) =

N1 i=1
N1
2

SONDAGE ALATOIRE SIMPLE


z

z
z

Dfinition: tirage quiprobable sans remise de n


units;
n
N

chantillons possibles;

i probabilit dinclusion (plan de taille fixe):


n
=
i N

quiprobabilit:

Remarque:

Taux de sondage: n = f

i =1

=n

p( s)

s (is )

10

SONDAGE ALATOIRE SIMPLE


z

Estimation du total et de la moyenne:


y - estimateur de Y
N y - estimateur de T
E( y) = Y ; E ( N y ) = T

Dmonstration avec les variables de Cornfield


E ( i ) = i

1 si i s
i =
0 si i s

V ( i ) = i (1 i ) cov( i ; j ) = ij i j

N
y
Yi
N
i
l
yi =T = = i

n is
is i
i=1 i
N

Yi

Yi= variable non alatoire

E(Tl ) = E(i ) = Yi = T
i =1 i

yi=variable alatoire;

i =1

11

SONDAGE ALATOIRE SIMPLE


z

Variances:
S2
V ( y ) = (1 f )
n
2
S
V (T ) = N (1 f )
n
2

Estimation de S2:
s2 =

1
( yi y )2

n 1 is

E ( s2 ) = S 2
n
s2
V ( y ) = (1 f ) n

2
s
Vn
2

(T ) = N (1 f ) n

12

SONDAGE ALATOIRE SIMPLE


z

Intervalles de confiance estims:


y2s

1 f
1 f
<Y < y+2s
n
n

Cas dun pourcentage:

Yi

1
=
0

Y =P

P(1 P) N
V( p) = (1 f )
n N 1
p(1 p) p(1 p)
Vl ( p) = (1 f )

n 1
n
13

homepage

Sources derreur et biais

Oliviero Marchese, octobre 2004

Sources derreur et biais

Utilisations des donnes denqute :


Describers & Modelers

Sources derreur
Nonsampling errors
Populations dintrt
Dfaut ou excs de couverture
Non-rponse
Erreur de mesure

Sources derreur et phases denqute


L art du sondeur

Utilisations des donnes denqute :


Describers & Modelers
Diffrents langages, diffrentes proccupations
Accent sur lestimation des caractristiques dune population
vs

Accent sur la validation dhypothses thoriques


Accent sur lestimation de moyennes et proportions
vs

Accent sur lexploration de structures de covariance


Forte attention aux erreurs de non-observation (dfauts de couverture,
non-rponse)
vs

Forte attention aux erreurs dobservation (questionnaire)


3

Sources derreur {1/3}


Erreur dchantillonnage
Htrognit des mesures parmi les individus de la population

Dfaut ou excs de couverture


Probabilit de slection nulle ou non connue pour les individus de la
population

Non-rponse
Dfaut de collecte de toute ou partie de linformation pour certains
individus de lchantillon

Erreur de mesure
Influence de lenquteur sur les rponses des personnes interroges
Incapacit (ou manque de volont) des personnes interroges rpondre
aux questions : mmoire, imprparation, facteurs psychologiques,
Dfauts de linstrument de mesure (questionnaire ou autre)
Effets du mode de recueil (face face, tlphone, auto-administr papier
ou Internet)

Sources derreur {2/3}

Ces erreurs peuvent tre lies les unes aux autres


Eg : Faire du forcing pour rduire la non-rponse peut amener
amplifier les erreurs de mesure

En gnral, les efforts de modlisation et de mesure sont ports sur


lerreur dchantillonnage et la non-rponse
Souvent on ne sait que trs peu et parfois rien du tout - sur les
erreurs dobservation et les dfauts de couverture
Or, cela peut savrer ltal, car ces erreurs - qui ont essentiellement la
nature de biais ne diminuent pas lorsque la taille dchantillon
augmente

Sources derreur {3/3}

Moralit
Les efforts visant affiner une mthode de tirage ou lexpression dun
estimateur pour obtenir un gain de prcision peuvent savrer bien
illusoires si, par ailleurs, les erreurs dobservation, les dfauts de
couverture ou la non-rponse sont importants
Dans une telle situation, une taille dchantillon trs importante ne sera
pas non plus de nature viter la droute
Lors de la Prsidentielle amricaine de 1936, le vote de paille organis
par le Literary Digest - portant sur prs de deux millions de lecteurs donnait une confortable avance Alfred Landon (54%) alors que
Franklin Roosevelt allait recueillir 61% des suffrages !

Nonsampling errors :
Populations dintrt
Population objet de linfrence (population of inference)
Ensemble des units tudier

Population cible du sondage (target population)


Ensemble des units tudies

Base de sondage (frame population)


Liste des units utilise pour la slection de lchantillon: l univers
auquel font rfrence la plupart des livres de statistique

Population enqutable (survey population)


Liste des units accessibles, physiquement et mentalement prtes
rpondre, souhaitant rpondre aux questions
Il sagit bien videmment dune abstraction, puisque elle ne peut tre
observe indpendamment des oprations dchantillonnage elles-mmes

Non-rponse
divergences entre frame et survey population

Erreurs de couverture
divergences entre frame et target population
Kish, L., Populations for Survey Sampling, Survey Statistician, No. 1, fvrier 1979, pp.14-15

Nonsampling errors :
Dfaut ou excs de couverture {1/2}
Ambigut du reprage des units de la population
Une base de sondage se doit pour le moins dtre une liste didentifiants
de bonne qualit

Manque dexhaustivit
Chaque unit faisant partie du champ de lenqute doit tre prsente dans
la liste des identifiants

Doubles comptes
Aucune unit doit tre prsente plusieurs fois dans la base (surtout si le
nombre de fois nest pas connu)

Absence dinformations auxiliaires


Leur disponibilit peut tre mise profit pour amliorer soit la mthode de
tirage, soit lestimateur, soit les deux

Vieillissement de la base elle-mme


Absence ou inaccessibilit de la base de sondage
(situation finalement pas si rare!)
8

Nonsampling errors :
Dfaut ou excs de couverture {2/2}
Lerreur de couverture est une fonction
de la proportion de population non couverte par la base de sondage
de la diffrence dans la valeur de la variable dintrt entre frame et
target population

Y c = Y + (Nnc / N) * (YC Ync)


o Y reprsente la valeur auprs des N units de la target population
Yc reprsente la valeur auprs des Nc units couvertes par la
frame population
Ync reprsente la valeur auprs des Nnc units non couvertes par la
frame population

Lerreur de couverture
est lie la variable dintrt
nest pas une proprit de lchantillon
9

Nonsampling errors :
Non-rponse {1/3}
Comme pour le dfaut de couverture d au manque dexhaustivit de
la base de sondage, la non-rponse
nous met dans limpossibilit dobserver la valeur de la variable dintrt
engendre un biais non mesurable, puisque lon ne sait pas si les units
observes sont comparables aux units non observes

A diffrence du dfaut de couverture, la non rponse


est dampleur mesurable, partir de lchantillon tir (taux de non-rponse
calculable)
peut tre complte ou partielle (lindividu slectionn rpond certaines
questions et pas dautres)

En diminuant la taille de lchantillon, la non-rponse occasionne une


perte de prcision (quelles que soient les hypothses formules sur le
profile des non-rpondants)
10

Nonsampling errors :
Non-rponse {2/3}
Le taux de non-rponse est souvent interprt comme LA
mesure de qualit de lestimation de la variable dintrt
or, il ne sagit que dune composante de lerreur et ne peut pas en
donner seul la mesure

Lerreur d la non-rponse est une fonction


du taux de non-rponse
de la diffrence dans la valeur de la variable dintrt entre
rpondants et non-rpondants

y r = yn + (nr / n) * (yr ynr)


Lerreur de couverture
est lie la variable dintrt
nest pas une proprit de lchantillon
11

Nonsampling errors :
Non-rponse {3/3}
Une expression plus complte de la variable dintrt
estime devrait tre
y r = yn

+ (nc / n) * (yr ync) +


+ (ni / n) * (yr yni) +
+ (rf / n) * (yr yrf)

o ync reprsente la valeur auprs des nc units non contact


yni reprsente la valeur auprs des ni units incapables de fournir
une rponse
yrf reprsente la valeur auprs des rf units refusant linterview
avec nc + ni + rf = nr
12

Nonsampling errors :
Erreur de mesure
Il y a erreur de mesure lorsque la valeur de la variable dintrt
collecte pour un individu est diffrente de la vraie valeur attache ce
mme individu. Quelques cas (liste non ordonne et non exhaustive !) :
Questions faisant appel la mmoire des personnes interroges
Questions portants sur des sujets sensibles (revenus, comportements
sexuels, consommation de drogues, )
Mcanismes psychologiques lis linteraction enquteur/enqut
Interprtation des rponses de la part de lenquteur
Suggestions de lenquteur lenqut
Mauvaise comprhension de la question (surtout en cas de traduction
des questions depuis une langue trangre)
Formulation de la question, effets dordre,
Fatigue due la dure dinterviews
Autres effets enquteur : le sexe, lge de lenquteur, sa faon de se
prsenter ne sont pas sans consquences sur la qualit des
rponses obtenues
13

Sources derreur et phases d enqute

Couverture
Non-rponse
chantillonnage
Erreurs de mesure

!!! Pertinence, formulation,


ordre des questions; longueur
du questionnaire !!!

Saisie
Codification
Traitement
Prsentation

Conception du
questionnaire

Objectifs et
contraintes

!!! Choix de la base de sondage


et de lalgorithme de tirage !!!

!!! Dfinition des variables


dintrt, du champ de lenqute,
du budget et des dlais !!!
Collecte des
donnes
Codification
Saisie
Contrles
Estimations
Redressement
Analyse des
donnes
Publications
valuations

Base de sondage
chantillonnage
!!! Choix du mode de
collecte le plus appropri et
contrle des enquteurs !!!
!!! Contrles de cohrence,
contrles de qualit de la
codification et de la saisie !!!

!!! Prise en compte du plan de


sondage !!!

!!! Contrle / relecture du


rapport dtude / des tableaux
statistiques, !!!

14

L art du sondeur
La thorie statistique nous aide mesurer et rduire
lerreur dchantillonnage
Lart du sondeur, praticien denqute, consiste juger
de limportance du non mesurable
La pratique de cet art require la comprhension
des causes qui sont lorigine des erreurs
de leur importance relative
des effets gnrs
des cots relatifs aux efforts de rduction des erreurs

Juger de limportance du non mesurable est un art qui


ne doit pas se transformer en alibi pour arrter tout effort
de modlisation et mesure de lerreur

15

Lecture minimale
Ardilly, P. (1994), Les techniques de sondage, Editions Technip,
Paris
Chapitre I. Aspects universels, principes de base

Pour aller plus loin


Groves, R.M. (1989), Survey errors and survey costs, Wiley, New
York
Chapitres I,III,IV,VII (si vous navez pas la force de le lire en entier)

16

SONDAGE A PROBABILITS INGALES


z
z
z

Les plans simples quiprobables ne sont utiliss quen


labsence de toute autre information
Tirage probabilits ingales: une manire dutiliser de
linformation auxiliaire
Infinit de plans probabilits ingales et sans remise

14

SONDAGE A PROBABILITS INGALES


z

Estimateur de Horvitz-Thompson ou des valeurs


dilates pour un total:
N

Tl = ai yi =aY
i ii
is

i =1

i=1

i=1

E(Tl ) = aY
i i E(i ) = aiiY i
N

Pour que Tl soit sans biais: E(Tl ) = Y i

aii =1

i =1

15

SONDAGE A PROBABILITS INGALES


Thorme:
yi
l
T =
est le seul estimateur linaire sans biais
is i
de T
Pour une moyenne Y

l 1
Y =
N

yi

i s

16

SONDAGE A PROBABILITS INGALES


Exemple (Ardilly) : nombre dhabitants Y inconnu, nombre de logements X connu.
Estimation du nombre moyen dhabitants par tirage probabilits
proportionnelles au nombre de logements

17

SONDAGE A PROBABILITS INGALES


Echantillons de deux communes:

18

SONDAGE A PROBABILITS INGALES


z

Si N est inconnu:
N

N = 1
i =1

Lestimateur de N est donc:

N =
is

Do:

E (
is

)=N
19

SONDAGE A PROBABILITS INGALES


z

Estimateur de Hajek:

Y =

i s

i s

yi

Poids alatoires de somme 1.


z Estimateur lgrement biais
z

20

SONDAGE A PROBABILITS INGALES


z

Un cas gnant:

Yi = C
Yi C
1
ly = 1
=

N is i N is i

Comme
z

Mais:

is

alors

ly C

E(ly) = C
21

SONDAGE A PROBABILITS INGALES


z

Variance:
N

Yi2

V(Tl ) =
i=1

Yi Yj

(1i ) +
i j

ij

i j )

si n fixe formule de Yates-Grundy :


2

Yi Yj
1
l
V(T) = (
i j ij )

2 i j i j
N

22

SONDAGE A PROBABILITS INGALES


z

Estimation de la variance (par Horvitz-Thomson):


Premire formule:
i j
n
i j
2 1i
V(T) = yi 2 + yi yj
peut tre < 0
is

i j s

i jij

Deuxime formule:
2

yi yj
n 1
i j ij
V(T) =
2 i, js i j ij
23

SONDAGE A PROBABILITS INGALES


La formule de Yates Grundy montre que
lon a intrt tirer proportionnellement
aux valeurs dune variable auxiliaire X
corrle (positivement!) Y.
z Intressant en cas deffet taille (CA, nb
demploys, bnfice)
z

24

SONDAGE A PROBABILITS INGALES


z

Calcul des probabilits dinclusion


z

i =

nxi
N

x
i =1

z Exemple:

tirage de 3 individus parmi 6


proportionnellement
x1=300 x2=90 x3=70 x4=50 x5=20 x6=20

25

SONDAGE A PROBABILITS INGALES


z
z
z

Units slectionnes doffice et units


tires au hasard.
Infinit de plans de sondage pour des i
fixs.
Daprs Till une bonne procdure de
tirage doit vrifier 4 critres:
1.
2.
3.
4.

Exactitude
Taille fixe
Gnralit
Sans remise
26

SONDAGE A PROBABILITS INGALES


z

Contraintes sur les ij


z
z
z
z

Strictement positives (sinon estimation de variance dlicate)


Indpendantes de lordre du fichier
ij< i j
Variance infrieure celle du plan avec remise

Facilit de mise en uvre


z
z

Algorithme rapide
Squentiel

27

SONDAGE A PROBABILITS INGALES


z
z

Plus de 50 mthodes! Aucune ne satisfait


tous les critres.
Quelques techniques simples:
z
z
z

Tirage avec remise et conservation des units


distinctes mais taille non fixe
Rejet de lchantillon si il y a des doublons mais
proba dinclusion non proportionnelles aux xi
Tirage successif sans remise:
z

On recalcule les probas dinclusion aprs tirage de chaque


i
individu. Si j est tir:
'

i =

1 j

Ne respecte pas les probas dinclusion dordre 1


28

SONDAGE A PROBABILITS INGALES


z
z
z

Sondage systmatique probabilits


ingales
Simplicit
Inconvnients:
z
z
z

certaines probabilits dinclusion dordre 2


peuvent tre nulles
Dpend de lordre du fichier
Tri alatoire avant tirage?

29

STRATIFICATION
z

Utilisation dune

information auxiliaire
qualitative
z Toujours efficace

P2
P1

S1

PH

kj

S2

30

STRATIFICATION, notations
z

Strates:
N 1 , N 2 ......N h .......N H

N=Nh

Y1 , Y 2 .......Y h .......Y H

Y =

, .... .....H
2
1

2
2

2
h

chantillon:

P1

S1

kj

S2

Nh
Yh
N

2
Nh 2
Nh
= h + (Yh Y )
N
N
2

n1,n2,.........nh,...........nH

n =nh

y1,y2,........yh,...........yH

nh
y = yh
n

12,22,.....h2............H2

P2

PH

31

STRATIFICATION
2
Nh 2
Nh
= h + (Yh Y ) =2W +2B
N
N
2

Variance totale=
moyenne des variances (variance intra)
+variance des moyennes (variance inter)

32

STRATIFICATION
z

Estimateur sans biais de Y (Horvitz Thomson)

Nh

Ystr =
yh
N
z

Variance:
2

2
N
N

h
h
h Nh nh
V (Ystr ) = V ( yh ) =
N
h=1 N nh Nh 1
H

Sh2
1 H
= 2 Nh (Nh nh )
N h=1
nh
33

STRATIFICATION, rpartition
proportionnelle
z

chantillon dit reprsentatif :


nh Nh
nh
n
=
h =
= =
n N
NH N

Taux de sondage constant dans chaque


strate
H

H
N
nh

h
Ystr = yh = yh = y = Yprop
h =1 N
h =1 n

34

STRATIFICATION, rpartition
proportionnelle
z

variance :

2
H
H
1
S
1
Nh nh

h
V (Yprop ) = 2 Nh ( Nh nh )
= 2
Nh Sh2
N h=1
nh N h=1 nh
H
H
1 H Nh
1
N
N
n
Nh 2

2
2
Sh
= 2 ( 1)Nh Sh = 2 ( 1)Nh Sh =

N h=1 nh
N h=1 n
nN h=1 N

Si est faible:

2
H
H
N

n
N
N

n
N
N

2
2
h
h
w


V (Yprop ) =
S
=
h nN
h
nN h=1 N
N
N n
h=1

35

STRATIFICATION, rpartition
proportionnelle
z

Variance de lestimateur du SAS sans remise:


n S2
N n 2
N n
=
V ( y ) = (1
)
S 

N n
N
N

Avec les mmes probabilits dinclusion dordre 1,


lchantillon stratifi reprsentatif est plus efficace
quun chantillon simple de mme taille ds que
les Y h sont diffrents.

36

STRATIFICATION optimale
z

Rpartition optimale:
1
m
V (Ystr ) = 2
N

avec

Sh

N h ( N h nh ) 2
Sh

nh

Nh
=
h2
Nh 1

ch cot unitaire dune observation

N h (N h nh
m in
nh

nhch = c0

Nh 2 2
2

S
N
S
n h
h h


h
fixe

)S

2
h

37

STRATIFICATION optimale
z

Solution:
N h2 S h2
n h2

nh

Nh

proportionnel ch
Sh
ch

Si ch constant:

N h Sh
nh = n
- Rpartition de Neyman
N h Sh

38

STRATIFICATION

Exemple n 1: prsondage de 155 units


Strates

Nh

3750

3272

1387

2475 10 884

nh

50

45

30

30

yh

12.6

14.5

18.6

13.8

h2

2.8

2.9

4.8

3.2

155

39

STRATIFICATION
z

Exemple n 1:

2

3750x12.6 + ..... + 2475x13.8
N
= 14.21
Y = h yh =
10884
N


V (Y ) 

2
l
Nh h
2
0
.0
2
0
5
9
(
0
.1
4
)
=
=

N nh
2

Intervalle de confiance 95% pour Y :

14.21 2x0.14 soit: 13.93 < Y <14.49


Pour T:

154662 3047

40

STRATIFICATION
z

Exemple n 1:
Nh 2
Nh
2
= h + (Yh Y )
N
N

nh l 2
h
On estime: par
n h 1
2
h

Y h par y h

Y par
2
2
l
= 6.06 = ( 2.46 )

41

STRATIFICATION
z

Suite: Rpartition de Neyman pour n=1000:

N1S1 = 6275
N2S2 = 5572
N3S3 = 3038
N4S4 = 4427
19 312

n1 = 1000 x 6275/19 312 = 325


n2 = 288
n3 = 157
n4 = 229

1 Nh ( Nh nh ) 2
2
Variance: 2
Sh = 0.0029 = ( 0.0542)
N
nh

Y connu + 2 x 0.0542 soit + 0.108

T connu + 1179

42

STRATIFICATION
z

chantillon simple 1000:


2 N n
n

N 1

= 0.0055 = ( 0.0742)

connu + 0.15; T connu + 1615

chantillon stratifi reprsentatif:


n1 = 345
n2 = 301
n3 = 127
n4 = 227
z

43

STRATIFICATION
z

Comment stratifier?
z Remarque

pralable: dans un sondage probabilit


ingale i proportionnel Yi annule la variance.

zNombre

de strates: le maximum mais

zRpartition

dans les strates:


z Si Sh inconnu : rpartition proportionnelle
z si Sh connu: Neyman
Sh
z sinon, hypothse frquente Y h = c do nh
proportionnel la somme de la variable tudie ou
dune variable corrle.
z

Exemple: chantillon dentreprises proportionnel au CA ou


44
leffectif de la strate.

STRATIFICATION
zVariable

de stratification: en thorie Y; sinon,


variable bien corrle avec Y.
zLimites

de strates optimales:

mthode de Dalenius et Hodges. Regrouper des


classes selon le cumul de la racine des effectifs

45

STRATIFICATION
Estimation dune proportion p
z Mme dmarche: une proportion est une
moyenne particulire
z

p str =
h =1

Nh
fh
N
2

N h ph (1 ph ) N h nh

V ( pstr ) =

N
nh
Nh 1

h =1
H

nh
N h f h (1 f h )

V ( p str ) 
1

N
n
N

h =1
h
h

46

SONDAGE A DEUX DEGRS


zDfinition:

tirage de m units primaires puis de ni


units secondaires
zAvantages:

Mais:
z

frais de dplacement rduit


absence de liste autorise

prcision moindre: effet de grappe.

M units primaire de taille Ni


N =

i =1

Ti =

Ni

j =1

Y i j - total de lUP ni
47

SONDAGE A DEUX DEGRS


Tirage alatoire simple chaque degr.
M
l
T =
m

Ni

is ni

jSi

yij

Remarque: inutile de connatre N pour estimer T.


V

2
2
S

n
S
m
M

2
,
i
2
i
1
Tl = M 1
N i 1
+

M
m
m
N
i
i n


( )

V a r ia n c e
in t e r
UP

1
S =
Ti T

M 1 i=1
2
1

V a r ia n c e
in t r a
UP

S2,i

Ni

1
=
Yij Y i

Ni 1 i=1

48

SONDAGE A DEUX DEGRS


z
z

S12

estim par

1 l Tl
2
s1 =
Ti

m1 i=1 M
m

idem pour S22,i


Remarque:
-

Si ni proportionnel Ni: taille dchantillon alatoire

Ni
ni = n0
N

Ni
N i m n0m
=
E ( ns ) = E ( n0 ) = n0
N
N M
M
iSi
kU i
49

SONDAGE A DEUX DEGRS


z

Sondage autopondr:

- m units primaires tires probabilits proportionnelles


leur taille
- tirage dchantillons de taille fixe n0
probabilits dinclusion constantes

Nj

n0 mn0
i =
=
m
N Nj
N
z

Estimateur de la moyenne: N peut tre inconnu

Y = y

50

CAS PARTICULIER: SONDAGE EN


GRAPPES
zDfinition:

toutes les US sont observes dans les


UP tires.
Ncessit de grappes: htrognes
de faible taille
nombreuses
de tailles voisines

Le tirage systmatique est un tirage dune grappe.

51

SONDAGE EN GRAPPES
Cas gnral :tirage de grappes probabilits
ingales
z

Ti

T =
m

Estimation du total:

i =1

Estimation dune moyenne

 1 m NiYi
y=
N i =1 i

pb si N inconnu: utiliser lestimateur de Hajek

52

SONDAGE EN GRAPPES
z

Tirage de grappes probabilits gales


m
i =
M

taille dchantillon alatoire


E (ns ) = E ( N i ) =
iSi

M
l
T =
m

T
i s

()

Ni

kU i

2
S
m

V Tl =M2 1 1
M m

m Nm
=
M
M

 M1 m
y=
NY

i i
m N i=1
53

SONDAGE EN GRAPPES
Tirage de grappes probabilits
proportionnelles la taille
z

N
i = m i
N

m
1

y = yi
m i =1

m
1
Ni

 2

V ( y) =
m
y
y)

(1
)(

i
m(m 1) i =1
N

Ni m m
E (ns ) = E ( N i ) = N i
=
M
M
iSi
iU i

2
N
i
i =1

54

MTHODES DE REDRESSEMENT OU DE
PONDRATION
zPrincipe:

utiliser a posteriori une information


supplmentaire corrle avec la variable
tudier.
z Information:
variables de contrle dont on connat soit des
caractristiques globales, des caractristiques
par classes, pour chaque individu.
55

MTHODES DE REDRESSEMENT OU DE
PONDRATION
Estimation par le quotient ou redressement par
variable quantitative
Exemple:
chantillon de 80 hypermarchs - On veut estimer
le CA moyen Y
On a y =110,2MF
On sait que le nombre moyen X de caisses dans la
population des hypermarchs est 28.
Dans lchantillon
x = 28.8
z

28

Y=110.2 =107.1
28.8

56

Estimation par le quotient

Formule gnrale:

X
yq = y
x

Remarque: en gnral estimation biaise,


mais biais ngligeable si n>1000.
Hypothse de proportionnalit (rgle de 3)

57

Estimation par le quotient


z

Calcul du biais:
y Y
y
y Y +Y
Y
= X
=Y
yq = X
x
xX + X
x X
1+
X


1+

Dveloppement limit:

y Y
yq  Y 1 +
Y

2
y Y x X y Y x X x X 2
x X x X

+
+

1
 Y 1+
Y
X
Y
X X

X

X

58

(y )
q

cov x; y
 Y 1

XY

) + V ( x )
X

Si probabilit gale et sans remise:


N n sx2 cov( x; y)
E yq =Y +
Y 2

Nn X
XY

( )

Biais en 1/n.
Biais nul si la droite de rgression passe par 0.
59

Erreur quadratique moyenne

N n 2
Y
Y 2 2
N n 1 n 2
E ( yq Y ) =
zi

s y 2 sxy + ( ) sx estim par


Nn
X
X
Nn n 1 i =1

Avec

zi = yi rxi

o r =

y
x

60

Complment: estimation dun ratio


Exemple: Tirage de n exploitations
agricoles (levage): Xi nombre de vaches,
Yi production
Y
y
z Rendement par vache: R = X estim par r = x
z Rapport de deux variables alatoires
z Dveloppement limit
z

s xy
N n s x2
E (r)  R +
R 2

Nn
X
XY

61

Estimation par la rgression


On connat pour chaque individu de
lchantillon une variable de contrle xi et
aussi la valeur moyenne X sur la population .
Hypothse:
y = a + bx

yr

yr = y + b X x

62

Post-stratification; redressement
sur critre qualitatif
Exemple:
n=1000; on veut estimer le pourcentage de
frquentation du cinma.
On saperoit que la frquentation du cinma
est lie la posssession de TV.
On sait que tl = 80%.
63

Post-stratification; redressement sur critre qualitatif


Cinma
Tele

Oui

Non

Total

Oui

20

680

700

(800) X 8/7

Non

80

220

300

(200) x 2/3

Total

100

900

Aprs redressement:
Cinma
Tele

Oui Non Total

Oui

23 777

800

Non

53 147

200

Total

76 924
64

Gnralisation: calage sur marges


z

Redressement sur plusieurs critres


z Mthode

(RAS)

itrative de Deming et Stephan

On ajuste alternativement sur chaque marge


(succession de rgles de 3)
z Macro

CALMAR de lINSEE

65

Post-stratification pour une


variable numrique
Tl post =Nh yh

1

ypost = Nh yh
N

Exemple: enqute concernant les revenus


X=classe dge; Y=revenu
<20

21-35

36-50

15%

30%

30%

6000

9000

15.000

>50
25% y = 11.100
12.000

On sait que les proportions sont:



y post = 10650
20
35
30
15

66

Post-stratification pour une variable numrique

( )


V ypost =V E(Y / nh ) + E V (Y / nh )


Conditionnellement aux nh:


2

Nh
Nh Nh nh 2
Nh 2 1 1
=
=
V
y
S
N h N N n h N Sh n N
h
h h

( )

Nh 2
N Sh

En prenant lesprance:
2

Nh 2 1 1 Nh 2
N Sh E n N N Sh
h
67

Calcul de
Nh
Ph =
N

nh
ph =
n

1
E

nh

ph Ph
nh
nh = n = nph = n ( ph Ph + Ph ) = nPh 1+

n
P
h

Dveloppement limit

1
1
1
=

p h Ph
nh
n Ph
1 +
P

h

ph Ph ph Ph
1 1
1
2
1 + =
1
+


nh nPh
nPh
Ph
Ph

68

En prenant lesprance :
E ( ph ) = Ph

N n
V ( ph ) =
Ph (1 Ph )
Nn

1
1
N n Qh
E

=
1 +

2
n
nP
N
n
P
h
h
h

( )

V ypost

1 N n Qh 1
2
= P S + 2 PS
h h
nP
Nn
P
N
h
h
2 2
h h

N n
1 N n
2
2
=
P
S
+
Q
S

h h
h h
Nn
n Nn

( )

V ypost

1 f Nh 2 1 f Nh 2
=
Sh + 2 1 Sh
n
n N
N
69

Pour avoir une bonne post-stratification


z Variable

de redressement bien corrle

zN

grand
z (N-Nh)/N petit donc grandes strates
z Effectifs Nh connus

70

MTHODES DE REDRESSEMENT OU DE
PONDRATION
Remarque:
ne

pas utiliser que des variables sociodcisionnelles;


dangers de redressement sur critres multiples.
Proprits:
lestimateur

est sans biais, mais il faut connatre


avec certitude les poids des strates.
sa

variance est plus petite si le critre de poststratification est trs li la variable dintrt, si n
est grand et sil ny a pas trop de strates.

71

Questions sensibles ou indiscrtes:


la mthode des questions alatoires

Premire technique:
On tire ou sort dans une urne avec boules
blanches et 1- boules noires la question
Si blanc: question A: Avez-vous fraud le fisc?
Si noire: question A: Je nai pas fraud
On veut estimer PA.
On recueille = Proba de Oui = PA + (1 )(1 PA )
72

l % de Oui

l (1 )

l=
P
A
2 1

( )

l =
VP
A

PA (1PA) 1 (1)
l
V
+
2
2
n
n
( 21)
( 21)
1

()

Inconvnient: A aussi indiscrte que A!

73

Deuxime technique:
Si blanche, question A sensible
Si noire, question B banale
= PA+ PB (1)

l (1 ) P

B
l=
P
A

(1) PB (1 PB )(1)
l
V PA 
+
2
n
n2

( )

PB peut tre connu lavance ou estim par une autre


enqute.
Exemple:
A: combien de fois avez-vous avort?
B: nombre idal denfants?
74

Effets et pratique des redressements

Oliviero Marchese, dcembre 2003

Effets et pratique des redressements

Prcisions de langage
Redresser pour quoi faire ?
Une pratique quil ne faut pas banaliser
Redresser sur quoi et comment
Le choix des critres
Les contrles oprer

La pratique des redressements


dans les tudes marketing
dans les tudes politiques

Peut-on se fier aux redressements ?


Bibliographie

Prcisions de langage

Extrapolation
Le poids comme coefficient dextrapolation : passage des
effectifs chantillon aux effectifs population

Pondration
Redistribution de poids effectif chantillon constant,
visant corriger une sur/sous -pondration de strates
dcide lors de ltablissement du plan de sondage

Redressement
Redistribution de poids effectif chantillon constant gnralement fonde sur des critres multiples -, visant
corriger une sur/sous -reprsentation de catgories de la
population constate a posteriori

Redresser pour quoi faire ? {1/2}

Prise en compte du plan de sondage


Pondration de strates dchantillon
Pondration selon la taille des units primaires (eg
mnages/individus)

Prise en compte dinformations sur la population


(post-stratification)
Correction de distorsions dues des erreurs de nonobservation (erreurs de couverture et/ou de non-rponse)
Ce type de correction est plus courant pour les
chantillons non-probabilistes (eg quota), ou dans les
chantillons probabilistes entachs dimportants erreurs
de non-observation

Redresser pour quoi faire ? {2/2}

Ne pas redresser revient attribuer aux nonrpondants le comportement moyen de lensemble


des rpondants, ce qui constitue souvent une
grossire erreur
Il est bien connu que les non-rpondants se
trouvent plus particulirement dans des catgories
sociales spcifiques (personnes ges, femmes,
personnes faible niveau dinstruction, )
Dhabitude il est prfrable attribuer aux nonrpondants le comportement moyen des
rpondants appartenant aux mmes catgories
sociales

Une pratique quil ne faut pas banaliser

Le redressement est trop souvent considr comme


une simple tape informatique , permettant de caler
mcaniquement la structure de lchantillon sur celle de
la population tudie
Cela fini par devenir une pratique de maquillage
dchantillon , ayant pour but de corriger les carts
entre quotas demands et quotas raliss
Comme toute autre phase de lenqute, le
redressement doit tre prpar en amont : il faut penser
poser les bonnes questions, codes de faon
homogne aux donnes de rfrence les plus rcentes,
en prenant garde aux units statistiques (mnages vs
individus, entreprises vs tablissements, )
6

Le choix des critres

Les variables de redressement doivent tre le plus corrles


possible aux thmatiques de ltude (afin de rduire la
variance des estimateurs) : des mthodes de segmentation
(eg CHAID) sont parfois utilises dans leur slection, mais la
plupart des fois quelques bons tris croiss suffisent
Les variables de redressement doivent tre peu nombreuses,
et doivent tre agrges de faon pertinente (afin dviter des
effets mal matriss)
Les non-rpondants aux questions utilises dans le
redressement doivent tre limins ou laisss leur poids
(viter des hypothses trop fortes leur gard)

Les contrles oprer

Il est important doprer une validation pralable de la


structure brute dchantillon, sur un ensemble de variables
critiques, quelles aient fait lobjet de quotas ou quelles soient
utilises comme simples variables de contrle
Bien sr les variables utiliser dpendent du sujet de ltude :
nombre de personnes au mnage, prsence denfants, type et
quipement du logement, restitution du vote une lection
antrieure,
Aprs redressement, il faut vrifier la distribution des poids
gnrs : min, max, quantiles et courbes de frquence,
indicateurs de forme du type
100 * ( poids) / n poids
(*) Cela vaut 100 si tous les poids sont gaux, entre 50 et 70 sil y a une forte dispersion;
moins de 50 le redressement est revoir

La pratique des redressements


dans les tudes marketing

Rgion croise par tranche dunit urbaine, sexe, ge, CSP


de la personne de rfrence ou de lindividu, prsence
denfants, niveau dtudes, pratiques mdias sont les
variables le plus souvent utilises dans les tudes marketing
Le plus important cest de :
ne pas jouer au perroquet
toujours utiliser des donnes de rfrence fiables et jour
veiller redresser en plusieurs tapes sil le faut : dabord une
premire pondration - eg mnage ou pays -, ensuite un calage
sur marges portant sur les variables individu
rester aussi critiques que possible sur les ventuels erreurs de
mesure commises

La pratique des redressements


dans les tudes politiques
Ce qui a t dit pour les tudes marketing reste bien sr
valable
Pour le reste, un exemple vaut mieux que mille discours :

10

Peut-on se fier aux redressements ?

Le redressement est indispensable


Correction des erreurs de non-observation
Standardisation des structures des fins de comparaison

Le redressement ne peut pas corriger les erreurs


de mesure
Dclarations de revenus
Restitutions et intentions de vote

Le redressement peut augmenter les biais


Poids dlirants > limitation des poids (eg. de 0,25 4,00)
Disponibilit de donnes de rfrence fiables et rcentes,
codes de faon homogne

11

Bibliographie

Ardilly, P. (1994), Les techniques de sondage, Editions Technip,


Paris
Chapitre III. Amlioration des estimateurs (redressements)

Lejeune, M., d. (2001), Traitements des fichiers denqutes.


Redressements, injections de rponses, fusions, PUG, Grenoble
Brossier, G., Dussaix,A.-M., d. (1999), Enqutes et sondages,
Dunod, Paris
Chapitre 5. Mthodes de redressement et de calage

12

La mthode des quotas

Oliviero Marchese, janvier 2004

La mthode des quotas


Principe de la mthode
Point de dpart et but recherch
Caractre intuitif de la mthode
A quoi ressemble une feuille de quotas ?
La recherche des personnes interroger

Critique de la mthode
Biais dchantillon
Impossibilit de calculer lerreur dchantillonnage
Si cest aussi compliqu
pourquoi continue-t-on ?

Enqutes par quotas et sondage alatoire


Une tude empirique
Quelques enseignements

Ralisation du plan de sondage


La ncessit de consignes prcises
La ncessit denquteurs professionnels
Quotas marginaux ou quotas croiss ?
Quels quotas choisir ?

Peut-on se fier aux chantillons par quotas ?


Bibliographie
2

Principe de la mthode
Point de dpart et but recherch

Le point de dpart : toutes les mthodes dchantillonnage


alatoire supposent lexistence dune base de sondage
partir de laquelle on tire alatoirement (mais avec
probabilit connue) un chantillon sans biais dont la
taille a t dtermine la suite de considrations sur le
niveau de prcision souhait
Or, pour la majorit des enqutes dopinion comme des
tudes de march on ne dispose pas de base de sondage

Le but recherch : il sagit de se rapprocher le plus possible


dun tirage rigoureusement alatoire

Principe de la mthode
Caractre intuitif de la mthode

On suppose que si lchantillon reproduit fidlement


certaines caractristiques de la population tudie (et
peut donc tre considr, par abus de langage,
reprsentatif ), alors il sera galement mme de
reproduire dautres caractristiques non contrles et/ou
contrlables qui constituent lobjet mme de lenqute
si la population se compose de 50% dhommes, on
imposera lenquteur charg de raliser 10 interviews
un quota de 5 hommes pour 10 personnes enqutes
si la mme population comporte 10% dagriculteurs, il
devra y avoir une et une seule interview dagriculteur

Principe de la mthode
A quoi ressemble une feuille de quotas ?
10 interviews
Auprs dlecteurs inscrits

Rpartition
des
interviews

1 2 3 4 5 6 7 8 9 10

Sexe
Homme

12345

Femme

12345

18 34 ans

123

35 49 ans

12

50 64 ans

12

65 ans et plus

123

Agriculteur

Artisan / Petit commerant

Prof. Lib. / Cadre suprieur

Prof. Intermdiaire, employ, ouvrier

1234

Retrait, tudiants, autre inactif

123

Age

CS de la personne interroge

Principe de la mthode
La recherche des personnes interroger

La recherche peut tre dautant plus longue que lon


approche la fin de la feuille : la dernire personne est
dtermine de manire unique par les modalits
restantes
Tout le mtier de lenquteur consiste ne pas se faire
piger et raliser correctement ses fin de quotas
Dfinir des quotas revient dfinir une stratification
multiple sur la population. La diffrence avec
lchantillon probabiliste est que au lieu de tirer les
units de sondage on laisse lenquteur le soin de les
trouver lui-mme au hasard de ses prgrinations (cela
prend un sens un peu diffrent en face face et au
tlphone)
6

Critique de la mthode
Biais dchantillon

Le biais est cr par les conditions mmes du


travail de lenquteur
A diffrentes heures de la journe les diffrentes
catgories de population prsentent des
probabilits diffrentes et inconnues dtre
touches par lenquteur
La probabilit dtre touch varie galement avec
laccessibilit des personnes interroger :
digicodes lentre des immeubles en face face,
numros sur liste rouge au tlphone

Critique de la mthode
Impossibilit de calculer lerreur dchantillonnage

La probabilit qua un individu de la population dappartenir


lchantillon est inconnue : il est alors impossible
dvaluer la variance dchantillonnage et donc de
mesurer la prcision des estimations

Deux ractions possibles :


De nombreux auteurs considrent que cette mthode est
inutilisable
Dautres auteurs, faute de mieux, adoptent lhypothse
dun tirage probabilits gales; hypothse qui nest,
vraisemblablement, jamais vrifie

Critique de la mthode
Si cest aussi compliqu

les estimateurs employs sont biaiss;


les calculs de taille dchantillon que lon ralise en
employant les formules du sondage probabilits gales
ne peuvent tre que des approximations plus ou moins
grossires
le plan de sondage doit tre accompagn dune srie
de consignes donnes lenquteur visant la fois :

rduire le biais dobservation;


se rapprocher le plus possible des conditions de tirage
probabilits gales

Critique de la mthode
pourquoi continue-t-on ?

ce nest pas parce que lon ne connat pas la prcision dune


estimation que cette estimation est mauvaise
de faon empirique nous avons dinnombrables exemples de
rsultats issus dchantillons par quotas fort comparables ceux
fournis par des chantillons alatoires

10

Enqute par quotas et sondage alatoire


Une tude empirique (1/2)

En 1953, linitiative de la London School of


Economics, mthode alatoire et mthode par quotas ont
t compares. Lchantillon alatoire tait tir partir
des listes lectorales, lautre chantillon devait respecter
trois quotas : le sexe, lge regroup en quatre classes, la
classe sociale en trois postes.
Le questionnaire tait le mme dans les deux enqutes
et portait sur des variables socio-dmographiques, les
niveaux de revenu et dinstruction, les loisir.

11

Enqute par quotas et sondage alatoire


Une tude empirique (2/2)

La comparaison des rsultats des deux enqutes a montr


que dans ce cas :
Lchantillon sur quotas donnait des estimations plus
biaises sur les variables socio-dmographique que sur
les variables purement sociologiques (loisirs,
consommation)
Pour ces variables sociologiques, si le biais tait trs
faible, en revanche il est presque toujours dans le sens
de la surestimation
En labsence de quotas sur le secteur conomique, il y a
sous-estimation des travailleurs de lindustrie

12

Enqute par quotas et sondage alatoire


Quelques enseignements

Il est important de contrler les variables sociodmographiques susceptibles dtre corrles aux
variables dintrts
Le secteur dactivit conomique doit galement tre
contrl, en imposant des quotas priori ou par poststratification (redressement)
Il faut toujours se mfier du syndrome du perroquet,
lorsquil sagit de dfinir les variables que lon souhaite
contrler par des quotas

13

Ralisation du plan de sondage


La ncessit de consignes prcises

Afin de canaliser les agissements de lenquteur la


feuille de quotas doit tre accompagne par des
consignes prcises, visant se rapprocher le plus
possible des conditions dun tirage probabilits gales
Il sagit de rapprocher autant que possible les diffrentes
probabilits que les individus ont dtre interrogs : par
exemple, pour une enqute comportant des interviews
dactifs, il est important de travailler en semaine aprs
18h00, les samedis et dimanches

14

Ralisation du plan de sondage


La ncessit denquteurs professionnels 1/2

Ce qui est demand lenquteur


professionnel
Savoir viter les refus
tre disponible pour un travail sans horaires fixes
Savoir viter dinterroger , dans une zone donne, des
personnes se ressemblant trop ou vivant dans les mmes
conditions
Ne pas hsiter renoncer une interview si la personne
contacte ne correspond pas aux quotas
Respecter les consignes de dispersion gographique des
interviews
Brasser large lintrieur des cellules de quota : si un quota
rassemble ouvriers et employs, ne pas se contenter
dinterroger que des ouvriers

15

Ralisation du plan de sondage


La ncessit denquteurs professionnels 2/2

Ce que lon demande lenquteur travaillant par quotas


cest en quelque sorte de se transformer en un instrument
de tirage quasi alatoire qui, par ses cheminements au
hasard de la zone quil exploite, russi constituer une
slection dinterviews proche de lquiprobabilit
Cette fiction rejoint plus ou moins la ralit du
terrain, selon le niveau de formation des enquteurs et la
qualit du travail de prparation effectu : si les quotas
que lon impose lenquteur refltent correctement la
structure de la zone quil a exploiter, le bon enquteur
ralise rapidement la srie dinterviews qui lui sont
confies
16

Ralisation du plan de sondage


Quota marginaux ou quotas croiss ?

La plupart des enqutes ralises adoptent


des quota marginaux
Lorsquil dispose de quotas marginaux lenquteur travaille
beaucoup plus rapidement, mme si le risque de se faire
piger par des fins de quotas irralisables le guette
Ce risque est souvent moins fort lorsque lon doit raliser un seul
quota crois
La plupart des enqutes par quotas se font en deux degrs, le
premier degr correspondant un tirage de zone
gographique. Si pour ces units primaires en gnral on
dispose des donnes statistiques marginales, les distributions
croises sont, elles, rarement disponibles
17

Ralisation du plan de sondage


Quels quotas choisir ?

Les quotas doivent tre :


Pertinents et lis aux variables dintrt, notamment
dans les enqutes ad hoc
Connus au niveau gographique le plus fin possible
(sources statistiques disponibles)
Aisment identifiables en termes de recherche sur le
terrain et de validation en dbut dinterview
Indpendants entre eux : si deux quotas sont
indpendants, lventuelle dformation de lun
nimplique pas la dformation de lautre
Aussi peu nombreux que possible : le contrle dautres
variables lies au sujet des lenqute peut toujours tre
opr par post-stratification (redressement)
18

Peut-on se fier aux chantillons par quotas ?

Quoique empirique, la mthode des quotas peut donner des


rsultats trs satisfaisants

Elle prsente lavantage dtre plus rapide et moins


coteuse que lenqute alatoire
En raison des risques de biais dont elle est affecte,
elle doit faire lobjet dune prparation minutieuse
sur le plan statistique : sources utilises, dfinition des critres
de recherche, dfinition des critres de redressement
Au niveau du terrain : slection et formation adquates des
enquteurs, clart des documents, prcision des consignes de
travail
19

Bibliographie
Ardilly, P. (1994), Les techniques de sondage, Editions Technip,
Paris
Chapitre II.6. Sondages empiriques

Deroo, M., Dussaix,A.-M. (1980), Pratique et analyse des enqutes


par sondage, PUF, Paris
Chapitre 7. Une mthode empirique : la mthode des quota

Dussaix,A.-M., Grosbras, J.-M., (1993), Les sondages : principes et


mthodes, PUF, Paris (Que sais-je ? n701)
Chapitre 5. La mthode des quotas

Jacquart, H. (1988), Qui ? Quoi ? Comment ? ou la pratique des


sondages, Eyrolles, Paris
Chapitre 6. Lchantillon par quotas ou chantillon proportionnel
20

LES PANELS
Panel= chantillon permanent dindividus
interrogs rgulirement sur leurs
comportements ou leurs opinions
z Quelques exemples:
z

z
z
z
z
z
z

Panels de consommateurs
Panels de distributeurs
Panels de tlspectateurs
Echantillon dmographique de lINSEE (700 000)
Enqutes emploi, loyers et charges (INSEE)
Panels de professionnels: mdecins, pharmaciens,
dentistes, agriculteurs.
1

PANELS :
CONSOMMATEURS ou DISTRIBUTEURS ?
PANEL DE CONSOMMATEURS
PANEL DE CONSOMMATEURS
Permet de connatre ce qui achet :
- quantits,
prix achet :
Permet de connatre
ce qui
- prom
otion (?)
- quantits,
prix
- acheteurs
- promotion
(?) : profils

- acheteurs : profils

PANEL DE DISTRIBUTEURS
Permet de connatre ce qui est vendu :
PANEL DE DISTRIBUTEURS

- quantit, prix
- prom
otion
Permet de connatre
ce
qui est vendu :
- circuits, enseignes

- quantit, prix
- promotion
- circuits, enseignes
C.Chevallier IRI-Secodip
PAPANEL DE CONSOMMATEURS

Un Rapide Historique des Panels

1929 : le premier panel dtaillant aux USA


cre par Arthur Charles Nielsen

1959 : le premier panel dtaillant en France


cr par Nielsen

1954 : le premier panel de consommateurs en France


cre par Stafco

1969 : cration de Scodip


= fusion de Stafco et Ccodis

1994/95 : la rvolution du Scanning

C.Chevallier IRI-Secodip

Les Socits de Panels Consommateurs


Scodip

le panel Consoscan scannris de 8000 foyers


qui a remplac depuis le 01/95 deux panels
traditionnels
un panel de 1000 foyers avec bbs de 0 36 mois
un panel de 3300 automobilistes
Nielsen

le panel Homescan scannris


C.Chevallier IRI-Secodip

Metascope SOFRES
z

Metascope
Le Mtascope est un Access Panel constitu d'un chantillon de 30 000 foyers, soit 80 000
individus, reprsentatifs de la population des mnages franais en termes de :
rgion, habitat, profession,
catgorie sociale du chef de mnage,
ge du chef de mnage,
nombre de personnes au foyer.
La base de sondage est consulte mensuellement par voie postale l'aide d'un questionnaire
auto-administr. Elle est renouvele hauteur de 6 000 foyers par an, par douzime
mensuel. Les panlistes sont recruts en face--face domicile, par tlphone, ou par voie
postale partir de fichiers spcifiques pour toucher des cibles larges ou trs fines.
Automobile / Transports
Descriptif et suivi du Parc Automobile
Le financement des automobiles
Suivi des achats de pneus
Description et suivi du Parc des deux-roues moteur
Banques / Assurances
Baromtre des contrats d'assurance dtenus par les foyers : Assurance Fidlit Transfert
Suivi de l'impact des actions publicitaires des banques et des compagnies d'assurances
Suivi du march des ouvertures de comptes
Suivi des comportements, besoins et attentes des PME-PMI l'gard de la banque
5

Equipement de la maison
Suivi des achats de revtements de sols, d'arts de la table et ustensiles de cuisson
Grande Consommation : alimentaire / entretien / hygine-beaut
Etudes d'image et attitudes
Test de produits ou de concepts
Carnets de comportement
Pharmacie / Sant
Suivi des achats de lunettes correctrices, solaires et lentilles de contact
Profil, descriptif du profil, des comportements d'achats et des habitudes des utilisatrices de soin
du corps
Tourisme / Loisirs
Descriptif des jardins et suivi des achats
Suivi de la demande touristique des Franais
Suivi des achats de photos d'identit, de livres, de cassettes vido
Suivi des achats de cartes routires, de guides touristiques, atlas et plans de ville

Audience tl (Mdiamtrie)

Objectifs
z
z
z
z
z
z
z

Fournir des estimations des parametres de la population


diffrentes priodes
Fournir des estimations sur une priode de temps
Mesurer des volutions
Mesurer des composantes dvolution au niveau
individuel
Agrger des donnes au niveau individuel sur une
priode donne
Mesurer des frquences, des dures pendant une
priode donne
Cumuler des chantillons
8

Panels ou chantillons
indpendants?
z

Un panel
-

Limite les erreurs dobservation dues aux


dfaillances de la mmoire
Donne une meilleure prcision pour mesurer
des volutions

Cas de deux enqutes successives,


avec mmes units
z

Diffrence de moyennes
Estimation de m2-m1 (mmes variances, grands chantillons, taux
de sondage faible)

Panel efficace si >0


10

Cas de deux enqutes successives,


avec mmes units (2)
z

Diffrence de moyennes
Test dvolution
H0 m2=m1
H1 m2 m1
Test de Student pour donnes apparies

11

Cas de deux enqutes successives,


avec mmes units (3)
z

Diffrence de pourcentages
Test de Mc Nemar
exemple: on interroge deux reprises, aprs une action, 600
clients dune socit pour connatre leur taux de satisfaction.
La proportion de satisfaits est passe de 41.7% 46.7% . Sil
sagissait de deux chantillons indpendants de 600 individus,
cette diffrence ne serait pas juge significative.
On commettrait une grave erreur en appliquant les formules des
chantillons indpendants : il faut ici connatre pour chaque
individu son tat aux deux enqutes, que lon peut rsumer par
le tableau de contingence 2x2 croisant les effectifs des deux
variables.
12

Cas de deux enqutes successives,


avec mmes units (4)
z

Diffrence de pourcentages
Test de Mc Nemar
T1
satisfaits
Non satisfaits

T2 Satisfaits
200
80

Non satisfaits
50
270

Mais pour tester la significativit de cette diffrence, il faut


en ralit comparer les effectifs des individus ayant
chang davis.

13

Cas de deux enqutes successives,


avec mmes units (5)
z

Test de Mc Nemar (suite)

T1
satisfaits
Non satisfaits

T2 Satisfaits
p11
p21
p.1

Non satisfaits
p12
p1.
P22
P2.
p.2

H0 : p1. = p.1
Comme p1. =p11 + p12 et p.1=p11+p21 H0 revient tester p12 = p21
test du khi-deux : sous lhypothse nulle p12 = p21 est estim
par (n12+n21)/2

14

Cas de deux enqutes successives,


avec mmes units (6)
z

Test de Mc Nemar (fin)

La statistique de test est donc :

Qui se simplifie en :

( n12 n21 )

n12 + n21
n12 + n21

n12
+ n21

2
2

n12 + n21
2

n12 + n21

On compare cette quantit un 21 , ou sa racine carre une variable


normale centre rduite.
Ici on trouve

( n12 n21 ) =
n12 + n21

80 50
= 2.63
80 + 50

augmentation significative de la satisfaction.


15

Biais et problmes lis aux panels


z

Biais de slection
z Recrutement
z Non-rponses

(lassitude)

Biais de conditionnement
z Effet

de panel (apprentissage)

Naissance dindividus (dfaut de couverture)


z Solution: renouvellement du panel

16

Renouvellement partiel dun panel


z

Pour estimer m2-m1 :


z En

z
z

thorie

si >0: pas de renouvellement


si <0: renouvellement total

Pour estimer m2:


z Utiliser

linformation de la vague 1
z k taux de renouvellement
z Estimateur combinaison linaire de lestimation
la vague 2 de la partie nouvelle, et dun estimateur
par rgression sur la partie reconduite
z k optimal > 50%
17

Les panels

Oliviero Marchese, janvier 2004

Les panels

Des panels pour quoi faire ?


Les utilisations les plus appropries
Questions pour un panel
Panels et chantillons ad hoc
Recrutement des panels
Gestion des panels
Contrles qualit
Vrais et faux panels
Peut-on se fier aux panels ?
Bibliographie
2

Des panels pour quoi faire ?

Llment distinctif des tudes utilisant des panels


cest de collecter les mmes donnes de faon rpte
auprs dun mme chantillon reprsentatif de la
population de rfrence
Le plus souvent ces donnes sont de nature
comportementale plus quattitudinale
La frquence de la collecte ainsi que les outils
employs dpendent :
du sujet de lenqute
de lutilisation des donnes
du niveau de prcision recherch
du budget disponible
du rythme de reporting demand
3

Les utilisations les plus appropries

Par rapport des chantillons indpendants, des


mesures rptes sur les mmes rpondants produisent
des rsultats plus prcis pour ce qui est des volutions
tudies
Les panels rendent galement possibles des analyses
de parcours individuels (volutions dans le temps de
comportements micro)
Ils constituent un instrument privilgi pour limiter les
erreurs dobservation sur les questions faisant appel
la mmoire des individus
Par leur caractre priodique, les panels permettent de
relever linformation juste au moment opportun
4

Questions pour un panel

Qui, Quoi, Combien, A quel prix, O, Quand, Quoi


dautre ? O dautre ?
Quantifier
sur de larges chantillons
au travers de mesures rptes dans le temps
avec une frquence raisonnablement leve
pour des utilisateurs multiples

Panels et chantillons ad hoc


Dune faon gnrale ce qui bon pour tout chantillon
est bon pour un panel
Dfinition prcise de la population de rfrence
Base de sondage adquate
Plan de sondage efficace
Mode de collecte appropri
Choix de redressement pertinent

Il y a cependant des rgles spcifiques respecter


Une fois les lments constitutifs tablis, il vaut mieux ne plus
y toucher
Si des biais viennent tre connus, souvent il est prfrable de
les garder inchangs plutt que chercher les corriger
Les rgles de maintenance du panel doivent faire lobjet dune
tude rigoureuse ds le dpart

Dabord il sagit de minimiser le biais, ensuite de le


maintenir constant
6

Recrutement des panels (1/4)


Aprs avoir dcid du plan dchantillonnage
slectionn lchantillon
contact les individus slectionns et avoir dcrit les
tches accomplir
faut-il encore recevoir laccord des panlistes et
sassurer de leur collaboration
Les trois premiers points ne diffrent gure entre panels
et chantillons ad hoc
les taux de rponse sont comparables ceux obtenus pour ces
derniers

Le dernier est spcifique au recrutement des panels


mme sil varient en fonction de la complexit des tches et du
temps demand au panlistes, les taux de recrutement des
panels sont souvent bien infrieurs aux taux de rponse des
enqutes ad hoc
7

Recrutement des panels (2/4)


Lors du recrutement des panlistes, il nest jamais
souhaitable de minimiser les tches accomplir
Cela ne peut que se traduire par un taux dabandon plus fort
lors des premires expriences du panliste (comme cela arrive
aux enquteurs qui, en phase de contact, trichent sur la
dure du questionnaire)
Cela fini par coter cher, crer des problmes de gestion du
panel et accentuer les difficults rencontres pour le maintien
de la reprsentativit du panel

Le dimensionnement du dispositif de recrutement doit


prendre en compte les sous-populations les plus
difficiles recruter (par leur raret ou par leur faible
propension participer ce type dtude)
Afin dviter trop de contacts inutiles dans les cibles les
plus faciles, les phases de qualification ( screening ) et de
recrutement sont souvent spares
8

Recrutement des panels (3/4)


Compte tenu des faibles taux de recrutement et de leur forte
variabilit selon les catgories de population, le mode
dchantillonnage retenu le plus souvent est celui par quotas
Cest une pratique courante que davoir recours un
establishment survey , parfois ralis lors dtudes
omnibus. Cela fourni un chantillon de contacts
parfaitement qualifis pour le recrutement proprement dit,
qui a lieu dans un deuxime temps
La conformit des pratiques de recrutement avec le code
ESOMAR comme avec les rglementations nationales
(Informatique et Libert, ) est un point ne pas ngliger :
droits daccs, scurit des donnes, primtre dutilisation
des donnes des panlistes,
9

Recrutement des panels (4/4)

Selon les ressources disponibles et le type de


recrutements raliser, le mode de contact peut tre le
courrier, le tlphone, le face face, le on-line ou un mix
de plusieurs modes
Le choix du mode de contact dpend galement du type
de formation spcifique requise pour le panliste

10

Gestion des panels (1/4)


Le recrutement dun panel est une affaire trs coteuse.
Sassurer du niveau de collaboration le plus lev
possible de la part des panlistes constitue lenjeu
majeur de la gestion de panel
La continuit et la cohrence de la collecte dpendent de
cette relation de collaboration quil convient de lier avec
le panliste
La relation avec les panlistes est fonde sur un contrat
qui doit tre respect par les deux parties
Il faut sabstenir de demander aux panlistes des tches qui
nont pas t dfinies lors du recrutement
Il faut galement sabstenir daugmenter le temps convenu
11

Gestion des panels (2/4)

Les incentives ne doivent pas tre perus comme la


rmunration dun travail (principe du volontariat); ils
ne doivent pas non plus tre perus comme drisoires
Ils doivent primer la qualit et la rgularit de la
collaboration et doivent inciter le panliste prolonger
la dure de la relation
Les incentives ne doivent pas tre en relation avec le
thme de ltude, ni tre de nature modifier le
comportement des panlistes au cours du temps

12

Gestion des panels (3/4)


La communication est galement un lment important
de la relation avec les panlistes
Lutilisation de newsletters ou de sites internet ddis est
devenue monnaie courante dans lanimation des panels
Dautres formes de communication, tels que des serveurs
vocaux interactifs ou des contacts avec des animateurs
(tlphoniques ou en face face) sont galement utiliss

Elle doit valoriser lintrt des rsultats obtenus grce au


panel
Elle peut accomplir des fonctions utilitaires telles que
rappeler des dates ou des moments importants de la vie
du panel et/ou servir la formation continue des
panlistes, en illustrant les meilleures pratiques
13

Gestion des panels (4/4)

Dfinition du contrat
attribution des incentives
animation
frquence de sollicitation
modalits des recrutements complmentaires
purge des non-rpondants
constituent les moments forts de la gestion des panels

14

Contrles qualit
La qualit dun panel est toujours juge sur la
cohrence des volutions mesures
La conformit des pratiques des panlistes aux
consignes donnes est un lment primordial de la
qualit du recueil
Des procdures de prcaution et de contrle trs strictes
doivent tre mises en uvre durant toute la dure de vie
dun panel
Souvent les donnes collectes auprs dun panliste qui vient
dtre recrut ne sont pas exploits
Les pratiques atypiques (par rapport la moyenne de
lchantillon ou lhistorique de lindividu) font lobjet de
validation auprs des dclarants
La consommation de produits de base est galement
vrifie et constitue une source de contrle indirect des
donnes collectes
15

Vrais et faux panels

Access panels , mgabases

Des panels comme rpertoires dadresses qualifies


la drive des rpertoires dadresses qualifies
prsents comme panels

16

Peut-on se fier aux panels ? (1/2)

Les erreurs de couverture touchent les panels ni plus ni


moins que les chantillons ad hoc
Les problmes lis la non-rponse complte ou
partielle se posent souvent de faon plus aigue dans
les panels
Mais cest surtout sur le terrain des erreurs de mesure que
les panels connaissent les plus grandes difficults

17

Peut-on se fier aux panels ? (2/2)

Le mot panel peut recouvrir des ralits trs varies


Depuis la notion dchantillon permanent permettant de
mieux estimer des volutions
celle dchantillon prt lemploi donnant accs des
sous-populations rares pour la ralisation denqutes ad
hoc
le chemin est long.
Mais la frontire avec les mgabases devrait rester
infranchissable, un peu comme celle sparant
lchantillon par quota de lchantillon de volontaires.
18

Bibliographie

Ardilly, P. (1994), Les techniques de sondage, Editions Technip,


Paris
Chapitre IV.3.1. Les panels

Deroo, M., Dussaix,A.-M. (1980), Pratique et analyse des enqutes


par sondage, PUF, Paris
Chapitre 8. Les panels

Pinet,B. (1980), Mthodes et pratique des panels, Technique &


Vulgarisation, Paris
Blanchard,D., Lesceux, D., (1995), Les panels. De la guerre des
panels la rvolution du scanning, Dunod, Paris

19

Mthodes denqute
Les tudes on-line

Oliviero Marchese, janvier 2004

Les tudes on-line


Pourquoi maintenant ?
Un dveloppement majeur
Les fondamentaux restent les mmes
Un auto-administr dun genre nouveau
Les dfauts de couverture
La participation et ses cueils spcifiques
Lchantillonnage : comment fait-on ?
Les systmes CAWI
Principales caractristiques
Limites actuelles

Autour des systmes CAWI


Les interactions avec les sites
Le suivi on-line des tudes

Des structures de cot indites


Bibliographie
2

Pourquoi maintenant ?

Il y a cinq ans

tout le monde en parlait


rares taient ceux qui en faisaient

Aujourdhui
Les technologies commencent arriver maturit
Les taux dquipement commencent tre convenables
En entreprise
Dans les mnages

Les clients des instituts en demandent

Un dveloppement majeur

Le on-line constitue un dveloppement majeur dans la


mthodologie denqute, dune importance comparable
lapplication de la thorie de lchantillonnage dans
les annes 1940 ou au dveloppement des tudes par
tlphone dans les annes 1970
Dconnexion des cots du recueil de la taille dchantillon
Rduction des dlais du recueil
limination des frontires dans le recueil des donnes

Les fondamentaux restent les mmes

Instrument Plan de sondage


Couverture
de mesure
Taille
(questionnaire) dchantillon

Participation

Un auto-administr dun genre nouveau

Des possibilits nouvelles


Interaction dynamique avec la personne interroge
Filtres, aiguillages, tirages alatoires,
Aide et instructions en ligne
Longues listes ditems, pour codification immdiate
Images et sons

et des risques nouveaux


Dpendance du butineur, de la dfinition de lcran, du dbit
de la liaison lInternet,
Dpendance de la dextrit informatique de la personne
interroge

Les dfauts de couverture (1/3)

Pour les tudes en population gnrale la couverture reste


largement insuffisante
Des biais persistants
++ jeunes
++ hommes
++ instruits
++ professions suprieures

Absence de bases de sondage


(listes exhaustives des populations de rfrence)

Les dfauts de couverture (2/3)

Pour certaines populations spcifiques la couverture peut


tre tout fait correcte
Visiteurs de sites Web
Professeurs universitaires
Dcideurs informatiques
Salaris dentreprises connectes lInternet

Les dfauts de couverture (3/3)

Des problmes difficiles restent rsoudre


Adresses multiples
Pas de correspondance un un mnage <> adresse

Manque de standardisation des adresses


Impossibilit de gnrer des adresses au hasard

La participation et ses cueils spcifiques

Ras-le-bol des pop-up


Junk mail (spam)
Tarification de la liaison lInternet
Dans de nombreux cas, la personne interroge paie pour
rpondre (sic!)

Dbit de la liaison lInternet


Parfois cest vraiment trop long, et lon peut avoir envie de
laisser tomber (ou de ne pas y aller)

10

Lchantillonnage : comment fait-on ? (1/2)

Plusieurs mthodologies disponibles :


E-mailing (personnalis ou pas)
Pop-up
On Entry
On Exit
On Entry / Exit
Avec e-mail automatique

Bandeau
avec rcupration dinformations du site

11

Lchantillonnage : comment fait-on ? (2/2)


Cookies et codes PIN
Cookie sur pop-up
Pas de re-prsentation aprs acceptation / refus

Cookie sur questionnaire


Reprise du questionnaire en cours
Pas de double remplissage (sur un mme poste)

Attention ! Parfois les navigateurs sont configurs pour


refuser les cookies
Code PIN
Identification de panlistes
Remplissage du questionnaire en plusieurs fois
12

Les systmes CAWI


Principales caractristiques (1/2)
Tout type de question
Simple
Multiple
Quantit
Ouverte

Droulements complexes
Prsentation ditems en alatoire
normal
prioritaire
pondr

Prsentation de questions en alatoire


Prsentation de blocs de questions en alatoire
Droulement horizontal de questions
13

Les systmes CAWI


Principales caractristiques (2/2)
Affichage de tableaux question/sous-questions sur un mme cran)
Affichage de plusieurs questions par cran
Support questionnaires multi-langues
Ouverture plusieurs technologies Internet
Ct serveur
ASP
PHP

Ct client
Applet Java
Java script (ne ncessite pas de machine Java)
HTML
WAP
Flash
14

Les systmes CAWI


Limites actuelles

Limitation du nombre de contacts simultans


par le nombre de licences (connexions autorises) ct serveur
par la puissance des serveurs

Possibilits de mise en page encore limites


Tout ou presque est possible, mais par programmation

15

Autour des systmes CAWI


Les interactions avec les sites

Off-line
Alignement sur la charte graphique (logos, fonds, polices)

On-line
Rcupration dinformations depuis le site visit par
linternaute
Visite dun site Web en cours de questionnaire
Visite dun site Wap en cours de questionnaire (Par
mulateur)
Listes additionnelles (Communes, profession)
Intgration de logiciels de trade-off (ACA, )

16

Autour des systmes CAWI


Le suivi on-line des tudes

Suivi de quotas
Tris plat
Tris croiss
Relecture (et codification) des questions ouvertes

17

Des structures de cot indites


Dconnexion (relative) cots / nombre dinterviews
Faible corrlation cots / dure dhbergement du
questionnaire sur le serveur de production
Peu dachats extrieurs (pas denquteurs), cest surtout
le temps pass par les programmeurs qui compte
Les lments clefs :
La charte graphique
Le nombre de langues
La complexit du questionnaire

Bien sr, cela nest vrai quen dehors de lventuel achat


dadresses; et l beaucoup dpend de lorigine des
adresses (panels, mga-bases, fichiers spcifiques, )
18

Bibliographie

Grossnickle, J., Raskin, O. (2001). The Handbook of OnLine Marketing


Research, New York, McGraw-Hill
Dillman, D.A., (2000). Mail and Internet Surveys. The Tailored Design
Method, New York, Wiley
Des donnes de cadrage sur les nouvelles technologies figurent dans le
Tableau de bord de linnovation" (dcembre 2003) dit par le SESSI
http://www.industrie.gouv.fr/sessi/

Le Collge Internet du CESP a publi, en 1997, une terminologie de la


mesure d'audience d'Internet. La dernire version a t finalise courant
mai 2002
http://www.cesp.fr

19

Mthodes denqute
Enqutes en face face, par tlphone,
par voie postale

Oliviero Marchese, fvrier 2004

Enqutes en face face,


par tlphone, par voie postale
La relation enquteur / enqut
Les enqutes en face face
Avantages
Inconvnients

Les enqutes par tlphone


Avantages
Inconvnients

Les enqutes par voie postale


Avantages
Inconvnients

Comparaison des trois mthodes


Autres modes et modes combins
Question darbitrages
Bibliographie
2

La relation enquteur / enqut


Quelle que soit lapproche pistmologique adopte,
objectiviste - renvoyant un charg dtudes neutre et
dtach ou constructiviste - soulignant linteraction invitable
du charg dtudes avec lobjet de son intrt -,
il faut bien admettre que linterrogation par questionnaire
standardis se situe dans le sillage de la premire de ces
deux approches.
Dans ce contexte, linfluence exerce par lenquteur sur
lenqut doit tre minimise.
3

Les enqutes en face face


Avantages
Possibilit de prsentation dlments visuels
chantillons de produits, maquettes de concepts
Descriptions illustres de situations
Annonces publicitaires ( visuels , films)

Utilisation de systmes CAPI (Computer Assisted


Personal Interviewing)
Filtres et aiguillages
Temps dadministration, global et par section
Dates et heures dinterview
Contrle du carnet de route

Possibilit dobtenir des rponses autres que le choix


entres diffrents items

Classement de cartes contenant des descriptions de produits,


selon un niveau dagrment

Possibilit pour lenquteur dobserver directement


lenqut dans son environnement
lments relatifs au logement, au niveau de vie

Les enqutes en face face


Avantages

Taux de participation lenqute gnralement levs


Dpend du nombre de visites
de la dure du questionnaire
de lventuelle rcompense ( incentive ) pour lenqut
et bien sr du mtier de lenquteur

Non rponses partielles contenues


Possibilit de relance ou de clarification par lenquteur

Faibles taux dabandon en cours dinterviews


Sil vous plat, il ne reste quune minute

Les enqutes en face face


Inconvnients
La faon de se prsenter de lenquteur peut engendrer
des refus de participer lenqute
Qualit du contact
Facteurs vestimentaires
Hostilit envers un groupe social, racisme,

La prsence de lenquteur peut influencer les


rponses donnes par lenqut
Recherche dapprobation
vitement de rponses embarrassantes

Les enqutes en face face


Inconvnients
Moindre dispersion de lchantillon

La ncessit de limiter les dplacements des enquteurs


impose un nombre minimum de questionnaires raliser sur
chaque point denqute, ce qui gnre un effet de grappe

Dures de terrain gnralement assez longues


Cela se compte en jours ou en semaines

Lenquteur peut interprter les rponses de lenqut


Perception slective en fonction de ses propres opinions
Attente de rponses probables ou logiques

Possibilit de tricherie de la part de lenquteur

Le mode de paiement de lenquteur, gnralement au


questionnaire complt, peut pousser au crime
Le contrle de 10 20 % des interviews ralises ( backchecks ) limite ces problmes, sans pouvoir les liminer
7

Les enqutes par tlphone


Avantages
Utilisation de systmes CATI (Computer Assisted
Telephone Interviewing)
Filtres et aiguillages
Temps dadministration, global et par section
Dates et heures dinterview
Contrle du carnet de route
Gestion des adresses gre par ordinateur
Fonctionnalits de preview et predictive-dialing

Encadrement rapproch
Facilit de briefing centralis
Prsence de chefs dquipe dans les salles

coutes distance
Rapidit dexcution, surtout pour les enqutes par quotas
Cela se compte en jours, parfois mme en heures
8

Les enqutes par tlphone


Avantages
Taux de participation lenqute gnralement levs
Dpend du nombre dappels
de la dure du questionnaire
de lventuelle rcompense ( incentive ) pour lenqut
et bien sr du mtier de lenquteur

Certaines personnes rpondent au tlphone plus quelles


ne laissent rentrer des inconnus chez elles
Dans des zones o les problmes dinscurit sont le plus ressentis
Le soir, au moment o lon cherche interroger les actifs

Non rponses partielles contenues


Possibilit de relance ou de clarification par lenquteur

Les enqutes par tlphone


Inconvnients
Pas de possibilit de supports visuels
Il ny a que du son

Moindre attention des enquts (la tl allume, les enfants


qui pleurent, )
Ncessit de rduire la dure des questionnaires

Linfluence de lenquteur est rduite par rapport au face


face, mais toujours prsente
Recherche dapprobation
vitement de rponses embarrassantes

Comme en face face, lenquteur peut interprter les


rponses de lenqut
Perception slective en fonction de ses propres opinions
Attente de rponses probables ou logiques

10

Les enqutes par tlphone


Inconvnients
Qualit dcroissante des bases de sondage
Listes rouges
Convergence fixe / mobile

Le recours au Random Digit Dialing constitue une assez


bonne rponse ces problmes

Ras-le-bol des appels non sollicits

Il est relativement facile de filtrer les appels


ou de raccrocher lenquteur

Taux dabandon en cours dinterviews plus lev

Certes lenquteur peut limiter les abandons Sil vous plat,


il ne reste quune minute , mais au tlphone cela lui est
plus difficile quen face face
11

Les enqutes par voie postale


Avantages
Questionnaire auto-administr
La personne interroge peut rpondre son rythme
en choisissant le moment qui lui convient le mieux

Bon contrle de lchantillon (au niveau mnage)


Possibilit dadministrer des questionnaires
comportant de nombreuses questions
Pas de prsence denquteur, donc aucune influence de
celui-ci sur lenqut
Possibilit de prsenter des lments visuels (dessins,
photos, VHS/DVD )
Moins de tricheries possibles
12

Les enqutes par voie postale


Inconvnients
Aucune aide personnalise au remplissage du
questionnaire ni dencouragement en arriver au bout
Pour ce qui est de lassistance, la mise en place dun numro
vert est fortement recommande
Pour lencouragement, lusage d incentives est
gnralement conseill

Limitation dans la complexit du questionnaire,


notamment en ce qui concerne les filtres et les
aiguillages
Non-rponse partielle plus frquente, due labsence
de relance de la part de lenquteur
13

Les enqutes par voie postale


Inconvnients
Obsolescence des listes dadresses
Risque de non ouverture du courrier ou de confusion
avec du courrier publicitaire (souvent jet demble)
Mauvais contrle de lchantillon (au niveau individu)
Lenteur des retours
Structure des rpondants souvent trop haut de
gamme
Plus instruits
Disposant de revenus plus levs
14

Comparaison des trois mthodes


Face face

Tlphone

Voie postale

Taux de
participation

Nombre de
questions

Complexit des
questions

Interaction
enquteur / enqut

Cot de linterview

Rapidit

15

Autres modes et modes combins

Autres modes
Enqutes en salle
en rue ou en sortie | entre de magasin, bureau de vote,
par fax, mail, internet,

et modes combins
Dpt / Rappel ( Drop-off / callback )
Phone / Mail / Phone
Face face, puis internet
Tlphone, puis internet
Voie postale, puis internet

La liste est longue et amene changer tous les jours.


16

Question darbitrages
Le choix dune mthode denqute nest pas toujours une
vidence.
Dans labsolu, cela na pas de sens daffirmer la supriorit dune
mthode sur une autre
Le sujet de ltude, le budget, les dlais, constituent un systme
de contraintes parfois difficile apprhender.
Il est toujours question darbitrages.
Lart du sondeur consiste trouver chaque fois la meilleure
solution adopter ;
ou parfois simplement la moins mauvaise.
17

Bibliographie

Lebart, L., d. (1992), La qualit de linformation dans les


enqutes, Paris, Dunod
Corbetta, P. (2003). Social Research, Theory, Methods and
Technics, London, Sage
Birn, R., d. (2000), The International Handbook of Market
Research Techniques, Second Edition, London, Kogan Page

18