Documente Academic
Documente Profesional
Documente Cultură
2003-2004
UV CNAM 18323 - STATISTIQUE B8
Intervenants : G.Saporta (CNAM), O.Marchese (IPSOS), S.Rousseau (INSEE)
Plan :
10 octobre : Introduction GS+OM
17 octobre : sondage alatoire simple GS
24 octobre: sources d'erreur et biais OM
31 octobre: sondages probabilits ingales GS
7 novembre : algorithmes de tirage GS
10 novembre: stratification GS
21 novembre: sondages deux degrs et grappes GS
28 novembre : donnes manquantes et fusions de fichiers GS
5 dcembre: Redressement (quotient, rgression post-strates) GS
12 dcembre: Effets et pratique des redressements OM
9 janvier: la mthode des quotas OM
16 janvier: panels GS
23 janvier: panels OM
30 janvier: mthodes d'enqute OM
6 fvrier : mthodes d'enqute OM
Rfrences
http://cedric.cnam.fr/~saporta/
http://www.agro-montpellier.fr/cnam-lr/statnet/
http://www.ipsos.fr/
http://www.cbs.nl/isi/iass/
P.ARDILLY
Les techniques de sondage (ditions Technip, 1994)
A.M. DUSSAIX, J.M. GROSBRAS Exercices de sondages (Economica, 1992)
A.M. DUSSAIX, J.M. GROSBRAS Les sondages (Que sais-je? N701, 1996)
Y.TILLE
Thorie des sondages (Dunod, 2001)
ENQUETES et SONDAGES
UV 18323 - STATISTIQUE B8
2003-2004
Gilbert SAPORTA
Chaire de Statistique Applique
Conservatoire National des Arts et Mtiers
292 rue Saint Martin
75141 Paris cedex 03
saporta@cnam.fr
http://cedric.cnam.fr/~saporta
1
INTRODUCTION
z Aperu
du secteur
statistique
publique
CNIS
INSEE 7 000 employs
400
Instituts privs
(10 000 employs, dont 4 000 permanents)
CA 2001: 1.275 milliards (+6.25%)
2
INTRODUCTION
Progression du CA des membres de Syntec
Marketing et Opinion
INTRODUCTION
z
Histoire rcente
1895
1925
Jensen
1934
1952
1936
Election de Roosevelt
1938
Fondation de lIFOP
1965
Ballottage De Gaulle
INTRODUCTION
Objectifs et
contraintes
Base de sondage
Conception du
questionnaire
chantillonnage
Collecte des
donnes
Codification
Saisie
Contrles
Estimations
Redressement
Analyse des
donnes
Publications
valuations
Mthodes alatoires:
Plans de sondage
Complexes: - stratifi
- en grappe
- plusieurs degrs
6
Quotas;
Itinraires;
Units types;
Volontariat;
Sondage chaud .
Problmes essentiels:
Slection de lchantillon;
Notations:
Population
ou base de sondage: N
Identifiant:
i
Variable dintrt: Y (Y1, Y2YN)
1
Y=
N
Yi ;
i =1
i=1
1
2
= (Yi Y) ;
N i=1
2
T = Yi
N
1
N 2
2
S=
(Yi Y) =
N1 i=1
N1
2
z
z
chantillons possibles;
quiprobabilit:
Remarque:
Taux de sondage: n = f
i =1
=n
p( s)
s (is )
10
1 si i s
i =
0 si i s
V ( i ) = i (1 i ) cov( i ; j ) = ij i j
N
y
Yi
N
i
l
yi =T = = i
n is
is i
i=1 i
N
Yi
E(Tl ) = E(i ) = Yi = T
i =1 i
yi=variable alatoire;
i =1
11
Variances:
S2
V ( y ) = (1 f )
n
2
S
V (T ) = N (1 f )
n
2
Estimation de S2:
s2 =
1
( yi y )2
n 1 is
E ( s2 ) = S 2
n
s2
V ( y ) = (1 f ) n
2
s
Vn
2
(T ) = N (1 f ) n
12
1 f
1 f
<Y < y+2s
n
n
Yi
1
=
0
Y =P
P(1 P) N
V( p) = (1 f )
n N 1
p(1 p) p(1 p)
Vl ( p) = (1 f )
n 1
n
13
homepage
Sources derreur
Nonsampling errors
Populations dintrt
Dfaut ou excs de couverture
Non-rponse
Erreur de mesure
Non-rponse
Dfaut de collecte de toute ou partie de linformation pour certains
individus de lchantillon
Erreur de mesure
Influence de lenquteur sur les rponses des personnes interroges
Incapacit (ou manque de volont) des personnes interroges rpondre
aux questions : mmoire, imprparation, facteurs psychologiques,
Dfauts de linstrument de mesure (questionnaire ou autre)
Effets du mode de recueil (face face, tlphone, auto-administr papier
ou Internet)
Moralit
Les efforts visant affiner une mthode de tirage ou lexpression dun
estimateur pour obtenir un gain de prcision peuvent savrer bien
illusoires si, par ailleurs, les erreurs dobservation, les dfauts de
couverture ou la non-rponse sont importants
Dans une telle situation, une taille dchantillon trs importante ne sera
pas non plus de nature viter la droute
Lors de la Prsidentielle amricaine de 1936, le vote de paille organis
par le Literary Digest - portant sur prs de deux millions de lecteurs donnait une confortable avance Alfred Landon (54%) alors que
Franklin Roosevelt allait recueillir 61% des suffrages !
Nonsampling errors :
Populations dintrt
Population objet de linfrence (population of inference)
Ensemble des units tudier
Non-rponse
divergences entre frame et survey population
Erreurs de couverture
divergences entre frame et target population
Kish, L., Populations for Survey Sampling, Survey Statistician, No. 1, fvrier 1979, pp.14-15
Nonsampling errors :
Dfaut ou excs de couverture {1/2}
Ambigut du reprage des units de la population
Une base de sondage se doit pour le moins dtre une liste didentifiants
de bonne qualit
Manque dexhaustivit
Chaque unit faisant partie du champ de lenqute doit tre prsente dans
la liste des identifiants
Doubles comptes
Aucune unit doit tre prsente plusieurs fois dans la base (surtout si le
nombre de fois nest pas connu)
Nonsampling errors :
Dfaut ou excs de couverture {2/2}
Lerreur de couverture est une fonction
de la proportion de population non couverte par la base de sondage
de la diffrence dans la valeur de la variable dintrt entre frame et
target population
Lerreur de couverture
est lie la variable dintrt
nest pas une proprit de lchantillon
9
Nonsampling errors :
Non-rponse {1/3}
Comme pour le dfaut de couverture d au manque dexhaustivit de
la base de sondage, la non-rponse
nous met dans limpossibilit dobserver la valeur de la variable dintrt
engendre un biais non mesurable, puisque lon ne sait pas si les units
observes sont comparables aux units non observes
Nonsampling errors :
Non-rponse {2/3}
Le taux de non-rponse est souvent interprt comme LA
mesure de qualit de lestimation de la variable dintrt
or, il ne sagit que dune composante de lerreur et ne peut pas en
donner seul la mesure
Nonsampling errors :
Non-rponse {3/3}
Une expression plus complte de la variable dintrt
estime devrait tre
y r = yn
Nonsampling errors :
Erreur de mesure
Il y a erreur de mesure lorsque la valeur de la variable dintrt
collecte pour un individu est diffrente de la vraie valeur attache ce
mme individu. Quelques cas (liste non ordonne et non exhaustive !) :
Questions faisant appel la mmoire des personnes interroges
Questions portants sur des sujets sensibles (revenus, comportements
sexuels, consommation de drogues, )
Mcanismes psychologiques lis linteraction enquteur/enqut
Interprtation des rponses de la part de lenquteur
Suggestions de lenquteur lenqut
Mauvaise comprhension de la question (surtout en cas de traduction
des questions depuis une langue trangre)
Formulation de la question, effets dordre,
Fatigue due la dure dinterviews
Autres effets enquteur : le sexe, lge de lenquteur, sa faon de se
prsenter ne sont pas sans consquences sur la qualit des
rponses obtenues
13
Couverture
Non-rponse
chantillonnage
Erreurs de mesure
Saisie
Codification
Traitement
Prsentation
Conception du
questionnaire
Objectifs et
contraintes
Base de sondage
chantillonnage
!!! Choix du mode de
collecte le plus appropri et
contrle des enquteurs !!!
!!! Contrles de cohrence,
contrles de qualit de la
codification et de la saisie !!!
14
L art du sondeur
La thorie statistique nous aide mesurer et rduire
lerreur dchantillonnage
Lart du sondeur, praticien denqute, consiste juger
de limportance du non mesurable
La pratique de cet art require la comprhension
des causes qui sont lorigine des erreurs
de leur importance relative
des effets gnrs
des cots relatifs aux efforts de rduction des erreurs
15
Lecture minimale
Ardilly, P. (1994), Les techniques de sondage, Editions Technip,
Paris
Chapitre I. Aspects universels, principes de base
16
14
Tl = ai yi =aY
i ii
is
i =1
i=1
i=1
E(Tl ) = aY
i i E(i ) = aiiY i
N
aii =1
i =1
15
l 1
Y =
N
yi
i s
16
17
18
Si N est inconnu:
N
N = 1
i =1
N =
is
Do:
E (
is
)=N
19
Estimateur de Hajek:
Y =
i s
i s
yi
20
Un cas gnant:
Yi = C
Yi C
1
ly = 1
=
N is i N is i
Comme
z
Mais:
is
alors
ly C
E(ly) = C
21
Variance:
N
Yi2
V(Tl ) =
i=1
Yi Yj
(1i ) +
i j
ij
i j )
Yi Yj
1
l
V(T) = (
i j ij )
2 i j i j
N
22
i j s
i jij
Deuxime formule:
2
yi yj
n 1
i j ij
V(T) =
2 i, js i j ij
23
24
i =
nxi
N
x
i =1
z Exemple:
25
Exactitude
Taille fixe
Gnralit
Sans remise
26
Algorithme rapide
Squentiel
27
i =
1 j
29
STRATIFICATION
z
Utilisation dune
information auxiliaire
qualitative
z Toujours efficace
P2
P1
S1
PH
kj
S2
30
STRATIFICATION, notations
z
Strates:
N 1 , N 2 ......N h .......N H
N=Nh
Y1 , Y 2 .......Y h .......Y H
Y =
, .... .....H
2
1
2
2
2
h
chantillon:
P1
S1
kj
S2
Nh
Yh
N
2
Nh 2
Nh
= h + (Yh Y )
N
N
2
n1,n2,.........nh,...........nH
n =nh
y1,y2,........yh,...........yH
nh
y = yh
n
12,22,.....h2............H2
P2
PH
31
STRATIFICATION
2
Nh 2
Nh
= h + (Yh Y ) =2W +2B
N
N
2
Variance totale=
moyenne des variances (variance intra)
+variance des moyennes (variance inter)
32
STRATIFICATION
z
Nh
Ystr =
yh
N
z
Variance:
2
2
N
N
h
h
h Nh nh
V (Ystr ) = V ( yh ) =
N
h=1 N nh Nh 1
H
Sh2
1 H
= 2 Nh (Nh nh )
N h=1
nh
33
STRATIFICATION, rpartition
proportionnelle
z
H
N
nh
h
Ystr = yh = yh = y = Yprop
h =1 N
h =1 n
34
STRATIFICATION, rpartition
proportionnelle
z
variance :
2
H
H
1
S
1
Nh nh
h
V (Yprop ) = 2 Nh ( Nh nh )
= 2
Nh Sh2
N h=1
nh N h=1 nh
H
H
1 H Nh
1
N
N
n
Nh 2
2
2
Sh
= 2 ( 1)Nh Sh = 2 ( 1)Nh Sh =
N h=1 nh
N h=1 n
nN h=1 N
Si est faible:
2
H
H
N
n
N
N
n
N
N
2
2
h
h
w
V (Yprop ) =
S
=
h nN
h
nN h=1 N
N
N n
h=1
35
STRATIFICATION, rpartition
proportionnelle
z
N n
N
N
36
STRATIFICATION optimale
z
Rpartition optimale:
1
m
V (Ystr ) = 2
N
avec
Sh
N h ( N h nh ) 2
Sh
nh
Nh
=
h2
Nh 1
N h (N h nh
m in
nh
nhch = c0
Nh 2 2
2
S
N
S
n h
h h
h
fixe
)S
2
h
37
STRATIFICATION optimale
z
Solution:
N h2 S h2
n h2
nh
Nh
proportionnel ch
Sh
ch
Si ch constant:
N h Sh
nh = n
- Rpartition de Neyman
N h Sh
38
STRATIFICATION
Nh
3750
3272
1387
2475 10 884
nh
50
45
30
30
yh
12.6
14.5
18.6
13.8
h2
2.8
2.9
4.8
3.2
155
39
STRATIFICATION
z
Exemple n 1:
2
3750x12.6 + ..... + 2475x13.8
N
= 14.21
Y = h yh =
10884
N
V (Y )
2
l
Nh h
2
0
.0
2
0
5
9
(
0
.1
4
)
=
=
N nh
2
154662 3047
40
STRATIFICATION
z
Exemple n 1:
Nh 2
Nh
2
= h + (Yh Y )
N
N
nh l 2
h
On estime: par
n h 1
2
h
Y h par y h
Y par
2
2
l
= 6.06 = ( 2.46 )
41
STRATIFICATION
z
N1S1 = 6275
N2S2 = 5572
N3S3 = 3038
N4S4 = 4427
19 312
1 Nh ( Nh nh ) 2
2
Variance: 2
Sh = 0.0029 = ( 0.0542)
N
nh
T connu + 1179
42
STRATIFICATION
z
N 1
= 0.0055 = ( 0.0742)
43
STRATIFICATION
z
Comment stratifier?
z Remarque
zNombre
zRpartition
STRATIFICATION
zVariable
de strates optimales:
45
STRATIFICATION
Estimation dune proportion p
z Mme dmarche: une proportion est une
moyenne particulire
z
p str =
h =1
Nh
fh
N
2
N h ph (1 ph ) N h nh
V ( pstr ) =
N
nh
Nh 1
h =1
H
nh
N h f h (1 f h )
V ( p str )
1
N
n
N
h =1
h
h
46
Mais:
z
i =1
Ti =
Ni
j =1
Y i j - total de lUP ni
47
Ni
is ni
jSi
yij
2
2
S
n
S
m
M
2
,
i
2
i
1
Tl = M 1
N i 1
+
M
m
m
N
i
i n
( )
V a r ia n c e
in t e r
UP
1
S =
Ti T
M 1 i=1
2
1
V a r ia n c e
in t r a
UP
S2,i
Ni
1
=
Yij Y i
Ni 1 i=1
48
S12
estim par
1 l Tl
2
s1 =
Ti
m1 i=1 M
m
Ni
ni = n0
N
Ni
N i m n0m
=
E ( ns ) = E ( n0 ) = n0
N
N M
M
iSi
kU i
49
Sondage autopondr:
Nj
n0 mn0
i =
=
m
N Nj
N
z
Y = y
50
51
SONDAGE EN GRAPPES
Cas gnral :tirage de grappes probabilits
ingales
z
Ti
T =
m
Estimation du total:
i =1
1 m NiYi
y=
N i =1 i
52
SONDAGE EN GRAPPES
z
M
l
T =
m
T
i s
()
Ni
kU i
2
S
m
V Tl =M2 1 1
M m
m Nm
=
M
M
M1 m
y=
NY
i i
m N i=1
53
SONDAGE EN GRAPPES
Tirage de grappes probabilits
proportionnelles la taille
z
N
i = m i
N
m
1
y = yi
m i =1
m
1
Ni
2
V ( y) =
m
y
y)
(1
)(
i
m(m 1) i =1
N
Ni m m
E (ns ) = E ( N i ) = N i
=
M
M
iSi
iU i
2
N
i
i =1
54
MTHODES DE REDRESSEMENT OU DE
PONDRATION
zPrincipe:
MTHODES DE REDRESSEMENT OU DE
PONDRATION
Estimation par le quotient ou redressement par
variable quantitative
Exemple:
chantillon de 80 hypermarchs - On veut estimer
le CA moyen Y
On a y =110,2MF
On sait que le nombre moyen X de caisses dans la
population des hypermarchs est 28.
Dans lchantillon
x = 28.8
z
28
Y=110.2 =107.1
28.8
56
Formule gnrale:
X
yq = y
x
57
Calcul du biais:
y Y
y
y Y +Y
Y
= X
=Y
yq = X
x
xX + X
x X
1+
X
1+
Dveloppement limit:
y Y
yq Y 1 +
Y
2
y Y x X y Y x X x X 2
x X x X
+
+
1
Y 1+
Y
X
Y
X X
X
X
58
(y )
q
cov x; y
Y 1
XY
) + V ( x )
X
Nn X
XY
( )
Biais en 1/n.
Biais nul si la droite de rgression passe par 0.
59
N n 2
Y
Y 2 2
N n 1 n 2
E ( yq Y ) =
zi
Avec
zi = yi rxi
o r =
y
x
60
s xy
N n s x2
E (r) R +
R 2
Nn
X
XY
61
yr
yr = y + b X x
62
Post-stratification; redressement
sur critre qualitatif
Exemple:
n=1000; on veut estimer le pourcentage de
frquentation du cinma.
On saperoit que la frquentation du cinma
est lie la posssession de TV.
On sait que tl = 80%.
63
Oui
Non
Total
Oui
20
680
700
(800) X 8/7
Non
80
220
300
(200) x 2/3
Total
100
900
Aprs redressement:
Cinma
Tele
Oui
23 777
800
Non
53 147
200
Total
76 924
64
(RAS)
CALMAR de lINSEE
65
1
ypost = Nh yh
N
21-35
36-50
15%
30%
30%
6000
9000
15.000
>50
25% y = 11.100
12.000
66
( )
V ypost =V E(Y / nh ) + E V (Y / nh )
Nh
Nh Nh nh 2
Nh 2 1 1
=
=
V
y
S
N h N N n h N Sh n N
h
h h
( )
Nh 2
N Sh
En prenant lesprance:
2
Nh 2 1 1 Nh 2
N Sh E n N N Sh
h
67
Calcul de
Nh
Ph =
N
nh
ph =
n
1
E
nh
ph Ph
nh
nh = n = nph = n ( ph Ph + Ph ) = nPh 1+
n
P
h
Dveloppement limit
1
1
1
=
p h Ph
nh
n Ph
1 +
P
h
ph Ph ph Ph
1 1
1
2
1 + =
1
+
nh nPh
nPh
Ph
Ph
68
En prenant lesprance :
E ( ph ) = Ph
N n
V ( ph ) =
Ph (1 Ph )
Nn
1
1
N n Qh
E
=
1 +
2
n
nP
N
n
P
h
h
h
( )
V ypost
1 N n Qh 1
2
= P S + 2 PS
h h
nP
Nn
P
N
h
h
2 2
h h
N n
1 N n
2
2
=
P
S
+
Q
S
h h
h h
Nn
n Nn
( )
V ypost
1 f Nh 2 1 f Nh 2
=
Sh + 2 1 Sh
n
n N
N
69
zN
grand
z (N-Nh)/N petit donc grandes strates
z Effectifs Nh connus
70
MTHODES DE REDRESSEMENT OU DE
PONDRATION
Remarque:
ne
variance est plus petite si le critre de poststratification est trs li la variable dintrt, si n
est grand et sil ny a pas trop de strates.
71
Premire technique:
On tire ou sort dans une urne avec boules
blanches et 1- boules noires la question
Si blanc: question A: Avez-vous fraud le fisc?
Si noire: question A: Je nai pas fraud
On veut estimer PA.
On recueille = Proba de Oui = PA + (1 )(1 PA )
72
l % de Oui
l (1 )
l=
P
A
2 1
( )
l =
VP
A
PA (1PA) 1 (1)
l
V
+
2
2
n
n
( 21)
( 21)
1
()
73
Deuxime technique:
Si blanche, question A sensible
Si noire, question B banale
= PA+ PB (1)
l (1 ) P
B
l=
P
A
(1) PB (1 PB )(1)
l
V PA
+
2
n
n2
( )
Prcisions de langage
Redresser pour quoi faire ?
Une pratique quil ne faut pas banaliser
Redresser sur quoi et comment
Le choix des critres
Les contrles oprer
Prcisions de langage
Extrapolation
Le poids comme coefficient dextrapolation : passage des
effectifs chantillon aux effectifs population
Pondration
Redistribution de poids effectif chantillon constant,
visant corriger une sur/sous -pondration de strates
dcide lors de ltablissement du plan de sondage
Redressement
Redistribution de poids effectif chantillon constant gnralement fonde sur des critres multiples -, visant
corriger une sur/sous -reprsentation de catgories de la
population constate a posteriori
10
11
Bibliographie
12
Critique de la mthode
Biais dchantillon
Impossibilit de calculer lerreur dchantillonnage
Si cest aussi compliqu
pourquoi continue-t-on ?
Principe de la mthode
Point de dpart et but recherch
Principe de la mthode
Caractre intuitif de la mthode
Principe de la mthode
A quoi ressemble une feuille de quotas ?
10 interviews
Auprs dlecteurs inscrits
Rpartition
des
interviews
1 2 3 4 5 6 7 8 9 10
Sexe
Homme
12345
Femme
12345
18 34 ans
123
35 49 ans
12
50 64 ans
12
65 ans et plus
123
Agriculteur
1234
123
Age
CS de la personne interroge
Principe de la mthode
La recherche des personnes interroger
Critique de la mthode
Biais dchantillon
Critique de la mthode
Impossibilit de calculer lerreur dchantillonnage
Critique de la mthode
Si cest aussi compliqu
Critique de la mthode
pourquoi continue-t-on ?
10
11
12
Il est important de contrler les variables sociodmographiques susceptibles dtre corrles aux
variables dintrts
Le secteur dactivit conomique doit galement tre
contrl, en imposant des quotas priori ou par poststratification (redressement)
Il faut toujours se mfier du syndrome du perroquet,
lorsquil sagit de dfinir les variables que lon souhaite
contrler par des quotas
13
14
15
Bibliographie
Ardilly, P. (1994), Les techniques de sondage, Editions Technip,
Paris
Chapitre II.6. Sondages empiriques
LES PANELS
Panel= chantillon permanent dindividus
interrogs rgulirement sur leurs
comportements ou leurs opinions
z Quelques exemples:
z
z
z
z
z
z
z
Panels de consommateurs
Panels de distributeurs
Panels de tlspectateurs
Echantillon dmographique de lINSEE (700 000)
Enqutes emploi, loyers et charges (INSEE)
Panels de professionnels: mdecins, pharmaciens,
dentistes, agriculteurs.
1
PANELS :
CONSOMMATEURS ou DISTRIBUTEURS ?
PANEL DE CONSOMMATEURS
PANEL DE CONSOMMATEURS
Permet de connatre ce qui achet :
- quantits,
prix achet :
Permet de connatre
ce qui
- prom
otion (?)
- quantits,
prix
- acheteurs
- promotion
(?) : profils
- acheteurs : profils
PANEL DE DISTRIBUTEURS
Permet de connatre ce qui est vendu :
PANEL DE DISTRIBUTEURS
- quantit, prix
- prom
otion
Permet de connatre
ce
qui est vendu :
- circuits, enseignes
- quantit, prix
- promotion
- circuits, enseignes
C.Chevallier IRI-Secodip
PAPANEL DE CONSOMMATEURS
C.Chevallier IRI-Secodip
Metascope SOFRES
z
Metascope
Le Mtascope est un Access Panel constitu d'un chantillon de 30 000 foyers, soit 80 000
individus, reprsentatifs de la population des mnages franais en termes de :
rgion, habitat, profession,
catgorie sociale du chef de mnage,
ge du chef de mnage,
nombre de personnes au foyer.
La base de sondage est consulte mensuellement par voie postale l'aide d'un questionnaire
auto-administr. Elle est renouvele hauteur de 6 000 foyers par an, par douzime
mensuel. Les panlistes sont recruts en face--face domicile, par tlphone, ou par voie
postale partir de fichiers spcifiques pour toucher des cibles larges ou trs fines.
Automobile / Transports
Descriptif et suivi du Parc Automobile
Le financement des automobiles
Suivi des achats de pneus
Description et suivi du Parc des deux-roues moteur
Banques / Assurances
Baromtre des contrats d'assurance dtenus par les foyers : Assurance Fidlit Transfert
Suivi de l'impact des actions publicitaires des banques et des compagnies d'assurances
Suivi du march des ouvertures de comptes
Suivi des comportements, besoins et attentes des PME-PMI l'gard de la banque
5
Equipement de la maison
Suivi des achats de revtements de sols, d'arts de la table et ustensiles de cuisson
Grande Consommation : alimentaire / entretien / hygine-beaut
Etudes d'image et attitudes
Test de produits ou de concepts
Carnets de comportement
Pharmacie / Sant
Suivi des achats de lunettes correctrices, solaires et lentilles de contact
Profil, descriptif du profil, des comportements d'achats et des habitudes des utilisatrices de soin
du corps
Tourisme / Loisirs
Descriptif des jardins et suivi des achats
Suivi de la demande touristique des Franais
Suivi des achats de photos d'identit, de livres, de cassettes vido
Suivi des achats de cartes routires, de guides touristiques, atlas et plans de ville
Audience tl (Mdiamtrie)
Objectifs
z
z
z
z
z
z
z
Panels ou chantillons
indpendants?
z
Un panel
-
Diffrence de moyennes
Estimation de m2-m1 (mmes variances, grands chantillons, taux
de sondage faible)
Diffrence de moyennes
Test dvolution
H0 m2=m1
H1 m2 m1
Test de Student pour donnes apparies
11
Diffrence de pourcentages
Test de Mc Nemar
exemple: on interroge deux reprises, aprs une action, 600
clients dune socit pour connatre leur taux de satisfaction.
La proportion de satisfaits est passe de 41.7% 46.7% . Sil
sagissait de deux chantillons indpendants de 600 individus,
cette diffrence ne serait pas juge significative.
On commettrait une grave erreur en appliquant les formules des
chantillons indpendants : il faut ici connatre pour chaque
individu son tat aux deux enqutes, que lon peut rsumer par
le tableau de contingence 2x2 croisant les effectifs des deux
variables.
12
Diffrence de pourcentages
Test de Mc Nemar
T1
satisfaits
Non satisfaits
T2 Satisfaits
200
80
Non satisfaits
50
270
13
T1
satisfaits
Non satisfaits
T2 Satisfaits
p11
p21
p.1
Non satisfaits
p12
p1.
P22
P2.
p.2
H0 : p1. = p.1
Comme p1. =p11 + p12 et p.1=p11+p21 H0 revient tester p12 = p21
test du khi-deux : sous lhypothse nulle p12 = p21 est estim
par (n12+n21)/2
14
Qui se simplifie en :
( n12 n21 )
n12 + n21
n12 + n21
n12
+ n21
2
2
n12 + n21
2
n12 + n21
( n12 n21 ) =
n12 + n21
80 50
= 2.63
80 + 50
Biais de slection
z Recrutement
z Non-rponses
(lassitude)
Biais de conditionnement
z Effet
de panel (apprentissage)
16
z
z
thorie
linformation de la vague 1
z k taux de renouvellement
z Estimateur combinaison linaire de lestimation
la vague 2 de la partie nouvelle, et dun estimateur
par rgression sur la partie reconduite
z k optimal > 50%
17
Les panels
Les panels
10
12
Dfinition du contrat
attribution des incentives
animation
frquence de sollicitation
modalits des recrutements complmentaires
purge des non-rpondants
constituent les moments forts de la gestion des panels
14
Contrles qualit
La qualit dun panel est toujours juge sur la
cohrence des volutions mesures
La conformit des pratiques des panlistes aux
consignes donnes est un lment primordial de la
qualit du recueil
Des procdures de prcaution et de contrle trs strictes
doivent tre mises en uvre durant toute la dure de vie
dun panel
Souvent les donnes collectes auprs dun panliste qui vient
dtre recrut ne sont pas exploits
Les pratiques atypiques (par rapport la moyenne de
lchantillon ou lhistorique de lindividu) font lobjet de
validation auprs des dclarants
La consommation de produits de base est galement
vrifie et constitue une source de contrle indirect des
donnes collectes
15
16
17
Bibliographie
19
Mthodes denqute
Les tudes on-line
Pourquoi maintenant ?
Il y a cinq ans
Aujourdhui
Les technologies commencent arriver maturit
Les taux dquipement commencent tre convenables
En entreprise
Dans les mnages
Un dveloppement majeur
Participation
10
Bandeau
avec rcupration dinformations du site
11
Droulements complexes
Prsentation ditems en alatoire
normal
prioritaire
pondr
Ct client
Applet Java
Java script (ne ncessite pas de machine Java)
HTML
WAP
Flash
14
15
Off-line
Alignement sur la charte graphique (logos, fonds, polices)
On-line
Rcupration dinformations depuis le site visit par
linternaute
Visite dun site Web en cours de questionnaire
Visite dun site Wap en cours de questionnaire (Par
mulateur)
Listes additionnelles (Communes, profession)
Intgration de logiciels de trade-off (ACA, )
16
Suivi de quotas
Tris plat
Tris croiss
Relecture (et codification) des questions ouvertes
17
Bibliographie
19
Mthodes denqute
Enqutes en face face, par tlphone,
par voie postale
Encadrement rapproch
Facilit de briefing centralis
Prsence de chefs dquipe dans les salles
coutes distance
Rapidit dexcution, surtout pour les enqutes par quotas
Cela se compte en jours, parfois mme en heures
8
10
Tlphone
Voie postale
Taux de
participation
Nombre de
questions
Complexit des
questions
Interaction
enquteur / enqut
Cot de linterview
Rapidit
15
Autres modes
Enqutes en salle
en rue ou en sortie | entre de magasin, bureau de vote,
par fax, mail, internet,
et modes combins
Dpt / Rappel ( Drop-off / callback )
Phone / Mail / Phone
Face face, puis internet
Tlphone, puis internet
Voie postale, puis internet
Question darbitrages
Le choix dune mthode denqute nest pas toujours une
vidence.
Dans labsolu, cela na pas de sens daffirmer la supriorit dune
mthode sur une autre
Le sujet de ltude, le budget, les dlais, constituent un systme
de contraintes parfois difficile apprhender.
Il est toujours question darbitrages.
Lart du sondeur consiste trouver chaque fois la meilleure
solution adopter ;
ou parfois simplement la moins mauvaise.
17
Bibliographie
18