Documente Academic
Documente Profesional
Documente Cultură
. Théorie de l’estimation
Michaël Genin
Université de Lille 2
EA 2694 - Santé Publique : Epidémiologie et Qualité des soins
michael.genin@univ-lille2.fr
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
4. Résumé
Point étudié
2. Estimation ponctuelle
4. Résumé
Notations préliminaires
Point étudié
2. Estimation ponctuelle
4. Résumé
Problématique
Résumer une loi → Moyenne (µ) et Variance (σ 2 ) dans la plupart des cas.
Problème
Dans la plupart des cas, impossible de considérer P dans son ensemble
On utilise un échantillon de n individus de P
Hypothèse forte : On considère que l’échantillon est tiré au hasard (i.e. chaque
individu a la même probabilité d’être tiré).
Point étudié
2. Estimation ponctuelle
4. Résumé
.
Définition
.
Soit X un caractère étudié sur une population P et E une expérience aléatoire qui
consiste à tirer un individu au hasard dans P.
On associe à E la v.a. X d’une certaine loi.
On réalise n fois la même expérience E , dans des conditions indépendantes.
L’ensemble {X1 , X2 , ..., Xn } de n v.a. i.i.d. de même loi que X est un échantillon
aléatoire.
.
Population
Caractère étudié : X
Moyenne : µ
Variance : σ 2
Echantillon 1
{x11 , x12 , . . . , x1n }
Réalisation de {X1 , X2 , . . . , Xn }
n réalisations indépendantes de X
.
La théorie de l’estimation permet d’extrapoler (inférence statistique) les
caractéristiques d’un échantillon à la population.
En d’autres termes : l’estimation consiste à déterminer les caractéristiques (µ, σ 2 ,
...)
. inconnues de la population à partir des données d’un échantillon.
2 types d’estimation :
Estimation ponctuelle
Estimation par intervalle de confiance
Point étudié
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
4. Résumé
Point étudié
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
4. Résumé
Echantillon 1
{x11 , x12 , . . . , x1n }
.
. Objectif : estimer µ et σ 2
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 12 / 73
Estimation ponctuelle Notion d’estimateur
1∑ 1∑
n n
x̄ = xi 2
sech = (xi − x̄)2
n n
i=1 i=1
Population
Population
Caractère
Caractère étudié
étudié : X (X)
: Taille
Moyenne
Moyenne :: µµ
Variance :: σσ22
Variance
Echantillon 1
{x11 , x12 , . . . , x1n }
1∑ 1∑
n n
x̄ = xi 2
sech = (xi − x̄)2
n n
i=1 i=1
Population
Population
Caractère
Caractère étudié
étudié : X (X)
: Taille
Moyenne
Moyenne :: µµ
Variance :: σσ22
Variance
Moyenne obs. : x̄1 Moyenne obs. : x̄2 Moyenne obs. : x̄3 Moyenne obs. : x̄k
1 2 3 k
Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech
1∑ 1∑
n n
x̄ = xi 2
sech = (xi − x̄)2
n n
i=1 i=1
1∑ 1∑
n n
X̄ = Xi 2
Sech = (Xi − X̄ )2
n n
i=1 i=1
Population
Population
Caractère
Caractère étudié
étudié : X (X)
: Taille
Moyenne
Moyenne :: µµ
Variance :: σσ22
Variance
Moyenne obs. : x̄1 Moyenne obs. : x̄2 Moyenne obs. : x̄3 Moyenne obs. : x̄k
1 2 3 k
Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech
1∑ 1∑
n n
x̄ = xi 2
sech = (xi − x̄)2
n n
i=1 i=1
1∑ 1∑
n n
X̄ = Xi 2
Sech = (Xi − X̄ )2
n n
i=1 i=1
.
Définition
.
Soit {X1 , X2 , ..., Xn } un échantillon aléatoire de taille n. Les Xi sont i.i.d. selon
une loi de probabilité de paramètre θ.
On appelle estimateur de θ toute v.a. fonction des Xi :
. T = f (X1 , X2 , ..., Xn )
Sur un échantillon tiré {x1 , x2 , ..., xn }, T fournit une réalisation qui est une
estimation ponctuelle de θ :
.
. θ̂ = f (x1 , x2 , ..., xn )
Exemple :
∑n
T = X̄ = n1 i=1 Xi (Estimateur)
∑n
µ̂ = x̄ = n1 i=1 xi (Estimation)
Point étudié
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
4. Résumé
.
Convergence
.
Un estimateur est dit convergent si :
lim T = θ
. n→∞
.
Biais
.
Le biais d’un estimateur est défini par :
B(T ) = E [T − θ]
.
Qualités d’un bon estimateur
.
Un estimateur efficace doit être de préférence :
Convergent
Sans biais
. De variance minimale
Remarques
Si deux estimateurs T1 et T2 d’un paramètre θ sont convergents et sans
biais, on choisira l’estimateur qui a la variance la plus faible
On peut préférer un estimateur biaisé d’une faible variance à un estimateur
non biaisé.
T1 T2
T1
T2
E[T1 ] = E[T2 ] = θ
Point étudié
2. Estimation ponctuelle
Notion d’estimateur
Propriétés d’un estimateur
Estimation d’une moyenne, variance, proportion
4. Résumé
1∑
n
X̄ = Xi
n
i=1
1∑
n
X̄ = Xi
n
i=1
µ̂ = x̄
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 27 / 73
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
1∑
n
X̄ = Xi
n
i=1
1∑
n
X̄ = Xi
n
i=1
.
A retenir
.
σ2
E [X̄ ] = µ V [X̄ ] =
. n
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 28 / 73
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
Correction : 1 - Si µ est connue :
[ 2 ]
E Sech =
[ 2 ]
E Sech =
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
Correction : 1 - Si µ est connue :
[ n ]
[ 2 ] 1∑
E Sech =E (Xi − µ) =
2
n
i=1
[ 2 ]
E Sech =
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
Correction : 1 - Si µ est connue :
[ n ] [ n ]
[ 2 ] 1∑ 1 ∑ 2 2µ ∑ 1∑ 2
n n
E Sech =E (Xi − µ) = E
2
Xi − Xi + µ
n n n n
i=1 i=1 i=1 i=1
[ 2 ]
E Sech =
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
Correction : 1 - Si µ est connue :
[ n ] [ n ]
[ 2 ] 1∑ 1 ∑ 2 2µ ∑ 1∑ 2
n n
E Sech =E (Xi − µ) = E
2
Xi − Xi + µ
n n n n
i=1 i=1 i=1 i=1
[ 2 ] 1 ∑
n
[ ] 2µ ∑
n
E Sech = E Xi2 − E [Xi ] +µ2 =
n n | {z }
i=1 i=1
=µ
1∑
n
2
Sech = (Xi − µ)2 ,
n
i=1
2
.est un estimateur convergent et sans biais de σ uniquement si µ est connue.
2
Exercice : Montrer que Sech est un estimateur non biaisé de σ 2 uniquement si µ
est connue.
Correction : 1 - Si µ est connue :
[ n ] [ n ]
[ 2 ] 1∑ 1 ∑ 2 2µ ∑ 1∑ 2
n n
E Sech =E (Xi − µ) = E
2
Xi − Xi + µ
n n n n
i=1 i=1 i=1 i=1
[ 2 ] 1 ∑
n
[ ] 2µ ∑
n
1 ∑
n
[ ]
E Sech = E Xi2 − E [Xi ] +µ2 = E Xi2 − µ2
n n | {z } n
i=1 i=1 i=1
=µ
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
Donc
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
Donc
E [X 2 ] = σ 2 + µ2
Finalement :
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
Donc
E [X 2 ] = σ 2 + µ2
Finalement :
[ 2 ] 1∑ n
[ ]
E Sech = E Xi2 − µ2
n
i=1
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
Donc
E [X 2 ] = σ 2 + µ2
Finalement :
[ 2 ] 1∑ n
[ ]
E Sech = E Xi2 − µ2
n
i=1
[ 2 ]
E Sech =
[ 2 ]
E Sech =
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
Donc
E [X 2 ] = σ 2 + µ2
Finalement :
[ 2 ] 1∑ n
[ ]
E Sech = E Xi2 − µ2
n
i=1
[ 2 ] 1∑ n
( 2 )
E Sech = σ + µ2 − µ2
n
i=1
[ 2 ]
E Sech =σ 2 + µ2 − µ2 = σ 2
2
Donc si µ est connue alors Sech est un estimateur sans biais de σ 2 .
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 30 / 73
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
[ ]
[ 2 ] 1∑ 1∑ [ ] 1∑
n n n
E Sech =E (Xi − µ) =
2
E (Xi − µ) =
2
V [Xi ] = σ 2
n n n
i=1 i=1 i=1
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ 2 ]
E Sech =
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ]
[ 2 ] 1∑
n
E Sech =E (Xi − X̄ ) =
2
n
i=1
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ] [ n ]
[ 2 ] 1∑ 1∑ 2 1 ∑ [ 2] [ ]
n n
E Sech =E (Xi − X̄ ) = E
2
Xi − X̄ =
2
E Xi − E X̄ 2
n n n
i=1 i=1 i=1
Par définition :
{
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ] [ n ]
[ 2 ] 1∑ 1∑ 2 1 ∑ [ 2] [ ]
n n
E Sech =E (Xi − X̄ ) = E
2
Xi − X̄ =
2
E Xi − E X̄ 2
n n n
i=1 i=1 i=1
Par définition :
{
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ] [ n ]
[ 2 ] 1∑ 1∑ 2 1 ∑ [ 2] [ ]
n n
E Sech =E (Xi − X̄ ) = E
2
Xi − X̄ =
2
E Xi − E X̄ 2
n n n
i=1 i=1 i=1
Par définition :
{
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
2
V [X̄ ] = σn = E [X̄ 2 ] − E [X̄ ]2 = E [X̄ 2 ] − µ2
Donc {
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ] [ n ]
[ 2 ] 1∑ 1∑ 2 1 ∑ [ 2] [ ]
n n
E Sech =E (Xi − X̄ ) = E
2
Xi − X̄ =
2
E Xi − E X̄ 2
n n n
i=1 i=1 i=1
Par définition :
{
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
2
V [X̄ ] = σn = E [X̄ 2 ] − E [X̄ ]2 = E [X̄ 2 ] − µ2
Donc {
E [X 2 ] = σ 2 + µ2
1∑
n
2
Sech = (Xi − X̄ )2
n
i=1
[ ] [ n ]
[ 2 ] 1∑ 1∑ 2 1 ∑ [ 2] [ ]
n n
E Sech =E (Xi − X̄ ) = E
2
Xi − X̄ =
2
E Xi − E X̄ 2
n n n
i=1 i=1 i=1
Par définition :
{
σ 2 = V [X ] = E [X 2 ] − E [X ]2 = E [X 2 ] − µ2
2
V [X̄ ] = σn = E [X̄ 2 ] − E [X̄ ]2 = E [X̄ 2 ] − µ2
Donc {
E [X 2 ] = σ 2 + µ2
2
E [X̄ 2 ] = σn + µ2
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 32 / 73
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
[ 2 ]
E Sech =
[ 2 ]
E Sech =
1∑
n
2
Sech = (Xi − X̄ )2 ,
n
i=1
2
.est un estimateur biaisé de σ (sous-estimation).
Michaël Genin (Université de Lille 2) Théorie de l’estimation Version - 30 octobre 2015 33 / 73
Estimation ponctuelle Estimation d’une moyenne, variance, proportion
1 ∑
n
S2 = (Xi − X̄ )2
n−1
i=1
2
.est un estimateur convergent et sans biais de σ
.
Remarques
.
Remarquons que
n
S2 S2 =
n − 1 ech
Si n est grand, les deux estimateurs donnent des résultats très proches.
.
Vocabulaire
Ecart-type de l’échantillon
v
u n
u1 ∑
sech =t (xi − x̄)2
n
i=1
Soit π une proportion d’un caractère dans une population que nous cherchons à
estimer.
(Exemple : proportion de femmes dans la population française).
Soit K une v.a. discrète distribuée selon une loi binomiale B(n, π).
(Exemple : K associe à un échantillon de taille n le nombre de femmes.
.
Théorème
.
La fréquence observée dans un échantillon de taille n constitue le meilleur
estimateur de π (Loi des grands nombres)
K
F =
n
Point étudié
2. Estimation ponctuelle
4. Résumé
Point étudié
2. Estimation ponctuelle
4. Résumé
Introduction
L’estimation ponctuelle d’un paramètre (moyenne, variance, proportion) peut
varier d’un échantillon à l’autre.
Population
Population
Caractère
Caractère étudié
étudié : X (X)
: Taille
Moyenne
Moyenne :: µµ
Variance :: σσ22
Variance
Moyenne obs. : x̄1 Moyenne obs. : x̄2 Moyenne obs. : x̄3 Moyenne obs. : x̄k
1 2 3 k
Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech Variance obs. : s2ech
Introduction
L’estimation ponctuelle d’un paramètre (moyenne, variance, proportion) peut
varier d’un échantillon à l’autre. On dit qu’elle ne prend pas en compte les
fluctuations d’échantillonnage.
Il est nécessaire de lui associer un intervalle qui contient, avec une certaine
probabilité, la vraie valeur du paramètre dans la population.
Définition
Définition
Loi de l’estimateur T
α α
1−α
2 2
θ−" θ θ+"
Définition
Rappel
Théorème ”Central - Limite” (T.C.L.)
Rappel
Théorème ”Central - Limite” (T.C.L.)
Contexte : Epreuves répétées caractérisées par une suite X1 , X2 , ..., Xn de v.a. i.i.d..
E [Xi ] = µ et V [Xi ] = σ 2 .
∑n
Soit Sn = i=1 Xi et Zn la variable centrée-réduite :
Sn − nµ
Zn = √
σ n
.
Théorème
.
∀x, la fonction de répartition Fn (x) = P(Zn ≤ x) est telle que
lim Fn(x) = Φ
n→∞
Distribution d’échantillonnage de X̄
.
Théorème (Grands échantillons)
.
Soit X une v.a. continue de moyenne µ et de variance σ 2 . En utilisant le T.C.L.,
on montre que :
( )
σ X̄ − µ
X̄ −→ N µ, √ ou encore √ −→ N (0, 1)
n→∞ n σ/ n n→∞
Distribution d’échantillonnage de X̄
.
Théorème (Petits échantillons)
.
On suppose que X ∼ N (µ, σ 2 ). Alors :
( )
σ
Si σ 2 est connue alors X̄ ∼ N µ, √
n
X̄ − µ
√ ∼ Tn−1 d.d.l.
s/ n
.
Distribution d’échantillonnage de F
.
Théorème
.
Soit π la proportion d’un caractère dans une population. D’après le T .C .L. on
montre que : ( √ )
π(1 − π)
F −→ N π,
n→∞ n
.
En pratique, cette approximation est valable lorsque :
Point étudié
2. Estimation ponctuelle
4. Résumé
−z1−α/2 0 z1−α/2
Autre Démonstration
Autre Démonstration
Exemple
On suppose que le taux de cholestérol dans une population est distribué selon un
loi normale de paramètres inconnus µ et σ.
De cette population est extrait un échantillon de 20 personnes. La moyenne
empirique du taux de cholestérol est de x̄ = 1.8 et l’écart-type empirique
(déviation standard) est égal à s = 0.1.
Exemple
Nous sommes dans le cadre d’un petit échantillon n = 20 < 30
La distribution normale du taux de cholestérol dans la population est
supposée.
La variance dans la population σ 2 est inconnue mais estimée par s 2
[ ]
95% s s
ICµ = x̄ − t1−α/2;n−1 √ ; x̄ + t1−α/2;n−1 √
n n
t1−α/2;n−1 = t0.975;19 = 2.093
95%
ICµ = [1.75; 1.85]
Point étudié
2. Estimation ponctuelle
4. Résumé
.
Intervalle de confiance d’une moyenne
.
σ 2 connue (rare)
[ ]
1−α σ σ
ICµ = x̄ − z1−α/2 √ ; x̄ + z1−α/2 √
n n
Exemple
On désire estimer la taille moyenne (cm) des hommes en France. On sait que son
écart-type σ = 14.
Exemple
Φ(z0.95 ) = 0.95
N (0, 1)
5% 90% 5%
−z0.95 0 z0.95
z0.975 ≈ 1.96
Donc l’intervalle de confiance a pour valeur :
[ ]
95% 14 14
ICµ = 175 − 1.96 √ ; 175 + 1.96 √
100 100
95%
ICµ = [172.3; 177.7]
z0.995 ≈ 2.58
Donc l’intervalle de confiance a pour valeur :
[ ]
99% 14 14
ICµ = 175 − 2.58 √ ; 175 + 2.58 √
100 100
99%
ICµ = [171.4; 178.6]
90%
ICµ = [172.7; 177.3]
95%
ICµ = [172.3; 177.7]
99%
ICµ = [171.4; 178.6]
Plus le seul de confiance est élevé, plus la taille de l’IC est importante.
Retour à l’exemple :
Point étudié
2. Estimation ponctuelle
4. Résumé
.
Intervalle de confiance d’une proportion
.
Si n ⩾ 30 et min{nπ̂, n(1 − π̂)} > 5
[ √ √ ]
1−α π̂(1 − π̂) π̂(1 − π̂)
ICπ = π̂ − z1−α/2 n
; π̂ + z1−α/2
n
.
Exemple
Exemple
95%
ICπ = [0.4423; 0.6377]
Exemple
La taille de l’échantillon n’est pas assez importante pour avoir une précision
permettant de se prononcer sur la victoire de A
[ √ ]
95% π̂(1 − π̂)
IC π = π̂ ± z1−α/2
n
π̂ = 0.54
Il faudrait une précision de l’IC ≤ 0.03 pour pouvoir tirer une conclusion.
√
π̂(1 − π̂)
z1−α/2 ≤ 0.03
n
( )2
π̂(1 − π̂) 0.03
≤
n z1−α/2
π̂(1 − π̂) 0.54 × 0.46
n≥ ( )2 = ( 0.03 )2 ≈ 1061
0.03
z1−α/2 1.96
Point étudié
2. Estimation ponctuelle
4. Résumé
1−α
h i
ICµ = x̄ − z1−α/2 √σn ; x̄ + z1−α/2 √σn
connue
σ2
n ≥ 30
inconnue 1−α
h i
Moyenne mais estimée par ICµ = x̄ − z1−α/2 √sn ; x̄ + z1−α/2 √sn
d’une va. continue s2
X ∼ L(µ, σ 2 )
1−α
h i
ICµ = x̄ − z1−α/2 √σn ; x̄ + z1−α/2 √σn
n < 30 connue
On suppose que
X ∼ N (µ, σ)
σ2
inconnue
mais estimée par
s2 1−α
h i
ICµ = x̄ − t1−α/2;n−1 √sn ; x̄ + t1−α/2;n−1 √sn
n ≥ 30, min{nπ̂, n(1 − π̂)} > 5
q q
Proportion 1−α
π
ICπ = π̂ − z1−α/2 π̂(1−π̂)
n ; π̂ + z1−α/2 π̂(1−π̂)
n