Sunteți pe pagina 1din 7

ESTIMATION

Introduction

L’estimation consiste à donner la valeur la plus probable d’une grandeur. C’est le problème
inverse de l’échantillonnage. On dispose de renseignements sur un ou plusieurs échantillons et
on cherche à connaître des informations sur la population mère.

On peut faine deux types d’estimation :

- L’estimation ponctuelle qui consiste à proposer une valeur pour la grandeur considérée,

- L’estimation par intervalle de confiance qui donne la probabilité que la grandeur soit
comprise dans un intervalle donné.

On remarque que la probabilité qu’une estimation ponctuelle soit parfaitement exacte est
nulle, ou enfin voisine de zéro. Il y a donc lieu quand c’est possible, de préférer l’estimation
par intervalle de confiance.

I- Estimation ponctuelle :
Considérons un échantillon aléatoire simple (X1,….,Xn) dont une réalisation est (x1,…xn)

La définition d'un estimateur T d’un paramètre θ est très vague. Si θ = φ(x1,…xn) est une
estimation du paramètre θ nous ne retiendrons que les estimateurs T= φ(X1,….,Xn) ayant de
bonnes propriétés dont les deux principales sont les suivantes:

Définition: Un estimateur T d'un paramètre  est dit sans biais si et seulement si E(T) = 

Définition: Un estimateur T d'un paramètre  est dit convergent si et seulement si

Exemples importants

a) Estimateur de la moyenne :

est un estimateur sans biais et convergent d'une moyenne 

b) Estimateur de la variance :
1
S*2 ∑𝑛𝑖=1( 𝑋𝑖 − ̅̅̅
𝑋)2 est un estimateur sans biais et convergent de la variance σ2.
𝑛−1

c) Estimateur d’une proportion p:

(dans le cas particulier où les Xi suivent des lois de Bernouilli de paramètre p) est un
estimateur sans biais et convergent d'une proportion p.

II-Estimation par intervalles de confiance :


Soit E = (X1, ..., Xn) un échantillon issu d'une distribution inconnue.
Soit  un paramètre de cette distribution, et * une estimation de la valeur de ce paramètre.
Il est possible de "coiffer" cette estimation par un segment tel qu'il soit possible d'affirmer
que ce segment recouvre la vraie valeur 0 (inconnue) du paramètre avec une probabilité P.
Ce segment s'appelle un intervalle de confiance associé à l'estimation *. Ses extrémités
sont des variables aléatoires qui ne dépendent que de l'échantillon (donc des "statistiques").
La longueur de l'intervalle de confiance est donc une mesure de l'incertitude sur la position
réelle de la vraie valeur 0 du paramètre estimé.

Définition :
La probabilité P, arbitrairement choisie, est notée (1 - ), et s'appelle le niveau de confiance
de l'intervalle de confiance. Les valeurs le plus souvent choisies pour  sont 0,05 et 0,01,
correspondant aux niveaux de confiance 95% et 99%.
Ainsi, si l'on choisit  = 0,05, l'intervalle de confiance correspondant a une probabilité égale
à 0,95 de contenir la vraie valeur 0 du paramètres estimé

Remarque : - Pour un échantillon donné, la taille de l'intervalle de confiance dépend du


niveau de confiance choisi.
-Un intervalle de confiance se traduit par une formule du type :

P {a < 0 < b}= 1 - 


Cas d’un échantillon gaussien


loi de la population Statistique Loi


Paramètre
N(0 ; 1)
à estimer ² connu
Normale
̅ − 𝝁)
√𝒏(𝑿 Student (n-1)
Moyenne : ² inconnu
m 𝑺∗

~ N(0 ; 1)
² connu
quelconque
n > 30
̅ − 𝝁) ~ N(0 ; 1)
² inconnu √𝒏(𝑿
𝑺∗
Variance :
² à n d.d.l.
 connu
normale
(𝑛−1)𝑆 ∗2 ² à n-1 d.d.l.
 inconnu
𝜎2

Proportion
~ N(0 ; 1)
n > 50

Estimation de la moyenne de la loi normale N(μ ;σ2) :

a) Rechercher un intervalle de confiance d'une moyenne μ d'une population normale


dont la variance ² est connue.

Choix de la statistique: On utilise la statistique qui est un bon estimateur de la moyenne μ


D'après la table de la loi N(0 ; 1), étant fixé, il est possible de trouver u tel que

Si est une observation de sur un échantillon, on peut donc affirmer que

appelé intervalle de confiance, contient la valeur inconnue  avec une probabilité 1-α


Remarque: A priori il existe une infinité de couples (a ; b) vérifiant P[ a < N(0 ; 1) < b] = 1-α
On a pris un intervalle symétrique (-u ; u) car pour une loi symétrique comme la loi
normale, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
𝛼
précision. Ainsi, FN(0,1) (uα) = 1- 2

b) Rechercher un intervalle de confiance d'une moyenne μ d'une population normale dont la


variance ² est inconnue.

Choix de la statistique: On utilise la statistique qui est un très bon estimateur de la


moyenne 𝝁

̅ −𝝁)
√𝒏(𝑿
 suit une loi de Student à n-1 ddl
𝑺∗

D'après la table de la loi de Student, étant fixé, il est possible de trouver t tel que

̅ −𝝁)
√𝒏(𝑿
P [ -tα <  < tα] = 1 –α
𝑺∗
𝑺∗ 𝑺∗
̅ - tα
P[ 𝑿 ̅ + tα
<μ<𝑿 ] = 1- α
√ 𝒏 √𝒏

Si et s* sont des observations de et S* sur un échantillon, on peut donc affirmer que

𝑺∗ 𝑺∗
̅ - tα
[𝒙 ̅ + tα
;𝒙 ] appelé intervalle de confiance contient la valeur inconnue  avec une
√𝒏 √𝒏
probabilité 1-

Remarque: A priori il existe une infinité de couples (a ; b) vérifiant P[ a < T(n-1) < b] = 1- .
On a pris un intervalle symétrique (-t ; t) car pour une loi symétrique comme la loi de
Student, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
𝜶
précision. Ainsi, FTn-1 (tα) = 1- 𝟐

Estimation de la variance de la loi normale N(μ ;σ2) :

a) Rechercher un intervalle de confiance d'une variance d'une population normale dont


la moyenne est connue.

Choix de la statistique: On utilise la statistique suivante :

De plus,

D'après la table de la loi du ² , étant fixé, il est possible de trouver a et b tels que

Si xi sont les observations sur un échantillon, on peut donc affirmer que

,
appelé intervalle de confiance, contient la valeur inconnue ² avec une probabilité 1-

Remarque: en fait il existe une infinité de couples (a ; b) vérifiant

La loi du ² n'étant pas symétrique, on montre que l'intervalle d'amplitude minimale est
obtenu en prenant a et b tels que

b) Rechercher un intervalle de confiance d'une variance σ2 d'une population normale dont la


moyenne est inconnue.
Choix de la statistique: On utilise la statistique S² qui est un bon estimateur de la variance.

𝒏𝑺𝟐 (𝒏−𝟏)𝑺∗𝟐
= suit la loi du Chi-deux à n-1 d.d.l
𝝈𝟐 𝝈𝟐

D'après la table de la loi du ² , étant fixé, il est possible de trouver a et b vérifiant :

𝒏𝑺𝟐
P( a< <b ] = 1-α
𝝈𝟐

𝒏𝑺𝟐 𝒏𝑺𝟐
P[ < 𝝈𝟐 < ] = 1- α
𝒃 𝒂

Si s² est une observation de S² sur un échantillon, on peut donc affirmer que

𝒏𝑺𝟐 𝒏𝑺𝟐
[ ; ] , appelé intervalle de confiance, contient la valeur inconnue ² avec une
𝒃 𝒂
probabilité 1-α

Remarque: en fait il existe une infinité de couples (a ; b) tels que :

.
La loi du ² n'étant pas symétrique, on montre que l'intervalle d'amplitude minimale vérifie

Estimation d’une proportion :


Rechercher un intervalle de confiance d'une proportion p à partir d'un échantillon de grande
taille.

Choix de la statistique: On utilise la statistique F qui est un bon estimateur d'une proportion p.

D'après la table de la loi  , étant fixé, il est possible de trouver u tel que
Si f est une observation de F sur un échantillon, on obtient

On remplace p par une estimation ponctuelle f, et on obtient l’intervalle de confiance suivant

𝛼
La fonction de répartition de la loi Normale centrée réduite en uα vaut 1- 2 .

S-ar putea să vă placă și