Sunteți pe pagina 1din 93

'

Act5120

UQM

Chapitre 1: Rappel de la statistique mathmatique

&

UQM - Chapitre 1.

Page 1 de 93

'

Plan de lexpos

Introduction
Lestimation ponctuelle de paramtres.
Diffrentes mthodes destimation.
Ltude sur la qualit des estimateurs.
Lestimation par intervalle de confiance.
Les tests dhypothses.
Exemples et exercices.
&

UQM - Chapitre 1.

Page 2 de 93

'

Introduction

Pourquoi faut-il un cours sur le modle de survie? La rponse est relativement


simple: parce que les donnes qui servent modliser la dure de vie dun
individu ou dun item donn ou, de faon plus gnrale, le temps avant quun
vnement bien dfini (par exemple dcs, divorce, gurison, rechute, faillite,
panne, emploi, etc), se produise sont souvent incompltes ( i.e. les donnes sont
censures ou tronques). Comme nous voulons effectuer des analyses
statistiques partir de ces donnes, il faut modifier les modles et mthodes
"traditionnels" afin quils puissent composer avec la censure ou la troncation.

&

UQM - Chapitre 1.

Page 3 de 93

'

Commenons avec quelques notions de bases, survenant assez frquemment en


pratique, pour saisir le rle appliqu de la thorie destimation, une composante
importante de la thorie de linfrence statistique.
Pour faire de lestimation dun paramtre, disons , au niveau de la population,
et de rpondre des questions, survenant assez frquemment en pratique, nous
supposons que chaque membre de la population en question possde un
caractre observable X, que la connaissance de X (pour un ou plusieurs
lments) nous donnera de linformation sur , et enfin que la rpartition (des
lments par rapport aux valeurs possibles) de X dpend du paramtre .
Donc, il sagit dobserver un certain nombre de fois, disons n fois, ce caractre
X et extraire linformation sur ce paramtre en question.

&

UQM - Chapitre 1.

Page 4 de 93

'

Plus formellement, nous supposons lexistence dune variable alatoire X


(caractre observable) dont la distribution de probabilit F (x|) (i.e.
rpartition des lments par rapport aux valeurs possibles de X) dpend de
paramtre . Nous reposons le problme destimation de sur n observations
indpendantes sur X, autrement dit sur n variables alatoires indpendantes
X1 , X2 , , Xn suivant une loi identique celle de X. En langage statistique
(ou probabiliste) lorsquon parle dun chantillon alatoire de taille n sur une
variable alatoire X F (x|) on sous-entend n variable alatoire
X1 , X2 , , Xn i.i.d. X (ou i.i.d. F (x|)).

&

UQM - Chapitre 1.

Page 5 de 93

'

Pour obtenir des rsultats prcis et intressants, nous faisons un certain nombre
dhypothses lies lexprience effectue sur la loi commune F (x|) des
variables X1 , X2 , , Xn de lchantillon.
Nous restreindrons notre tude, dans les chapitres 12 et 15, la statistique dite
paramtrique. Dans cette approche, les diffrentes lois considres possibles a
priori pour les variables Xi sont dans la famille paramtrique, cest dire dans
lensemble {F (x|)} de lois de probabilits sur . Nous chercherons alors
dterminer une fonction de rpartition F (x|) qui est en accord avec les
donnes et estimer le paramtre inconnu . Nous tudierons les cas o les
donnes sont compltes et individuelles, groupes, tronques ou censures.
Lorsquon ignore la forme spcifique de la loi inconnue F (x|) et quon na pas
de bonnes raisons pour supposer quelle appartienne telle ou telle famille
paramtrique, nous aborderons alors, dans les chapitres 13 et 14, lanalyse
statistique de ces modles dite non paramtrique.

&

UQM - Chapitre 1.

Page 6 de 93

'

Une statistique

Une statistique (ou une rgle de calcul) calcule partir dun chantillon
alatoire ou dune exprience randomise est une variable alatoire. On appelle
distribution dchantillonnage la loi de probabilit dune statistique.
Exemples:
Pn

Moyenne chantillonnale: T1 =

1
n

Variance chantillonnale: T2 =

1
n1

i=1

Xi = X

Pn

i=1 (Xi

X)2 = S 2

Fonction de rpartition chantillonnale:


1
(Nombres dobservations pour lesquelles Xi x) = Fn (x)
T3 = n
Statistique dordre n: T4 = M ax{X1 , X2 , , Xn } = X(n)
Statistique dordre 1: T5 = M in{X1 , X2 , , Xn } = X(1)
tendue chantillonnale: T6 = X(n) X(1)

&

UQM - Chapitre 1.

Page 7 de 93

'

Chaque ralisation x1 , x2 , , xn de lchantillon alatoire X1 , X2 , , Xn ,


quon appelle les donnes statistiques ou observations, produit une valeur de
chacune des statistiques. Par exemple, les donnes 4,3; 2,2; 2,7; 2,8 produiront
les valeurs X = 3, S 2 = 0, 82, F4 (2, 3) = 0, 25.
Le traitement thorique dun problme dinfrence portant sur une population
X F (x|) consiste choisir une statistique approprie (par exemple,
X , S 2 , Fn (x) etc.) et associer chaque valeur de la statistique choisie une
dcision propos du paramtre. La dcision peut prendre diffrentes formes,
trois desquelles seront traites ici:
1. Estimation ponctuelle: On peut dcider que le paramtre a telle ou telle
valeur.
2. Estimation par intervalle: On peut dcider que le paramtre se trouve
vraisemblablement dans tel ou tel intervalle.
3. Test dhypothses: On peut dcider que la valeur du paramtre est ou
nest pas gale un nombre fix davance.

&

UQM - Chapitre 1.

Page 8 de 93

'

Lestimation ponctuelle consiste trouver un estimateur b dun paramtre


inconnu , cest--dire, une statistique dont les valeurs auraient tendance, en un
certain sens, sapprocher du paramtre. Par exemple, la moyenne
arithmtique
b (X1 , X2 , , Xn ) = X est gnralement utilise comme
estimation de lesprance mathmatique des variables X1 , X2 , , Xn , et la
c2 (X1 , X2 , , Xn ) = S 2 est utilise comme
variance chantillonnale
estimation de leur variance.
Lestimation par intervalle de confiance consiste dterminer deux bornes et
, toutes deux fonctions des observations, et affirmer que le paramtre se situe
entre ces deux bornes. Une telle affirmation peut, bien sr, tre errone, mais
les bornes sont dtermines de faon que la probabilit derreur soit faible.
Un test dhypothse consiste dterminer une rgle pour dcider quand une
hypothse H0 concernant un paramtre doit tre rejete. Par exemple, Rejeter
lhypothse H0 que = 10 si X > 14, 3 est une rgle, ou un test statistique.

&

UQM - Chapitre 1.

Page 9 de 93

'

Estimation ponctuelle

Toute statistique T = T (X1 , X2 , , Xn ) utilise pour faire une estimation


b 1 , X2 , , Xn ).
dun paramtre est appele estimateur de et note (X
Dans certains cas, le choix dun estimateur est naturel et intuitif: nous
estimons la moyenne dune population par la moyenne X de lchantillon; et
nous estimons une probabilit de succs par la proportion de succs dans
lchantillon. Mais il nous faut des critres objectifs pour choisir un estimateur,
car parfois
1) plusieurs estimateurs semblent aussi naturels lun que lautre;
2) aucun estimateur ne se prsente lesprit comme particulirement naturel;
3) certains estimateurs peuvent sembler naturels alors que dautres sont en
fait meilleurs. Un exemple du dernier est le cas dune variance 2 .
Lestimateur le plus naturel premire vue est
S 2

&

n
1X
=
(Xi X)2 ;
n i=1

mais il se trouve que lestimateur S 2 est en un certain sens prfrable.

UQM - Chapitre 1.

Page 10 de 93

'

Lestimateur et lestimation

b 1 , X2 , , Xn ) est une entit alatoire et une


Rsumons, un estimateur (X
b 1 , x2 , , xn ) est une entit fixe quon obtient en utilisant les
estimation de (x
donnes (x1 , x2 , , xn ) sur (X1 , X2 , , Xn ). Lequel faut-il juger,
lestimateur ou lestimation?
Nous savons que cest lestimateur qui produit lestimation, donc il faut
sinterroger sur les qualits de lestimateur. tant donne quun estimateur est
une variable alatoire, on ne peut porter de jugement sur ses qualits et ses
dfauts quen terme probabiliste et/ou frquentiste.
La thorie destimation ponctuelle suggre des techniques destimation avec
leur heuristique (mthode des moindres carrs, vraisemblance maximum,
mthodes des moments, etc...) et propose des proprits objectives (meilleur
que, sans biais, convergent, efficace, asymptotiquement..., etc...) quon pourrait
souhaiter pour un estimateur.

&

UQM - Chapitre 1.

Page 11 de 93

'

Au niveau mathmatique, les qualits quon souhaite dun estimateur


b 1 , X2 , , Xn ) et ceci pour tout , sont traduites par:
(X

b
E =;


2
b
b

E ou E est petit ;

b quand n , il faut bien sr prciser aussi le mode de


convergence ;
2
E b 0 quand n ;

b

n /b en loi vers N (0, 1) ;

etc...

&

UQM - Chapitre 1.

Page 12 de 93

'

Biais

b 1 , , Xn ) pour le paramtre est la diffrence


Le biais dun estimateur (X
b 1 , , Xn ) et quon dsigne par B b , alors
entre la valeur moyenne de (X


b 1 , , Xn )
Bb = E (X
On peut aussi voir Bb comme la valeur moyenne de lerreur b .

Remarque: Les variables X1 , X2 , , Xn suivent une loi identique qui dpend


de . videment, la valeur moyenne de b va dpendre de et n. Soit

b = b , n .
Ainsi le biais de b dpend aussi de et n;


Bb = Bb , n .

&

UQM - Chapitre 1.

Page 13 de 93

'

Un estimateur b est dite sans biais pour si son biais est identiquement nul i.e.


Bb , n = E b = 0,
ou galement, si sa valeur moyenne est identiquement gale , cest--dire

E b = .
Il est dite asymptotiquement sans biais si

Bb , n
0 lorsque

&

UQM - Chapitre 1.

Page 14 de 93

'

Exemple 1.

Soient X1 , X2 , , Xn un n-chantillon de loi f x|(, )


X est un estimateur sans biais pour .
c2 =

1
n

Pn

i=1 (X1

)2 est un estimateur sans biais pour 2 .

c2 = 1 P n (X1 X)2 est un estimateur biais pour 2 . Le biais de cet


i=1
n
estimateur: B c2 = 2 /n. On remarque que le biais est ngatif, ce qui

c2 est infrieur la vraie valeur du paramtre 2


montre que lestimateur

en moyenne.

&

UQM - Chapitre 1.

Page 15 de 93

'

Exemple 2. (plus pratique!)

Une caisse populaire aimerait connatre le nombre moyen de transactions faites


un guichet automatique par ses clients. La recherche de cette information
implique certains cots, et on prfre utiliser un chantillon plutt que de
passer en revue le dossier de tous les clients. Nous allons supposer que:
Cette caisse populaire na que 5 clients (N = 5)
Lchantillon alatoire simple sera form de deux clients (n = 2) que nous
identifierons leur numro de compte (de 1 5).

&

Numro du compte

Nombre de transactions

15

18

22

25

10

1 X
=
yi = 18 ;
N i

UQM - Chapitre 1.

1 X
=
(yi )2 = 27, 6.
N i
2

Page 16 de 93

'

chantillons de taille 2

La liste de tous les chantillons possibles de taille 2:


(15,18)

(15,22)

(15,25)

(15,10)

(18,22)

(18,25)

(18,10)

(22,25)

(22,10)

(25,10)

La moyenne de tous les chantillons possibles de taille 2:


y 1 =16,5

y 2 =18,5

y 3 =20

y 4 =12,5

y 5 =20

y 6 =21,5

y 7 =14

y 8 =23,5

y 9 =16

y 10 =17,5

On peut rsumer la distribution de la moyenne chantillonnale de Y dans la


tableau suivant:
Y = y

12,5

14

16

16,5

17,5

18,5

20

21,5

23,5

1/10

1/10

1/10

1/10

1/10

1/10

2/10

1/10

1/10

(y)

Lesprance mathmatique de notre estimateur de la moyenne est:


E()
b

E(Y ) =

X
y

12, 5

1
10

yp

(y)

+ 14

1
10

+ + 23, 5

= 18

10

Y est donc un estimateur sans biais de .

&

UQM - Chapitre 1.

Page 17 de 93

'

Exemple 3.

Supposons une population avec fonction de densit ou de probabilit

1 ex/ , x > 0

f (x | ) =
0
sinon

o est un paramtre positif inconnu. Comme E(X) = , on peut estimer ce


paramtre par:
1
b = X = (X1 + X2 + X3 )
3
o X1 , X2 , X3 (disons dun chantillon de taille 3) sont i.i.d. X. Lestimateur
X est sans biais pour .
Proposons un autre estimateur de , disons Y = Mdiane(X1 , X2 , X3 ). Est-il
sans biais pour , c--d. E(Y | ) = ?

&

UQM - Chapitre 1.

Page 18 de 93

'

Solution:
Trouvons dabord la densit de Y , fY (y), comme E(Y | ) =
que fY (y) = d FY (y), nous commenons par FY (y):
dy

FY (y)

y fY (y)dy et utilisons le fait

Pr[Y y] = Pr[Mdiane (X1 , X2 , X3 ) y]

Pr[X1 , X2 , X3 y] + Pr[X1 , X2 y, X3 > y]


+ Pr[X1 , X3 y, X2 > y]
+ Pr[X2 , X3 y, X1 > y]

3
2
FX (y) + 3 FX (y) (1 FX (y)) comme Xi sont i.i.d. FX

de faite que

FX (y) =

&

UQM - Chapitre 1.

Ry

(1 ey/ )3 + 3(1 ey/ )2 ey/

si y > 0

si y 0

fX (x)dx =

y
Ry 1 x/

e
dx = ex/ = 1 ey/

0
0

si y > 0
si y 0

Page 19 de 93

'

La fonction de densit fY (y) de Y est donc:

d F (y) = . . . = 6 [e2y/ e3y/ ],

dy
Y

fY (y) =

$
y > 0
si y 0

finalement:

E(Y | )

Z 6
y [e2y/ e3y/ ]dy

Z 2
Z 3
2y/
3
y e
dy 2
y e3y/ dy

0
0

3/2 2/3 =

6=

Alors la mdiane est un estimateur biais pour , si X1 , X2 , X3 sont i.i.d. de loi Exp (). Le biais
est

5
BY = E(Y | ) =
=
6
6

&

UQM - Chapitre 1.

Page 20 de 93

'

Exemple 4.

Supposons que X1 , X2 , , Xn sont i.i.d. U (0, ), o > 0 c--d.

1
si 0 < x <

fX (x | ) =
0
sinon

n = Max(X , . . . , Xn ) est asymptotiquement sans biais pour .


Montrons que
1

Solutions:
Il faut montrer que
Z

lim E(n | ) = lim


y f (y)dy =
n
n
n

d
n est f
o la densit de la variable alatoire
n (y) = dy F
n (y) avec F
n (y) est la fonction de

n .
rpartition de
F (y)
n

&

n y] = Pr[max(X , X , Xn ) y]
Pr[
1
2

Pr[X1 y, X2 y, , Xn y]

Pr[X1 y] Pr[X2 y] Pr[Xn y] comme X1 , X2 , . . . , Xn


(FX (y))n comme X1 , X2 , . . . , Xn sont i.i.d. FX .

UQM - Chapitre 1.

sont indpendants

Page 21 de 93

'

Comme

FX (y)

Zy

Pr(X y) =

fX (x)dx

Alors

et par consquent:

F (y) =
n

Ry 1
y
dy =

0
1

0



y n

d
f (y) =
F (y) =
n

dy n

&

UQM - Chapitre 1.

si y < 0

si 0 < y <
si y >

si y < 0
si 0 y
si y >

0
ny n1
n
0

si y < 0
si 0 y
si y >

Page 22 de 93

'

ce qui implique enfin:

n | )
E(

0
=

ny n1
n

dy =

n Z

y n dy

n n+1
n y n+1
=
n n + 1 0
n (n + 1)
!
n

n+1

n est biais:
On voit que
n | ) 6= ,
E(
mais asymptotiquement sans biais:
n | ) = lim
lim E(
n
n

&

UQM - Chapitre 1.

n
n+1

= .

Page 23 de 93

'

Estimateur convergent

b
Lestimateur (X
il est fonction de la taille de
1 , X2 , , Xn ) tant une fonction de lchantillon,
n
o
bn , n = 1, 2, . On peut alors
lchantillon et ainsi on a une suite de variables alatoires

parler de convergence en probabilit dun estimateur vers la valeur du paramtre cest--dire de


bn vers la constante .

bn du paramtre est convergent si > 0,


On dit alors quun estimateur



b

lim Pr
> = 0
n
n

Pr
bn
et on note
.

En mots, un estimateur convergent scarte du paramtre avec une faible probabilit, si la taille
de lchantillon est assez grande.

Lexemple de base destimateur convergent est la moyenne empirique X n . La loi faible des grands
nombres affirme que X n est un estimateur convergent de lesprance de X.

&

UQM - Chapitre 1.

Page 24 de 93

'

Puisque la convergence est vers une constante, on peut utiliser le critre dfini suivant:

Si

alors

bn
E

et

bn
V ar

Pr
bn

Ce rsultat est beaucoup plus simple dmontrer que la convergence en probabilit selon la
dfinition. Par contre si ce critre ne fonctionne pas, il ne faut pas conclure que lestimateur nest
pas convergent puisque ce sont uniquement des conditions suffisantes. On peut interprter le
critre de convergence en probabilit comme tant le fait que si la taille de lchantillon est assez
grande alors la valeur sera suffisamment prs du paramtre.
Pour la preuve de ce critre, utilisez lingalit de Chebychev.

Exemples: Soit X un caractre tudi tel que E (X) = , V ar (X) = 2 alors


i. X est un estimateur convergent pour

P
ii. S 2 = 1
Xi 2 est un estimateur convergent pour 2
n
iii. S 2 est un estimateur convergent pour 2

&

UQM - Chapitre 1.

Page 25 de 93

'

Un exemple

Soit X1 , X2 , Xn un chantillon de variable alatoire dont la densit


f (x | ) =

x1 ,

si 0 < x < 1

sinon

o est un paramtre positif inconnu. Montrer que

Solution:

X
est un estimateur convergent pour .
1X

Pour tout c > 0,


c

E(X ) =

Z 1
0

c
1
x x
dx =

h x+c i 1

=
.
+c 0
+c

En particulier, en prenant c = 1 puis c = 2, on obtient:

E(X) =

2
E(X ) =

+1

et

+2

V ar(X) =

( + 1)2 ( + 2)

Nous dduisons alors pour la moyenne dchantillon X:


.
+1

V ar(X) =
n(+1)2 (+2)
qui 0 quand n + .
E(X) =

&

UQM - Chapitre 1.

est un estimateur convergent pour

+1

Page 26 de 93

'

La suite de la solution de cet exemple est base sur la proposition suivante:


Soit n un estimateur convergent du paramtre , et une fonction de R dans R, continue au
point . Alors ((n )) est un estimateur convergent de ().
Une application simple de cette proposition: Considrons comme modle la loi uniforme sur [0, ],
o le paramtre est inconnu. La moyenne empirique X n est un estimateur convergent de
lesprance de la loi, qui vaut /2. Donc n = 2X n est un estimateur convergent de .

y
. Cette fonction est
1y
, il sensuit
continue en tout point de y 6= 1. Comme X est un estimateur convergent pour
+1

que h(X) est un estimateur convergent pour h( ) si


6= 1. Il ne reste plus qu observer
+1
+1
X , que
que h(X) =
1X

1+
h(
) =
=
1+
1
1+
Revenons notre exemple prcdent et considrons la fonction h(y) =

et que la condition

&

UQM - Chapitre 1.

6= 1 est satisfaite car > 0.


1+

Page 27 de 93

'

Prcision dun estimateur

La proprit que la moyenne de lentit alatoire b soil gale (ou que la


moyenne de lerreur b soit gale zro) est certainement dsirable du point
de vue de lestimation, car tout autre chose tant gale, on va certainement
prfrer un estimateur sans biais un autre qui ne le serait pas.
Cependant, la valeur moyenne b nest pas une bonne mesure de lerreur de
lestimation car les erreurs positives jouent contre les erreurs ngatives dans le
calcul de la moyenne. Donc, part le biais, il faut aussi tenir compte de la


2
b
b

valeur moyenne de ou de . Nous allons opter pour la deuxime
car la fonction valeur absolue nest pas plaisante du point de vue du calcul
analytique.

&

UQM - Chapitre 1.

Page 28 de 93

'

Erreur quadratique moyenne

On appelle erreur quadratique moyenne de lestimateur b par rapport au


2

b
b
paramtre est la valeur moyenne de quon dsigne par EQM ; alors

2
EQM b = E b
b dun estimateur est un critre important dans
Remarque 1. La variance V ar()
la mesure o il caractrise la dispersion des valeurs de dans lespace des
chantillons possibles. Toutefois il sagit de la dispersion autour de la
b et non pas autour de . Pour prendre en compte lcart par
moyenne E()
rapport on introduit alors ce critre derreur quadratique moyenne

Remarque 2. Lorsque b constitue un estimateur sans biais de , son erreur


quadratique moyenne est gale sa variance.

Remarque 3. Lerreur quadratique moyenne peut se dcomposer alors sous la


forme:



EQM b = V ar b + B 2 b

&

UQM - Chapitre 1.

Page 29 de 93

'

Remarque 4. Lapplication des deux premiers critres peut mener un conflit


puisquun estimateur biais peut avoir un cart quadratique moyen plus
petit quun estimateur non biais. Par exemple, si on considre un
caractre lune loi normale de moyenne et de variance 2 , on peut
considrer deux estimateurs de 2 bass sur un chantillon de taille n :
n
n
2
2
1 X
1X
2
2
S =
Xi X
et S =
Xi X
n 1 i=1
n i=1


2
2
2
On peut montrer que E S = et que V ar S = 2 4 / (n 1) ce qui

implique que EQM2 S 2 = 2 4 / (n 1).
Dun autre ct, on a S 2 = (n 1) S 2 /n cest--dire que

et ainsi


n1 2
E S 2 =

et


2 (n 1) 4
V ar S 2 =

n2


2n 1 4
EQM2 S 2 =

n2
Selon le critre 1, lestimateur S 2 est meilleur que S 2 et selon le critre 2,
S 2 est meilleur que S 2 . La diffrence est minime et on prfre par
tradition utiliser S 2 comme estimateur.

&

UQM - Chapitre 1.

Page 30 de 93

'

Remarque 5. En adaptant ce critre de EQM pour juger de la prcision dun


estimateur, le problme est de chercher le meilleur estimateur au sens de
ce critre, ce qui nous conduit la dfinition suivante:
Soient b1 et b2 deux estimateurs du paramtre , on dit que b1 domine
(ou plus prcis) que b2 si

EQM (b1 ) EQM (b2 ) .

Pour lexemple prcdent, S 2 est plus efficace que S 2 :


EQM (S 2 ) EQM (S 2 ) =

3n 1
4
2
(n 1)n

qui est toujours positif.


Un estimateur b qui est sans biais pour est dit donc variance minimale
si pour tout autre estimateur b sans biais pour on a
b V ar(b ) .
V ar()

&

On souhaite alors de trouver parmi les estimateurs sans biais dun


paramtre celui dont la variance est la plus faible. Il sagit l dun
estimateur sans biais de variance minimale.

UQM - Chapitre 1.

Page 31 de 93

'

Exemple 1:
Soit X1 , X2 , Xn un chantillon de variable alatoire de loi de bernoulli
de paramtre inconnu . Considrons comme estimateur de : b = 0.5. Il
b = 0.5 6= . De plus
est biais car pour tout , E()


2
b
EQM () = E (0.5 )
=

(0.5 )2

Cet estimateur est le meilleur selon le critre de lEQM lorsque =0,5 car
lerreur quadratique moyenne au point 0,5 est nul. Par contre, cet EQM
augmente quand sloigne de 0,5.
b = EQM1 ()=0,25.
b
Remarquez EQM0 ()

&

UQM - Chapitre 1.

Page 32 de 93

'

Exemple 2:
X = nombre de clients le samedi dans un supermarch, X P(). La
ralisation dun chantillon de taille 7 donne:
501,

522,

475,

526,

481,

498,

506

b 1 = x = 501.3 ou, comme


Nous proposons comme estimateur de :
b 2 = s2 = 362.6.
E(X) = V ar(X) = , lestimateur

Les deux sont des estimateurs sans biais et nous retiendrons plutt la
premire estimation. En effet
b1 )
2
n2
n
V ar(
=

=
1,
4
b
n
2(n

1)
2(n

1)
V ar(2 )

b 1 est donc plus prcis que


b2

&

UQM - Chapitre 1.

Page 33 de 93

'

Exemple 3: Soit estimer le paramtre p dune loi de Bernoulli (ou en


situation pratique, une proportion p par sondage dans une population).
Soit X le total (ou leffectif) empirique de succs observe. Montrons que
si p est au voisinage de 1/2 la statistique
pb1 =

X+1
n+2

est prfrable au sens de EQM la proportion empirique naturelle


pb2 = X/n pour estimer p.

Comme X est de loi B(n, p), on a E(b


p2 ) = p et
EQM (b
p2 ) = V ar(b
p2 ) =
Pour lestimateur pb1 , on a
E(b
p1 ) =

np + 1
n+2

et

p(1 p)
.
n

V ar(b
p1 ) =

np(1 p)
(n + 2)2

do

&

i2
np(1 p) h np + 1
(1 2p)2 + np(1 p)
EQM (b
p1 ) =
+
p =
.
(n + 2)2
n+2
(n + 2)2

UQM - Chapitre 1.

Page 34 de 93

'

En faisant le rapport de cette EQM par rapport celle de pb2 , on obtient


h
(1 2p)2 i
n
n+
(n + 2)2
p(1 p)

Or pour p = 1/2 ceci veut dire que n2 /(n + 1)2 < 1 et le rapport ci-dessus
tant continue de p dans [0, 1], il reste strictement infrieur 1 dans un
certain voisinage de 1/2. Un calcul plus approfondi montrerait que ce
voisinage dpend de n et est lintervalle
i1 r n + 1 1 r n + 1 h

,
+
2
2n + 2 2
2n + 2

En conclusion, aucun des deux estimateurs ne domine lautre.

&

UQM - Chapitre 1.

Page 35 de 93

'

et 2 = 6 Y sont tous
Exemple 4: la page 18, nous avons vu que 1 = X
5
deux estimateurs sans biais pour o Y = Mdiane (X1 , X2 , X3 ) avec
X1 , X2 , X3 sont i.i.d. de loi exponentielle de paramtre . De ce qui
prcde:
1
1
EQM (b1 ) = V ar(X) = V ar(Xi ) = 2 .
3
3
De mme
EQM (b2 )

=
=
=

comme
E(Y 2 ) =

Z
0

V ar(b2 ) = E(22 ) E 2 (2 )

2 !
 2
6
6
E
Y
2 =
E(Y 2 ) 2
5
5
 2
6
19 2

2 = 0, 52 2 ,
5
18

y 2 fY (y)dy =

Z
0

y2

6 2y/
19 2
(e
e3y/ )dy = =
.

18

b1 est donc plus prcis que b2 .

&

UQM - Chapitre 1.

Page 36 de 93

'

Exemple 5: Supposons que X1 , X2 , , Xn sont i.i.d. X U (0, ), o > 0.


2 = n+1 X(n) , et 3 = X(n) pour
Comparez les EQM de 1 = 2X,
n
estimer .
= V ar( | ) + B 2 (), E(X) =
Rappelons que EQM ()

V ar(X) =

2
.
12

E(1 )

E(2 )

E(3 )

et

Alors:
= 1 est sans biais pour .
2E(X)


n+1
E
X(n) = 2 est de mme sans biais pour .
n
n
n
E(X(n) ) =
E(2 ) =
3 est biais pour
n+1
n+1
n

dont le biais est: B =


=
.
3
n+1
n+1

Donc:
EQM (1 )

=
=

&

UQM - Chapitre 1.

V ar(1 | )

V ar(X)
2
4
=
.
n
3n

Page 37 de 93

'

De mme: EQM (2 ) = V ar(2 | ) = E(22 | ) 2 o



2 ! 
2
n
+
1
n
+
1
Y
| =
E(Y 2 | )
E(22 | ) = E
n
n


n+1
n

 2 Z

n+1
n

2

n+1
n

2

(n + 1)2 2
.
n(n + 2)

2 ny

n1

dy

ny n+2

n n + 2 0
n2
n+2

Ce qui donne:

&

UQM - Chapitre 1.

2 2
2
(n
+
1)

2
EQM (2 ) =
=
.
n(n + 2)
n(n + 2)

Page 38 de 93

'

Et enfin lerreur quadratique moyenne pour lestimateur 3 est:


EQM (3 )

&

UQM - Chapitre 1.

V ar(3 | ) + (E(3 | ) )2


n
2 |
n+1

V ar

n2
(n + 1)2

2 (2n + 2)
(n + 1)2 (n + 2)

22
.
(n + 1)(n + 2)

2
+
(n + 1)2

2
n(n + 2)

2 (n + 2)
+
(n + 1)2 (n + 2)

Page 39 de 93

'

Remarques:

Pour n = 1
= 2X
= 2X

1
1
2
2

2
)
EQM (
i
3
3

3 a un biais mais une variance plus petite pour compenser.

= X

3
1
2

Pour n = 2
= X +X
= 3 max(X , X )

1
1
2
2
1
2
2
2
2

)
EQM (
i
6
8

2 est un estimateur plus prcis que 1 et 3 .

Pour n 3
= 2X

1
2
)
EQM (
i
3n

et
2 est un estimateur plus prcis que
1
2
n(n + 2)

&

= max(X , X )

3
1
2
2

UQM - Chapitre 1.

<

= n+1 X

2
(n)
n
2
n(n+2)

3 , en effet:
2 2

(n + 1)(n + 2)

<

= X

3
(n)
2 2
(n+1)(n+2)

3n

Page 40 de 93

'

Estimation par intervalle

Un estimateur donne une valeur unique comme estimation, et cette valeur a


peu de chance de concider avec celle du paramtre. Un statisticien qui, avec
un chantillon de botes de conserves, obtient le poids moyen 7,50 onces,
donnera cette valeur comme estimation de la moyenne de la population. Cest
la meilleure estimation que lui fournissent ses donnes, mais laffirmation la
moyenne de la population est de 7,50 est presque certainement fausse. Une
affirmation du genre la moyenne de la population se trouve entre 7,25 et 7,75,
qui est une affirmation plus faible que la prcdente, a plus de chance dtre
vraie. Lestimation par intervalle de confiance consiste entourer dun
intervalle (I, S) la valeur de lestimateur et affirmer plutt se trouve dans
(I, S). On peut alors choisir I et S de telle sorte que la probabilit que cette
proposition soit vraie soit assez leve.

Le but de lestimation par intervalle est de fournir la prcision dune


estimation par un intervalle - lintervalle de confiance - auquel on peut
associer une probabilit fixe lavance de contenir la vraie valeur .

&

UQM - Chapitre 1.

Page 41 de 93

'

Dfinition: Un intervalle de confiance de niveau 100(1 )% pour le


paramtre est un intervalle
 alatoire
 de bornes I(X1 , . . . , Xn ) et
S (X1 , . . . , Xn ) tel que Pr (I, S)

1 . 0 < < 1

Remarque 1. Nous savons comment estimer la moyenne dune population ou la


proportion de succs dans une population partir des quantits
correspondantes dun chantillon. Ceci mne de lestimation ponctuelle.
Remarque 2. Un intervalle de confiance de niveau 1 pour un paramtre a
deux composantes: un intervalle calcul partir des donnes et un niveau
de confiance 1 qui donne la probabilit 1 que la mthode produise
un intervalle contenant le paramtre .
Remarque 3. Typiquement, = 5% et 100(1 ) % = 95% et on dnote
IC-95%. Un IC-95% (i, s) ne veut pas dire que Pr(i s) = 95% .
i, et s sont tous fixes. LIC-95% (i, s) est une ralisation de (I, S).

&

UQM - Chapitre 1.

Page 42 de 93

'

Intervalle de confiance pour

Si X1 , X2 , . . . , Xn sont i.i.d. X de moyenne alors la distribution de est


approximativement N (, ) par le thorme central limite.
Pour construire un intervalle de confiance de niveau 100(1 )%, il faut trouver
le point critique suprieur z de la distribution normale standard tel que:

o Z N (0, 1) .
P (Z z ) =
2
En choisissant alors le point critique z(/2) de cette faon, on obtient
!

z/2 = 1
Pr z/2

et les manipulations donnent




Pr z/2 + z/2 = 1
donc lintervalle

z/2

+ z/2

contient avec probabilit 100(1 )% o P (z(/2) Z z(/2) ) = 1 .

&

UQM - Chapitre 1.

Page 43 de 93

'

Remarque 1:

Lcart-type de lestimateur =
alors si la solution des ingalits

z/2

est fonction de , disons (),


V ar()

z/2
()

et lintervalle est alors


savre trop complexe, on remplace () par ()



z/2 () ; + z/2 ()
Voir lexemple 1 la page 54 et lexemple 3 la page 58.

&

UQM - Chapitre 1.

Page 44 de 93

'

Remarque 2:

Lintervalle de confiance
 nest pas unique. Dans lexemple prcdant il tait
z(/4) = 1 au dpart et de
possible de poser Pr z(3/4)

dduire lintervalle

z(3/4)

+ z(/4)

qui est un I.C. respectant la dfinition. Il est plus raisonnable de partager le


risque en deux parties gales mais non obligatoire.

&

UQM - Chapitre 1.

Page 45 de 93

'

Intervalle de confiance pour une moyenne

On va considrer le cas dobservations provenant dune distribution F (x|, )


o la variance est connue, un cas simple mais peu raliste. On fait a afin de se
concentrer sur le raisonnement derrire linfrence statistique.

Si X1 , X2 , . . . , Xn sont i.i.d. X N (, ) alors X N (, / n).


Si X1 , X2 , . . . , Xn sont i.i.d. X de moyenne et dcart type alors la

distribution de X est approximativement N (, / n) par le thorme central


limite.
Un intervalle de confiance de niveau 1 pour est

x z/2
n
o z/2 est le point critique suprieur /2 de la distribution normale standard.
Cet intervalle est exact si la distribution de la population est normale et
approximativement correct si n est grand dans les autres cas.

&

UQM - Chapitre 1.

Page 46 de 93

'

Remarque: I.C. pour la moyenne : cas de inconnu


Soit X1 , X2 , . . . , Xn i.i.d. F (x|, ). Alors lintervalle de confiance avec
connu est bas sur le fait que:
X
N (0, 1) .
/ n
Si est inconnu, il faut le remplacer par s, lcart type de lchantillon.

Note: Lcart type de la distribution de X est: X = / n. On lestime par

s/ n quon appelle lerreur standard (standard deviation vs standard error).

&

UQM - Chapitre 1.

Page 47 de 93

'

Considrons
T =

X
.
s/ n

On a vu que si n est grand, T suit approximativement une loi N (0, 1) . En fait,


est distribu selon une distribution t avec n 1 degrs de libert.
Les ailes de ces distributions sont plus lourdes que celles de la normale
standard. Ceci implique que les quantiles suprieurs dune tn sont plus
grands que ceux dune N (0, 1).
Une loi de Student est symtrique par rapport 0, sa moyenne est 0 et sa
variance est n/(n 2) pour n > 2.
Un intervalle de confiance de niveau 1 pour est:
s
x t
n

o t , note aussi tn1;/2 , est le point critique suprieur /2 dune t(n 1),
soit P (T > t ) = /2 o T t(n 1).

&

UQM - Chapitre 1.

Page 48 de 93

'

I.C. et la mthode de la fonction pivot

Nous introduisons maintenant la mthode de la fonction pivot qui permet de


rsoudre la plus part des cas classiques de la construction des intervalles de
confiance.
Dfinition: Une fonction pv(X1 , X2 , Xn |) est appele fonction pivot si:
1. la loi de pv(X1 , X2 , Xn |) est connue et ne dpend pas de .
2. pour tous rels u1 et u2 tels que u1 u2 et tout (x1 , x2 , xn ), la double
ingalit
u1 pv(x1 , x2 , xn |) u2
peut se rsoudre ou pivoter en selon:

t1 (x1 , x2 , xn ) t2 (x1 , x2 , xn ) .

&

UQM - Chapitre 1.

Page 49 de 93

'

Lexistence dune fonction pivot assure une procdure dintervalle de confiance


de niveau donne quelconque.
En effet, il suffit de choisir, sur la loi connue, des quantiles u1 et u2 tels que:

Pr u1 pv(x1 , x2 , xn | u2 ) = 1
puis de faire pivoter pour encadrer . Cest ce qui a t effectu pour
lintervalle de confiance pour la moyenne inconnue pour une population
normale de variance connue.

&

UQM - Chapitre 1.

Page 50 de 93

'

$
iid

Exemple 1: Soient X1 , X2 , Xn Exp(), la fonction


pv(X1 , X2 , Xn |) = X
est un pivot.
iid

Exemple 2: Soient X1 , X2 , Xn N (, ),
si connu, la fonction
pv(X1 , X2 , Xn |) =

/ n

est un pivot.
Si est inconnu (voir le prochain chapitre), la fonction
pv(X1 , X2 , Xn |) =
et la fonction

&

s/ n

S2
pv(X1 , X2 , Xn |) = 2

sont des pivots.

UQM - Chapitre 1.

Page 51 de 93

'

Un exemple

Soit X1 , X2 , . . . , Xn un chantillon de taille n dune population de fonction de


densit
1 1
f (x) = x( ) pour 0 < x < 1 et > 0 .

a. Montrer que Yi = ln(Xi) est de loi exponentielle


1 Pn
b. Concluez que b = n
i=1 ln(Xi) est un estimateur sans biais de
c. Dterminer la variance de b

d. Si n = 1 et la seule observation est X1 = 0, 25, dterminer un intervalle de


confiance 90% pour . (Considrez Y = Y1 / comme pivot).
e. Soit Y = X(n) . Montrer que Z = Y n/ est de loi uniforme sur (0; 1).
Utiliser ce fait pour dterminer un intervalle de confiance 90% pour
tant donn lchantillon suivant:
0, 3 0, 5 0, 12 0, 15 0, 17 0, 21 0, 32 0, 45 0, 68 0, 78 0, 85

&

UQM - Chapitre 1.

Page 52 de 93

'

P
f. Utiliser le fait que b = 1 11
i=1 ln(1/Xi) est de loi gamma de paramtres
= 11 et = 1 pour dterminer un intervalle de confiance 90% pour
tant donn lchantillon en e. Voici quelques valeurs de la fonction de
rpartition F (x) dune loi gamma de paramtres = 11 et = 1:
x

0, 01

0, 05

0, 10

0, 15

0, 20

0, 80

0, 85

0, 90

0, 95

0, 99

F (x)

4, 77

6, 17

7, 02

7, 64

8, 16

13, 65

14, 41

15, 41

16, 96

20, 14

P
h. Utiliser le fait que b = 1 11
i=1 ln(1/Xi) est peu prs de loi normale pour
dterminer un intervalle de confiance 90% pour tant donn
lchantillon en e.

&

UQM - Chapitre 1.

Page 53 de 93

'

Exemple 1: I.C. approximatif pour p dans une population binomiale


On considre un caractre X de loi Bin (1, p), on veut un I.C. pour le
paramtre p bas sur un chantillon de taille n. On se base sur la statistique
1 Pn
pb = n
i=1 Xi cest--dire la proportion de succs observe dans lchantillon.
On sait par le T.C.L. que

On utilise la relation
Pr

&

UQM - Chapitre 1.

np

z/2

pb p

p (1 p)

np

pb p

N (0, 1)

p (1 p)

z/2

Page 54 de 93

'

pour construire lI.C. Aprs manipulations, on obtient


2

Pr

(b
p p)
2
n z/2
p (1 p)


p)
Pr (b
p p) n




2
2
2
2
Pr pb 2b
pp + p n z/2 p p 0






2
2
2
2
Pr nb
p 2b
pn + z/2 p + n + z/2 p 0


2
z/2
p (1

On a une quation du second degr qui est ngative lorsque p est entre les deux
2
est toujours positif. Les racines de cette quations
racines puisque 2b
pn + z/2
sont

!
r



1
2
2
4
2
2
 2b
p
r1 = 
pn + z/2 +
4b
pnz/2 + z/2 4z/2 nb
,

2
2 n+z

/2

r2 =

&

2
2 n + z/2

UQM - Chapitre 1.

2
2b
pn + z/2

r

2
4
2 nb
4b
pnz/2
+ z/2
4z/2
p2

!


Page 55 de 93

'

Cela veut dire que Pr(r1 p r2 ) 1 et lI.C. est


r


2
2 (1 p
4

b
)
+
z
2b
p
n
+
z
4b
p
nz
/2
/2
/2



p

2
2 n + z/2
Cet intervalle est assez difficile valuer mais on peut simplifier en utilisant la
statistique

pb p
np
pb (1 pb)
qui est approximativement N (0, 1). LIC est alors donn par
!
r
pb (1 pb)
p pb z/2
n

&

UQM - Chapitre 1.

Page 56 de 93

'

Exemple 2: Intervalle de confiance pour 2 dans une population normale


On utilise la statistique
(n 1) S 2
2

n1
2
pour construire lIC. La relation de base est


2
(n

1)
S
2
=1
Pr 2n1;1/2

n1;/2
2
et lIC est
2

1) S 2

1) S 2

(n
(n
;
2n1;/2 2n1;1/2

Remarque: La taille de lchantillon a une influence sur la longueur de


lintervalle de confiance : si la taille augmente alors lI.C. a une longueur qui
diminue. On appelle prcision la demi longueur de lintervalle de confiance
lorsque ce dernier est symtrique par rapport la statistique. On utilise la
prcision pour dterminer une taille dchantillon.

&

UQM - Chapitre 1.

Page 57 de 93

'

Exemple 3: I.C. approximatif pour dans une population dune variable


alatoire poissonienne.
Soit X1 , X2 , . . . , Xn un chantillon de taille n dune population de fonction de
x e
1 Pn
. En se basant sur la statistique b = n
probabilit p(x) = x!
i=1 Xi ,
E(X) = , V ar(X) = /n et enfin sur le pivot correspondant:
"
#

X
z/2 1 ,
Pr z/2 p
/n
nous pivotons(!) pour dduire un I.C. 100(1 )% comme suit:
p

1 = Pr[|X | z/2 /n]


=

&

UQM - Chapitre 1.

)2 z 2
Pr (X
/2


+ z2
Pr 2 2X
/2


2 0
+X

Page 58 de 93

'

soit encore

+ z2
2X

/2

Pr
"

+
Pr X

2
z/2

2n

1
n

r

z/2 q
2n

+ z2 1
2X
/2 n
2

z/2
+ 4nX

2

2
4X

qui donne comme I.C. 100(1 )% pour :


x
+

2
z/2

2n

z/2 q
2n

2
z/2
+ 4n
x.

Une deuxime mthode alternative pour cet intervalle est, comme V ar() = n
,
b = b = X , ce qui dduit comme I.C. 100(1 )% pour
de lestimer par Vd
ar()
n

&

UQM - Chapitre 1.

x
z/2

Page 59 de 93

'

Tests dhypothses

La thorie des tests dhypothses est quivalente celle de lestimation par intervalle
de confiance. Nous tentons de dcider si les donnes confirment ou contredisent une
opinion a priori concernant la valeur dun paramtre de la population. Voici des
exemples:
situation bernouillinne: Un organisme anticipe que la proportion p des
individus dune population(trs grande) possdant une certaine particularit
(fumeurs. protestants. chmeurs etc) est suprieure 1/2, (ou une valeur p0
dintrt particulier).
situation poissonnienne: Un chercheur postule que le taux de ralisation
dun vnement (nombre moyen de naissances par jour, nombre moyen de
collisions par semaine, nombre moyen dappels par heure pour un service
tlphonique, etc) est infrieur 4 (ou une valeur 0 dintrt particulier).
La valeur moyenne dun certain caractre X (poids, taille, temps dattente
entre deux appels ou deux accidents) soumis des perturbations des au
hazard est infrieure ou gale 0
Une compagnie nonce que la dure moyenne de vie des pneus, dune certaine
marque, est au moins 20,000 milles

&

UQM - Chapitre 1.

Page 60 de 93

'

Un agronome se demande si lemploi dun nouvel engrais produirait une rcolte


de bl plus leve compare un engrais employ frquemment par des fermiers.
Une compagnie dassurance veut sassurer, avant la mise en march dune
nouvelle police dassurance, que les individus gs de 50 ans vivent en moyenne
15 ans de plus.
Une association de mdecins veut confirmer quune nouvelle pilule
anticonception- nelle, mise en march par une compagnie pharmaceutique, est
au moins scure 99%.
Un chercheur prtend que la relation entre deux caractres X et Y est linaire
sauf pour une perturbation alatoire de moyenne zro et de variance 2 :
Y = + X +
Une quipe de recherche postule quil ny a pas de diffrence significative entre
les rcoltes moyennes de tabac par acre obtenues par quatre mthodes
diffrente dirrigations utilises dans un pays; elle postule de plus quil ny a
pas dinteraction significative entre diffrents types dengrais et diffrents type
dirrigation,

&

UQM - Chapitre 1.

Page 61 de 93

'

Dfinitions:
Une hypothse statistique est un nonc (une affirmation) concernant les
caractristiques (valeurs des paramtres, forme de la distribution des
observations etc.) dune population.
Un test dhypothse (ou test statistique) est une dmarche qui a pour but de
fournir une rgle de dcision permettant, sur la base de rsultats dchantillon,
de faire un choix entre deux hypothses statistiques.
Lhypothse selon laquelle on fixe priori un paramtre de la population une
valeur particulire sappelle lhypothse nulle et est note H0 . Le test est fait
pour mesurer la force de linformation contre H0 . Elle est habituellement sous
la forme dun nonc reprsentant aucun effet ou aucune diffrence.
Nimporte quelle autre hypothse qui diffre de lhypothse H0 sappelle
lhypothse alternative (ou contre-hypothse) et est note Ha . Lnonc
reprsentant ce quon pense tre la ralit si H0 nest pas satisfaite.
Note: Cest lhypothse nulle qui est soumise au test et toute la dmarche du
test seffectue en considrant cette hypothse comme vraie.

&

UQM - Chapitre 1.

Page 62 de 93

'

Axiomatique: Nous traitons seulement de situations pour lesquelles une et une


seule des hypothses H0 et Ha est vraie. Par consquent le rejet de lhypothse
H0 entrainerait implicitement lacceptation de Ha et vice versa.

Problmatique et modlisation: Une vrification sans erreur dune hypothse


concernant une population est impossible moins quon observe la population
entire. Or nous cherchons une thorie rationnelle pour trouver de bons critres
de dcision qui, dpendant dun nombre fini dobservations de la population,
peuvent conduire au meilleur choix possible entre H0 et Ha .
Nous supposons donc quil existe une caractristique numrique X, observable
chez chaque lment de la population et que la rpartition de X dpend dun
paramtre , X suit une loi f (x|). Nous supposons aussi que lensemble H des
valeurs admissibles pour est connu, et la connaissance exacte de conduit
la vraie hypothse H0 ou Ha . Donc nous postulons que le problme H0 versus
Ha divise lespace paramtrique en deux parties non vides H0 et Ha :

H SH = H
H :H
a
0
0
0
et
H0 T Ha =
Ha : Ha

&

UQM - Chapitre 1.

Page 63 de 93

'

nonc du problme: Nous avons notre disposition une variable alatoire X


qui suit une loi f (x|) dont le paramtre est inconnu; on sait cependant que
H. Nous avons deux hypothses complmentaires concernant la valeur :

H :H
0
0
.
Ha : Ha

Comme exemple: on sintresse au taux de polluant dans la fabrication dune


composante lectronique. Supposons que le taux acceptable est de 75 p.p.m.
(parties par million), on sintresse au paramtre qui donne le taux moyen,
lhypothse nulle est H0 : 75 et lalternative est Ha : > 75.

Nous avons donc choisir entre deux actions complmentaires: d0 : rejeter H0


et d1 : rejeter H1 . Pour guider notre choix nous observons n fois la variable X.
Nous devons prendre soit laction d0 soit laction d1 en se basant sur
lchantillon alatoire X1 , X2 , . . . , Xn .
Le critre de la dcision: Par lexemple qui suit, nous tudions pas pas ce
critre et nous dfinissons le langage correspondant.

&

UQM - Chapitre 1.

Page 64 de 93

'

Exemple 1.

Un manufacturier de gouttes optomtriques met sur le march une nouvelle


solution dans des bouteilles de 30 ml pour lesquelles il prtend quil y a en
moyenne 5 ml dun certain produit chimique A dans chaque bouteille.
Toutefois, on suspecte quil pourrait y avoir plus de 5 ml par bouteille, ce qui
serait dangereux pour les yeux. Par exprience du processus de fabrication, on
sait que la quantit du produit chimique dans une bouteille de 30 ml est
distribue selon une loi normale de moyenne 5 ml (si on met la quantit
annonce) et un cart type de 2,1 ml. Si on en met trop, alors la moyenne
devrait tre plus grande que 5 ml.
On prend donc un chantillon de 15 bouteilles et on mesure la quantit du
produit chimique A dans chacune dentre elles. On obtient la quantit moyenne
de produit chimique pour les 15 bouteilles: x = 6, 2. Est ce une indication
suffisante quon met une trop grande quantit du produit chimique A dans les
bouteilles?

&

UQM - Chapitre 1.

Page 65 de 93

'

Suite...

Question: Si on met la bonne quantit, alors = 5 ml. Quelle est la


probabilit que la moyenne de 15 observations sous cette hypothse donne un
rsultat au moins aussi lev que la valeur observe, soit 6,2 ml?
Rponse(voir la page 10 ci-dessous): Si on met vraiment 5 ml par bouteille en
moyenne, alors la probabilit est de 0,013.
Conclusion: Puisque cette probabilit est faible (en moyenne 1,3% des
chantillons de taille 15 donneraient des rsultats plus levs que a si on
mettait 5 ml par bouteille) on a une bonne indication que le manufacturier met
une trop grande quantit du produit chimique A.

&

UQM - Chapitre 1.

Page 66 de 93

'

Notes:
Nous savions lavance (avant de voir les donnes) que sil tait pour y
avoir un problme, alors > 5. Si la moyenne tait moins que 5, ce ne
serait pas dangereux pour les yeux.
Le test est bas sur une statistique qui estime le paramtre dans H0 .

Lorsque H0 est vraie, on sattend ce que la valeur de lestimateur soit


proche de celle spcifie par H0 .

Des valeurs estimes loignes de la valeur du paramtre dans H0 sont une


indication lencontre de H0 . Lhypothse alternative dtermine la
direction qui va lencontre de H0 .
Les hypothses sont donc:
H0

5.

Ha

> 5.

&

UQM - Chapitre 1.

Cest la quantit indique sur ltiquette.


Ce quon pense tre la ralit si H0 nest pas satisfaite

Page 67 de 93

'

Seuil de signification empirique

La probabilit, calcule en faisant lhypothse que H0 soit vraie, que la


statistique de test est au moins aussi extrme que la valeur observe sappelle le
seuil de signification empirique du test ou P-valeur.
Plus cette valeur est petite, moins H0 semble plausible la lumire des donnes.
Exemple du produit chimique: Soit X1 , X2 Xn i.i.d. N (, = 2.1). Nous
observons x = 6, 2.
H0 : = 5
v.s.
Ha : > 5
La P-valeur du test est donc
P (X 6.2|H0 : = 5)

X 0
6.2 5

/ n
2.1/ 15

P (Z 2.22)

0, 0132

o la variable alatoire Z = n(X 0 )/ est de loi normale standard, du fait que

la loi de la statistique du test, X, est une loi normale N (x = 5, x = 2.1/ 15).

&

UQM - Chapitre 1.

Page 68 de 93

'

Signification statistique

Dans notre dmarche, nous allons tablir des rgles de dcision qui vont nous
conduire lacceptation ou au rejet de lhypothse nulle H0 . Toutefois cette
dcision est fonde sur une information partielle, les rsultats dun chantillon.
Il est donc statistiquement impossible de prendre la bonne dcision coup sr.
En pratique, on met en oeuvre une dmarche qui nous permettrait, long
terme de rejeter tort une hypothse nulle vraie dans une faible proportion de
cas. La conclusion qui sera dduite des rsultats de lchantillon aura un
caractre probabiliste: on ne pourra prendre une dcision quen ayant
conscience quil y a un certain risque quelle soit errone. Ce risque nous est
donn par le seuil de signification du test.
Le seuil de signification du test est la mesure statistique qui indique la
probabilit avec laquelle on est dispos risquer de commettre lerreur de
rejeter tort lhypothse nulle.
Ce risque, consenti donc lavance et que nous notons , snonce en
probabilit ainsi:
= P (rejeter H0 | H0 vraie) .

&

UQM - Chapitre 1.

Page 69 de 93

'

Rgion critique

Aprs avoir tablir lhypothse nulle, le seuil de signification du test , la


nature de la statistique (ou de la variable observe X de la population)
utiliser, il sagit maintenant de determiner la (ou les ) valeur(s) critique(s) de la
statistique du test. Il peut y avoir une ou deux de ces valeurs selon le test est
unilatral ou bilatral. Cest cette valeur critique qui donne(nt) la valeur de la
variable statistique partir de laquelle on rejettera lhypothse nulle.
La rgion critique (appele galement rgion de rejet) dun test est lensemble
des valeurs de lchantillon pour lesquels on rejette lhypothse nulle, on dit
que cest la rgion de rejet de lhypothse nulle associ au test statistique.
Laire de cette rgion correspond la probabilit . Si par exemple, on choisit
= 0.05, cela signifie que lon admet davance que la variable dchantillonnage
peut prendre, dans 5% des cas, une valeur se situant dans la zone de rejet de
H0 , bien que H0 soit vraie et ceci uniquement daprs le hasard de
lchantillonnage.
Sur la distribution dchantillonnage correspondra aussi une rgion
complmentaire, dite rgion dacceptation de H0 (ou rgion de non-rejet) de
probabilit 1 .

&

UQM - Chapitre 1.

Page 70 de 93

'

Dans lexemple de produit chimique et sous lhypothse H0 , la loi de la

statistique du test, X, est une loi normale N (x = 5, x = 2.1/ 15).

Schma de dcision: Il sagit de reprsenter graphiquement le seuil de


signification du test et la rgion de rejet de H0 et de dterminer la valeur
critique pour X sous H0 :

&

la rgion de rejet de lhypothse H0 au seuil de risque 5% est [5, 891; +[.

UQM - Chapitre 1.

Page 71 de 93

'

En effet, les hypotheses confronter taient H0 : = 5 versus Ha : > 5.


Puisquon fait le test au niveau 5% et que P (Z > 1, 645) = 0, 05, alors on
rejette H0 lorsque
X 5

Z=
1, 645
2.1/ 15
si et seulement si

2.1
X 5 + 1, 645
15

si et seulement si
X 5.89,

(la rgion critique)

cest dire P (X 5, 89|H0 ) = 0, 05 .


La quantite moyenne du produit chimique A dans lchantillon de 15 bouteilles
prend la valeur 6.2 ml. Comme cette valeur appartient la rgion de rejet de
H0 , on peut conclure au seuil de risque 5% quon met trop de quantit en
moyenne de ce produit chimique.

&

UQM - Chapitre 1.

Page 72 de 93

'

Exemple 3.

Un standardiste prtend quil reoit en moyenne 2 appels par minutes. Le


patron voudrait dmontrer que le nombre dappels par minute est infrieur 2.
Pour ce faire, il procde de la faon (peu recommandable) suivante. un
moment alatoire de la journe, il entre chez le standardiste et attend larrive
du prochain appel. Il note son temps dattente: 3 minutes. A-t-il lvidence
quil faut pour dclarer que le nombre moyen dappels est infrieur 2?
Formulez une hypothse et une alternative et trouver une rgion critique de
taille = 0, 05?.
Solution: Soit X le temps dattente. On suppose que X Exp(). Soit le
nombre moyen dappels par minute. On veut tester H0 : = 2 contre
Ha : < 2. Or = 1/ et donc H0 : = 1/2 contre Ha : > 1/2. On rejette
H0 si {X C} o C doit satisfaire P (X C| = 1/2) = 0, 05.
P (X C| =

1
1
) = exp(2C) = 0, 05 C = ln(0, 05) = 1, 479.
2
2

Donc on rejette H0 si X 1, 479. Puisque X = 3, 5% de risque derreur, on


rejette H0 et on conclut que < 2.

&

UQM - Chapitre 1.

Page 73 de 93

'

Exemple 4.

Test pour le paramtre dune variable de loi de Poisson: Un dfaut dans la


fabrication des bouteilles se prsente sous la forme de minuscules bulles dans le
verre. Le nombre moyen de bulles dans le verre des bouteilles fabriques par
une certaine compagnie est sens tre de 3 par bouteille si le processus est bien
rgl. On dcide de prlever une bouteille au hasard pour tester lhypothse
que le procd est bien rgl, cest--dire, H0 : = 3. Si la bouteille contient 8
bulles, doit-on rejeter H0 5% de risque derreur?
Solution: Si limportant est de dtecter un procd pour lequel est trop
grand, cest dire si on pose Ha : > 3, on rejettera alors H0 : = 3 lorsque
X C o X est le nombre de boules dans une bouteille et C doit satisfaire la
P (X C | H0 : = 3) 5%.

&

UQM - Chapitre 1.

Page 74 de 93

'

On calcule donc P (X C | = 3) pour diverses valeurs de C, jusqu ce quon


trouve la plus petite valeur qui satisfait P (X C | = 3) 5% (la loi de X
est une P( = 3)).
C

10

P (X C | = 3)

0,1847

0,0839

0,0335

0,0119

0,0038

0,0011

On choisira donc comme point critique C = 7 et la rgion critique est {X 7}


(la taille de cette rgion critique est 0,0335). La rgion critique {X 6} ne
serait pas acceptable car
P (X 6| = 3) = 0, 0839 0, 05 .
X = 8 se trouve dans le rgion critique, on doit alors rejeter H0 5% de risque
derreur.

&

UQM - Chapitre 1.

Page 75 de 93

'

Une faon moins onreuse deffectuer ce test consiste dterminer la P-valeur


au point X = 8, sans ncessairement dterminer le point critique. On a trouv
que P (X 8| = 3) = 0, 0119; et puisque P-valeur < 0,05, on rejette alors ce
test 5% derreur (voir le graphique suivant.)

&

UQM - Chapitre 1.

Page 76 de 93

'

Remarques...

1. Les seuils de signification les plus utilises sont = 0.05 et = 0.01, dpendant
des consequences de rejeter tort lhypothse H0 .
2. La P-valeur est le plus petit niveau auquel les donnes sont significatives.
3. La P-valeur contient plus dinformation que le rsultat dun test avec niveau
de signification fixe. Si un rsultat est significatif au niveau 5%, lest-il au
niveau 1%?
4. Si la P-valeur est infrieure ou gale , le rsultat du test est considre
statistiquement significative au niveau .
5. Un test dhypothse bilatral de niveau rejette lhypothse H0 : = 0 si et
seulement si lintervalle de confiance de niveau 1 pour ne contient pas .
6. tapes dun test
noncer les hypothses nulle et alternative.
(Optionnel) Spcifier le niveau de signification .
Calculer la valeur de la statistique de test.
Calculer la P-valeur pour les donnes observes. Si elle est plus petite que
, le rsultat est significatif au niveau .

&

UQM - Chapitre 1.

Page 77 de 93

'

Test dhypothses et dcision

Lorsquon confronte deux hypothses statistiques laide dun test, on doit


considrer quil y a la ralit (la valeur relle du paramtre) et la dcision qui
est prise. Cela mne deux types derreurs:

Si lhypothse H0 est fausse, on aimerait rejeter H0 le plus souvent possible. La


probabilit quun test de niveau fixe rejette H0 lorsquune alternative
particulire est vraie sappelle la puissance du test envers cette alternative.
La probabilit dune erreur de type I est le niveau de signification et la
probabilit dune erreur de type II, note aussi par , pour une alternative
particulire est 1 moins sa puissance.

&

UQM - Chapitre 1.

Page 78 de 93

'

Dans lexemple de produit chimique: Les hypotheses confronter taient


H0 : = 5 versus Ha : > 5. Supposons quon veut calculer la puissance dun
test de niveau 5% pour lalternative Ha : = 5, 5. Puisquon fait le test au
niveau 5% et que P (Z > 1, 645) = 0, 05, alors on rejette H0 lorsque
X 5.89,

(la rgion critique)

cest dire P (X 5, 89|H0 ) = 0, 05 .


La puissance du test est donc
P (X 5, 89|Ha : = 5, 5)

&

UQM - Chapitre 1.

X 5, 5
5, 89 5, 5

)
2.1/ 15
2.1/ 15

P(

P (Z 0, 904)

0, 1736 .

Page 79 de 93

'

Illustration

Densit de la moyenne sous H0 et Ha

&

UQM - Chapitre 1.

Page 80 de 93

'

Remarques

Le risque de premire espce est choisi priori. Toutefois le risque de


deuxime espce dpend de lhypothse alternative Ha et on ne peut le
calculer que si on spcifie des valeurs particulires du paramtre dans
lhypothse Ha que lon suppose vraie.
Pour un mme risque et une mme taille dchantillon n, on constate
que, si lcart entre la valeur du paramtre pose en H0 et celle suppose
dans lhypothse vraie Ha augmente, le risque diminue.
Une rduction du risque de premire espce (de = 0.05 = 0.01 par
exemple) largit la zone dacceptation de H0 . Toutefois, le test est
accompagne dune augmentation du risque de deuxime espce . On ne
peut donc diminuer lun des risques quen consentant augmenter lautre.
Pour une valeur fixe de et un dtermin, laugmentation de la taille
dchantillon aura pour effet de donner une meilleure prcision puisque

X = / n diminue. La zone dacceptation de H0 sera alors plus


restreinte, conduisant une diminution du risque . Le test est alors plus
puissant.

&

UQM - Chapitre 1.

Page 81 de 93

'

Plus lhypothse alternative sloigne de H0 , plus la puissance augmente.


Si tout le reste demeure fixe, on peut augmenter la puissance dun test en
augmentant la taille de lchantillon.
Considrons lexemple prcdent, on a vu quon rejet H0 : = 5 lorsque

X 5 + 1, 645 2.1/ 15 ou de faon gnrale si X 0 + z / n pour


un test unilatrale droite de niveau : H0 : = 0 v.s. Ha : > 0 .
La puissance pour Ha : = a devient
(a )

=
=
=

P X 0 + z / n | Ha : = a
!

X a
0 + z / n a
P

/ n
/ n


0 a
P Z z +

/ n

Cette fonction de puissance (a ) ( cest aussi 1 (a ) ) est une


fonction croissante en a > m0 et en n et dcroissante en .

&

UQM - Chapitre 1.

Page 82 de 93

'

Exemple 2.

Pour tester lhypothse H0 : p = 0, 4. On prlve des observations une une


jusqu ce quon ait un succs. Soit X le nombre dessais effectus.
a. Montrer que X 6 est une rgion critique de niveau 10% .
Solution: X G(p) et
5

P (X 6|p = 0, 4) = (1 0, 4) = 0, 07776 0, 10.


La rgion critique {X 5} ne serait pas acceptable car
P (X 5|p = 0, 4) = (1 0, 4)4 = 0, 1296 0, 10 .

b. Dterminer la puissance de ce test au point p = 0, 3.


Solution: La fonction de puissance est
5

(pa ) = P (X 6|p = pa ) = (1 pa ) .
au point pa = 0, 3, la puissance du test est: (0, 3) = 0, 16807.

&

UQM - Chapitre 1.

Page 83 de 93

'

c. Une autre approche consiste tirer des observations jusqu ce quon ait
deux succs. Si Y est le nombre dessais effectu considrons la rgion
critique {Y : Y > C}. Pour quelle valeur de C a-t-on un test de niveau
10%? Dterminez la puissance de ce test au point p = 0, 3. Lequel des
deux tests est meilleur?

Solution: Ici X BN (n = 2, p = 0, 4) et on cherche P (X C|p = 0, 4), or


cette probabilit est la mme que la probabilit que les C premiers essais
donnent 0 ou 1 succs: cest dire: P (Y < 2|p = 0, 4) o
Y B(n = C, p = 0, 4). Soit alors
 C
C
0
C
P (X C|p = p0 ) =
p0 (1 p0 ) +
p10 (1 p0 )C1
0
1
Partant de petites valeurs de C, on sarrte la premire pour laquelle
0, 10. On trouve que P (X > 8|p = 0, 4) = 0, 106 et
P (X > 9|p = 0, 4) = 0, 0705. La rgion critique sera donc {Y > 9}.
La fonction de puissance est
(pa )

&

P (X > 9|p = pa )

(1 pa ) + 9pa (1 pa )

0, 196

pour pa = 0, 3

Ce deuxime test est nettement plus puissant.

UQM - Chapitre 1.

Page 84 de 93

'

d. Une troisime approche consiste choisir un nombre fixe dobservations.


Supposons quon prlve un chantillon de taille n = 13. Si Z est le
nombre de succs, considrons la rgion critique {z : z C}. Pour quelle
valeur de C a-t-on un test de niveau 10%? Comment ce test compare-t-il
aux deux premiers?
Solution: Z B(n = 13; p), et
P (Z 3|p = 0, 4) = 0, 169

et

P (Z 2|p = 0, 4) = 0, 057 .

La rgion critique sera donc {Z 9}. De mme, la puissance du test au


point p = 0, 3 est
(0, 3)

=
=
=

P (Z 2|p = 0, 3)
 13
 13
 13
0
13
1
12
2
11
(0, 3) (0, 7) +
(0, 3) (0, 7)
(0, 3) (0, 7) +
1
2
0
0, 202 .

Puissance suprieure encore celle des deux premiers, malgr une rgion
critique de taille infrieure.

&

UQM - Chapitre 1.

Page 85 de 93

'

e. Remarquez quavec le test en (a), il ne sera jamais ncessaire de traiter


plus de 5 patients. Ainsi la comparaison avec le test en (d) qui utilise 13
patients, est injuste. Reprenez le test avec n = 5.
Solution: Soit W le nombre de succs en 5 essais. On rejette H0 si
{W 0}; la taille de cette rgion critique est
P (W 0|p = 0, 4) = (1 p)5 = (1 0, 4)5 = 0, 07776 .
La fonction de puissance est (p) = (1 p)5 . Soit (0, 3) = 0, 16807 . Ce test
est donc identique au premier.

&

UQM - Chapitre 1.

Page 86 de 93

'

Test pour dune normale avec connue

Soit X1 , X2 , . . . , Xn i.i.d. N (, ) avec lcart type connu. Considrons


lhypothse nulle
H0 : = 0 .

Sous cette hypothse, X N (0 , / n), la valeur de la statistique de test est


z=

x 0

/ n

(1)

et Z a une distribution normale standard. Donc la P-valeur de H0 v.s.


Ha

> 0

est

P (Z > z)

Ha

< 0

est

P (Z < z)

Ha

6= 0

est

2P (Z > |z|)

o Z N (0, 1) et z est donne par (1).


Ces P-valeurs sont exactes si les Xi sont normales et approximativement
correctes lorsque n est grand si la loi des Xi nest pas normale.

&

UQM - Chapitre 1.

Page 87 de 93

'

Exemple

Le National Center for Health Statistics rapporte que la moyenne de la pression


systolique pour les cadres masculins de 35-44 ans est de 128 avec un cart type
de 15. Le directeur mdical dune compagnie se rend compte que pour les 72
cadres dans ce groupe dge de sa compagnie, x = 126, 07. Est-ce suffisant pour
conclure que la pression artrielle systolique moyenne dans la compagnie diffre
de la moyenne nationale?
Les hypothses sont H0 : = 128 versus Ha : 6= 128. La statistique de test a
pour valeur
x 0
126, 07 128

z=
= 1, 09 .
=
/ n
15/ 72
La P-valeur est 2P (Z > | 1, 09|) = 0, 2758, donc on na pas beaucoup
dinformation lencontre de H0
Note: Les donnes ne dmontrent pas que la moyenne est de 128. Tout au plus,
on peut dire que les donnes ne contredisent pas H0 . Mais on na pas dmontr
que H0 est vraie.

&

UQM - Chapitre 1.

Page 88 de 93

'

Test avec niveau de signification fixe

La P-valeur de certains tests nest pas toujours facile calculer. Parfois on


dtermine lavance le niveau de signification. Pour ce faire, on doit dterminer
la rgion critique, soit les valeurs de Z pour lesquelles on va rejeter H0 .
Pour tester H0 : = 0 lorsque X1 , X2 , . . . , Xn i.i.d. N (, ) avec lcart
type connu, on calcule la valeur de la statistique de test
z=

x 0
.
/ n

On rejette H0 au niveau de signification contre lhypothse unilatrale

ou

Ha

> 0

si

z > z

Ha

< 0

si

z < z

o z est le point critique suprieur de niveau .


Si lalternative est bilatrale, Ha : 6= 0 , alors on rejette H0 lorsque
|z| > z/2 o z/2 est le point critique suprieur de niveau /2.

&

UQM - Chapitre 1.

Page 89 de 93

'

Exemple

Test SAT dadmission luniversit. Le pointage typique la partie mathmatique


de cet examen est habituellement de 475. La distribution du pointage est normale
avec un cart type de 100. Mais comme ce nest quune minorit des finissants du
secondaire qui font lexamen, quelquun fait le commentaire suivant: Si tous les
finissants du secondaire faisaient lexamen, la moyenne ne dpasserait pas 450.
Afin de vrifier cette hypothse, on fait une exprience. On prend un E.A.S. de 500
finissants de la Californie et la moyenne de leur pointage est de x = 461. Y a-t-il
suffisamment dvidence pour rejeter lhypothse que la moyenne ne dpasse pas
450?
On fait le test au niveau 1%. Les hypothses sont H0 : = 450 versus Ha : > 450.
On obtient
x 0
461 450
z=
= 2, 46 .

=
/ n
100/ 500
Parce que lhypothse Ha est unilatrale, on rejette H0 si z est suprieur au point
critique. Puisque P (Z > 2, 326) = 0.01, dans notre cas, z = 2, 46 > 2, 326 et on
rejette alors H0 au niveau 1%.
Notez que la P-valeur est P (Z > 2, 326) = 0, 0069 < 0, 01.

&

UQM - Chapitre 1.

Page 90 de 93

'

Test pour avec inconnu

Soit X1 , X2 , . . . , Xn i.i.d. N (, ) avec lcart type inconnu. Considrons


lhypothse nulle
H0 : = 0 .

Sous cette hypothse, T = n(X 0 )/s t(n 1), la valeur de la statistique


de test est
x 0
t=
(2)
.
s/ n
Donc la P-valeur de H0 v.s.
Ha

> 0

est

P (T > t)

Ha

< 0

est

P (T < t)

Ha

6= 0

est

2P (T > |t|)

o T t(n 1) et t est donne par (2).


Ces P-valeurs sont exactes si les Xi sont normales et approximativement
correctes lorsque n est grand si la loi des Xi nest pas normale.

&

UQM - Chapitre 1.

Page 91 de 93

'

Test avec niveau de signification fixe

Si on dtermine lavance le niveau de signification, on dtermine alors la


rgion critique, soit les valeurs de T o T t(n 1) pour lesquelles on va
rejeter H0 .
Pour tester H0 : = 0 lorsque X1 , X2 , . . . , Xn i.i.d. N (, ) avec lcart
type inconnu, on calcule la valeur de la statistique de test
t=

x 0
.
s/ n

On rejette H0 au niveau de signification contre lhypothse unilatrale

ou

Ha

> 0

si

t > t

Ha

< 0

si

t < t

o t est le point critique suprieur de niveau dune t(n 1).


Si lalternative est bilatrale, Ha : 6= 0 , alors on rejette H0 lorsque |t| > t/2
o t/2 est le point critique suprieur de niveau /2.

&

UQM - Chapitre 1.

Page 92 de 93

'

Test pour une proportion

Soit pb la proportion de succs dans un E.A.S. de taille n dune population o la


probabilit de succs est p (ou encore X B(n, p) et pb = X/n). On a vu dans
un des chapitres que si n est grand, la distribution de pb est approximativement
p
N (p, p(1 p)/n).
Pour faire de linfrence, on a besoin destimer lcart type. Pour tester
p
H0 : p = p0 , on peut alors utiliser p0 (1 p0 )/n (puisque si p = p0 alors
V ar(b
p) = p(1 p)/n = p0 (1 p0 )/n). La statistique du test est:
Z= p

(3)

p0 (1 p0 )/n

La P-valeur approximative de H0 v.s.

&

pb p0

Ha

p > p0

est

P (Z > z)

Ha

p < p0

est

P (Z < z)

Ha

p 6= p0

est

2P (Z > |z|)

o Z N (0, 1) et z est donne par (3).

UQM - Chapitre 1.

Page 93 de 93

S-ar putea să vă placă și