Stats Cours Tests Parametriques

Cours de Tests parametriques
F. Muri-Majoube et P. Cenac
2006-2007
Licence
Ce document est sous licence ALC TYPE 2. Le texte de cette licence est egalement consul-
table en ligne à ladresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Article 1
La presente licence sadresse à tout utilisateur de ce document. Un utilisateur est toute
personne qui lit, telecharge ou reproduit ce document.
Article 2
La licence rappelle les droits de lauteur sur son document et les prerogatives quil a entendu
conceder aux utilisateurs. Chaque utilisateur est donc tenu de lire cette licence et den respecter
les termes.
Article 3
La licence accompagne le document de manière intrinsèque. Tout utilisateur qui reproduit le
document et le cède à un tiers est tenu de ceder la licence. La licence simpose alors à ce tiers,
et ce meme en cas de cessions successives. En outre, cette licence ne peut en aucun cas etre
modiee.
Article 4
Toute concession accordee par lauteur sur ses droits, conformement à lobjet de lassociation
qui est de promouvoir lenseignement et le partage des connaissances, ne vaut que tant que
lexploitation du document est faite à titre gratuit. Lutilisation du document dans le cadre
dun enseignement payant ne constitue pas une utilisation à titre commerciale au sens de la
presente licence. Le recouvrement de sommes correspondant à des frais de port ou de mise sur
support na pas pour eet dattribuer un caractère commercial à lexploitation du document.
Ces frais ne peuvent en aucun cas exceder les sommes deboursees pour ces services.
Article 5
Lauteur autorise tout utilisateur à reproduire et representer son oeuvre, sur tout support,
dès lors que lutilisation, privee ou publique, est non commerciale, et sous reserve du respect
des dispositions de larticle 6. La reproduction partielle du document est autorisee sous reserve
du respect des dispositions de ce meme article.
Article 6
Lutilisateur doit respecter les droits moraux de lauteur : aussi bien la paternite de lauteur
que lintegrite de loeuvre. Ainsi, le nom de lauteur doit toujours etre clairement indique, meme
en cas de reproduction ou representation partielle. En cas de reproduction ou representation
partielle, il devra etre precise quil ne sagit que dun extrait, et reference devra etre faite à
loeuvre integrale. Aucune modication du document nest autorisee, à lexception des modi-
cations apportees par lauteur lui-meme.
Article 7
Aucun apport ou actualisation nest autorise pour ce document. Lutilisateur qui desirerait
apporter une precision ou actualiser le document, nest pas autorise à le faire. Il peut toutefois
soumettre sa proposition à lauteur, via lassociation, an dobtenir une autorisation. Ainsi,
cette licence nouvre aucun droit à contribution. De meme, toute traduction est interdite, ou
soumise à laccord de lauteur.
Article 8
Toute infraction à la presente licence pourrait constituer une atteinte aux droits de lauteur
sur son oeuvre. Dans tous les cas, le non-respect de la licence sera susceptible de fonder une
action en justice.
Article 9
En cas de litige, la loi francaise sera la seule applicable.
Table des matières
1 Demarche 1
1.1 Objectifs du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Description et nature des hypothèses . . . . . . . . . . . . . . . . . . . . 8
1.3.2 Erreurs commises, qualite dun test . . . . . . . . . . . . . . . . . . . . . 9
1.4 Construction dun test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Degre de signication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Tests sur les moyennes 15
2.1 Comparaison dune moyenne observee à une moyenne theorique . . . . . . . . . 15
2.1.1 Grands echantillons de loi quelconque . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Comparaison dune proportion observee à une proportion theorique . . . . . . . 23
2.3 Test degalite dune variance à une valeur xe . . . . . . . . . . . . . . . . . . . 25
2.3.1 Cas des grands echantillons de loi quelconque . . . . . . . . . . . . . . . 25
2.3.2 Cas des petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . 26
3 Tests de comparaison 27
3.1 Comparaison de deux moyennes observees . . . . . . . . . . . . . . . . . . . . . 27
3.1.1 Grands echantillons de loi quelconque . . . . . . . . . . . . . . . . . . . . 27
3.1.2 Petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Comparaison de deux proportions . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Comparaison de deux variances (cas gaussien) . . . . . . . . . . . . . . . . . . . 35
i
Chapitre 1: Demarche
1.1 Objectifs du cours
Un test statistique est un procede dinference : son but est denoncer des proprietes de la
population en sappuyant sur un echantillon dobservations. A laide dun test, on construit
aussi des intervalles de conance qui expriment le degre dincertitude associe à une simulation.
Lobjectif du test est de repondre à des problèmes decisionnels dans un environnement incertain.
Par exemple, on peut se demander à partir dun echantillon si la taille des hommes est dierente
de la taille des femmes, si un nouveau medicament est vraiment plus ecace ou encore si
lincidence du cancer du poumon est plus elevee actuellement quil y a vingt ans. On ne dispose
en pratique que dun echantillon soumis aux uctuations pour repondre à ces questions. Lobjet
des tests statistiques est de distinguer ce qui est plausible de ce qui est trop peu vraisemblable.
Ce cours introduit les concepts necessaires pour developper et appliquer les tests parametri-
ques.
1.2 Exemple introductif
Presentation du problème
On suppose que la teneur en cacao (en grammes par kg) des tablettes dun certain fabricant
est une v.a. X de loi N(600, 75
2
). Le fabricant declare avoir trouve un nouveau procede de
conception qui assure une qualite superieure du chocolat en garantissant une plus grande teneur
en cacao, cest-à-dire que la teneur en cacao de ses tablettes est une variable aleatoire de loi
N(, 75
2
), avec > 600, disons = 650 pour xer les idees.
On eectue un controle de qualite sur n = 9 tablettes fabriquees avec le nouveau procede, et
les teneurs en cacao (en grammes par kg) sont les suivantes :
580 ; 614 ; 700 ; 590 ; 660 ; 630 ; 640 ; 645 ; 620
Ces donnees, notees x
1
, . . . , x
n
, sont les realisations de n variables aleatoires independantes
(X
1
, . . . , X
n
), de meme loi N(, 75
2
), o` u X
i
represente la teneur en cacao de la i
eme
tablette
testee (1 i n). Lindependance implique labsence dinuence dune variable sur les autres
et le fait que les X
i
aient la meme loi implique en particulier que
E(X
1
) = E(X
2
) = = E(X
n
) =
Var(X
1
) = Var(X
2
) = = Var(X
n
) =
2
= (75)
2
On veut savoir si le fabricant dit la verite, cest-à-dire determiner laquelle des deux hypothèses
est la bonne entre
1
= 600, le nouveau procede nest pas meilleur
= 650, le nouveau procede est meilleur comme le pretend le fabricant.
Pour cela, on va eectuer un test statistique. : on va tester lhypothèse
H
0
: = 600 contre H
1
: = 650.
Principe du test
On se place du point de vue du consommateur qui hesite à opter pour le nouveau procede
qui co ute plus cher. Lexperience doit etre convaincante : il nabandonnera H
0
quen presence de
faits experimentaux contredisant nettement la validite de H
0
. On va etablir une procedure qui
va permettre de conclure quant à lacceptation ou le rejet de H
0
avec un risque xe à lavance.
Comment decider ?
La question porte sur lesperance de la variable. Pour prendre en compte les 9 experiences, il
est logique de raisonner à partir dun estimateur de . On pense de facon naturelle à lestimateur
empirique

X =
1
n
9
i=1
X
i
, dont on connat la loi sous H
0
(et sous H
1
). On rappelle que

X est un
estimateur sans biais de , E(

X) = (il vise bien en moyenne), et que Var(

X) =

2
n
= 25
2
.
Ceci decoule des proprietes suivantes.
Rappel 1 : Soient Y et Z deux v.a. et soient a et b deux reels, alors
E(aY +bZ) = aE(Y ) +bE(Z) et Var (aY +b) = a
2
Var(Y ).
Si de plus, Y et Z sont independantes, Var (Y +Z) = Var(Y ) + Var(Z).
Vous avez vu (cf. cours destimation) que dune part

X converge en moyenne quadratique vers
et dautre part que

X converge en probabilite vers . Lestimateur

X est donc un estimateur
consistant.
De plus,

X N(, 25
2
) car les X
i
sont independants et de meme loi N(, 75
2
). En eet,
Rappel 2 : Soient Y et Z deux v.a. gaussiennes independantes telles que Y N(
1
,
2
1
) et
Z N(
2
,
2
2
), alors
aY +bZ N
_
a
1
+b
2
, a
2
2
1
+b
2
2
2
_
.
Autrement dit, la somme de deux v.a. gaussiennes independantes est gaussienne, ce qui
setend aux n v.a. X
1
, X
2
, . . . , X
n
, qui sont iid, avec E(X
i
) = et Var(X
i
) =
2
.
Rappel 3 : Soit X
1
, . . . , X
n
un n-echantillon de la loi N(,
2
), alors
n
i=1
X
i
N
_
n, n
2
_
,
soit encore
X =
1
n
n
i=1
X
i
N
_
,

2
n
_
.
2
Ainsi, sous H
0
,

X N
_
600, 25
2
_
, et sous H
1
,

X N(650, 25
2
). On notera
X
H
0
N(600, 25
2
) et

X
H
1
N(650, 25).
Si

X est petit , on choisira H
0
.
Si

X est grand, on rejettera H
0
, pour choisir H
1
.
Le problème est de savoir à partir de quelle valeur on choisit H
1
plutot que H
0
, i.e. de
determiner la zone de rejet et la zone dacceptation de H
0
, i.e. de determiner le reel c
tel que
si

X c
, on accepte H
0
,
si

X > c
, on rejette H
0
.
Erreurs commises
Lors de la prise de decision, on peut commettre deux erreurs :
Decision H
0
H
1
Realite
H
0
Decision correcte Erreur de première espèce
proba 1 proba
H
1
Erreur de seconde espèce Decision correcte
proba proba 1
Lerreur de première espèce est lerreur que lon commet lorsquon rejette H
0
à tort, cest-
à-dire lorsquon choisit H
1
alors que H
0
est vraie.
La probabilite de commettre cette erreur, que lon appelle le risque de première espèce,
est notee P(rejeter H
0
à tort) = P
H
0
(rejeter H
0
). Pour un niveau de test , on impose que
P
H
0
(rejeter H
0
) .
Pour notre exemple, lerreur de première espèce est
= P(rejeter H
0
à tort) = P
H
0
(rejeter H
0
) = P
H
0
(

X > c
).
Lerreur de deuxième espèce est lerreur que lon commet lorsquon accepte H
0
à tort, cest-
à-dire lorsquon ne rejette pas H
0
alors quelle est fausse ; la probabilite de commettre cette
erreur, que lon appelle le risque de deuxième espèce, est notee erreur, que lon appelle
le risque de deuxième espèce, est notee avec
= P(accepter H
0
à tort) = P
H
1
(accepter H
0
).
Dans notre exemple, lerreur de deuxième espèce est
= P
H
1
(

X c
).
3
On introduit une dissymetrie dans ces erreurs. On considère que lerreur de première espèce
est plus grave. On construit le test à partir de cette erreur. On xe tout dabord le risque de
première espèce , puis on cherche à minimiser celui de deuxième espèce, qui servira à juger de
la qualite du test construit.
On commence par choisir c
pour que la probabilite de rejeter H

0
à tort, i.e. de se tromper
en acceptant H
1
, soit petite, par exemple egale à 0, 05. Autrement dit, on xe c
pour quil y
ait 5 chances sur 100 que, si H
0
est vraie, lechantillon ne donne pas une valeur de

X comprise
dans la zone dacceptation de H
0
. H
0
est donc privilegiee : on veut avant tout controler le risque
de rejeter H
0
à tort. On est donc pret à rejeter H
0
si le resultat fait partie dune eventualite
improbable nayant que 5% de chances de se produire.
On cherche donc c
tq
P
H
0
(rejeter H
0
) = P
H
0
(

X > c
) = = 0, 05
(ce seuil c
na que 5% de chances detre depasse). Or pour notre exemple, on a vu que sous

H
0
,

X N(600, 25
2
) et
X 600
25
N(0, 1). Ainsi,
P
H
0
(

X > c
) = P
H
0
_

X 600
25
>
c
600
25
_
= P
_
Y >
c
600
25
_
,
o` u Y N(0, 1). Dans la table de la loi N(0, 1), on lit la valeur
c
600
25
telle que
P
H
0
_
Y >
c
600
25
_
= 0, 05
On trouve
c
600
25
= 1, 645, soit encore c
= 600 + 25 1, 645 = 641, 125.

On en deduit la règle de decision suivante :
Si

X 641, 125, on accepte H
0
;
Si

X > 641, 125, on rejette H
0
pour accepter H
1
(avec une proba de 5% de se tromper).
Lensemble {
X > 641, 125} sappelle la zone ou region de rejet de H

0
au niveau 5%, que lon
notera ZR
5%
, et {
X 641, 125} la zone dacceptation de H

0
, notee ZA
5%
, au risque 5%.
Mise en oeuvre : on observe que x = 631 < 641, 125, donc on conserve H
0
: = 600
(au risque 5%).
Attention : accepter H
0
ne signie pas que cette hypothèse est vraie mais seulement que
les donnees ne sont pas incompatibles avec H
0
, et que lon na pas de raison susante de lui
preferer H
1
compte-tenu des resultats de lechantillon. Ce nest pas parce quune experience ne
conduit pas au rejet de H
0
, que H
0
est vraie (dautres experiences pourraient la rejeter).
4
On a choisi c
pour que la probabilite de se tromper en rejetant H

0
soit 0, 05. Quelle est
la probabilite de se tromper en acceptant H
0
? Sous H
1
, on a vu que

X N(650, 25
2
) et donc
X 650
25
N(0, 1). On en deduit
P
H1
(accepter H
0
) = P
H1
(

X 641, 125)
= P
H1
_

X 650
25
0, 12
_
= P
H1
_

X 650
25
0, 12
_
= 1 P
H1
_

X 650
25
< 0, 12
_
= 1 0, 5478 = 0, 4522
ce qui est considerable. La forme de ZR
est indiquee par la nature de H

1
mais le seuil c
ne
depend que de H
0
et de , la deuxième erreur nintervient pas. H
0
est privilegiee : on veut
avant tout controler le risque de rejeter H
0
à tort. On voit donc que les 2 hypothèses H
0
et H
1
ne jouent pas le meme role.
La probabilite de rejeter H
0
à tort est choisie au depart
P
H
0
(rejeter H
0
) = (parfois on a seulement une inegalite )
o` u est le niveau du test.
La probabilite daccepter H
0
à tort
= P
H
1
(accepter H
0
)
peut donc etre relativement grande. On va chercher à minimiser cette erreur , ce qui
revient à maximiser la puissance du test
= P(rejeter H
0
quand elle est fausse) = 1 = P
H
1
(rejeter H
0
).
La puissance mesure laptitude du test à rejeter une hypothèse fausse. Dans notre exemple, la
puissance est
1 = P
H
1
(

X > 641, 125) = 1 0, 4522 = 0, 5478
La puissance du test est dautant plus grande que la duree de vie des ampoules est importante
(on seloigne de H
0
). Le test de niveau 5% a 55 chances sur 100 de detecter une duree de vie
de 650 (ou plus).
Que se passe-til quand le niveau du test varie ?
Si grandit, P
H
0
(rejeter H
0
) grandit, on tolère donc une plus grosse probabilite derreur en
acceptant H
1
: on accepte plus facilement H
1
; ainsi diminue, et la puissance augmente.
Si diminue (decrot vers 0), 1 augmente, et la règle de decision est plus stricte : on
nabandonne H
0
que dans des cas rarissimes, et on conserve H
0
bien souvent à tort. A force
de ne pas vouloir abandonner H
0
, on la garde presque tout le temps, ainsi augmente,
et la puissance diminue.
5
Lideal serait davoir un niveau petit, et une grande puissance. Un moyen dy parvenir
est daugmenter le nombre n dobservations (n ).
Nombre dobservations necessaires pour obtenir, à un niveau xe, une puissance donnee
Pour le niveau = 5% xe, calculons le nombre dobservations necessaires pour avoir une
puissance de 80%. On a
= 0, 05 = P
H
0
(

X c
)
1 = 0, 80 = P
H
1
(

X > c
)
On a vu que sous H
0
,

X N
_
600,
75
2
n
_
et sous H
1
,

X N
_
650,
75
2
n
_
. On en deduit,
= 0, 05 = P
H
0
_
n(

X 600)
75
>
n(c
600)
75
_
= 0, 05 = P
H
0
_
Z >
n
(c
600)
75
_
o` u Z N(0, 1). On lit dans la table de la loi normale N(0, 1),
n(c
40)
75
= 1, 645, soit
c
= 1, 645
75
n
+ 600 . De plus, on a aussi
1 = 0, 80 = P
H
1
_
n(

X 650)
75
>
n(c
650)
75
_
1 = 0, 80 = P
H
1
_
Z >
n
(c
650)
75
_
.
On lit dans la table de la loi normale N(0, 1) que
n(c
650)
75
= 0, 84. En reportant la
valeur de c
du premier encadre, dans cette dernière equation, on trouve

0, 84 =
n
_
1, 645
75
n
+ 600 650
_
75
= 1, 645 +
n(600 650)
75
soit
n = (1, 645 + 0, 84)

75
(600 650)
n = (1, 645 + 0, 84)
2
5625
(600 650)
2
= 13, 89
Il faudrait au moins n = 14 observations pour avoir, au niveau 5% une puissance de 80%.
Remarque (Lien avec les intervalles de conance). On a choisi c
tel que P
H
0
(

X > c
) = 0, 05,
cest-à-dire tel que P
H
0
(

X c
) = 0, 95, soit encore P

H
0
_
X ] , c
]
_
= 0, 95. Lintervalle
I
5%
=] , c
] est un intervalle de conance non symetrique au risque 5% de lestimateur

X,
6
sous lhypothèse H
0
( 600). En eet, on a bien P
H
0
(

X I
5%
) = 95%; autrement dit, sous
H
0
, on prend un risque de 5%, lorsquon parie, avant dobserver une realisation de

X, que cette
realisation va tomber dans lintervalle I
5%
. On a bien s ur P
H
0
(

X / I
5%
) = 5%. Ainsi, on peut
formuler la règle de decision suivante :
Si

X / I
5%
, on rejette H
0
,
Si

X I
5%
, on accepte H
0
.
Point de vue du fabricant
On se place cette fois du point de vue du fabricant qui hesite à opter pour H
1
car il ne
gagnera de largent que si son procede est utilise. On reprend donc le meme exemple, mais en
testant cette fois
H
0
: = 650 contre H
1
: = 600.
A nouveau le test est base sur un bon estimateur de , lestimateur empirique

X. Cette fois,
sous H
0
,

X N(650, 25
2
), et sous H
1
on a

X N(600, 25
2
). Contrairement au test precedent,
Si

X est petit, on choisira H
1
,
Si

X est grand, on choisira H
0
.
On en deduit la règle de decision,
Si

X < c
, on rejette H
0
,
Si

X c
, on accepte H
0
,
o` u c
est tel que P

H
0
(rejetter H
0
) = P
H
0
(

X < c
) = xe.
Test au niveau 5%
determination de c
: On cherche c
tel que P
H
0
(

X < c
) = 0, 05. Sous H
0
,

X N(650, 25
2
),
et donc

X650
25
N(0, 1). On en deduit
P
H
0
(

X < c
) = P
H
0
_

X 650
25
<
c
650
25
. .
0
_
= P
H
0
_

X 650
25
>
650 c
25
_
(rappelons quune loi gaussienne est symetrique !) Ainsi on obtient
P
H
0
(

X < c
) = 0, 05 1 P
H
0
_

X 650
25

650 c
25
_
= 0, 05
P
H
0
_

X 650
25

650 c
25
_
= 0, 95
On lit sur la table de la loi N(0, 1),
650 c
25
= 1, 645 et ainsi c
= 608, 875.
mise en oeuvre : x = 631 > 608, 75, donc on accepte H
0
; cette fois, on conserve lhypothèse
= 650.
Juste avec cet exemple, on voit que les hypothèses H
0
et H
1
ne jouent pas un role symetrique ;
il est donc très important de bien choisir les hypothèses H
0
et H
1
.
7
1.3 Cadre general
On sinteresse à une population P au travers dun caractère X (qualitatif ou quantitatif).
Souvent la loi de X depend dun (ou plusieurs) paramètre inconnu(s). La statistique inferentielle
permet de transporter les conclusions concernant les resultats dun echantillon (X
1
, , X
n
)
de meme loi que X à la population entière dont il est issu, en quantiant les erreurs que lon
risque de commettre. Il existe essentiellement deux classes de methodes :
la theorie de lestimation pour estimer un (ou plusieurs) paramètres par un nombre (esti-
mation ponctuelle) ou par un intervalle (estimation par intervalle) ;
la theorie des tests pour emettre et trancher entre deux hypothèses au vu des resultats de
lechantillon.
On dispose de n donnees x
1
, , x
n
realisations de n variables aleatoires X
1
, , X
n
. On
va chercher à tester des hypothèses portant sur la loi de probabilite du n-uplet (X
1
, , X
n
)
modelisant les observations. On se placera essentiellement dans le cadre o` u les X
i
sont indepen-
dantes et identiquement distribuees (iid). On eectue un test de H
0
contre H
1
, H
0
et H
1
etant
deux hypothèses portant sur la loi de X
1
, X
n
.
La construction dun test va consister à etablir une règle de decision permettant de faire un
choix entre les deux hypothèses H
0
et H
1
au vu dun echantillon de meme loi que X.
1.3.1 Description et nature des hypothèses
Denition 1. Lhypothèse H
0
est appelee hypothèse nulle, et lhypothèse H
1
est
hypothèse alternative.
Choix des hypothèses : H
0
est lhypothèse privilegiee
Lhypothèse H
0
appelee hypothèse nulle est celle que lon garde si le resultat de lexperience
nest pas clair. On conserve H
0
sauf si les donnees conduisent à la rejeter. Quand on accepte
H
0
, on ne prouve pas quelle est vraie ; on accepte de conserver H
0
car on na pas pu ac-
cumule susamment delements materiels contre elle ; les donnees ne sont pas incompatibles
avec H
0
, et lon na pas de raison susante de lui preferer H
1
compte-tenu des resultats de
lechantillon. Ne pas rejetter H
0
, cest acquitter faute de preuve. On nabandonne pas H
0
sans de solides raisons. Lhypothèse H
1
contre laquelle on teste H
0
est appelee contre hypothèse
ou hypothèse alternative.
Analogie Test/Procès : tout suspect est presume innocent et laccusation doit apporter la
preuve de sa culpabilite avant de le condamner. Cette preuve doit sappuyer sur des elements
materiels comme le test qui utilise les donnees pour rejeter H
0
.
Selon les cas, on choisit pour lhypothèse nulle :
lhypothèse quil est le plus grave de rejeter à tort. On a vu que la probabilite de rejeter H
0
à tort est choisie aussi petite que lon veut. On choisit donc H
0
et H
1
de telle sorte que le
8
scenario catastrophique soit daccepter H
1
alors que H
0
est vraie : ce scenario le pire a
ainsi une petite probabilite ( est xee) de se realiser.
lhypothèse dont on a admis jusquà present la validite, H
1
representant la contre hypothèse
suggeree par une nouvelle theorie ou une experience recente.
lhypothèse qui permet de faire le test (seule hypothèse facile à formuler et sous laquelle
on peut eectuer le calcul de la loi dune variable aleatoire sur laquelle on peut fonder le
test). Cette dernière raison, purement technique, est evidemment la moins bonne.
Exemples
1. On veut faire un test pour savoir si un pont va secrouler ou pas. Le scenario le pire est
daccepter que le pont ne secroulera pas alors quen fait il va secrouler. Ainsi, on testera
H
0
: le pont secroule contre H
1
: le pont ne secroule pas.
2. On veut faire un test pour savoir si un medicament a des eets secondaires dangereux ou
pas. Le scenario le pire est daccepter quil ny a pas deets secondaires dangereux, alors
quil y en a. On testera donc H
0
: le medicament a des eets secondaires dangereux
contre H
1
: le medicament na pas deets secondaires dangereux.
Remarque. Le scenario catastrophique depend souvent du point de vue considere.
Revenons à lexemple introductif. Si le nouveau procede co ute plus cher que lancien, le scenario
catastrophique pour le consommateur est de decider = 650 (le procede le plus cher est utilise)
alors quen fait = 600 (le plus cher nest pas mieux que lancien). Donc, du point de vue du
consommateur, on teste H
0
: = 600 contre H
1
: = 650. Mais si le fabricant qui a invente le
nouveau procede de conception des tablettes gagne une grosse prime si son procede est utilise
dans le commerce, le scenario catastrophique pour lui est que lon accepte = 600 (son procede
nest pas utilise) alors quen fait = 650 (son procede devrait etre utilise). Donc, du point de
vue du fabricant, on teste H
0
: = 600 contre H
1
: = 650.
Comme en general, le test est realise par lexperimentateur pour prouver que H
1
est vraie,
le test est dit signicatif lorsquil permet, une fois realise, de conclure au rejet de H
0
. On
prouve H
1
par le rejet de H
0
.
Les dierents types dhypothèse et de test
Il existe plusieurs types dhypothèses. Une hypothèse est dite parametrique si elle porte sur
la valeur dun ou plusieurs paramètres, sinon elle est dite non parametrique.
Une hypothèse est dite simple si elle specie completement la loi de la variable aleatoire
consideree, ou le paramètre considere. Sinon elle est dite multiple.
1.3.2 Erreurs commises, qualite dun test
Lors de la prise de la decision de rejetter ou non lhypothèse H
0
, on peut commettre deux
erreurs. Les situations possibles lors de la prise de decision ont dejà ete resumees dans le tableau
de la section 1.2 de lexemple introductif.
9
La strategie consiste à xer le niveau du test et à imposer que le risque de première espèce
soit inferieur à . On est donc pret à rejeter H
0
si le resultat fait partie dune eventualite
improbable. Lhypothèse H
0
est privilegiee : on veut avant tout controler le risque de rejeter
H
0
à tort. Une fois le risque de première espèce controle par , on cherchera alors à minimiser
le risque de deuxième espèce , qui sera du coup une fonction de .
Puissance
La qualite dun test est donnee par sa capacite à separer les deux hypothèses H
0
et H
1
. Elle
est mesuree par la puissance du test qui est la probabilite daccepter H
0
quand H
1
est vraie.
Cette puissance est donc donnee par
= P(rejeter H
0
quand elle est fausse) = 1 () = P
H
1
(rejeter H
0
).
La puissance mesure laptitude du test à rejeter une hypothèse fausse. Cest un mesure de
la qualite du test. Pour un niveau xe, on va chercher à obtenir une grande puissance .
Rien ne dit que conserver H
0
mette à labri de se tromper. La probabilite daccepter H
0
à tort
est , et cette probabilite (qui ne se calcule que si lon connat la loi de T
n
sous H
1
) peut etre
très importante, contrairement à qui est xe aussi petit quon veut à lavance. Les hypothèses
H
0
et H
1
ne jouent donc pas un role symetrique.
1.4 Construction dun test
A partir dobservations x
1
, . . . , x
n
, qui sont les realisations de n variables aleatoires X
1
, . . . , X
n
,
on va chercher à tester des hypothèses de modelisation portant sur la loi de X
1
, . . . , X
n
. Les
dierentes etapes de la construction dun test sont les suivantes.
Description de lhypothèse nulle H
0
et de lhypothèse alternative. Souvent, la loi
commune des X
i
depend dun (ou plusieurs) paramètre , et H
0
est une assertion concer-
nant . Dans lexemple introductif, la loi des X
i
est une loi normale dependant de deux
paramètres, esperance et variance
2
. Nous avons fait un test portant sur le paramètre
= .
Construction de la statistique de test. Le test est base sur lutilisation dune statis-
tique de test, T
n
, fonction des variables aleatoires X
1
, , X
n
, en general liee à un estima-
teur. La statistique de test T
n
est une variable aleatoire dont on connat la loi sous H
0
et
qui a un comportement dierent sous H
1
, que sous H
0
(

X dans lexemple precedent). La
decision va porter sur la valeur prise par cette variable aleatoire .
Règle de decision et forme de la region de rejet. La statistique de test T
n
permet
de construire la region de rejet de H
0
. Intuitivement, on rejette H
0
quand T
n
est loin de
H
0
, vers H
1
. On determine donc la règle de decision :
_
si T ZR
alors on rejette H
0
,
si T / ZR
alors on accepte H
0
,
10
o` u ZR
sappelle la region de rejet de H

0
du test de niveau et doit etre telle que
P
H
0
(T ZR
) = P
H
0
(rejeter H
0
) = P(rejeter H
0
à tort) ,
o` u est le niveau du test xe à lavance.
On peut egalement formuler la règle de decision en terme de zone dacceptation :
_
si T ZA
alors on accepte H
0
si T / ZA
alors on rejette H
0
ZA
sappelle la region dacceptation de H

0
du test de niveau et doit etre telle que
P
H
0
(T ZA
) = 1 .
Mise en uvre du test : calcul exact de la region de rejet et conclusions. Soit t
la realisation de T,
Si t ZR
alors on rejette H
0
. En eet, si H
0
etait vraie, il aurait ete alors très peu pro-
bable dobtenir les resultats que lon a trouves. Les donnees sont en contradiction avec H
0
.
Si t / ZR
alors on accepte H
0
: les donnes ne sont pas en contradiction avec H
0
.
Remarque. Il est necessaire de connatre la loi de la statistique de test T
n
sous H
0
pour pou-
voir calculer lerreur de première espèce et ainsi construire la region de rejet. Il est egalement
necessaire que T
n
ait un comportement dierent sous H
0
et sous H
1
; mais dans de nombreux
cas, on ne connat pas la loi de T
n
sous H
1
, ce qui nempeche pas de construire le test.
Remarque (Lien entre tests et zones de conance). Construire une region de conance I
, au
risque , sous H
0
, pour les realisations de T
n
, revient à construire un test de H
0
au niveau .
En eet, si I
est une region de conance de risque pour les realisations de T

n
, on a
P
H
0
(T I
) = 1 .
Cest-à-dire que lon a
P
H
0
(T / I
) = 1 P
H
0
(T I
) = .
On peut donc construire un test de règle de decision
_
si T / I
alors on rejette H
0
,
si T I
alors on accepte H
0
.
Dans notre exemple, on a construit un test de
H
0
: = 600 contre H
1
: = 650.
On a montre que lensemble {
X > 641, 125} est une zone de rejet de H

0
au niveau 5%. Lin-
tervalle I
5%
=] ; 641, 125] est un intervalle de conance non symetrique de

X au risque 5%,
sous lhypothèse H
0
. Cest-à-dire que sous H
0
, on prend un risque de 5% lorsquon parie, avant
dobserver une realisation de

X, que cette realisation va tomber dans I
5%
.
11
1.5 Degre de signication
Lorsque le test nest pas signicatif (cest-à-dire quon ne rejette pas H
0
, on peut se demander
à quel niveau H
0
serait rejettee. Ce niveau est appele degre de signication ou probabilite
critique (P-value).
Soit t une realisation de la statistique de test T. Le degre de signication mesure la probabilite
dobtenir t sous lhypothèse H
0
. Cest une mesure de laccord entre lhypothèse testee et le
resultat obtenu. Plus il est proche de 0, plus forte est la contradiction entre H
0
et le resultat
de lechantillon, et plus on rejettera H
0
avec assurance.
Revenons à lexemple introductif, o` u lon testait H
0
: = 600 contre H
1
: = 650 au niveau
= 5%. La règle de decision etait
Si

X > 641, 125, on rejette H
0
pour accepter H
1
,
Si

X 641, 125, on accepte H
0
.
On a observe que x = 631 < 641, 125, donc on accepte H
0
: = 600. Le test nest donc
pas signicatif à 5%. On peut se demander sil le serait par exemple à 10%. On peut aussi se
demander dans quelle mesure la moyenne dechantillon observee x = 631 est compatible avec
lhypothèse H
0
: = 600, cest à dire, determiner P
H
0
(

X > 631) (probabilite que, sous H
0
,
la statistique de test

X soit > à la valeur reellement observee x). Cest ce que lon appelle le
degre de signication
s
. Calculons, pour cet exemple, le degre de signication
s
= P
H
0
(

X > 631) = P
H
0
_

X 600
25
>
631 600
25
_
= P
H
0
_

X 600
25
> 1, 24
_
= 1 P
H
0
_

X 600
25
1, 24
_
= 1 0, 8925 = 0, 1075 11%
Le degre de signication est assez eleve. Cela signie que si la nouvelle conception de tablettes
de chocolat netait pas meilleure (i.e. sous H
0
), les seules uctuations dechantillonage auraient
11 chances sur 100 de conduire à une valeur de

X aussi grande (> 631). Ici,
s
> et donc
x / ZR
, on accepte H
0
.
En fait, le degre de signication est le plus petit niveau
s
pour lequel le test correspondant
serait signicatif.
Remarque. Le degre de signication ne peut etre calcule quune fois que les observations
ont ete faites : cest le niveau du test obtenu en choisissant la zone de rejet de H
0
la plus
petite possible qui contienne lobservation. Dans notre exemple, cest le niveau du test de
region de rejet {
X > 631}.
Un test est dautant plus signicatif, cest-à-dire probant en ce qui concerne lalternative
H
1
, que son degre de signication est plus petit.
s
mesure la conviction avec laquelle on
arme que le test est signicatif. Calculer le degre de signication evite le problème de se
xer un risque à lavance pour eectuer le test.
Beaucoup de logiciels statistiques eectuent automatiquement les tests en donnant le degre
de signication. En fonction du risque choisi, on decide si on accepte ou non H
0
: il sut
de comparer
s
à : si
s
< on rejette H
0
.
12
Generalement on admet que :
degre de signication signicativite du test
0, 01 <
s
0, 05 signicatif
0, 001 <
s
0, 01 très signicatif
s
0, 001 hautement signicatif
Remarque. Ne pas confondre signicativite avec dimportante distance entre et H
0
. Si le test
est puissant, il peut etre hautement signicatif avec pourtant un ecart faible entre et H
0
. Il
existe aussi des tests non signicatifs avec pourtant une grande distance entre et H
0
. Ce sont
des tests peu puisants.
13
14
Chapitre 2: Tests sur les moyennes
(On parle aussi de tests sur lesperance. On ne se limitera dans ce chapitre quaux tests sur
les moyennes à un echantillon)
On va sinteresser ici à un (ou plusieurs) caractère quantitatif X dune population P dont
on veut etudier la moyenne (lesperance) E(X)
def
= . On note
2
def
= Var(X). On considèrera
dans la suite, que lon dispose dune observation (x
1
, , x
n
) constituee des mesures du ca-
ractère X faites sur un echantillon : on considère (x
1
, , x
n
) comme la realisation dun
nuplet (X
1
, , X
n
) de variables aleatoires independantes et de meme loi que X. On dira
que (X
1
, , X
n
) est un n-echantillon de (la loi de) X.
2.1 Comparaison dune moyenne observee à une moyenne theorique
On considère donc un n-echantillon (X
1
, , X
n
) de X desperance E(X
i
) = E(X) = et de
variance Var(X
i
) = Var(X) =
2
.
Faire un test de comparaison dune moyenne observee avec une moyenne theorique revient à
repondre à la question suivante. La variable quantitative X a-t-elle une moyenne egale à une
valeur
0
donnee à lavance ? Il sagit donc de juger de la pertinence de lhypothèse
H
0
: =
0
o` u
0
est la moyenne theorique. La quantite dont on dispose pour pouvoir juger est la realisation
x de la moyenne empirique du n-echantillon de X
X =
1
n
n
i=1
X
i
.
X est un estimateur de . Il est naturel de rejeter H

0
si lecart

X
0
entre
0
et cet estimateur
est trop grand. La diculte est de quantier lecart acceptable d u à lalea de lestimateur. Il
va sagir de reconnatre un faible ecart d u à lalea de lestimateur, dun ecart signicatif non
expliquable par les simples uctuations de lestimateur.
Quelle est lalternative qui nous interesse quand H
0
est inacceptable ?
1. Une alternative unilaterale H
1
: >
0
,
2. H
1
: <
0
(alternative unilaterale) ?
3. ou une alternative bilaterale : H
1
: =
0
?
15
Si H
0
est rejetee au prot de
1. H
1
, on rejetera H
0
pour les valeurs trop grandes de

X
0
2. H
1
, on rejetera H
0
pour les valeurs trop petites de

X
0
, ou encore pour les
valeurs trop grandes de
0

X,
3. H
1
, on rejetera H
0
pour les valeurs trop grandes de lecart absolu |
X
0
|.
Quelle est la loi de

X
0
sous H
0
?
En pratique, on va distinguer plusieurs cas :
la variance
2
de X est-elle connue ou inconnue ?
a-ton un grand echantillon (de loi quelconque) pour utiliser le TCL, ou un petit echantillon
de loi normale ?
On rappelle que
Rappel 4 : (Theorème Central Limite) Soit X
1
, X
2
, . . . , X
n
un n-echantillon de loi X, desperan-
ce et de variance
2
. On note la moyenne empirique
X
n
=
X
1
+X
2
+ +X
n
n
.
La loi de X
n
, lorsque n est susamment grand, est approximativement une N
_
, n
1
2
_
. Plus
precisement, si lon note
Z
n
=
n
_
X
n
et F
n
(x) la fonction de repartition de Z
n
, alors lim
n
F
n
(x) = F(x), o` u
F(x) =
1
2
_
x
z
2
2
dz est la fonction de repartition de la loi N (0, 1) .
Cest-à-dire que lon a
lim
n
P
_
n
_
X
n
m
_
< x
_
= P(Z < x) , o` u Z N (0, 1) .
On dit alors que Z
n
converge en loi vers Z, et on note Z
n
L
n
Z.
2.1.1 Grands echantillons de loi quelconque
On considère un n-echantillon (X
1
, . . . , X
n
) de X avec E(X
i
) = , et Var(X
i
) =
2
. On rappelle
(cf. cours destimation) que lestimateur empirique

X
n
est un estimateur consistant de . De
plus, pour un grand echantillon (cest-à-dire pour n grand), on peut appliquer le TCL et ainsi
n(

X )
N(0, 1).
Sous lhypothèse H
0
: =
0
on a alors
T
n
def
=
n(

X
0
)
N(0, 1). (2.1.1)

16
La statistique T
n
ne depend que des observations et des paramètres connus que si est connue.
Sinon, il faudra utiliser une estimation de cet ecart-type an de ne conserver dans la statistique
que des variables connues ou observees.
Cas o` u la variance
2
est connue
Test de H
0
: =
0
contre H
1
: =
0
On considère comme statistique de test la variable T
n
denie en (2.1.1), de sorte que, sous
H
0
,
T
n
N(0, 1).
Sous H
1
, T
n
prend des valeurs plus petites ou plus grandes que sous H
0
. En eet, sous H
1
,
X
n
se comporte en moyenne comme , et =
0
. Ainsi T aura tendance à prendre des
grandes valeurs positives ou negatives.
Pour un test de niveau (xe par exemple à 5%), on en deduit la règle de decision suivante.
Si T
n
> c
ou T
n
< c
, cest-à-dire si |T
n
| > c
, on rejette H
0
.
Si c
T
n
c
, cest-à-dire si |T
n
| c
, on accepte H
0
.
Le seuil c
est tel que P

H
0
(rejeter H
0
) = P
H
0
(|T
n
| > c
) = . On cherche c
tel que
P
H
0
(T
n
c
) = P
H
0
(T
n
> c
) /2. Comme sous H

0
, T
n
N(0, 1), on choisit le
quantile c
tel que P(N(0, 1) c
) = 1 /2.
Mise en oeuvre : on note t
n
=

n(x
n

0
)/ la realisation de T
n
, on rejetera H
0
si
|t
n
| > c
, on acceptera H
0
si |t
n
| c
.
Test de H
0
: =
0
contre H
1
: >
0
Sous H
0
, T
n
N(0, 1), et sous H
1
, T
n
prend des valeurs plus grandes que sous H
0
.
On en deduit la règle de decision suivante.
Si T
n
> c
, on rejette H
0
.
Si T
n
c
, on accepte H
0
.
c
est tel que P

H
0
(rejeter H
0
) = P
H
0
(T > c
) = , pour un niveau de test xe.

Mise en oeuvre : on note t
n
=

n( x
0
n
, on rejetera H
0
si
t
n
> c
.
Test de H
0
: =
0
contre H
1
: <
0
Sous H
0
, T
n
N(0, 1), et sous H
1
, T
n
prend des valeurs plus petites que sous H
0
.
On en deduit la règle de decision suivante.
Si T
n
< c
(< 0), on rejette H

0
.
Si T
n
c
, on accepte H
0
.
c
est tel que P

H
0
(rejeter H
0
) = P
H
0
(T < c
) = . Notons que c
est negatif.
Mise en oeuvre : soit t
n
=
n( x
0
n
. On rejetera H
0
si t
n
< c
.
Remarque. On peut aussi eectuer les tests
H
0
:
0
contre H
1
: >
0
17
ou encore
H
0
:
0
contre H
1
: <
0
.
Pour le premier test, la construction est basee sur le choix de c
tel que P
H
0
(T
n
> c
) =
;
le risque depend de , et sous H
0
, peut prendre toutes les valeurs reelles telles que
0
.
Mais en fait, correspond au risque maximum que lon accepte de prendre en rejetant H
0
à tort, cest-à-dire = sup
H
0

. On construira donc nalement la zone de rejet en

utilisant la valeur
0
seule qui correspond au risque le plus eleve. Le niveau du test est
la valeur la plus elevee du risque atteinte en =
0
. On peut donc confondre le niveau
du test (risque maximum) et le risque
qui depend de , car lorsque lon teste des

hypothèses simples du type H
0
: =
0
, le risque maximum est atteint en =
0
.
Exemple : Une petite usine fabrique des portes dont la hauteur est une variable aleatoire
desperance = 2.5 mètres et de variance
2
= 10
4
. Pour verier si ses machines sont
bien reglees, le nouveau directeur de lusine fait mesurer les hauteurs de cents portes tirees
au hasard et observe x
100
= 2.4 mètres.
Les machines sont-elles bien reglees ? (on prendra comme niveau de test = 5%)
Soit X la hauteur dune porte desperance E(X) = (taille moyenne dune porte) et de
variance Var(X) =
2
= 10
4
. On note X
i
la hauteur de la i
` eme
porte, pour i = 1, . . . , 100.
On a donc E(X
i
) = et Var(X
i
) = 10
4
.
On souhaite donc tester H
0
: = 2, 5 contre H
1
: = 2, 5.
On considère la statistique de test
T
n
=
100(

X
100
2, 5)
10
4
On a vu que sous H
0
, T
n
N(0, 1) daprès le TLC.
Règle de decision :
si |T
n
| > c
on rejette H
0
,
si |T
n
| c
on accepte H
0
,
o` u c
est tel que P

H
0
(|T
n
| > c
) = 0, 05. Pour lire la valeur de c
dans la table de la loi

gaussienne centree reduite, on peut utiliser la symetrie de cette loi :
P
H
0
(|T
n
| > c
) = P
H
0
(T
n
> c
) +P
H
0
(T
n
< c
)
= P
H
0
(T
n
> c
) +P
H
0
(T
n
> c
)
= 2
_
(1 P
H
0
(T
n
c
)
_
P
H
0
(|T
n
| > c
) = P
H
0
(T
n
c
) = 1

2
Dans la table de la N(0, 1), on lit la valeur de c
telle que P
H
0
(T
n
c
) = 1
0,05
2
= 0, 975.
On trouve c
= 1, 96. Donc si |T
n
| > 1, 96 on rejetera H
0
.
Mise en oeuvre : x
n
= 2, 4 et ainsi t
n
= 10(2, 42, 5)/10
2
= 100. On rejette donc H
0
;
18
la dierence est signicative au niveau 5% (les machines sont signicativement mal reglees).
Degre de signication
s
= P
H
0
(|T
n
| > 100) = 2
_
1 P
H
0
(T
n
100)
_
2(1 1) 0
Donc
s
0%. Lecart entre la moyenne observee et la moyenne theorique 2, 5 est signi-
catif à 0%. Ce qui signie que, si les machines etaient bien reglees (i.e. sous H
0
), les seules
uctuations dechantillonnage nauraient que 0 chances sur 100 de conduire au resultat
observe, cest-à-dire une moyenne de 2.4 au lieu de 2.5.
2
est inconnue
Lorsque la variance
2
= Var(X) est inconnue, il faut, comme pour les intervalles de conance,
remplacer
2
par un estimateur (consistant) de
2
.
Test de H
0
: =
0
contre H
1
: =
0
Lorsque
2
est connue, on utilise comme statistique de test T
n
. On peut prendre comme
estimateur de
2
,
S
2
e
=
1
n
n
i=1
(X
i

X)
2
ou S
2
=
1
n 1
n
i=1
(X
i

X)
2
,
ou tout autre estimateur consistant de
2
. On choisit le plus souvent S
2
qui est un estima-
teur sans biais de
2
.
Resultat (admis) : Sous H
0
, U
n
=
n(

X
0
)
S
2
suit approximativement une N(0, 1).
On procède alors de la meme manière que dans le cas o` u
2
est connue.
si |U
n
| > c
, on rejette H
0
,
si |U
n
| c
, on accepte H
0
,
o` u le seuil c
est tel que P

H
0
(rejeter H
0
) = P
H
0
(|U
n
| > c
) = , pour un niveau de
test xe (par exemple à 5%). Or sous H
0
, U
n
N(0, 1), on cherche donc c
tel que
P(N(0, 1) c
) = 1 /2.
Mise en oeuvre : si u
n
=

n(x
n

0
)/S est la realisation de U
n
, on rejetera H
0
si
|u
n
| > c
et on acceptera H
0
si |u
n
| c
.
Exemple : Le benece mensuel moyen dune succursale dune chane de magasins est egal
à 300 000. An daugmenter ses marges, cette chane de magasins a decide dadopter une
nouvelle politique de gestion des stocks pour lensemble de ses succursales. On note X
i
la
19
variable aleatoire representant le benece de la i
` eme
succursale. Une etude menee sur 50
succursales a donne les valeurs observees suivantes :
1
50
50
i=1
x
i
= 314 600
_
1
49
50
i=1
(x
i
x
n
)
2
= 25 000
La nouvelle politique est-elle plus ecace que lancienne ?
La loi de X
i
est inconnue ; E(X
i
) = benece mensuel moyen, Var(X
i
) =
2
inconnue.
On teste H
0
: = 300 000 contre H
1
: > 300 000
Sous H
0
, U
50
=
50(X
n
300 000)
S
2
N(0, 1), et sous H
1
, U
50
prend des valeurs plus
grandes que sous H
0
. La règle de decision est si u
50
> c
on rejette H
0
, sinon on accepte
H
0
, o` u c
est tel que P

H
0
(U
n
> c
) = 0, 05. On lit dans la table de la loi gaussienne,

c
= 1, 64.
Mise en oeuvre : u
50
=
50(314 600 300 000)/25 000 = 4, 13 > 1, 64, donc le test

est signicatif au niveau 5% : la nouvelle politique est signicativement plus ecace.
Degre de signication :
s
= P
H
0
(U
n
> 4, 13) = 1 P
H
0
(U
n
4, 13) 0
Remarque. Pour les tests de H
0
contre toutes les autres alternatives ( =
0
, <
0
, >
0
),
on procède aussi comme dans le cas o` u la variance est connue, en remplacant cette variance
par un estimateur consistant.
2.1.2 Petits echantillons gaussiens
Lorsque lon a aaire à des petits echantillons, on ne peut plus appliquer le TLC. Il faut donc
une hypothèse supplementaire sur la loi commune des X
i
, pour connatre la loi de T
n
sous H
0
.
On suppose maintenant que lon a un n-echantillon (X
1
, . . . , X
n
) gaussien, X
i
N(,
2
).
Sous H
0
, on connat alors la loi exacte (et non plus une approximation de la loi ) de X
n
et par
consequent de T
n
aussi.
Sous H
0
, T
n
=
n(X
n
0
)
N(0, 1)
A nouveau, T
n
nest utilisable directement comme statistique de tests (cest-à-dire comme
fonction des observations) que si
2
est connue.
2
est connue
On utilise la statistique de test T
n
dont la loi exacte sous H
0
est une N(0, 1). La procedure
pour eectuer chacun des tests est alors la meme que precedemment.
20
Exemple : Le PDG dune chane de magasins à grande surface voudrait savoir sil doit entre-
prendre une campagne publicitaire à lechelon national pour augmenter la vente de ses produits.
Pour prendre une decision, il fait une campagne publicitaire dans 5 villes et observe les accrois-
sements X
i
de beneces correspondants. On suppose que X
i
N(, 2) o` u = 0 si la campagne
est inecace, et > 0 si la campagne est ecace. Les accroissements de benece observes dans
les 5 villes sont : 1 ; 1, 5 ; 0 ; 1 ; 0, 5.
La campagne est-elle signicativement ecace ? (on fera le test à 5%).
On teste donc H
0
: = 0 contre H
1
: > 0.
Sous H
0
, T
n
=
5(

X 0)/2 N(0, 1), et sous H
1
, T
n
a tendance à prendre des valeurs plus
grandes.
Si T
n
> c
, on rejette H
0
,
si T
n
c
on accepte H
0
,
o` u c
est tel que P

H
0
(T
n
> c
) 0, 05. On lit dans la table de la loi gaussienne c
= 1, 64.
Mise en oeuvre : t
n
=
5(0, 8 0)/2 = 0, 89 < 1, 64, donc on accepte H

0
, la campagne
nest pas signicativement ecace.
s
= P
H
0
(T
n
> 0, 89) = 1 P
H
0
(T
n
0, 89) = 1 0, 8133 = 0, 1867.
Donc
s
= 18, 67% > = 5%.
2
est inconnue
On eectue encore le test de H
0
: =
0
contre H
1
: =
0
.
On ne peut plus utiliser la statistique de test precedente puisque
2
est inconnue. On estime
alors
2
par S
2
. Dans le cas dun echantillon gaussien, on sait alors que
U
n
=
n(

X
0
)
S
2
H
0
St(n 1),
o` u St(d) est une loi de Student à d degres de liberte.
Rappel 5 : Si Y et Z sont deux variables aleatoires independantes telles que Y N(0, 1) et
Z
2
(n), alors
Y
_
Z
n
St(n) (loi de Student à n degres de liberte).
Rappel 6 : Si Y
1
, . . . , Y
n
sont n variables aleatoires independantes de meme loi N(0, 1), alors
Y =
n
i=1
Y
2
i

2
(n) (Loi du chi deux à n degres de liberte).
21
Rappel 7 : Soit (X
1
, . . . , X
n
) un n-echantillon gaussien de loi N(, ). Alors
X
n
_
S
2
n
=
n(X
n
)
S
St(n 1) et
(n 1)S
2
2

2
(n 1).
En eet,
n(X
n
)
S
2
=
n 1
n(X
n
)
_
(n 1)
S
2
N(0, 1)
_
2
(n 1)
n 1
.
Nous avons donc (n 1)
S
2
2

2
(n 1) et sous H
0
,
n(X
n
0
)
N(0, 1). Donc sous H

0
,
U
n
=
n(X
n
0
)
S
2
St(n 1).
si |U
n
| > c
, on rejette H
0
,
si |U
n
| c
, on accepte H
0
.
c
est tel que P

H
0
(|U
n
| > c
) = . La valeur du seuil c
se lit cette fois dans la table de la

St(n 1).
On procède de meme pour les autres hypothèses alternatives ( <
0
, >
0
, =
1
, ...).
Remarque. Ces resultats sont valables pour nimporte quel echantillon gaussien, quil soit grand
ou petit.
Exemple : On suppose que le taux de cholesterol dun individu est une variable aleatoire X
de loi normale desperance et de variance
2
. Une etude epidemiologique a mis en evidence
que les individus atteints dune maladie C presentent un fort taux de cholesterol de 4 g / litre.
Des medecins decident de sassurer de lecacite dun nouveau medicament M suppose faire
baisser le taux de cholesterol. Pour cela, ils mesurent le taux de cholesterol sur un echantillon
de n = 10 individus atteints de la maladie C, traites par le nouveau medicament M. On observe
les resultats suivants :
10
i=1
x
i
= 37.2 et
10
i=1
x
2
i
= 139.58,
o` u x
i
designe la realisation de la variable aleatoire X
i
representant le taux de cholesterol obtenu
après traitement par le medicament M, du i
` eme
individu teste. Le nouveau medicament M est-il
signicativement ecace ?
On souhaite donc tester H
0
: = 4 contre H
1
: < 4.
Sous H
0
, U
10
=
10(X
n
4)/
S
2
St(9). On verie aisement que U
10
secrit en fonction
des deux estimateurs 10X
10
et
X
2
i
dont on connat les observations,
U
10
=
10(X
n
4)
_
1
9
n
i=1
X
2
i

1
90
(10X
10
)
2
.
22
si U
10
< c
, on rejette H
0
,
si U
10
c
, on accepte H
0
.
c
est tel que P

H
0
(U
10
< c
se lit cette fois dans la table de la St(9).

Pour un niveau de 5%, on trouve c
= 1, 833.
Mise en oeuvre : u
n
=
10(3, 72 4)/0.36 = 2, 43 < 1.833, donc on rejette H

0
, le
medicament est signicativement ecace.
s
= P
H
0
(U
n
< 2, 43) 1 0, 975 = 0, 025.
Donc
s
= 2, 5% < = 5%.
2.2 Comparaison dune proportion observee à une proportion theorique
On sinteresse cette fois à une proportion p inconnue dindividus possèdant un caractère X
dans une population P. Par exemple, la proportion dindividus dintentions de votes favorables
à un candidat. La variable X est denie par {X = 1} si lindividu possède la propriete en
question (dans lexemple, si il est favorable au candidat) et {X = 0} sinon (defavorable). On
a P(X = 1) = p, P(X = 0) = 1 p, et X B(p). On rappelle que pour une loi de Bernoulli
de paramètre p on a E(X) = p et Var(X) = p(1 p). Ce cadre est donc un cas particulier de
test de moyennes avec cette fois un n-echantillon (X
1
, . . . , X
n
) de X de loi B(p), desperance
def
= E(X
i
) = E(X) = p et de variance
2
def
= Var(X
i
) = Var(X) = p(1 p).
On rappelle que la proportion aleatoire dindividus de lechantillon (possèdant le caractère)
notee P
n
= X
n
=
1
n
n
i=1
X
i
est un bon estimateur de la proportion p inconnue dans la popula-
tion.
Test de H
0
: p = p
0
contre H
1
: p = p
0
Le test va etre construit autour de lestimateur P
n
de p, plus exactement à partir de la
dierence P
n
p
0
. Si on dispose dun echantillon susamment grand (n > 30), on peut
appliquer le theorème central limite pour approcher la loi de P par une loi normale :
P
n
N
_
p,
p(1 p)
n
_
,
soit encore

n(P
n
p)
_
p(1 p)
N (0, 1) .
On pourrait estimer la variance p(1 p) par un estimateur consistant (P
n
(1 P
n
) par
exemple) mais cest inutile puisque sous H
0
, p = p
0
, et donc sous H
0
, p(1p) = p
0
(1p
0
).
On construit donc le test à partir de la statistique de test
T
n
=
n(P
n
p
0
)
_
p
0
(1 p
0
)
23
Et sous H
0
,
T
n

H
0
N (0, 1)
si |T
n
| > c
, on rejette H
0
,
si |T
n
| c
, on accepte H
0
.
Le seuil c
est tel que P

H
0
(|T
n
| > c
se lit dans la table de la

N (0, 1).
Si on note p
n
la realisation de P
n
sur lechantillon, et t
n
=

n( p p
0
)/
_
p
0
(1 p
0
) celle
de T
n
, on rejetera H
0
si |t
n
| > c
.
On procède de la meme manière pour les autres formes dhypothèse alternative H
1
.
Exemple 1 Une machine doit etre mise à la casse si elle produit strictement plus de 10%
de pièces defectueuses. Pour savoir si lon doit remplacer une certaine machine, on prelève
au hasard 70 pièces fabriquees par cette machine, et on constate que 8 dentre elles sont
defectueuses. On notera p la proportion de pièces defectueuses fabriquees par cette macine.
Doit-on acheter une nouvelle machine ? (test à 5%)
Soit p la proportion de pièces defectueuses produites par une machine. On veut tester
lhypothèse H
0
: p = 0, 1 contre H
1
: p > 0, 1 (p
0
= 0, 1).
Soit X
i
la v.a. representant letat de la ième pièce fabriquee par la machine (X
i
= 1 si la
ième pièce est defectueuse et 0 sinon), X
i
B(p).
p est estimee par P
n
=
n
i=1
X
i
la proportion aleatoire de pièces defectueuses de lechantillon.
La taille n = 70 de lechantillon est susamment grande pour appliquer le TCL, et la
statistique de test est
T
n
=
n(P
n
0.1)
_
0.1(1 0.1)
H
0
N (0, 1) .
si T
n
> c
on rejette H
0
,
si T
n
c
on accepte H
0
.
Le seuil c
est tel que P

H
0
(T
n
> c
) = = 5%. Comme T
n

H
0
N (0, 1), on lit c
dans la
table de la N (0, 1) tel que P(N (0, 1) c
) = 1 = 0.95. On trouve c
= 1.645.
Mise en oeuvre : Sur lechantillon, on trouve p
n
= 8/70 = 0, 11 (0.11 est une estimation
ponctuelle de p), et t
n
= 0.398. t
n
< c
donc on accepte H
0
à 5%. Le test est non signicatif.
Exemple 2 En 2004, 42% des franciliens travaillaient à plus de 30 kms de leur domicile.
Pour estimer la proportion de franciliens qui, en 2006, travaillent à plus de 30 kms de
leur domicile, on a eectue un sondage sur 2000 franciliens ; parmi les 2000 personnes
interrogees, 860 dentre elles ont declare travailler à plus de 30 kms de leur domicile. La
proportion de franciliens travaillant à plus de 30 kms de leur domicile a-t-elle evolue de
manière signicative entre 2004 et 2006 ?
24
Soit p la proportion de franciliens travaillant à plus de 30 kms de leur domicile en 2006.
On veut tester H
0
: p = 0, 42 contre H
1
: p = 0, 42.
Exemple 3 En 1990, 38% des parisiens allaient regulièrement (au moins une fois par
semaine) au cinema. Une enquete realisee en 1997 indique que sur 1000 personnes inter-
rogees, 350 dentre elles vont regulièrement au cinema. Y a t-il une baisse signicative de
la frequentation des salles de cinema parisiennes entre 1990 et 1997 ?
Soit p la proportion de parisiens allant regulièrement au cinema en 1997. On veut tester
H
0
: p = 0, 35 contre H
1
: p < 0, 35.
2.3 Test degalite dune variance à une valeur xe
On considère donc un n-echantillon (X
1
, . . . , X
n
) de X desperance E(X
i
) = E(X) = et de
variance Var(X
i
) = Var(X) =
2
.
On se propose detudier la question : la variable (quantitative) X a-t-elle une variance
Var(X) =
2
egale à une valeur
2
0
donnee à lavance ? Pour repondre à cette question, nous
allons eectuer le test de lhypothèse nulle
H
0
:
2
=
2
0
o` u
2
0
est une valeur xee, contre les alternatives
2
>
2
0
,
2
<
2
0
, ou
2
=
2
0
. Ce test est
base sur lestimation de la variance
2
par lestimateur

2
= n
1
n
i=1
(X
i
)
2
, quand est
connue et par lestimateur S
2
= (n 1)
1
n
i=1
(X
i
X
n
)
2
, quand est inconnue. On suppose
dans la suite que E(X
4
i
) existe et est nie. Comme precedemment, nous allons distinguer le cas
des grands echantillons de lois quelconques des petits echantillons gaussiens.
2.3.1 Cas des grands echantillons de loi quelconque
Cas o` u est connue
La variance
2
peut etre estimee par

2
n
=
1
n
n
i=1
(X
i
)
2
. Notons Z
i
def
= (X
i
)
2
. Ainsi,
2
n
secrit en fonction des variables Z
i
puisque

2
n
= Z
n
. De plus, les variables aleatoires Z
i
sont i.i.d., desperance
2
et de variance
4
+E(X
i
)
4
. On peut donc appliquer le Theorème
Central Limite aux variables Z
i
et obtenir que
n(
2
n
2
)
_
1
n1
n
i=1
(Z
i
Z
n
)
2
L
n
N(0, 1).
Tester une egalite sur la variance de X
i
revient à tester une egalite sur la moyenne de Z
i
. On
construit donc le test de la meme facon, à partir de la statistique de test
n(
2
n
2
)
_
1
n1
n
i=1
(Z
i
Z
n
)
2
.
25
Cas o` u est inconnue
2.3.2 Cas des petits echantillons gaussiens
Cas o` u est connue
La variance
2
peut etre estimee par

2
n
. Notons à nouveau Z
i
def
= (X
i
)
2
. Les variables
aleatoires Z
i
sont i.i.d. de loi gaussienne N
_
2
,
4
+E(X
i
)
4
_
. Ainsi, on a
n(
2
n
2
)
_
1
n1
n
i=1
(Z
i
Z
n
)
2
St(n 1).
Cas o` u est inconnue
On utilise la statistique de test (n 1)S
2
/
2
0
. En eet, sous H
0
cette statistique suit une loi
2
(n 1).
26
Chapitre 3: Tests de comparaison
Nous avons vu jusquà present des test de moyennes (et proportions) à partir dun echantillon.
On comparait la moyenne dun caractère dune population à une valeur de reference. Nous allons
maintenant eectuer des tests de comparaison de moyennes dun meme caractère à partir de
deux echantillons extraits de deux populations. La generalisation à plus de deux populations
sera faite dans le cas gaussien dans le cadre du cours de lanalyse de la variance (modèle lineaire).
3.1 Comparaison de deux moyennes observees
On dispose de mesures dune meme grandeur sur deux echantillons extraits, independamment,
de deux populations dierentes :
(X
1
, . . . , X
n
1
), deectif n
1
, extrait dune population de moyenne E(X
i
) =
1
et de variance
Var(X
i
) =
2
1
; on note X
n
la moyenne, et S
2
1
la variance de cet echantillon;
(Y
1
, , Y
n
2
), deectif n
2
, extrait dune population de moyenne E(Y
i
) =
2
, et de variance
Var(Y
i
) =
2
2
; on note Y
n
la moyenne, et S
2
2
la variance de cet echantillon;
Problème pose : On se demande si la moyenne de cette grandeur est la meme dans les deux
populations. On veut donc tester
H
0
:
1
=
2
contre lalternative bilaterale H
1
:
1
=
2
,
ou contre lalternative unilaterale H
1
:
1
<
2
,
ou contre lautre lalternative unilaterale H
1
:
1
>
2
.
Par exemple, on sinteresse à la taille des hommes et des femmes dun pays ; on note
1
la
taille moyenne des femmes et
2
la taille moyenne des hommes. On peut chercher à tester si la
taille des hommes est signicativement superieure à celle des femmes, cest-à-dire H
0
:
1
=
2
contre H
1
:
1
<
2
.
Il est naturel de fonder les tests de H
0
sur lecart X
n
Y
n
entre les moyennes observees des
deux echantillons. Sous lhypothèse H
0
, la dierence observee X
n
Y
n
doit avoir une esperance
nulle puisque E(X
n
) E(Y
n
) =
1
2
= 0. Il faut donc connatre la loi de X
n
Y
n
sous H
0
.
On va une nouvelle fois distinguer deux cas : les grands echantillons de loi quelconque, et les
petits echantillons gaussiens.
3.1.1 Grands echantillons de loi quelconque
Si les tailles dechantillons n
1
et n
2
sont grandes, on sait daprès le TLC que, approximati-
vement, on a
X
n
N
_
1
,

2
1
n
1
_
et Y
n
N
_
2
,

2
2
n
2
_
.
27
Comme les deux echantillons sont independants, X
n
et Y
n
sont independants et quapproxima-
tivement sous H
0
, on a
X
n
Y
n
N
_
0,

2
1
n
1
+

2
2
n
2
_
,
soit encore,
X
n
Y
n
_
2
1
n
1
+

2
2
n
2
N (0, 1) .
On ne peut utiliser directement cette variable aleatoire comme statistique de test que lorsque
les variances des deux populations sont connues.
Cas o` u les variances
2
1
et
2
2
sont connues
Test de H
0
:
1
=
2
contre H
1
:
1
=
2
La statistique de test est
T
n
=
X
n
Y
n
_
2
1
n
1
+

2
2
n
2
Sous H
0
, T
n
N (0, 1). Sous H
1
, T
n
a tendance à prendre des valeurs plus petites ou plus
grandes.
si |T
n
| > c
on rejette H
0
,
si |T
n
| c
, on accepte H
0
.
Le seuil c
est tel que P

H
0
(|T
n
| > c
) = , i.e. tel que P

H
0
(T
n
> c
) = /2. La valeur de
c
est lue dans la table de la N (0, 1).

Test de H
0
:
1
=
2
contre H
1
:
1
>
2
Sous H
0
, T
n
=
X
n
Y
n
r
2
1
n
1
+
2
2
n
2
N (0, 1). Sous H
1
, T
n
a tendance a prendre des valeurs plus
grandes.
si T
n
> c
on rejette H
0
,
si T
n
c
, on accepte H
0
,
o` u c
est tel que P

H
0
(T
n
> c
) = .
Test de H
0
:
1
=
2
contre H
1
:
1
<
2
Sous H
0
, T
n
=
X
n
Y
n
r
2
1
n
1
+
2
2
n
2
N (0, 1). Sous H
1
, T
n
a tendance a prendre des valeurs plus
petites.
si T
n
< c
(c
> 0) on rejette H
0
,
si T
n
c
, on accepte H
0
,
o` u c
est tel que P

H
0
(T
n
< c
) = .
28
2
1
et
2
2
sont inconnues
On remplace respectivement
2
1
et
2
2
par leurs estimateurs consistants et sans biais
S
2
X
=
1
n
1
1
n
1
i=1
(X
i
X
n
)
2
et S
2
Y
=
1
n
2
1
n
2
i=1
(Y
i
Y
n
)
2
.
On utilise alors la statistique de test
T
n
=
X
n
Y
n
_
S
2
X
n
1
+
S
2
Y
n
2
Sous H
0
, T
n
N (0, 1) approximativement, et on procède de meme que precedemment.
2
1
et
2
2
sont inconnues mais egales
Si les variances sont inconnues mais egales
2
1
=
2
2
=
2
, on estime la valeur commune
2
par
S
2
=
(n
1
1)S
2
X
+ (n
2
1)S
2
Y
n
1
+n
2
2
=
1
n
1
+n
2
2
_
n
1
i=1
(X
i
X
n
)
2
+
n
2
i=1
(Y
i
Y
n
)
2
_
.
On montre facilement que lestimateur obtenu S
2
est sans biais. En eet, S
2
X
est un estimateur
sans biais de
2
1
donc E(S
2
X
) =
2
1
=
2
, et S
2
Y
est sans biais de
2
2
donc E(S
2
Y
) =
2
2
=
2
. On
en deduit que
E(S
2
) =
(n
1
1)E(S
2
X
) + (n
2
1)E(S
2
Y
)
n
1
+n
2
2
=
(n
1
1)
2
+ (n
2
1)
2
n
1
+n
2
2
=
2
On estime alors

2
1
n
1
+

2
2
n
2
=
2
_
1
n
1
+
1
n
2
_
par S
2
_
1
n
1
+
1
n
2
_
et on utilise la statistique de test
T
n
=
X
n
Y
n
_
S
2
_
1
n
1
+
1
n
2
_
.
Sous H
0
, T
n
N (0, 1) approximativement, et on procède de meme que precedemment.
Exemple
Un fabriquant de cables en acier etudie un nouveau traitement de cables pour ameliorer leur
resistance. Il choisit au hasard 200 cables traites et 100 cables non traites. On suppose que la
charge de rupture est une variable aleatoire. On note X
i
la charge de rupture du ième cable
traite et Y
i
la charge de rupture du ième cable non traite. On observe x
n
= 30, 82, y
n
= 29, 63,
29
1
199
200
i=1
(x
i
x
n
)
2
= 27, 25 et
1
99
100
i=1
(y
i
y
n
)
2
= 23, 99. Peut-on conclure à lecacite du
traitement ?
On note
1
la charge de rupture moyenne (dans la population) des cables traites,
2
1
la
variance, et
2
la charge de rupture moyenne (dans la population) des cables non traites,
2
2
la
variance. On suppose que les deux echantillons X
1
, . . . , X
n
1
, n
1
= 200, et Y
1
, . . . , Y
n
2
, n
2
= 100
sont independants. On a E(X
i
) =
1
, Var(X
i
) =
2
1
, E(Y
i
) =
2
, Var(Y
i
) =
2
2
.
1
et
2
sont
estimees par X
n
et Y
n
les charges moyennes aleatoires des cables traites et non traites des
echantillons. Une estimation ponctuelle de
1
(resp.
2
) est la realisation x
n
= 30.82 (resp.
y
n
= 29.63) de lestimateur X
n
(resp. Y
n
) sur lechantillon des cables traites (resp. non traites).
Les variances
2
1
et
2
2
sont inconnues et estimees par les variances aleatoires S
2
X
et S
2
Y
. Une
estimation ponctuelle de
2
1
(resp.
2
2
) est la realisation s
2
X
= 27.25 (resp. s
2
X
= 23.99) de
lestimateur S
2
X
(resp. S
2
Y
) sur lechantillon.
On souhaite tester H
0
:
1
=
2
contre H
1
:
1
>
2
.
Le TCL sapplique (les echantillons sont susamment importants), et la statistique de test est
en labsence dinformation sur les variances
T
n
=
X
n
Y
n
_
S
2
X
n
1
+
S
2
Y
n
2
N (0, 1) sous H
0
Si les variances etaient supposees inconnues mais egales
2
1
=
2
2
=
2
, on estimerait la valeur
commune
2
par la variance empirique aleatoire calculee sur les deux echantillons traites/non
traites reunis (normalisee pour avoir un estimateur sans biais)
S
2
=
(n
1
1)S
2
X
+ (n
2
1)S
2
Y
n
1
+n
2
2
.
La statistique de test serait
T
n
=
X
n
Y
n
_
S
2
_
1
n
1
+
1
n
2
_
N (0, 1) sous H
0
si T
n
> c
on rejette H
0
,
si T
n
c
, on accepte H
0
,
o` u le seuil c
est tel que P

H
0
(T
n
> c
) = = 5%. Dans la table de la loi N (0, 1), on lit

c
= 1, 645. Si on note t
n
la realisation de T
n
sur les deux echantillons, si t
n
> 1.645 on
rejettera H
0
(avec un risque de 5% de se tromper), si t
n
1.645 on acceptera H
0
.
Mise en oeuvre : Sur lechantillon, on trouve t
n
= 1, 94 > 1, 645. On rejette H
0
. Le traite-
ment est donc ecace.
30
3.1.2 Petits echantillons gaussiens
On considère à nouveau deux echantillons independants, le premier (X
1
, . . . , X
n
1
), de moyenne
E(X
i
) =
1
, Var(X
i
) =
2
1
, et le second (Y
1
, . . . , Y
n
2
), E(Y
i
) =
2
, Var(Y
i
) =
2
2
. Si les eec-
tifs respectifs n
1
et n
2
des deux echantillons ne sont pas assez importants pour appliquer le
TCL, on fait alors à nouveau lhypothèse supplementaire que ces echantillons sont gaussiens :
(X
1
, . . . , X
n
1
), X
i
N (
1
,
2
1
) et (Y
1
, , Y
n
2
), Y
i
N (
2
,
2
2
). Bien s ur les resultats suivants
seront valables pour de grands echantillons gaussiens !
Test de H
0
:
1
=
2
contre
1
=
2
Le test est encore fonde sur la dierence X
n
1
Y
n
2
. Dans le cas gaussien, on connat la loi
exacte de X
n
1
et Y
n
2
. On a
X
n
1
N
_
1
,

2
1
n
1
_
et Y
n
2
N
_
2
,

2
2
n
2
_
.
Par independance des deux echantillons,
X
n
1
Y
n
2
N
_
2
,

2
1
n
1
+

2
2
n
2
_
.
Sous H
0
,
X
n
1
Y
n
2
N
_
0,

2
1
n
1
+

2
2
n
2
_
soit encore
X
n
1
Y
n
2
_
2
1
n
1
+

2
2
n
2
N (0, 1) .
On ne peut utiliser directement cette variable aleatoire comme statistique de test que
lorsque les variances des deux populations sont connues.
2
1
et
2
2
sont connues
La statistique de test est
T
n
=
X
n
1
Y
n
2
_
2
1
n
1
+

2
2
n
2
.
Sous H
0
, T
n
N (0, 1) et on procède de la meme manière que precedemment.
2
1
et
2
2
sont inconnues mais egales
Les solutions ne sont pas satisfaisantes pour des petits echantillons lorsque les variances sont
dierentes et inconnues. On supposera donc legalite des variances
2
1
=
2
2
=
2
. Nous verrons
une procedure permettant de tester legalite des variances dans le cas gaussien, le test de Fisher,
que vous utiliserez egalement dans le modèle lineaire. On va donc estimer la valeur commune
2
31
par la moyenne ponderee par les eectifs (n
1
1) et (n
2
1) des deux variances dechantillons
S
2
1
et S
2
2
:
S
2
=
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+n
2
2
de sorte que
2
1
/n
1
+
2
2
/n
2
=
2
(1/n
1
+ 1/n
2
) est estimee par S
2
(1/n
1
+ 1/n
2
). On utilise
alors la statistique de test
T
n
=
X
n
1
Y
n
2
_
S
2
_
1
n
1
+
1
n
2
_
.
On montre que dans le cas gaussien, sous H
0
, T
n
St(n
1
+n
2
2). En eet, on a
T
n
=
X
n
1
Y
n
2
_
S
2
_
1
n
1
+
1
n
2
_
=
X
n
1
Y
n
2
2
_
1
n
1
+
1
n
2
_
_
(n
1
+n
2
2)S
2
n
1
+n
2
2
=
N(0, 1)
_
2
(n
1
+n
2
2)
n
1
+n
2
2
= St(n
1
+n
2
2).
On a besoin de legalite des variances pour avoir un
2
au denominateur (on aurait sinon une
somme de
2
). La statistique de test est donc T
n
, mais cette fois, sous H
0
, T
n
St(n
1
+n
2
2).
Les règles de decision se construisent de la meme manière mais on recherche cette fois les valeurs
seuils c
dans la table de la student St(n

1
+n
2
2) et non dans la table de la N(0, 1).
Exemple 1
On cherche à savoir si le rythme cardiaque dun individu augmente lorsque lindividu est
soumis à un stress. Pour cela, on mesure le rythme cardiaque de 5 individus avant une seance
de cinema passant un lm dhorreur, et le rythme cardiaque de 5 autres individus après la
seance de cinema. On suppose que le rythme cardiaque dun individu est une variable aleatoire
de loi normale. Les rythmes cardiaques observes sont les suivants :
avant la seance 90 76 80 87 83
après la seance 98 77 88 90 89
1. Le ryhtme cardiaque augmente til de manière signicative avec le stress ?
2. Calculer le degre de signication du test.
Exemple 2
On admet que la production de lait dune vache normande (respectivement hollandaise) est
une variable aleatoire de loi N(
1
,
2
1
) (respectivement N(
2
,
2
2
)). Un producteur de lait sou-
haite comparer le rendement des vaches normandes et hollandaises de son unite de production.
32
Les releves de production de lait (exprimee en litres) de 10 vaches normandes et hollandaises
ont donne les resultats suivants :
vaches normandes 552 464 483 506 497 544 486 531 496 501
vaches hollandaises 487 489 470 482 494 500 504 537 482 526
Les deux races de vaches laitières ont-elles le meme rendement ? (on supposera legalite des
variances)
3.2 Comparaison de deux proportions
On souhaite comparer deux proportions p
1
et p
2
dindividus possèdant un meme caractère
dans deux populations dierentes. Par exemple, p
1
represente la proportion de favorables à un
candidat dans une ville V1, et p
2
la proportion de favorables à ce candidat dans une autre ville
V2 : on peut se demander si la proportion de favorables au candidat est la meme dans les deux
villes, auquel cas on testera H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
. On va donc considerer deux
echantillons independants (X
1
, , X
n
1
) de loi B(p
1
), et (Y
1
, , Y
n
2
) de loi B(p
2
). Dans le
cas de lexemple, X
i
represente lopinion du ième electeur dans V1, Y
i
dans V2. La proportion
theorique p
1
est estimee par la proportion aleatoire du premier echantillon n
1
1
n
1
i=1
X
i
= X
n
1
et
p
2
par n
1
2
n
2
i=1
Y
i
= Y
n
2
, proportion aleatoire du 2ème echantillon. On rappelle que E(X
i
) = p
1
,
Var(X
i
) = p
1
(1p
1
), E(Y
i
) = p
2
, Var(Y
i
) = p
2
(1p
2
), E(X
n
1
) = p
1
, Var(X
n
1
) = p
1
(1p
1
)/n
1
,
E(Y
n
2
) = p
2
et Var(Y
n
2
) = p
2
(1 p
2
)/n
2
.
Test de H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
Le test est fonde sur lecart X
n
1
Y
n
2
entre les deux proportions aleatoires observees
dans les echantillons, variables aleatoires dont il faut connatre la loi sous H
0
. Si les tailles
dechantillons n
1
et n
2
sont susamment importantes, le TCL sapplique et on a
X
n
1
N
_
p
1
,
p
1
(1 p
1
)
n
1
_
et Y
n
2
N
_
p
2
,
p
2
(1 p
2
)
n
2
_
Par independance,
X
n
1
Y
n
2
N
_
p
1
p
2
,
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
.
Sous H
0
,
X
n
1
Y
n
2
N
_
0,
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
soit encore,
X
n
1
Y
n
2
_
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
N (0, 1)
On connat la loi de cette variable aleatoire sous H
0
, mais on ne peut lutiliser comme
statistique de test car on ne connat pas la valeur de p
1
(1 p
1
)/n
1
+p
2
(1 p
2
)/n
2
. Il faut
33
donc estimer cette quantite sous H
0
. Sous H
0
, p
1
= p
2
= p, et on estime la valeur commune
p par
P
n
=
n
1
i=1
X
i
+
n
2
i=1
Y
i
n
1
+n
2
=
n
1
X
n
1
+n
2
Y
n
2
n
1
+n
2
.
P
n
est la proportion aleatoire observee sur les deux echantillons. On estime alors (sous H
0
)
p
1
(1 p
1
)/n
1
+ p
2
(1 p
2
)/n
2
= p(1 p)(1/n
1
+ 1/n
2
) par P
n
(1 P
n
)(1/n
1
+ 1/n
2
). On
construit le test à partir de la statistique
T
n
=
X
n
1
Y
n
2
_
P
n
(1 P
n
)
_
1
n
1
+
1
n
2
_
Sous H
0
, T
n
N(0, 1).
si |T
n
| > c
on rejette H
0
,
si |T
n
| c
, on accepte H
0
,
o` u le seuil c
est choisi tel que P

H
0
(|T
n
| > c
) = ; la valeur de c
est lue dans la table de

la N(0, 1).
Exemple
A la sortie de deux salles de cinema donnant le meme lm, on a interroge des spectateurs quant
à leur opinion sur le lm. Les resultats de ce sondage dopinion sont les suivants :
Opinion Mauvais lm Bon lm Total
Salle 1 30 70 100
Salle 2 48 52 100
Total 78 122 200
Lopinion est-elle signicativement liee à la salle ?
Soit p
1
, resp. p
2
la proportion de gens de la salle 1, resp. salle 2, ayant une mauvaise opinion
du lm. On veut tester H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
.
Soit X
i
, resp. Y
i
, la variable aleatoire representant lopinion du ième spectateur interroge dans
la salle 1, resp. salle 2. X
i
= 1 si le ième spectateur interroge dans la salle 1 a une mauvaise
opinion, X
i
= 0 sinon. X
i
B(p
1
). De meme, Y
i
B(p
2
). On note X
n
1
, resp. Y
n
2
, la proportion
aleatoire de spectateurs interroges dans la salle 1, resp. salle 2, ayant une mauvaise opinion. Les
eectifs n = n
1
= n
2
= 100 sont susamment grands pour appliquer le TCL. La statistique de
test est
T
n
=
X
n
Y
n
_
P
n
(1 P
n
)
_
1
n
1
+
1
n
2
_
o` u sous H
0
P
n
= (n
1
X
n
1
+ n
2
Y
n
2
)/(n
1
+ n
2
) est un estimateur de la proportion commune
p de spectateurs interroges ayant une mauvaise opinion salle 1 et 2 confondues. Sous H
0
,
T
n
N(0, 1).
34
si |T
n
| > c
on rejette H
0
,
si |T
n
| c
, on accepte H
0
,
o` u le seuil c
est choisi tel que P

H
0
(|T
n
| > c
) = = 5%; la valeur de c
= 1, 96 est lue dans

la table de la N(0, 1).
Mise en oeuvre : soient x
n
1
, y
n
2
, p
n
les realisations de X
n
1
, Y
n
2
, P
n
(ce sont des estimations
ponctuelles de p
1
, p
2
, p). x
n
1
= 30/100, y
n
2
= 48/100, p
n
= (30 + 48)/200.
Ainsi, t
n
= (x
n
1
y
n
2
)/
_
p
n
(1 p
n
)(1/100 + 1/100) = 2.61. |t
n
| = 2.61 > 1.96 = c
donc
on rejette H
0
à 5% : il y a une dierence signicative entre les deux salles (il y a une inuence
signicative de la salle sur lopinion).
s
= P
H
0
(|T
n
| > 2.61) = 2(1 P
H
0
(T 2.61)) = 2(1 0.995) = 0.01.
3.3 Comparaison de deux variances (cas gaussien)
On souhaite comparer les variances
2
1
et
2
2
dun meme caractère dans deux populations
dierentes. Nous ne traiterons que le cas o` u le caractère est distribue dans les deux po-
pulations suivant une loi normale. On considère deux echantillons gaussiens (X
1
, . . . , X
n
1
),
X
i
N (
1
,
1
) et (Y
1
, . . . , Y
n
2
), Y
i
N (
2
,
2
). Soient X
n
1
=
n
1
i=1
X
i
/n
1
estimateur de
1
, Y
n
2
=
n
2
i=1
Y
i
/n
2
estimateur de
2
, S
2
1
=
n
1
i=1
(X
i
X
n
1
)
2
/(n
1
1) estimateur de
2
1
, et
S
2
2
=
n
2
i=1
(Y
i
Y
n
2
)
2
/(n
2
1) estimateur de
2
2
.
On veut comparer
2
1
et
2
2
: à partir des variances observees S
2
1
et S
2
2
, peut-on dire si
2
1
=
2
2
?
On va donc construire le test de H
0
:
2
1
=
2
2
contre H
1
:
2
1
=
2
2
.
Sous H
0
,
2
1
=
2
2
, i.e.
2
1
/
2
2
= 1. Le test va alors etre fonde sur le rapport S
2
1
/S
2
2
que
lon comparera à la valeur de reference 1. Si ce rapport est signicativement dierent de 1, on
rejettera H
0
, sinon on acceptera H
0
.
Quelle est la loi de la statistique de test T = S
2
1
/S
2
2
sous H
0
? Puisque les echantillons sont
gaussiens, on sait que
(n
1
1)S
2
1
2
1

2
(n
1
1) et
(n
2
1)S
2
2
2
2

2
(n
2
1).
De plus, ces deux variables aleatoires sont independantes.
Rappel 8 : Soient X, Y deux variables aleatoires independantes tq X
2
(d
1
) et Y
2
(d
2
).
Alors la variable aleatoire (X/d
1
)/(Y/d
2
) F(d
1
, d
2
) (loi de Fisher à d
1
et d
2
degres de liberte).
La loi de Fisher est une loi non symetrique et une variable aleatoire de Fisher ne prend que des
valeurs positives.
Donc on a
(n
1
1)S
2
1
2
1
/(n
1
1)
(n
2
1)S
2
2
2
2
/(n
2
1)
=
2
(n
1
1)/(n
1
1)
2
(n
2
1)/(n
2
1)
= F(n
1
1, n
2
1).
35
Or sous H
0
,
2
1
=
2
2
, donc T = S
2
1
/S
2
2
F(n
1
1, n
2
1).
si T < c
(c
< 1) ou si T > d
(d
> 1) on rejette H
0
,
si c
T d
, on accepte H
0
.
Les seuils c
et d
sont choisis tels que

P
H
0
(rejetter H
0
) = P
H
0
(T < c
ou T > d
) = P
H
0
(T < c
) +P
H
0
(T > d
) =
xe à lavance. Or sous H
0
, T F(n
1
1, n
2
1), donc les valeurs de c
et d
sont lues
dans la table de la Fisher (n
1
1, n
2
1) tels que P(F(n
1
1, n
2
1) < c
) = /2 et
P(F(n
1
1, n
2
1) > d
) = /2, i.e. P(F(n

1
1, n
2
1) d
) = 1 /2.
Remarque. Il y a donc deux bornes à lire dans la table de la Fisher. La valeur de d
(> 1)
se lit directement dans la table de F(n
1
1, n
2
1). En revanche, la lecture de c
pose plus
de problème car c
< 1. Mais on rappelle que si F F(d

1
, d
2
), alors
1
F
F(d
2
, d
1
), et donc
pour lire une valeur plus petite que 1, il sut de prendre linverse de la valeur lue dans la
table F(d
2
, d
1
) o` u lon a inverse les degres de liberte. Ainsi, si F F(d
1
, d
2
) et si a < 1,
P(F < a) = P(1/F > 1/a) = /2 et P(1/F 1/a) = 1 /2.
Remarque. Il est bien entendu possible de lire les valeurs des deux seuils c
et d
. Mais on peut
ne lire quune seule valeur, celle situee du meme cote que 1 que le rapport observe t = s
2
1
/s
2
2
.
En eet si t > 1, il sut de lire d
puisque lon sait que c
< 1 : si t > d
on rejettera H
0
, et
si t < d
, on sait aussi que c
< 1 < t < d
, et on acceptera H
0
. De meme si t < 1, il sut de
lire la valeur c
puisque lon sait que d
> 1. Attention, meme si on ne peut lire la valeur que

dune seule borne pour conclure, la règle de decision est bien :
si T < c
ou si T > d
on rejette H
0
,
si c
< T < d
, on accepte H
0
.
En pratique, on calculera au depart les realisations s
2
1
et s
2
2
des variances : si s
2
1
> s
2
2
on utilisera
le rapport t = s
2
1
/s
2
2
qui sera plus grand que 1, il sura alors de lire la valeur de d
dans la
table F(n
1
1, n
2
1). Si s
2
1
< s
2
2
on utilisera le rapport t = s
2
2
/s
2
1
qui sera plus grand que 1,
il sura alors de lire la valeur de d
mais cette fois dans la table F(n

2
1, n
1
1). Ainsi pour
ne calculer que la borne superieure d
(plus simple à lire dans la table), on choisit au prelable

le bon rapport à calculer, i.e. celui o` u la variance la plus grande est au numerateur (en prenant
garde dutiliser les bons degres de liberte).
Exemple 1
Tester legalite des variances dans lexemple du test de comparaison de moyennes du cas gaussien
sur les vaches hollandaises et normandes.
Exemple 2
Dans deux Unites dEnseignement et de Recherche (UER), U1 et U2, de psychologie, on suppose
36
que les notes de statistiques des etudiants suivent des lois normales. On observe les resultats
suivants sur un echantillon de 25 etudiants de lUER U1 et de 10 etudiants de lUER U2 :
25
i=1
x
i
= 310
25
i=1
x
2
i
= 3916
10
i=1
y
i
= 129 et
10
i=1
y
2
i
= 1709.1
o` u x
i
(respectivement y
i
) designe la note obtenue par le i
` eme
etudiant de lechantillon de U1
(respectivement U2).
Peut-on dire que les variances des notes de statistiques dans les deux UER sont signicativement
dierentes ? (on prendra un risque de 5%).
37

Stats Cours Tests Parametriques

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Stats Cours Tests Parametriques

Încărcat de

Drepturi de autor:

Formate disponibile

Cours de Tests parametriques

pour que la probabilite de rejeter H

na que 5% de chances detre depasse). Or pour notre exemple, on a vu que sous

= 600 + 25 1, 645 = 641, 125.

X > 641, 125} sappelle la zone ou region de rejet de H

X 641, 125} la zone dacceptation de H

pour que la probabilite de se tromper en rejetant H

est indiquee par la nature de H

du premier encadre, dans cette derni`ere equation, on trouve

n = (1, 645 + 0, 84)

) = 0, 95, soit encore P

] est un intervalle de conance non symetrique au risque 5% de lestimateur

est tel que P

sappelle la region de rejet de H

sappelle la region dacceptation de H

est une region de conance de risque pour les realisations de T

X > 641, 125} est une zone de rejet de H

X est un estimateur de . Il est naturel de rejeter H

N(0, 1). (2.1.1)

est tel que P

) /2. Comme sous H

tel que P(N(0, 1) c

est tel que P

) = , pour un niveau de test xe.

(< 0), on rejette H

est tel que P

. On construira donc nalement la zone de rejet en

qui depend de , car lorsque lon teste des

est tel que P

) = 0, 05. Pour lire la valeur de c

dans la table de la loi

est tel que P

est tel que P

) = 0, 05. On lit dans la table de la loi gaussienne,

50(314 600 300 000)/25 000 = 4, 13 > 1, 64, donc le test

est tel que P

) 0, 05. On lit dans la table de la loi gaussienne c

5(0, 8 0)/2 = 0, 89 < 1, 64, donc on accepte H

N(0, 1). Donc sous H

est tel que P

se lit cette fois dans la table de la

est tel que P

se lit cette fois dans la table de la St(9).

10(3, 72 4)/0.36 = 2, 43 < 1.833, donc on rejette H

est tel que P

se lit dans la table de la

est tel que P

est tel que P

) = , i.e. tel que P

est lue dans la table de la N (0, 1).

est tel que P

est tel que P

est tel que P

) = = 5%. Dans la table de la loi N (0, 1), on lit

dans la table de la student St(n

est choisi tel que P

est lue dans la table de

est choisi tel que P

= 1, 96 est lue dans

sont choisis tels que

) = /2, i.e. P(F(n

< 1. Mais on rappelle que si F F(d

puisque lon sait que c

, on sait aussi que c