Tests Parametriques Printable PDF

.
Tests statistiques
.
Michaël Genin
Université de Lille 2
EA 2694 - Santé Publique : Epidémiologie et Qualité des soins
michael.genin@univ-lille2.fr
Plan
1. Principe des tests statistiques

Exemple introductif
Définitions
2. Grands échantillons n ⩾ 30
Comparaison d’une moyenne observée à une moyenne théorique
Comparaison de deux moyennes / Echantillons indépendants
Comparaison de deux moyennes / Echantillons appariés
Comparaison d’une proportion observée à une proportion théorique
Comparaison de deux proportions / Echantillons indépendants
3. Petits échantillons n < 30
Comparaison d’une moyenne observée à une moyenne théorique
Comparaison de deux moyennes / Echantillons indépendants
Comparaison de deux moyennes / Echantillons appariés
4. Conclusions
Michaël Genin (Université de Lille 2) Tests statistiques Version - 19 février 2015 1 / 103
Principe des tests statistiques Exemple introductif
Exemple introductif
Exemple 1 : efficacité d’un nouveau médicament
On souhaite tester l’efficacité d’un nouveau médicament par rapport au

médicament couramment utilisé.
On dispose d’un échantillon de 100 patients divisé en 2 groupes :

Groupe A (50 individus) : nouveau médicament
Groupe B (50 individus) : médicament classique
En observant la guérison à 1 mois :

Groupe A : 75% de guérison
Groupe B : 65% de guérison
Exemple introductif
Exemple 1 : efficacité d’un nouveau médicament
Le nouveau médicament est-il plus efficace que le médicament classique ?

D’un point de vue descriptif → OUI
Si on tire un autre échantillon de patients, retrouve-t-on la même différence
d’efficacité ? (fluctuations d’échantillonnage)
Peut-on extrapoler cette différence d’efficacité à la population ?
Les tests statistiques permettent de fixer une règle de décision objective.
Exemple introductif
Exemple 2 : identification d’un facteur de risque
On s’intéresse au lien entre le tabagisme et et le cancer du poumon sur un

échantillon de 200 individus.
On procède à une étude cas/témoins :
Malade Non malade

Fumeur 70 20
Non fumeur 30 80
Chez les malades, on observe 70% de fumeurs

Chez les non-malades, on observe 20% de fumeurs
Exemple introductif
Exemple 2 : identification d’un facteur de risque
Comment interpréter la proportion plus élevée de fumeurs dans l’échantillon de

malades que dans celui des non-malades ?
Existence d’un réel lien entre le tabagisme et le cancer du poumon ?
Différence de proportion liée à l’échantillon ?
Cette différence est-elle extrapolable à la population ?
Les tests statistiques permettent de fixer une règle de décision objective.
Principe des tests statistiques Définitions
Définitions
Objectif : Valider ou non une hypothèse faite sur une ou plusieurs populations
. Outil pour effectuer une preuve

1
Médicament A est meilleur que le le médicament B

Un facteur F est lié à la pathologie P
. Méthode expérimentale (non déterministe)
2
On se base sur un ou plusieurs échantillons

La prise de décision peut être influencée par le choix de l’échantillon
La conclusion ne pourra se faire de manière certaine (notion de risque)
. Raisonnement mathématique particulier : raisonnement par l’absurde → Test
3
d’hypothèse
Définitions
Notion d’hypothèse (H0 , H1 )
On pose une hypothèse, appelée Hypothèse nulle, notée H0 .

Souvent, cette hypothèse est le contraire ce que l’on cherche à prouver
(raisonnement par l’absurde) :
H0 : Le médicament classique et le nouveau ont la même efficacité
C’est cette hypothèse qu’on va tester à l’aide des observations sur le (ou les)
échantillon(s).
Un test statistique peut amener à deux décisions possibles :

Conservation de H0
Rejet de H0
Définitions
Notion d’hypothèse (H0 , H1 )
Si l’hypothèse testée est rejetée, alors on ”accepte” le complémentaire de cette

hypothèse, appelée hypothèse alternative, notée H1
H1 : Le nouveau médicament et le classique ont des efficacités différentes
Un test statistique présente donc deux hypothèses, H0 et H1 :

Définitions
Notion de risque
Le jugement d’une hypothèse se fait sur un ou plusieurs échantillons.
→ La conclusion du test n’est pas certaine mais lui est associé un risque d’erreur
faible.
.
Le risque de première espèce α
.
. Risque de rejeter H0 sachant qu’elle est vraie.
Les deux médicaments n’ont pas la même efficacité

alors qu’en réalité leur efficacité est équivalente
La preuve n’est pas certaine, on lui associe un risque fixé à l’avance

(ex : α = 5%)
Définitions
Notion de risque
Si on rejette H0 , le test est dit significatif au risque α.

.
Le risque de seconde espèce β
.
. Risque de conserver H0 sachant que H1 est vraie.
Les deux médicaments ont la même efficacité

alors qu’en réalité leur efficacité est différente
Si on conserve H0 , le test est dit non significatif au risque β
Définitions
Risques associés à un test
Réalité
Décision H0 H1
H0 conclusion correcte risque de deuxième espèce
H1 risque de première espèce conclusion correcte
Définitions
Règle de décision
Se base sur une statistique de test ST : variable aléatoire observable telle que
sa loi est complètement connue sous H0
La réalisation de ST est observée sur l’échantillon
Les valeurs peu probables de ST observées mettent en cause la validité de H0
Exemple : efficacité de deux médicaments

On suppose de ST ∼ N (0, 1) sous H0 .
On observe sT (réalisation de ST ) sur un échantillon de taille 200 et sT = 3.
sT = 3 est une valeur très peu probable pour une loi N (0, 1).
P(ST > 3) < 0.025
Exemple : efficacité de deux médicaments

Sous H0
ST ∼ N (0, 1)
0 3
Valeur de ST observée
Si H0 était vraie, on aurait dû obtenir une valeur de ST plus probable et non une
valeur extrême.
2 explications possibles :
H0 n’est pas vraie ( les deux médicaments ont des efficacités différentes)
Problème d’échantillonnage
Quelles valeurs de ST conduisent au rejet de H0 ???
Définitions
Région critique
On appelle région critique W l’ensemble des valeurs de ST qui conduisent au rejet

de H0 au profit de H1 .
P(ST ∈ W /H0 ) = α
P(ST ∈
/ W /H0 ) = 1 − α
Et
P(ST ∈
/ W /H1 ) = β
P(ST ∈ W /H1 ) = 1 − β
1 − β est appelée la puissance du test
Définitions
Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05
N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
Le test est dit bilatéral

H1 : Les deux médicaments ont une efficacité différente
Définitions
Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05
Test unilatéral à gauche Test unilatéral à droite

N (0, 1) N (0, 1)
5% 95% 95% 5%
−z0.95 0 0 z0.95
W =] − ∞; −Z0.95 ] W = [z0.95 ; +∞[

H1 : Le nouveau médicament est moins efficace que le classique H1 : Le nouveau médicament est plus efficace que le classique
Définitions
Risques associés à un test
Réalité
Décision H0 H1
H0 Niveau de confiance 1 − α β
H1 α Puissance 1 − β
Définitions
Remarques
Le choix de α conditionne la capacité du test à rejeter H0

Si α est trop petit → on ne rejette que très rarement H0 (test conservatif)
Si α est trop grand → on va rejeter très souvent H0 , mais le risque de se
tromper est grand...
Le risque β se calcule si la loi de ST sous H1 est connue
α et β varient en sens inverse
Si on diminue α alors β augmente
Il est d’usage de fixer α = 1%, 5%, 10%
Définitions
Distribution sous H0 Distribution sous H1
Zone de conservation de H0 Zone de rejet de H0

Seuil
Risque α
Définitions
Zone de rejet de H0 Zone de conservation de H0

Seuil
Risque β
Définitions
Zone de rejet de H0 Zone de conservation de H0

Seuil
Puissance 1 − β
Définitions
P-value
En pratique, au lieu de calculer la région critique W , on préfère donner un seuil

critique appelé p-value.
La p-value correspond à la plus petite valeur de α conduisant à rejeter H0 .
C’est le degré de signification du test. Plus elle faible par rapport à α, plus le test
a un degré de signification important.
En pratique :
P-value < α alors on rejette H0
P-value ⩾ α alors on ne rejette pas H0
Principe des tests statistiques
Démarche d’un test statistique

1. Choix de H
0 et de H1
2. Choix d’un risque α
3. Choix d’une statistique de test S

T et de sa loi sous H0
.4 Détermination de la région critique W
5. Conclusion : observation de la réalisation de S
T sur l’échantillon :
Si sT ∈ W alors Rejet de H0
Si sT ∈
/ W alors Non rejet de H0
Types de tests
Tests paramétriques : comparaison de paramètres (moyennes, variances...)
Tests semi et non-paramétriques : comparaison de distributions
Grands échantillons n ⩾ 30 Comparaison d’une moyenne observée à une moyenne théorique
Test Z ou de l’écart réduit
Exemple : QI et prisonniers...
Objectif : on cherche à déterminer si le QI des prisonniers est le même (en

moyenne) que le QI de la population générale dont on connait la moyenne :
µ0 = 100, l’écart-type étant σ.
Considérons que dans la population de prisonniers le QI est une va X de moyenne

µ et d’écart-type est σ ′ .
Nous ne pouvons faire des tests de QI sur tous les prisonniers, donc on procède à
un échantillonnage.
Soit un échantillon de n = 100 prisonniers sur lequel on calcul la moyenne

empirique x̄ = 85 et l’écart-type empirique sn−1 = 10.
1. Choix des hypothèses
Soit X la va qui associe à un prisonnier son QI

H0 : le QI moyen des prisonniers est identique à celui de la population
générale
H1 : le QI moyen des prisonniers est différent de celui de la population
générale
H0 : µ = µ0
H1 : µ ̸= µ0

α = 5%
3. Choix de la statistique de test et de sa loi sous H0
Sous H0 ,
.
X̄ − µ0
Z= √ ∼ N (0, 1)
. Sn−1 / n
Pourquoi ?
Sous H0 , on considère que les QI moyens sont égaux. Aussi, l’échantillon de
prisonniers est tout simplement un échantillon de 100 individus de la population
générale de moyenne µ0 et d’écart-type σ (pas de différence).
Or, on sait d’après le T.C.L., que si n ⩾ 30 alors

√
X̄ ∼ N (µ0 , σ/ n)

4. Détermination de la région critique W
N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
W =] − ∞; −1.96] ∪ [1.96; +∞[

5. Calcul de Z sur l’échantillon et conclusions
x̄ − µ0
z= √
sn−1 / n
85 − 100
z= = −15
10/10
z ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.

La moyenne observée sur l’échantillon est significativement différente de la
moyenne théorique.
Remarques
Test bilatéral → H1 : µ ̸= µ0
Calcul de la p-value :
P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 15) ≈ 0
Comme P(Z > |z|) ≪ 0.05, on rejette H0
Si la méthodologie d’échantillonnage est bonne (la différence n’est pas due à

un échantillon peu représentatif)
Inférence à la population des prisonniers : Le QI des prisonniers est en
moyenne inférieur à celui de la population générale
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons indépendants
Test de Z ou de l’écart réduit
Exemple : patients diabétiques et taux de mauvais cholestérol (LDL)
Objectif : on désire savoir si le LDL est différent entre les patients diabétiques et
les personnes saines.
En population générale, on considère que le LDL moyen chez les diabétiques a

pour valeur µ1 et un écart-type σ1 .
En population générale, on considère que le LDL moyen chez les personnes saines
a pour valeur µ2 et un écart-type σ2 .
On dispose de 2 groupes de sujets :

Malades (n1 = 100) : x¯1 = 1.8, s1 = 0.5
Témoins (n2 = 50) : x¯2 = 1.3, s2 = 0.2
H0 : Le LDL est identique entre les témoins et les malades

H1 : Le LDL est différent entre les témoins et les malades
H0 : µ1 = µ2
H1 : µ1 ̸= µ2

α = 5%
Sous H0 ,
.
X¯1 − X¯2
Z=√ ∼ N (0, 1)
S12 S22
+
. n1 n2
Pourquoi ? Comme n1 et n2 sont > 30, on applique le T.C.L. :

√
X¯1 ∼ N (µ1 , σ1 / n1 )
√
X¯2 ∼ N (µ2 , σ2 / n2 )
Donc
 √ 
σ12 σ22 
X¯1 − X¯2 ∼ N µ1 − µ2 , +
n1 n2
Et
X¯1 − X¯2 − (µ1 − µ2 )

√ ∼ N (0, 1)
σ12 σ22
+
n1 n2
Car les échantillons sont indépendants
Or sous H0 , µ1 = µ2
Donc
X¯ − X¯2
√1 ∼ N (0, 1)
σ12 σ22
+
n1 n2
Comme σ1 et σ2 sont inconnus, on utilise S1 et S2 (estimateurs non baisées de
l’écart-type)
Sous H0 , la statistique de test sera ”en moyenne” nulle.

N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
W =] − ∞; −1.96] ∪ [1.96; +∞[

x¯1 − x¯2
z=√ ∼ N (0, 1)
s12 s22
+
n1 n2
1.8 − 1.3
z=√ = 9.3
0.52 0.22
+
100 50

La moyenne observée sur l’échantillon de malades est significativement différente
de la moyenne chez les témoins.
Remarques
Test bilatéral → H1 : µ1 ̸= µ2
P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 9.3) ≈ 0

des échantillons peu représentatifs)
Inférence à la population de malades : Le LDL est en moyenne supérieur à
celui de la population générale.
Grands échantillons n ⩾ 30 Comparaison de deux moyennes / Echantillons appariés
Définition de l’appariement
Un échantillon A et un échantillon B sont des échantillons appariés si chaque

observation de A est liée à une observation homologue de B.
Chaque couple de valeurs forme alors une paire.
Exemples :
On mesure la taille pour différents couples de frère et soeur, et l’on souhaite
comparer la taille entre les hommes et les femmes
Mesure d’un paramètre biologique chez des patients, avant et après une
intervention (données répétées)
Test Z pour échantillons appariés
Principe du test
On se base sur la différence des valeurs associées à chaque observation.

L’hypothèse nulle testée stipule qu’en moyenne ces différences sont nulles.
On se libère de la variabilité intra-échantillon (entre les observations d’un même

échantillon) afin de prendre en compte uniquement la variabilité inter-échantillons
(variabilité des différences entre paires).
Dans le cadre des données appariées, un test Z apparié est plus puissant qu’un
test Z de comparaison de moyennes.
Exemple : évaluation d’un traitement contre le cholestérol
Objectif : Un traitement a pour but de réduire le taux de LDL. On veut montrer

que ce traitement est efficace.
Dans la population de malades, on pose :

X1 la mesure du LDL avant TTT
X2 la mesure du LDL après TTT
On dispose d’un échantillon de n = 100 patients pour lesquels on a mesuré

le LDL avant TTT (x¯1 = 1.8)
le LDL après TTT (x¯2 = 1.6)
Exemple : évaluation d’un traitement contre le cholestérol
Dans la population de malades, si le traitement n’a aucun effet, on considère que :

D = X1 − X2 une va d’espérance µD = 0 et de variance σD
2
Dans la population de malades, si le traitement a un effet, on considère que :

D = X1 − X2 une va d’espérance µD = ∆ et de variance σD
2
Ce sont ces considérations qui vont permettre de définir les hypothèses ainsi que
la statistique de test.
H0 : Le TTT n’a pas d’effet

H1 : Le TTT a un effet
H0 : µD = 0
H1 : µD = ∆, ∆ ̸= 0

α = 5%
3. Choix de la statistique de test
D̄ − ∆
Z= √ ∼ N (0, 1)
SD / n
Or sous H0 , ∆ = 0, donc :
.
D̄
Z= √ ∼ N (0, 1)
SD / n
Avec :
D̄ = X¯1 − X¯2
et √ ∑n
∑n i=1 (Di )
2
i=1 Di − n
SD =
. n−1

N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
W =] − ∞; −1.96] ∪ [1.96; +∞[

Posons sur l’échantillon, sD = 0.2
d̄
z= √
sD / n
1.8 − 1.6
z= √ = 10
0.2/ 100

Le TTT est efficace.
Remarques
Test bilatéral → H1 : µD = ∆ ̸= 0
P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 10) ≈ 0

Inférence à la population de malades : Le LDL est en moyenne inférieur après
TTT. Le TTT est efficace.
Relation de causalité
Grands échantillons n ⩾ 30 Comparaison d’une proportion observée à une proportion théorique
Test sur une proportion
Exemple : Sondage électoral
Objectif On désire comparer les intentions de votes entre le département du Nord

et Pas-De-Calais pour un candidat à l’élection présidentielle.
On sait que dans le Nord, le candidat a π0 = 54% d’intention de vote.
On ne peut recenser l’ensemble des habitants du Pas-De-Calais pour déterminer la

proportion π d’intention de vote. On procède donc à un échantillonnage.
On dispose d’un échantillon de n = 200 individus dans lequel la proportion

d’intention de vote pour le candidat est de π̂ = 42%

H0 : La proportion d’intention de vote est identique entre le Nord et le
Pas-De-Calais (H0 : π = π0 )
H1 : La proportion d’intention de vote est différente entre le Nord et le
Pas-De-Calais (H1 : π ̸= π0 )
α = 5%
Sous H0
.
π̂ − π0
Z=√ ∼ N (0, 1)
π0 (1−π0 )
. n

N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
W =] − ∞; −1.96] ∪ [1.96; +∞[

π̂ − π0
z=√
π0 (1−π0 )
n
0.42 − 0.54
z=√ = −2.41
0.54(1−0.54)
100

Les intentions de vote dans le Nord et le Pas-De-Calais sont significativement
différentes .
Remarques
Test bilatéral → H1 : π ̸= π0
P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 2.41) = 0.0159
Comme P(Z > |z|) < 0.05, on rejette H0

Inférence à la population du Pas-De-Calais : La proportion d’intention de
vote pour le candidat est significativement plus faible que dans le Nord.
Grands échantillons n ⩾ 30 Comparaison de deux proportions / Echantillons indépendants
Comparaison de deux proportions / échantillons

indépendants
Exemple : comparaison de l’efficacité de deux médicaments
Objectif : On veut montrer qu’il y a une différence d’efficacité entre un

médicament classique et un nouveau médicament.
Dans la population de malades prenant le médicament classique, on considère

qu’il y a une proportion π1 de guérison à 1 mois.
Dans la population de malades prenant le nouveau médicament, on considère qu’il

y a une proportion π2 de guérison à 1 mois.
On dispose de deux échantillons :

Médic. classique (n1 = 50) observant πb1 = 65% de guérison à 1 mois.
Nouveau médic. (n2 = 50) observant πb2 = 75% de guérison à 1 mois.

indépendants
H0 : Les deux médicaments ont la même efficacité

H1 : Les deux médicaments ont une efficacité différente
H0 : π1 = π2
H1 : π1 ̸= π2

α = 5%

indépendants
πb1 − πb2 − (π1 − π2 )

Z=√ ∼ N (0, 1)
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2
Sous H0 , π1 = π2 , donc :
.
πb1 − πb2
Z=√ ∼ N (0, 1)
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2
.

indépendants
N (0, 1)
2.5% 95% 2.5%
−z0.975 0 z0.975
W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[
W =] − ∞; −1.96] ∪ [1.96; +∞[


indépendants
πb1 − πb2
z=√
πb1 (1−πb1 ) πb2 (1−πb2 )
n1 + n2
0.65 − 0.75
z=√ = −1.10
0.65(1−0.65) 0.75(1−0.75)
50 + 50
z∈/ W donc on ne rejette pas H0 au risque de seconde espèce β non quantifiable.

A la vue des données, il n’y a pas de différence d’efficacité significative entre le
nouveau médicament et le classique.

indépendants
Remarques - 1
Test bilatéral → H1 : π1 ̸= π2
P(Z > |z|) = 2P(Z > z) = 2 × P(Z > 1.10) = 0.2713
Comme P(Z > |z|) > 0.05, on ne rejette pas H0
Causes probables du non-rejet de H0 :

Les deux médicaments ont effectivement des efficacités identiques (H0 vraie)
On ne dispose de pas assez d’individus pour montrer une différence
significative (puissance statistique)

indépendants
Remarques - 2
Si l’on considère deux échantillons (n1 = 200) et (n2 = 200) dans lesquels les
proportions de guérison à 1 mois sont identique (πb1 = 0.65 et πb2 = 0.75), alors :
0.65 − 0.75
z=√ = −2.19
0.65(1−0.65) 0.75(1−0.75)
200 + 200
P − value = 0.0285 < α
Le test est significatif : il y a une différence d’efficacité entre le nouveau

médicament et le classique. Le premier semble est plus efficace que le deuxième.

indépendants
Remarques - 3
La puissance d’un test est en partie fonction du nombre d’observations
disponibles
Théoriquement, plus on augmente le nombre d’observations, plus le test sera
capable de détecter une différence infime comme significative
En pratique : on se fixe une différence clinique minimale (ex : 10%)...
Estimation du nombre de sujets nécessaires...
Petits échantillons n < 30 Comparaison d’une moyenne observée à une moyenne théorique
Test T de Student
Remarques préliminaires :
Le principe est très proche du test Z
On doit supposer que X ∼ N (µ, σ) dans la population
Retour à l’exemple sur le QI des prisonniers
Objectif : on cherche à déterminer si le QI des prisonnier est le même (en

moyenne) que le QI de la population générale distribué selon une loi normale de
moyenne : µ0 = 100, et d’écart-type σ.
Considérons la population de prisonniers dans laquelle le QI est distribué selon une

loi normale de moyenne µ et d’écart-type σ ′ .
Soit un échantillon de n = 10 prisonniers sur lequel on calcul la moyenne

empirique x̄ = 85 et l’écart-type empirique sn−1 = 10.
Test T de Student
H0 : le QI moyen des prisonniers est identique à celui de la population

générale (H0 : µ = µ0 )
H1 : le QI moyen des prisonniers est différent de celui de la population
générale (H1 : µ ̸= µ0 )
α = 5%
Sous H0 ,
.
X̄ − µ0
T = √ ∼ Tn−1 d.d.l
. Sn−1 / n
Test T de Student
T(9 ddl)
2.5% 95% 2.5%
−t0.975, 9 0 t0.975, 9
W =] − ∞; −t0.975,, 9ddl ] ∪ [t0.975,, 9ddl ; +∞[
W =] − ∞; −2.26] ∪ [2.26; +∞[

Test T de Student
5. Calcul de T sur l’échantillon et conclusions
x̄ − µ0
t= √
sn−1 / n
85 − 100
t= √ = −4.74
10/ 10
t ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.

La moyenne observée sur l’échantillon est significativement différente de la
moyenne théorique.
Test T de Student
Remarques
Test bilatéral → H1 : µ ̸= µ0
P(T9ddl > |t|) = 2P(T9ddl > t) = 2 × P(T9ddl > 4.74) = 0.001
Comme P(T > |t|) < 0.05, on rejette H0

Inférence à la population des prisonniers : Le QI des prisonniers est en
moyenne inférieur à celui de la population générale
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons indépendants
Conditions nécessaires au Test T de Student
Remarques préliminaires :
On doit supposer que dans la population :
X1 ∼ N (µ1 , σ1 )
X2 ∼ N (µ2 , σ2 )
On distingue deux cas de figure :
1. σ12 = σ22
2. σ12 ̸= σ22
Pour différencier ces deux cas, on procède à un test de comparaison de deux

variances
Test F - Comparaison de deux variances

Considérons :
X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 )
Les hypothèses du test
H0 : σ12 = σ22
H1 : σ12 > σ22
Soient deux échantillons de taille n1 et n2 :
1 ∑ 1 ∑
n1 n2
S12 = (X1i − X¯1 )2 et S22 = (X2i − X¯2 )2
n1 − 1 n2 − 1
i=1 i=1
Statistique de test sous H0
.
S12
F = ∼ F(n1 −1,n2 −1)ddl
. S22
En pratique :
Test unilatéral à droite
On prend la valeur la plus élevée entre s12 et s22 comme numérateur de la
statistique de test
Le rapport est ⩾ 1.
Région critique W
Fn1 −1,n2 −1
5%
0 1 2 3 4 5 6
fn1−α
1 −1,n2 −1
W = [fn1−α
1 −1,n2 −1
; +∞[
Remarques
Les variances σ1 et σ2 sont dites homogènes si le test F est non significatif

→ Notion d’homoscédasticité
Si le test est significatif, les variances sont dites hétérogènes
→ Notion d’hétéroscédasticité
Le test nécessite la normalité de X1 et X2
X1 et X2 doivent être indépendantes
Test de T de Student
Exemple : patients diabétiques et taux de mauvais cholestérol (LDL)
Objectif : on désire savoir si le LDL est différent entre les patients diabétiques et
les personnes saines.
En population générale, on considère que le LDL chez les diabétiques est distribué
selon une loi normale de moyenne µ1 et d’écart-type σ1 .
En population générale, on considère que le LDL chez les personnes saines est
distribué selon une loi normale de moyenne µ2 et d’écart-type σ2 .
On dispose de 2 groupes de sujets :

Malades (n1 = 25) : x¯1 = 1.8, s1 = 0.5
Témoins (n2 = 20) : x¯2 = 1.3, s2 = 0.2
H0 : Le LDL est identique entre les témoins et les malades

H1 : Le LDL est différent entre les témoins et les malades
H0 : µ1 = µ2
H1 : µ1 ̸= µ2

α = 5%
1. Si σ 2 = σ 2 = σ 2 , alors sous H
1 2 0 :
.
X¯1 − X¯2
T = √ ∼ Tn1 +n2 −2 ddl
S n11 + n12
.
Avec S 2 l’estimateur de la variance commune σ 2 .
.
(n1 − 1)S12 + (n2 − 1)S22
S2 =
. n1 + n2 − 2
. Si σ 2 ̸= σ 2 , alors sous H0 :
2
1 2
.
X¯1 − X¯2
T =√ 2 ∼ Tn1 +n2 −2 ddl
S1 S22
. n1 + n2
Test T de Student
T(43 ddl)
2.5% 95% 2.5%
−t0.975, 43 0 t0.975, 43
W =] − ∞; −t0.975,, 43ddl ] ∪ [t0.975,, 43ddl ; +∞[
W =] − ∞; −2.017] ∪ [2.017; +∞[

Test T de Student
Il faut tout d’abord tester l’égalité des variances σ12 et σ22 :
On pose un risque α = 5%
H0 : σ12 = σ22
H1 : σ12 > σ22
s12 (0.5)2
f = 2 = = 25
s2 (0.1)2
Test T de Student
Région critique W
F24,19
5%
0 1 2 3
0.95
f24,19
0.95
W = [f24,19 ; +∞[
W = [2.11; +∞[
Test T de Student
f ∈ W donc on rejette H0 avec un risque α de première espèce.
Les variances σ12 et σ22 sont différentes. (Hétéroscédasticité).
Pour le test de Student, on choisit donc comme statistique de test :
X¯1 − X¯2
T =√ 2 ∼ Tn1 +n2 −2 ddl
S1 S22
n1 + n2
1.8 − 1.3
t=√ = 4.56
(0.5)2 (0.2)2
25 + 20
Test T de Student
t ∈ W =] − ∞; −2.017] ∪ [2.017; +∞[ donc on rejette H0 avec un risque α de

première espèce.
La moyenne observée sur l’échantillon de malades est significativement différente

de la moyenne chez les témoins.
Test T de Student
Remarques
Test bilatéral → H1 : µ1 ̸= µ2
P(T > |t|) = 2P(T > t) = 2 × P(T > 4.56) ≈ 4.10−6
Comme P(T > |t|) ≪ 0.05, on rejette H0

des échantillons peu représentatifs)
Inférence à la population de malades : Le LDL est en moyenne supérieur à
celui de la population générale.
Petits échantillons n < 30 Comparaison de deux moyennes / Echantillons appariés
Test T de Student sur échantillons appariés
Exemple : Traitement du diabète 1
Objectif : On désire étudier l’effet d’une nouvelle stratégie de traitement du

diabète en mesurant l’effet sur la glycémie. On dose la glycémie (g/L) chez 15
sujets avant le début du nouveau protocole et 3 mois après.
Dans la population de malades, on pose :

X1 la mesure de glycémie avant TTT
X2 la mesure de glycémie après TTT (3 mois après)
D = X1 − X2 une va distribuée selon une loi normale d’espérance µD et de

2
variance σD
1. Statistique - Epidemiologie, T. Ancelle, p. 141

Test T de Student sur échantillons appariés
Exemple : Traitement du diabète
Sur l’échantillon
Les mesures sont appariées car elles sont effectuées sur les mêmes individus.
La moyenne des différences entre les mesures :
d̄ = 0.1
L’écart-type des différences entre les mesures :
sD = 0.091
Test T de Student pour échantillons appariés
H0 : les glycémies sont identiques avant et après le nouveau protocole

H1 unilatérale : la glycémie est réduite grâce au nouveau protocole
H0 : µD = 0
H1 : µD = ∆, ∆ > 0

α = 5%
D̄ − ∆
T = √ ∼ Tn−1 ddl
SD / n
Or sous H0 , ∆ = 0, donc :
.
D̄
T = √ ∼ Tn−1 ddl
SD / n
Avec
D̄ = X¯1 − X¯2
et v [ n ]
u
u n
t 1 ∑ 2 ( )2
SD = Di − D̄
n−1 n
. i=1

Région critique W
T(14 ddl)
95% 5%
0 t0.95, 14
W = [t0.95, 14 ; +∞[
W = [1.761; +∞[
d̄
t= √
sD / n
0.1
z= √ = 4.25
0.91/ 15
t ∈ W donc on rejette H0 au risque de première espèce α = 5% de se tromper.

La glycémie est significativement plus basse après administration de la nouvelle
stratégie.
Remarques
Test unilatéral → H1 : µD > 0

P(T14ddl > t) = P(T14ddl > 4.25) ≈ 4.10−4
Comme P(T > t) ≪ 0.05, on rejette H0
Conclusions
Tests de comparaison
Les tests de comparaison servent à comparer des paramètres entre des populations
différentes.
2 types :
Comparaison d’un échantillon observé à une population de référence
Comparaison de deux échantillons observés (les deux populations sont
inconnues)
Le principe fondamental est le test de la différence des deux paramètres.

Sous H0 cette différence est en moyenne nulle
Sous H1 cette différence est en moyenne non-nulle
Sous H0 , la loi de probabilité de cette différence est toujours connue !!
Conclusions
Tests de comparaison
Porter une attention double sur :

Le type de paramètres en jeu (moyennes, proportions, variances...)
Les conditions d’application du test
Distinguer deux cas de figure :

n ⩾ 30
n < 30
Se poser la question :
Les échantillons sont-ils indépendants ?
Conclusions
Tests de comparaison - Résumé
Test Comparaison Conditions d’applications

Test Z moyenne observée/théorique n ⩾ 30
2 moyennes n1 et n2 ⩾ 30
2 moyennes appariées n ⩾ 30
Test T moyenne observée/théorique X1 ∼ N (µ, σ)
2 moyennes X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 )
2 moyennes appariées (X1 − X2 ) = D ∼ N (µD , σD )
Test sur % prop. observée/prop. théorique n ⩾ 30 et min{np, n(1 − p)} > 5
2 proportions n1 , n2 ⩾ 30
min{ni p, ni (1 − pi )} > 5, i = 1, 2
Conclusions
Tests de comparaison - Résumé
Il reste des cas de figure sans réponse !!

n ⩾ 30 et comparaison de deux proportions sur échantillons appariés
Ex : % avant et après un TTT chez les même individus
→ χ2 de McNemar
n < 30 Comparaison de moyennes (ind. ou appariés) et conditions de

normalité non respectées
→ Test non paramétrique : Test de Wilcoxon pour échantillons indé.
→ Test non paramétrique : Test de Wilcoxon pour échantillons appariés
Comparaison de plus de 2 moyennes

n ⩾ 30 → ANOVA
n < 30 → si normalité alors ANOVA
n < 30 → si non normalité alors Test de Kruskal - Wallis
Conclusions
Allons plus loin...
Cours essentiellement basé sur les tests de comparaison.
On peut tester la liaison entre deux variables :

2 variables qualitatives
Ex : Existe-t-il un lien significatif entre le fait d’être malade (non malade) et le
sexe ?
→ Test du χ2 d’indépendance
2 variables quantitatives
Ex : Existe-t-il un lien significatif entre le taux de prothrombine et l’âge ?
→ Test sur le coefficient de corrélation / Régression linéaire

Tests Parametriques Printable PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Tests Parametriques Printable PDF

Încărcat de

Drepturi de autor:

Formate disponibile

.

1. Principe des tests statistiques

Exemple 1 : eﬃcacité d’un nouveau médicament

On souhaite tester l’eﬃcacité d’un nouveau médicament par rapport au

On dispose d’un échantillon de 100 patients divisé en 2 groupes :

En observant la guérison à 1 mois :

Exemple 1 : eﬃcacité d’un nouveau médicament

Le nouveau médicament est-il plus eﬃcace que le médicament classique ?

Les tests statistiques permettent de fixer une règle de décision objective.

Exemple 2 : identification d’un facteur de risque

On s’intéresse au lien entre le tabagisme et et le cancer du poumon sur un

On procède à une étude cas/témoins :

Malade Non malade

Chez les malades, on observe 70% de fumeurs

Exemple 2 : identification d’un facteur de risque

Comment interpréter la proportion plus élevée de fumeurs dans l’échantillon de

Les tests statistiques permettent de fixer une règle de décision objective.

. Outil pour eﬀectuer une preuve

Médicament A est meilleur que le le médicament B

On se base sur un ou plusieurs échantillons

Notion d’hypothèse (H0 , H1 )

On pose une hypothèse, appelée Hypothèse nulle, notée H0 .

Un test statistique peut amener à deux décisions possibles :

Notion d’hypothèse (H0 , H1 )

Si l’hypothèse testée est rejetée, alors on ”accepte” le complémentaire de cette

H1 : Le nouveau médicament et le classique ont des eﬃcacités diﬀérentes

Un test statistique présente donc deux hypothèses, H0 et H1 :

H0 : Le médicament classique et le nouveau ont la même eﬃcacité

Le jugement d’une hypothèse se fait sur un ou plusieurs échantillons.

Les deux médicaments n’ont pas la même eﬃcacité

La preuve n’est pas certaine, on lui associe un risque fixé à l’avance

Si on rejette H0 , le test est dit significatif au risque α.

Les deux médicaments ont la même eﬃcacité

Si on conserve H0 , le test est dit non significatif au risque β

Risques associés à un test

H1 risque de première espèce conclusion correcte

Exemple : eﬃcacité de deux médicaments

P(ST > 3) < 0.025

Exemple : eﬃcacité de deux médicaments

On appelle région critique W l’ensemble des valeurs de ST qui conduisent au rejet

1 − β est appelée la puissance du test

2.5% 95% 2.5%

W =] − ∞; −z0.975 ] ∪ [z0.975 ; +∞[

Le test est dit bilatéral

Exemple avec ST ∼ N (0, 1) sous H0 et α = 0.05

Test unilatéral à gauche Test unilatéral à droite

W =] − ∞; −Z0.95 ] W = [z0.95 ; +∞[

Risques associés à un test

Le choix de α conditionne la capacité du test à rejeter H0

Il est d’usage de fixer α = 1%, 5%, 10%

Distribution sous H0 Distribution sous H1

Zone de conservation de H0 Zone de rejet de H0

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0

Distribution sous H0 Distribution sous H1

Zone de rejet de H0 Zone de conservation de H0

En pratique, au lieu de calculer la région critique W , on préfère donner un seuil

La p-value correspond à la plus petite valeur de α conduisant à rejeter H0 .

Principe des tests statistiques

Démarche d’un test statistique

3. Choix d’une statistique de test S

Test Z ou de l’écart réduit

Objectif : on cherche à déterminer si le QI des prisonniers est le même (en