Sunteți pe pagina 1din 55

Université Sidi Faculté des Sciences et Techniques

Mohamed Ben Abdellah Fès

Statistique inférentielle

C. IHSSANE
03/12/2011 1
Introduction:

La mission essentielle de la statistique inférentielle est d'obtenir une valeur approchée


d'un ou plusieurs paramètres statistiques d'une variable aléatoire d'une population à
partir des données observées dans un échantillon.
La notion d'estimation a été présentée lors de l'introduction de la notion de la
statistique inférentielle.
• Estimation ponctuelle
• Estimation par intervalle.

 Estimation et intervalle de confiance

 Test hypothèse et tests statistiques

 Analyse de la variance
03/12/2011 2
Statistique inférentielle

 Estimation et intervalle de confiance


Population de 1000 cps (µ,σ)

Ech.i Ech.1
n=20 Ech.2 n=20
Ech.3
n=20 n=20

[ x i, s i ] [ x 1, s1]
[ x 3, s 3] [ x 2, s 2]

Question: les moyennes des i échantillons, sont elles de même ordres?


Estimation et intervalle de confiance

 Les valeurs des moyennes trouvées sont donc différentes. Et elles sont considérées
comme des valeurs d’une variable aléatoire qui est la moyenne X i

 Cette série des valeurs des moyenne s’appelle distribution d’échantillonnage de la moyenne.

 Cette distribution suit-elle une loi normale?


 et quelle sera la moyenne et la variance ?
Estimation et intervalle de confiance

On observe n réalisations x1,….,xn d’ un échantillon et on calcule la moyenne x


x va-t-elle être proche de m inconnue?

Et si j’insiste
lourdement ? Loi de distribution de X
Pas mal…
mais que se serait-il passé si
j’avais pris un autre échantillon ?

m
Moins bien…. x 2 x 1
Et un autre ?

Théorème fondamental:
Si X est une v.a. de moyenne m et d’écart-type s, alors la v.a. moyenne, notée
 
Pourquoi les observations de x sont-elles concentrées autour
X , obtenue sur un échantillon de taille n tend vers une loi normale N μ,s n
de la moyenne inconnue m ?
Estimation et intervalle de confiance

La variance :

1 1 nσ²
σ² x = Var(x i )
= Var(  x i )
=  var(x i )
=
n n² n²
σ²
σ² x =
n

D’ou

s x s n
l’inférence statistique consiste à

estimer, à partir d’un échantillon, les valeurs numériques de la moyenne et de


la variance de la population, en déterminant la précision de cette estimation.

1. Estimation ponctuelle

2. Estimation par intervalle


1. Estimation ponctuelle

1.1. Moyenne
Notation:
La moyenne vrai est notée µ
La moyenne estimée est notée m̂ ou x
1
Estimation de la moyenne µ à partir d’un nombre mˆ  x   x i
réduit de mesures est: n i
1.2. Variance
Notation:
La variance vrai est notée σ²
La variance estimée est notée sˆ 2 ou s²

1
Estimation de la variance σ² à partir d’un nombre
réduit de mesures est:
sˆ  s ² 
2

n 1 i
( x i  x )²
2. Estimation par intervalle

L’estimation ponctuelle d’un seul paramètre ne présente pas grand intérêt - n’apporte pas beaucoup
d’informations- , autrement dit l’outil d’estimation présente une relative fragilité.

Pour sécuriser une estimation ponctuelle, on va introduire un autre outil fondamental puissant :
intervalle de confiance.
Intervalle dans le quel, on a des bonnes raisons de croire qu’il contient la vrai valeur du paramètre
estimée.

Soit e le paramètre inconnu et ê son estimation, déterminer un intervalle revient à chercher les

deux limites e1 et e2 tel que: e  [e1, e2]

En suite, on définit un degré de confiance ou niveau de confiance noté (1-α) tel que la probabilité

P (e1< e <e2) = 1-α

 [e1, e2] est par définition appelé intervalle de confiance au niveau de confiance 1-α
 α est le risque de se tromper (1%, 5%)
2.1. Intervalle de confiance de la moyenne (IC)

 La moyenne n’est donc qu’une estimation de la valeur vrai et, si on faisait une autre série
de mesures, on n’obtiendra pas tout à fait la même moyenne. Il y a donc un risque que le
résultat final soit différent de µ.

 L’intervalle de confiance de la moyenne permet, non pas de supprimer ce risque mais de


le quantifier.

L’intervalle de confiance de la moyenne a deux limites (L,U). Pour les obtenir:

-On calcule d’abord l’écart-type de la moyenne s x selon la formule suivante:


s
sx 
n
-On obtient l’intervalle de confiance(L,U) au niveau de confiance 1-α à l’aide de la formule
suivante:
[x  k IC  s ;x
x  kIC  x s ]
Ou kIC est le facteur de couverture de l’intervalle de confiance
Si l’écart-type est inconnu ( le cas le plus courant) on pose :

k IC
 t n1,1 / 2

Et la formule de l’intervalle de confiance devient:

[ x  t n1,1 / 2  s x ; x  t n1,1 / 2  s x ]
Ou t est la variable de Student correspond à n-1 degré de liberté et 1-α/2.
Exemple: Si le risque d’erreur α=5% alors 1-α/2= 97,5

Pour calculer l’intervalle de confiance de la moyenne, on doit calculer à partir de la série des
mesures de l’échantillon:
-La moyenne x
-L’écart-type s
-l’écart-type de la moyenne sx
-La quantile t de Student (n-1 degré de liberté et α le risque d’erreur)??!!
Statistique inférentielle Estimation et intervalle de confiance

La valeur de t de Student peut être déterminée à partir de la table de Student ou ne se trouvent que quelques
valeurs conventionnelles du niveau de confiance, comme 95%, 97,5%, 99%, ect.
Pratiquement, on peut obtenir n’importe quelle valeur de le quantile t facilement, en précisant le nombre de
degré de liberté et la probabilité, et ceci à l’aide de la fonction LOI. STUDENT. INVERSE(Probabilité,
degré de liberté) de l’Excel.

Remarque:
Bien que le niveau de confiance est 1- α = 95%,
on note que la probabilité 1- α/2=97,5% pour
indiquer l’IC est bilatéral et que le risque α est
réparti de chaque coté de la fonction de densité.

Lorsqu’on calculera le quantile t, il faudra tenir

compte du fait que le risque α est réparti par moitié,

à chaque extrémité de l’intervalle.


Si l’écart-type est connu (cas rare) on pose :
k IC
 z n 1,1 / 2

Et la formule de l’intervalle de confiance devient:

[ x  z1 / 2  s x ; x  z1 / 2  s x ]
Ou z est la variable de la loi normale réduite correspond à un niveau de confiance de (1-α)
Pour un niveau de confiance de (1- α) bilatéral , le fractile z est lu dans la table de la loi normale
pour une probabilité de 1- α/2.
2.2. Intervalle de confiance de la variance

La formule proposée de calcul de l’intervalle de confiance de la variance:


( n 1) s 2 ( n 1) s ²
[ ; ]
 /2
2
 2
1 / 2

Ainsi la formule de calcul de l’intervalle de confiance de l’écart-type:

[ SCE x ; SCE x ]
 / 2
2
 12 / 2

χ²α/2 et χ²1-α/2 sont les quantiles du khi-deux (χ²) à n-1 degré de liberté pour des
probabilité 1-α/2 et α/2.
Ces deux quantiles peuvent être obtenus à l’aide de la fonction:
KHIDEUX. INVERSE (probabilité, degré de liberté)

Remarque:
Les limites de confiance de la variance ne sont pas symétriques par rapport à la variance de l’échantillon.
2.3. Intervalle de confiance d’une proportion

Soit une population constituée d’un lot de 5000 ampoules. On a deux situations (opposée):
1-Ampoule défectueuse (ED),
2-Ampoule non défectueuse (END).
On souhaite connaitre avec précision la proportion p des ampoules défectueuses

Quelle est la loi qui régit dans ces conditions? Loi binomiale

Loi binomiale a comme paramètres:


Moyenne=np
Variance=npq

n: nombre des éprouves (essais)


p: la proportions des ampoules défectueuses =x/n
q: la proportion restante (des ampoules non défectueuses)=1-p

Est-ce qu’il est possible de faire les éprouves sur toute Pas toujours
la population (lot entier)? possible

Alors comment faire pour estimer avec précision la


proportion des ampoules défectueuses?
2.3. Intervalle de confiance d’une proportion

Un échantillon de 100 ampoules a été prélevé à partir du lot de 5000 ampoules.


Après avoir contrôler les 100 ampoules, on a déterminé que la proportion des (ED) est p1.
Un autre échantillon de 100 ampoule est obtenu et la proportion retrouvée est p2
Échantillon i ………..pi

Alors comment estimer à partir d’un échantillon la


proportion des (ED) de la population?

p1, p2, p3, …pi sont aussi des valeurs de la variable P (p=x/n)

La nouvelle variable aléatoire P a comme paramètres:

la moyenne des proportions: mx= p


pq p(1 p)
la variance de la moyenne des proportions: s ²  
n n
p(1-p)
si np>5, La variable pi → (p; )suit une loi normale, alors L’intervalle de confiance de la
n
proportion p, à un niveau de confiance 1-α,est donné par la formule suivante:

[ p  z1 / 2  s ; p  z1 / 2  s ]
Statistique inférentielle Estimation et intervalle de confiance

Alors,
Alors,l’intervalle
l’intervallede
deconfiance
confianced’une
d’uneproportion
proportionppd’un
d’unéchantillon
échantillonest
est lelesuivant:
suivant:

Prob ([( p 
Prob z1 / 2  Sp    p  z1 / 2)=1-α
 Sp ] )=1-α
[ p  z1 / 2  s    p  z1 / 2  s ]

Si p est inconnue (cas courant): p (1 p )


Sp 
n

Z1-α/2 est la variable de la loi normale correspond à un niveau de confiance de (1-α)


Pour un niveau de confiance de (1- α) bilatérale, le fractile z est lu dans la table de la loi normale
pour une probabilité de 1- α/2.
EXEMPLE : La valeur de z à 95% de chance égale 1,96
Statistique inférentielle Estimation et intervalle de confiance

Exemple 3:
Soit un échantillon de 100 ampoules prise de manière aléatoire dans une production.
Parmi elles, 6 sont défectueuses. Donner l’intervalle de confiance à 95 % de la proportion
d’ampoules défectueuses.

Solution:
Calculons la proportion p et q
P=6/100=0,06 et q=1-0,06= 0,94
La condition de normalité: np=6>5 et nq=94>5 et puisque La proportion π de la population mère est
inconnue.

0,06×0,94
Sp= =0,0237
100
Et l’intervalle de confiance à un niveau de confiance de 95%
[0,06−0,0237x1,96 ; 0,06 + 0,0237x1,96] = [0,06 −0,05; 0,06 + 0,05]=[0,01;0,11]
Soit en pourcentage: [1% ; 11%]
Un laboratoire d’analyses médicales utilise une technique analytique pour quantifier le taux

de glucose dans le sérum sanguin. Au vu et au su des résultats antérieurs, la précision de

cette technique a été caractérisée par un écart-type σ =2mg/dL.

Pour un échantillon donné, donner l’intervalle de confiance (au seuil de confiance de 95%)

du taux « réel » de glucose en envisageant 3 cas:

1) On ne fait qu’une mesure qui donne la valeur 127 mg/dL

2) On fait 7 mesures dont les résultats sont les suivants (en mg/dL)

127 -125- 123- 130- 131- 126- 129

3) On reprend les 7 mesures de (2) mais on considère que l’on ne connaît pas σ.
Solution:

a) On suppose que la distribution est normale


Statistique inférentielle Estimation et intervalle de confiance

Intervalle de confiance de la variance

On mesure la quantité de zinc perdue par des aiguilles galvanisées lorsque l’on trempe

celles-ci dans une solution d’acide hydrochlorique. Pour cela, on pèse les aiguilles avant et

après les avoir trempées, c'est-à-dire avant et après que les aiguilles aient réagit avec

l’acide.

On a obtenu les résultats suivants (quantités perdues) :

1,45-1,56- 1,46- 1,89- 1,60- 1,63- 1,44- 1,55- 1,45- 1,52

Calculer l’intervalle de confiance (à un seuil de confiance de 95%) de la moyenne et de la

variance de la quantité de zinc perdue.


les résultats de dosage du principe actif dans 20 comprimés sont regroupées dans le suivant:
Calculer l’intervalle de confiance de la moyenne?

N° Conc (mg) N° Conc (mg)


1 21,04 16 18,59
2 18,59 17 20,33
3 20,12 18 19,86
4 21,16 19 19,46
5 19,14 20 19,74
6 19,84 21 19,66
7 19,90 22 19,99
8 19,94 23 18,99
9 20,08 24 19,89
10 23,43 25 20,25
11 21,04 26 18,59
12 18,59 27 20,33
13 20,12 28 19,86
14 21,16 29 19,46
15 19,14 30 19,74

L’intervalle de confiance est à 95% vaut [19,50-20,48]


Tests d’hypothèses

- Peut-on considérer que la teneur en pesticide d'un lait bio est identique à celle d'un
lait classique du commerce?

- Peut-on considérer que quatre variétés des haricots verts produisent des haricots de
même finesse?

- Est-ce que les deux teneurs moyennes en huile de deux variétés de Tournesol sont de
même ordres?

La prise de décision pour donner une réponse à chaque question par OUI ou NON
n’est pas évidente.

Ces types de questions peuvent être résolues par un test d'hypothèses statistiques, qui
est un processus décisionnel.

La réponse sera donnée à l'issue d'un résultat aléatoire ( observation, expérimentation)


et, par suite, "fatalement", cette réponse sera plus ou moins risquée.
Définition:

 Un test d’ hypothèse statistique ou test de signification est une supposition au sujet d'un

ou plusieurs paramètres de la population ( moyenne, écart-type, CV, proportion, etc..) .

Cette supposition peut ou ne peut pas être vrai.

 Le but d’un test d’ hypothèse statistique est de vérifier, à partir des données d’un ou

plusieurs échantillons , la validité de certaines hypothèses relatives à une ou plusieurs

populations.

Les tests d’hypothèses ou les tests statistiques sont des techniques statistiques
développées pour faciliter la prise de décision. (Max feinberg)
Principe:

 En général, dans tout test d’ hypothèse, on émit, en concurrence, deux hypothèses H0


et H1 .

L'hypothèse nulle, symbolisée par H0, est une hypothèse statistique qui indique qu'il n'y a

aucune différence entre un paramètre et une valeur spécifique, ou qu'il n'y a pas de

différence entre deux paramètres.

L'hypothèse alternative, symbolisée par H1, est une hypothèse statistique qui indique

l’existence d'une différence entre un paramètre et une valeur spécifique, ou affirme qu'il y

a une différence entre deux paramètres.


Supposons qu’un analyste a développé une nouvelle méthode (μ2) pour remplacer une
méthode ancienne (μ1)

Pour réaliser l’étude, comment on va procéder:

H0: les deux moyennes sont du même ordre de grandeur:

H1: les deux moyennes ne sont pas du même ordre de grandeur ou sont significativement
différentes. Différents situations se présentent :

 Si H1 est: ce test est appelé test bilatéral

 Si H1 est: ou ce test est appelé test unilatéral

En réalité, l'hypothèse H1 est celle que l'expérimentateur cherche à mettre en évidence. En


effet, la revendication doit être formulée comme l'hypothèse alternative en utilisant < , > ,
ou ≠. Pour cette raison, l'hypothèse alternative est parfois appelée l'hypothèse de
recherche.
En réalité, l’analyste ne sait pas si les deux méthodes sont équivalentes ou non. Alors
nous sommes dans les situations suivantes:

1. l’analyste va accepter l’égalité des deux moyennes, alors que les deux méthodes
sont effectivement équivalentes.

Conclusion correcte

2. l’analyste va rejeter l’égalité des deux moyennes, alors que les deux méthodes
sont effectivement différentes.

Conclusion correcte

3. l’analyste peut accepter l’égalité des deux moyennes, alors que les deux méthodes
sont effectivement différentes.

Conclusion fausse

4. l’analyste peut rejeter l’égalité des deux moyennes, alors que les deux méthodes
sont effectivement équivalentes.

Conclusion fausse
On peut résumer les situations précédentes par le tableau suivant:

Etat réel des méthodes

Décisions Equivalentes Différentes

Décision fausse
Conclure qu’elles sont Décision correcte
Risque d’erreur du 1ier
différentes Pas de risque
espèce (α)

Décision fausse
Conclure qu’elles sont Décision correcte
équivalentes Risque d’erreur du 2ieme
Pas de risque
espèce (β)
Définitions:

1. Risque de 1ier espèce

Lorsqu'on rejette H0, on prend le risque de le faire alors que cette hypothèse est vraie : c'est le
risque de 1ier espèce . Concrètement, dans notre exemple, le risque du 1ier espèce est le risque
que l'on prend en décidant que les deux moyennes sont différentes alors qu'elles sont
réellement égales.

Le maximum du risque de 1ier espèce est appelé "niveau du test ou niveau de signification" ou
encore "seuil de signification " noté α
Dans la pratique, c'est l'utilisateur, le plus souvent, qui fixe ce seuil.

Traduction probabiliste :
Le risque est une probabilité conditionnelle : α = P(rejet de Ho)
Étapes du test

Tous les tests statistiques suivent la même démarche qui est résumée par les six étapes suivants:

1. Définir une hypothèse nulle ou hypothèse principale H0.

2. Définir une hypothèse alternative H1 qui dira que le test est unilatéral ou bilatéral.

3. Calculer la valeur de la statistique (valeur observé) Sobs à partir des données


expérimentales et de la formule fournie pour le type de test statistique employé.

4. Définir le niveau de signification pour le rejet de H0.

5. Lire dans la table de référence la valeur statistique critique Scrt pour le nombre de
mesure utilisé et le niveau de signification accepté., en tenant compte du fait que
le test est unilatéral ou bilatéral.

6. Prendre une décision de rejeter ou de conserver l’hypothèse principale et faire une


interprétation
Pour notre exemple, H0: Les deux méthodes sons équivalents : On suppose que les deux
moyennes sont statistiquement égales μ1 = μ2 ou ǀμ1 - μ2ǀ =0

Après avoir déclaré l'hypothèse H0 (et aussi H1: μ1 ≠μ2), on fixe le niveau de signification
α = 0,05.

A partir des données expérimentales, on calcule les deux moyennes et des deux
méthodes. Elles sont les estimations respectivement des vrais moyennes des deux
méthodes μ1 et μ2.

Puis, on calcule également ce qu’on appelle un critère observé ou la statistique observée


(Sobs).

Soit et les moyennes et les variances des deux méthodes respectivement.


La statistique, dans notre cas, est définit par la formule suivante:

Ensuite, on définit la loi que la statistique suit, dans notre cas, puisque les deux variables
suivent la loi normale alors la différence suit aussi la loi normale, en
conséquence; le critère observé suit une loi normale centrée et réduite.
D’une manière générale, les critères statistiques observés sont la plupart du temps
construits de façon à obtenir une nouvelle variable aléatoire qui suit une loi de probabilité
statistique déjà connu, comme la loi de Student ou la loi de Fisher.

Une fois la loi est définie, on passe à l’étape de la prise de décision:

Règle de décision 1:

Connaissant la loi de probabilité (N.C.R.) suivie par la statistique Sobs sous l’hypothèse H0,
il est possible d’établir une valeur seuil (valeur critique), notée Sseuil de la statistique pour
le niveau de signification du test (α=0,05).

La région critique correspond à l’ensemble des valeurs telles que Sobs > Sseuil est tel que :

P(S > Sseuil) = 0,05 avec P(S ≤ Sseuil) = 0,95


Sous l’hypothèse «H0 est vraie » et pour un seuil de signification α fixé .

• Si la valeur de la statistique S calculée Sobs est supérieure à la valeur seuil Sseuil alors l’hypothèse H0
est rejetée au risque d’erreur α et l’hypothèse H1 est acceptée.

• Si la valeur de la statistique S calculée Sobs est inférieure ou égale à la valeur seuil Sseuil alors
l’hypothèse H0 n’est pas rejetée.
Exemple 1

Le niveau de risque α=0,05


Sobs = 1,59 et Sseuil = 1,65
Règle de décision 2:

Connaissant la loi de probabilité suivie par la statistique Sobs sous l’hypothèse H0, il est
possible d’établir une valeur de probabilité qui correspond à la valeur de la statistique Sobs
telle que P (S ≥ Sobs). Cette probabilité est appelée la probabilité critique αobs .

En quelque sorte, la probabilité critique évalue la crédibilité de l'hypothèse Ho testée, compte


tenu du résultat observé à partir du ou des échantillons: Plus la valeur de αobs . est petite,
moins Ho est crédible et plus il y a de chances que Ho soit rejetée.

• Si αobs ≥ 0,05, l’hypothèse H0 est acceptée car le risque d’erreur de rejeter H0 alors
qu’elle est vraie est trop important.

• Si αobs < 0,05, l’hypothèse H0 est rejetée car le risque d’erreur de rejeter H0 alors
qu’elle est vrai est très faible.
Exemple 2

Le niveau de risque α=0,05 (attention test bilatéral)


Sobs = 8,2 alors αobs = 0,0294 x 2 = 0,0588

Puisque αobs > 0,05 alors H0 est acceptée


Remarque:

Selon l'ordre de grandeur de la probabilité critique, le test sera qualifié de


significatif,
très significatif et
hautement significatif:
- 1% < αobs <5% Test significatif, souvent symbolisé par *
- l ‰ < αobs < 1% Test très significatif, souvent symbolisé par **
- αobs≤ l‰ Test hautement significatif, souvent symbolisé par ***.
Test de conformité d’une moyenne

Le test de conformité d’une moyenne par rapport à une valeur fixe (valeur de référence
définie à l’avance par le laboratoire).
Exemple 1: Au cours de la validation d’une méthode en vue de vérifier que cette méthode est
juste, on doit obtenir un résultat conforme à la valeur de référence d’un matériau de
référence de teneur connue.
Exemple 2: En analyse de routine, en contrôle la conformité d’un lot par rapport à une norme
ou une spécification.

1- Démarche statistique

Soit R est la valeur fixe, la moyenne calculée, s l’écart-type et n le


nombre de mesure.
On pose H0:
H1:
Alors, il s’agit d’un test bilatéral.
2- statistique du test
Sous H0, la statistique du test de conformité d’une moyenne est définit par la formule
suivante:

Pour des petites valeurs de n la statistique suit la loi de Student à n-1 ddl

3- prise de décision

Si

Ou

On rejette H0 avec un seuil de


signification α
Remarque :
En développent la formule ci-dessous et tenant compte de la valeur absolue, on
obtient la formule qui analogue à celle de l’intervalle de confiance:

Alors, réaliser le test de conformité d’une moyenne revient à vérifier si la valeur 0 est bien
comprise dans l’intervalle de confiance de
4- Exemple

On a observé les teneurs, ci-dessous, en nitrates (mg/l) des eaux de sources de régions
différentes, ces teneurs ne doivent pas dépasser un seuil ou une norme de 25 mg/l.
H0: m=25 mg/l et H1: m ≤ 25 mg/l

la valeur de Student égale à:

Dans la table de Student, la valeur de t-crit pour un ddl de 29 et un niveau de signification de


0,05 et le test est unilatéral:

tcal > tcrt donc H0 est rejetée et le test est significatif.

Ou on calcule la probabilité P (t  0,9553) = 0,17 < 0,05 donc H0 est rejetée


Test de comparaison de deux moyennes
1- Démarche statistique

Soit deux populations de moyennes m1 et m2 et de variances σ²1 et σ ²2


la variance commune des deux population est:

1= n1-1 est le ddl de de la population 1 et n1 est le nombre de mesure.


2= n2-1 est le ddl de de la population 1 et n2 est le nombre de mesure.
On pose H0: m1 - m2 = 0
H1: m1 ≠ m2
Alors, il s’agit d’un test bilatéral.

2- statistique du test
Sous H0, la statistique du test de comparaison de deux moyennes suit la loi de Student à
n2 +n1 -2 ddl, elle est définit par la formule suivante:
3- prise de décision

On rejette H0, pour un test bilatéral à = n1+n2 – 2 ddl et un niveau de signification α, quand:

P ( ǀ t ǀ  tcal ) ≤ α ou tcal  t ; 1- α/2


4- Exemple
Test de comparaison de deux variances
1- Démarche statistique

Soit deux populations de variances σ²1 et σ ²2


1= n1-1 est le ddl de de la population 1 et n1 est le nombre de mesure.
2= n2-1 est le ddl de de la population 1 et n2 est le nombre de mesure.
On pose H0: σ²1 = σ ²2
H1: σ²1 ≠ σ ²2
Alors, il s’agit d’un test bilatéral.

2- statistique du test
Sous H0, la statistique du test de comparaison de deux variance suit la loi de Fisher -
Snedecor à 1=n1 -1 et 2=n2 -1 ddl, elle est définit par la formule suivante:

S²max étant la plus grande des deux variances estimées et S²min est la plus petite.
3- prise de décision

Le rejet de H0 intervient, pour le test bilatéral à 1=n1 -1 et 2=n2 -1 ddl et un niveau


de signification α, quand

P ( ǀ F ǀ  Fcal ) ≤ α/2 ou Fcal  F 1- α/2


Homogénéité des variances

.
On utilise le test de Cochran qui consiste à comparer la statisyique de Cochran de ces
variances avec celui lu sur la table correspondante à un risque α.

Soit un ensemble de k variances S²i, toutes calculées à partir du même nombre n de


résultats de réplique, la statisyique de Cochran est

2
S

ma x
C ca l k

S
2
i
i 1

S²i : Variance calculée à partir de n résultats d’un même groupe i


S²ma: variance maximale de l’ensemble des k S i2

Le critère de Cochran ne teste que la plus forte valeur d’un ensemble de variances (ou ses écart types
associés) et est donc un test unilatéral de valeur aberrante. Le test de Cochran correspond à vérifier
l’inégalité suivante :

C Ccal table(  , n , m )
n: nombre de répétitions
m: nombre de groupe

Si l’inégalité est vérifiée on accepte l’hypothèse selon laquelle les variances


des populations sont égales entre elles.
Vérification de la normalité d’une distribution

On vérifier si l’ensemble des données suivent la loi normale et déterminer si certaines


d’entre elles sont aberrantes.
Parmi les tests le plus connu est celui du Χ² ( khi- deux). Mais pour être efficace, il requit
un grand nombre de mesures, ce qui est rarement le cas en chimie analytique.

On propose une méthode graphique basée sur la droite de henry, décrite dans la
norme ISO 5479 .
Cette technique simple permet de:
 Vérifier visuellement si une valeur est aberrante,
 Vérifier visuellement si l’ensemble des données suivent la loi normale.

06/12/2011 Pr B. IHSSANE 52
Démarche pratique pour la vérification de la normalité
d’une distribution

Pour réaliser ce graphique on va procéder comme suit:


 Trier les données par ordre croissantes on leur affecter un numéro d’ordre i
qui correspond à leur rang,
 Calculer la moyenne m et l’écart-type s,
x -x
u
i
 Pour chaque xi , calculer la valeur centrée réduite notée: i
s
 Pour chaque xi , calculer un intervalle de probabilité Pobs à l’aide de la
formule suivante: i 0,375
P 
n  0,25
obs

Ou i désigne le numéro d’ordre de la donnée et n le nombre total des données


 Pour chaque Pobs calculer à l’aide la fonction inverse de la loi normale centrée
réduite la valeur uobs
 Porter sur le même graphique les valeurs de u et uobs en fonction de x

06/12/2011 Pr B. IHSSANE 53
Exemple d’application de la vérification de la normalité
d’une distribution
4,0

3,0
V.C.R (U)

2,0 U obs

1,0

0,0

-1,0

-2,0

-3,0
18 19 20 21 22 23 24

Par ce moyen graphique, il est possible de repérer le point extrême qui déforment la
figure et qu’on peut alors la suspecter d’être un point aberrantes.

D’prés la figure, on remarque que le point correspond à la mesure n°10 est anormale

06/12/2011 Pr B. IHSSANE 54
Exemple d’application de la vérification de la normalité
d’une distribution

4,0

3,0 V.C.R (U)

2,0 U obs

1,0

0,0

-1,0

-2,0

-3,0
18 18,5 19 19,5 20 20,5 21 21,5

La nouvelle droite de Henry montre que les deux séries de points sont alors presque
confondues. Ce résultats confirme que la valeur de la mesure n°10 biaise le calcule.

Reconstituons maintenant avec les 19 données un nouveau Histogramme


06/12/2011 Pr B. IHSSANE 55
Diagramme d’histogramme corrigé

50
fréquence

40

30

20

10

0
18,85 19,36 19,88 20,39 20,90
Centre de classe

On constate clairement d’après la forme de ce nouveau histogramme que la


distribution suit la loi normale

06/12/2011 Pr B. IHSSANE 56

S-ar putea să vă placă și