Documente Academic
Documente Profesional
Documente Cultură
Chapitre 2
La loi normale
L'objectif du chapitre est de prsenter la loi normale qui est le modle probabiliste le plus utilis pour dcrire de trs nombreux phnomnes observs dans la pratique. Une grande attention devra tre accorde aux concepts, essentiels en statistiques, d'esprance mathmatique et de variance et aux oprations qui leurs sont attaches.
21
correspondant aux valeurs possibles de X . Ces probabilits sont obligatoirement telles que : et la correspondance 8 xi , pH xi L< est appele : loi de probabilit (ou distribution de probabilit ) de la variable alatoire X . Si les valeurs possibles de X , sont rparties de faon continue sur un intervalle fini ou infini, X est une variable alatoire continue . Une telle variable est dfinie si l'on connait la probabilit pour que X prenne une valeur dans tout intervalle @ x, x + h @. On se donne pour cela la fonction de rpartition de X : PH xL = Prob 8 X < x< pH x1 L + ... + pH xi L + ... + pH xn L = 1,
Un cas particulier important, auquel nous nous attacherons exclusivement dans ce qui suit, est celui o la fonction de rpartition est continue, et peut tre mise sous la forme : o pH xL s'appelle la densit de probabilit de X , appellation qui rsulte du fait que : La densit de probabilit pH xL ou la fonction de rpartition PHxL dfinissent la loi de probabilit d'une variable alatoire continue X . Elles donnent lieu aux reprsentations graphiques suivantes :
Prob 8 x X <x+D x< pH xL = limD x0 Dx
22
(2.1)
Il est important de bien noter que, conformment aux axiomes qui dfinissent les probabilits : - pH xL x = 1 et 0 PHxL 1
+
La variable alatoire U est distribue uniformment sur l'intervalle @a, bD si sa densit de probabilit est constante sur cet intervalle :
(2.2)
Si, maintenant, on considre les intervalles de temps T qui s'coulent entre les vnements successifs d'un processus de Poisson, soit F HtL la fonction de rpartition de T . On a :
23
F Ht L = 1 - Prob 8T > t<. Or cette dernire probabilit est gale la probabilit pour qu'il ne se produise aucun vnement jusqu' l'instant t, c'est--dire p0 HtL, et par consquent : F Ht L = 1 - -l t .
C'est la loi exponentielle qui peut constituer un modle intressant pour les dures de vie alatoires de certains matriels (tubes lectroniques) : chaque instant t de la vie du matriel, la probabilit de dfaillance pendant l'intervalle de temps D t qui suit, est indpendante de t et gale l D t.
Si les deux variables sont indpendantes, cette expression doit dpendre de x seulement et l'on doit donc pouvoir faire disparatre p2 H yL par simplification. De la mme faon, l'expression : doit dpendre de y seulement et l'on doit pouvoir la simplifier pour faire disparatre p1 H yL. Il en rsulte que pH x, yL doit tre gal au produit des densits de probabilit marginales de X et de Y : Prob 8 y Y < y + y x X < x + x< = . p1 HxL
pH x, yL y
24
pH x, yL = p1 H xL p2 H yL. Cette condition est videmment ncessaire et suffisante . Elle se gnralise pour un nombre quelconque de variables alatoires indpendantes dans leur ensemble.
On remarquera qu'une variable f H X L peut prendre la mme valeur pour deux valeurs diffrentes xi et x j de X . La probabilit de la valeur f Hxi L ou f H x j L est alors gale pH xi L + pH x j L.
Etant donnes une variable alatoire X , dfinie par sa densit de probabilit pH xL, et une fonction f , la variable alatoire f H X L, fonction de la variable alatoire X , est dfinie de la faon suivante : f H X L prend la valeur f H xL, lorsque X prend la valeur x.
On peut aussi dfinir des fonctions de plusieurs variables alatoires. La somme de deux variables alatoires , notamment, se dfinit de la faon suivante : tant donn deux variables alatoires X et Y , leur somme est la variable alatoire H X + Y L qui prend la valeur Hx + yL lorsque X prend la valeur x et Y prend la valeur y. L encore, une mme valeur de la somme peut tre obtenue pour deux couples diffrents de valeurs de X et Y . Penser, par exemple la variable : on jette deux ds et on en fait la somme.
2. Esprance mathmatique
2.1. Esprance et moments d'une variable alatoire
Etant donnes une variable alatoire X dfinie par sa densit de probabilit pH xL et une fonction f , on dsigne par le terme d'esprance mathmatique de la variable alatoire f H X L, et on la note E@ f H X LD, l'expression : E@ f H X LD = - f HxL pH xL x
+
C'est donc un oprateur qui transforme la variable alatoire f H X L en un nombre. Appliqu la variable X elle-mme, l'oprateur donne sa moyenne m : m = EH X L = - x pH xL x.
+
Dans le cas d'une variable alatoire discrte valeurs positives ou nulles : x0 , ... , xi , ... , xn , l'expression prcdente devient : m = E@ f H X LD = n i=0 f H xi L pH xi L.
et toutes les proprits de l'oprateur E que nous dmontrerons par la suite, pour une variable continue, s'tendent sans difficult au cas d'une variable discrte.
Lorsque f H X L est une puissance de X , l'expression EH X k L est appele moment d'ordre k de la variable alatoire X . La moyenne m = EH X L est ainsi le moment d'ordre 1 de la variable X . Elle s'interprte comme l'abcisse du centre de gravit de la distribution de probabilit et c'est, ce titre, une caractristique de tendance centrale de la distribution : les valeurs d'une variable alatoire se rpartissent autour de sa moyenne.
Lorsque fH XL est une puissance de X , l'expression EH X k L est appele moment d'ordre k de la Chapitre 2 : La loi normale 25 variable alatoire X . La moyenne m = EH X L est ainsi le moment d'ordre 1 de la variable X . Elle s'interprte comme l'abcisse du centre de gravit de la distribution de probabilit et c'est, ce titre, une caractristique de tendance centrale de la distribution : les valeurs d'une variable alatoire se rpartissent autour de sa moyenne.
Le moment centr d'ordre 2 est appel variance et il revt une importance toute particulire. Nous le noterons s2 H X L, ou trs souvent s2 : s2 H X L = E@H X - mL2 D = - Hx - mL2 pH xL x.
+
Par analogie avec la mcanique, on peut dire que m est le centre de gravit et que s2 est le moment d'inertie de la distribution. Sa racine carre s est appele l'cart-type , qui s'interprte comme une mesure de la dispersion d'une variable alatoire : plus les valeurs de la variable sont susceptibles de s'loigner de sa moyenne, plus son cart-type est grand. C'est ce que montre l'ingalit de Bienaym-Tchebichef.
c'est dire :
C'est l'ingalit de Bienaym-Tchebichef qui s'interprte ainsi : plus s est petit, plus les grandes valeurs de X - m sont improbables, donc moins la variable X est disperse autour de sa moyenne m. Si l'on pose a = t s, l'ingalit s'crit :
1 Prob 8 X - m > t s< < t2 .
et exprime que la probabilit pour que X s'loigne de sa moyenne de plus que t fois son 1 cart-type s, est infrieure t2 . Il y a, en particulier, moins de 1 chance sur 4 pour que X 1 s'loigne de m de plus de 2 fois s, et il est trs improbable (probabilit infrieure ) que X 100 s'loigne de m de plus de 10 fois s.
26
et exprime que la probabilit pour que X s'loigne de sa moyenne de plus que t fois son 1 cart-type s, est infrieure t2 . Il y a, en particulier, moins de 1 chance sur 4 pour que X 1 s'loigne de m de plus de 2 fois s, et il est trs improbable (probabilit infrieure ) que X 100 s'loigne de m de plus de 10 fois s. Ces rsultats sont trs gnraux puisqu'ils ne ncessitent aucune hypothse sur la forme de la loi de probabilit de X . On peut, bien sr, les rendre beaucoup plus prcis et les serrer davantage dans chaque cas particulier o la loi de probabilit de X est connue.
EHa X + bL = a EH X L + b.
EH X + Y L = - x x - pH x, yL y + - y y - pH x, yL x EH X + Y L = - x p1 HxL x + - y p2 H yL y EH X + Y L = EH X L + EHY L
+ + +
Cette proprit s'applique, bien entendu, la somme d'un nombre quelconque de variables. On notera, d'autre part, que la dmonstration n'a requis aucune hypothse sur l'indpendance des variables alatoires considres.
De la forme mme de la variance, il rsulte que : - la variance d'une constante est gale 0, - dans un changement d'chelle de rapport k , la variance est multiplie par k 2 . Si, d'autre part, on dveloppe l'expression de la variance, et qu'on utilise les proprits de linarit de l'esprance, il vient : et, puisque EH X L = m : s2 H X L = EH X 2 - 2 m X + m2 L = EH X 2 L - 2 m EH X L + m2 s2 H X L = EH X 2 L - m2 s2 H X L = EH X 2 L - E H X L2
Cette relation sera trs souvent utilise. On la retiendra facilement en crivant que :
et en nonant que : la variance est gale l'esprance du carr moins le carr de l'esprance . Appliquons la quelques-unes des variables alatoires dj rencontres.
27
Soit la variable U distribue uniformment sur l'intervalle @0, aD. Elle a pour densit de 1 probabilit a , donc pour moyenne :
1 a EHU L = 0 x a x = 2, a
1 a EHU 2 L = 0 x2 a x = 3 ,
2
a s2 HU L = EHU 2 L - EHU L2 = 12
2
s2 H X L = EH X 2 L - EH X L2 = v - v2 = vH1 - vL.
2.5.3. Loi de Poisson La loi de Poisson est dfinie par la densit de probabilit :
l pHk L = -l , k!
k
k =0
l -l = l. Hk -1L!
k -1
l k Hk - 1L -l = l2 . k!
On a, par consquent :
s2 HK L = EHK 2 L - EHK L2 = l2 + l - l2 = l.
La loi de Poisson est donc telle que moyenne et variance soient toutes les deux gales l. 2.5.4. Loi exponentielle La densit de probabilit est :
28
2 EHT 2 L = 0 t2 l -l t t = , l2
Soient X et Y deux variables alatoires dfinies par leur densit de probabilit pH x, yL. L'esprance mathmatique du produit de ces deux variables est, par dfinition :
EH X Y L = - x p1 HxL x - y p2 H yL y = EH X L E HY L.
+
Il s'agit l d'un thorme trs important qui peut s'noncer de la faon suivante : si deux variables alatoires sont indpendantes, l'esprance de leur produit est gale au produit de leurs esprances . Ce thorme justifie la dfinition d'une quantit appele la covariance de X et Y : sH X , Y L = EH X Y L - EH X L EHY L
qui a la proprit suivante : la covariance de deux variables alatoires indpendantes est nulle. Il faut faire attention au fait que la rciproque n'est pas vraie, en gnral.
2.7. Variance d'une somme (ou d'une diffrence) de variables alatoires indpendantes
Soient X et Y deux variables alatoires. La variance de leur somme (ou de leur diffrence) peut s'crire (esprance du carr moins carr de l'esprance) : s2 H X ! Y L = E @H X ! Y L2 D - EH X ! Y L2 .
et le second terme en :
EH X ! Y L2 = E H X L2 ! 2 EH X L EHY L + EHY L2 .
29
o l'on reconnait :
Si, maintenant, les deux variables X et Y sont indpendantes, leur covariance est nulle, et :
proprit qui s'nonce ainsi : la variance de la somme ou de la diffrence de deux variables alatoires indpendantes est gale la somme de leurs variances.
3. Loi normale
3.1. Dfinition et proprits
La loi de probabilit la plus utilise en statistique est la loi normale, encore appele loi de Gauss, ou de Laplace-Gauss. Une variable alatoire X suit une loi normale si sa densit de probabilit a pour quation :
1 L , 2 H s pH xL = ! - !!!!!!
1 x-m 2
2p
dont le graphe est la fameuse " courbe en cloche ", et qui dpend de deux paramtres m et s qui ne sont autres, comme on le montrera au paragraphe suivant, que la moyenne et l'cart-type de X .
(2.3)
La distribution est symtrique par rapport m qui caractrise donc la tendance centrale. Quant s, il caractrise la dispersion de la distribution. Plus il est grand, plus la distribution est tale de part et d'autre de m. Les points d'inflexion se trouvent H m - sL et H m + sL, avec : Prob 8 X - m < s< = 68, 26 %.
Il sera bon de conserver en mmoire deux autres valeurs intressantes : Prob 8 X - m > 1, 96 s< = 5 %, Prob 8 X - m > 2, 58 s< = 1 % ,
30
que l'on pourra aussi comparer celles que donnait l'approximation de Bienaym-Tchebichef pour une loi de probabilit quelconque.
1 L x. 2 H s EH X L = ! x - !!!!!! s 2 p -
Pour calculer cette intgrale, faisons le changement de variable, classique pour les calculs sur la loi normale :
x-m u = . s
Il vient :
1 2 u, EH X L = H m + s uL - !!!!!! ! 2 p - + +
u2 u2
m s 2 u + 2 u. EH X L = - u - !!!!!! ! !!!!!! ! 2 p - 2 p - +
u2
La seconde intgrale est nulle. Quant la premire, elle est gale posant :
2 u, I = - -
u2
d'o :
2 Hx I 2 = - - -
+ y2 L
x y,
De la mme faon :
31
2p
La nouvelle variable suit donc une loi normale qui est dite centre HEHU L = 0L et rduite Hs2 HU L = 1L, et qui ne fait intervenir aucun paramtre. Cette loi, appele loi normale rduite , est tabule. Les tables donnent gnralement, pour diffrentes valeurs de u, les probabilits :
1 2 t , Prob 8- < U < u< = PHuL = - !!!!!! ! 2 p - u
t2
1 - pHuL u = !!!!!! ! 2 u.
u2
2p
qui, compte tenu de la symtrie de la loi et de l'additivit des probabilits pour des intervalles disjoints, permettent de connaitre la probabilit attache n'importe quel intervalle.
(2.4)
On en dduit facilement la probabilit pour qu'une variable suivant une loi normale quelconque X H m, sL de moyenne m et d'cart-type s, soit comprise dans un intervalle donn @ x1 , x2 D :
x1 -m x2 -m Prob 8 x1 < X < x2 < = Prob 8 < U < <. s s
et que :
s2 Ha1 X1 + a2 X2 L = a1 2 s2 H X1 L + a2 2 s2 H X2 L.
Cette proprit s'tend videmment une fonction linaire d'un nombre quelconque de variables indpendantes suivant des lois normales.
32
On appelle loi log-normale une loi qu'une transformation du type logH X - x0 L ramne une loi normale. Cette loi est trs rpandue, notamment dans le domaine des sciences naturelles (gologie, biologie, ...) et des sciences humaines (psychologie, conomie, ...). Chaque fois que les causes perturbatrices l'origine des fluctuations observes rpondent aux conditions du thorme central limite mais sont multiplicatives , on enregistre des distributions modlisables par des lois log-normales.
33
Exercices du chapitre 2
Exercice 1 Le profil lamin partir d'un lingot est dcoup en billettes de 8 mtres de longueur. L'extrmit du profil correspondant au laminage de la tte du lingot prsente un dfaut sur une certaine longueur X qui suit une loi normale de moyenne gale 15 mtres et d'cart-type gal 5 mtres. a) Pour tenter d'liminer la longueur atteinte, on dclasse systmatiquement les trois billettes de tte. Quel est le risque pour que la quatrime billette prsente encore un dfaut ? b) Calculer le nombre de billettes dclasser pour que la premire billette retenue soit propre avec un risque infrieur 1 %. Exercice 2 On usine des axes sur un tour automatique. L'intervalle de tolrance sur le diamtre de ces axes est (355, 365) en centimes. Les diamtres des axes usins sur la machine sont distribus suivant une loi normale de moyenne correspondant au rglage de la machine et d'cart-type 2 centimes. Montrer que le meilleur rglage est 360. Quelle est alors la proportion de dchets ? Quelle est la proportion de dchets si la machine se drgle et que la moyenne devient gale 358 ? Exercice 3 La dure de vie d'un certain type de lampes incandescence suit une loi normale de moyenne gale 160 heures. Les spcifications impliquent que 80 % au moins de la production tombe entre 120 et 200 heures. Quel est le plus grand cart-type acceptable pour que la fabrication rponde aux spcifications ? Exercice 4 Il existe deux mthodes pour doser le phosphore dans l'acier d'une coule : - mthode C : dosage par voie chimique, - mthode S : dosage par mthode spectrographique. Pour toutes les coules effectues pendant une certaine priode, on a ralis les deux mesures et calcul la variance s2 H X L des mesures obtenues par la mthode C, la variance s2 HY L des mesures obtenues par la mthode S, et la variance s2 H X - Y L des diffrences entre les mesures relatives une mme coule. On a trouv : s2 H X L = 20, s2 HY L = 35 et s2 H X - Y L = 50. Quelle est la variance de la vraie teneur en phosphore pendant la priode considre ? Quelles sont les variances caractrisant les erreurs de mesure commises par les mthodes C et S ? Quelle est la covariance entre les deux mesures ?
34
On admettra que le rsultat d'une mesure est la somme de la vraie teneur en phosphore et d'une erreur indpendante de cette teneur (modle de l'erreur "absolue"). Exercice 5 A une heure dtermine, soit Z le nombre de voyageurs arrivant une station dans une voiture de mtro. On compte le nombre X de voyageurs qui montent et le nombre Y de voyageurs qui descendent. La voiture repart avec N personnes. On admettra que les variables X , Y , et Z sont indpendantes et qu'elles suivent des lois normales de moyennes E H X L = 40, E HY L = 30, EHZ L = 100 et d'cart-type : sH X L = 9, sHY L = 12 et sHZ L = 20. Calculer la capacit n de la voiture pour que Prob 8 N > n< = 5 %.
Exercice 6 Une tude a montr que, pour un haut-fourneau donn, lorsqu'on vise un poids de coule mQ , on obtient un poids de fonte distribu suivant une loi normale de moyenne justement gale au poids vis mQ et d'cart-type sQ tel que sQ = g mQ o g est le coefficient de variation du H.F. tudi. Les moyens de transport dont on dispose entre le H.F. et l'acirie consistent en n poches identiques. Lorsqu'on cherche remplir au maximum une poche, le poids de fonte contenue suit une loi normale de moyenne mP et d'cart-type sP . Calculer le poids de coule qu'il faut viser pour qu'au risque a prs, on ne doive pas reboucher le H.F. non vide. Application numrique : g = 0.01, n = 2, a = 10 %, mP = 30 T et sP = 2 T . Exercice 7 La production d'une taille (chantier de production du charbon), pendant le cycle d'abattage, est distribue suivant une loi normale de moyenne 500 T et d'cart-type 50 T . Elle est desservie par un train de n berlines. Lorsqu'on cherche remplir une berline, le poids charg est distribu suivant une loi normale de moyenne 10 T et d'cart-type 1 T . Calculer n pour que le risque de "manque vide" soit gal 2 % seulement. Exercice 8 Un problme grave est pos en Lorraine par les effondrements danciennes exploitations souterraines du minerai de fer, qui menacent des villages construits leur aplomb. Une des mthodes dexploitation les plus courantes consistait laisser en place, dans la couche exploite, des piliers destins soutenir les terrains sus-jacents. Dans lune de ces anciennes exploitations, les mesures ont montr que les contraintes dans les piliers suivaient une loi normale de moyenne gale 10 bars et dcart-type gal 3 bars, que la rsistance la compression du minerai suivait une loi normale de moyenne gale 50 bars et dcart-type gal 15 bars. On peut par ailleurs raisonnablement accepter l'indpendance entre contrainte et rsistance. Quel est la probabilit de ruine dun pilier ?
35
Exercice 9 Des pices de monnaie ont un poids distribu suivant une loi normale de moyenne 10 g et d'cart-type 0.15 g . Pour les compter, on les pse par lots d'environ un kilo. Quel est le risque de faire une erreur d'une unit ? Exercice 10 Dans une trfilerie, l'atelier pour l'maillage du fil de cuivre comporte 4 machines. Chaque machine est alimente partir d'un stock reconstitu chaque jour. Sachant que la production journalire d'une machine suit une loi normale de moyenne 10 tonnes et d'cart-type 2 tonnes, calculer le stock pour que le risque de pnurie soit gal 1 % seulement. Que devient le stock total qui serait ncessaire si l'on dcidait d'organiser l'atelier de telle sorte que les 4 machines puissent tre alimentes partir d'un stock commun ?