Sunteți pe pagina 1din 31

Statistique applique la gestion et au marketing

http://foucart.thierry.free.fr/StatPC

Chapitre 4

NOTIONS DE PROBABILITS
Les chapitres prcdents donnent des mthodes graphiques et numriques pour caractriser les principales proprits dun ensemble de donnes. Cet ensemble de donnes est constitu, dans certains cas, dobservations tires au hasard au sein dune population, par exemple dans un fichier informatique. Avant dtendre les proprits observes sur cet ensemble la totalit de cette population, il faut tenir compte du fait que ces proprits dpendent du tirage effectu : un autre tirage au hasard ne donnera peut-tre pas les mmes rsultats. Pour cela, il est ncessaire de connatre les notions lmentaires de la thorie des probabilits que nous prsentons dans ce chapitre.

1. PROBABILITS. PROBABILITS CONDITIONNELLES.


1.1 Population et vnements. Les dfinitions donnes ci-dessous tablissent en fait une quivalence entre le langage des probabilits et le langage de la thorie des ensembles. Nous utiliserons dans la suite ces deux langages suivant le contexte.

Chapitre 4

page 2

Notions de probabilits

Dfinitions : On appelle population statistique un ensemble constitu de N lments appels units statistiques (notes u.s.) ou individus. Le nombre N est appel nombre de cas possibles. On appelle vnement un sous-ensemble de la population . Le nombre NA du.s. appartenant un vnement A est appel nombre de cas favorables .

Cette population est celle dans laquelle on effectuera ultrieurement des tirages au hasard, et nous serons parfois amens la considrer comme infinie, de mme que le nombre du.s. appartenant un vnement. Elle est souvent appele urne en probabilits. Nous dirons que lvnement A sest ralis si lunit statistique tire au hasard appartient au sous-ensemble A.

Relations et oprations : On considre deux sous-ensembles A et B de . Il existe deux vnements trs particuliers : Lvnement certain caractris par la population . Lvnement impossible ou ensemble vide not par la lettre grecque (phi). On dit que B est inclus dans A si tous les lments de B appartiennent A (figure 1).

Chapitre 4

page 3

Notions de probabilits

Linclusion signifie en particulier que si B est inclus dans A, la ralisation de lvnement B, dfinie par le tirage dun lment de B, entrane la ralisation de lvnement A puisque llment tir, sil appartient B, appartient aussi A. Rciproquement, si la ralisation de B entrane toujours celle de A, tout lment de B appartient A et le sous-ensemble B est inclus dans le sous-ensemble A. Lensemble A inter B ou vnement A et B not AB, est constitu des lments qui appartiennent la fois A et B.

Lensemble A union B ou vnement A ou B not AB est constitu des lments de A, de B ou de A et B (figure 2). On dit que le ou est inclusif.

Chapitre 4

page 4

Notions de probabilits

On a donc la relation suivante :

[AB] [AB].

le sous-ensemble complmentaire dun sous-ensemble B (figure 4) est dfini par le sous-ensemble A tel que : AB = AB = .

On note alors : vide sont complmentaires.

A = Bc

Le complmentaire de A = Bc est videmment Ac = B. La population et lensemble

1.2 Dfinition et proprits des probabilits. On considre une population deffectif N et un vnement A deffectif NA. Dfinition : on appelle probabilit de lvnement A le rapport NA/N. La probabilit NA/N est gale ce que lon appelle couramment le rapport du nombre de cas favorables NA au nombre de cas possibles N . Cette notion de probabilit est appele quiprobabilit : la probabilit dun vnement constitu dune seule unit statistique est constante et gale 1/N.

Chapitre 4

page 5

Notions de probabilits

Dfinition : Tirages avec et sans remise : Lunit statistique tire peut tre remise dans la population et tre ventuellement retire : le tirage est dit indpendant puisquil nexerce aucune influence sur les tirages suivants. Inversement, si lu .s. nest pas remise, les nombres NA et N sont diminus de 1 : aprs le premier tirage, la probabilit de lvnement A devient (NA 1)/(N 1) et nest plus la mme : les tirages sont dpendants ou sans remise . Proprits des probabilits : La probabilit est un nombre compris entre 0 et 1 : 0 P(A) 1 Cette proprit est vidente, le nombre de cas favorables tant toujours positif ou nul et infrieur ou gal au nombre de cas possibles. La probabilit de la population est gale 1 et celle de lensemble vide 0 : P() = 1 P() = 0

Lorsque lvnement est la population , les cas favorables sont les cas possibles : il y a galit des effectifs, et lorsque cest lensemble vide , le nombre de cas favorables est nul. La probabilit de lvnement complmentaire est gale : P(Ac) = 1 P(A) Les lments de Ac sont ceux qui nappartiennent pas A. Il y en a donc N NA, do la relation. La probabilit de lunion de deux vnements est donne par : P(AB) = P(A) + P(B) P(AB) Les lments de A B sont les lments de A (il y en a NA), les lments de B (il y en a NB). En ajoutant NA et NB, on compte deux fois les lments qui appartiennent la fois A et B, cest--dire de AB : il est donc ncessaire de les soustraire une fois. Do la relation prcdente dite additivit forte . Si un sous-ensemble B est inclus dans un sous-ensemble A, la probabilit P(B) est infrieure ou gale la probabilit P(A)

Chapitre 4

page 6

Notions de probabilits

BA

P(B) P(A)

Cest une consquence directe de la dfinition de linclusion : tous les lments de B appartiennent A : le nombre dlments de B est infrieur ou gal au nombre dlments de A et par suite le rapport NB/N est infrieur au rapport NA/N.

Dfinition gnralise dune probabilit et dun espace probabilis : Il nest pas toujours possible de dfinir la population, les vnements et les probabilits comme prcdemment, en particulier dans le cas o la population est infinie, comme par exemple un ensemble de nombres. Pourtant, il est naturel de considrer que si lon tire au hasard un nombre entier, il y a une chance sur deux dobtenir un nombre pair, une chance sur trois un nombre divisible par trois On est donc amen gnraliser les dfinitions prcdentes de la faon suivante : un univers est un ensemble quelconque . les vnements sont des sous-ensembles de tels que lunion dvnements,

lintersection et la complmentation sont des vnements. la probabilit est une application qui tout vnement A associe un nombre P(A)

vrifiant les proprits prcdentes. La formalisation de la population considre est parfois complexe. Elle est rarement indispensable, et souvent il nest pas indispensable den donner la dfinition prcise. Dans toute la suite du chapitre, les proprits seront explicites dans le cas de la dfinition initiale de la probabilit (rapport du nombre de cas favorables au nombre de cas possibles). 1.3 Indpendance et probabilit conditionnelle. La formule de Bayes (18e sicle) permet de prendre en compte la ralisation dun vnement pour rvaluer la probabilit dun autre. Par exemple, la ralisation de lvnement A : la personne est de sexe fminin a un impact vident sur la probabilit de lvnement B : la personne chausse du 41, peu de femmes chaussant du 41. Considrons deux vnements A et B, deffectifs NA et NB. On note NAB leffectif du sous-ensemble AB. Dans lexemple prcdent, AB est lensemble de femmes chaussant du 41 et NAB leur nombre.

Chapitre 4

page 7

Notions de probabilits

Supposons que lvnement A soit ralis : on a donc tir un lment parmi les NA lments de A. Examinons ensuite la probabilit de B : elle est maintenant dfinie par le rapport NAB/NA : NAB ________ NA = NAB _______ N NA /
____

Dfinition : La probabilit conditionnelle dun vnement B pour un vnement A fix de probabilit non nulle est dfinie de la faon suivante : P(B/A) = P(BA)/P(A) La probabilit de B na pas chang si lon a : NAB _______ NA NAB ________ N de lun ne modifie pas la probabilit de lautre. Proprit caractristique : deux vnements A et B sont indpendants si et seulement si la probabilit de lvnement A B est gale au produit des probabilits : P(AB) = P(A) P(B) Exemple : on lance un d 6 faces. On tudie les vnements A : le chiffre obtenu est pair, B : le chiffre obtenu est infrieur ou gal 3, C : le chiffre obtenu est 1, 3, 4 ou 6. On a : P(A) = 1/2 P(B) = 1/2 P(C) = 2/3 A B: le chiffre obtenu est pair et compris entre 1 et 3, donc cest 2 : P(A B) = 1/6. P(A) P(B) = 1/4 : A et B ne sont pas indpendants. A C : le chiffre obtenu est 4 ou 6 : P(A C) = 2/6 P(A) P(C) = 2/6 : A et C sont indpendants. Calculons les probabilits conditionnelles : P(B/A) = P(A B)/P(A) = (1/6 ) / (1/2) = 1/3 P(B) = 1/2 NB =
____

N NA NB _____ x _____ N N

Cette relation peut scrire de la faon suivante : =

Dfinition : on dit que deux vnements A et B sont indpendants quand la ralisation

Chapitre 4

page 8

Notions de probabilits

P(C/A) = P(A C)/P(A) = (2/6 ) / (1/2) = 2/3= P(C) = 2/3 Formule de Bayes : soit A un vnement de . On considre un vnement B et son complmentaire Bc . On a : P(A/B) P(B) P(B/A) =
___________________________________

P(A/B) P(B) + P(A/Bc) P(Bc) La dmonstration de cette formule est donne dans les complments.

Exemple : il y a une femme sur deux adultes dans la population franaise, et, parmi les femmes, une sur dix chausse du 41, la proportion tant de un sur cinq chez les hommes. Calculons la probabilit quune personne chaussant du 41 soit une femme. On note A lvnement la personne chausse du 41 , B lvnement la personne est une femme et videmment Bc lvnement la personne est un homme . On a donc : P(B) = 1/2 P(A/B) = 1/10 On en dduit : P(B/A) = (1/10) x (1/2) _________________________________ (1/10) x (1/2) + (1/5) x (1/2) 1 =
____

P(Bc) = 1/2 P(A/Bc) = 1/5

2. VARIABLES ALATOIRES. LOIS DE PROBABILIT.

2.1 Variables alatoires Dfinition : on appelle variable alatoire (note v.a.) une application qui chaque u.s. tire au hasard dans associe un objet ou un nombre appartenant un ensemble V. X:
______

>

La v.a. X est appele discrte si lensemble V est inclus dans lensemble des

entiers N (ou si elle prend un nombre fini de valeurs x1, x2, , xn). La v.a. X est appele continue si lensemble V est gal lensemble des rels R

ou un intervalle de R. Nous apporterons des prcisions ultrieurement. La v.a. X est appele qualitative si lensemble V est un ensemble de modalits

(par ex. la liste des couleurs des cheveux, des catgories socioprofessionnelles, etc.)

Chapitre 4

page 9

Notions de probabilits

Exemple : on considre les variables alatoires dfinies sur lensemble de la clientle dEUROMARKET suivantes : lge X1, le nombre denfants X2, le revenu X3, la catgorie socioprofessionnelle X4, le montant de ses achats X5. le sexe X6. Lge, le revenu, le montant des achats dfinissent des variables alatoires quantitatives ; ce sont des variables alatoires relles , dont les valeurs appartiennent lensemble R des nombres rels. X1, X3, X5 :

______

>

V=R

Le sexe et la catgorie socioprofessionnelle dfinissent des variable alatoires qualitatives dont les modalits sont pour le sexe F pour Fminin et M pour Masculin et pour la catgorie socioprofessionnelle : Agri : agriculteur ; ouvrier agricole Ouv. : ouvrier Emp. : employ ; C.M. : cadre moyen ; C.Sup. : cadre suprieur; PIC : Commerants, artisans ; Inact. : inactifs, retraits, chmeurs, tudiants .

Le nombre denfants est une variable alatoire discrte puisquelle prend les valeurs 0, 1, 3, .... La notion de moyenne ayant un sens, cest une variable quantitative. 2.2 Probabilit dun intervalle. Soit X une v.a. et I un sous-ensemble de V. On appelle vnement X I lensemble A des u.s. u de la population telles que X(u) I. On note NA le nombre dunits statistiques de A. On a donc : P [XI] = NA/N Chaque variable alatoire X transporte donc la probabilit P dfinie sur la population statistique sur lensemble X( ), en gnral lensemble des nombres rels R (figure 5.4) . Cette probabilit transporte est note frquemment PX. Dfinition : on appelle loi de probabilit de la variable X la probabilit dfinie sur transporte par X sur R.

Chapitre 4

page 10

Notions de probabilits

Exemple : On considre lge (v.a. X1) : . Lvnement 33 X1 45 est dfini par lensemble A des clients gs de 33 45 ans. La probabilit P(33 X1 45) est gale par dfinition la probabilit P(A), cest--dire la proportion de clients gs de 33 45 ans dans la population totale. On considre le sexe (v.a. X6). Lvnement {X6 = F} est dfini par lensemble B des clients de sexe fminin. La probabilit P(X6= F) est gale par dfinition P(B), cest--dire la proportion de clientes dans la population totale. 2.3 Loi de probabilit dune v.a. discrte. Dfinition : la densit de la loi probabilit (ou densit de probabilit) dune v.a. discrte dont les valeurs possibles sont x1, x2, ..., xi, ..., xi, , xn est dfinie par la suite de toutes les probabilits pi = P(X = xi), i = 1, , n. Dans le cas o il existe une infinit de valeurs possibles de la v.a. X, on supposera que les sommes de 1 n donnes ci-dessous tendent vers une limite lorsque n tend vers linfini ; la notation consiste simplement remplacer n par + .

Exemple : on considre la variable dfinie par le nombre denfant. Sa loi de probabilit est la suite p0, p1, p2, ... dfinie par :

Chapitre 4

page 11

Notions de probabilits

p0 = nombre de clients sans enfant / nombre total de clients p1 = nombre de clients ayant 1 enfant / nombre total de clients p2 = nombre de clients ayant 2 enfants / nombre total de clients etc.

Proprits : la probabilit P[X{x1, x2, ..., xl}] est la somme des probabilits P[ X = x1], P[ X = x2], ..., P[ X = xl] : P[ X {x1, x2, ..., xl}]= P[ X = x1] + P[ X = x2] + ... + P[ X = xl] la somme de toutes les probabilits pi est gale 1 : n p1 + p2 + p3 + ... pi + + pn = pi = 1 i=1 Ces proprits dcoulent directement de la dfinition de la probabilit par le rapport du nombre de cas favorables au nombre de cas possibles. Dfinitions : lesprance E(X) (ou moyenne ) dune v.a. discrte prenant les valeurs x1, = E(X) = p1 x1 + p2 x2 + ... pi xi + pn xn Soit : n = E(X) = pi xi i=1 la variance V(X) (ou 2) dune v.a. discrte prenant les valeurs x1, x2, ..., xi, = p1 (x1 )2 + p2 (x2 )2 + ... + pi (xi )2 + ... + pn (xn )2 n = V(X) = pi (xi )2 i=1
2

x2, ..., xi, ..., xn est la somme ci-dessous :

..., xn est la somme ci-dessous : 2= V(X)

On montre que cette variance est gale 2 = p1 x12 + p2 x22 + ... + pi xi 2 + + pn xn2 2

Chapitre 4

page 12

Notions de probabilits

2 = V(X) =

n pi xi 2 2 i=1

cest--dire lesprance des carrs moins le carr de lesprance. Le terme est appel cart-type. La fonction de rpartition thorique est une fonction dfinie pour toute valeur relle x par la relation ci-dessous : F(x) = P(X x) Remarque : nous retrouvons les dfinitions dj vues de la moyenne, de la variance et de la fonction de rpartition dune srie dobservations, mais ici il sagit de valeurs thoriques, concernant une variable alatoire, et non une suite de valeurs observes. La statistique consiste justement trouver des valeurs approches de ces paramtres et de la fonction, les meilleures si possible, et en tudier les proprits. 2.4 Loi de probabilit dune v.a. continue. On considre une v.a. continue X. Nous allons dfinir la densit de la loi de probabilit de cette variable en plusieurs tapes. On dfinit tout dabord des intervalles disjoints recouvrant lensemble des valeurs possibles de la variable X : I1, I2, ..., Ii..., Ik. On en dduit les probabilits P1, P2,..., Pi, ...Pk : Pi = P(XIi) Densit par intervalle : On appelle densit par intervalle dfinie sur k intervalles Ii, i = 1, , k la suite (i) i = 1, , k dfinie par : i = Pi/li o li est lamplitude de lintervalle Ii. Relation fondamentale : Pi = i x li Remarque : en supposant que la population est deffectif fini N, les probabilits P1, P2,..., Pi, ...Pk sont dfinies de la faon suivante : Pi = P(XIi) = Ni / N et la densit par intervalle de lintervalle Ii de longueur li par :

Chapitre 4

page 13

Notions de probabilits

i = ( Ni / N) / li La notion de densit par intervalle dune variable alatoire est donc la mme que celle que nous avons dfinie dans le chapitre 1 pour construire des histogrammes. Mais la densit est ici calcule partir des probabilits et non des proportions.

Exemple : on considre la variable montant des achats que lon suppose toujours compris entre 0 et 1000F. On dfinit les intervalles : I1 = [0, 200[ I2 = [200, 500[ I3 = [500, 800[ I4 = [800, 1000] On suppose N = 15 000, N1 = 3000, N2 = 4700, N3 = 4400, N4 = 2900. On en dduit la densit par intervalle : d1 = 0.0010 d2 = 0.001044 d3 =0.000978 d4 = 0.000967 Dfinition : on appelle densit de probabilit dune variable continue la fonction f(x) limite de la densit par intervalle lorsque le nombre dobservations augmente indfiniment et que la longueur des intervalles tend vers 0.

Cette dfinition repose sur lhypothse de la convergence du rapport Pi/li dont le numrateur Pi =Ni / N et le dnominateur li tendent vers 0. Dans le cas dune population finie, la densit de lintervalle Ii de centre not x est : i = ( Ni/N ) / li Lorsque N tend vers linfini et que li tend vers 0, le numrateur Ni / N tend vers 0 et le dnominateur li aussi : la limite du rapport est indtermine. Lhypothse que lon effectue pour dfinir les v.a. continues consiste supposer que la limite du rapport existe, dpend du centre de lintervalle et est donc de la forme f(x). Lorsque cette limite nexiste pas, la variable nest pas continue : nous ntudierons pas ce genre de variable alatoire.

Exemple : nous considrons une population constitue de 15 000 valeurs que nous rpartissons en 20 classes de mme amplitude. La densit par intervalle suivant ces 20 classes

Chapitre 4

page 14

Notions de probabilits

est reprsente par lhistogramme (figure 6). La densit thorique (ici la densit de la loi normale dfinie plus loin) est la courbe superpose cet histogramme.

2.5 Proprits et calcul des probabilits. Laire comprise entre la courbe et laxe des abscisses de + est gale 1.

En effet, cette aire est la limite de la somme des aires des rectangles, qui est la somme des probabilits Pi, donc toujours gale 1. La probabilit de lvnement { X [ a, b] } (ou { X [ a, b [ } ) est gale

laire comprise entre la densit, laxe des abscisses et les droites x = a et x = b. Une approximation de cette aire est donne par laire du rectangle dfini par lintervalle [a, b] et la densit dans cet intervalle (figure 6). On dfinit lesprance et la variance en considrant la densit par intervalle. Pour

des intervalles Ii fixs, on peut calculer lesprance et la variance comme dans le cas des variables alatoires discrtes. En nous limitant la notion desprance (le raisonnement est identique dans le cas de la variance), on tudie la somme : p1 x1 + p2 x2 + ... pi xi + pn xn = n pi xi i=1

Lorsque la longueur des intervalles Ii tend vers 0 et que le nombre dobservations augmente indfiniment, le nombre n tend vers linfini et les probabilits pi deviennent gales

Chapitre 4

page 15

Notions de probabilits

aux produits f(xi) li par dfinition de la densit f(x). Lesprance est alors la limite de la somme ci-dessus. Ces proprits sexpriment de faon simple par le calcul intgral lmentaire. La probabilit de lvnement { X ] a, b] } est lintgrale de la densit dfinie

entre x = a et x = b.

P (X ]a ,b ])= f(x )dx (


a

Lintgrale entre et + est gale 1. Cette intgrale est gale F(b) F(a), o F(x) est une primitive de la densit

f(x) (ou la drive de F(x) est gale la densit f(x)). Lesprance et la variance sont dfinies de la faon suivante :

E ( X ) = = xf ( x ) dx
a

V ( X ) = = (x ) f (x)dx
a

La fonction F(x) dfinie par la relation ci-dessous : F(x) = P(X x)

est appele fonction de rpartition de la v.a. Sa drive est gale la densit f(x). On a : P(a < X b) = F(b) F(a) La dmarche pratique ne fait presque jamais appel au calcul intgral. Dans la quasi totalit des cas en effet, F(a) et F(b) sont donns dans une table numrique ou calculs par ordinateur (on en trouvera des exemples dans le paragraphe ci-dessous). Pour calculer les probabilits dvnements dans le cas dune v.a. continue, on utilise les proprits suivantes : P( X ] a, b ]) = P( X [ a, b [ ) = P( X ] a, b [ ) = P( X [ a, b ]) Soit c ] a, b[ : P( X [ a, b ]) = P( X [ a, c [ ) + P( X [ c, b [ ) P( X ] , a ]) = F(a) P( X ] a, + ]) = 1 F(a)

Pour calculer lesprance et la variance des v.a., on utilise les proprits suivantes : E(a X + b Y ) = a E(X) + b E(Y) V(a X+ b ) = a2 V(X)

3. LOIS DE PROBABILIT DISCRTES.

Chapitre 4

page 16

Notions de probabilits

Les lois de probabilits discrtes prsentes dans ce paragraphe sont les plus courantes. Nous les compltons en exercice par la loi gomtrique et donnons les dmonstrations des formules dans les complments. 3.1 Loi uniforme discrte. Dfinition : la variable X dont les valeurs possibles sont 1, 2, ..., n suit la loi uniforme discrte sur {1, 2, ..., n} si la probabilit pi = P(X=i) est gale 1/n quel que soit i. Proprit : lesprance et la variance 2 dune variable qui suit la loi uniforme discrte sur {1, , n} sont gales : n+1 n2 1 2 =E(X) = = V(X) = 2 12 3.2 Loi de Poisson Dfinition : la loi de Poisson de paramtre strictement positif est la loi dune v.a. X valeurs dans N et dfinie par sa densit : e i pi = P[X = i] = 1 x 2 x 3... x i Le dnominateur de lexpression ci-dessus est le produit des n premiers nombres entiers et est appel factorielle i. On le note i! : i! = 1 x 2 x 3... x i.

Proprit : lesprance et la variance dune variable qui suit la loi de Poisson de paramtre sont gales : = E(X) = 2 = V(X) =

Les valeurs de la densit sont donnes dans la table statistique de la loi de Poisson. Exemple : Densit de la loi de Poisson pour = 2. i P(X=i) P(Xi) i P(X=i) P(Xi)

Chapitre 4

page 17

Notions de probabilits

0 1 2 3 4 5 6

0.135335 0.270671 0.270671 0.180447 0.090224 0.036089 0.012030

0.135335 0.406006 0.676676 0.857123 0.947347 0.983436 0.995466

7 8 9 10 11 12 13

0.003437 0.000859 0.000191 0.000038 0.000007 0.000001 0.000000

0.998903 0.999763 0.999954 0.999992 0.999999 1.000000 1.000000

Thoriquement la v.a. peut prendre les valeurs de 0 + . Mais la probabilit pi est quasi nulle partir de i = 13. On pourra vrifier par le calcul que la moyenne et la variance sont gales 2. Cest le cas gnral de toutes les v.a. discrtes prenant une infinit de valeurs : la probabilit devient trs petite et quasi nulle partir dune certaine valeur. 3.3 Loi de Bernoulli et loi binomiale. On considre un vnement E tel que P(E) = p. On a videmment P(Ec) = 1p. On dfinit la v.a. X prenant la valeur 1 si lvnement E est ralis, 0 sinon. La v.a. X est appele indicatrice de E. Elle suit par dfinition la loi de Bernoulli de paramtre p.

Dfinition : on dit quune v.a. X suit la loi de Bernoulli de paramtre p si cest la variable indicatrice dun vnement E de probabilit p. Elle prend les valeurs 0 ou 1 avec les probabilits suivantes : P ( X= 0) = 1 p On a : = E(X) = p 2 = V(X) = p (1 p) P(X = 1) = p

Dfinition : on appelle variable binomiale de paramtres n et p la v.a. dfinie par le nombre de ralisations dun vnement de probabilit p au cours de n tirages indpendants.

Une variable binomiale peut tre considre comme la somme de n v.a. Xi indicatrices dvnements Ei indpendants et de probabilit p : X = X1 + X2 + + Xi + + Xn La densit de la v.a. est donne par la formule :

Chapitre 4

page 18

Notions de probabilits

pi = P(X = I ) =

1 x 2 x 3 x .. x n _________________________________________ (1 x 2 x 3 x .. x i) x (1 x 2 x 3 x ... x [n i])

(1 p)n i pi

On crit, en utilisant la notation factorielle dfinie dans le paragraphe sur la loi de Poisson (on pose par convention 0! = 1, et on rappelle que x0 = 1 quelle que soit la valeur x) : n! pi = P(X = i ) =
__________

(1 p)n i x pi

i! [n i]! On retrouve dans cette formule le nombre de combinaisons de i lments pris parmi n et not Cni (un rappel danalyse combinatoire est donn dans les complments). La densit de la loi binomiale B(n,p) est finalement la suivante : quel que soit i de 0 n pi = Cni (1 p)n i x pi

Lesprance et la variance sont donnes par les formules ci-dessous : = E(X) = n p 2 = V(X) = n p (1 p)

Remarque : Les valeurs de la densit sont donnes dans la table statistique de la loi binomiale. Pour p = 0.3 et n = 5, on a : i P(X=i) P(Xi) i P(X=i) P(Xi) 0 0.168070 0.168070 3 0.132300 0.969220 1 0.360150 0.528220 4 0.028350 0.997570 2 0.308700 0.836920 5 0.002430 1.000000 Pour les valeurs de n telles que n p >5 et n (1 p ) >5, on peut utiliser une approximation par la loi normale : la probabilit P(X = i) o X suit la loi binomiale B(n,p) a pour valeur approche la probabilit P( i 0.5 < Y < i + 0.5) o Y suit la loi normale de paramtre = n p et 2 = n p (1 p). On se reportera au paragraphe 4.3.

Chapitre 4

page 19

Notions de probabilits

4. LOIS DE PROBABILIT CONTINUES. Nous ne dfinissons ci-dessous que les lois continues les plus couramment utilises en statistique. Les dmonstrations des formules desprance et de variance sont donnes dans les complments. 4.1 Loi uniforme continue. Dfinition : la densit de la loi uniforme continue sur un intervalle ] a, b [ est dfinie par la fonction f(x) : Pour x ] a, b[ Pour x a ou x b f(x) = 1/(ba) f(x) = 0

Les bornes a et b peuvent tre incluses ou exclues de lintervalle : elles sont de probabilit nulle et cela ne change rien. Un exemple dune telle variable est donn par la touche rnd ou random qui figure sur un grand nombre de calculatrices : chaque pression de cette touche, on obtient un nombre compris entre 0 et 1, et la densit de cette variable alatoire est la loi uniforme sur lintervalle ] 0, 1 [.

Proprits : La moyenne et la variance 2 thoriques dune loi uniforme continue sur ] a, b [ sont gales : a+b (b a )2 =E(X) = 2 = V(X) = 2 12 La probabilit dun intervalle [ x1, x2 ], avec a x1 x2 b suivant la loi uniforme continue sur ] a, b [ est gale : P( X ] x1, x2 ]) = (x2 x1)/(b a)

Chapitre 4

page 20

Notions de probabilits

Exemple : on considre la loi uniforme continue sur ]0, 2[.

La densit est dfinie par la fonction f(x) : pour x ] 0, 2[ pour x 0 ou x 2 f(x) = 1/2 f(x) = 0

Sur la figure 7, la probabilit de lvnement X ] x1, x2 ] est laire du rectangle reprsent en gris. Elle est gale videmment P (X [ x1, x2 ]). 4.2 Loi exponentielle. La loi exponentielle est la loi de lintervalle alatoire sparant deux vnements successifs : en cela, elle est utilise conjointement avec la loi de Poisson pour lanalyse des files dattente. Son expression mathmatique utilise la fonction exponentielle dont une prsentation est donne dans les complments. Dfinition : on appelle loi exponentielle de paramtre a>0 et x0 R la loi de probabilit dont la densit est donne par la fonction suivante : pour tout x x0 f(x) = a e pour tout x < x0 f(x) = 0 a (x x0)

Chapitre 4

page 21

Notions de probabilits

Il nexiste pas de table statistique donnant les valeurs de la fonction de rpartition F(x) dans le cas de la loi exponentielle. Une simple calculatrice suffit puisque lon a : a (x x0) F(x) = 1 e Proprit : la moyenne et la variance 2 thoriques sont gales : = E(X) = x0 + 1/a 2 = V(X) = 1/a2

Nous donnons en figure 8 la reprsentation graphique de cette densit pour a = 2 et x0 = 0. La probabilit de lintervalle [ 1, 1.5] indiqu sur la figure est laire de la rgion comprise entre les deux segments. Elle est gale F(x2) F(x1), o F est la fonction de rpartition. On a donc : ( x1 x0) P(X ] x1, x2] ) = e e ( x2 x0)

4.3 Loi normale. La loi normale est une densit thorique donnant la rpartition dune infinit dobservations sous la forme dune courbe dite courbe en cloche (figure 9) laquelle nous

Chapitre 4

page 22

Notions de probabilits

avons dj fait rfrence dans les chapitres antrieurs. Elle est appele aussi loi de LaplaceGauss. Elle fait intervenir deux paramtres et ( = 3.1415videmment). Dfinition : on appelle loi normale de paramtres R et > 0 la loi de probabilit dont la densit est dfinie par la fonction suivante : 1 f(x) = Proprits : Les paramtres et 2 sont la moyenne et la variance de la loi normale. Si X suit la loi normale de moyenne et de variance 2, la loi de (X )/ est la loi normale de moyenne 0 et de variance 1. La v.a. (X )/ est centre et rduite.
_____________

[ (x )/ ]2 e

[ 2 ]1/2

Les zones grises sur la figure 9 correspondent aux valeurs 1.96 ; elles ont chacune pour aire 0.025, ou 2.5%. On retrouve la premire rgle de classification des valeurs observes propose dans le chapitre 2 :

Chapitre 4

page 23

Notions de probabilits

P[ 1.9600 < X < + 1.9600 ] P[ 1.6449 < X < + 1.6449 ] P[ + 1.0364 < X < + 1.0364 ] P[X < 1.9600 ] P[X > + 1.9600 ] P[X > + 1.6449 ] P[X < 1.6449 ] P[X > + 1.0364 ] P[X < 1.0364 ]

= 0.95 = 0.90 = 0.70 = 0.025 = 0.025 = 0.050 = 0.050 = 0.150 = 0.150

Limportance de la loi normale est considrable en statistique : on la rencontre trs frquemment dans les applications et elle possde des proprits fondamentales dont la plus importante est connue sous le nom de theorem central limit , ou, en franais, thorme de la limite centrale (on dit aussi centre), que nous nonons dans le chapitre suivant. 4.4 Loi du 2 et loi de Fisher. La loi du 2 (du Chi2) de Pearson est la loi dune v.a. note souvent X2 (il ne sagit pas du carr dune v.a. X) et dfinie par la somme de carrs de v.a. indpendantes suivant la loi normale centre rduite X1, X2, , X: X2 = X12 + X22 + + X2 Le nombre de ces v.a. normales et appel degr de libert. Lesprance de X2 est gale et sa variance 2 . On notera que la densit nest pas symtrique (figure 10).

Chapitre 4

page 24

Notions de probabilits

Les zones grises correspondent aux valeurs 31.55 et 70.22 ; elles ont pour aire 0.025 (ou 2.5%). La probabilit quune variable qui suit la loi du 2 de degr de libert = 49 soit comprise entre 31.55 et 70.22 est donc gale 0.95. La loi de Fisher (ou Fisher Snedecor) est la loi de probabilit du rapport F de deux variables X12 et X22 suivant chacune la loi du 2 de degr de libert 1 et 2, et divises par ces degrs de libert : X12 / 1 F = X22 / 2 On notera que si F suit la loi de Fisher de degrs de libert 1 et 2, 1/F suit la loi de Fisher de degrs de libert 2 et 1. Ces lois sont utilises pour effectuer des estimations par intervalle de confiance et des tests dindpendance (cf. paragraphe 5 .3 et chapitres suivants) 4.5 Loi de Student. La loi de Student est la loi dune v.a. note T dfinie par le rapport dune v.a. X suivant la loi normale centre rduite et de la racine carre dune v.a. X2suivant la loi du 2 et divise par son degr de libert : X T = [X2/]1/2 Elle dpend de ce degr de libert not . Elle est symtrique, de moyenne nulle, de variance /( 2). Sa densit (figure 11) est une fonction complique dont lexpression ne prsente pas dintrt ici. Lorsque le degr de libert augmente (>120), la loi de Student est confondue avec la loi normale centre rduite.

Chapitre 4

page 25

Notions de probabilits

5. COUPLES DE VARIABLES ALATOIRES. La notion de couple de variables alatoires est indispensable pour aborder la question de lindpendance entre deux variables qualitatives ou quantitatives. Nous nous limitons au cas de deux variables qualitatives que nous reprendrons dans le chapitre 7. 5.1 Couples de variables alatoires qualitatives. Nous tudions tout dabord les couples de v.a. qualitatives, la seule difficult venant des notations un peu compliques. Un couple de v.a. qualitatives est constitu de deux v.a. qualitatives observes sur une mme population . Nous noterons ici la taille de la population par la lettre minuscule n, pour conserver la notation utilise gnralement . On note : X la premire v.a., x1, x2, , xi, xp ses modalits. Y la seconde v.a., y1, y2, , yj, , yq ses modalits

Le nombre de cas favorables ni,j est le nombre dunits statistiques vrifiant les deux modalits la fois. La probabilit pi,j que X soit gal xi et Y yj., est donc gale au rapport ci-dessous : P(X = xi, Y = yj) = ni,j/n = pi,j

Chapitre 4

page 26

Notions de probabilits

Exemple numrique : nous tudions le tableau ci-dessous, de taille suffisamment faible pour que les calculs puissent tre effectus laide dune simple calculatrice. Il rassemble les rponses dune population de 200 tudiants aux questions X (sexe) et Y (couleur des cheveux). La question X comporte deux modalits (M et F, notes 1 et 2), la question Y trois modalits (blond, brun, autre, notes 1, 2, 3). Cheveux blonds (j = 1) 25 62 87 Cheveux bruns (j = 2) 51 31 82 Autre couleur (j = 3) 17 14 31 Effectifs marginaux 93 107 200

Masculin ( i = 1) Fminin ( i = 2) Effectifs marginaux

Tableau de contingence Sexe x Couleur de cheveux (200 tudiants) Formalisons lexemple numrique prcdent : ces effectifs ni,j sont rassembls dans le tableau de contingence ci-dessous. y1 n1,1 n2,1 ni,1 np,1 n.1 y2 n1,2 n2,2 ni,2 np,2 n.2 ... Question Y yj n1,j n2,j ni,j np,j n.j marge ... yq n1,q n2,q ni,q np,q n.q n1. n2. ni. np. n

x1 x2 Question X xi xp marge

Tableau 1.4 : Tableau de contingence (notations) Les termes n1., n2., ... , ni., ... donnent les effectifs des u.s. ayant rpondu la question X par les modalits x1, x2, ..., xi, ....( n1. = 93 tudiants de sexe masculin, n2. = 107 de sexe fminin). La notation i. indique que cest la ligne i qui est concerne. Les termes n.1, n.2, ... , n.j, ... donnent les effectifs des u.s. ayant rpondu la question Y par les modalits y1, y2, ..., yj, .....(n.1 = 87 ont les cheveux blonds, n.2 = 82 bruns, n.3 = 31 dune autre couleur). La notation .j indique que cest la colonne j qui est concerne.

Chapitre 4

page 27

Notions de probabilits

On distingue ainsi les termes de la ligne 1 nots 1. des termes de la colonne 1 nots .1 (idem pour 2., etc.). Ces effectifs ni. et n.j sont appels effectifs marginaux. Le nombre total de rponses tant not n, on a videmment : q p ni. = ni,j n.j = ni,j j=1 i=1 p q p q n = ni. = n.j = ni,j i=1 j=1 i=1 j=1 Du tableau de contingence on dduit un tableau contenant les proportions, en divisant simplement les effectifs par le nombre du.s.. Ce tableau de proportion est la loi de probabilit du couple de v.a. (X,Y) :

Dfinitions : (X, Y) tant un couple de v.a. qualitatives ou discrtes, on appelle loi de probabilit de ce couple lensemble des valeurs pi,j dfinies par les rapports ni,j/n : pi,j = P(X = xi, Y = yj) = ni,j/n on appelle lois de probabilit marginales les lois de probabilit de X et Y dfinies par les suites de valeurs pi. et p.j dfinies par les rapports ni./n et n.j/n : pi. = P(X = i) = ni./n p.j = P(Y = j)= n.j/n

Exemple numrique : on dduit du tableau de contingence Sexe x couleur des cheveux le tableau de proportion ci-dessous, appel aussi tableau de probabilit : Cheveux blonds (j = 1) 0.125 0.310 0.435 Cheveux bruns (j = 2) 0.255 0.155 0.410 Autre couleur (j = 3) 0.085 0.070 0.155 Marge en colonne 0.465 0.535 1

Masculin ( i = 1) Fminin ( i = 2) Marge en ligne

Tableau de probabilit et lois marginales

Chapitre 4

page 28

Notions de probabilits

Remarque : les notations et dfinitions prcdentes, donnes dans le cas dun couple de v.a. qualitatives, sont les mmes dans le cas dun couple de v.a. discrtes. Le tableau des effectifs est alors quivalent un tableau de corrlation. 5.2 Couples de variables alatoires quantitatives. Un couple de v.a. continues X et Y est une fonction qui, chaque u.s. de la population associe deux nombres rels x et y. Chaque variable X ou Y est appele variable marginale et sa loi de probabilit, note fX(x) ou fY(y), loi de probabilit marginale. Un exemple classique de couple de v.a. quantitatives est celui de la loi binormale. On se reportera au complment correspondant pour obtenir des prcisions. 5.3 Indpendance de deux variables alatoires. Dfinition : on dit que deux variables X et Y sont indpendantes lorsque les vnements X I et Y J sont indpendants quels que soient les sous-ensembles I et J.

Proprits : Dans le cas de deux variables qualitatives ou discrtes indpendantes, le produit

des densits marginales est gal la densit du couple et chaque terme pi,j est calcul par la formule ci-dessous : pi,j = pi. p.j Dans le cas dun couple gaussien, lindpendance est quivalente la nullit du

coefficient de corrlation. Nous admettrons bien entendu cette proprit. 5.4 Lois conditionnelles. La dernire classe de lois de probabilit que nous tudions est celle des lois conditionnelles. Nous nous limiterons aux v.a. discrtes ou qualitatives. Cette notion sera utilise pour contrler lindpendance de deux variables qualitatives et en analyse factorielle des correspondances sous le nom de profil (chapitre 9).

Dfinition : Soient X et Y deux variables discrtes ou qualitatives.

Chapitre 4

page 29

Notions de probabilits

on appelle loi de probabilit conditionnelle de Y sachant X = xi la loi dfinie par la suite des probabilits conditionnelles PJi = {p1i, p2i, p3i, p4i, pqi) o : pji = P(Y = yj / X = xi)

on appelle loi de probabilit conditionnelle de X sachant Y = j la loi dfinie par la suite des probabilits conditionnelles PIj = {p1j, p2j, p3j, p4j, , ppj) o : pij = P(X = xi / Y = yj)

Proprit : Lindpendance des variables X et Y est quivalente lgalit des lois conditionnelles en lignes (ou en colonnes).

La dmonstration est assez facile et est donne dans les complments pdagogiques.

Exemple : partir du tableau de contingence donnant la rpartition des tudiants suivant leur sexe et la couleur des cheveux, on peut calculer deux sortes de rpartitions appeles lois conditionnelles, exprimes souvent en pourcentages : (i) la rpartition des tudiants de sexe masculin suivant la couleur des cheveux, puis celles des tudiantes (lois conditionnelles en ligne) : Masculin Fminin Cheveux blonds 25/93 = 26.9% 62/107= 57.9% Cheveux bruns 51/93 = 54.8% 31/107= 29% Autre couleur 17/93 =18.3% 14/107= 13.1% Total 100% 100%

Lois de probabilit conditionnelle en lignes (ii) les rpartition des tudiants blonds suivant leur sexe, puis des tudiants bruns et enfin des tudiants d'une autre couleur de cheveux (lois conditionnelles en colonne) : Cheveux blonds Cheveux bruns Autre couleur Masculin ( i = 1) 25/87 = 28.7% 51/82 = 62.2% 17/31 = 54.8% Fminin ( i = 2) 62/87 = 71.3% 31/82 = 37.8% 14/31 = 45.2% Total 100% 100% 100% Lois de probabilit conditionnelle en colonnes PJ1 est la rpartition des tudiants de sexe masculin suivant la couleur des cheveux. PI2 est la rpartition des tudiants bruns suivant leur sexe.

Chapitre 4

page 30

Notions de probabilits

Lindpendance consiste dire que PJ1 = PJ2 (les garons et les filles sont rpartis de la mme faon suivant la couleur des cheveux) ou que PI1 = PI2= PI3 ( les blonds, les bruns et les tudiants dune autre couleur de cheveux sont rpartis de la mme faon suivant le sexe).

CONCLUSION
Nous nous sommes limits dans ce chapitre aux notions essentielles. La prsentation, lmentaire, respecte les notions abstraites que lon dfinit dans lapproche mathmatique moderne. On notera que certaines notions ncessitent imprativement la matrise des fonctions exponentielle et logarithme, ainsi que le calcul intgral lmentaire, qui ne sont plus enseigns dans certaines sections de classes terminales franaises pourtant vocation commerciale. Les tudiants issus de ces sections trouveront une introduction aux fonctions logarithme et exponentielle dans les complments.

Chapitre 4

page 31

Notions de probabilits

TABLE DES MATIRES 1. PROBABILITS. PROBABILITS CONDITIONNELLES.................................... 1 1.1 Population et vnements. .................................................................................... 1 1.2 Dfinition et proprits des probabilits............................................................... 4 1.3 Indpendance et probabilit conditionnelle.......................................................... 6 2. VARIABLES ALATOIRES. LOIS DE PROBABILIT........................................ 8 2.1 Variables alatoires .............................................................................................. 8 2.2 Probabilit dun intervalle. ................................................................................... 9 2.3 Loi de probabilit dune v.a. discrte. ................................................................ 10 2.4 Loi de probabilit dune v.a. continue................................................................ 12 2.5 Proprits et calcul des probabilits. .................................................................. 14 3. LOIS DE PROBABILIT DISCRTES.................................................................. 15 3.1 Loi uniforme discrte. ........................................................................................ 16 3.2 Loi de Poisson .................................................................................................... 16 3.3 Loi de Bernoulli et loi binomiale........................................................................ 17 4. LOIS DE PROBABILIT CONTINUES. ............................................................... 19 4.1 Loi uniforme continue. ....................................................................................... 19 4.2 Loi exponentielle. ............................................................................................... 20 4.3 Loi normale. ....................................................................................................... 21 4.4 Loi du 2 et loi de Fisher. ................................................................................... 23 4.5 Loi de Student..................................................................................................... 24 5. COUPLES DE VARIABLES ALATOIRES......................................................... 25 5.1 Couples de variables alatoires qualitatives. ...................................................... 25 5.2 Couples de variables alatoires quantitatives. .................................................... 28 5.3 Indpendance de deux variables alatoires......................................................... 28 5.4 Lois conditionnelles............................................................................................ 28 CONCLUSION ............................................................................................................ 30

S-ar putea să vă placă și