Documente Academic
Documente Profesional
Documente Cultură
Variables Alatoires
Aprs avoir ralis une exprience, on ne sintresse bien souvent une certaine fonction
du rsultat et non au rsultat en lui-mme. Lorsquon regarde une portion dADN, au lieu
de vouloir connaitre tout la suite de nuclotides, on peut vouloir juste connaitre le nombre
dapparition dun mot. Ces grandeurs (ou fonctions) auxquelles on sintresse sont en
fait des fonctions relles dfinies sur lensemble fondamental et sont appeles variables
alatoires.
On considre un ensemble muni dune probabilit IP.
Dfinition 0.1 Une variable alatoire X est une fonction de lensemble fondamental
valeurs dans R, X : R.
Lorsque la variable X ne prend que des valeurs discrtes, on parle de variable alatoire
discrte.
Un vecteur alatoire X : Rd est une fonction X = (X1 , . . . , Xd ) valeurs dans Rd
telle que les coordonnes Xi soient des variables alatoires.
Pour tout intervalle [a, b] R, lensemble {X [a, b]} = { : X() [a, b]} est un
vnement.
Exemple 0.2
1. On jette deux ds distincts et on sintresse la somme des points. On
note X cette variable alatoire, elle est dfinie par
X:
(1 , 2 ) $ 1 + 2 .
2. On lance toujours deux ds, mais cette fois on sintresse au plus grand chiffre Y
obtenu. On a alors
Y :
(1 , 2 ) $ max(1 , 2 ).
18
(1 , 2 ) $ inf{1 , 2 }.
La loi de probabilit dune variable alatoire permet de connaitre les chances dapparition
des diffrentes valeurs de cette variable.
On se place sur lespace de probabilit (, IP).
Dfinition 1.1 Soit X une variable alatoire. La loi de probabilit de X est dfinie par
la fonction FX , appele fonction de rpartition de la variable X, dfinie par
FX : R [0, 1]
x
$ IP(X x).
On dit que deux variables alatoires X et Y ont la mme loi si elles ont la mme fonction
de rpartition FX = FY .
Remarque 1.2 Soit I un intervalle de R. Lvnement {X x} reprsente lensemble des
valeurs telles que X() soit infrieur x, i.e.{X x} = { : X() x}.
La loi de X est en gnrale note L(X) ou Loi(X).
x+
Remarque 1.5 Soit a b, on a IP(X [a, b]) = IP(X b) IP(X < a).
1.1
La fonction de rpartition dune variable discrte est constante par morceaux. Si X est une
variable discrte valeurs dans {x1 , . . . , xn } avec x1 < . . . < xn alors pour x R
FX (x) =
k
!
i=1
IP(X = xi )
Les sauts de la fonction de rpartition FX ont lieu en les points xi et la hauteur du saut
au point xi est gale IP(X = xi ). Il suffit donc de calculer la fonction de rpartition aux
points xi .
19
Proposition 1.6 Si X est valeurs discrtes dans {x1 , . . . , xn } (ou {x1 , . . . , xn , . . .}), la
loi de X est entirement caractrise par {IP(X = xi ) : i 1}. (En effet, voir p. 8)
On remarque que
1. pour tout i 1, IP(X = xi ) [0, 1],
!
P
2.
IP(X = xi ) = 1. (En effet, 1=IP(X R) = i1 IP(X = xi ).)
i1
Exemple 1.7 Reprennons les deux premiers exemples prcdents, qui dcrivent effectivement des variables discrtes. Pour trouver la loi de ces variables on utilise la proposition 1.6.
1. X est valeurs dans {2, 3, . . . , 12}, donc IP(X = k) = 0 pour k
/ {2, 3, . . . , 12}.
k
2
3
4
5
6
7
8
9
10
11
12
IP(X = k) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
2. Y est valeurs dans {1, 2, . . . , 6}, donc IP(Y = k) = 0 pour k
/ {1, 2, . . . , 6}.
k
1
2
3
4
5
6
IP(Y = k) 1/36 3/36 5/36 7/36 9/36 11/36
FY (k)
1/36 4/36 9/36 16/36 25/36
1
La fonction de rpartition de Y est
Fonction de Repartition de Y
1.1
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
1
0.1
1.2
Une variable alatoire X de Bernoulli est une variable qui ne prend que deux valeurs : lchec
(au quel on associe la valeur 0) et le succs (auquel on associe la valeur 1) dune exprience.
Cette exprience est appele preuve de Bernoulli. Par exemple, on souhaite savoir si
une cellule est atteinte par un virus. On associe la valeur 1 si elle est atteinte (succs) et la
valeur 0 si elle est saine (chec).
La loi est donne par : P (X = 1) = p P (X = 0) = 1 p.
Loi Binomiale, B (n, p), avec p ]0, 1[, n N, n 1.
Exemple 1.8 On tudie les msanges bleues parmi la population de msange en Ille et
Vilaine. La msange nest pas un oiseau migrateur et vit en groupes forms de plusieurs
espces de msanges. On poste alors des observateurs diffrents endroits dans le dpartement. On note p la proportion de msanges bleues parmi la population de msange. Quelle
est la probabilit que le nombre de msanges bleues sur 1000 msanges tudies soit gal
k?
20
La loi Binomiale est utilise pour modliser un sondage avec remise. Cest la loi du nombre
de succs lorsquon renouvelle n fois de manire indpendante une preuve de Bernoulli de
paramtre p. On note X le nombre de succs obtenus lissue des n preuves. Sa loi sappelle
loi Binomiale de paramtres n et p. On a
P (X = k) =
"
n
k
On peut crire le nombre de succs X laide des rsultats de chaque preuve de Bernoulli.
On note Xi le rsultat de la ime exprience :
$
1 si la ime exprience est russie
Xi =
0 si la ime exprience est un chec
On a alors X = X1 + . . . + Xn . Toute variable de Bernoulli peut scrire de cette faon.
Loi Hypergomtrique H(N, m, n), avec N 1, (m, n) {1, .., N }2 .
Exemple 1.9 Un lac contient N poissons. On en pche m quon marque et quon remet
leau. On pche nouveau n poissons. Quelle est la probabilit de pcher k poissons
marqus ?
La loi hypergomtrique est utilise pour modliser un sondage sans remise. Cest le cas
de pratiquement tous les sondages (notamment lorsquon veut tudier la conformit dun
lot de mdicaments, tudier le nombre de cellules atteintes par un virus, etc. . .).
La loi est donne par : P (X = k) =
0
@
m
k
10
A@
0
@
N m
nk
N
n
1
A
1
A
21
1 xn+1
.
1x
avec i 1.
k
k! e
avec k N.
! xk
x2 x3
e =1+x+
+
+ ... =
2
3!
k!
x
k=0
1.3
Considrons la dure de vie dune bactrie. On conoit facilement que la probabilit que cette
dure de vie vaille exactement une certaine valeur est nulle. Par exemple, il est quasiment
impossible quune bactrie vive exactement 1 an 0 mois, 0 heure, 0 minute, . . .. La fonction de
rpartition dune telle variable est par consquent continue. On peut par contre sintresser
la probabilit que la bactrie vive moins dun an.
On ne verra dans ce cours que des variables qui sont soit discrtes soit continues mme sil
existe des variables plus complexes.
Dfinition 1.13 Une variable alatoire X est densit, ou continue, sil existe une
fonction f dfinie sur R telle que la fonction de rpartition de X scrit
% x
x R FX (x) =
f (t)dt
Une fonction qui vrifie les conditions 1. et 2. est appele densit de probabilit.
Proprits 1.14 Soit X une variable alatoire densit.
Alors pour tout x R, IP(X = x) = 0.
22
"
&b
Remarque 1.15
1. La probabilit IP(X [a, b]) = a f (t)dt correspond laire de la
surface comprise entre la courbe de f et laxe des abcisses sur lintervalle [a, b].
2. La fonction de rpartition dune variable densit est continue.
1.4
f (x) =
Fonction de rpartition :
F (x) = 0
xa
=
ba
= 1
si x < a
si x [a, b]
si x > b
23
Densit :
f (x) = ex
si x 0
= 0
si x < 0
1.5
0.5
x
Exponentielle(1)
Exponentielle(2)
si x < 0
x
= 1e
si x 0
La loi exponentielle est la seule loi continue qui vrifie la proprit dabsence de mmoire :
Si X E (), alors pour tout s, t > 0 IP(X > t + s|X > t) = IP(X > s).
La loi exponentielle est celle de la mortalit des tres qui ne seraient pas soumis au veillissement : chaque moment ils ont la mme probabilit de mourrir dans lunit de temps quil
leur reste, quelque soit leur ge.
'
(
Loi Normale (ou loi Gaussienne), N m, 2 , avec m R, > 0 rel.
La loi Normale est une loi centrale dans la thorie des probabilits. Elle est notamment
trs utilise en statistique. Une grandeur influence par un grand nombre de paramtres
indpendants est souvent modlise par une loi normale (par exemple, les erreurs de mesures
lors dune exprience).
Densit :
(x m)2
1
2 2
f (x) = e
avec x R.
2
0.4
0.3
0.2
0.1
x
Normale(0,1)
Normale(0,4)
24
'
(
Loi Log-Normale, LN m, 2 , avec m R, > 0 rel.
'
(
'
(
Une variable X suit une loi Log-Normale LN m, 2 si ln(X) suit une loi normale N m, 2 .
Cette loi permet de modliser par exemple le temps de survie des bactries en prsence de
dsinfectant, le dosage de certains mdicaments . . .
Densit :
(ln(x) m)2
1
2 2
e
f (x) =
avec x > 0.
x 2
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0
10
1.6
a=2 et b=0.5
a=2 et b=1
a=3 et b=1.5
a=4 et b=3
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
25
2.1
Lide intuitive de lesprance puise son origine dans les jeux de hasard. Considrons le jeu
suivant : on lance un d plusieurs fois de suite. Supposons que pour une mise de 1 euro, on
gagne 1 euro si le rsultat obtenu est pair, 2 euros si le rsultat est 1 ou 3, et on perd 3
euros si le rsultat est 5. Est-il intressant de jouer ce jeu ? Quel peut-tre le gain moyen ?
Soit X la variable alatoire correspondant au nombre deuros gagns ou perdus. La loi de
X est
k
3
1
2
IP(X = k) 1/6 1/2 1/3
Lesprance de gain, not E[X], est alors E[X] = 3 1/6 + 1 1/2 + 2 1/3 = 2/3. Le joueur
gagne donc en moyenne 2/3 deuros pour une mise de 1 euro. . .
Dfinition 2.1 Lesprance dune variable alatoire X est note E[X]. Elle reprsente la
valeur moyenne prise par la variable X.
1. Si X est une variable discrte valeurs dans D = {x1 , . . . , xn }, son esprance est
E[X] = x1 IP(X = x1 ) + . . . + xn IP(X = xn ) =
n
!
xi IP(X = xi ).
i=1
2. Si X est une variable discrte valeurs dans lensemble infini D = {xi : i 1}, lorsque
la somme est bien dfinie, son esprance est
E[X] =
+
!
xi IP(X = xi ).
i=1
3. Si X est une variable densit f , lorsque lintgrale est bien dfinie, son esprance est
E[X] =
xf (x)dx.
26
2.2
n
!
h(xi )IP(X = xi ).
i=1
2. si X est une variable discrte valeurs dans lensemble infini D = {xi : i 1}, lorsque
la somme est bien dfinie, on a
E [h(X)] =
+
!
h(xi )IP(X = xi ).
i=1
2.3
Proprits 2.7
"
Exemple 2.8 Supposons que la dure de vie T dune bactrie est modlise par la loi
exponentielle de densit f (t) = exp(t) pour t 0 pour une certaine valeur de . La
variance de la dure de vie de la bactrie tudie est V ar(T ) = 1/2 .
27
Cette fonction est surtout utile en volution des populations. En effet, si on considre une
population dont chaque gnration volue de faon indpendante de la prcdente mais selon
la mme loi, pour connatre sil y a un risque dextinction de la population, on utilise la
transforme de Laplace.
Dfinition 3.1 Soit X une variable alatoire valeurs dans R. Pour t R, sa transforme de Laplace est dfinie par
LX (t) = E[etX ]
pour t R.
Proposition 3.2 La transforme de Laplace LX dune variable X vrifie les proprits
suivantes
1. LX est valeurs dans [0, +], LX (0) = 1,
2. LX caractrise la loi de X (i.e., si deux variables ont la mme transforme de Laplace, alors
elles ont la mme loi),
3. si E[|X|k ] < alors LX est drivable k fois en 0 et la drive k ime en zro vaut
(k)
LX (0) = E[X k ].
28
4.1
P (X = k) = p (1 p)k1 avec k N .
4.2
k
k! e
avec k N.
Loi
Notation
Esprance
Variance
Transforme
de Laplace
Bernoulli
B(p)
p(1 p)
1 p + pet
Binomiale
B(n, p)
np
np(1 p)
(1 p + pet )n
Gomtrique
G(p)
1
p
1p
p2
Poisson
P()
pet
1 (1 p)et
t
e(e 1)
Notation
Densit
Esprance
Variance
Transforme
de Laplace
Uniforme
U([a, b])
Exponentielle
E(), > 0
1
pour x [a, b]
ba
a+b
2
1
(b a)2
12
1
2
etb eta
ba
si t <
t
Normale
N (m, 2 ), 2 > 0
ex pour x 0
1
e
2
(x m)2
2 2
etm+
Remarque 4.1 Dans Mthodes statistiques de P. Tassi (Ed. Economica), on retrouve les
principales lois de probabilit ainsi que leurs caractristiques (esprance, variance, etc. . . ).
2 t2
2
29
Exercice 2.7.
Dans les expriences suivantes, dfinir la variable alatoire considre et chercher la loi (ou
les lois) la mieux adapte au problme. Essayez dexpliquer do vient lala.
1. Sur une plaque de verre quadrille, on verse de faon homogne un liquide contenant
des cellules simples. On fait attention ce que le liquide ait une paisseur constante
sur la plaque. Sous le microscope nous comptons le nombre de carrs sans cellules,
avec une cellule, avec deux cellules, etc. . .
2. Une plaque dAgar est une bote de Ptri strile qui contient un milieu de culture
utilise pour la culture des micro-organismes. Elles sont traites avec un antibiotique.
Les bactries qui sont rparties sur les plaques ne peuvent se multiplier sauf les rares
rsistantes aux antibiotiques. Elles forment des colonies. On dcompte le nombre de
colonies.
3. Dans une substance radioactive, la dsintegration des noyaux se fait de faon spontane. On note la constante radioactive du noyau, i.e. la probabilit de dsintgration
par unit de temps : entre les instants t + h et t la probabilit de dsintgration du
noyau est h. On sintresse au nombre de dsintegration sur un intervalle de temps
fix et au temps dattente entre deux dsintgrations.
Exercice 2.8.
Une urne contient 3 sortes de boules de poids diffrents : 7 boules de poids 1kg, 5 boules de
poids 3kg et 3 boules de poids 5kg.
On tire au hasard une boule de lurne et on note X son poids.
1. Dterminer la loi de la variable X.
2. Calculer lesprance et la variance de X.
Exercice 2.9.
Considrons deux parents htrozygotes de gntopye Aa tels que leur enfants peuvent avoir
les gnotypes AA, Aa ou aa avec probabilit
IP(AA) = 1/4 IP(Aa) = 1/2 IP(aa) = 1/4.
Supposons quils aient 4 enfants.
1. Quelle est la probabilit quexactement lun deux aient le gnotype aa ?
2. Quelle est la probabilit quau moins lun deux ait le gnotype aa ?
Exercice 2.10.
La proportion des groupes sanguins en France est environ :
A = 44% B = 13% AB = 3% O = 40%
On considre la rpartition de ces diffrents groupes sur 50 tudiants.
1. Donner la loi de la variable X gale au nombre dtudiants de groupe O.
2. Donner la loi de la variable Y gale au nombre dtudiants de groupe AB.
3. Calculer IP(Y 5), lesprance et la variance de Y .
30
Exercice 2.11.
Considrons les enfants de parents htrozygotes de gntopye Aa. La distribution des enfants est
IP(AA) = 1/4 IP(Aa) = 1/2 IP(aa) = 1/4.
On choisit de faon alatoire 240 de ces enfants. On dfinit N1 , N2 , N3 le nombre denfants
de gnotype AA,Aa et aa respectivement.
1. Quelle est la loi de N1 ? N2 ? N3 ? Calculer lesprance et la variance pour chaque
gnotype.
2. Quel est le lien entre ces diffrentes variables ?
3. Vrifier que pour k1 , k2 , k3 N,
IP(N1 = k1 , N2 = k2 , N3 = k3 ) -= IP(N1 = k1 )IP(N2 = k2 )IP(N3 = k3 ).
Exercice 2.12. Loi de Hardy-Weinberg
En 1908, un mathmaticien anglais G.H. Hardy et un mdecin allemand W. Weinberg ont
formul une loi, connue sous le nom de loi de Hardy-Weinberg, qui concerne les frquence
allliques pour un gne pouvant sexprimer sous la forme de deux allles A et a dans une
population diplode idale. Une population diplode est dite idale si : la population est
de grande taille (idalement de taille infinie), panmictique (pas de choix du conjoint en
fonction de son gnotype), sans mutation, migration, ni slection et dont les gnrations ne
se chevauchent pas.
La loi de Hardy-Weinberg snonce de la faon suivante : dans une population idale, les frquences allliques dun gne sexprimant sous la forme de deux allles A et a sont constantes
au cours du temps.
La distribution gnotypique la gnration 0 est
P (AA) = r
P (Aa) = s P (aa) = t.
31
k
e avec k N
k!
32