Sunteți pe pagina 1din 28

CHAPITRE I

Probabilits lmentaires
Nous prsentons un formalisme qui permet de modliser une situation alatoire
dans laquelle les ventualits possibles sont en nombre fini et sont compltement
connues, mais par contre nous ne savons pas laquelle va se produire. Pour ce faire
nous utilisons des ensembles et des applications.
1. Formalisme
Nous considrons un ensemble dont les lments sont vus comme les direntes ventualits qui peuvent se produire. Par exemple, nous voulons tester un
algorithme sur un entier tir au hasard entre 1 et 1000 et lensemble est lintervalle dentiers [1, 1000] ou encore nous nous intressons la propagation dune
pidmie et lensemble est lensemble des individus concerns pas lpidmie.
Nous considrons des assertions comme lentier que nous tirons est pair ou
les individus contamins sont des brebis. Ces assertions sont baptises vnements et sont modlises par des sous-ensembles de . Par exemple il est naturel
de chercher une corrlation entre le fait de fumer et le cancer du poumon. Naturellement lensemble est, disons, lensemble des individus franais entre 15 et 80 ans
et nous considrons dune part lensemble F des fumeurs, dautre part lensemble C
des personnes atteintes dun cancer du poumon, ainsi que lintersection F C qui
sinterprtent comme la conjonction des deux proprits tre fumeur et tre atteint dun cancer du poumon. Cette transposition du vocabulaire ensembliste en
vocabulaire probabiliste est rsum dans le tableau 1.
Nous avons maintenant besoin dune application qui mesure la vraisemblance
des vnements. Pour cela nous considrons une probabilit sur lensemble des
vnements cest--dire une application P qui part de lensemble P() des parties
de et arrive dans lintervalle rel [0, 1]. Cette application doit satisfaire aux
conditions suivantes :
lvnement certain a pour probabilit 1;
lvnement impossible a pour probabilit 0;
langage ensembliste langage probabiliste
ensemble
univers des possibilits

est une ventualit


A
A est un vnement

vnement impossible

vnement certain
A (complmentaire) vnement contraire de A
AB
A et B
AB
A ou B
A et B disjoints
A et B incompatibles
partition de
systme complet dvnements
Table 1. La correspondance la base de la thorie des probabilits.

CHAPITRE I. PROBABILITS LMENTAIRES

pour A et B deux vnements disjoints, P(A B) = P(A) + P(B).


Nous avons ainsi un espace probabilis fini. Avec la premire et la dernire condition,
nous obtenons tout de suite P(A) + P(A) = 1 pour tout vnement A et aussi pour
deux vnements A et B la formule P(A B) = P(A) + P(B) P(A B), obtenue
en dcomposant la runion A B en les trois vnements disjoints A \ B, A B,
B \ A.
Dfinition #1 : Un espace probabilis fini est un couple (, P) dans lequel est
un ensemble fini et P est une application de lensemble des parties P() dans [0, 1]
qui satisfait aux trois conditions :
lvnement certain a pour probabilit 1;
lvnement impossible a pour probabilit 0;
pour A et B deux vnements disjoints, P(A B) = P(A) + P(B).
Un exemple courant de probabilit est lquiprobabilit : la probabilit de
lvnement A est (en notant #X le cardinal dun ensemble fini X)
P(A) =

#A
,
#

o selon la locution classique le nombre de cas favorables sur le nombre de cas


possibles. Ce choix semble tout fait acceptable pour un lancer de pice avec
une probabilit 1/2 pour pile et pour face; ou encore pour un lancer de d avec
probabilit 1/6 pour chacun des six entiers de 1 6.
Le lecteur peut noter que nous semblons associer, dans ces deux exemples,
les probabilits des ventualits et non des vnements. Cela tient ce quune
probabilit sur un ensemble fini est compltement dtermine par la connaissance
des probabilits des vnements disons lmentaires que sont les singletons {}
avec dans . Cela tient la troisime proprit de la dfinition dune probabilit
qui donne pour tout vnement A

P(A) = P
{} =
P({}).

Demande 1 Un domino est un rectangle compos de deux carrs sur lesquels


sont gravs de zro six points. Dans un jeu de dominos, tous les dominos sont
dirents.

a. Quel est le nombre de dominos dans un jeu de dominos?


b. On tire un domino au hasard dans un jeu de dominos. Quelle est la probabilit
que la somme des points sur le domino soit impaire?
Prenons un autre exemple un peu plus complexe. Nous considrons un ensemble fini I n lments. Nous pensons aux lments comme des individus,
Le got de la poire

Cours de mathmatiques spciales

1. FORMALISME

Figure 1. Un graphe de relations entre individus.


votre frre, votre boulanger, votre professeur de mathmatiques. Nous considrons
tous les graphes simples g que nous pouvons former sur cet ensemble. Un tel graphe
simple est un couple (S, A) o S est lensemble des sommets et A lensemble des
artes. Ici lensemble des sommets est lensemble I des individus. Quant lensemble des artes cest un sous-ensemble de lensemble des paires dlments de I.
Autrement dit pour chaque paire dindividus {s, t} ou bien cette paire est une arte
ou bien ne lest pas. Nous pensons un tel graphe comme exprimant une relation
entre les individus : les individus s et t sont relis par une arte sils se connaissent.
Par exemple avec le graphe de la figure 1, Bernard connat tout le monde et tout le
monde le connat; Catherine et Denise sont deux vieilles amies. Lensemble est
lensemble des graphes simples sur I.
Demande 2 Vrifiez que lensemble des graphes simples sur un ensemble S
est en bijection avec lensemble des applications de P2 (S) dans {0, 1}. Quel est le
nombre de graphes simples sur un ensemble n lments?
Nous munissons de lquiprobabilit, ce qui fait que nous avons un espace
probabilis fini. Sur cet espace, nous pouvons considrer lassertion les deux individus s et t se connaissent et valuer la probabilit de cet vnement. Cependant
nous voyons tout de suite que si nous avons un graphe dans lequel {s, t} est une
arte nous pouvons lui associer le graphe qui sen dduit pas la simple suppression
de cette arte et bien sr nous pouvons aussi employer lopration inverse. Il y a
donc autant de graphes avec larte {s, t} que sans larte {s, t}. La probabilit que
larte {s, t} soit prsente est donc 1/2, en formule
P( les deux individus s et t se connaissent ) =

1
.
2

ce point une question nous saute la figure : est-ce bien raisonnable? Les probabilits que dune part votre boulanger et votre professeur de mathmatiques,
dautre part vous-mme et votre frre se connaissent sont-elles gales? Et en plus
quasiment dtermines par une partie de pile ou face. Il est clair que le modle est
excessivement simplet.
Ce modle amne deux commentaires. Dabord ce serait une erreur de le considrer comme inintressant parce quil reprsente mal les relations entre personnes.
Si nous considrons que les individus sont des serveurs informatiques, il fournit un
modle simple du rseau mondial qui nest pas totalement stupide. Bien sr cela
Filire PSI

Ph. Dumas, 2015

CHAPITRE I. PROBABILITS LMENTAIRES

Hommes
Femmes
Ensemble
Population totale 31 888 651 33 932 265 65 820 916
Moins de 20 ans
8 283 597
7 907 016 16 190 613
de 20 64 ans
18 592 668 19 189 292 37 781 960
65 ans et plus
5 012 386
6 835 957 11 848 343
Table 2. Population totale par sexe et ge au 1er janvier 2014,
France hors Mayotte. Source : Insee, estimations de population
(rsultats provisoires arrts fin 2013).

ncessite de le reprendre pour que la probabilit p que deux serveurs soient connects aient une valeur plus raliste que 1/2. Mais cela sort du champ dapplication
de ce chapitre.
Ensuite et cest le point le plus important, les espaces probabiliss sont des
modles et cest le rle des statistiques que de trouver des reprsentations cohrentes avec lexprience. En particulier il est naturel destimer les probabilits par
des frquences. Dans la crise du virus ebola en Afrique de louest du printemps-t
2014, il y eu, au 31 juillet, 909 cas confirms dinfection par le virus qui ont amen
485 dcs. Les journalistes disent quil y a plus dune chance sur deux de mourir si
on est atteint par le virus. Dans les exemples qui suivent nous allons frquemment
employer les frquences comme estimation des probabilits, cependant lobtention
dun modle satisfaisant demande plus de rflexion quune simple rgle de trois.
Nous restons ici volontairement lmentaires, mais il est clair que statistiques et
probabilits sont lies. Plus prcisment les deux disciplines sont surs : les statistiques permettent de mettre au point les modles probabilistes; les probabilits
permettent de justifier la pertinence des mthodes statistiques.
2. Probabilit conditionnelle
Linformation dont nous disposons conditionne notre perception des possibilits. Au mois de fvrier Paris, vous ne vous habillez pas dun tee-shirt parce que
vous savez que la probabilit quil fasse plus de 15 C est bien faible. A contrario
en vacances Marseille au mois daot, vous ne portez pas un pull marin. Une
information rduit le champ des possibilits. Au lieu dutiliser lensemble complet
des ventualits , nous employons seulement un sous-ensemble.
Probabilit conditionnelle. Cette remarque nous amne la notion de probabilit
conditionnelle. Nous fixons une partie B de dont la probabilit nest pas nulle et
nous dfinissons une nouvelle probabilit PB = P( | B) par
A ,

P(A | B) =

P(A B)
.
P(B)

Il nest pas dicile de vrifier quil sagit bien dune probabilit, pour laquelle tous
les vnements incompatibles avec B ont une probabilit nulle.
Dfinition #2 : La probabilit conditionnelle associe un vnement B de probabilit non nulle est la probabilit dfinie par la formule
A ,

P(A | B) =

P(A B)
.
P(B)

Considrons par exemple lensemble des franais au 1er janvier 2014. Nous
munissons cet ensemble de lquiprobabilit et nous considrons les vnements
J : avoir moins de 20 ans ;
A : avoir entre 20 et 64 ans ;
Le got de la poire

Cours de mathmatiques spciales

2. PROBABILIT CONDITIONNELLE

S : avoir 65 ans ou plus ;


H : tre un homme ;
F : tre une femme .
Daprs le tableau 2, la probabilit quun franais ait moins de 20 ans est
16 190 613
P(A) =
24.6%.
65 820 916
Si nous savons que la personne tire au hasard est une femme la probabilit est la
probabilit conditionnelle
7 907 016
P(A | F ) =
23.3%.
33 932 265
Demande 3 Une table de mortalit, comme celle de la figure 2, est base sur
une gnration fictive de 100 000 individus et donne pour chaque ge x le nombre
de survivants not ici Lx , ainsi que le quotient de mortalit annuelle qx . Ici la
table distingue deux populations, dune part (table TF) les franaises, dautre part
(table TH) les franais. Les donnes ont t releves entre 2000 et 2002. Ltalement
dans le temps a pour but de gommer les irrgularits conjoncturelles. Ces tables
sont utilises par les actuaires et sont les tables rglementaires pour les contrats
dassurance-vie.
Le quotient de mortalit annuelle qx est simplement
qx =

Lx Lx+1
Lx+1
=1
,
Lx
Lx

autrement dit la probabilit (en fait cest une frquence) de dcs dans lanne. Par
exemple, en regardant pour lge de 50 ans et pour les femmes nous voyons que la
cohorte (cest le langage du statisticien et de lactuaire) comprend L50 = 96 546
femmes, alors que pour 51 ans, la cohorte ne comprend plus que L51 = 96 304
femmes. Autrement dit 96 546 96 304 = 242 femmes sont dcdes lge de 50
ans. Le quotient de mortalit q50 vaut donc
242
q50 =
0.002506577176,
96 546
ce qui figure dans la colonne adjacente.
a. Quelle est la probabilit pour un homme de 50 ans de vivre au moins jusqu 70
ans?
b. Quel est lge maximal quune femme de 30 ans peut esprer atteindre avec
une probabilit suprieure 90%? Que devient cette valeur si lon demande une
probabilit suprieure 95%? Et avec 100%?
La formule de dfinition des probabilits conditionnelles peut se lire
A ,

P(A B) = P(A | B) P(B).

Elle sinterprte facilement en terme de choix successifs. Cest la version probabiliste du principe des bergers de la combinatoire, souvent matrialis laide dune
arborescence. Par exemple si lon tire deux cartes dans un jeu usuel de cinquantedeux cartes, la probabilit dobtenir deux as est
P( obtenir deux as ) =
P( la seconde carte est un as | la premire carte est un as )
P( la premire carte est un as )

=
Filire PSI

3
4
.
51 52

Ph. Dumas, 2015

10

CHAPITRE I. PROBABILITS LMENTAIRES

Age
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55

TF 00-02 dcs TH 00-02 dcs


Lx
qx
Lx
qx
100 000 0,00384 100 000 0,00489
99 616 0,00033 99 511 0,00038
99 583 0,00021 99 473 0,00027
99 562 0,00017 99 446 0,00022
99 545 0,00014 99 424 0,00018
99 531 0,00012 99 406 0,00016
99 519 0,00011 99 390 0,00014
99 508 0,00010 99 376 0,00013
99 498 0,00010 99 363 0,00013
99 488 0,00010 99 350 0,00012
99 478 0,00011 99 338 0,00013
99 467 0,00011 99 325 0,00013
99 456 0,00012 99 312 0,00016
99 444 0,00013 99 296 0,00020
99 431 0,00016 99 276 0,00026
99 415 0,00020 99 250 0,00037
99 395 0,00024 99 213 0,00050
99 371 0,00029 99 163 0,00067
99 342 0,00033 99 097 0,00083
99 309 0,00035 99 015 0,00095
99 274 0,00035 98 921 0,00102
99 239 0,00034 98 820 0,00105
99 205 0,00034 98 716 0,00105
99 171 0,00034 98 612 0,00104
99 137 0,00034 98 509 0,00105
99 103 0,00035 98 406 0,00105
99 068 0,00035 98 303 0,00107
99 033 0,00036 98 198 0,00109
98 997 0,00037 98 091 0,00111
98 960 0,00039 97 982 0,00114
98 921 0,00042 97 870 0,00116
98 879 0,00047 97 756 0,00120
98 833 0,00052 97 639 0,00125
98 782 0,00058 97 517 0,00132
98 725 0,00064 97 388 0,00143
98 662 0,00070 97 249 0,00153
98 593 0,00076 97 100 0,00166
98 518 0,00084 96 939 0,00179
98 435 0,00093 96 765 0,00195
98 343 0,00103 96 576 0,00214
98 242 0,00114 96 369 0,00237
98 130 0,00125 96 141 0,00264
98 007 0,00138 95 887 0,00293
97 872 0,00151 95 606 0,00325
97 724 0,00165 95 295 0,00360
97 563 0,00180 94 952 0,00397
97 387 0,00195 94 575 0,00435
97 197 0,00210 94 164 0,00472
96 993 0,00224 93 720 0,00508
96 776 0,00238 93 244 0,00545
96 546 0,00251 92 736 0,00582
96 304 0,00265 92 196 0,00624
96 049 0,00282 91 621 0,00668
95 778 0,00302 91 009 0,00715
95 489 0,00324 90 358 0,00767
95 180 0,00346 89 665 0,00821

56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112

94 851
94 501
94 131
93 741
93 329
92 892
92 425
91 923
91 382
90 797
90 164
89 476
88 726
87 907
87 010
86 024
84 941
83 751
82 442
80 998
79 402
77 633
75 671
73 496
71 088
68 423
65 478
62 233
58 680
54 828
50 706
46 362
41 868
37 319
32 821
28 469
24 328
20 444
16 860
13 618
10 750
8 277
6 204
4 516
3 185
2 171
1 426
900
544
314
172
89
44
20
9
4
1

0,00369
0,00392
0,00414
0,00440
0,00468
0,00503
0,00543
0,00589
0,00640
0,00697
0,00763
0,00838
0,00923
0,01020
0,01133
0,01259
0,01401
0,01563
0,01752
0,01970
0,02228
0,02527
0,02874
0,03276
0,03749
0,04304
0,04956
0,05709
0,06564
0,07518
0,08567
0,09693
0,10865
0,12053
0,13260
0,14546
0,15965
0,17531
0,19229
0,21060
0,23005
0,25045
0,27208
0,29473
0,31837
0,34316
0,36886
0,39556
0,42279
0,45223
0,48256
0,50562
0,54545
0,55000
0,55556
0,75000
1,00000

88 929
88 151
87 329
86 460
85 538
84 558
83 514
82 399
81 206
79 926
78 552
77 078
75 501
73 816
72 019
70 105
68 070
65 914
63 637
61 239
58 718
56 072
53 303
50 411
47 390
44 234
40 946
37 546
34 072
30 575
27 104
23 707
20 435
17 338
14 464
11 852
9 526
7 498
5 769
4 331
3 166
2 249
1 549
1 032
663
410
244
139
75
39
19
9
4
2
1

0,00875
0,00932
0,00995
0,01066
0,01146
0,01235
0,01335
0,01448
0,01576
0,01719
0,01876
0,02046
0,02232
0,02434
0,02658
0,02903
0,03167
0,03455
0,03768
0,04117
0,04506
0,04938
0,05426
0,05993
0,06660
0,07433
0,08304
0,09253
0,10264
0,11352
0,12533
0,13802
0,15155
0,16576
0,18059
0,19625
0,21289
0,23059
0,24926
0,26899
0,28964
0,31125
0,33376
0,35756
0,38160
0,40488
0,43033
0,46043
0,48000
0,51282
0,52632
0,55556
0,50000
0,50000
1,00000

Figure 2. Les tables de mortalit TF 00-02 et TH 00-02 dduites


des donnes de lInsee.
Bien sr le rsultat nest pas dirent de ce que nous aurions obtenu en considrant
le nombre de cas favorables sur le nombre de cas possibles

4
2
P( obtenir deux as ) = .
52
2
Formule de Bayes. La symtrie de lexpression P(A B) qui est P(A | B) P(B)
mais aussi P(B | A) P(A), donne la formule de Thomas Bayes
P(A | B) =
Le got de la poire

P(B | A) P(A)
,
P(B)
Cours de mathmatiques spciales

2. PROBABILIT CONDITIONNELLE

11

Streptatest positif Streptatest ngatif total


culture positive
120
4
124
culture ngative
20
355
375
total
140
359
499
Table 3. Un test de dpistage de langine streptocoque A.

ce qui permet un change entre cause et consquence. Dailleurs cette formule est
aussi appele formule de probabilit des causes.
Formule de Bayes #3 : Pour deux vnements A et B de probabilits non nulles,
les probabilits conditionnelles sont lies par
P(A | B) =

P(B | A) P(A)
,
P(B)

Expliquons ceci sur une situation classique de test et de diagnostic. La socit Dectra Pharm propose un test de dtection rapide des angines streptocoque du groupe A, baptis Streptatest. Le but de ce type de produit est dviter lemploi dun antibiotique dans le cas o le patient prsente des signes dangine streptococcique mais nest en fait pas atteint par cette maladie (il pourrait
tre atteint dune angine virale). La socit Dectra Pharm a eectu des tests
(http://www.testangine.com/etudes_cliniques.html) qui se rsume en le tableau 3. La mise en culture permet de savoir si le patient a rellement une angine
streptococcique. Dfinissons les vnements
A : le patient a une angine streptococcique;
T : le test est positif.
Lespace de rfrence est lchantillon des 499 personnes qui ont particip au
test. Si, une fois de plus, nous confondons frquence et probabilit, nous obtenons
la probabilit conditionnelle
120
P(T | A) =
96.8%
124
que le test soit positif sachant que le patient est malade. Nous pouvons aussi calculer
la probabilt davoir un faux positif , cest--dire un test positif alors que le
patient na pas dangine streptococcique,
20
P(T | A) =
5.3%.
375
Considrons maintenant la population globale et les vnements A et T
qui snoncent comme A et T . Nous crivons
P(A | T ) =

P(T | A ) P(A )
.
P(T )

Nous faisons maintenant lhypothse que lchantillon est reprsentatif de la population, ce que nous traduisons en les galits
P(T | A ) = P(T | A),

Cela nous donne

P(A | T ) =

P(T | A ) = P(T | A).


P(T | A) P(A )
.
P(T )

Notons pour abrger p = P(A ). Nous utilisons le fait que {A , A } est un systme
complet dvnements pour crire

P(T ) = P(T A ) + P(T A ) = P(T | A )P (A ) + P(T | A ) P(A ).


Filire PSI

Ph. Dumas, 2015

12

CHAPITRE I. PROBABILITS LMENTAIRES

Lhypothse et la notation amnent la formule


P(T ) = P(T | A)p + P(T | A)(1 p ).

Nous arrivons la formule

P(A | T ) =
ce qui donne numriquement
P(A | T ) =

P(T | A)p
P(T | A)p + P(T | A)(1 p )

0.968p

0.968p
0.968p
=
.

+ 0.053(1 p )
0.915p + 0.053

ce stade nous avons besoin pour terminer le calcul de la valeur de p . Cest le rle
de lpidmiologie que de la dterminer. Dans le cas des angines streptocoques,
elle dpend de lge ce qui fait considrer trois tranches dges, 315 ans, 1525 ans
et au dessus de 25 ans et les valeurs p315 = 25%, p1525 = 8%, p>25 = 10%. Nous
avons ainsi
P315 (A | T ) = 86%,

P1525 (A | T ) = 61%,

P>25 (A | T ) = 67%.

Pour un jeune de 1525 ans, la probabilit dtre atteint dune angine streptocoques sachant que le test est positif est de 61%. Pour un enfant, le test est meilleur
puisque la probabilit est de 86%.
Au cours du calcul nous avons utilis un cas particulier de la rgle de Bayes
(1)

P(B | Aj ) P(Aj )
P(Aj | B) =
P(B | Ak ) P(Ak )
kK

valable pour vnement B et un systme complet dvnements (Ak )kK . Comme


lcrit William Feller, An Introduction to Probability Theory and Its Applications, 3e d, John Wiley, 1968, section V.2, page 124 : we have calculated certain
conditional probabilities directly from the definition. The beginner is advised always
to do so and not to memorize the formula (1). [Nous avons calcul certaines probabilits conditionnelles directement partir de la dfinition. Nous conseillons au
dbutant de procder toujours ainsi et de ne pas mmoriser la formule (1).]
Indpendance. Un vnement A est indpendant dun vnement B sil vrifie
la condition
P(A | B) = P(A).
En crivant la dfinition de la probabilit conditionnelle, nous voyons que la relation
entre A et B est symtrique et scrit
P(A B) = P(A) P(B),

ce qui ne suppose plus P(B) > 0.


Dfinition #4 : Deux vnements A et B sont indpendants sils vrifient
P(A B) = P(A) P(B),

La notion dindpendance nous vient naturellement par exemple lors de parties


successives de pile ou face, ou plus gnralement lorsque nous employons comme
espace un produit cartsien 1 2 n muni de la probabilit produit, qui
est dfini partir de la probabilit des pavs P(A1 A2 An ) = P1 (A1 )
P2 (A2 ) Pn (An ). Limitons nous n = 2 pour simplifier lcriture. Avec
B1 = A1 2 et B2 = 1 A2 , nous avons tout de suite P(B1 B2 ) = P1 (A1 )
P2 (A2 ) = P(B1 ) P(B2 ). Par exemple en tirant une carte dun jeu de cinquantedeux cartes, sous lhypothse dquiprobabilit, la probabilit davoir un roi de
cur, 1/52, est bien le produit davoir un roi, 1/13, par la probabilit davoir
Le got de la poire

Cours de mathmatiques spciales

3. VARIABLE ALATOIRE

13

Aucun
enfant de
moins de 25
ans

1 enfant de
moins de 25
ans

2 enfants de
moins de 25
ans

3 enfants de
moins de 25
ans

4 enfants ou
plus de
moins de 25
ans

Couple sans enfant

7 507 472

7 507 472

Couple avec enfant(s)

530 756

2 820 509

2 943 143

1 082 608

338 772

7 715 788

Famille
monoparentale
compose dun
homme
avec
enfant(s)

75 174

212 077

97 285

25 127

7 017

416 680

Famille
monoparentale
compose dune
femme
avec
enfant(s)

392 598

960 196

549 604

177 259

70 003

2 149 660

Ensemble

Ensemble

8 506 001 3 992 782 3 590 032 1 284 994


415 792 17 789 600
Table 4. Familles par type de famille et nombre denfants de
moins de 25 ans. Source : Insee, recensement de la population 2010.

du cur, 1/4. Lindpendance sera gnralement pour nous une hypothse qui
permettra de mener les calculs bien.
Demande 4 La table 4 donne la composition des familles franaises selon le
type de famille et le nombre denfants.
Quelle est la probabilit quune famille nait pas de fille de moins de 25 ans, en
considrant que toutes les familles ont la mme probabilit dtre tire au hasard?
Il faut noter quune hypothse simplificatrice est ncessaire, faute dinformation.
vnements mutuellement indpendants. Aprs la dfinition de lindpendance
de deux vnements, il est naturel de gnraliser lide en considrant lindpendance mutuelle dvnements.
Dfinition #5 : Les vnements A1 , A2 , . . . , An sont mutuellement indpendants
si est satisfaite la condition

P(
Ah ) =
P(Ah )
hH

hH

pour toute partie H de P([1, n]) ayant au moins deux lments.


Il faut signaler une dicult technique : lindpendance deux deux nimplique
pas lindpendance mutuelle.

Demande 5 Donnez un exemple de famille dvnements indpendants deux


deux mais qui ne sont pas mutuellement indpendants.
3. Variable alatoire
Considrons lensemble des franais entre 3 et 100 ans. chaque individu est
associe sa taille. Nous avons ainsi une application T de dans R. Si nous tirons au
hasard, avec quiprobabilit, un individu dans la population nous obtenons une
valeur alatoire T (). Lapplication T est ce que lon appelle une variable alatoire.
Filire PSI

Ph. Dumas, 2015

14

CHAPITRE I. PROBABILITS LMENTAIRES

Dans cet exemple la variable alatoire est numrique, mais une variable alatoire
nest pas ncessairement numrique. Par exemple chaque individu, nous pouvons
associer son sexe ou la couleur de ses yeux.
Dfinition #6 : Une variable alatoire sur un espace probabilis fini (, P) est
une application dfinie sur lensemble .
Loi. La variable alatoire X qui est dfinie sur lespace probabilis (, P) et
prend ses valeurs dans lensemble V fournit une probabilit PX sur V par la formule
W V,

PX (W ) = P(X 1 (W )) = P(X W ).

Dfinition #7 : La loi dune variable alatoire X sur un espace probabilis fini (, P)


valeurs dans un ensemble V est la probabilit PX dfinie par
W V,

PX (W ) = P(X W ).

Prenons un exemple bent. Nous lanons deux ds, avec quiprobabilit sur
[1, 6]2 , et nous regardons la somme des points. Cest une variable alatoire S valeurs entires et sa loi est compltement dfinie par les probabilits des vnements
lmentaires, donnes par le tableau ci-dessous.
s
0 1 2 3 4 5 6 7 8 9 10 11 12 s 13
36PS ({s}) 0 0 1 2 3 4 5 6 5 4 3 2 1
0
Considrons un tirage de pile ou face en n tapes. Nous supposons les lancers
indpendants et la pice quilibre ce qui fait que nous utilisons lespace =
{P, F }n muni de lquiprobabilit. Une ventualit est un mot de longueur n sur
lalphabet {P, F }. Nous considrons la variable alatoire Yn qui compte le nombre
de faces apparues dans le tirage et nous voulons connatre sa loi. Pour cela nous
voyons chaque tirage, chaque mot comme un chemin dans le plan. Nous partons
de lorigine (0, 0). Le tirage dun pile P nous fait faire un pas horizontal disons
de (x, y) (x + 1, y). Une face F nous fait faire un pas vertical de (x, y) (x, y + 1).

n
Le nombre total de chemins ou de mots est
n2 . Le nombre de chemins en n pas
qui terminent laltitude y est le binomial y , qui correspond au choix des places
parmi les n o nous crivons la lettre F , les autres tant P . Nous obtenons donc

1 n
PYn ({y}) = P(Yn = y) = n
.
2 y

Nous pouvons voir un tirage de pile ou face dune autre manire. Au lieu
dassocier pile et face les valeurs 0 et 1, nous leur associons les valeurs 1 et 1.
Nous obtenons nouveau des chemins, comme dans le dessin ci-dessous, mais nous
Le got de la poire

Cours de mathmatiques spciales

3. VARIABLE ALATOIRE

15

Figure 3. La distribution de probabilit pour la marche de


livrogne et sa fonction de rpartition (pour 25 pas).
les pensons maintenant comme une marche alatoire sur Z, la marche de lhomme
ivre.

Lcart par rapport lorigine est Sn = Yn (n Yn ) = 2Yn n. La loi de Sn est


donc

1
n
PSn (s) = P(Sn = s) = pn,s = n n+s .
2
2
La fraction (s + n)/2 ne doit pas nous troubler : s et n ont ncessairement la
mme parit. Nous voyons en particulier que la probabilit que la marche alatoire
revienne en 0 au temps 2n vaut

1 2n
1
u2n = p2n,0 = 2n
.
2
n n+ n

Lquivalent rsulte de ltude des intgrales de Wallis.


Proposition #8 : La probabilit de retour en 0 en n pas pour la marche de
lhomme ivre est

1 2n
1
u2n = 2n
.
2
n n+ n
La distribution de probabilit est illustre par la figure 3. On y voit le graphique de
la suite (pn,s )sZ pour un n donn, ici n = 25, et aussi la fonction de rpartition de
la variable alatoire Sn , cest--dire la fonction de variable relle x P(Sn x).

Demande 6 Nous considrons une marche alatoire sur la droite Z dont les pas
lmentaires sont 1 ou 1 et qui part de 0. De manire quivalente, en considrant le
graphe de la marche en fonction du temps, nous considrons des chemins sur N Z
Filire PSI

Ph. Dumas, 2015

16

CHAPITRE I. PROBABILITS LMENTAIRES

Figure 4. Le principe de rflexion de Dsir Andr.


qui partent de lorigine (0, 0) et qui ont pour pas lmentaires (1, 1) et (1, 1).
Nous nous intressons au premier retour en 0.
a. Un chemin qui revient en 0 pour la premire fois linstant 2n ou bien demeure
dans les ordonnes strictement positives ou bien demeure dans les ordonnes strictement ngatives, except bien sr ses extrmits. Les deux vnements ont la
mme probabilit par symtrie. Nous regardons donc le premier cas et alors le
chemin passe ncessairement par (1, 1) et (2n 1, 1).
En vous inspirant de la figure 4, montrez que le nombre de chemins qui vont
de (1, 1) (2n 1, 1) et qui touche ou traverse laxe des abscisses est gal aux
nombre de chemins de (1, 1) (2n 1, 1). [Indication : Utilisez, par exemple, le
dernier instant de passage au niveau 0.]
b. Quelle est la probabilit f2n quune marche alatoire de longueur 2n revienne
pour la premire fois en 0 linstant 2n?
c. Vrifiez lgalit
n 1,

f2n =

1
u2n
2n 1

avec

u2n =


1 2n
.
22n n

Variables alatoires indpendantes. Lide dindpendance se propage aux variables alatoires.


Dfinition #9 : Deux variables alatoires X et Y sont indpendantes si pour A
et B dans les espaces darrive des deux applications que sont ces variables alatoires, la formule suivante est satisfaite
P((X, Y ) A B) = P(X A) P(Y B).
Lois usuelles. Nous illustrons quelques lois usuelles laide de modles durne.
Supposons que nous ayons une urne qui contient B boules blanches et N boules
noires. Nous tirons une boule au hasard. Nous notons X la variable alatoire qui
vaut 1 si nous obtenons une boule blanche, ce que nous voyons comme un succs, et
qui vaut 0 si nous obtenons une boule noire, ce que nous voyons comme un chec.
Nous calculons immdiatement
P(X = 1) =
Le got de la poire

B
,
B+N

P(X = 0) =

N
.
B+N

Cours de mathmatiques spciales

3. VARIABLE ALATOIRE

17

Plus gnralement une loi de Bernoulli B(p) est dfinie par la donne dun paramtre p dans [0, 1] avec
P(X = 1) = p,

P(X = 0) = 1 p.

Le paramtre p est la probabilit de succs et la quantit q = 1p est la probabilit


dchec.
Supposons quau lieu de tirer une seule boule, nous tirions n boules. Nous
pouvons le faire avec ou sans remise. Supposons quaprs chaque tirage, nous remettions la boule dans lurne ce qui fait que la composition de lurne est toujours
la mme. La suite des n tirages donne un mot sur lalphabet {B, N }, par exemple
BBN BN N N BB. Si nous supposons les tirages indpendants, la probabilit du
mot prcdent est p5 q 4 en notant
p la probabilit dobtenir une boule blanche et

q = 1 p. De plus il y a nk mots pour lesquels la lettre B apparat k fois. En


notant X la variable alatoire qui compte le nombre de boules blanches tires, nous
voyons que sa loi est donne par

n k nk
P(X = k) =
p q
.
k
Cest une loi binomiale B(n, p).
Dfinition #10 : La loi binomiale B(n, p) avec n entier naturel non nul et p
dans [0, 1] est la loi sur lintervalle dentiers [0, n] dont les probabilits lmentaires
sont les

n k nk
k [0, n], pk =
p q
,
k
avec q = 1 p. Pour n = 1, cest une loi de Bernoulli B(p) = B(1, p).

Nous pouvons aussi eectuer un tirage sans remise. Lespace probabilis est
alors lespace des parties n lments de lensemble des boules. Sil y a B boules
blanches et N boules noires, la variable X qui compte le nombre de boules blanches
tires a pour loi

B
N
k
nk
,
P(X = k) =
B+N
n
pour max(0, n B) k min(n, B) et 0 sinon. Cest une loi hypergomtrique
Esprance, variance. Nous nous limitons ici des variables alatoires qui prennent
des valeurs numriques et mme numriques relles pour simplifier. Si nous avons
une telle variable alatoire X dfinie sur un espace probabilis (, P) et valeurs
dans R, alors son esprance est la quantit

E(X) =
x P(X = x).
xX()

Plus gnralement son moment dordre k 1 est

E(X k ) =
xk P(X = x).
xX()

Lesprance est donc la valeur moyenne prise par la variable alatoire.


La variance dune variable alatoire relle est la quantit
Var(X) = E((X E(X))2 ).

Un simple dveloppement du carr donne, en utilisant la linarit de lesprance,


Var(X) = E(X 2 ) E(X)2 .
Filire PSI

Ph. Dumas, 2015

18

CHAPITRE I. PROBABILITS LMENTAIRES

Enfin lcart-type X est la racine carre de la variance.


Dfinition #11 : Pour une variable alatoire X sur un espace probabilis fini (, P),
lesprance, la variance et lcart-type sont respectivement

E(X) =
x P(X = x),
Var(X) = E((XE(X))2 ),
X = Var(X)1/2 .
xX()

Prenons par exemple une variable alatoire de la loi binomiale B(n, p). Nous
voyons tout de suite

n
n

n k nk
n 1 k1 (n1)(k1)
E(X) =
k
p q
= np
p
q
= np,
k
k1
k=0

k=1

en utilisant la formule classique

n, k 1,

n
n n1
=
.
k
k k1

De mme nous calculons


n k nk
n 2 k2 (n2)(k2)
k(k1)
p q
= n(n1)p2
k = 2n
p
q
= n(n1)p2
k
k2
k=0

et nous en tirons, avec k 2 = k(k 1) + k,


E(X 2 ) = n(n 1)p2 + np,
puis
Var(X) = n(n 1)p2 + np n2 p2 = np np2 = np(1 p) = npq.
Proposition #12 : Une loi binomiale B(n, p) a pour esprance np et pour variance npq.
Produit scalaire. Lesprance est une forme linaire et cela nous permet de dfinir
une application bilinaire symtrique sur lespace R des variables alatoires relles.
Nous posons simplement
X, Y R ,

(X | Y ) = E(XY ).

Il sagit dun produit scalaire parce que lesprance dune variable alatoire positive
est positive et la condition E(X 2 ) = 0 scrit

x2 P(X = x) = 0
xX()

et implique que X ne prend que la valeur 0, car une somme de nombres positifs ne
peut tre nulle que si chaque nombre est nul.
De plus lesprance apparat comme un projecteur sur lespace des variables
alatoires constantes cause de lvidente formule E(E(X)) = E(X). Ceci nous
amne dcomposer une variable alatoire X en
X = E(X) + (X E(X))
et la variable alatoire X E(X) est centre, ce qui signifie que son esprance est
nulle.
Le got de la poire

Cours de mathmatiques spciales

3. VARIABLE ALATOIRE

19

Supposons que nous ayons deux variables alatoires indpendantes X et Y .


Alors lesprance du produit est donne par

E(XY ) =
xy P(X = x, Y = y) =
xy P(X = x) P(Y = y)
(x,y)

(x,y)

x P(X = x)

y P(Y = y) = E(X) E(Y ).

La formule est donc tout fait simple.


Regardons l autrement en considrant les variables centres X E(X) et
Y E(Y ). Leur produit scalaire est donn par
E((X E(X))(Y E(Y ))) = E(XY X E(Y ) Y E(X) + E(X) E(Y )) = 0.

Nous constatons que pour deux variables alatoires, les variables alatoires centres
associes sont orthogonales.
Proposition #13 : Les variables centres associes deux variables alatoires
indpendantes sont orthogonales.
Appliquons ceci la marche alatoire sur Z de lhomme ivre. Le pas numro k
vaut 1 ou 1 et ceci est la variable alatoire Xk . La variable alatoire Sn nest rien
dautre que la somme des Xk , 1 k n,
Sn = X 1 + X 2 + + X n .

Nous avons depuis le dbut suppos les variables alatoires Xk indpendantes et


elles sont centres. Nous obtenons par linarit
E(Sn ) = 0
et grce au rsultat prcdent et au thorme de Pythagore
n

E(Sn2 ) =
E(Xk2 ) = n.
k=1

Ainsi lcart-type vaut n.


Proposition
#14 : Dans la marche alatoire de lhomme ivre, lcart-type est

Sn = n.
Ingalit de Bienaym-Tchebychev. Nous voulons quantifier lcart entre les valeurs dune variable alatoire et sa valeur moyenne. Lcart-type est un premier pas
en ce sens, mais nous voulons renforcer linformation quil fournit. Pour cela nous
tablissons dabord lingalit dAndrei Markov. Nous considrons une variable
alatoire Z qui ne prend que des valeurs relles positives et un rel a strictement
positif. Nous crivons que pour z a, nous avons z/a 1 et cela donne

z
1
1
P(Z a) =
P(Z = z)
P(Z = z) =
z P(Z = z) E(Z).
a
a
a
za

za

za

Comme on le voit, la preuve de lingalit de Markov est absolument lmentaire.


Ingalit de Markov #15 : Une variable alatoire Z positive et un rel a strictement positif sont lis par
1
P(Z a) E(Z).
a
Nous tendons lgrement lingalit prcdente en considrant une fonction
numrique de variable relle f qui est croissante et positive sur un intervalle I de R.
Nous considrons une variable alatoire Y valeurs dans I et un rel b dans I. La
croissance de f fournit limplication
y I,
Filire PSI

y b f (y) f (b)
Ph. Dumas, 2015

20

CHAPITRE I. PROBABILITS LMENTAIRES

Figure 5. Trois ventualits (ralisations) de la marche alatoire S1000 . La parabole indique lcart-type.
et donc linclusion
{ | Y () b} { I | f (Y ()) f (b)}.

Il en rsulte lingalit

P(Y b) P(f (Y ) f (b)).

Ensuite nous appliquons lingalit de Markov la variable alatoire Z = f (Y )


avec a = f (b) en supposant a > 0 et nous obtenons
P(Y b)

1
E(f (Y )).
f (b)

Pour une variable alatoire X, nous posons Y = |X E(X)| et nous utilisons


le rsultat prcdent avec I = R+ et f : y y 2 . Nous obtenons
b > 0,

P(|X E(X)| b)

1
Var(X).
b2

En utilisant lcart-type ceci scrit encore


Ingalit de Bienaym-Tchebychev #16 : Une variable alatoire relle X
dcart-type vrifie
1
r > 0, P(|X E(X)| r ) 2 .
r
Cette ingalit montre que les valeurs de la variable alatoire loign de la
moyenne ont une faible probabilit. Sa gnralit fait quelle manque de prcision
sur un cas particulier. Cependant si nous reprenons la marche alatoiresur Z que
nous avons dj considre pages 14 et 19. Dans ce cas lcart-type vaut n, qui est
petit par rapport n, alors que les valeurs extrmes que peut prendre Sn sont n
et n. Lingalit de Bienaym-Tchebychev nous donne par exemple

1
P(|Sn | 2 n) .
4

Lillustration de la figure 5 montre bien le phnomne ( 1000 31.6). Le mme


phnomne apparat dans les processus de diusion : au bout dun temps t, une
particule nest pas une
distance de lordre de t de son point de dpart mais une
distance de lordre de t.
4. Rsum
Une probabilit sur un ensemble fini est une application P qui
chaque partie de associe un rel de [0, 1] et qui satisfait aux conditions :
lvnement certain a pour probabilit 1;
lvnement impossible a pour probabilit 0;
pour A et B deux vnements disjoints, P(A B) = P(A) + P(B).
Le got de la poire

Cours de mathmatiques spciales

5. EXERCICES

21

Le couple (, P) est un espace probabilis fini.


La probabilit conditionnelle associe un vnement B est la proP(A B)
babilit dfinie par la formule P(A | B) =
pour tout vneP(B)
ment A. Lvnement B est suppos de probabilit non nulle.
P(B | A) P(A)
La formule de Bayes snonce P(A | B) =
pour deux
P(B)
vnements A et B de probabilits non nulles.
Une variable alatoire sur un espace probabilis fini (, P) est une
application dfinie sur lensemble . La loi dune variable alatoire X
sur un espace probabilis fini (, P) valeurs dans un ensemble V est
la probabilit PX dfinie par
W V,

PX (W ) = P(X W ).

Les vnements A1 , A2 , . . . , An sont mutuellement indpendants


sils vrifient

P(
Ah ) =
P(Ah )
hH

hH

pour toute partie H de P([1, n]) ayant au moins deux lments. Des
variables alatoires X1 , X2 , . . . , Xn sont indpendantes si elles vrifient
P(k, Xk Ak ) =

j=1

P(Xj Aj )

pour tout choix des vnements Aj , 1 j n, pris dans les espaces


convenables.
Pour une variable alatoire X sur un espace probabilis fini (, P),
lesprance, la variance et lcart-type sont respectivement

E(X) =
x P(X = x), Var(X) = E((XE(X))2 ), X = Var(X)1/2 .
xX()

La loi binomiale B(n, p) avec n entier naturel non nul et p dans [0, 1]
est la loi sur lintervalle dentiers [0, n] dont les probabilits lmentaires
sont les

n k nk
k [0, n], pk =
p q
,
k
avec q = 1 p. Pour n = 1, cest une loi de Bernoulli B(p) = B(1, p).
Une loi binomiale B(n, p) a pour esprance np et pour variance npq.
Les variables centres associes deux variables alatoires indpendantes sont orthogonales.
Daprs lingalit de Bienaym-Tchebychev, une variable alatoire
relle X dcart-type vrifie
r > 0,

P(|X E(X)| r )

1
r2

5. Exercices
Exercice 7 Au poker, dans sa version classique, les cartes sont dans lordre
croissant de force : deux, trois, quatre, cinq, six, sept, huit, neuf, dix, valet, dame,
Filire PSI

Ph. Dumas, 2015

22

CHAPITRE I. PROBABILITS LMENTAIRES

roi, as et il y a quatre couleurs : pique, trfle, carreau, cur. Il y a donc cinquantedeux cartes. Une main est une combinaison de cinq cartes.
a. On tire une main au hasard. Quel est lespace probabilis qui vient naturellement
lesprit?
b. Une suite colore ou quinte flush est une suite de cinq cartes de rang conscutifs
de mme couleur. Elle est nomme par sa couleur et le rang de la plus haute carte,
par exemple une quinte flush la reine carreau . Une quinte royale est une
quinte flush colore las. Cest la main la plus forte. Quelle est la probabilit de
tirer une quinte flush?
c. Une suite ou quinte est une suite de cinq cartes de rangs conscutifs et dau moins
deux couleurs (sil ny a quune couleur cest une quinte flush). Elle est nomme
suivant le rang de la plus haute carte. Quelle est la probabilit de tirer une quinte?
Exercice 8 [Le problme des anniversaires] Quelle est la probabilit que dans
un groupe de n personnes au moins deux aient le mme anniversaire? Prcisons
que nous considrons que lanne a 365 jours. Quel est le plus petit entier n pour
lequel cette probabilit dpasse 1/2?
Exercice 9 a. Soit X une variable alatoire un espace probabilis fini dont
les valeurs sont des entiers naturels non nuls. Prouvez la formule

E(X) =
P(X x).
x1

Nous pouvons considrer que la somme est finie car pour x assez grand P(X x)
est nul.
b. En vous basant sur la table de mortalit de la figure 2, calculez lesprance de
vie dun franais de 100 ans.
Exercice 10 Avec les notations de la demande 6, montrez lgalit
f2n = u2n2 u2n

pour n 1. Quelle est la probabilit que lhomme ivre revienne en 0 un moment


donn?
Exercice 11 Nous considrons la marche alatoire
Sn = X 1 + X 2 + + X n

dans laquelle les Xk sont des variables alatoires indpendantes qui suivent toutes
la mme loi de type Bernoulli,
1
P(X = 1) = P(X = 1) = .
2
Nous nous intressons la loi du maximum Mn entre 0 et n. Les sommes partielles
de la somme prcdente sont notes S0 = 0, S1 = X1 , S2 = X1 +X2 , etc. Puisque S0
est nulle, le maximum est une variable alatoire positive.
a. Soit m un entier positif. En utilisant le principe de rflexion dAndr, donnez
la probabilit que la marche arrive au temps n la position k < m en passant
par au moins une valeur suprieure ou gale m. Pour abrger, vous emploierez la
notation

1
n
pn,k = P(Sn = k) = n n+k .
2
2
Le got de la poire

Cours de mathmatiques spciales

5. EXERCICES

23

b. Quelle est la probabilit que la marche reste strictement en dessous du niveau m


et termine au niveau k, cest--dire combien vaut
P(t [0, n 1], St < m et Sn = k)?

c. Quelle est la probabilit que la valeur maximale de la marche, entre les instants 0
et n, soit exactement m?

Exercice 12
Dans larticle Programming pearls: a sample of brilliance,
Jon Bentley, Bob Floyd, Communications of the ACM, septembre 1987, volume 30,
numro 9, pages 754757, repris dans More programming pearls Confessions of a
coder, Jon Bentley, Addison-Wesley, 1988, qui commence en ces termes
How can a computer deal a poker hand? If we assigne each card
in the deck its own integer between 1 and 52, then we can make a
hand from a random sample of 5 integers in the range 1..52, for
instance
4 8 31 46 47
(It is important that no number appear twice; holding more than
one ace of spades can jeopardize a cardplayers health.) Random
simulation also arise in applications such as simulation, program
testing, and statistics.
Jon Bentley discute des algorithmes qui tire alatoirement une combinaison de M
lments dun ensemble N lments, concrtement lintervalle dentiers [1, N ]. Il
rappelle dabord que la majorit des algorithmes existants ont essentiellement la
structure suivante.
initialize set S to empty
Size := 0
while Size < M do
T := RandInt(1,N)
if T is not in S then
insert T in S
Size := Size + 1
Ensuite il fournit lalgorithme de Floyd qui dans une version itrative scrit
initialize set S to empty
for J := N - M + 1 to N do
T := RandInt(1,J)
if T is not in S then
insert T in S
else
insert J in S
et il en vante les mrites.
a. Expliquez en quoi la version de Floyd est meilleure que la version gnrique.
b. Fournissez un codage en Python de lalgorithme de Floyd. Vous utiliserez la
structure de liste pour reprsenter lensemble S.
c. Prouvez que sous lhypothse que la fonction RandInt qui gnre des entiers
fournit des entiers avec quiprobabilit dans lintervalle donn, alors lalgorithme
de Floyd gnre des combinaisons dans PM ([1, N ]) avec quiprobabilit.

Filire PSI

Ph. Dumas, 2015

24

CHAPITRE I. PROBABILITS LMENTAIRES

6. Rponses
Demande 1 a. Un domino est une paire dentiers entre 0 et 6 ou un doublon (x, x)
avec x entre 0 et 6. Il y en a donc

7
78
+7=
= 28.
2
2

b. Bien sr, la question ne fait sens que si nous indiquons la probabilit utilise. Le
caractre implicite de lnonc signifie que lquiprobabilit est utilise. Un dessin nous
ouvre les yeux.

Nous voyons tout de suite que le nombre de cas favorables est 1 + 2 + 3 + 3 + 2 + 1 = 12.
La probabilit demand vaut donc
P( la somme des points est impaire ) =

12
3
= 43%.
28
7

Demande 2 Nous pouvons voir un graphe simple dune manire lgrement dirente. Se donner un graphe simple sur I revient se donner une application v de P2 (I)
dans {0, 1}. Un couple {s, t} est une arte du graphe si et seulement si limage de {s, t}
par v vaut 1. Par exemple pour le graphe de la figure 1, lapplication v est la suivante
v({Albert, Bernard}) = 1,

v({Albert, Catherine}) = 0,

v({Albert, Denise}) = 0,

v({Bernard, Catherine}) = 1,

v({Bernard, Denise}) = 1,

v({Catherine, Denise}) = 1.

Autrement dit lensemble des graphes simples sur I est en bijection avec lensemble des
applications de P2 (I) dans {0, 1}. Le cardinal de est donc
n

# = 2( 2 ) = 2

n(n1)
2

Avec Albert et les autres, il y a donc a priori 2


lventualit qui est ralise est celle de la figure 1.

Le got de la poire

= 64 graphes simples possibles et

Cours de mathmatiques spciales

6. RPONSES

25

Demande 3 a. Notons Hx lvnement lhomme vit au moins jusqu x ans . La


question est de calculer la probabilit conditionnelle
P(H70 | H50 ) =

P(H70 H50 )
.
P(H50 )

Cependant il est on ne peut plus rare quun individu atteigne 70 ans sil na pas dabord
atteint 50 ans, en clair H70 H50 . Il reste donc
P(H70 | H50 ) =

P(H70 )
P(H50 )

et en considrant que nous utilisons lquiprobabilit (ce que nous faisons depuis le dbut)
le quotient des probabilits est le quotient des eectifs, soit
72 019
78%.
92 736
b. La question est de mme nature la prcdente et nous employons une notation similaire.
Avec un cohorte de 98 921 femme de 30 ans, lingalit
P(H70 | H50 ) =

P(Fx | F30 ) =

P(Fx )
Lx
=
90%
P(F30 )
L30

se traduit en

9
98 921 89 029
10
et la table donne x 67 ans. Avec le seuil de 95%, la cohorte doit avoir un eectif dau
moins 93 975 femme et lge maximal devient 58 ans.
Si lon demande 100%, cest--dire la certitude, on obtient videmment le seuil de 30
ans. En voulant tre certain, on na plus rien dire.
Lx

Demande 4 a. Notons Mk (avec M pour mnage) lvnement la famille a k enfants


de moins de 25 ans . Les donnes dont nous disposons nous oblige agglomrer tous les
vnements Mk avec k 4 en lunique vnement M4 . Autrement dit nous considrons
quune famille ne peut pas avoir plus de quatre enfants. Ce point tant acquis nous
notons pk avec 0 k 4, la probabilit de lvnement Mk . Nous trouvons aisment les
valeurs suivantes (p0 = 8 506 001/17 789 600 47.8%, etc) en lisant la dernire ligne du
tableau.
k
0
1
2
3
4
pk 47.8% 22.4% 20.2% 7.22% 2.34%
Ensuite pour une famille de k enfants, la probabilit fille-garon peut tre considre
comme gale 1/2 et nous pouvons supposer que les direntes naissances sont indpendantes. Du coup la probabilit quune famille de k enfants ne comporte pas de fille
est 1/2k . En notant F lvnement la famille comporte une fille , cela scrit encore
P(F | Mk ) =

1
.
2k

En utilisant le systme complet dvnements quest la partition (Mk )0k4 , nous trouvons
donc
4

P(F ) =
P(F | Mk ) P(Mk ),
k=0

cest--dire

P( la famille ne comporte pas de fille ) =

1
pk 65.1%.
2k

k=0

Nous sommes tonns de ce que les familles sans fille de moins de 25 ans apparaissent
avec une probabilit denviron 2/3. Cela va contre notre bon sens.
la rflexion, il est bien possible que notre bon sens comprenne la question comme
suit : quelle est la probabilit quune famille nait pas de fille (de moins de 25 ans), sachant
quelle comporte des enfants (de moins de 25 ans)? Nous reprenons donc la question en

Filire PSI

Ph. Dumas, 2015

26

CHAPITRE I. PROBABILITS LMENTAIRES

conditionnant tous les calculs au fait de ne considrer que des familles avec enfants (de
moins de 25 ans), cest--dire par lvnement
M1 =

Mk .

k=1

Les probabilits qk = P(Mk | M1 ) sont donnes par le tableau suivant, obtenu partir
de la deuxime ligne de donnes (q1 = 2 820 509/7 185 032, etc; voyez aussi le tableau
pour la question suivante)
k
1
2
3
4
qk 43.0% 38.7% 13.8% 4.5%
Le mme raisonnement que ci-dessus nous donne la probabilit conditionnelle
PM1 (F ) =
cest--dire

k=1

PM1 (F | Mk ) PM1 (Mk ) =

P(F | M1 ) =

k=1

P(F | Mk ) PM1 (Mk ),

1
qk 33.2%.
2k

k=1

Notre intuition ne nous permet pas de quantifier cette probabilit mais le rsultat obtenu
semble plus raisonnable.
Comme les filles et les garons jouent des rles similaires dans cette histoire, nous
voyons que grosso modo, parmi les familles franaises avec enfant, un tiers ne comporte
que des garons, un tiers ne comporte que des filles et le dernier tiers est mixte.
Demande 5 La question ne se pose quavec au moins trois vnements. Nous considrons donc trois vnements A, B, C sur un ensemble fini muni de lquiprobabilit.
Comme nous voulons un exemple simple, nous faisons une hypothse de symtrie assez
forte et rsume dans la figure suivante qui donne les cardinaux des parties.

La symtrie fait quil ny a pas trois quations mais une seule pour exprimer lindpendance deux deux, explicitement
(x + 3y + 3z + t)(x + y) = (x + 2y + z)2 .
Nous voulons des entiers. Par ttonnements, nous trouvons x = 0, y = 1, z = 0, t = 1, qui
est en fait la seule solution. Avec ce choix, nous obtenons P(A) = 1/2, P(A B) = 1/4 et
les valeurs qui sen dduisent par symtrie. Nous avons bien lindpendance deux deux.
Cependant nous constatons
1
P(A B C) = 0 = P(A) P(B) P(C) =
8
et nous avons le contre-exemple voulu, un joli coup de chance.
Serge Bernstein a donn une configuration qui amne ces probabilits : une urne
contient quatre boules qui sont tiquetes 000, 011, 101, 110. On tire au hasard une boule

Le got de la poire

Cours de mathmatiques spciales

6. RPONSES

27

et on note Ak , avec 1 k 3, lvnement ltiquette de la boule porte un 1 en ke


position .
Demande 6 a. Si nous avons un chemin qui va de (0, 0) (2n, 0) en restant positif, il
passe ncessairement par
(1, 1)
et (2n 1, 1). Donc nous considrons les chemins de (1, 1)
(2n 1, 1). Il y en a 2n2
puisquils comportent n 1 pas et autant de montes que
n1
de descentes. Nous voulons le nombre de ces chemins qui restent strictement au dessus de
laxe des abscisses sauf aux extrmits. Il nous faut soustraire les chemins qui touchent
le niveau 0 ailleurs quaux extrmits. Un tel chemin a ncessairement un dernier instant
o il passe au niveau 0 (autre que les instants 0 et 2n). Nous retournons la partie entre
linstant 0 et le dernier instant de
0 et nous obtenons un chemin qui passe
passage

par (1, 1) et (2n 1, 1). Il y en a 2n2


. Donc le nombre de chemins qui nous intressent
n2
est

2n 2
2n 2

.
n1
n2
b. Chaque chemin a une probabilit 1/22n donc il vient

1
2n 2
2n 2
f2n = 2 2n

,
2
n1
n2

le facteur 2 correspondant la symtrie que nous avons remarqu ds le dbut.


c. La formule obtenue donne

f2n

2n 2
=2
n1

n1
1
n

2 2n 2
=
.
n n1

Pour comparer ceci u2n nous considrons le binomial


2n
2n 2n 1
2n 2n 1
2n 2n 1 2n 2
=
=
=
n
n n1
n
n
n
n
n1
et le rsultat demand vient.
Exercice 7 a. Une main est une partie cinq lments de lensemble K des cinquantedeux cartes, donc il est naturel de prendre comme espace probabilis lensemble P5 (K)
muni de lquiprobabilit.
b. Une quinte flush peut avoir quatre couleurs et tre au six, au sept, au huit, au neuf,
au dix, au valet, la dame, au roi ou las, ce qui laisse neuf possibilits. Il y a donc
trente-six quinte flush. La probabilit demande est donc
P( tirer une quinte flush )
49
49
3
= =
=
0.001%.
52

51

50

49

48
216
580
52
12345
5
Cest un vnement rare.
c. Comptons le nombre de suites sans tenir compte de la restriction sur les couleurs. La
plus haute carte peut avoir neuf rangs depuis le six jusqu las. Pour chaque rang nous
avons quatre choix possibles, ce qui donne donc 945 possibilits. Cependant nous devons
enlever les trente-six quintes flush. Le nombre de cas favorables est donc
9 (45 4) = 9 4 (44 1) = 9 4 255

et la probabilit demande vaut

P( tirer une quinte ) = 255 P( tirer une quinte flush ) =

Filire PSI

9
0.35%.
2 548

Ph. Dumas, 2015

28

CHAPITRE I. PROBABILITS LMENTAIRES

Exercice 8 Soit X lensemble des personnes dans le groupe. chaque individu nous
associons la date de son anniversaire ce qui donne une application a (comme anniversaire)
de X dans un ensemble 365 lments, lensemble D des dates. Lespace probabilis que
nous utilisons est lensemble DX des applications de X dans D et nous le munissons de
lquiprobabilit.
Lvnement contraire de celui que lon nous fait considrer est toutes les personnes
ont des anniversaires dirents . Le sous-ensemble de DX qui correspond cet vnement
est lensemble des injections de X dans D. Celui-ci a
365!
365 364 (365 n + 1) =
(365 n)!
lments, alors que lensemble DX a 365n lments. La probabilit demande est donc

P( au moins deux personnes ont le mme anniversaire )


365
364
365 n + 1
=1


.
365
365
365
Le calcul donne les valeurs suivantes en notant pn la probabilit prcdente.
n pn
1 0
16 0.28
2 0.0027 17 0.32
3 0.0082 18 0.35
4 0.016
19 0.38
5 0.027
20 0.41
6 0.040
21 0.44
7 0.056
22 0.48
8 0.074
23 0.51
9 0.095
24 0.54
25 0.57
10 0.12
11 0.14
26 0.60
12 0.17
27 0.63
13 0.19
28 0.65
14 0.22
29 0.68
15 0.25
30 0.71
Nous voyons que la probabilit reste en dessous de 10% pour moins de dix personnes, passe
au dessus de 50% pour vingt-trois personnes et au dessus de 70% pour trente personnes.
Exercice 9

a. Nous crivons la somme considre sous la forme

P(X x) =
P(X = y),
x1

x1 yx

puis nous changeons lordre de sommation, ce qui donne

P(X x) =
P(X = y) =
y P(X = y) = E(X).
x1

y1 1xy

x1

b. Nous reprenons les notations de la demande 3. De mme quexiste la notion de probabilit conditionnelle, il est possible de dfinir une notion desprance conditionnelle. Ici
nous considrons la variable alatoire V qui un individu associe le nombre dannes
qui lui reste vivre. Nous voulons connatre son esprance conditionne par lvnement
lindividu est un homme et il a 100 ans . Notons Hx lvnement lhomme vit au
moins jusqu x ans . La loi de probabilit de V conditionne par H100 est donne par
la formule
P(V = v | H100 ) = P(H100+v | H100 ) P(H101+v | H100 ),
qui exprime que lindividu est encore vivant dans son anne 100 + v mais dcde avant sa
101 + v-ime anne.
Nous pouvons procder de deux manires. La premire consiste appliquer la formule
de dfinition de lesprance

E(V | H100 ) =
v P(V = v | H100 ).
v1

Le got de la poire

Cours de mathmatiques spciales

6. RPONSES

29

La seconde mthode consiste appliquer le rsultat de la question prcdente,

E(V | H100 ) =
P(V v | H100 )
v1

et la probabilit conditionnelle P(V v | H100 ) est bien sr donne par


L100+v
P(V v | H100 ) = P(H100+v | H100 ) =
,
L100
avec les notations de la demande 3. Quoi quil en soit nous obtenons
E(V | H100 ) 1.42 ans.
Exercice 10 Nous connaissons les formules
n 1,

f2n =

1
u2n ,
2n 1

n 0,

u2n =

1
22n

2n
.
n

Nous calculons donc pour n 1




1
2n 2
1 2n
4
n
2n
1 2n
u2n2 u2n = 2n2
2n
= 2n
2n
2
n1
2
n
2 2(2n 1) n
2
n

1
1
2n
= 2n
(2n (2n 1)) = f2n .
2 2n 1 n
La probabilit de retour en 0 est la somme tlescopique
+

n=1

f2n =

n=1

(u2n2 u2n ) = u0 = 1

et le calcul est correct parce que la suite (u2n ) a pour limite 0. Nous sommes trs naturellement sorti du cadre des espaces probabiliss finis.
Exercice 11 a. Nous voyons le graphe de la marche dans le plan N Z avec le temps
discret en abscisse et les valeurs prises par la marche en ordonne. Notons t le premier
instant o le niveau k est atteint. Nous modifions le chemin en conservant la partie entre
les instants 0 et t et en eectuant la symtrie par rapport la droite horizontale dquation
y = m pour la partie entre t et n. Nous obtenons un chemin qui va de (0, 0) (n, 2m k).
Inversement un tel chemin croise la droite de niveau m en un premier point et via la
symtrie nous obtenons un chemin de (0, 0) (n, k) qui atteint le niveau m. Fort de cette
bijection, nous obtenons
P(t [0, n 1], St = m et Sn = k) = pn,2mk .
b. La probabilit davoir un chemin qui arrive linstant n en position k est pn,k donc, par
soustraction et en employant la question prcdente, la probabilit que la marche termine
au niveau k et reste strictement infrieure m vaut
pn,k pn,2mk .
c. Dire que le maximum Mn vaut exactement m cest dire que la marche reste toujours
strictement en dessous de m + 1 mais ne reste pas strictement en dessous de m, donc la
probabilit que la marche ait comme maximum m et termine au niveau k linstant n
vaut
(pn,k pn,2m+2k ) (pn,k pn,2mk ) = pn,2mk pn,2m+2k .
Le niveau k est nimporte quel entier de mme parit que n qui est infrieur ou gal m
et plus grand que n. La probabilit demande est donc
P(Mn = m) = pn,2m+n pn,2m+2+n + pn,2m+n2 pn,2m+n + + pn,2m pn,2m+2 ,

en notant lentier de mme parit que n et le plus grand qui reste infrieur ou gal m.
La somme est tlescopique et se rduit
P(Mn = m) = pn,2m pn,2m+n+2 .

Mais 2m + n + 2 est strictement plus grand que n, car m est positif ou nul, et pn,2m+n+2
est nul. Quant 2m , il vaut m ou m + 1, comme on le voit en considrant les quatre

Filire PSI

Ph. Dumas, 2015

30

CHAPITRE I. PROBABILITS LMENTAIRES

cas possibles de parits. Les trois petits tableaux ci-dessous donnent, dans cet ordre, les
valeurs de , 2m et 2m .
n m
2
2 + 1

2
2
2 1

2 + 1
2
2 + 1

nm
2
2 + 1

2
2
2 + 1

2 + 1
2 + 2
2 + 1

nm
2
2 + 1

2
m
m+1

2 + 1
m+1
m

Nous constatons que 2m vaut m ou m + 1 selon que n et m sont de mmes parits ou


de parits contraires. Finalement nous arrivons
P(Mn = m) = pn,m+
avec qui vaut 0 ou 1 et choisi de manire que n et m + aient la mme parit.
Le dessin ci-contre montre le graphe de la suite (P(Mn = m))m0 pour n = 100.
On voit que pour m 20, cest--dire m plus grand que deux fois lcart type de S100 la
probabilit est en dessous de 1%.

Exercice 12 a. Dans les deux versions, chaque tour de boucle lalgorithme vrifie
que llment tir nest pas dj dans lensemble. Quand lensemble a une taille k cela
cote k comparaisons. Cependant dans la version gnrique, quand la taille de lensemble
est k, la probabilit dchec, cest--dire la probabilit de tirer un lment qui est dj
dans lensemble, est de pk = k/N , alors que lalgorithme de Floyd ne rencontre jamais
dchec. Il en rsulte que lalgorithme gnrique eectue trop de tirages dentiers et de
comparaisons. Nous pouvons eectuer une estimation grossire comme suit de cet excs.
Avec un ensemble k lments le temps dattente pour un succs est de 1/pk = N/k
(Nous avons aaire une loi gomtrique de paramtre p et desprance 1/p.), donc le
surcot est denviron k N/k = N et ceci chaque tape donc globalement le surcot
est de lordre de M N .
Quant lalgorithme de Floyd, il eectue un test chaque tape pour savoir si
lentier tir est dans la partie. Le nombre de comparaisons est donc 1 + 2 + + (M 1) =
M (M 1)/2. On voit que le surcot de lalgorithme gnrique est suprieur au cot de
lalgorithme de Floyd.
b. Voici un codage possible, dcor dune instruction dcriture de manire rendre lexcution comprhensible.
# python
from random import randint
N = 10
# size of the set
M = 8
# size of the sample
S = []
for J in range(N - M,N):
T = randint(1,J)
print "%d : %d" % (J,T)
# verbose instruction
if T in S:

Le got de la poire

Cours de mathmatiques spciales

6. RPONSES

31

S.append(J)
else:
S.append(T)
print(S)
Une excution donne par exemple
2 :
3 :
4 :
5 :
6 :
7 :
8 :
9 :
[1,

1
1
3
1
2
1
4
7
3, 4, 5, 2, 7, 8, 9]

Le paquetage numpy comporte un sous-paquetage random, plus puissant que la paquetage


natif random, et la premire ligne du codage aurait pu tre.
# python
from numpy.random import randint
c. Commenons par mettre des notations en place. Lespace probabilis utilis est
=

[1, j],

j=N M +1

muni de lquiprobabilit, car lquiprobabilit sur chaque composante donne lquiprobabilit sur le produit. Une ventualit est un M -uplet = (j )M N +1jN . Les tirages
successifs apparaissent comme des variables alatoires Tj , qui ne sont en fait que les projections Tj : j , pour M N + 1 j N .
Le rsultat de lalgorithme est une partie M lments de lintervalle dentiers [1, N ]
et nous la voyons comme une variable alatoire S. La formule que nous avons prouver
est
1
N 1, M N, s PM ([1, N ]), P(S = s) = .
N
M
Nous procdons par rcurrence sur N . Pour N = 1 la proprit demande est lhypothse
que le gnrateur alatoire fournit des entiers entre 1 et N avec quiprobabilit.
Pour traiter lhrdit de la proprit, nous remarquons que le cas M = 1 est
nouveau lhypothse sur le gnrateur alatoire dentiers. Nous supposons donc M 2 et
nous rcrivons lalgorithme en dtachant de la boucle le dernier tour de boucle.
initialize set S to empty
for J := (N -1) - (M - 1) + 1 to N -1 do
T := RandInt(1,J)
if T is not in S then
insert T in S
else
insert J in S
#
T := RandInt(1,N)
if T is not in S then
insert T in S
else
insert N in S
La partie de lalgorithme avant la marque # fournit une partie M 1 lments de
lintervalle [1, N 1]. Nous la voyons comme une variable alatoire S et daprs lhypothse

Filire PSI

Ph. Dumas, 2015

32

CHAPITRE I. PROBABILITS LMENTAIRES

de rcurrence, nous disposons de la formule


s PM 1 (1, N 1),

P(S = s ) =

1
N 1
M 1

Le dernier tour de boucle fournit un entier t de [1, N ] qui est une valeur de la variable
alatoire TN et lhypothse sur le gnrateur dentiers donne
1
P(TN = t) = .
N
Nous considrons deux cas suivant ce quest la partie s. Dans le premier cas, la
partie s contient N . Pour que lalgorithme donne une telle partie, cest--dire, pour que
lvnement S = s soit ralis, il est ncessaire et susant que lentier tir t ou bien soit
infrieur ou gal N 1 et soit dans s = s \ {N }, la partie obtenue avant le dernier
tour de boucle et qui comporte M 1 lments, ou bien gal N . Ceci se produit avec
la probabilit M/N . En eet ou bien t est entre 1 et N 1 et doit faire partie des M 1
lments de s , ce qui laisse M 1 possibilits ou bien t vaut N ce qui donne exactement
une possibilit. Dans ce cas, la probabilit P(S = s) vaut, daprs lindpendance des
tirages,
1
M
1

P(S = s) = P(S = s ) P(TN s ou TN = N )] =


= ,
N
N 1
N
M 1

daprs la formule bien connue


n 1, m [1, n],

n
m n1
=
.
m
n m1

Dans le second cas, la partie s ne contient pas N . Cela signifie que lalgorithme a dabord
produit une partie s M 1 lments pris dans [1, N 1], puis que le dernier tirage a
donn un lment t qui est entre 1 et N 1 mais qui nest pas dans s . Inversement si
nous considrons la partie s, nous lobtenons ds que le dernier tirage donne un lment t
de s et que les tirages prcdents ont donn la partie s = s \ {t}. Nous obtenons donc

P(S = s) =
P(S = s \ {t}) P(TN = t)
ts

ts

N 1
M 1

1
1
1
1

=M
= .
N
N
N 1
N
M 1
M

Nous obtenons lexpression attendue dans tous les cas et lhrdit est prouve. Daprs
le principe de rcurrence lquiprobabilit est donc prouve.

Le got de la poire

Cours de mathmatiques spciales

S-ar putea să vă placă și