Documente Academic
Documente Profesional
Documente Cultură
Statistique
pour économiste
Kinshasa/RDC-Mai 2010
2
3
Avertissement
vertissement
Préface
réface
Chapitre Premier
Chapitre I. Introduction aux calculs des probabilités
ntroduction aux calculs des probabilités
Exercice 2 : On tire une carte dans un jeu de 52 cartes. Quelle est la probabilité
de tirer un roi ?
Solution
( )
Solution
Solution
a) P (E1) = 13/52
b) P (E2) = 1/52
c) P (E3) = 0/52 = 0
d) P (E4) = 1.
Remarque
2°/P(S) = 1
P( A B)
Formule : P( A / B)
P( B)
Solution
A = (1,2) ; (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) ; (3,2) ; (4,2) ; (5,2) ; (6,2) 11
couples.
P(A) = 11/36
P(B) = 5/36
P (AB) = 2/36
P( A B) 2 / 36
P( A / B) 2 / 5 0,4
P(B) 5 / 36
On sait que :
P( A B)
P( A / B)
P(B)
A1 A2 = (2,5) ; (5,2) 2 couples
A3 A4 = (2,2) ; (2,4) ; (2,6) ; (4,2) ; (4,4) ; (4,6) ; (6,2) ; (6,4) ; (6,6) 9
couples
A5 A6 = 0 couple
P( A 2 A1) 2 / 36
a) P( A 2 / A1) 1/ 3 0,33
P( A1) 5 / 36
P( A1 A 2 ) 2 / 36
b) P( A1 / A 2 ) 2 / 11 0,18
P( A 2 ) 11/ 36
P( A3 A 4 ) 9 / 36
c) P( A3 / A 4 ) 1/ 2 0,5
P( A 4 ) 18 / 36
P( A5 A 6 ) 0 / 36
d) P( A5 / A6 ) 0
P( A 6 ) 6 / 36
13
Remarque
P( A B)
P( A / B) et
P(B)
P( A B)
P(B / A)
P( A)
Ainsi, P(AB) = P(A). P(B/A) = P(B). P(A/B). C’est la loi de multiplication des
probabilités.
Généralisation
n n2 n 1
P( Ai ) P( A1 ).P( A2 / A1 ).P( A3 / A1 A2 ).P( A4 / A1 A2 A3 )...P( An1 / Ai).P( An / Ai)
i 1 i 1 i 1
Exercice 3 : Quelle est la probabilité qu’il y ait deux garçons dans une famille de
3 enfants, si on sait qu’il y a au moins une fille?
Solution
P( A1 A 2 ) 3 / 8
P( A1 / A 2 ) 3/ 7
P( A 2 ) 7/8
Solution
P( A 2 A1) 0,05
a) P(A2/A1) = 1/ 3
P( A1) 0,15
P( A1 A 2 ) 0,05
b) PA1/A2) = 1/ 12
P( A 2 ) 0,06
c) P(A1A2) = P(A1)+P(A2)-P(A1A2)
= 0,15 + 0,60 – 0,05
= 0,7
Exercice 5
Parti A B C
Sexe
Homme 13 21 19
Femme 20 8 19
Solution
a) P(A1) = 0,33
P( A1 A5 ) 20 / 100
b) P(A1/A5) = 20 / 47
P( A5 ) 47 / 100
P( A 2 A3 ) A 4 )
c) P(A2A3)/A4 =
P( A 4 )
P( A 2 A 4 ) P( A3 A 4 )
P( A 4 )
P( A 2 A 4 ) P( A3 A 4 )
P( A 4 ) P( A 4 )
= 0,21/0,53+0,19/0,53 = 40/53
P( A5 A3 ) 0,19
d) P(A5/A3) = 0,5
P( A3 ) 0,38
Exercice 6
Solution
P(E2/E1) = 2/5
b) P(E1)=2/5
P(E2/E1) = ¼ puisqu’étant donné que l’événement E1 s’est déj{ réalisé, il ne
reste que 4 craies dans la boîte parmi lesquelles une rouge.
P(E k )P(E / E k )
P(E k / E) n
P(E i )P(E / E i )
i 1
Exercice 1
Solution
P(A/F) = 0,01
P(A/G) = 0,04
P(F A)
P(F/A) =
P( A)
P(FA) = P(F).P(A/F)
= 0,60 (0,01)
= 0,006
0,006 6
P(F/A) = 0,27
0,022 22
18
En appliquant le théorème de Bayes, on a :
P(F) P( A / F)
P(F/A) =
P(F) P( A / F) P(G)P( A / G)
0,6 (0,01)
=
0,6(0,01) 0,4(0,04)
6
=
22
Exercice 2
Une ville est formée à 54% des femmes. On sait que 32% des femmes pratiquent
le « Basket-ball » alors que 41% des hommes le pratiquent.
On choisit une personne au hasard dans cette ville. Quelle est la probabilité
qu’elle pratique le « Basket-ball » ?
Solution
P(A1) = 0,54
P(A2) = 0,46
P(A/A1) = 0,32
P(A/A2) = 0,41
Exercice 3
Solution
P(A1) = 0,25
P(A2) = 0,33
19
P(A3) = 0,416
P(A/A1) = 0,9
P(A/A2) = 0,8
P(A/A3) = 0,75
La probabilité cherchée est P(A).
D’après le théorème de probabilité totale :
P(A) = P(A1).P(A/A1)+P(A2).P(A/A2)+P(A3).P(A/A3)
3 4 5
= (0.9) (0.8) (0.75)
12 12 12
= 0.225+0.267+0.313
= 0.805
Exercice 4 :
Solution
1
Exercice 1 : Soit S = a1, a2, a3, a4avec P (a1) = 1 = 1, 2, 3,4
4
Soient les événements E1, E2, E3 S
E1 = a1, a2 ; E2 = a1, a3 ; E3 = a1, a4
Solution
Exercice 2 : Dans une boîte, il y a une craie rouge, une craie jaune, un dé rouge
et une bague jaune. On pige un objet au hasard dans cette boîte
Si E1 est l’événement « choisir un objet rouge »
E2 l’événement « choisir un objet jaune » et
E3 l’événement « choisir une craie »
Peut-on dire que ces 3 événements sont indépendants ?
Solution
Conclusion :
On a :
S ̅
H 46 184 230
F 8 32 40
54 216 270
̅
•
•
Les identités étant vérifiées, nous disons donc que la sélection est
indépendante du sexe.
23
1.6.1. Arrangement
Solution
4! 4! 4 .3!
a) A 13 = = = =4
(4 1)! 3! 3!
Ce groupe c’est : a, b, c, d.
2 4!
b) A 4 = = 12
(4 2)!
Exercice 2 : Une association doit élire son comité directeur. Celui-ci doit
comprendre 1 président, 1 vice-président, 1 secrétaire et 1 trésorier.
S’il y a 10 candidats, de combien de manières ces 4 postes peuvent
être occupés ?
Solution
Il s’agit de l’arrangement
4 10! 10.9.8.7.6!
A 10 = = = 5040
(10 4)! 6!
1.6.2. Permutation
Il s’agit de la permutation
P 6 = 6 ! = 720 manières différentes
Solution
6! 6.5.4.3.2!
P6 = = = 360
2! 2!
Exercice 2
8!
P8 = = 3360
3!2!
1.6.3. Combinaison
Solution
Il s’agit de la combinaison
8 12!
C 12 = = 495
4!8!
Solution
Exercices supplémentaires
Exercice 1
Combien de mots de 7 lettres peut-on former avec toutes les lettres du
mot « ENTENTE » ?
Rép. 210 mots
26
Exercice 2
Exercice 3
Exercice 5
Exercice 7
Dans une firme, on doit procéder au remplacement d’un directeur, d’un sous-
directeur, d’un chef de service et d’un chef de bureau. Combien de possibilités
y a-t-il de procéder aux nominations.
a) Si l’on a 4 candidats de mêmes compétences ;
b) Si l’on a 5 candidats de mêmes compétences
Rép.
a) P 4 = 4 ! = 24 possibilités
4 5!
b) A 5 = = 120 possibilités
(5 4)!
27
1.6.4. Le binôme de newton
Exemple :
- Bon et mauvais
- Ordinaire et non ordinaire
- Fille et garçon
Formule général du binôme de newton
1
(a + b) = a + b
2
(a + b) = a2 + 2ab +b2
(a + b) 3 = a3 + 3a2b + 3ab2 + b4
(a + b) 4 = a4 + 4a3b + 6a2b2 + 4ab3 + b4
n
(a + b) n = C nk a nk b k
k 0
Solution
(a + b) 3 = b 3 + 3a 2 b + 3ab 2 + b 3
Où :
a3 représente la probabilité de tirer 3 bonnes ampoules ;
3a2b représente la probabilité de tirer 2 bonnes ampoules et une ampoule
défectueuse ;
3ab2 représente la probabilité de tirer 1 bonne ampoule et 2 ampoules
défectueuses ;
b3 représente la probabilité de tirer 3 ampoules défectueuses.
28
a) La probabilité de tirer 2 bonnes ampoules et une ampoule défectueuse
est :
a3 = (0.05)2 = 0.000125
Exercice 2 : On sait que 80% des avions de la compagnie SABENA arrivent à
l’heure. Un voyageur emprunte 4 avions de cette compagnie.
Quelle est la probabilité pour qu’il arrive 3 fois { l’heure.
Solution
Soit a = probabilité d’arriver { l’heure = 0.8
b= probabilité de ne pas arriver { l’heure = 0.2
Ici, nous avons affaire à une expansion de puissance 4
0 1 2 3 4
(a + b)4 = C 4 a4b0 + C 4 a3b + C 4 a2b2 + C 4 ab3 + C 4 a0b4
La probabilité cherchée est:
1
C 4 a3b = 4a3b = 4(0.8)3 (0.2) = 0.4096
D’où la probabilité que notre voyageur arrive 3 fois { l’heure est de 41%
NB : Si on demandait la probabilité d’arriver 2 fois en retard, on aurait :
2
C 4 a2b2 = 6(0.8)2(0.2)2
Remarque
k 0 1 2 3 4 5 6 7
n
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
Ce triangle de pascal est important en ce sens qu’il nous donne les coefficients
du binôme.
- Pain ou fufu
- Poisson ou viande
- Lait ou boisson sucrée
De combien de façon peuvent-ils choisir leur repas
Solution
Poisson
Boisson sucrée Pn, Ps, Bs
Pain
Lait Pn, Vd, Lt
Viande
Exercice 1
R 0.5(0.9) X
0.9
A1
0.5 0.1 𝑅 0.5(0.1)
0.05 R 0.4 (0.05) Y
0.4 A2
P
0.95 𝑅 0.4 (0.95)
0.1 0.1 R 0.1 (0.1) Z
A2
0,45
P( A1 / A) 45 / 48
0,48
On a :
Exercice 2 :
Dans une usine, trois machines M1, M2, M3 fabriquent des stylos. La machine
M1 en fabrique 1000 dans une journée alors que M2 en fabrique 2000 et M3 en
fabrique 3000 quotidiennement. On sait que pour M1, 3% de stylos fabriqués
sont défectueux ; pour M2, 2% sont défectueux et pour M3, 1%. A la fin d’une
journée, on choisit un stylo au hasard et on constate qu’il est défectueux.
Quelle est la probabilité qu’il provienne de la machine M2 ?
Solution
1000
P( A1) 1/ 6
6000
2000
P( A 2 ) 1/ 3
6000
3000
P( A 3 ) 1/ 2
6000
P(D/A1) = 0.03
P(D/A2) = 0.02
P(D/A3) = 0.01
A 𝐴̅ A 𝐴̅
A1 30 970 1000 A1 30/6000 970/6000 1/6
A2 40 1960 2000 A2 40/6000 1960/6000 2/6
A3 30 2970 3000 A3 30/6000 2970/6000 3/6
100 5900 6000 100/6000 5900/6000 1.0
P(A2/B)=40/100=0.40
33
Selon le théorème de Bayes, on a :
P( A 2 ).P(D / A 2 )
P( A 2 / D)
P( A1).P(D / A1) P( A 2 ).P(D / A 2 ) P( A3 ).P(D / A3 )
1/ 3(0.02)
1/ 3(0.03) 1/ 3(0.02) 1/ 2(0.01)
= 2/5
= 0.4
Solution
On a :
0.99 A P(I A)=0.10(0.99)
I
0.10 P(I 𝐴̅)=0.10(0.01)
0.01 𝐴̅
A ̅
I 0.099 0.001 0.10
̅ 0.018 0.882 0.90
0.117 0.883 1.00
a) /̅ ̅
b) ̅
34
Exercice 2
Un appareil peut être monté avec des pièces de haute qualité ou exclusivement
avec des pièces ordinaires. Dans le 1er cas, sa fiabilité (c’est-à-dire la probabilité
de fonctionnement sans panne durant le temps T) est de 0.95 et dans le second
cas 0.7. Environ 40% des appareils sont fabriqués avec des pièces de haute
qualité. Un appareil choisi au hasard a été testé pendant le temps T et s’est
avéré être bon. Calculer la probabilité pour qu’il soit monté avec des pièces de
haute qualité.
Exercice 3
On amène { l’hôpital en moyenne 50% des malades avec la maladie K, 30% avec
la maladie L et 20% avec la maladie M. La probabilité de guérison pour la
maladie K (resp. L et M) est de 0.7 (resp. 0.8 et 0.9), un malade a été guéri.
Trouver la probabilité pour que le malade guéri ait souffert de la maladie K.
Exercice 4
Exercice 5
Un tireur tire sur une cible. Sachant que la probabilité de tirer au but est p = 0.4
et qu’il tire 3 coups. Calculer la probabilité qu’il a d’atteindre :
- 0 fois la cible
- 1 fois la cible
- 2 fois la cible
- 3 fois la cible.
Exercice 7
Exercice 8
Dans les mêmes hypothèses que l’exercice précédent ; le tireur gagne 5 points
chaque fois qu’il tire au but. Le nombre de points gagnés par le tireur est donc
une v.a. discrète X prenant les valeurs 0, 5, 10 et 15.
a) Tracer l’histogramme de cette v.a.
b) Etablir le tableau de répartition des points gagnés.
1.8. Solutions
Ex. 1 :
a) 45/435
b) 190/435
c) 200/435
∑ ( )
( ) ( ) ( )
Ex 6 :
a) 0.216
b) 0.432
c) 0.288
d) 0.064
Ex 7 :
a) 1
b) 0.784
c) 0.352
d) 0.064
Ex 8 : Voir chapitre 2.
37
2.1. Introduction
Exemple
Une urne contient des boules blanches en proportion p et des boules rouges en
proportion q = 1-p. On tire une boule au hasard et on définit la v.a.X de la façon
suivante :
- si la boule tirée est blanche X = 1
- si la boule tirée est rouge X = 0.
On aura alors :
S = B, R X = 1,0
P(X=1) = p
P(X=0) = q = 1-p
On dit qu’une variable aléatoire X est discrète lorsque ses différentes valeurs
possibles sont en nombre fini ou infini dénombrable.
Exemples :
- Soit M = l’ensemble des jours de la semaine
M = L, Ma, Me, J, V, S, D ensemble fini
- P = x/x = médecin congolais ensemble fini
- Soit Y = l’ensemble de nombres entiers positifs pairs
Y = 2,4,6, … ensemble infini dénombrable
- A=x R/0 ≤ x ≤ 1 ensemble infini non dénombrable.
- B=x/x=poids d’un bébé nouveau né ensemble infini non
dénombrable.
Loi de probabilité
Solution
Graphiquement
f(x)
Diagramme en bâton
3/8
x
1/8
0 1 2 3 X=x
Fonction de répartition
Exercice 2
Solution
Représentation graphique
F(xi)
1/8
0 X = xi
1 2 3
41
2.2.2. Espérance mathématique – Variance – Moment – Coefficient
d’asymétrie et coefficient d’aplatissement
Exercice 3
Solution
Exercice 4
Supposons qu’{ chaque face xi obtenue, on gagne xi2 points. On définit alors
une V.a Y prenant les valeurs 0, 1, 4, 9.
Calculer l’espérance mathématique de Y = nombre de points gagnés.
Solutions
1. E(aX+b) = a E(X) + b
2.E (X+Y) = E(X) + E(Y)
3.E(X*Y)=E(X)*E(Y) X et Y étant deux variables aléatoires indépendantes
4. E[g(x)]=g(xi)pi
Exercice 5
Solution
Var (X) = (0-1.5)² (1/8) + (1-1.5)² (3/8) + (2 – 1.5)² (3/8) + (3 – 1.5)² (1/8)
= 0.75
Propriétés de la variance
Exercice 6
Solution
k = E (X-)k = (xi-)kpi
N.B.
Cette mesure est indépendante des unités utilisées et elle est utile pour
la comparaison des distributions dont les unités diffèrent.
32 32
1 coefficient de PEARSON
32 ( 2 ) 3
3
1 1 coefficient de FISHER
3
Si
1 = 0, la distribution est symétrique (cas de la distribution normale et de t de
Student)
1 0, la distribution est penchée vers la droite (allongée à gauche)
1 0, la distribution est penchée vers la gauche (allongée à droite)
Exercice
√ =0
u4 u4
2 coefficient de PEARSON
u 22 4
2 2 3 coefficient de FISHER
Si
2 = 0, la distribution est symétrique (cas de la distribution normale)
2 0, la distribution est platokurtique (cas de la distirbution t de Student)
2 0, la distribution est leptokurtique
2.2.3. Exercices
Exercice 1.
Soit X 1a V.a définie par le nombre de garçons dans une famille de 3 enfants.
a) Construire le tableau de distribution des probabilités
b) Trouver la fonction de répartition et représenter
graphiquement cette fonction
c) Calculer E(X) et Var (X)
Exercice 2. On jette deux dés. On définie la V.a X comme la somme des points
obtenus par les deux dés.
Exercice 4. Un vendeur de parapluies peut gagner 300FF par jour quand il pleut.
Il peut perdre 60 FF par jour quand il fait chaud. Quelle somme
peut-il espérer gagner par jour si la probabilité pour qu’il pleuve
est 0.3 ?
Supposons que son salaire hebdomadaire soit de 50FF plus une commission de
100FF par automobile vendue. Quel salaire hebdomadaire peut-il espérer ?
Exercice 7
Dans les mêmes hypothèses que l’exercice précédent, supposons que le profit
découlant de la vente des automobiles soit une variable aléatoire W donnée par
W = 10X²-40.
Trouver le profit hebdomadaire espéré.
46
Exercice 8
Le vendeur d’automobile de l’exercice n°6 vend aussi des camions. Selon son
estimé, le nombre de camions vendues chaque semaine est une V.a. V dont la
fonction de probabilité est donné par le tableau suivant :
Exercice 9
On effectue une expérience dans laquelle l’événement A peut être réalisé avec
la probabilité p ou ne pas être réaliser. Soit X la V.a représentant le nombre de
réalisation de l’événement A. Trouver son espérance mathématique, sa
variance et son écart type.
Exercice 10
Exercice 11
Un jeu consiste { tirer une carte d’un jeu ordinaire de 52 cartes. Si on tire un AS,
on a 10 points, un roi 5 points, une dame 3 points, un valet 2 points, une carte
avec un numéro pair un point et une carte avec un numéro impair aucun point.
a) Trouver la fonction de probabilité de la Va X représentant le nombre de
points obtenus
b) Trouver P(X3)
Exercice 12
Trois coups sont tirés sur une cible. La probabilité d’atteindre la cible avec un
coup est égale à 0.4.
Pour chaque coup réussi, le tireur gagne 5 points.
a) établir le tableau de distribution de nombre des points gagnés
b) trouver E(X), Var(X), le coefficient d’asymétrie et le coefficient de
kurtose.
47
Exercice 13
Démontrer que :
X u
a) la variable centrée réduits Z a une moyenne égale à 0 et un
écart-type égale à 1.
b) Var (XY) = Var (Y)
c) Var (k) = 0
d) Var (kX) = k² Var (X)
e) E (X+Y) = E(X) + E(Y)
Solutions
Ex.1.
a)
b)
0 pour xi 0
1/8 pour 0 xi 1
F(Xi) = 4/8 pour 1 xi 2
7/8 pour 2 xi 3
1 pour xi 3
F(xi)
4/8
1/8
0 X = xi
1 2 3
Ex.2.
a) et b)
V.aX P(X=Xi) F(xi)=P(Xxi) xipi (xi-)² (xi-u)²Pi
48
2 1/36 1/36 2/36 25 25/36
3 2/36 3/36 6/36 16 32/36
4 3/36 6/36 12/36 9 27/36
5 4/36 10/36 20/36 4 16/36
6 5/36 15/36 30/36 1 5/36
7 6/36 21/36 42/36 0 0
8 5/36 26/36 40/36 1 5/36
9 4/36 30/36 36/36 4 16/36
10 3/36 33/36 30/36 9 27/36
11 2/36 35/36 22/36 16 32/36
12 1/36 1 12/36 25 25/36
TOTAL 1 7 5.83
F(X
i)
27/3
6
18/3
6
9/
36
0 1 X = xi
2 3 4 5 6 7 8 9 1 1 1
0 1 2
c) E(X) = 7 Var (X) = 5.83 Mo = 7 Md = 7
d) P (4 X 8) = P (X=5) + P(X=6)+P(X=7)+P(X=8)
= F(8)-F(4)
= 5/9
P(X9) = 1 – P(X8)
= 1 – F (8)
= 1 - 26/36
= 5/18
Ex.3.
V.aX 2 3 4 5 6 7 8 9 10 11 12
V.A Y ½ 1 3/2 2 5/2 3 7/2 4 9/2 5 11/2
P(Yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
F(Y) 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 1
49
c)
f(yi)
6/36
Polygone de probabilité de Y
Y=
0 3 7/ 4 9/ 5 11/2 yi
1/ 1 3/ 2 5/
2 2 2 2 2
2Yi / 36 pour 1/ 2 Yi 3
12 2Yi
c) f (yi) pour 3 Yi 11/ 2
36
0 aileurs
d) Mo = 3
Md = 3
Ex.4.
V.a.X P(X=xj)
300 0.3
-60 0.7
Total 1
Ex.5.
On aura donc :
50
xi yi pi yipi (yi-)2 (yi-)2pi
7843 -2 0.1 -0.2 4.41 0.441
7845 -1 0.2 -0.2 1.21 0.242
7847 0 0.3 0 0.01 0.003
7849 1 0.3 0.3 0.81 0.243
7851 2 0.1 0.2 3.61 0.361
Total X 1 0.1 X 1.29
b) E(Y) = yipi=0.1
Var(Y) = (yi-)²pi = 1.29
c) Y X 7847 X 7847 2Y
2
E(X) = 7847 + 2 E(Y) = 7847 + 2 (0.1) = 7847,2
Var(X) = 2² Var (Y) = 4 (1.29) = 5.16
Ex. 6.
On a Y = 50 + 100 X
W = 10X² - 40
E(W) = 10 E(X²) – 40
E( X 2 ) X i2Pi 0(0.05) 1(0.07) ... 100(0.01) 26.5
E(W) = 10 (26.5) – 40 = 225.
Ex.9.
V.a.X P(X=xi)
0 q=1–p
1 p
Total 1
Ex. 10. a) et b)
V.aX P(X=xi) F(x)
0 8/27 8/27
1 12/27 20/27
2 6/27 26/27
3 1/27 1
1
Remarque
Si le tirage d’un échantillon est avec remise dans une population, on utilise la loi
binomiale.
P( X x) C nx p x qnx
Si le tirage d’un échantillon est sans remise dans une population, on utilise la loi
hypergéométrique.
x nx
C Np C Nq
P( X x)
C Nn
P( X 0) C 30p 0 q3 (1 / 3) 0 ( 2 / 3) 3 8 / 27
P( X 1) C13p1q2 (1 / 3)1 ( 2 / 3) 2 12 / 27
. . . . . .
P( X 3) C 33p3q0 (1 / 3) 0 ( 2 / 3) 3 1 / 27
52
Dans le même ordre d’idées, si on appliquait la loi hypergéométrique, on
aurait :
Np = 3 Nq = 6 N = 9 et n=3
C 30 C 36
Ainsi, P( X 0) 120 / 504
C 39
Ex.11.
xi 0 1 2 3 5 10 Total
f(xi) 16/52 20/52 4/52 4/52 4/52 4/52 1
b) P (X3) = P(X=3) + P(X=5) + P (X=10)
= 4/52 + 4/52 + 4/52
= 3/13
Ex.12.
x1 = 0 x2 = 5 x3 = 10 x4 = 15
xi 0 5 10 15
pi 0.216 0.432 0.288 0.064
Ex.13.
a) Z X
X X
E(Z) = E ( ) E( ) E( )
1
= E( X )
=
=0
X X
Var(Z) = Var ( ) Var ( ) Var ( )
1
= Var ( X )
2
2
= 1
2
b)
Pij = P (X = xi ; Y=yj)
54
E( X Y) (xi y j )Pij
i j
xiPij yiPij
i j i j
xi Pij y j Pij
i j j j
xi Pio y j Poj
i j j j
E (X + Y) = E(X) + E(Y)
Si X est une v.a continue, la probabilité pour que X prenne une valeur
particulière quelconque est généralement nulle. Il n’est donc pas possible de
définir une fonction de probabilité comme pour une v.a discrète.
Pour pouvoir définir une distribution de probabilité dans le cas d’une v.a
continue, on remarque que la probabilité pour que X soit comprise entre deux
valeurs différentes est une notion qui a un sens.
Exemple
Ces remarques nous conduisent { postuler l’existence d’une fonction f(x) telle
que :
a) f(x) 0
b)
f ( x) dx 1
Ainsi, la probabilité pour que X soit comprise entre a et b sera définie par :
55
∫
Une fonction f(x) que satisfait aux propositions précédentes est appelée
« fonction de probabilité ou distribution de probabilité », mais plus souvent on
l’appelle « fonction de densité de probabilité » pour une v.a continue.
N.B. Pour une v.a continue, la probabilité que X soit égale à une valeur donnée
quelconque est nulle. Dans ces conditions, on peut remplacer les signes
par .
Ainsi,
b
P (a X b) = P (a X b) = P (a X b) = P (a X b) = f (x)dx F(b) F(a)
a
Exercice 1
{
Solution
a) Pour que f(x) satisfasse à la propriété 1, il faut que c 0. Et, pour qu’elle
satisfasse à la propriété 2, il faut que :
3
f(x)dx 0 f(x)dx 1
3
3 cx 3
0 cx dx 3 9c 1
2
Ainsi,
0
c = 1/9
56
La fonction de densité est donc :
1/ 9x 2 pour 0 x 3
f ( x)
0 ailleurs
2 2
b) P (1 X 2) = 1 f(x)dx 1 1/ 9x dx 7 / 27
2
Exercice 2
Dans l’intervalle 2, 4, f(x) = k x². Trouver k sachant que la fonction f(x) est une
fonction de densité.
Solution
4
f(x)dx 2kx²dx 1
56
k 1
3
k = 3/56
Fonction de répartition
Exemple 1.
a) Dans l’intervalle ] ]
f(t) = 0
F(x) = P(Xx)=∫
b) Dans l’intervalle ] ]
f(t)=
F(x)=P(Xx)= ∫ ∫ * +
57
F(x)=
c) Dans l’intervalle [ [
f(t)=0
F(x)= P(Xx)= ∫ ∫ ∫
F(x)=1
Exemple 2.
0 pour x 0
F(x) =
x pour 0 x 1
1 pour x 1
Graphiquement
F(x)
0 1 x
Connaissant la fonction de répartition, on peut dériver la fonction de densité
d F ( x)
par la formule f (x)
dx
{ ,
58
Graphiquement
f(x)
x
0 1
P (X 0.4) = ∫
Exemple 3
P (0.6 x 0.9)
- En utilisant la fonction de densité on à :
0.9
P (0.6 x 0.9) = 0.6 1dx 0.3
- En utilisant la fonction de répartition, on a :
E (X) = = xf(x)dx
E g (x) = g(x) f (x)dx
2.3.2.2. Variance
Var(x) = (x ) 2 f (x)dx
= E(x2) - E (x)2 =∫
∫ ∫ ( )
Mathématiquement :
Md
Md est telle que f (x)dx 1/ 2 ou
Md
f (x)dx 1/ 2
k E ( x k
(x )k f (x)dx
u32 u32
1 coefficien t de PEARSON
u32 ( 2 ) 3
1 = 1 33 coefficien t de FISHER
4 4
1 coefficien t de PEARSON
22 4
S
60
2.3.3. Exercices
Ex. 1 : soit X une v.a continue dont la distribution f est constante sur un
intervalle
a x b
k pour
I= a x b et vaut 0 ailleurs : f(x) = o ailleur
a) Calculer k ;
b) Calculer la moyenne de X et la variance ;
c) Déterminer la fonction de répartition F(x)
k (30 x) , pour 0 x 30
F(x)=
0 , autrement
On demande :
a) de déterminer la valeur de k pour que le modèle spécifié soit
véritablement une densité de probabilité ;
b) de représenter graphiquement le modèle probabiliste ;
c) de déterminer F(x) et tracer le graphique ;
d) d’évaluer : P (X15), P (10 X 20), P (X12)
e) d’évaluer le mode et la médiane de la v.a X.
f (x) = {
1°/ Evaluer (a) la constante c, (b) P (1 X 2), (c)P (X 3) et (d) P (X 1)
2°/ Trouver la fonction de distribution de la v.a X
a) trouver le coefficient a ;
b) trouver la densité de probabilité f(x) ;
c) trouver la probabilité pour que la variable X se trouve dans l’intervalle
(0.25 et 0.5)
Ex. 7 : La v.a X suite une loi de probabilité :
a) trouver a ;
b) tracer le graphique de la densité de probabilitéf(x)
c) trouver le mode Mo et la médiane Md ;
d) trouver la fonction f(x) de répartition et tracer son graphique ;
e) trouver la probabilité pour que la v.a X se trouve dans l’intervalle
0 x /4.
Ex. 8 : Une v.a continue X de densité de probabilité c(4x-x2) est définie sur
l’intervalle allant de 0 { 4 ;
a) calculer la constante c de façon que c (4x- x2) soit effectivement une
fonction de densité ;
b) représenter graphiquement la loi de probabilité correspondante ;
c) quelle est la fonction de répartition de la v.a en question ;
d) déterminer la somme de probabilité correspondant aux valeurs de X
compris entre 1et 3 ;
e) calculer l’espérance mathématique et la variance.
{
a) établir l’expression de la densité de probabilité ;
b) évaluer la probabilité que X 2 et -3 X 4
{
62
Evaluer :
a) la constante c ;
b) P (1/2 X 3/2) ;
c) P (X 1) ;
d) La fonction de répartition.
F(x) = 0, si x 0
F(x) = 1, si x /2
F(x) = sin x, si 0 x /2
a) montrer que F est une fonction de répartition ;
b) calculer E(X) et var (X).
Ex.12 : Une variable aléatoire continue X est distribuée sur un segment fermé
1, e avec une densité f(x)= k/x.
a) Déterminer la constante k et la fonction de répartition ;
b) Calculer la moyenne et la variance ;
c) Evaluer P(xe)
1°/ évaluer :
a) la constante c ;
b) P (X 2) ;
c) P (0.5 X 1.5)
Solutions
Ex.1 :
b b
a) f (x)dx 1 kdx 1, avec k, une cons tan te
a a
k x
b
1 k (b a) 1 k
1
a
ba
b
b b x x2 b2 a2 a b
b) E(x) = xf(x)dx kxdx
a a ba
dx
2(b a a 2(b a)
2
2
b x2 ab (b a) 2
var( x) dx
a ba 2 12
63
c)
Ex. 2 :
a) k = 1/450 ;
b) p.m
c) {
Calcul de la médiane
∫ ( ) [ ]
8.8
Md
51.2 (à rejeter)
Ex. 3 :
f(x)
a)
0 2 4
b)
{
64
c) E(X) = 2 ; Mo = 2 et Md = 2
∫ ∫ ∫ ∫
* + * +
Calcul de la médiane
∫
Ou encore :
∫ * +
6 (à rejeter)
Md
2
La distribution étant parfaitement symétrique, on voit que l’espérance
mathématique, le mode et la médiane coïncident.
Ex. 4 :
1
a) axdx 1 a / 2 1 a 2
0
1
b) E(x) = O
( x)( 2 x)dx 2 / 3
1
O ( x 2 / 3) (2 x)dx 1 / 18
2
d) Var (X) =
Ou encore
1
Var (X) = E(X2) - E(X)2 = O ( x )(2 x)dx 4 / 9 1 / 18
2
b) P (i X 2) = F (2)-F(1)
6
= e e 3
1 1
= 3
(1 3 )
e e
1
c) P(X 3) = 3 f ( x)dx F (3)
e9
0 1
d) P(X 1) = f ( x)dx
O
f ( x)dx
=
O
1
0dx 3e 3x dx e 3x
O
1
0 e 3 e 0 1 e 3
= F(1)- F(0)
Ex.6 :
,
1
2axdx 1 a 1
0
{
66
Ex.7 :
/2
a) / 2 a cos xdx 1 a sin / 2 a sin( / 2) 1
a1 (1) 1
a 1/ 2
b) Graphique
f(x)
-/2 0 /2
c) – Le mode correspond à la valeur de x pour la quelle f(x) atteint le
maximum. Sur le graphique, on trouve que pour x =0, la fonction
atteint le maximum. D’où Mo = 2
df ( x)
0 ( 1 2 cos x)' 0 (1 / 2 sin x) 0 x 0
dx
Condition du 2eme ordre pour le maximum :
( )
𝜋 𝜋 X
b) Graphiquement :
f(x) = -3/32x2+12/32x pour 0 x 4
f(x) = 0 pour x 0 et x 4
Coordonnés du sommet (M)
12 / 32
= 2
6 / 32
YM = - /4a, avec = (12/32)2 -4(-3/32) (0) = 144/1024
144 / 1024
YM 3/8
4(3 / 32 )
68
f(x)
3/8
0 2 4 X
Graphiquement F(x)
0
2 4 x
1
= F(3)- F(1)
= 25/32
Ex.9 :
df ( x)
a) f(x) =
dx
69
b) P(x 2) = 1 – F(2)
= e 4
c) P(-3 X 4)= F(4) – F(-3)
= 1- e 8
Ex. 10 :
a)
b) P(1/2 X 3/2) = F(3/2) – F(1/2)
= 1/2
c) P(X 1) = 1 - F(1) = 3/4
d) La fonction de distribution est :
Ex. 11 :
a) Pour montrer que F(x) est une fonction de répartition, on vérifie les
propriétés suivantes :
1°/ F(x) est non négative dans 0 ; /2
F(x) = sin x
Ainsi, dans 0 ; /2, F(x) est non négative et non décroissante.
2°/ F(a) = 0 F (0)= sin 0 = 0
3°/ F (b) = 1 F (/2) = 1
D’où F(x) est une fonction de répartition. On peut l’exprimer comme suit :
{
b) E(X) =
Var (X) =
Ex.12 :
a) k=1
b) ∫ ( ) ∫
Exemple 1.
Soient des jets « indépendants » de deux dés à six faces. Considérons les v.a X
et Y définies comme suit :
X : l’évènement "le résultat obtenu sur le premier dé"
Y : l’évènement "la somme des points des deux dés".
L’ensemble des résultats possibles formé de tous les couples (x,y) permet de
ressortir la loi de probabilité à deux dimensions.
V.a Y 2 3 4 5 6 7 8 9 10 11 12 F(x)
v.a X
1 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 0 0 1/6
2 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 0 1/6
3 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 1/6
4 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 1/6
5 0 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 1/6
6 0 0 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 1//6
f(y) 1/36 1/18 /12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36 1.0
Comme dans le cas des v.a à une dimension, ici aussi on s’intéresse {
différentes catégories d’événement et aux probabilités de leurs réalisations.
Pij =P(X=xi, Y=yj), avec Pij 1 (la somme des probabilités attachées aux
i j
Désignons par Pi., la totalisation des probabilités Pij suivants l’indice j (somme
de probabilité de la ligne j), alors :
Pi.= Pij P ( x xi )
j
x2 P21 P22 .…
… P2j ….…. P2m P2 .
xm Pm1 Pm2 .…
… Pmj ……. Pmn Pm .
Si l’on s’intéresse { la probabilité qu’une des variables aléatoires prenne une valeur
donnée, peu importe la valeur prise par l’autre variable, on obtient les fonctions de
répartition marginale définies comme suit :
f (a, y )
a xi j
j
( ) ( ) f ( x , b)
i b y j
i
Exemple 2
{
73
En dénombrant les cas favorables et les cas possibles, on obtient le tableau des
probabilités jointe que voici :
w 0 1 P(Z=zi)
z
0 1/6 1/6 1/3
1 1/3 1/3 2/3
P(W=wi) ½ ½ 1.0
Exercice
P(B/A)=P(Y=1/x=1) =
(ce qui permet de remplir la première case).
⁄
P(A/B)=P(x=1 /Y=1) =
⁄ ⁄
=1/2 (ce qui permet de remplir la première case
⁄
correspondante à P(Y=1).
b) Il s’agit de vérifier si :
P(x=xi, Y=yi) = P(x=xi)•P(Y=yi)
a.
b.
D’où les variables X et Y sont indépendantes.
Comme dans le cas univarié, une fonction f(x, y) qui est telle que son
intégration dans la totalité du domaine de variation des deux variables (X et Y)
donne l’unité est une fonction de probabilités jointes ou fonction de densité de
probabilité jointe, c’est-à-dire :
∫ ∫ ∫ ∫
x x+dx
Exemple
{
76
Dériver la fonction de densité jointe associée à cette fonction de répartition et
calculer : P(1≤X≤2, 1≤Y≤3).
Solution
{ [ ]} [ ]
Ailleurs, F(x,y) = 0,
D’où, {
∫ [ ]
P(1≤X≤2, 1≤Y≤3) =∫ [ ]
=[ ] [ ]
=
=
= 0.074
3 0.074
1 2
c’est-à-dire ∫
c’est-à-dire ∫
Exemple
Soit f(x, y) = ,
3 2
f x ( x) 3
( x 2 y )dx
2 x2
3 2
2 xy
3
0( x )
2 9
( 6 y ) pour 0 y 1
3 2
0
0, ailleurs
(3 4 y ), 0 y 1
f y ( y)
0, ailleurs
79
3.1. Introduction
Si X B (n,p), alors
E(X) = np, et
Var (X) = npq
Exercice 1
Solution
xi f(xi)
0 0.0778
1 0.2592
2 0.3456
3 0.2304
4 0.0768
5 0.0102
1.0000
Solution
Exercice 3
Solution
E(X) = np
N n
Var (X) = npq
N 1
où p = probabilité initiale (probabilité de succès)
Exercice 1
Solution
Exercice 2
Solution
Cette V.a X qui obéit à cette loi hypergéométrique peut prendre les réalisations
0, 1, 2, 3, 4 et 5. On doit donc calculer les probabilités que X prenne chacune de
ces valeurs.
C130 C395
f(0) = P (X = 0) = 0.2215
C525
C131 C394
f(1) = P (X = 1) = 0.4114
C525
f(2) = P (X = 2) = 0.2743
f(3) = P (X = 3) = 0.0816
f(4) = P (X = 4) = 0.0107
f(5) = P (X = 5) = 0.0005
xi f(xi)
0 0.2215
1 0.4114
2 0.2743
3 0.0816
4 0.0107
5 0.0005
1.0000
Exercice 3
Solution
On a N = 52
n=2
p = 13/52 = 0.25
Np = 13
Nq = 39
84
C131 C39
1
b) P(X = 1) = 0.3824
C522
Si les 999 premier tirage avaient données des boules rouges, on aurait :
40000
P( B1000 / R1 R2 ...R999 ) 0.404036 0.4
99001
On remarque donc qu’{ chacun des tirages, la probabilité de tirer une
boule blanche reste très proche de la proportion primitive p de boules blanches
85
dans l’urne : en pratique, on est dans les conditions d’application de la loi
binomiale.
Ainsi, lorsque la taille de la population est grande et que la taille de l’échantillon
est petite par rapport à celle de la population (on considère n petit si n N/20),
la différence entre un tirage avec remise et un tirage sans remise devient très
faible. Dans ces conditions, il y a lieu d’utiliser la loi binomiale.
La V.a de Poisson X est une v.a discrète qui prend les valeurs entières :
x = 0, 1, 2, …
avec des probabilités :
e x
P(X = x) = où np
x!
Si X Po (), alors
E(X) = , et
Var (X) =
Si n est grand et qu’en même temps p est petit, la loi binomiale tendra vers la
loi de poisson de paramètre = np. En effet, si n est grand et p très petit, on
aura :
Cette table donne les valeurs de et x. Elle est à double entrée. Voir
Annexe.
Exercices
Ex. 1. Dans une grande ville, on compte en moyenne 5 décès par accident
d’auto chaque mois. Sachant que le nombre d’accidents par mois est une
v.a de Poisson de paramètre = 5, calculer la probabilité pour que dans
un mois, il y ait zéro accident (resp. 1 accident, au moins 6 accidents).
Ex. 2. Une dactylo fait en moyenne deux erreurs de dactylographie par page.
Sachant que le nombre d’erreurs par page est une v.a de Poisson,
calculer la probabilité qu’elle tape une page sans erreur.
Ex. 3. Une centrale téléphonique reçoit des appels en raison de k appels par
heure en moyenne. En supposant que le nombre d’appels pendant un
intervalle de temps donné est une v.a de Poisson, calculer la probabilité
pour que pendant deux minutes la centrale reçoive exactement 3 appels
(resp. au moins 1 appel, au moins 3 appels).
Ex.5. 10% d’outils produits par un certain procédé de fabrication ont été
défectueux. Trouver la probabilité pour que 2 outils exactement soient
défectueux sur un échantillon de 10 choisit au hasard, en utilisant :
a) la loi binomiale
b) l’approximation de la loi binomiale par la loi de Poisson.
87
Ex.6. Si la probabilité pour qu’un individu ait une mauvaise réaction { l’injection
d’un sérum est de 0.001, quelle est la probabilité pour que sur 2000
individus :
a) 3 aient une réaction dangereuse
b) Plus de deux aient une réaction dangereuse.
Ex.7. Une agence organise des voyages par bus. Le prix est fixé à 2000F par
passager. Le bus peut transporter 50 personnes et l’Agence doit payer
25000F au propriétaire du bus. L’expert de la compagnie fait observer
que le nombre de personnes qui annulent une réservation suit une
distribution de Poisson de moyenne L’Agence se demande alors
si elle doit accepter plus de réservations que de places disponibles. En
effet, si les annulations sont inférieures au nombre de réservations
supplémentaires, l’Agence paie 500F { titre de dommages { la personne
qu’elle ne peut transporter.
Calculer le nombre de réservations supplémentaires que peut accepter
l’Agence.
Solutions
e x
Ex.1. Pour une v.a de Poisson P(X=x) =
x!
e 5 5 0
a) P(X = 0) = 0.0067
0!
e 5 51
b) P(X = 1) = 0.0337
1!
c) P(X 6) = 1 – P(X 6)
= 1 – (P1 + P2 + P3 + P4 + P5)
= 1 – 0.616
= 0.384
Ex.2. = 2 et x=0
e 2 2 .0
P( X 0) 0.1353
0!
Ex.3. = k/30
e k / 30 (k / 30 ) 3 e k / 30 (k / 30 ) 3
a) P(X = 3) =
3! 6
b) P(X 1) = 1 – P (X 1) = 1 – P (X = 0)
= 1 - e-k/30
c) P(X 3) = 1 – P(X3)
= 1 – (P0 + P1 + P2)
88
e k / 30 (k / 30 ) 2
= 1 - (e k / 30 (k / 30 ) e k / 30 )
2
= 1 - e-k/30 (1 + k/30 + k/1800)
Ex.3.
xi Pi xipi x12 p i
0 0.05 0 0
1 0.16 0.16 0.16
2 0.23 0.46 0.92
3 0.21 0.63 1.89
4 0.17 0.68 2.72
5 0.09 0.45 2.25
6 0.06 0.36 2.16
7 0.03 0.21 1.47
1.00 2.95 11.57
Ex.5.
x x n x
a) P(X=xi) = C n p q
p = 0.1 et q = 0.9
P(X=2) = C10 (0.1) (0.9) 0.1937
2 2 8
e x
b) P(X = x) =
x!
= nbp = 10 (0.1) = 1
e 112
P(X = 2) = 0.1839
2!
Ex.6.
p = 0.001 et n = 2000
n 50 et p 0.1, on peut approximer la loi binomiale par la loi de Poisson.
= np = 2000 (0.001) = 2
89
e 2 2 3
a) P(X = 3) = 0.1804
3!
b) P(X 2) = 1 - P(X 2) = 1 - (P0 + P1 + P2)
= 1 – 0.6767
= 0.3233
RESERVATIONS SUPPLEMENTAIRES
Avec λ=2.5 0 1 2 3 4 5 6 7 8 9 10
0.082084999 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0.205212497 2000 0 500 1000 1500 2000 2500 3000 3500 4000 4500
0.256515621 4000 2000 0 500 1000 1500 2000 2500 3000 3500 4000
0.213763017 6000 4000 2000 0 500 1000 1500 2000 2500 3000 3500
0.133601886 8000 6000 4000 2000 0 500 1000 1500 2000 2500 3000
0.066800943 10000 8000 6000 4000 2000 0 500 1000 1500 2000 2500
0.027833726 12000 10000 8000 6000 4000 2000 0 500 1000 1500 2000
0.009940617 14000 12000 10000 8000 6000 4000 2000 0 500 1000 1500
0.003106443 16000 14000 12000 10000 8000 6000 4000 2000 0 500 1000
0.000862901 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 500
0.000215725 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0
1
91
Le nombre de réservation supplémentaires que peut accepter la compagnie
correspond à la perte implicite la plus minimale. Les calcules de ces pertes
implicites (PI) espérées se fait comme suit :
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
.
.
.
[ ]
f ( x) exp 1 / 2
2
Symboliquement, on note X N(, ²) pour indiquer que la v.a X suit une
loi normale de paramètres et ², qui déterminent la position et la forme de la
distribution. Plus l’écart-type est grand, plus la courbe sera large, aplatie,
traduisant ainsi une plus grande dispersion.
Propriétés
Graphique 3.1 : Trois distributions normales ayant la même moyenne, avec des
écart-types différents.
𝛿
93
Graphique 3.2 : Trois distributions de moyennes différentes ayant la même
transformation normale centrée réduite.
0 1,34 a b
a- b- 0 Z
1
Dans d’autres tables, on trouve la valeur de l’aire entre - et zi ; càd P (Z zi).
94
Exercice 1
Si Z N (0,1), trouver :
a) P (0.80 Z 2.35)
b) P (-2.11 Z 0)
c) P (-0.35 Z 3.42)
Solution
Z
0 0,8 2,35
-2,11 0 2,11
Z
-0,35 0 -3,42
Z
95
Exercice 2
Solution
Pour utiliser la table, il faut transformer la v.a X en une v.a centrée réduite Z
défini par
X 20
Z
10
X 20 25 20
a) P(X 25) = P ( )
10 10
= P (Z 0.5)
= 0.5 – P (0 Z 0.5)
= 0.5 – 0.1915
20 25 X
= 0.3085
Z
0 0.5
N.B. On sait que l’aire totale sur la courbe est 1 ; donc la moitié de cette aire est
0.5
Exercice 3
La taille moyenne de 500 élèves du Mont AMBA est de 151 Cm et la variance 225
Cm. Sachant que la taille est une variable aléatoire continue qui obéit à une loi
normale, trouver :
a) La probabilité qu’un élève choisit au hasard ait une taille comprise entre
120 cm et 155 cm ;
96
b) La probabilité qu’il ait une taille de 185 cm ou plus
c) Le nombre d’élèves ayant une taille supérieure { 185 cm.
Solution
Si on désigne par X la v.a représentant la taille des élèves du Mont Amba, alors
X N (151, 225).
-0.27 0 0.27
b) P(X185) = P(Z2.27)
= 0.5 - P(0 Z 2.27)
= 0.5 - 0.4884
= 0.0116
0 2.27
c) Lorsque on a 500 élèves, on peut considérer que l’on tire 500 élèves dans
une population très grande. Si Y représente le nombre d’élèves ayant une
taille supérieure à 185 Cm, alors Y est une v.a qui obéit à une loi
hypergéométrique où N est très grand, n = 500 et p = 0,0116. Toutefois,
comme la population est très grande (on dit souvent infinie), on peut
considérer que Y suit une loi binominale : Y B (500, 0.0116). Alors le
nombre d’élèves qui mesurent plus de 185 Cm est égal { :
E(Y) = np = 500 (0.0116) = 6 élèves.
Exercice 4
Ici, le problème est à sens inverse par rapport aux précédents. En effet, si
X est une v.a représentant la distance de lancer des javelots, on cherche ici une
valeur de X, appelons-la xi telle que :
P(X xi) = 0.10
x 64
P(X xi) = P( Z i ) 0.10
6
= P (Z zi) = 0.10
0.5 - P(0 Z zi) = 0.10
P (0 Z zi) = 0.40
X
64 xi
zi Z
0
Exercice 5
Solution
1
D’où la valeur maximum de f(x) est
3 2
Exercice 6
Solution
Exercice 7
Solution
X
Z
99
88
- Pour le premier étudiant, on a 0.8 = 88 0.8
64
- Pour le second étudiant, on a - 0.4 = 64 0.4
On aura donc :
0.8 80 1 0.8 88
0.4 64 1 0.4 64
D’où = 72 et = 20
Exercice 8
Solution
D’où, on donnera { LAURA une note de 666. Avec cette note, LAURA est
classée parmi les 5% des meilleurs.
Si n est grand et qu’en même temps p est grand (c’est-à-dire que p n’est
pas trop voisin de 0, ni de 1), la loi binomial tendra vers la loi normale de
paramètre = np et ² = npq.
Etant donné que la loi binomiale concerne les valeurs discrètes et que la
loi normale concerne les valeurs continues, il y a une correction { faire que l’on
appelle « correction de continuité ».
Si on veut approximer par une loi normale, il faut tenir compte du fait que
X B (30 ; 0.4) est une v.a discrète alors que Y N (12 ; 7.2) est une v.a
continue. Si on cherche P(Y=10), on trouve 0.
Il en est de même pour toute probabilité qu’une v.a continue prenne une valeur
particulière. Puisqu’une v.a continue remplace une v.a discrète, chaque valeur
de la v.a discrète sera remplacée par un intervalle de longueur 1 situé
également de part et d’autres de cette valeur. Ainsi x = 10 sera remplacé par 9.5
Z 10.5. C’est ce qu’on appelle « la correction continuité ».
Solution
Solution
Exercice 3
On envoie 400 questionnaires par la poste pour effectuer un sondage. On sait
que la probabilité qu’une personne retourne le questionnaire complété est
0.10. Quelle est la probabilité qu’au moins 60 questionnaires soient retournés
complétés ?
Solution
On a n = 400, p = 0.1, np = 40 et npq = 36
= 6.7 et = 1.2
Exercice 4
La maladie de Popo atteint 55% des ouvriers agricoles d’une région donnée.
a) Dans une entreprise agricole employant 5 ouvriers, quelles sont les
probabilités respectives pour que :
- aucun ouvrier ne soit atteint par la maladie de Popo
- au maximum 4 ouvriers soient attendus par cette maladie
- au moins un ouvrier soit atteint par cette maladie
b) Dans une entreprise agricole employant 40 ouvriers, quelle est la probabilité
pour que moins de la moitié des ouvriers soit atteints par la maladie de Popo.
C) Les ouvriers de la région considérée sont pour 1/3 des femmes et 2/3 des
hommes :
- sachant que 48% de ces femmes sont atteintes par la maladie de Popo,
quelle est la proportion des ouvriers agricoles hommes atteints par
Popo ?
- lorsque le médecin est appelé dans une entreprise agricole pour
examiner un ouvrier atteint de la maladie de Popo, quelle est la
probabilité pour qu’il ait { examiner une femme.
Solution
Solution
N
Etant donnée que n 30, n , np 5 et nq 5 ; on doit donc faire
20
l’approximation de la loi hypergéométrique par la loi normale de paramètre =
21.6 et ² = 6.0988.
Ainsi :
P(X 20) P(Y 19.5)
= P(Z -0.85)
= 0.8023
Solution
a) = 10
P(X 15) = P(X = 16) + P(X = 17) + P(X = 18) + …
= 0.0217 + 0.0128 + 0.0071 + …
= 0.0488
b) = = 10 et ² = = 10
P(X 15) P(Y 15.5)
= P (Z 1.74)
= 0.0409
La loi de khi-deux est importante, non pas comme les lois précédemment
étudiées, mais en raison du rôle qu’elle joue dans les tests statistiques ;
notamment dans le test de l’ajustement d’une loi théorique { une distribution
observée et dans les tests d’hypothèses sur l’indépendance de deux variables
aléatoires.
Cette variable aléatoire varie entre 0 et .
Propriétés
1. 0 ²
2. E(²) = k
3. Var (²) = 2k
4. 1 = (1-2t)-k/2
106
Table de Khi-carré
P ( k x) p et P ( k x)
2 2
P α
𝑥
x 2
k , 2
k, p 𝑥
Ici, p est donnée ; x est l’inconnu et ² est donné dans la table. P est le niveau
de confiance. Dans d’autres tables, c’est plutôt α=1-p, seuil de signification qui
est donné. Dans ce cas, c’est la valeur de correspondant à P( =α qui
est donné directement.
Exemple
Exercice 1
Soit une v.a distribuée suivant un ² avec 10 degrés de liberté. Evaluer P(²
12.5)
Solution
Etant donné que la somme de toutes les probabilités est égale à 1, si P(² x) =
p, alors P(² x) = 1-p.
Nous aurons donc : k2; p 10
2
; p 12.50
et P( 10
2
; 12.5) 1 P( 10; p 12.5) 0.25
2
Solution
Exercice 3
Solution
Table de t de student
La table que nous avons utilisé pour évaluer les probabilités lorsque la v.a suit la
loi de student nous donne la probabilité que t soit supérieur à une valeur
spécifiée tk,α ; soit :
P(tk x) = α où x = tk,α est la valeur tk,α donnée dans la table. D’autres ables
donnent P(tk≤x)=p
0 ti t
Exemple
Pour t20 ; 0.99 = 2.53, cela signifie que P(t20 2.53) = 0.99
Donc t20 ;0.01 = 2.53 signifie que P(t20≥2.53)=0.01
Souvent, les tables ne donnent pas toutes les possibilités et sont parfois
muettes. Pour ce fait, on applique le principe de symétrie :
tk,p = -tk,α
Exemple
T15,0.95= -t15,0.95
= -1.75
Exercice 1
Soit une v.a continue distribuée suivant la loi de student avec 12 degrés de
liberté. Déterminer, { l’aide de la table, P(t 2.68).
Solution
Solution
a) P (t t1) = 0.01
t1 = 2.60
t1 = 1.34
t1 = 2.95
t1 = 2.13
k 22 (2k 2 2k1 4)
Var ( F )
k12 (k 2 2) 2 (k 2 4)
Table de Fisher
P α
0 Fi F
Exercice 1
Solution
On doit trouver dans la table la valeur de α telle que Fα ;20 ;5 = 4.56. On trouve
cette valeur dans la table où α = 0.05.
Exercice 2
Solution
Exercice 3
Solution
Puisque nous avons directement cette table, nous allons utiliser la formule ci-
dessus en utilisant la table de F.
Ainsi F0.05 ; 10 ;6 = 4.06
Exercice 4
Solution
Puisque nous n’avons pas directement cette table, nous allons utiliser la
transformation ci-dessus en utilisant la table de F
1 1
Ainsi F0.95;6;10 0.246
F0.05;10;6 4.06
rapport devient :
12
F
22
Une distribution uniforme est une distribution telle que f(x) est constante
dans un intervalle [a,b] et 0 partout ailleurs. En d’autres termes, lorsque la
probabilité est proportionnelle { la longueur de l’intervalle, la variable aléatoire
est definie de façon uniforme avec comme densité de probabilité :
{
Solution
{
avec
=>* +
b) P(20≤x≤24)=∫
=>* +
La loi exponentielle peut être utilisée pour décrire des variables aléatoires
telles que le temps entre les arrivées à une station service, le temps nécessaire
pour charger un camion, la distance entre les défauts majeurs sur une route,
etc. La fonction de densité exponentielle s’écrit :
pour
avec = moyenne.
Comme exemple de la loi exponentielle, supposons que le temps de
chargement d’un camion sur les docks suive une telle distribution. Si le temps
moyen de chargement d’un camion est de 15 minutes ( =15), la fonction de
densité appropriée s’écrit :
Dans les exemples sur les files d’attente, la distribution exponentielle est
souvent utilisée pour le temps de service.
Comme pour toute loi continue, l’aire sous la courbe dans un intervalle
donné fourni la probabilité que la variable aléatoire prenne une valeur
appartenant { cet intervalle. Dans l’exemple des docks, la probabilité qu’un
camion soit chargé en au plus 6 minutes (X≤6) est définie par l’aire sous la
courbe, représentée par la figure 3.3 comprise entre X=0 et X=6. De même, la
probabilité qu’un camion soit chargé en au plus 18 minutes (X≤18) et définie par
l’aire sous la courbe compris entre X=0 et X=18. Notez aussi que la probabilité
que le temps de chargement du camion soit compris entre 6 et 18 minutes
(6≤X≤18) est définie par l’aire sous la courbe comprise entre X = 6 et X = 18.
114
Figure 3.3 Loi exponentielle pour l’exemple des docks de Schips.
f(x)
0,07
0,05
0,03
0,01
0 5 15 25 35 45 X
Temps de chargement
f(x)
0,07
0,06 P(x≤6)=0,3297
0,05
0,04
0,03
0,02
0,01
X
0 5 10 15 20 25 30 35 40 45
Temps de chargement
116
117
Chapitre 4. Echantillonnage
Chapitre Quatrième
chantillonage
Exercice 1.
Solution
Echantillon x Echantillon x
2-1 1.5 1-3 2
2-0 1 1-4 2.5
2-3 2.5 0-3 1.5
2-4 3 0-4 2
1-0 0.5 3-4 3.5
∑
c)
∑ ∑
( )
√
∑
d) 1°. ̅
̅
∑
2°. ̅
̅
121
Exemple 2.
Solution
a) = 110.
( )
b) = 110.
Remarque
Exercice 3
La taille des 72 élèves d’une école de Kisangani est une v.a obéissant { une loi
normale des moyenne 160 cm et d’écart-type 10cm. Si on prélève sans remise
122
un échantillon de 10 élèves de l’école, quelle est la probabilité que la taille
moyenne dans cet échantillon soit supérieure à 170cm.
Solution
Exercice 4
Solution
Soit X une v.a représentant la durée de vie de grille-pain. On est dans une
situation où on peut considérer que la population a une taille quasi-infinie ;
donc le prélèvement de l’échantillon se fait avec remise.
̅ et ̅ √
N(150 ;1.44)
NB : Il est donc pratiquement certain que la durée de vie moyenne des grille-
pains dans un échantillon de taille 100 sera supérieur à 144 mois. Il ne faut
pas confondre avec la probabilité que la durée de vie d’un grille-pain soit
supérieur à 144 mois ; soit p(X>144). Dans ce contexte, on ne peut évaluer
cette dernière probabilité puis que la distribution de probabilité de X
n’est pas connue.
123
Exercice 5
Le PDG de l’imprimerie GALIMAGE fait une étude sur le revenu annuel de ses
200 employés. Il sait que le revenu annuel moyen est de 24000 Francs avec un
écart-type de 4200 Francs.
S’il prélève un échantillon de 50 employés, quelle est la probabilité que le
salaire moyen dans cet échantillon soit entre 23500 et 24 500 Francs.
Solution
̅ √
NB :
- Si n≥ 30, nπ≥5 et n(1-π)≥5, la distribution de l’échantillonnage des
proportions devient proche de la distribution normale.
- Si n<30, on remplace dans la formule n par n-1.
- Lorsque on approxime une v.a discrète par une v.a normale, la
correction de la continuité, dans ce cas, devient p±0.5/n.
- Si XN(μ,δ2), alors ( ̅ ̅ ).
124
Exercice 1
Lors de dernières élections estudiantines, 42% des électeurs du comité EST ont
voté pour le Parti OUEST. Si on prélève avec remise un échantillon de 100
électeurs du comité EST, quelle est la probabilité que, dans cet échantillon, on
trouve plus de 40 et moins de 44% d’électeurs ayant voté pour le Parti OUEST.
Solution
Soit π la proportion des électeurs du comité EST ayant voté pour le Parti
OUEST : π=0.42.
On a n=100, nπ=42 et n(1-π)=58.
̅ et ̅ √
Exemple 2
Solution
̅ et ̅ √ √
On cherche : P( ≥ ) =P( ≥0.5556)
= P(Z )
= P(Z )
= P(Z>-0.85)
= 0.8023
Exercice 3
Chacune des personnes d’un groupe de 500 individus lance 120 fois une pièce
de monnaie parfaitement équilibrée. Combien de personne signaleront que :
a) Le nombre de faces qu’elles obtiennent se trouve compris entre 40 et
60% ?
b) 5/8 ou plus de leurs jets correspondent à des faces.
Solution
Autres méthodes
On cherche P(0.4≤P≤0.6) =( )
= P(-2.28<Z<2.28)
= 0.9774
b) et
P(P≥5/8)=P(P≥0.6250)=P(Z)>
=P(-2.28<Z<2.28)
=0.004
126
D’où, le nombre de personnes qui signaleront que 5/8 au plus de leurs jets
correspondent à des faces est :
0.004(500)=2 personnes.
Exercice 4
Solution
f(
0.00 0.36
0.50 0.48
1.00 0.16
1.00
c) E( )=0.40
d) Var( )=0.12
e) Π=2/5=0.40
Exercice 5
E 1 2 4 6
E
1 (1,1) (1,2) (1,4) (1,6)
2 (2,1) (2,2) (2,4) (2,6)
4 (4,1) (4,2) (4,4) (4,6)
6 (6,1) (6,2) (6,4) (6,6)
2°.
Echantillon ̅ Echantillon ̅ Echantillon ̅ Echantillon ̅
1-1 1 2-1 0.5 4-1 0.5 6-1 0.5
1-2 0.5 2-2 0 4-2 0 6-2 0
1-4 0.5 2-4 0 4-4 0 6-4 0
1-6 0.5 2-6 0 4-6 0 6-6 0
3°.
4°.
δF=0.306
c) 1°.
E 1 2 4 6
E
1 - (1,2) (1,4) (1,6
2 - - (2,4) (2,6)
4 - - - (4,6)
6 - - - -
2°.
Echantillon f Echantillon f
1–2 0.5 2–4 0
1–4 0.5 2–6 0
1–6 0.5 4–6 0
3°. F = 0.25
4°. ²F = 0.063
F = 0.251
128
12 22
et X 1 X 2 X2 1 X2 2 si le tirage est non-exhaustif (ou avec remise)
n1 n2
12 N1 n1 22 N 2 n2
X 1 X 2 X2 1 X2 2 si le tirage est exhaustif.
n1 N1 n n2 N 2 1
1 (1 1 ) N1 n1 2 (1 2 ) N 2 n2
P1 P2 P21 P22 si le tirage est
n1 N1 1 n2 N2 1
exhaustif.
129
Lorsqu’on considère la distribution d’échantillonnage des sommes de
statistiques, les équations (1) deviennent :
S1 S 2 S1 S 2 (4)
et S1 S 2 S21 S22
X 1X 2
X 1 X 2 1 2
et X 1 X 2 X2 1 X2 2
Et P1 P 2 P21 P22
Exercice 1
Solution
Exercice 2
Les ampoules d’un fabriquant A ont une durée de vie moyenne de 1400 heures
avec un écart-type de 200 heures, et celle d’un fabriquant B ont une durée de
130
vie moyenne de 1200 heures avec un écart-type de 200 heures. Si l’on teste des
échantillons de 125 ampoules pour chaque marque, quelle est la probabilité que
la marque d’ampoule A ait une durée de vie moyenne qui soit d’au moins :
a) 160 heures supérieures { celle de la marque d’ampoules B
b) 250 heures supérieures à celle de la marque d’ampoules B
Solution
X AX B
200 h
X AX B
20 h
-2 0 Z
a) On cherche
160 200
P( X A X B ) 160) P(Z )
20
= P(Z -2)
= 0.5 + P(0 Z 2)
= 0.9772
b) On cherche
250 200
P( X A X B ) 250) P( Z )
20
= P(Z 2.5)
= 0.5 – P(0 Z 2.5)
= 0.0062
0 2,5 Z
Exercice 3
A et B jouent tous deux à pile au face en jetant chacun 50 fois une pièce de
monnaie bien équilibrée. A gagne au jeu s’il réussit { avoir 5 faces ou davantage
de plus que B, sinon c’est B qui gagne. Déterminer les chances pour que A
gagne lors d’un jeu particulier.
Solution
On a π1=0.5, π2=0.5,
131
P P P P 0.5 0.5 0
1 2 1 2
P P 0.10
1 2
5
On cherche P( ( P A P B ) ) P( ( P A P B ) 0.1)
50
0.5
P (Y 0.1 )
n
0.09 0
P(Z )
0.10
= P(Z 0.9)
= 0.1841 0 0,9 Z
(x
i 1
i x )²
n 1
suit la loi du ² avec n degrés de liberté. A toute somme de carrés de variables
aléatoires est associé un nombre de degrés de liberté. Ainsi,
n
( xi )²
i 1
a n degrés de liberté puisqu’elle consiste en n déviations indépendantes.
n
Par contre (x
i 1
i x)²
132
a seulement (n-1) degrés de liberté ; les données devant être utilisées d’abord
pour évaluer x , qui sert d’estimation { , il ne reste plus que n-1 déviations
indépendantes. En effet, à partir de x et des n-1 déviations indépendantes nous
pouvons reconstituer la nième déviation.
Ainsi, nous perdons un degré de liberté.
Pour s’assurer que (xi- x ) soit centrée réduite, comme l’exige un ², nous
devons la diviser par , alors
(x
2
n x1 x x) 2
2
i
i 1 2
n
Par contre (x
i 1
i x)² (n 1) S ², donc
(n 1) S 2
2
2
et cette quantité est distribuée suivant la loi du khi-deux avec (n-1) degrés de
liberté. On peut illustrer cela par une application de cette distribution.
Exercice
Soit S², la variance d’un échantillon aléatoire de taille n = 16, tiré d’une
population normale de variance ² = 20. Evaluer la probabilité suivante :
P(9.68 S² 33.33).
Solution
2
(16 1)(9.68)
Ainsi, à S² = 9.68 correspond 12 7.26
20
(16.1)(33.33)
à S² = 33.33 correspond 22 25
20
Donc, P (9.68 S² 33.33) P(7.26 ² 25)
Si nous disons que la longueur d’une latte est comprise entre 4.5 Cm et
5.5 Cm pendant que sa vraie longueur est de 5 Cm, nous avons commis une
erreur de 0.5 cm. L’erreur peut être positive ou négative.
En général, nous pouvons écrire : X Z x X
Sachant que X , on peut écrire : x Z c
n n
Puisque Zc peut prendre 2 valeurs, l’une négative, l’autre positive, nous
écrirons :
X Zc
n
En considérant l’erreur maximum que nous pouvons commettre (E), le second
terme de notre équation peut s’écrire E Z c
n
En élevant cette dernière expression au carré et en résolvant pour n, nous
obtenons :
2
Z c2 2 Z
n c
E2 E
Si les données sont sous forme des proportions, la taille de l’échantillon
s’obtient par la formule :
Z c2 (1 )
n
E2
Exercice 1
Solution
Exercice 2
Solution
̅ ̅
( ) ( )
̅ ̅
100
Puisque X et X , on aura 0,95
n n
Exercice 3
Chapitre 5 Estimation
Chapitre Cinquième
stimation
5.1. Estimateur
D’autres possibilités sont offertes pour faire une telle estimation : ainsi,
on pourrait utiliser la médiane de l’échantillon pour estimer le revenu des
ménages congolais. Il faudrait donc déterminer quelle estimation s’avère la
meilleure.
n
et si n , alors Var( X ) 0. de même P est un estimateur convergent
(I )
de car Var( P ) = 0 lorsque n
et Var ( P )
n
- Un estimateur sans biais ̂ d’un paramètre inconnu est efficace si la
variance de ̂ est inférieur à la variance de tout autre estimateur sans biais de
. Choisir un estimateur efficace c’est donc choisir le meilleur estimateur,
c'est-à-dire celui qui fournir des estimés les plus près possible de la valeur
réelle du paramètre.
Par exemple, la variable aléatoire X représentant les moyennes
échantillonnales est un estimateur efficace de comparativement à la v.a
représentant les médianes échantillonnales.
1°/ tk,p signifie « suit la loi t de student avec k degré de liberté » ; k = n-1
141
Exercices
Exercice 1.
Exercice 2
Exercice 3
Exercice 4
X
Xi ; alors
n
∑
( ) (∑ ) ∑
Or E(Xi) = u
Alors = ∑
est donc un estimateur sans biais de μ.
√ √
Comme n ≥ 30 ; alors δ² ou ˆ x2 = S2
950±1.96√
Ex.5.
a) n = 50 N = 200 =75 10 1-α=0.95
δ² est inconnue et n≥30
√ n≥30 ̅
75±1.96√ ( )
On a donc [72.6 ; 77.4]
D’ μ [72.6 ; 77.4]
75±Zα √ ( )
On a 23Zα = 1
Zα = 0.81
α = 0.209
α
1- α %
X N(n<30)
L’ e de confiance a la forme :
[39630.06 ; 44369.94]
L’ :
√
[ √ √ ] avec
[ √ ( ) √ ( )]
Exercices
Exercice 1
Exercice 2
Un échantillon de 100 votants choisis au hasard parmi tous les votants d’une
circonscription donnée a montrée que 55% d’entre eux étaient favorables { un
certain candidat. Déterminer les limites de confiance (a) à 95% ; (b) à 99,73% de
la proportion de tous les votants favorables à ce candidat.
Solution
√ ( )
√ ( )
[0.270 ; 0.464]
D’ π [ ] au seuil de confiance de 90%.
Exercice 2
146
a) n=100 =0.55 1-α=0.95 Zα = 1.96
√ ( )
On a donc :
[0.45 ; 0.65]
b) 1-α=0.9973 Zα = 3
On a donc
[0.40 ; 0.70]
Ainsi :
- L’intervalle de confiance de la différence de deux moyennes de
population normales indépendantes de variances connues où n1≥30,
n2≥30 est donnée par :
̂ ̂ avec
( ) √ √
Si en plus n1 = n2 , alors :
avec
( ) √
le degré de liberté
est
Si les variances inconnues sont supposées inégales (n1 = n2 30), le degré de
liberté est obtenu de la manière suivante :
̂ ̂
̂ ̂
⁄ ⁄
N.B. : Si le tirage est sans remise, on doit multiplier la variance par le facteur de
correction.
( )
Exercices
Exercice 1
Exercice 2
148
Sur un échantillon de 400 adultes et 600 adolescents ayant regardé un certain
programme de télévision, 100 adultes et 300 adolescents l’ont apprécié.
Calculer les limites de confiance.
a) à 95%
b) à 99%
de la différence des fréquences des adultes et des adolescents qui ont
apprécié le programme.
Solutions
Ex.1. n1 = 150
n2 = 200
a) 1 - α = 0.5 Zα =1.96
L’intervalle cherché a la forme :
( ) √
b) 1 - α = 0.99 Zα =2.58
D’ [ ] au de confiance de 99%
Ex.2. n1 = 400 ̅
n2 = 600 .
( ) √ √
a) 1 - α = 0.95 Zα =1.95
On a donc 0.25±0.08
D’ π1 – μ2 [ ] au de confiance de 99%
* √ √ + si δ² est inconnue
Exercice
Solution
n<30 et inconnue
180000±4.47√
√ √ pour l’écart-type
L
L
pour la variance
Exercice 1
Solution
124.3220≤σ≤354.1433
√ √
11.15≤σ≤18.82
151
Exercice 2
Solution
ests d’hypothèse
Supposons par exemple que l’on observe qu’un jeune homme qui joue
aux dés gagne presqu’{ tous les coups en pariant que la somme de deux dés
lancés sera 10. Le grand nombre de victoires qu’il remporte étonne et cela
amène { formuler l’hypothèse que les dés sont truqués. Pour confirmer ou
infirmer cette hypothèse, on confisque les deux dés et on vérifie l’hypothèse en
effectuant l’expérience consistant { lancer les deux dés une centaine de fois.
Puisque la probabilité d’obtenir une somme égale { 10 avec deux dés honnêtes
est 3/36, l’espérance mathématique du nombre 10 obtenu en 100 lancers est
8,33. Si on obtient 8 ou 10 ou 12 fois la somme 10, l’hypothèse affirmant que les
dés sont truqués devrait être rejetée. Si par contre on obtient 78 fois la somme
10, alors il serait certes justifié d’accuser le jeune homme d’utiliser des dés
truqués. Ce qu’on fait lorsque, par une expérience quelconque, on arrive à
confirmer ou { infirmer une hypothèse s’appelle un « test d’hypothèse ».
D’une part, il y a l’hypothèse nulle que l’on note H0. C’est l’hypothèse qui
sera rejetée uniquement s’il y a suffisamment d’évidence contre elle. C’est
l’hypothèse qui n’amène pas de changement, qui n’amène pas d’action {
entreprendre. C’est l’hypothèse du statu quo. C’est l’hypothèse prudente.
D’autre part, il y l’hypothèse alternative ou contre-hypothèse que l’on note H1.
C’est l’hypothèse qui sera accepté si H0 est rejetée. C’est l’hypothèse qui amène
un changement, qui implique généralement une action à entreprendre.
Etant donné que notre décision est basée sur une information partielle,
un échantillon, il est facile de concevoir qu’elle comporte un risque d’erreur.
Ceci nous amène { définir deux types d’erreurs possibles lorsque nous portons
un jugement sur l’hypothèse H0.
Ces erreurs sont :
- Erreur de première espèce (α)
- Erreur de deuxième espèce (β)
Situations
H0 vraie H1 vraie
Décisions Accepter H0 Bonne décision Erreur de deuxième
espèce β
Rejeter H0 Erreur de première Bonne décision
espèce α
6.3.3. Réduction de α et β
n
² inconnue X u ̅ ̅ ̅
Tn 1
et X 2
S
N(n30) ou
n 1
̅
² inconnue Approximation ̅ ̅ ̅
et n 30 X u ou
N (0,1)
̅
n
Exercices
Exercice .1.
La compagnie de pneus MICHELIN prétend que ses pneus ont une durée
de vie moyenne de 42.000 Km. En prélevant un échantillon de 30 pneus, on
trouve une durée de vie moyenne de 39.480 Km. En supposant que la durée de
vie de ces pneus obéit { une loi normale d’écart-type 4500 Km, peut-on dire
que l’affirmation de la compagnie est exagérée au niveau de signification =
0.05 ?
Exercice 2.
Exercice 3.
Exercice 4.
Exercice 5.
Solutions
Ex.1.
(2) H0 : = 42000
H1 : 42000
158
(3) = 0.05
X u
(4) X N ( , ²), alors N (0,1)
n
(5)
0.05
42000 X
0 Z
-Z
(-1.645)
39480 42000
(6) Z ( X ) 3.07
821.58
(7) Rejeter H0, car -3.07 -1.645. On peut donc conclure que l’affirmation de la
compagnie est exagérée.
Ex. 2.
On a = 2 = 0.2 n = 100 X 2 .3
(2) H0 : = 2
H1 : 2
(3) = 0.10
X u X 2
(4) Z
2 0.02
n
0.05
0.05
(5)
2 X
0 Z
-Z -Z
(-1.645) (-1.645)
2.3 2
(6) Z ( X ) 15
0.02
(7) Rejeter H0, car 15 1.645. On peut donc affirmer que la masse moyenne des
poulets n’est pas 2 Kg.
159
Ex.3.
-t T9
(-1.83)
1780 1800
(6) T9( X ) 3.00
6.6667
(7) Rejeter H0, car -3.00 -1.83. D’où le fabricant a exagéré dans son
affirmation.
Ex.4.
(4) Z X 105
0.5333
Z
0 Z
(5) (1.645)
(6) Z ( X ) 9.38
(7) Rejeter H0, car 9.43 1.645. On conclut donc que la dépense hebdomadaire
moyenne pour se nourrir a augmenté.
160
Ex. 5
(a)
(1) X : poids d’un nouveau congélateur
: poids moyen de nouveaux congélateurs
On a = 260 n = 36 X 240 = 43
(2) H0 : = 260
H1 : 260
(3) = 0.05
(4) Z X 260
7.17 0.05
(5)
260 X
Z
-Z 0
(-1.645)
432
aZ
36
= 260 + (-1.645) (7.17)
= 248.20
= P (Z 1.14)
= 0.1271 0.05
= 0.13 Région de rejet Région d’acceptation
(erreur )
Illustration
248.2 260
Exercices
Exercice 1.
Le ministère des transports affirme que 15% des véhicules circulant sur nos
routes ne rencontrent pas les normes de sécurité du code de la route. La police
procède alors { l’inspection de 600 véhicules parmi lesquels elle en trouve 94
ne rencontrant pas les normes de sécurité du code de la route. En utilisant un
niveau de signification = 0.05, peut-on accepter l’affirmation du ministère des
transports ? A quel intervalle de confiance appartient π
Exercice 2.
Solutions
Ex.1.
a) 555
(1) : la proportion des véhicules circulant sur nos routes et ne rencontrent pas
les normes de sécurité du code de la route.
On a : = 0.15 n = 600 P 0.1567
162
(2) H0 : = 0.15
H1 : 0.15
(3) = 0.05
P 0.15 P 0.15
(4) Z
0.1567(0.8433) 0.0148
600
(5)
0.025 0.025
Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) Z( P) 0.46
(7) Accepter H0 car -1.96 0.46 1.96. Donc l’affirmation du ministère des
transports peut être acceptée.
b) L’intervalle de confiance de π est 0.1567±1.96√ . Ainsi,
π [0.1277 ;0.1857].
x.2.
(a)
(2) H0 : = 24000
H1 : 24000
(3) = 0.05
X 24000
(4) Z
400
(5)
0.025 0.025
Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) Z( X ) 1
163
(7) Accepter H0 car -1.96 -1 1.96. D’où l’affirmation du Gouverneur Yoanis est
validée.
(b)
D’où = 0.2946, c’est la probabilité d’accepter que la moyenne est 24000 alors
qu’elle est en réalité 23000.
Pour ce qui est de la proportion, il n’y a qu’un seul cas (n1 et n2≥30) :
- Zc= ̅ ̅ ̅ ̅
√
Exercices
Exercice 1.
La société LENGSRAM affirme que la durée de vie moyenne de ses ampoules
est de 400 heures supérieures { celle de la compagnie DEF. On sait que l’écart-
type de la durée de vie des ampoules LENGSRAM est de 140 heures et que celui
des ampoules DEF est de 180 heures. On prélève un échantillon de 50 ampoules
LENGESRAM et on y trouve une durée de vie moyenne de 1750 heures. De
même, on prélève un échantillon de 40 ampoules DEF et on y trouve une durée
de vie moyenne de 1320 heures. Au niveau de signification = 0.05, peut-on
accepter l’affirmation de la société LENGSRAM ?
Exercice 2.
Un politicien affirme que, dans la fonction publique, le salaire moyen des
femmes est identique à celui des hommes. Agnès veut confondre ce politicien
car elle pense que le salaire moyen des femmes dans la fonction publique est
inférieur à celui des hommes. Elle prélève donc un échantillon de 35 femmes
travaillant dans la fonction publique et elle trouve un salaire mensuel moyen de
23000 FB avec un écart-type échantillonnal de 4200 FB. Elle prélève également
un échantillon de 45 hommes, travaillant dans la fonction publique et elle y
trouve un salaire mensuel moyen de 25800 FB avec un écart-type échantillonal
de 3900 FB. Au niveau de signification = 0.05. Agnès peut-il confondre ce
politicien ?
Exercice 3.
Un psychologue affirme que la proportion des mariages qui se terminent par un
divorce en moins de cinq ans est de 10% supérieur en milieu urbain qu’en milieu
rural. Un échantillon de 50 mariages de personnes vivant en milieu urbain
révèle que 28 se terminent par un divorce en moins de cinq ans. Un échantillon
de 75 mariages de personnes vivant en milieu rural révèle que 35 se terminent
par un divorce en moins de cinq ans. Au niveau de signification = 0.05, peut-
on accepter l’affirmation de ce psychologue ?
165
Solutions
Exercice 1.
(1) Soit X1 : durée de vie des ampoules LENGSRAM
1 : durée de vie moyenne des ampoules LENGSRAM
X2 : durée de vie des ampoules DEF
2 : durée de vie moyenne des ampoules DEF
On a
1 = 140 2 = 180 n1 = 50 X 1750
n2 = 40 1320
1
X2
0.025 0.025
Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) Z ( X 1 X 2 ) 0.87
Exercice 2.
(1)
X1 : salaire mensuel d’une femme travaillant dans la fonction publique
1 : salaire mensuel moyen des femmes travaillant dans la fonction publique
X2 : salaire mensuel d’un homme travaillant dans la fonction publique
2 : salaire mensuel moyen des hommes travaillant dans la fonction publique
on a : n1 = 35 = 23000 S1 = 4200
n2 = 45 = 25800 S2 = 3900
(2) H0 : μ1-μ2=0
H1 : μ1-μ2<0
(3) α = 0.05
166
̅
(4)
(5)
(-1.645)
0
Z
(6) Z ( X 1 X 2 ) 3.05
(7) Résister H0, car -3.05<-1.645. D’où Agnès peut confondre ce politicien, car le
salaire des termes est inférieur à celui des hommes.
Exercice 3.
(3) α = 0.05
(4)
√
(5)
0.025 0.025
Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) =-0.08
Dans la section 3.3.5, nous avons dit que l’hypothèse que 1 2 (les
2 2
̂
deux populations ont même variance), le rapport ̂ peut être utilisé pour
éprouver l’hypothèse de l’égalité de deux variances lors des tests
d’hypothèses. Ordinairement, on place la plus grande variance au numérateur.
L’hypothèse nulle sera H 0 : 1 2 . Lorsque la valeur de F calculée se situe
2 2
̂ =200 ̂ =250
Solution
0.10 / 2 0.05
k1 9 et k2 7
H 0 : 12 22
H1 : 12 22
Au seuil de signification de 10%, les valeurs critiques de F sont :
- limite supérieure de F est F0.05 ; 9,7 = 3.68
1 1
- limite inférieure de F est 0.304
F0.05;7;9 3.29
168
40000
̂
Le F calculé est ̂
0.64
62500
(en mettant la plus grande variance au numérateur, on trouve Fe = 1.56)
c’est-à-dire :
X’ X’’ X’’’
X11 X21 X31
X12 X22 X32
: : :
: : :
X1k X2k X3k Total
(Xi) X1 X2 X3 X1+X2+X3=B
(Xi)² X 12 X 22 X 32
Sachant que k est égal au nombre d’échantillon et nT est égal au nombre total
de résultats de tous les échantillons :
̂ entre =
̂ intérieure =
Par conséquent :
̂
̂
Exercice 1 :
Solution
X1 X2 X3
22 23 22
23 20 23 k=nombre de données =3
25 24 26 X1 X2 X3
23 25 20
26 21 Total
∑X 119 92 112 323=B
(∑X)2 14161 8464 12544
n 5 4 5 14=nT
(∑X)2 /n 2832,2 2116 2508,8 7457=A
∑ (X)2 2843 2130 2530 7503=C
̂ entre =
̂ intérieur =
=0,59
(2,11)=7,21
Les calculs peuvent être simplifiés, si les chiffres sont élevés, en soustrayant à
chaque valeur de tous les échantillons un nombre arbitraire et procéder au
calcul comme précédemment.
171
En prenant le même exemple, soustrayons 25 à chaque valeur de tous les
échantillons et effectuons les calculs comme précédemment :
X1 X2 X3
-3 -2 -3
-2 -5 -2
0 -1 1
-2 0 -5
1 -4 Total
∑X -6 -8 -13 -27=B
(∑X)2 36 64 169
n 5 4 5 14=nT
(∑X)2 /n 7,2 16 33,8 57=A
∑ (X)2 18 30 55 103=C
̂ entre =
̂ intérieur =
=0,59
Exercice 2.
Calculs de F
- A-B2/nT=166803.8-166432=371.8
- C-A=167532.32-166803.8=728.52
- K-1=5-1=4
- nT-k=26-5=21
on aura
̂ entre =
̂ intérieur =
Par conséquent,
=2.68
F0.05(4 ;21)=2.84
Fc<FT, on accepte H0.
Test de SCHEFFE
H0 : μ1 = μ2 = μ3… μk ; et
H1 : μ1 ≠ μ2 ≠ μ3… μk.
1. Calculer S=√ ̂
X1 X2 X3 X4
0 2 4 6
1 3 5 7
1 3 5 7
2 4 6 8
2 4 6 8
On trouve que :
H0 : μ1 = μ2= μ3 = μ4 est rejetée au seuil de signification de 0.05, sachant que
A=452.8 et C=464.
̂ intérieur =
F0.05(3 ; 16)=3,24
√ ⁄ √ √ =2,13
O E (O – E) (O – E)2 (O – E)2/E
26 25 1 1 0.04
51 40 11 121 3.03
23 35 -12 144 4.11
9.21
175
Exemple 2.
Chiffre 0 1 2 3 4 5 6 7 8 9
Fréquences 28 29 33 31 26 35 32 30 31 25
Peut-on conclure que les chiffres sont distribués dans un nombre égal
dans la table.
Solution
Si les chiffres étaient distribués en nombre égal, la fréquence de
chaque chiffre serait de 30 (300/10). C’est ça la fréquence théorique.
O E (O – E) (O – E)2 (O – E)2/E
28 30 -2 4 0.133
29 30 -1 1 0.033
33 30 3 9 0.300
31 30 1 1 0.033
26 30 -4 16 0.533
35 30 5 25 0.833
32 30 2 4 0.133
30 30 0 0 0.00
31 30 1 1 0.033
25 30 -5 25 0.833
N.B. Dans le cadre de l’ajustement d’une loi théorique { une loi de probabilité
quelconque, la fréquence théorique et observée d’une classe quelconque
doivent être d’au moins 5. Ainsi, si quelques classes ont des fréquences
inférieures à 5, on regroupe ces classes avec les précédentes ou les suivantes ;
afin d’en avoir au-moins 5. Dans ce cas, le degré de liberté sera calculé en
considérant le nombre de classe (n) obtenu après regroupement.
Exercice 1
xi 0 1 2 3 4 5 6 Total
Fréquences 29 37 17 7 3 2 1 96
Solution
xi 0 1 2 3 4 5 6 Total
P(X=xi) 0.2621 0.3932 0.2458 0.0819 0.0154 0.0015 0.0001 1
0 29 25.16 0.586
1 37 37.75 0.015
2 17 23.60 1.846
3 ou plus 13 9.49 1.298
96 96 c2 = 3.745
Comme T2 = 7.81, on accepte l’hypothèse nulle ; parce que 3.745 7.81.
D’où l’ajustement de ces données par une loi binomiale de paramètre p = 0.2
semble satisfaisant.
Exercice 2
Solution
(1) Les données du problème peuvent être présentées sous forme d’un
tableau.
xi Fréquences
observés
0 6
1 34
2 56
3 46
4 18
Total 160
xi 0 1 2 3 4 Total
P(X=xi) 0.0625 0.2500 0.3750 0.2500 0.0625 1
xi O E (O – E)2/E
0 6 10 1.60
1 34 40 0.90
2 56 60 0.27
3 46 40 0.90
4 18 10 6.40
Comme T2 = 7.78, on rejette l’hypothèse nulle ; parce que 10.07 7.78.
D’où on ne peut affirmer que la probabilité de naissance d’un garçon et celle
d’une fille sont identiques.
Exercice 3
Soit les données suivantes sur le nombre d’accidents de travail en une journée
pour une période de 100 jours.
Solution
La loi de poisson n’a besoin que d’un seul paramètre, { savoir . Le calcul de ce
paramètre donne = ( xi ni)/n = 200/100 = 2. Ceci permet d’avoir la distribution
de probabilité suivante :
xi 0 1 2 3 4 5 6 et Total
plus
P(X=xi) 0.1353 0.2707 0.2707 0.1804 0.0902 0.0361 0.0166 1
xi 0 1 2 3 4 5 6 et plus Total
Fréquences 13.53 27.07 27.07 18.04 9.02 3.61 1.66 100
xi O E (O – E)2/E
0 13 13.53 0.02076
1 27 27.07 0.00018
2 27 27.07 0.00018
3 19 18.04 0.05108
4 9 9.02 0.00004
5 ou plus 5 5.27 0.01290
B2 f21 f22 .…
… f2j …
…. f2m L2
Bn fn1 fn2 .…
… fnj …. fnm Ln
A A1 A2 Aj Am Total des
B lignes (Li)
B1 L1
B2
L2
…… …… Li
Bi ….
……
Ln
Bn
Total des C1 C2 Cj Cm Grand
colonnes total (n)
(Ci)
Exercice 1
Le tableau ci-après montre les données obtenues pendant une épidémie de
choléra. Dans ce tableau il y a des personnes qui étaient vaccinées ; parmi
celles-ci il y a celles qui sont atteintes de choléra, d’autres non atteintes. Il y a
également des personnes non vaccinées du tout ; ici aussi, certaines personnes
ont été atteintes et d’autres non. Est-ce que la vaccination est efficace contre le
choléra ?
Personnes Personnes non Total
atteintes atteintes
Personnes vaccinées V 31 469 500
Personnes non vaccinées NV 185 1.315 1.500
Total 216 1.784 2.000
Les chiffres en encadré donnent les fréquences observées (0) ; pour trouver la
fréquence théorique de chaque cas, on multiplie les fréquences marginales de
la ligne et de la colonne, puis on divise par le grand total.
181
Personnes atteintes Personnes non atteintes Total
V 500
NV 1.500
Dans le cas qui nous concerne ; c’est un tableau de contingence 2x2 ; donc DL
=(2-1) (2-1)=1.
Au niveau de signification de 0,05, c’es-à-dire α=0.05 ; ( )=3,84.
Solution
Les calculs requis donnent :
O E O-E (O – E)2 (O – E)2/E
Comme T2 = 13.28, on rejette l’hypothèse nulle ; parce que 19.6 13.28. D’où il
y a relation entre le nombre d’accidents et l’âge du conducteur.
Exercice 3
Solution
Comme T2 = 5.99, on accepte l’hypothèse nulle ; parce que 1.63 5.99. D’où il
n’y a pas de relation entre le fait de porter des lunettes et la scolarité.
Exercice 4
B1 B2 Total
A1 40 105 145
A2 60 95 155
Total 100 200 300
Solution
Comme T2 = 3.84, on accepte l’hypothèse nulle ; parce que 3.64 3.84.
N.B. La correction de Yates est utilisée seulement quand le degré de liberté (dl)
est égal à 1 et peut être utilisée pour les tests impliquant des ajustements des
distributions.
Coefficient de contingence
Ccorrigé = c/cmaximum
Bien qu’il y ait dépendance, il y a lieu de retenir que le degré d’association est
faible.
Ccorrigé =0.19/0.816=0.23
Dans chacun des tests sur deux moyennes, les hypothèses de base sont
restrictives, entre autres, celle de l’égalité des variances inconnues. Si l’on peut
respecter cette hypothèse alors le rapport critique tel que défini au test de
l’égalité de deux variances supposées égales ne peut s’appliquer.
Toutefois, B.L. Welch (1947) a développé un rapport critique, que nous notons
t’ qui permet d’obtenir une solution approximative. Cette statistique.
185
̂ ̂
√
̂ ̂
̂ ̂
⁄ ⁄
P.S. La solution de Welch exige toutefois que les deux échantillons aient la même
taille.
Exercice
Procédé I Procédé II
126.4 125.7
122.6 129.0
124.9 130.4
123.8 126.3
121.5 122.2
127.2 127.2
125.6 124.2
123.2 123.6
126.2 129.0
Solution
3. α = 0.05
4.
̂ ̂
√
∑
̂
∑
̂
⁄ ⁄
( )
6.
√
Donc les deux procédés semblent produire des câbles dont la force de rupture
est égale.
Nous avons mentionné, lors des tests sur une moyenne que différents
échantillons d’une même population peuvent présenter des moyennes
différentes de celle de la population-mère. Il est de même pour la variance d’un
échantillon vis-à-vis de la variance de la population. On tentera donc ici de
vérifier une hypothèse sur la variabilité de la population { l’aide d’une mesure
échantillonnelle.
187
L’hypothèse nulle que l’on observe est : H0 :
Où est une valeur hypothétique comme μ0.
Le seul outil dont on peut disposer pour vérifier cette hypothèse est de
calculer la variabilité d’un échantillon aléaloire de taille n, tiré d’une population
normale, et de tenter avec un certain risque d’erreur de généraliser le résultat {
la population. Donc, la statistique S2 servira { éprouver l’hypothèse nulle.
Nous avons discuté à la section 3.36 de la distribution empirique de S 2.
Nous devons donc faire appel à la loi de 2. Les différents test sont résumés au
tableau suivant.
Exercice
Solution
5. Région critique
La valeur critique de est = 30.14
188
6. n = 20 S2 = 12500 ; alors :
a) Peut-on conclure que les deux machines sont ajustées à la même valeur
centrale ?
Par expérience, on sait que la variance de la machine 1 est 4 et celle de
la machine 2 est de 6.
b) Appliquer le test de l’égalité de deux variances.
c) Supposons que les variances de ces deux populations sont inconnues.
Comment pouvez-vous, { partir des résultats dans b) tester l’hypothèse
de l’égalité de deux moyennes.
On retient l’hypothèse que les populations sont normales.
Solution
√ √
5. Région critique :
-Zα/2 = -1.96 et Zα/2 = 1.96
189
6.
√
7. -1.96<Zc<1.96 ; nous pouvons accepter H0.
2. H0 : =
H1 : ≠
3. α=0.05
4. la statistique sur laquelle porte le test est le quotient de deux
variances empiriques. Ordinairement, on place la plus grande
variance au numérateur.
Le rapport critique est alors :
̂
̂
qui est distribué suivant la loi de Fisher avec (n2-1) et (n1-1)
degrés de liberté.
5. Raison critique
Le test étant bilatéral, on aura : F0,975 ;9 ;9=0.248 et F0.025 ;9 ;9=4.03
6.
6.
√
H0 : 1 = 2 = … = k
H1 : au moins deux j sont différents
La statistique du test est c2 = (O – E)2/ E . Cette statistique suit la loi de Khi-
deux à (n – 1) degrés de liberté. Si c2 T2, on rejette H0.
Il est { noter que, dans le calcule des valeurs théoriques, on part de l’hypothèse
que si toutes les proportions étaient identiques, alors :
p1 = p2 = … = p1 = p = (n1 + n2 + … + nk)/ (N1 + N2 + … + Nk), avec ni = nombre de
succès du groupe i, et Ni = taille de l’échantillon du groupe i.
Exercice 1
Dans l’usine U1, 75 ouvriers sur 150 sont favorables à la grève, tandis que dans
l’usine U2, 103 sur 200 sont favorables à la grève. Si { l’Usine U3, 112 sur 225 sont
favorables à la grève, peut-on dire que la proportion des ouvriers favorables à
la grève est la même dans ces usines ?
Solution
(1)Les données du problème peuvent être présentées sous forme d’un tableau
à double entrée :
U1 U2 U3 Total
Pour la grève 75 103 112 290
Contre la 75 97 113 285
grève
Total 150 200 225 575
191
5.99
U1 U2 U3 Total
Pour la grève 75.6 100.8 113.4 290
Contre la 74.4 99.2 111.6 285
grève
Total 150 200 225 575
On peut donc procéder au calcul de c2. Si cette valeur est plus grand que 5.99,
cela veut dire que l’écart entre les fréquences théoriques et observées est trop
grand pour être dû au hasard. Dans le cas contraire, on peut conclure à
l’égalité.
O E (O – E) (O – E)2 (O – E)2/E
75 75.6 -0.6 0.36 0.0048
103 100.8 2.2 4.84 0.0480
112 113.4 -1.4 1.96 0.0173
75 74.4 0.6 0.36 0.0048
97 99.2 -2.2 4.84 0.0488
113 11.6 1.4 1.96 0.0176
On accepte H0 parce que 0.1413 5.99. On peut donc conclure que dans les
trois usines, la proportion de travailleurs en faveur de la grève est la même et
peut être évaluée à 50.4 %.
192
Exercice 2
Une entreprise vient de mettre au point une nouvelle couleur pour un appareil
portable et aimerait savoir si cette couleur semble plaire { un groupe d’âges en
particulier ou si elle semble attrayante quel que soit l’âge. Les résultats de cette
étude permettraient { l’entreprise d’orienter sa publicité.
7.81
O E (O – E) (O – E)2 (O – E)2/E
104 92.5 11.5 132.25 1.423
122 111 11 121.00 1.090
68 74 -6 36.00 0.486
41 55.5 -14.5 210.25 3.788
21 32.5 -11.5 132.25 4.069
28 39 -11 121.00 3.103
32 26 6 36.00 1.385
34 19.5 14.5 210.25 10.782
Rejet H0 parce que 26.13 7.81. On peut donc conclure que la proportion de
consommateurs auxquels la couleur plaît n’est pas la même selon les différents
groupes d’âges. D’après l’évaluation de 2, le groupe d’âge 46 et plus semble
celui qui diffère le plus des autres groupes.
194
195
7.1. Ajustement
Ajuster, c’est substituer une courbe continue, régulière, simple, aussi
fidèle que possible, { un nuage de points représentatif d’une série statistique.
Si le phénomène étudié est susceptible d’un ajustement linéaire, l’équation de
la droite d’ajustement de la forme :
Y=a+bX où Y : variable dépendante ; et
X : variable indépendante.
∑ ∑ ∑ ∑
̂ (1)
∑ ∑
∑ ∑ ∑ ∑
̂
∑ ∑ (2)
a= -b
Pour simplifier les calculs dans les nombreux cas, ces coefficients peuvent être
aussi exprimés de façon suivante :
∑
∑
7.2. Corrélation
Il est en général possible d’étudier plusieurs variables sur une même
unité statistique.
Exemple :
Unité statistique Variable 1=X Variable 2=Y
Enfants d’une école Taille Poids
Année Revenue Consommation
Cadre d’une entreprise Age Salaire
∑
√[∑ ∑ ][∑ ∑ ]
r sera du signe de ∑
La corrélation est forte sur r voisin de +1 ou -1.
Si le coefficient de corrélation, r, négatif et voisin de -1, cela signifie que les
deux phénomènes peuvent être liés, mais qu’ils évoluent en sens inverse
(exemple prix et quantités vendus pour un produit).
Si r est positif et voisin de +1, cela signifie que les deux phénomènes évoluent
dans le même sens (exemple : revenu et consommation d’une année donnée).
On considère que la corrélation est significative si :
2
Conseils généraux
2
P. BORENTIN & C. RAULET : "Techniques quantitatives de gestion G2", Tome 2, Bordas,
Paris, 185, p.86.
197
d’une relation de cause { effet entre les deux phénomènes étudiés. Par
exemple, pour une période donnée, on pourrait montrer l’existence d’une
corrélation entre les ventes de boisson gazeuses et les ventes de chapeaux de
soleil. Il n’y a aucun lien de cause { effet entre les deux phénomènes, mais ces
deux types de ventes sont fortement liés à la température extérieure.
̂ et ̂
3
Il suffit pour cela de multiplier seulement le numérateur et le dénominateur par 1/N
198
a) Tracer sur le diagramme rectangulaire Or, Oc le nuage représentant les
points (Ri, Ci) et la droite obtenue en appliquant la méthode des
moindres carrés.
b) Présenter le calcul des coefficients de la droite d’ajustement
c) Calculer le coefficient de corrélation des 2 séries Ri et Ci.
Solution
I Ri (en 000Fc) Ci (en 000FC) RiCi R²
1 72 67 4824 5184 4489
2 75 72 5400 5625 5148
3 75 70 5250 5625 4900
4 76 73 5548 5776 5329
5 78 75 5850 6084 5625
6 80 75 6000 6400 5625
456 432 32872 34694 31152
a)
76
74
72
C
70
68
66
70 72 74 76 78 80 82
R
b) R = 456/6 = 76
C=432/6=72
B=40/38=1.0520
A=72-1.0520(76)=-8
L’équation de la droite d’ajustement est donc :
Ci=-8+1.0520 Ri
√[ ][ ] √
Exercice 2
Solution
X Y X² XY Y²
0.3 10 0.09 3 100
0.6 15 0.36 9 225
0.9 30 0.81 27 900
1.2 35 1.44 42 1125
1.5 25 2.25 31.5 625
1.8 30 3.24 54 900
2.1 50 4.41 105 2500
2.4 45 5.76 108 2025
10.8 240 18.36 385.5 8500
a)
̂
Exercice 3
r=0.9
̂
On trouve donc :
Y = 2.1250 + 1.5750X
X = 0.1439 + 0.5143Y
Exercice 4
Yi Xi
3 1
2 2
3 3
6 4
4 5
Solution
1. a=1.8 et n=0.6
Y = 1.8 + 0.6X
2. Sx = 1.41 ; Sy = 1.35 et SXY = 1.10
3. r = 0.5745 et R² = 0.33
201
Annexes
nnexes
202
203
AVERTISSEMENT ......................................................................................... 3
PREFACE ..................................................................................................... 5
................................................................................................................... 7
CHAPITRE I. INTRODUCTION AUX CALCULS DES PROBABILITES ..................... 7
1.1. LE CONCEPT DE PROBABILITE ............................................................................ 7
1.2. QUELQUES PROPRIETES FONDAMENTALES ......................................................... 10
1.3. REGLE DE MULTIPLICATION ET PROBABILITE CONDITIONNELLE ................................ 10
1.3.1. Probabilité conditionnelle ............................................................... 11
1.3.2. Loi de multiplication de probabilité ................................................ 13
1.4. THEOREME DE PROBABILITE TOTALE ET THEOREME DE BAYES ................................. 16
1.4.1. Théorème de probabilité totale ...................................................... 16
1.5. L’INDEPENDANCE STOCHASTIQUE .................................................................... 20
1.6. ANALYSE COMBINATOIRE ............................................................................... 23
1.6.1. Arrangement ................................................................................... 23
1.6.2. Permutation .................................................................................... 23
1.6.3. Combinaison ................................................................................... 25
1.6.4. Le binôme de newton ...................................................................... 27
1.6.5. Le triangle de Pascal ....................................................................... 28
1.6.6. Le diagramme arborescent ............................................................. 29
1.7. EXERCICES DE RECAPITULATION ....................................................................... 34
1.8. SOLUTIONS ................................................................................................. 35
CHAPITRE 2. NOTION DE VARIABLES ALEATOIRES ...................................... 37
2.1. INTRODUCTION ........................................................................................... 37
2.2. VARIABLE ALEATOIRE DISCRETE ....................................................................... 38
2.2.1. V.a discrète et fonction de probabilité ............................................ 38
2.2.2. Espérance mathématique – Variance – Moment – Coefficient
d’asymétrie et coefficient d’aplatissement ............................................... 41
2.2.2.1. Espérance mathématique (E(X)) .............................................. 41
2.2.2.2. Variance de la v.a discrète ....................................................... 41
2.2.2.4. Le mode et la médiane d’une V.a discrète .............................. 44
2.3. VARIABLE ALEATOIRE CONTINUE ...................................................................... 54
2.3.1. V.a continue et fonction de densité ................................................ 54
Fonction de densité de probabilité............................................................ 55
2.3.2. Espérance mathématique et variance ............................................ 58
2.3.2.1. Espérance mathématique........................................................ 58
2.3.2.2. Variance ................................................................................... 58
204
2.3.2.3. Le mode et la médiane de la v.a continue ............................... 59
2.3.2.4. Moment de la v.a continue ..................................................... 59
2.3.3. Exercices .......................................................................................... 60
2.4. DISTRIBUTION DE PROBABILITES JOINTES : V.A DISCRETE ....................................... 70
2.4.1. Fonction de distribution de probabilités jointes ............................. 70
2.4.2. Fonction de répartition ................................................................... 72
2.4.3. Loi de multiplication et probabilité conditionnelle ......................... 73
2.5. DISTRIBUTION DE PROBABILITE BIVARIEE : V.A CONTINUE ...................................... 74
2.5.1. Fonction de densité jointe ............................................................... 75
2.5.2. Fonction de répartition ................................................................... 75
2.6. DISTRIBUTIONS MARGINALES .......................................................................... 77
CHAPITRE 3. LES LOIS DE DISTRIBUTION STATISTIQUE ................................ 79
3.1. INTRODUCTION ........................................................................................... 79
3.2. LES MODELES DISCRETS ................................................................................. 79
3.2.1. La loi binomiale ............................................................................... 79
3.2.1.1. V.a binomiale ............................................................................... 79
3.2.1.2. Fonction de probabilité ........................................................... 79
3.2.1.3. Moyenne et Variance .............................................................. 80
3.2.2. La loi hypergéométrique ................................................................. 81
3.2.2.1. Fonction de probabilité ........................................................... 82
3.2.2.2. Moyenne et Variance .............................................................. 82
3.2.2.3. Tendance de la loi hypergéométrique vers la loi binomiale ... 84
3.2.3. La loi de poisson .............................................................................. 85
3.2.3.1. Fonction de probabilité ........................................................... 85
3.2.3.2. Moyenne et Variance .............................................................. 85
3.2.3.3. Approximation de la loi Binomiale par la loi de Poisson ......... 85
3.2.3.4. Table de la loi de Poisson ........................................................ 86
3.3. LES MODELES CONTINUS ................................................................................ 91
3.3.1. La loi normale ................................................................................. 91
3.3.1.1. Définition ................................................................................. 92
3.3.1.2. V.a normale réduite ................................................................. 93
3.3.1.3. Approximation de la loi binomiale par la loi normale ............. 99
3.3.1.4. Approximation de la loi de Hypergéométrique par la loi
normale............................................................................................... 104
3.3.1.5. Approximation de la loi Poisson par la loi normale ............... 104
3.3.2. La loi de Khi-deux (x²) .................................................................... 105
Table de Khi-carré ............................................................................... 106
3.3.3. La distribution t de student ........................................................... 107
Table de t de student .......................................................................... 108
3.3.4. Distribution F de Fisher ................................................................. 109
Table de Fisher.................................................................................... 110
3.3.5. Distribution du Quotient de deux variances ................................. 111
3.3.6. Distribution uniforme .................................................................... 112
205
3.3.7. Distribution exponentielle ............................................................. 113
Calcul des probabilités d’une loi exponentielle .................................. 113
CHAPITRE 4. ECHANTILLONNAGE ............................................................. 117
4.1. THEORIE DE L’ECHANTILLON OU THEORIE DU SONDAGE ...................................... 117
4.2. INFERENCE ET ECHANTILLONNAGE.................................................................. 117
4.3. DISTRIBUTION D’ECHANTILLONNAGE .............................................................. 119
4.4. DISTRIBUTION D’ECHANTILLONNAGE DES MOYENNES ......................................... 121
4.4. DISTRIBUTION D’ECHANTILLONNAGE DES FREQUENCES OU DES PROPORTIONS ......... 123
4.6. DISTRIBUTION D’ECHANTILLONNAGE D’UNE SOMME OU D’UNE DIFFERENCE ............ 128
4.7. LA DISTRIBUTION DE LA VARIANCE EMPIRIQUE S² .............................................. 131
4.8. DETERMINATION DE LA TAILLE DE L’ECHANTILLON ............................................. 133
CHAPITRE 5 ESTIMATION......................................................................... 137
5.1. ESTIMATEUR ............................................................................................. 137
5.2. ESTIMATION PONCTUELLE ET ESTIMATION PAR INTERVALLE.................................. 139
5.3. INTERVALLE DE CONFIANCE DES PARAMETRES D’UNE POPULATION ........................ 139
5.4. INTERVALLE DE CONFIANCE DE LA MOYENNE ................................................. 140
5.5. INTERVALLE DE CONFIANCE D’UNE PROPORTION Π ............................................. 144
Exercices .................................................................................................. 145
5.6. INTERVALLE DE CONFIANCE DES DIFFERENCES ET DES SOMMES ............................. 146
5.7. INEGALITE DE TCHEBYCHEFF ET INTERVALLE DE CONFIANCE DE LA MOYENNE ....... 148
5.8. LA DISTRIBUTION DE KHI-DEUX ET L’INTERVALLE DE CONFIANCE DE LA VARIANCE ET DE
L’ECART-TYPE................................................................................................... 150