Documente Academic
Documente Profesional
Documente Cultură
STATISTIQUE I
(STAT-D-101)
ECTS: 5 (théorie: 2, exercices: 2, travaux
personnels: 1)
Catherine Dehon
Bâtiment S - 11ème étage - bureau S11.226
Tél.: (02) 6503858 e-mail: cdehon@ulb.ac.be
Université libre de Bruxelles
Année 2009-2010
Version 2
2
AVERTISSEMENT
A savoir ....
• Buts du cours:
1. Introduction des concepts statistiques afin de
réaliser des analyses descriptives sur des vari-
ables quantitatives et/ou qualitatives.
2. Introduction des éléments du calcul de proba-
bilités et des lois de probabilité univariée discrète
pour préparer les problèmes d’inférence statis-
tique qui seront étudiés en 2ème année.
3. Mise en pratique des connaissances dans des
situations de la vie de tous les jours.
• Exercices:
Subdivision des étudiants en groupes de T.P.
Les énoncés des exercices sont disponibles sur
le site ci-avant. Quelques examens résolus des
années précédentes sont également téléchargeables
sur ce site. En outre, des permanences et
des guidances sont organisées.
• Méthode d’évaluation:
Une épreuve écrite dispensatoire est organisée
durant la session de janvier. L’examen com-
porte une partie théorique et une partie pra-
tique, sans interruption entre les deux. Aucune
note personnelle n’est autorisée. Les étudiants
peuvent (re)présenter une épreuve durant la ses-
sion de mai/juin. Dans ce cas, la note obtenue
remplace celle de l’épreuve de janvier.
Chapitre 1
INTRODUCTION A LA
STATISTIQUE
5
CHAPITRE 1. INTRODUCTION A LA STATISTIQUE 6
⇓
la statistique est l’outil de confrontation d’une
théorie scientifique à l’observation
CHAPITRE 1. INTRODUCTION A LA STATISTIQUE 7
1.1 EXEMPLES
2. Statistique Descriptive:
Tableaux-Graphiques
• Variable étudiée: taux de rentabilité.
• Variable quantitative continue.
• Variable étudiée sur 2 populations:
Info et Agro alimentaire.
• Effectif: n=100 dans chaque secteur.
Graphiques: Histogrammes
8
6 Secteur de l’informatique
effectif
4
2
0
-10 -5 0 5 10
ROI
Secteur de l’agroalimentaire
12
10
8
effectif
6
4
2
0
-10 -5 0 5 10
ROI
Histogramme du taux d’absenteisme Hist. du salaire moyen Hist. du pourcentage de Part Time
15
15
20
10
15
10
effectif
effectif
effectif
10
5
5
5
0
0
0 5 10 15 0 10000 30000 50000 0 10 20 30 40
14
14
12
12
12
10
10
10
Absent
Absent
Absent
8
8
6
6
4
4
2
• Type de variable:
- variable directe: mesurable directement (salaire)
- indicateur: non mesurable directement (santé
des entreprises belges cotées en bourse: BEL20)
- variable qualitative: caractéristiques (modalités)
non numériques (profession)
- variable dichotomique: variable qualitative
ne prenant que 2 modalités (sexe)
- variable quantitative dicrète: valeurs numériques
discrètes, isolées (nombre d’enfants)
- variable quantitative continue: valeurs numériques
sur un intervalle continu (salaire)
CHAPITRE 1. INTRODUCTION A LA STATISTIQUE 19
• Introduction
• Analyse descriptive: série statistique univariée
• Probabilité
• Analyse descriptive: série statistique bivariée
• Analyse d’une série chronologique
• Variables aléatoires et lois de probabilités discrètes
CHAPITRE 1. INTRODUCTION A LA STATISTIQUE 23
1.5 REFERENCES
STATISTIQUE DESCRIPTIVE
D’UNE SERIE UNIVARIEE
• Se divise en 2 aires:
- élaboration de tableaux et graphiques
- valeurs numériques résumant l’échantillon
(statistiques).
24
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 25
2.1 NOTATIONS
• n: Taille de l’échantillon
• p: nombre de variables
⇓
Matrice de données de dimension n × p
=⇒ Série statistique à p-dimension.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 26
Remarques
• Série univariée si p = 1:
• Série bivariée si p = 2:
• Série ordonnée:
Définition: La série ordonnée {x(1), x(2), . . . , x(n)}
est telle que : x(i) ≤ x(j) si i ≤ j, où ≤ définit
la relation d’ordre.
(i) est appelé le rang de l’observation x(i).
Exemple:
Série observée: {xi; i = 1, . . . , 6} = {2, 0, −1, 1, 4, 3}
Série ordonnée: {x(i); i = 1, . . . , 6} = {−1, 0, 1, 2, 3, 4}
Ainsi: x(1) = x3, x(3) = x4, x(6) = x5.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 27
xj nj fj
American express 36 0.18
Diners Club 2 0.01
Discover 12 0.06
Master card 50 0.25
Visa 100 0.50
200 1
PJ
Remarque: j=1 fj = 1.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 30
Représentations graphiques
Bar Chart
Ordre AlphabØtique Ordre DØcroissant
100
100
80
80
60
60
Effectif(nj)
Effectif(nj)
40
40
20
20
0
AE DC D MC VISA VISA MC AE D DC
ModalitØ ModalitØ
6.0%
1.0%
25.0%
18.0%
50.0%
xj nj fj (%) Degré
American express 36 0.18 64.8
Diners Club 2 0.01 3.6◦
Discover 12 0.06 21.6
Master card 50 0.25 90◦
Visa 100 0.50 180◦
200 1 360◦
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 32
0 0 0 0 1
0 0 1 0 0
X= 1 0 0 0 0
0 0 0 0 1
··· ··· ··· ··· ···
0 1 0 0 0
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 33
Représentations graphiques
Diagramme en barres des effectifs et des fréquences
(Bar Chart)
Diagramme en barres (effectifs) Diagramme en barres (frØquences)
0.4
40
0.3
30
Frequence(fj)
Effectif(nj)
0.2
20
0.1
10
0.0
0
TD D M F TF TD D M F TF
Diagramme en blocs
120
TD D
100
80 M F
60 TF
40
20
0
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 36
25 Best−Paid Executives
6
5
4
Effectif(nj)
3
2
1
Highest Degree nj fj Nj Fj
None 1 0.04 1 0.04
Bachelors 7 0.28 8 0.32
Masters 11 0.44 19 0.76
Doctorale/law 6 0.24 25 1
25 1
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 39
(pourcentage d’observations ≥ xj )
C. Données quantitatives
Exemple 1 - Variable discrète: Pour étudier
la qualité de la recherche à l’ULB, on utilise
comme indicateur le nombre de publications par
an. L’échantillon est constitué de 25 jeunes pro-
fesseurs.
• Tableau récapitulatif de la série observée:
xj nj fj Nj Fj Nj∗ Fj∗
0 5 0.20 5 0.20 25 1
1 10 0.40 15 0.60 20 0.80
2 4 0.16 19 0.76 10 0.40
3 3 0.12 22 0.88 6 0.24
4 2 0.08 24 0.96 3 0.12
5 1 0.04 25 1 1 0.04
25 1
Remarque: Nj = Nj−1 + nj
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 41
Représentations graphiques
Diagramme en bâtons
4
2
0 1 2 3 4 5
Nombre de publications
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 42
10
5
0
0 2 4 6
Nombre de publications
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 43
25
20
15
Nj
10
5
0
0 2 4 6
Nombre de publications
Remarques:
• Si x = xj =⇒ N (x) + N ∗(x) = n + nj
• Si x 6= xj =⇒ N (x) + N ∗(x) = n
Série Statistique:
83 83 18 65 99 96 7 94 62 98 71 20 97 88 38 55
81 51 68 19 36 41 56 49 33 85 75 97 35 36 32 59
88 28 63 60 99 7 31 13 34 33 15 12 62 41 13 27
74 24 67 98 22 13 32 9 54 84 35 62 14 90 91 59
77 38 31 22 92 39 54 90 47 89 81 79 9 88 30 50
41 16 49 44 45 87 23 5065 20 88 83 7 53 73 64
45 78 60 38 75 83 28 11 27 34 15 94 33 76 86 36
42 52 61 52 78 54 53 58
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 45
Série Ordonnée:
7 7 7 9 9 11 12 13 13 13 14 15 15 16 18 19 20 20
22 22 23 24 27 27 28 28 30 31 31 32 32 33 33 33
34 34 35 35 36 36 36 38 38 38 39 41 41 41 42 44
45 45 47 49 49 50 50 51 52 52 53 53 54 54 54 55
56 58 59 59 60 60 61 62 62 62 63 64 65 65 67 68
71 73 74 75 75 76 77 78 78 79 81 81 83 83 83 83
84 85 86 87 88 88 88 88 89 90 90 91 92 94 94 96
97 97 98 98 99 99
Diagramme en bâtons
Diagramme en b tons
4
3
Effectif
2
1
0
20 40 60 80 100
note
Résumer l’information
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 47
0|77997 0|77799
1|89352334615 1|12333455689
2|0874223087 2|0022347788
3|8635621432581908436 3|0112233344556668889
4|1917194552 4|1112455799
5|516949400322438 5|001223344456899
6|528302725401 6|001222345578
7|1547938568 7|1345567889
8|338158491878336 8|113333456788889
9|9648779801204 9|0012446778899
J ≈ 1 + log2 n
−−|−−−−−−−|−−−−−−−|−−
lj− xcj lj+
où nj = nombre d’observations dans la classe j
et hj = longueur de la classe.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 49
10
5
0
0 20 40 60 80 100
Note de tØlØphone
nj
NB: Parfois, on prends comme ordonnée hj de
telle sorte que la surface de chaque barre est
égale à nj
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 51
10
5
0
0 20 40 60 80 100
Note de tØlØphone
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 52
40
20
0
0 20 40 60 80 100
Note de tØlØphone
Remarques (exercices)
• Si x 6= xj ∀j:
N (x) + N ∗(x) = n
• Fonctions N (x) et N ∗(x):
0 x < l −
1
n1 −) − ≤ x < l+
(x − l l
h1 1 1 1
... ...
N (x) = nj −) l− ≤ x < l+
N +
j−1 hj (x − lj j j
... ...
lJ+ ≤ x
n
n x < l −
1
... n ...
N ∗(x) = Nj∗ − hj (x − lj−) lj− ≤ x < lj+
j
... ...
lJ+ ≤ x
0
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 55
D. Conclusions
Rappel:
• mesure d’une caractéristique de la population
(lettre grecque)
• mesure d’une caractéristique de l’échantillon
(lettre latine).
-2 0 2
x
0 2 4 6
y
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 60
-40 -20 0 20
x
-40 -20 0 20
y
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 61
1 2 3
x
-2 0 2
y
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 62
1. Moyenne arithmétique x̄
Soit {x1, . . . , xn} un échantillon de données numériques,
alors n
1 X
x̄ = xi
n
i=1
Exemples:
• Soit l’échantillon {1, 1, 2, 2, 2, 2, 3, 3}
⇓
1
x̄ = (1 + 1 + 2 + 2 + 2 + 2 + 3 + 3) = 2.
8
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 63
83 83 18 65 99 96 7 94 62 98 71 20 97 88 38 55
81 51 68 19 36 41 56 49 33 85 75 97 35 36 32 59
88 28 63 60 99 7 31 13 34 33 15 12 62 41 13 27
74 24 67 98 22 13 32 9 54 84 35 62 14 90 91 59
77 38 31 22 92 39 54 90 47 89 81 79 9 88 30 50
41 16 49 44 45 87 23 5065 20 88 83 7 53 73 64
45 78 60 38 75 83 28 11 27 34 15 94 33 76 86 36
42 52 61 52 78 54 53 58
⇓
1
x̄ = (83+83+18+65+. . .+53+58) = 53.12
120
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 64
J
1 X
x̄ = nj xcj
n
j=1
10 × 16 + 30 × 29 + . . . + 90 × 28
=
120
= 52.83
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 65
Propriétés
• Sensible face aux points aberrants.
Echantillon {1, 1, 2, 2, 2, 2, 3, 3} → x̄ = 2.
Echantillon {1, 1, 2, 2, 2, 2, 3, 300} → x̄ = 39.125.
• Valeurs centrées:
Echantillon {1, 1, 2, 2, 2, 2, 3, 3} =⇒ x̄ = 2.
Alors l’échantillon des valeurs centrées:
{xi − x̄} = {−1, −1, 0, 0, 0, 0, 1, 1}
est de moyenne nulle:
n
1 X
(xi − x̄) = 0
n
i=1
(exercice).
• Réécriture de la formule de la moyenne:
Xn
xi = nx̄
i=1
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 66
• Agrégation de 2 échantillons.
Echantillon 1: {n1, x̄1}, Echantillon 2:{n2, x̄2}
⇓
la moyenne de l’échantillon global comprenant
n = n1 + n2 individus est donné par:
n1x̄1 + n2x̄2
x̄ =
n
• Moyenne pondérée.
- La moyenne est par unité élémentaire.
- La moyenne pondérée est par unité de poids.
Total investi:
Moyenne pondérée:
3
X
wixi = 0.20 × 20% + 0.36 × 15% + 0.44 × 30%
i=1
= 22.6%
2. Médiane x1/2
• Calcul de la médiane:
a) Mettre les observations en ordre croissant:
{x(1), . . . , x(n)}
x( n )+x( n +1)
Si n est pair: x1/2 = 2 2
2
• Exemples:
Echantillon: {2, 5, 9, 11, 13} =⇒ x1/2 = 9
Echantilon: {2, 5, 9, 11, 13, 20} =⇒ x1/2 = 9+11
2
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 71
p 1-p
-l————-l—————l
x(1) xp x(n)
• Quantiles particuliers:
-Mediane x1/2: quantile 50%
4. Mode xM
• Définition: Valeur la plus fréquente.
• Problèmes:
- dépend de la manière dont vous construisez
l’histogramme (bin width)
- il est possible d’avoir plusieurs modes
x(1) + x(n)
c1 =
2
x1/4 + 2x1/2 + x3/4
c2 =
4
x1/4 + x3/4
c3 =
2
Moyenne tronquée:
n−1
1 X
c4 = x(i)
n−2
i=2
Moyenne géométrique:
p
c5 = Πixi
···
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 77
Distribution gaussienne
-2 -1 0 1 2
• Distribution asymétrique.
Distribution asymétrique
Mode 5 Moyenne 10 15
Médiane x
• Aversion au risque:
Préférez-vous avoir
- 100$ avec certitude
- 0 ou 200$ avec probabilité égale
Les 2 ont la même moyenne (100$)! Préférez
vous réduire l’incertain ou aimez vous le risque?
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 81
1. Etendue
E = x(n) − x(1)
• Facile et rapide à calculer
• Très sensible aux points aberrants
2. Ecart interquartile
Il contient 50% des observations:
EQ = x3/4 − x1/4
3. Ecart interdécile
Il contient 80% des observations:
ED = x9/10 − x1/10
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 82
4. Le peigne
x1/2 Dispersion Position
x3/4+x1/4
Q x1/4 x3/4 x3/4 − x1/4 2
x(1)+x(n)
E x(1) x(n) x(n) − x(1) 2
5. Le Box Plot
• Définition de base:
xg = x(1) et xd = x(n).
n
1X
em = |xi − x̄|
n
i=1
Remarque: Changeons le paramètre de posi-
tion. Alors,
n
1 X
em(c) = |xi − c|
n
i=1
est minimum quand c = x1/2.
n
1
e∗m =
X
|xi − x1/2|
n
i=1
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 85
8. Variance
Version française:
n
2 1X
s = (xi − x̄)2
n
i=1
Version anglaise (on l’utilisera en 2ème année)
n
1
S2 = (xi − x̄)2
X
n−1
i=1
• Agrégation: Soient 2 échantillons:
n1 n2
x̄1 s21 x̄2 s22
• Théorème de Konig-Huyghens:
1X
(xi − c)2 = s2 + (x̄ − c)2 c ∈ IR
n
i
Démonstration
1X 1
(xi − c)2 = (xi − x̄ + x̄ − c)2
X
n n
i i
1X n o
= (xi − x̄)2 + 2(xi − x̄)(x̄ − c) + (x̄ − c)2
n
i
1X
= (xi − x̄)2 + (x̄ − c)2
n
i
1 X
+ 2(x̄ − c) (xi − x̄)
n
i
= s2 + (x̄ − c)2
1
Conséquence: n i(xi−c)2 est minimum quand
P
c = x̄
9. Ecart-type
p
s= s2
• Interprétations:
Distribution gaussienne
-2 -1 0 1 2
2
3 des observations ∈ à l’intervalle (x̄ ± s)
95% des observations ∈ à l’intervalle (x̄ ± 2s)
99% des observations ∈ à l’intervalle (x̄ ± 3s)
9. Coefficient de variation
s
CV =
x̄
• Mesure relative de variabilité. Nombre sans
unité (pure number).
• Answers:
“Typically, in percentage terms, how far are
data values from average?”
GRAPHIQUES
1. Box Plot
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 91
ASYMETRIE - SKEWNESS
• Coefficient de Fisher: g1 = m
s3
3
APLATISSEMENT - KURTOSIS
• Coefficient de Pearson
m4
b2 = 4
s
où m4 est le moment centré d’ordre 4
n
1
(xi − x̄)4
X
m4 =
n
i=1
• Coefficient de Fisher: g2 = b2 − 3
b2=3, g2=0
b2>3, g2>0
b2<3, g2<0
-2 -1 0 1 2
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 94
γ = 2A
Belgium 28, 7%
Paraguay 57, 7%
Sweden 25%
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 96
BUTS:
• Facilité l’encodage, la lecture des données
• ...
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 97
Exemple
Soit un échantillon reprenant le salaire brut de
10 travailleurs en FB. La variable z aura comme
unité l’Euro et comme moyenne 0.
i xi zi
1 98000FB 114,03
2 96000FB
3 104000FB
4 66000FB
5 120000FB
6 75000FB
7 88000FB
8 84000FB
9 93000FB
10 110000FB 411,50
-500 0 500
z
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 100
1.2
3.5
1.0
3.0
log(y)
0.8
y
2.5
0.6
2.0
0.4
1.5
x log(x)
∇xt = xt − xt−1
INDICE ELEMENTAIRE
Définition. Soit 0 l’époque de base (référence).
L’indice de la variable x pour le temps t est:
xt
it/0(x) = .
x0
L’indice mesure le pourcentage d’augmentation
ou diminution de la variable par rapport à l’époque
de référence.
Remarque:
La variable étudiée peut être le prix (p), la
quantité (q) ou la valeur (v=pq) d’un bien.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 105
• Indice de Bradstreet:
P (j)
j xt
Bt/0(x) = P
(j)
x
j 0
• Indice Moyenne arithmétique:
(j)
1 X xt
At/0(x) =
n (j)
j x0
• Autres indices: moyenne harmonqiue, moyenne
géométrique, . . .
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 107
• Indice de Laspeyres:
(j) (j)
P
j w 0 xt
Lt/0(x) = P
(j) (j)
j w 0 x0
(j)
où w0 peut donner représenter le prix ou la
quantité du produit j au temps de référence.
CHAPITRE 2. STATISTIQUE DESCRIPTIVE D’UNE SERIE UNIVARIEE 108
• Indice de Paasche:
P (j) (j)
j wt xt
Pt/0(x) = P
(j) (j)
j t x0
w
(j)
où wt peut donner représenter le prix ou la
quantité du produit j au temps t.
• Indice de Sidgwick:
Lt/0(x) + Pt/0(x)
St/0(x) =
2
• Indice de Fisher:
q
Ft/0(x) = Lt/0(x) × Pt/0(x)
• Indice de Edgeworth:
P (j) (j) (j)
(w
j 0 + w t )xt
Et/0(x) = P
(j) (j) (j)
(w
j 0 + w t )x0
Chapitre 3
INTRODUCTION A LA THEORIE
PROBABILISTE
109
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 110
Scéma du développement:
Exemple 5: Témoignage
Etre un bon juré.
Faits:
• le témoin affirme avoir vu un taxi jaune
• il y a 2 types de taxi: jaune et orange
• difficulté: le soir tombait et un test pratiqué
dans des conditions similaires a montré que
le témoin ne pouvait distinguer correctement
la couleur que dans 80% des cas
3.3.1 DEFINITIONS
3.3.2 EXEMPLES
F = {} = ∅
E = {1, 2, 3, 4, 5, 6} = Ω
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 122
E1 se réalise ⇒ E2 se réalise.
• Conjonction (= intersection = produit logique)
E1 ∩ E2: E1 et E2 se réalisent tous les deux
• Différence
E1\E2: E1 se réalise sans que E2 se réalise
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 124
E = Ω\E
Remarques
1. E ∩ E = ∅
⇒ E et E sont mutuellement exclusifs
2. E ∪ E = Ω
• Partition de E
{E1, E2, . . . , Em} tel que:
1. E1, E2, . . . , Em ⊂ E
2. Ei ∩ Ej = ∅ (i 6= j)
3. E = E1 ∪ E2 ∪ . . . ∪ Em
Exemples: Soit E ∈ F
1. n(E) = nombre d’éléments de E
n(E)
2. f (E) = n(Ω)
Propriétés:
1. f (E) ≥ 0, pour tout E ⊂ Ω
2. f (Ω) = 1
3. Si E1, E2, . . . sont mutuellement exclusifs
(Ei ⊂ Ω):
• Si Ω est infini
⇓
on se restreint à une classe F de parties, stricte-
ment contenue dans l’ensemble des parties de
Ω, qui contient les évènements élémentaires, les
évènements impossibles et certain, ainsi que tous
ceux qui sont obtenus par les opérations ci-avant.
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 128
• Définition classique
Expérience: - N résultats possibles “équivalents”
(symétrie des résultats)
- NS résultats donnent le succès S.
=⇒ Probabilité de succès:
NS
P (S) = .
N
• Définition fréquentiste
(approche expérimentale)
⇓
n(E)
Fréquence: fn(E) = n .
• Définition axiomatique
Cas où Ω est fini
A.2: P (Ω) = 1
Remarques:
1. Les propriétés ci-dessus impliquent que
∅ ∈ F et ∩Ei ∈ F
2. (Ω, F) est appelé un espace probabiliste
3. (Ω, F, P ) est appelé un espace probabilisé
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 132
• Propriété 1
Si un événement E est partitionné en deux évé-
nements E1 et E2:
P (E) = P (E1) + P (E2).
• Propriété 2
Extension à plus de 2 événements.
• Propriété 3
Si E1 ⊂ E2:
P (E1) ≤ P (E2).
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 133
• Propriété 4
Pour tout événement E, P (E) ≤ 1.
• Propriété 5
Si E est le complémentaire de E:
P (E) = 1 − P (E)
• Propriété 6
Le complémentaire de Ω est ∅
⇒ P (∅) = 0.
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 134
Démonstration:
A ∪ B = (A\B) ∪ (A ∩ B) ∪ (B\A)
P (A ∪ B) = P (A\B) + P (A ∩ B) + P (B\A)
⇒ P (A ∪ B) = P (A) − P (A ∩ B)
+P (A ∩ B) + P (B)
−P (A ∩ B)
= P (A) + P (B) − P (A ∩ B).
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 135
Exemple:
B = {3, 6}, C = {2, 4, 6}
P (B ∪ C) = P (B) + P (C) − P (B ∩ C)
2 3 1 4
= + − =
6 6 6 6
Si A et B sont mutuellement exclusifs:
A∩B =∅
• Probabilité conditionnelle
Présentation à partir de l’exemple 4.1 (ELST,
p.149)
1 1/6 P (B ∩ C)
P (C|B) = = =
2 2/6 P (B)
• Règle de multiplication
Cas de deux événements
Soient A et B deux événements de probabilité
non nulle:
P (A ∩ B) = P (A).P (B|A)
P (A ∩ B) = P (B).P (A|B)
Cas de 2 événements
1. Définition
Deux événements A et B de probabilité non
nulle sont (stochastiquement) indépendants
si et seulement si:
P (A ∩ B) = P (A).P (B)
P (Ei) ≥ 0 (i = 1 . . . , m).
• Théorème de Bayes
Soit {E1, . . . , Em} un système exhaustif défini
sur Ω et un événement quelconque de A ∈ F, de
probabilité non nulle. Supposons connaı̂tre les
probabilités a priori P (Ei) et les probabilités
conditionnelles P (A|Ei) (pour i = 1, . . . , m).
On peut alors calculer les probabilités a poste-
riori par la relation:
P (Ei)P (A|Ei)
P (Ei|A) = Pm .
j=1 P (Ej )P (A|Ej )
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 144
• La formule du binôme
Schéma de Bernoulli
Dans une expérience aléatoire ξ, nous nous intérès-
sons à l’avènement ou non de l’événement E:
P (E) = p et P (Ē) = q = 1 − p.
P (E se réalise n fois) = pp . . . p = pn
P (E ne se réalise jamais) = qq . . . q = q n
P (E se réalise au moins 1 fois) = 1 − q n
P (E se réalise r fois dans ordre précis) = pr q n−r
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 145
N1 N2
p= et q =
N N
(formule du binôme)
CHAPITRE 3. INTRODUCTION A LA THEORIE PROBABILISTE 147
! !
N1 N2
r n−r
P (r fois Jaune) = !
N
n
si r ≤ N1 et n − r ≤ N2.
3. Remarque
! !
N1 N2
!
r n−r n
! −→ pr q n−r
N r
n
pour N1, N2 → ∞ et N
N
1 = p.
Chapitre 4
STATISTIQUE DESCRIPTIVE
D’UNE SERIE BIVARIEE
• Données : Série statistique bivariée:
{(xi, yi); i = 1, 2, . . . , n}
Questions:
• Quel est le mode de payement favori des clients?
• Les clients qui dépensent plus que la moyenne
en liquide dépensent-ils également plus que la
moyenne par carte ?
• etc
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 150
⇓
Variable nominale.
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 152
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 2 2 3
Y 0 0 1 1 1 2 2 2 2 3 3 3 3 4 4 0 1 3 4 5
Commentaires:
• Beaucoup d’étudiants s’engageant dans les
études en économie n’ont jamais eu de 2ème ses-
sion dans le secondaire.
• Ne pas avoir eu de 2ème session dans le sec-
ondaire n’est pas une garantie de réussite en 1ère
session à l’université
• Les étudiants sans 2ème session dans le sec-
ondaire ont-ils plus de chances de réussite en
1ère session que les autres ?
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 153
Commentaires :
• Deux étudiants de l’échantillon n’ont jamais
eu de 2ème session
• Un étudiant a eu trois 2èmes sessions en
secondaire et cinq 2èmes sessions à l’université
• L’effectif maximal est 4 pour des étudiants
n’ayant jamais eu de 2ème session en secondaire
mais deux 2èmes sessions à l’université
• ...
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 157
2. Distributions marginales
Etude d’une seule série observée (abstraction de
l’autre série) =⇒ étude de séries univariées.
Fréquence marginale en x :
nj.
fj. = où j = 1, . . . , J =⇒
n
n J
1X 1X
x̄ = xi = nj.xj
n n
i=1 j=1
n J
2 1 2 1X
nj.(xj − x̄)2
X
sx = (xi − x̄) =
n n
i=1 j=1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 159
Fréquence marginale en y :
n.k
f.k = où k = 1, . . . , K =⇒
n
n K
1 X 1 X
ȳ = yi = n.k yk
n n
i=1 k=1
n K
2 1 1
(yi − ȳ)2 = n.k (yk − ȳ)2
X X
sy =
n n
i=1 k=1
Exercice:
X J K
X J X
X K
nj. = n.k = njk = n
j=1 k=1 j=1 k=1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 160
4 4
3. Distributions conditionnelles
Etude d’une série observée en fixant la valeur
de l’autre série observée.
Questions :
• Parmi les étudiants n’ayant jamais eu de
2ème session dans le secondaire, quel est le pour-
centage d’étudiants réussissant sans 2ème ses-
sion à l’université ?
• Quelle est la moyenne du prix d’une action
pour les titres échangés sur la bourse de New
York ?
• Sachant que les dépenses en liquides par
mois sont inférieures à 100 euros pour certains
individus de l’échantillon, quelle sera la moyenne
des dépenses de ces individus par carte ?
• ...
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 162
Distribution conditionnelle de y en x :
njk
fyk |xj = fk|j = j fixé ; k = 1, . . . , K
nj.
On peut calculer les moyennes, variances,. . . con-
ditionnelles :
K
1 X
ȳ|xj = njk yk
nj.
k=1
K
2 1
njk (yk − ȳ|xj )2
X
sy|x =
j nj.
k=1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 163
Distribution conditionnelle de x en y:
njk
fxj |yk = fj|j = k fixé ; j = 1, . . . , J
n.k
On peut calculer les moyennes, variances,. . . con-
ditionnelles :
J
1 X
x̄|yk = njk xj
n.k
j=1
J
2 1
njk (xj − x̄|yk )2
X
sx|y =
k n.k
j=1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 164
Exemple : Bourse
Moyenne des prix d’une action pour les titres
échangés sur la bourse de New York :
Exercice: ȳx=OT C = . . .
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 165
1. Les moments
Généralisation à 2 dimensions de la notion de
moment :
a) Moments centrés
n
1
(xi − x̄)r (yi − ȳ)s
X
mrs = r, s ∈ IN
n
i=1
Cas particuliers :
n
1X
m20 = (xi − x̄)2 = s2x
n
i=1
n
1
(yi − ȳ)2 = s2y
X
m02 =
n
i=1
n
1 X
m11 = (xi − x̄)(yi − ȳ) = sxy
n
i=1
où sxy est appelé covariance
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 166
c)Propriétés de mrs
2. Covariance
Moment centré d’ordre (1,1):
n
1 X
m11 = sxy = cov(x, y) = ((xi − x̄)(yi − ȳ))
n
i=1
La covariance sera positive (négative) s’il existe
une relation croissante (décroissante) entre les 2
variables.
Exemple: Mode de payement
Modes de payement
-
+
50 100 150 200
Propriétés
• Influencée par les changements d’unités mais
pas d’origine. Soient
xi − x0 yi − y0
ui = et vi = (i = 1, . . . , n)
dx dy
cov(x, y)
=⇒ cov(u, v) = (exercice)
dxdy
• |cov(x, y)| ≤ sxsy (exercice)
Aide: développer l’expression suivante:
n
1
(b(xi − x̄) − (yi − ȳ))2
X
n
i=1
• Expression liant m11 et m011 (exercice):
n
1 X
m11 = sxy = ((xi − x̄)(yi − ȳ))
n
i=1
n
1X
= xiyi − x̄ȳ = m011 − m001m010
n
i=1
1 Pn
Mettre en parallèle avec : sx = n i=1 x2i − x̄2.
2
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 169
3. Coefficient de corrélation
(Bravais-Pearson)
Définition:
sxy
r= où sx 6= 0, sy 6= 0
s x sy
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 170
Commentaires:
r = 1 quand tous les points observés se trou-
vent sur une même droite de pente positive
r ≈ 1 quand tous les points observés sont
situés à proximité d’une telle droite
r = 0 quand le nuage de points est allongé
parallèlement à l’un des axes de coordonnées ,
ou forme arrondie
r = −1 quand tous les points observés se trou-
vent sur une même droite de pente négative
r ≈ −1 quand tous les points observés sont
situés à proximité d’une telle droite
Propriétés
• Ne peut pas être utilisé avec des variables
qualitatives
• −1 ≤ r ≤ 1
a) Vecteur moyenne:
!
x̄
ḡ =
ȳ
NB: ḡ définit le centre de gravité des données.
b) Matrice variance-covariance:
!
s2x sxy
V =
sxy s2y
NB: V est une matrice symétrique.
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 174
=⇒ V = n1 Xc0 Xc
x − x̄ y1 − ȳ
! 1
1 x2 − x̄ y2 − ȳ
x1 − x̄ x2 − x̄ . . . xn − x̄
= .
. ..
n y1 − ȳ y2 − ȳ . . . yn − ȳ .
xn − x̄ yn − ȳ
Exercice: Ecriture matricielle avec trois vari-
ables (x, y, z).
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 175
Exemples
4
2
0
y2
-2
-4
1 0 1 2 -2 -1 0 1
x1 x1
2
1
y4
0
-1
-2
1 0 1 2 -2 -1 0 1
x1 x1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 176
CADRE THEORIQUE
ei = yi − ŷi = yi − a − bxi
But: Minimiser:
n n
e2i = (yi − a − bxi)2.
X X
i=1 i=1
∂
(i) Q(a, b) = 0
∂a
∂
(ii) Q(a, b) = 0.
∂b
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 180
Résolution:
Dérivons la somme des résidus carrés par rap-
port à a:
n
∂ X
Q(a, b) = −2 (yi − a − bxi)
∂a
i=1
Il s’ensuit de (i) que
n
X
⇔ (yi − a − bxi) = 0
i=1
Xn n
X
⇔ yi − na − b xi = 0
i=1 i=1
Xn Xn
⇔ yi = na + b xi
i=1 i=1
⇔ ȳ = a + bx̄,
a = ȳ − bx̄
sxy
b = 2
sx
n n
1 1
s2y = (yi −ŷi)2 + (ŷi −ȳ)2 = s2e +s2reg
X X
n n
i=1 i=1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 184
Démonstration:
n n
2 1 2 1
(yi − ŷi + ŷi − ȳ)2
X X
sy = (yi − ȳ) =
n n
i=1 i=1
n n
1 2 1
(ŷi − ȳ)2
X X
= (yi − ŷi) +
n n
i=1 i=1
n
2 X
+ (yi − ŷi)(ŷi − ȳ)
n
i=1
Montrons que le double produit est nul. Rappel:
ŷi = a + bxi = ȳ − bx̄ + bxi = ȳ + b(xi − x̄)
Donc, nous avons que:
n n
2X 2X
(yi − ŷi)(ŷi − ȳ) = (yi − ȳ − b(xi − x̄))(b(xi − x̄))
n i=1 n i=1
n n
2b X X
= [ (yi − ȳ)(xi − x̄) − b (xi − x̄)2]
n i=1 i=1
sxy
= 2b[sxy − bs2x] = 2b[sxy − 2 s2x] = 0
sx
Exemple
xi 12 12 15 14 16 14 12 13 11 11
yi 4.1 3.4 11.3 10.2 11.5 7.2 6.0 7.8 3.5 3.0
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 188
! ! ! !
x̄ 13 s2x sxy 2.6 4.8
ḡ = = et V = =
ȳ 6.8 sxy s2y 4.8 9.99
Soient:
- Y une variable quantitative (p.e. le salaire)
- X une variable qualitative (p.e. le niveau
de diplôme) prenant les modalités x1, . . . , xj , . . . , xJ .
n K
1 1
s2y = (yi − ȳ)2 = n.k (yk − ȳ)2
X X
n n
i=1 k=1
J XK
1
njk (yk − ȳ)2
X
=
n
j=i k=1
J X K
1
njk (yk − ȳ|xj + ȳ|xj − ȳ)2
X
=
n
j=i k=1
J X K
1
njk (yk − ȳ|xj )2
X
=
n
j=i k=1
J
1
nj.(ȳ|xj − ȳ)2
X
+
n
j=i
= moyenne des variances conditionnelles
+ variance des moyennes conditionnelles
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 193
1 PJ n (ȳ|x − ȳ)2
2 n j=i j. j
ηy.x =
s2y
Remarques:
- expression à comparer avec R2
2 est indépendant des origines et des
- ηy.x
unités
2 ≤1
- 0 ≤ ηy.x
- Si ȳ|xj = ȳ 2 =0
∀j =⇒ ηy.x
- Si s2y|x = 0 2 =1
∀j =⇒ ηy.x
j
2 − r2
- Indice de non linéarité: ηy.x
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 194
i 1 2 3 4 5 6 7 8 9 10
QN E B B E S S I B E S
QS B B B E S B I E B S
R B B E B B I I E B B
P S B E E B I I B S B
G B B E B E B I S S E
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 195
Exemples:
Série observée: QNi = {E, B, E, B, S, S, I, B, E, S}
Série ordonnée: QN(i) = {I, S, S, S, B, B, B, E, E, E}
Rang de la série ordonnée: R(QN(i)) = {1, 3, 3, 3, 6, 6, 6, 9, 9, 9}
Rang de la série observée: R(QNi) = {9, 6, 9, 6, 3, 3, 1, 6, 9, 3}
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 196
Rs = corr(R(x), R(y)).
• Corrélation du quadrant
Basé sur la division de l’espace en 4 parties au
moyen des médianes.
• Corrélation de Kendall
Basé sur la notion de paire d’observations con-
cordantes et discordantes.
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 197
{(xj , yk , njk ); j = 1, . . . , J et k = 1, . . . , K}
Tableau de contingence
njk U1 U2 U3 nj.
R1 28 73 29 130
R2 0 2 18 20
R3 12 25 13 50
n.k 40 100 60 200
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 198
Formalisation
• 2 variables qualitatives (nominales) X et Y :
- X prend J modalités: A1, . . . , AJ
Remarquons que:
fjk est une estimation de
πjk = P (X ∈ Aj , Y ∈ Bk )
Exemple Régions-Universités.
fjk U1 U2 U3 fj.
R1 0.14 0.365 0.145 0.65
R2 0 0.010 0.090 0.10
R3 0.06 0.125 0.065 0.25
f.k 0.20 0.50 0.30 1
Commentaires
• 14% des 200 étudiants viennent de la région
R1 et sont à l’université U1
• 65% des étudiants viennent de la région R1
• 30% des étudiants sont à l’université U3
• ...
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 201
Commentaires
• Dans les étudiants venant de la région R2,
10% ont choisi l’université U2.
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 202
Commentaires
• Dans les étudiants ayant choisi l’université
U3, 30% viennet de la région R2.
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 203
Situation d’indépendance
• Si 2 variables aléatoires X et Y sont indépendantes,
alors ∀j ∈ {1, . . . , J} et ∀k ∈ {1, . . . , K}:
a)P (X ∈ Aj , Y ∈ Bk ) = P (X ∈ Aj )P (Y ∈ Bk )
b)P (Y ∈ Bk |X ∈ Aj ) = P (Y ∈ Bk )
c)P (X ∈ Aj |Y ∈ Bk ) = P (X ∈ Aj )
fjk U1 U2 U3 fj.
R1 0.14 0.365 0.145 0.65
R2 0 0.010 0.090 0.10
R3 0.06 0.125 0.065 0.25
f.k 0.20 0.50 0.30 1
∗ U
fjk U2 U3 fj.
1
R1 0.13 0.325 0.195 0.65
R2 0.02 0.050 0.030 0.10
R3 0.05 0.125 0.075 0.25
f.k 0.20 0.50 0.30 1
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 206
Ecarts à l’indépendance
Les écarts à l’indépendance sont donnés par
• Exemple Régions-Universités
njk U1 U2 U3 nj. n∗jk U1 U2 U3 nj.
R1 28 73 29 130 R1 26 65 39 130
R2 0 2 18 20 R2 4 10 6 20
R3 12 25 13 50 R3 10 25 15 50
n.k 40 100 60 200 n.k 40 100 60 200
CHAPITRE 4. STATISTIQUE DESCRIPTIVE D’UNE SERIE BIVARIEE 207
=⇒
ejk U1 U2 U3
R1 2 8 -10
R2 -4 -8 12
R3 2 0 -2
• Interprétations:
ejk > 0 ↔ njk > n∗jk ↔ fjk > fjk ∗ =f f
j. .k
→ on dit que les modalités Aj et Bk “s’attirent”
Méthodes de classification
Méthodes permettant de grouper les individus
ou variables suivant certains critères de prox-
imité.
Analyse discriminante
Techniques destinées à classer (affecter à des
classes préexistantes) des individus caractérisés
par un certain nombre de variables quantitatives
ou qualitatives
Chapitre 5
SERIES CHRONOLOGIQUES
211
Chapitre 5 : Analyse
d’une série chronologique
1. Introduction.
Série chronologique :
Suite de valeurs observées {yt1, yt2, ….ytn}
d’une variable Y effectuées dans le temps
aux instants : {t1, t2, …, tn}.
1
Hypothèse simplificatrice :
On suppose que les dates d’observations sont
équidistantes → {y1, y2, …yn}.
Variable de niveau :
Etat à un moment donné :
- montant des avoirs le 31 décembre
- nombre de chômeurs le 1er de
chaque mois
- etc
Variable de flux :
Mouvement intervenu durant une certaine
période :
- quantité produite pendant 1 mois
- nombre de navetteurs sur la E411 sur
une journée
- etc
2
Prévisions :Exemples
T= tendance
C= composante cyclique
S= composante saisonnière
Modèle additif : yt = Tt + Ct + St + Et
NB : composante extra-saisonnière : ft = Tt + Ct
Modèle additif : yt = Tt + Ct + St + Et
5
Graphique 3 : T + C + S = idem+
composante saisonnière
Graphique 4 : T + C + S + E= idem+
composante résiduelle
6
Modèle multiplicatif : yt = Tt * Ct * St * Et
7
Graphique 3 : T * C * S = idem *
composante saisonnière
Graphique 4 : T * C * S * E= idem *
composante résiduelle
CONCLUSION :
8
3. Etude de la tendance
a) Approche exploratoire
Outils :
- filtres linéaires (moyenne mobile, etc)
- régression linéaire simple après avoir
linéarisé par différenciation,
transformation logarithmique, etc
9
b) Filtres linéaires.
où wt est indépendant de t
Donc y =
*
t ∑w y
j =−1
j t+ j = w−1 yt −1 + w0 yt + w1 yt +1 + w2 yt + 2
11
12
13
14
15
5°) Choix de l’ordre de la moyenne mobile.
16
17
Donc le choix « idéal » dépend de la
saisonnalité.
18
c) Ajustement analytique (régression
linéaire)
Procédure :
- étape 1 : si y n’est pas une fonction
linéaire : f(t) = a + bt, essayer de la
linéariser
120
80
60
20 40 60 80
y1
y2
40
20
0
0
0 10 20 30 40 50 0 10 20 30 40 50
t t
-0.2
80
y3
y4
60
-0.6
40
20
-1.0
0 10 20 30 40 50 0 10 20 30 40 50
t t
Régression exponentielle :
y = 10 a +bx ⇒ log10 y = a + b x
Régression hyperbolique :
1 1
y= ⇒ = a + bx
a + bx y
zi = 1 yi
20
Régression quadratique: la parabole
y = b0 + b1 x + b 2 x 2
Min Q (b0 , b1 , b2 ) = ∑
i
( yi − b0 − b1 xi − b2 xi)
2 2
∂Q
∂ b2
( )( )
= −2 ∑ yi − b0 − b1 xi − b2 xi2 xi2 = 0
i
21
Etape 2 : Estimation de la tendance par la
méthode des moindres carrés
yˆi = a + bti
(a, b ∈ R)
ei = yi − yˆi = yi − a − bti
∑ei
2
i =1
Critère des moindres carrés :
22
Critère des moindres carrés (MC)
∂Q (a, b)
=0
∂a
∂Q (a, b)
=0
∂b
On obtient donc comme solution du problème de
minimisation :
a = y − bt
s ty
b = 2
st
Remarque : en calculant les dérivées secondes,
on peut montrer que la solution est bien un
minimum
23
Cas particulier :
⇒ 1+ 2+...+T =
T(T +1)
⇒ t = T +1
2 2
T 2 −1
et 12 + 22 +...+T 2 =
T(T +1)(2T +1)
⇒ st2 =
6 12
yˆt = a +b t
où a= y −bT +1
2
T T
T +1 yt
∑ tyt −
2 ∑
b= t =1 t =1
et 1 T(T 2 −1)
12
24
4. Etude de la composante
saisonnière
a). Introduction.
25
b) Modèle additif
26
27
28
29
30
31
32
33
34
c) Modèle multiplicatif
35
5. Elimination de la tendance
ou/et de la composante
saisonnière
a) Elimination de la tendance.
Solution 1 :
On détermine T et ensuite on effectue les
opérations suivantes :
36
b) Elimination de la saisonnalité.
Solution 1 :
On détermine Sj (ou 1+ sj) et ensuite on
effectue les opérations suivantes :
37
6. Méthodes de Prévision
38
39
40
41
42
43
44
45
46
Chapitre 6
212
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES213
ω1 : P 1 ∩ P 2
ω2 : P 1 ∩ F 2
ω3 : F1 ∩ P2
ω4 : F 1 ∩ F 2
& %
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES214
'
Ω $
V
ω1 : P 1 ∩ P 2 H H ' $
HH
H
jH
H
HH
0
HH
ω2 : P1 ∩ F2 XXXX
XzXX
XXX
X
1
2
*
ω3 : F1 ∩ P2
,
,
,
,
,
,
,
, & %
ω4 : F 1 ∩ F 2 ,
,
,
& %
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES215
'
Ω $
' $
V
P1 ∩ P2 %
E0 & HH ' $
H
HH
jH
HH
' $ H
0
HH
P1 ∩ F2 XXXX
X
zXX
E1 X XXX
1
2
*
F1 ∩ P2
&
%
,
,
,
,
,
,
' $,
, & %
F 1 ∩ F2
,
E2 & ,
%
,
& %
On a donc:
1
P (E0) = P (X = 0) =
4
1 1 1
P (E1) = P (X = 1) = + =
4 4 2
1
P (E2) = P (X = 2) =
4
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES216
px
1 6
3
4
1
2
1
4
-
0 1 2 x
x = X(ω) ∈ V.
'
Ω $
V
' $
•```````z``
ω ```
`•
x
& %
& %
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES217
Discrète et continue
Si V est un ensemble discret, la v.a. est dite
discrète (par exemples V = {0, 1, . . . , n} où
n ∈ N ; V = Z)
Expérience Variable aléatoire X Valeurs possibles V
Contacter 5 clients Nbre de clients 0, 1, 2, 3, 4, 5
qui commandent
Inspecter une Nbre de radios défectueuses 0, 1, . . . , 50
cargaison de 50 radios
Gérer un restaurant Nombre de clients 0, 1, 2, 3, . . .
pendant une journée
{(x, px), x ∈ V }.
F (x) = P (X ≤ x) où x ∈ IR
Propriétés
• F (x) ∈ [0, 1]
• F (−∞) = 0 et F (∞) = 1
• P (a < X ≤ b) = P (X ≤ b) − P (X ≤ a)
= F (b) − F (a), (a < b)
1 1
E[gain pour A] = 64 + 32 = 48
2 2
1 1
E[gain pour B] = 0 + 32 = 16
2 2
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES222
2. Définition
Soit la distribution de probabilité:
{(x, px), x ∈ V }
3. Propriétés
• Si b est une constante: E(b) = b
Démonstration:
X X
E(b) = bpx = b px = b.
x x
• Si a est une constante : E(aX) = aE(X)
Démonstration:
X X
E(aX) = (ax)px = a xpx = aE(X).
x x
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES223
E(aX + b) = aE(X) + b
Démonstration: exercice
Démonstration: exercice.
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES224
• Moyenne
Cas particulier de l’EPM pour g(X) = X:
X
E(X) = xpx := µ
x
Remarque : analogie avec la statistique descrip-
tive basée sur un échantillon :
1X X
x̄ = nj xj = f j xj
n
j j
Exemple: Lancement de 2 pièces
px
1 6
3
4
1
2
1
4
-
0 1 2 x
X 1 1 1
µ= xpx = 0 + 1 + 2 = 1
x
4 2 4
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES225
• Variance et Ecart-type
Cas particulier de l’EPM: g(X) = (X −E(X))2
x
Remarque : analogie avec la statistique descrip-
tive basée sur un échantillon :
1
s2 = nj (xj − x̄)2 = fj (xj − x̄)2
X X
n
j j
3
4
1
2
1
4
-
0 µ=1 2 x
2 1 1 1 1
σ = (0 − 1) + (1 − 1) + (2 − 1) =
4 2 4 2
p
Ecart-type: σ = (σ 2).
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES226
PROPPRIETES:
1. Si b est une constante: V (b) = 0
Démonstration: Puisque E(b) = b, on a:
2 (b−E(b))2px = 0.
X
V (b) = E((b−E(b)) ) =
x
3. Si Y = X − a alors V (Y ) = V (X)
Démonstration: Exercice.
⇓
La variance est indépendante d’un changement
d’origine.
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES227
5. Soit Z = X−µ
σ alors V (Z) = 1
• Les Moments
Définition: Moments d’ordre r par rapport à c
Cas particuliers:
PROPRIETES:
µ00 = µ0 = 1
µ01 = E(X) = µ
µ1 = 0
µ2 = E[(X − µ)2] = σ 2
Démonstration: exercice.
Démonstration:
• Médiane
Définition: La médiane x1/2 est telle que:
1 1
P (X < x1/2) ≤ et P (X ≤ x1/2) ≥
2 2
2
1 1 t 1 2t
M (t) = E(etX ) = tx
X
e px = + e + e
4 2 4
x=0
dM (t) 1 t 1 2t
→µ = [ ]t=0 = [ e + e ]t=0 = 1
dt 2 2
d 2M (t) 1 t 3
0
→ µ2 = [ 2t
]t=0 = [ e + e ]t=0 =
dt2 2 2
2 0 2 3 1
⇒ σ = µ2 − µ = − 1 =
2 2
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES233
1. Distribution uniforme
a) Définition: X ∼ U [1, . . . , n] si
1
P (X = x) = ∀x ∈ V = {1, . . . , n}
n
b) Exemples
• valeur obtenue par un lancé de dé (n=6)
• dans une étude basée sur un échantillon de
taille n, il est souvent assumé que chaque indi-
vidu de l’échantillon à un poids 1/n.
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES234
c) Quelques paramètres
• Moyenne (paramètre de position):
n n
X 1X n+1
µ = E(X) = xpx = x=
n 2
x=1 x=1
Aide: n
X n(n + 1)
x=
2
x=1
Preuve:
(x + 1)3 = x3 + 3x2 + 3x + 3
⇒ (x + 1)3 − x3 = 3x2 + 3x + 1
n
[(x + 1)3 − x3] = (n + 1)3 − 1
X
et
x=1
En outre
n n
[(x + 1)3 − x3] = (3x2 + 3x + 1)
X X
x=1 x=1
= 3(1 + 22 + . . . + n2)
+ 3(1 + 2 + . . . + n) + n
Nous avons donc que:
n n
(n + 1)3 − 1 = 3 x2 + 3
X X
x+n
x=1 x=1
n
X
2 1 3 n(n + 1)
⇒ x = [(n + 1) − 1 − 3 − n]
3 2
x=1
n
X
2 1
⇒ x = n(n + 1)(2n + 1)
6
x=1
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES236
2. Distribution de Bernouilli
a) Définition: X ∼ B(1, p) si les valeurs pos-
sibles pour X sont succès (x = 1) et échec
(x = 0). En outre la probabilité de succès est
égale à p (P (X = 1) = p).
b) Exemples
• inspection d’une pièce dans un processus in-
dustriel (défectueux ou pas)
• résultat (réussite ou échec) à l’examen de
statistique.
µ = p
σ 2 = pq où q = 1 − p
µ3 = pq(q − p)
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES238
3. Distribution binomiale
b) Exemples
• Sélection aléatoire n pièces dans une produc-
tion et on compte le nombre de pièces conformes
• On compte le nombre de fois que l’on gagne
(avoir pile) dans un jeu de n pile ou face.
c) Distribution de probabilité:
- x ∈ {0, 1, !
. . . , n}
n
- px = pxq n−x (formule du binôme)
x
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES240
• Variance:
dM 2(t)
µ02 = [ 2
]t=0
dt
= np[(n − 1)(q + pet)n−2pe2t + (q + pet)n−1et]t=0
= np[(n − 1)p + 1] = np(np + q)
σ 2 = µ2 = µ02 −µ02
1 = n2p2 +npq −n2p2 = npq
µ3 = npq(q − p)
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES242
e) Fréquence de succès
• Soit X le nombre de succès et Y la fréquence
de succès:
X
Y =
n
• Valeurs de Y: y ∈ {0, n1 , . . . , 1}
4. Distribution de Poisson
b) Exemples
• Le nombre de faillites sur une journée dans
un secteur industriel.
• Le nombre d’accidents d’avion sur une année.
• Moments d’ordre 3 et 4
µ3 = λ µ4 = λ + 3λ2
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES245
Pour n → ∞, p → 0 et np → λ, on obtient:
(λ)x −λ
P (X = x) → e ∗1
x!
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES246
• X ∼ Bin(100, 0.05)
P(X=5)=0,1800
F(5)=0,6160
• X ∼ P (5)
P(X=5)=0,1755
F(5)=0,6160
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES247
−−−|−−−−|−−−−−−|−−−−|−−−−|−−−−
0 ↑ ↑ t t + ∆t
Donc,
5. Distribution géométrique
a) Définition: Schéma de Bernouilli (expériences
uniformes et indépendantes avec probabilité de
succès égale à p) où n n’est pas fixé a priori.
X=nombre d’essais précédant le premier succès.
b) Exemples:
• Nombre de lancé d’un dé avant d’avoir 1.
• En répondant au hasard: le nombre de QCM
faux avant d’avoir une bonne réponse.
c) Distribution de probabilité:
P (X = x) = px = pq x x ∈ {0, 1, 2, . . .}
e) Quelques moments:
• La moyenne:
dM (t) pqet pq q
µ=[ ]t=0 = [ t 2
]t=0 = 2 =
dt (1 − qe ) p p
• Moments d’ordre 2
dM 2(t)
µ02 = [ 2
]t=0
dt
et(1 − qet)2 + 2etqet(1 − qet)
= pq[ t 4
]t=0
(1 − qe )
(1 − q)2 + 2qp q(p + 2q) q(1 + q)
= pq 4
= 2
=
p p p2
q(1 + q) q 2 q
⇒σ = 2 − 2= 2
p 2 p p
e) Définition alternative: Y =nombre d’essais
nécessaire pour avoir le premier succès.
• Y = X+1; P(Y=y)=pqy−1 y ∈ {1, 2, . . .}
tY pet
• M (t) = E(e ) = 1−qet
dM (t)
• µ = [ dt ]t=0 = p1 et σ 2 = pq2 .
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES251
x=0
∞
r−1 (qet)x = pr
= pr
X
Cx+r−1
(1 − qet)r
x=0
CHAPITRE 6. VARIABLES ALEATOIRES ET LOIS DE PROBABILITE DISCRETES252
7. Distribution hypergéométrique
a) Définition: On prélève n individus dans une
population de taille N de manière aléatoire, mais
sans remise. Chaque individu possède (succès)
ou ne possède pas (échec) une certaine caractéristique.
Dans la population M individus possèdent cette
caractéristique. Soit X=nombre de succès.
b) Distribution de probabilité:
! !
M N −M
x n−x
P (X = x) = !
N
n
où x ∈ {max(0, n−(N −M )), . . . , min(n, M )}.
STAT-D-101
Catherine Dehon
Séance 1 : Introduction1
Exercice 1
Utilisez le signe de sommation pour écrire les expressions suivantes :
1. y1 + y2 + y3 + y4 + y5 ;
2. n1 x1 + n2 x2 + . . . + nJ xJ ;
3. f1 (x1 − a)2 + f2 (x2 − a)2 + . . . + fJ (xJ − a)2 .
Exercice 2
L’étudiant nommé Crésus reçoit de ses parents chaque mois 100 Euros comme argent de
poche.
1. Calculez l’argent de poche reçu sur une année.
Crésus, étant relativement dépensier, travaille également pour gagner de l’argent. La
somme d’argent gagnée varie selon les mois :
Mois Jan Fev Mars Avril Mai Juin Juil Aôut Sept Oct Nov Dec
Somme d’argent 100 125 100 150 175 125 150 200 250 100 150 125
2. Calculez le montant total d’argent dont Crésus peut disposer sur une année.
Néanmoins, Crésus a un GSM dont le coût fixe par mois est de 15 Euros.
3. Calculez la somme d’argent disponible pour une année aprés avoir retenu les frais de
son GSM.
Exercice 3
Considérons la série statistique de taille 5 :{x1 = 1; x2 = 4; x3 = 5; x4 = 3; x5 = 2}. Déterminez
la valeur des sommes suivantes :
P5
1. i=1 xi ;
P5
2. i=1 4xi ;
3. x = 15 5i=1 xi ;
P
P5
4. i=1 (xi − x) ;
P5 2
5. i=1 xi .
1
Les énoncés sont disponibles sur le site www.ulb.ac.be/soco/statrope
1
Exercice 4
Trouver la valeur minimale de n (n ≥ 1) tel que :
n 5
2
1− ≥ 0.95.
3
Exercice 5
Considérons l’ensemble E de R suivant : {1, 3, 15, 31, 42, 100}. On note A = {1, 15, 42},
B = {1, 15, 100} et C = {3, 31}.
1. Déterminer les ensembles A, A ∪ B, A ∩ B et A \ B.
2. Vérifier que A ∪ B = A ∩ B, A ∩ B = A ∪ B et A ∪ B = (A \ B) ∪ (A ∩ B) ∪ (B \ A).
Exercice 6
Calculer les sommes suivantes :
P10 2 k P10 2 k
1. k=1 ( 5 ) et k=0 ( ) ;
P∞ 1 k P∞ 51 k
2. k=1 ( 5 ) et k=0 ( 5 ) .
Exercice 7
Soient p et n deux entiers naturels tel que, 1 ≤ p ≤ n. Montrez que :
n n
1. = .
p n−p
n n n+1
2. + = .
p+1 p p+1
Pn k n
3. k=0 (−1) = 0.
k
Pn n
4. k=0 = 2n .
k
Exercice 8
Considérons la série de variables suivante : nombre d’enfants dans une famille, couleur des
yeux, catégorie socio-professionnelle, commune de naissance, niveau de scolarité, revenu,
poids, sexe, age, langue maternelle, type de voiture, taille, nombre de grains de beauté sur
la peau, taille de grains de beauté.
Spécifier pour chacune de ces variables si elle est qualitative, quantitative, continue,
discrète, ordinale ou nominale.
2
Université Libre de Bruxelles Année académique 2009-2010
STAT-D-101
Catherine Dehon
Exercice 1
Un constructeur d’automobiles a demandé à 150 individus de faire part de leur préférence
concernant la couleur de la voiture. Les résultats qu’il obtient sont les suivants :
Exercice 2
Lors d’une étude en psychologie sociale sur la mobilité géographique, on a interrogé 50
personnes pour savoir si elles passaient leurs vacances à l’étranger. Les effectifs obtenus
sont les suivants :
Vacances à l’étranger Jamais Parfois Souvent Toujours
Effectifs 5 19 23 3
1
Exercice 3
Soit la population des étudiants de première bachelor à l’ULB en ingénieur de gestion. Une
étude de la Communauté Française (en charge de l’enseignement secondaire) s’intéresse
à l’âge de ces étudiants. Pour ce faire, on prélève un échantillon de taille n = 50. Les
résultats sont les suivants :
17 20 19 18 21 18 18 19 19 18
18 18 17 18 18 20 20 17 18 17
21 18 19 20 18 17 21 19 17 18
17 17 19 18 18 17 21 19 17 20
18 17 19 21 18 20 18 17 19 17
Exercice 4
On a mesuré, en millisecondes, à quelle vitesse 50 enfants de quatre ans identifiaient des
images simples (ours, lapin, chat . . . ). Les résultats sont les suivants :
24 27 33 21 27 19 23 23 24 19
27 30 15 27 24 34 18 20 21 15
33 27 20 32 28 27 22 17 30 18
21 25 25 29 25 24 32 31 28 20
29 24 23 27 17 15 21 28 24 23
2
Exercice 5
Considérons une série statistique {x1 , . . . , xi , . . . , xn } relative à un caractère quantitatif
X et le changement d’origine et d’unité suivant :
xi −a
yi = d ,i = 1, . . . , n.
Soient x et s2x la moyenne et la variance de la série {x1 , . . . , xi , . . . , xn } et y et s2y celles de
la série {y1 , . . . , yi , . . . , yn }. Démontrez que :
x−a
1. y = d ;
2
2. s2y = sdx2 .
Exercice 6
Une enquête sur le taux de chômage des jeunes femmes en 2002 dans les directions
subrégionales de Namur et Charleroi a été réalisée. La direction subrégionale de Namur
comprend 31 communes et celle de Charleroi 26 communes. Le taux de chômage moyen
des jeunes femmes à Namur est de x1 = 32% avec un écart-type de s1 = 10%. Le taux
de chômage moyen des jeunes femmes à Charleroi est de x2 = 34% avec un écart-type de
s2 = 5%.
1. Enoncez les formules d’agrégation de la moyenne et de la variance en définissant
soigneusement chacune des composantes.
2. Calculez la moyenne globale x et la variance globale s2 du taux de chômage pour
l’échantillon obtenu en regroupant les communes de Namur et de Charleroi.
Exercice 7
Roméo quitte son domicile à 20 heures pour se rendre chez Juliette à la vitesse moyenne
de 200 km/h. Il la quitte à 23 heures et retourne chez lui à la vitesse moyenne de 40 km/h.
Supposons que la distance à l’aller égale celle du retour.
1. Quelle est dans ce cas la vitesse moyenne de Roméo sur l’aller-retour ?
2. Comment calculer cette vitesse rapidement ?
Exercice 8
Une personne place une somme d’argent K dans une banque pendant une période de 3
ans. Dans cette banque le taux d’intérêt varie d’une année à une autre. Il est de 20% la
première année, 10% la seconde année et de 6% la troisième année.
1. Le taux d’intérêt moyen pour l’ensemble de ces trois années est-il de 12% ?
2. Comment calculer ce taux rapidement ?
3
Exercice supplémentaire 1
Considérons la série statistique de taille n : {x1 ; x2 ; . . . ; xn }. Montrez que :
Pn 1
Pn
1. i=1 (xi − x) = 0, si x = n xi ;
1
Pn 1
Pn i=1 2
2. sx = n i=1 (xi − x) = n i=1 xi − x2 .
2 2
Exercice supplémentaire 2
Soit {x1 , . . . , xn } une série statistique univariée de moyenne x et de variance s2x . Calculez la
moyenne et la variance de la série des valeurs centrées et réduites {z1 , . . . , zn } où zi = xis−x
x
.
Exercice supplémentaire 3
On a calculé la moyenne et la variance d’une série de 10 observations et on a obtenu
les résultats suivants : x = 5.9 et s2x = 4.83. On a constaté ultérieurement qu’une des
observations initiales avait été transcrite de façon erronée : la valeur considérée au cours
des calculs était 8.5 alors que la valeur exacte est en réalité 6.5. La moyenne et la variance
sont recalculées sur les données corrigées. Calculez la moyenne et la variance exactes.
Exercice supplémentaire 5
Construisez deux séries statistiques univariées constituées de 6 observations chacune,
{x1 , x2 , . . . , x6 } et {y1 , y2 , . . . , y6 }, telles que,
1. x1/2 = y1/2 mais x̄ > ȳ, où x1/2 et y1/2 désignent les médianes des deux séries
statistiques.
2. x1/2 = y1/2 mais EDx > EDy , où EDx et EDy désignent les deux écarts interdéciles
des deux séries statistiques.
3. Ex = Ey mais x̄ > ȳ, où Ex et Ey désignent les deux étendues des deux séries
statistiques.
4. xM = yM et x̄ > ȳ, où xM et yM désignent les modes des deux séries statistiques.
5. x̄ = ȳ et sx > sy .
4
Université Libre de Bruxelles Année académique 2008-2009
STAT-D-101
Catherine Dehon
1
1
Séances 5, 6 et 7 2 : Introduction à la théorie probabiliste
Exercice 1
a) Avec les chiffres 0 et 1, on peut former 8 séquences de longueur 3 : 000, 001, 010, 011, 100,
101, 110, 111. Combien de séquences de longueur 10 peut-on former ?
b) Combien de mots de longueur 100 peut-on former avec les lettres K, A, H, J, D, I ?
c) Combien de mots de longueur n peut-on former avec un alphabet de m lettres ?
Exercice 2
Trois filles (Annie, Julie et Nathalie) et trois garçons (Damien, Eric et Jonathan) font la file devant
un distributeur automatique de billets.
a) Il y a combien d’arrangements possibles ?
b) Il y a combien d’arrangements possibles si les trois filles doivent être ensemble et les trois
garçons doivent être ensemble ?
c) Il y a combien d’arrangements possibles si on exige seulement que les trois filles soient
ensemble ?
Exercice 3
On lance simultanément deux dés numérotés de 1 à 6. Déterminer l’ensemble fondamental Ω dans
les cas suivants :
a) les deux dés sont distincts (par exemple un rouge et un bleu).
b) les deux dés sont identiques.
c) les deux dés sont identiques et on s’intéresse seulement à la parité du résultat.
Exercice 4
Soit L’expérience aléatoire consistant au lancé de deux dés à 6 faces. Nous sommes intéressés par
les deux évènements suivants :
– A : avoir comme résultat deux fois le même nombre (la même face)
– B : avoir au moins une fois la face numérotée 5.
a) Démontrez à partir des 3 axiomes définissant la probabilité que :
b) Calculez chacune des 4 probabilités énoncées dans la formule par rapport au cas concret
explicité ci-dessus et montrez que l’égalité énoncée ci-dessus est bien correcte.
c) Les événements A et B sont-ils dépendants ? mutuellement exclusifs ?
1
Les énoncés sont disponibles sur le site www.ulb.ac.be/soco/statrope
1
Exercice 5
Dix couples sont réunis dans une soirée. On admet que, pour danser, chaque homme choisit une
femme au hasard.
a) Quelle est la probabilité pour que chacun des 10 hommes danse avec son épouse ?
b) Quelle est la probabilité pour que monsieur Dupond danse avec son épouse ?
c) Quelle est la probabilité pour que monsieur Dupond et monsieur Durand dansent avec leur
épouse ?
d) Quelle est la probabilité pour que monsieur Dupond ou monsieur Durand dansent avec leur
épouse ?
Exercice 6
On cherche une lettre qui a la probabilité 0.2 de se trouver dans l’un des quatre tiroirs d’un
secrétaire. On note A l’événement “la lettre est dans le quatrième tiroir” et B l’événement “la
lettre n’est pas dans les trois premiers tiroirs”.
a) Calculez les probabilités P (A ∩ B), P (B ∩ Ā) et P (A ∩ B̄).
b) En déduire les probablités P (A), P (B) et P (A|B).
c) Les événements A et B sont-ils indépendants ?
Exercice 7
Sept personnes prennent place au rez-de-chaussée dans un ascenseur d’un immeuble de dix étages.
Chacune choisit l’étage où elle sort de l’ascenseur. Quelle est la probabilité que :
a) elles sortent toutes à des étages différents ?
b) deux personnes au moins descendent à un même étage ?
c) trois personnes déterminées à l’avance descendent à un même étage et toutes les autres à
des étages différents ?
d) trois personnes (n’importe lesquelles) descendent à un même étage et toutes les autres à des
étages différents ?
e) trois personnes (n’importe lesquelles) descendent à un même étage, deux autres (n’importe
lesquelles) descendent à un autre étage et les deux dernières encore à un autre étage ?
Exercice 8
Un livre contient cinq fautes d’orthographe. A chaque relecture, on a une probabilité de 1/3 de
détecter et de corriger une faute. On effectue successivement plusieurs relectures indépendantes.
Soit n le nombre de relectures nécessaires pour qu’il ne reste aucune faute avec une probabilité
supérieure ou égale à 0.9.
a) Pour chaque faute, quelle est la probabilité pour qu’elle soit corrigée en n relectures ?
b) Quelle est la valeur minimale de n ?
Exercice 9
Dans une rue, un panneau publicitaire est remarqué par un passant sur quatre. On suppose que,
pour un passant, l’événement ” remarquer le panneau numéro i ” est indépendant de l’événement
” remarquer le panneau numéro j ”.
a) Sachant que l’on dispose de deux panneaux dans la même rue, calculer la probabilité qu’un
passant remarque exactement un seul panneau publicitaire.
2
b) Sachant que l’on dispose de trois panneaux dans la même rue, calculer la probabilité qu’un
passant remarque au moins un panneau publicitaire.
c) Combien doit-il y avoir de panneaux pour que plus de 95% des passants remarque au moins
une publicité ?
Exercice 10
Dans l’entrepôt d’une certaine usine de fabrication de clous, 50% des clous ont été fabriqués par
la machine A, 30% par la machine B et 20% par la machine C. Parmi les clous fabriqués par la
machine A, 3% sont défectueux. Parmi ceux fabriqués par la machine B, 5% sont défectueux et
parmi ceux fabriqués par la machine C, 8% sont défectueux. On tire un clou au hasard d’un lot
constitué de clous fabriqués.
a) Quelle est la probabilité que ce clou ne soit pas défectueux ?
b) Sachant que le clou est défectueux, quelle est la probabilité qu’il soit fabriqué par la machine
B?
Exercice supplémentaire 1
Une personne rentre chez elle après une soirée un peu trop arrosée. Elle ne sait plus laquelle des 10
clés qui se trouvent dans sa poche ouvre la porte de son domicile. Elle essaie donc les clefs une à
une sans utiliser deux fois la même. Déterminer la probabilité pour que la k-ième clé soit la bonne
(1 ≤ k ≤ 10).
Exercice supplémentaire 2
On cherche un parapluie qui se trouve dans un immeuble de sept étages. La probabilité qu’il se
trouve dans l’un des sept étages est 0.6 et qu’il se trouve au rez-de-chaussée est 0.4. Chacun des sept
étages est susceptible de cacher le parapluie avec la même probabilité. On a fouillé les six premiers
étages et on en a rien trouvé. Quelle est la probabilité que le parapluie se trouve au septième étage ?
Exercice supplémentaire 3
Deux étudiants et 14 étudiantes sont assis au hasard sur 16 chaises formant une ligne.
a) Quelle est la probabilité que les deux étudiants soient assis un à côté de l’autre ?
b) Quelle est la probabilité que les deux étudiants occupent les deux extrémités de la ligne ?
Exercice supplémentaire 4
Deux étudiants et 14 étudiantes sont assis au hasard sur 16 chaises formant un cercle.
a) Quelle est la probabilité que les deux étudiants soient assis un à côté de l’autre ?
b) Quelle est la probabilité que les deux étudiants occupent deux chaisses diamétralement op-
posées ?
Exercice supplémentaire 5
On tire au hasard un nombre de 9 chiffres. Calculez la probabilité p que tous les chiffres soient
différents.
3
Exercice supplémentaire 6
Soient A et B des événements tels que P (A) = 51 et P (A ∪ B) = 12 .
a) Supposons que A et B soient des événements mutuellements exclusifs. Calculez P (B).
b) Supposons que A et B soient des événements indépendants. Calculez P (B).
Exercice supplémentaire 7
Une étude a classé les gérants de portefeuilles en deux catégories : ceux qui sont bien informés et
ceux qui ne le sont pas. Lorsqu’un gérant bien informé achète une valeur boursière pour son client,
la probabilité que le cours de celle-ci monte est de 0,8. Dans le cas d’un gérant mal informé, cette
probabilité ne vaut que 0,5. Si on choisit au hasard un gérant dans un annuaire professionnel, la
probabilité qu’il soit bien informé est de 0,2. Calculez la probabilité qu’un gérant choisi au hasard
soit mal informé, sachant que la valeur qu’il a achetée a monté.
Exercice supplémentaire 8
Un étudiant répond à une question à choix multiple. De deux choses l’une : soit il connaı̂t la réponse,
soit il la devine. Soit p la probabilité que l’étudiant connaise la réponse (et donc 1 − p celle qu’il
la devine). On admet que l’étudiant qui tente de deviner la réponse, répondra correctement avec
une probabilité 1/m, où m est le nombre de modalité qu’offre la question. Quelle est la probabilité
qu’un étudiant connaisse la réponse à la question s’il y a répondu correctement ?
Exercice supplémentaire 9
Un étudiant doit suivre 2 cours de math (M1, M2), 3 cours de chimie (C1, C2, C3), et 4 cours de
physique (P1, P2, P3, P4). Il décide de n’assister qu’à 3 cours. S’il choisit au hasard, quelle est la
probabilité qu’il assiste aux deux cours de math ? n’assiste à aucun cours de math ? n’assiste qu’à
un cours de math ?
Exercice supplémentaire 10
On considère une classe de 42 élèves. On suppose qu’il n’y a pas d’année bissextile.
a) Quelle est la probabilité pour que deux élèves au moins aient la même date d’anniversaire ?
b) Quelle est la probabilté pour qu’au moins un élève ait la même date d’anniversaire que
Socrate ?
Exercice supplémentaire 11
Dans une classe de 21 étudiants, une personne raconte une histoire à une seconde personne qui la
raconte à une troisième et ainsi de suite. A chaque étape, l’individu, à qui l’on raconte l’histoire,
est choisi au hasard. Chacune des étapes est indépendantes des autres. Notons p1 la probabilité que
l’histoire ne revienne pas à son inventeur et p2 la probabilité qu’elle ne soit jamais répétée deux
fois à la même personne. L’histoire étant racontée 8 fois, calculer p1 et p2 .
Exercice supplémentaire 12
Dans une population donnée, un individu peut être atteint d’une affection A avec la probabilité
pA = 1/100 et d’une affection B, indépendante de A, avec une probabilité pB = 1/20. Quelle est la
probabilité pour qu’un individu choisi au hasard soit atteint d’au moins une des deux maladies ?
4
Université Libre de Bruxelles Année académique 2008-2009
STAT-D-101
Catherine Dehon
1
Séances 7 2 et 8 : Statistique descriptive d’une série
bivariée 1
Exercice 1
Une enquête réalisée auprès des familles d’une ville comporte les deux questions suivantes :
– Combien avez-vous eu d’enfants jusqu’à ce jour ?
– Combien de télévisions avez-vous ?
En ne considérant que 257 familles ayant au moins une télévision et au moins un enfant, on
construit un tableau de contingence résumant les réponses données à ces deux questions.
Le tableau de contingence observé est le suivant :
Nombre d’enfants Y
Nombre de télévision X 1 2 3 4 5 6
1 12 11 15 15 7 10
2 9 6 8 3 4 6
3 11 12 11 15 17 10
4 10 12 11 15 17 10
Exercice 2
L’association nationale des entrepreneurs du bâtiment évalue les marchés immobiliers les
plus abordables et les moins abordables. Les données sur le revenu moyen (en milliers de
dollars) et le prix de vente moyen (en milliers de dollars) d’un échantillon de 12 marchés
immobiliers choisis parmi la liste des marchés les plus abordables, sont présentés ci-dessous
(The Wall Street Journal Almanac 1998).
1
Les énoncés sont disponibles sur le site www.ulb.ac.be/soco/statrope
1
Marché Revenu Prix
Syracuse, NY 41.8 76
Springfield, IL 47.7 91
Lima, OH 40 65
Dayton, OH 44.3 88
Beaumont, TX 37.3 70
Lakeland, FL 35.9 73
Baton Rouge, LA 39.3 85
Nashau, NH 56.9 118
Racine, WI 46.7 81
Des Moines, IA 48.3 89
Minneapolis-St. Paul, MN 54.6 110
Wilmington, DE-MD 55.5 110
Exercice 3
Dans une enquête réalisée auprès de 200 personnes en activité, deux variables qualitatives
étaient mesurées. La première consistait à savoir leur niveau d’études et la deuxième
portait sur le secteur où ils travaillaient.
Le tableau de contingence observé est le suivant :
2
Exercice supplémentaire 1
Une société de consultance a relevé le revenu annuel X (en milliers d’euros) et l’épargne
correspondante Y (en milliers d’euros) de 12 familles. Les résultats sont dans le tableau
suivant :
Famille 1 2 3 4 5 6 7 8 9 10 11 12
Revenu 21 21 19 23 19 20 24 18 19 21 21 22
Epargne 2.2 1.8 1.9 1.9 2.3 1.9 2.0 2.4 1.8 1.9 2.1 2.2
Exercice supplémentaire 2
Un échantillon de 82 femmes âgées de plus de 40 ans et ayant au moins un enfant, a été
classé selon les deux critères suivants : le nombre de frères et soeurs (vivants ou décédés)
(Y ) et le nombre d’enfants (X). Les résultats obtenus sont présentées dans le tableau
suivant :
3
Exercice supplémentaire 3
Le tableau suivant donne la répartition de 200 étudiants de première année universitaire
selon deux caractères statistiques : l’âge X et le principal sport pratiqué Y .
Exercice supplémentaire 4
Dans une classe, on a mesuré la taille (en pouces) et le poids (en livres) de 10 élèves.
L’objectif est d’étudier le poids (Y ) en fonction de la taille (X). Le tableau ci-dessous
présente les résultats obtenus par les 10 élèves
Nom Albert Alice Cindy Carol Henry July Jane Janet Jack John
Taille 69.0 56.5 65.3 62.8 63.5 57.3 59.8 62.5 62.5 59.0
Poids 112.5 84.0 98.0 102.5 102.5 83.0 84.5 112.5 84.0 99.5
4
Université Libre de Bruxelles Année académique 2009-2010
STAT-D-101
Catherine Dehon
1
1
Séances 9 et 10 2 : Analyse d’une série chronologique
Exercice 1
Pendant trois semaines consécutives, on a observé le nombre de visiteurs d’un musée dont les
jours de fermeture sont le samedi et le dimanche.
Exercice 2
Les 12 observations suivantes représentent le nombre de magasins ouverts, par trimestre et
pendant trois années, dans une station de sport d’hiver :
Trimestres
Années T1 T2 T3 T4
2002 60 30 10 85
2003 72 36 18 74
2004 86 29 20 100
1
Exercice 3
Les 10 observations suivantes représentent la valeur d’une action observée pendant 10 mois
consécutifs :
t 1 2 3 4 5 6 7 8 9 10
Y 40 41 40 39 77 70 40 17 25 39
1. Effectuez une prévision par lissage exponentiel simple de la valeur de cette action pour le
11ième mois, avec comme valeur de α = 0.3.
2. Supposons que l’observation pour le 11ième mois soit 50. Effectuez alors une prévision de
la valeur de cette action pour le 12ième mois en utilisant votre résultat en 1.
Exercice supplémentaire 1
Le tableau ci-dessous contient des valeurs expérimentales de la pression P (en Pascals) d’un
certain gaz en fonction de son volume V (en m3 ) :
P 65 50 40 35 50
V 50 60 70 80 55
On suspecte entre P et V une relation de la forme ” P.V b = c ”, où b et c sont des constantes.
1. Estimez la valeur de ces constantes en utilisant les résultats d’un certain ajustement linéaire
au sens des moindres carrés.
2. En utilisant cet ajustement, estimez la valeur de P pour le cas où V vaut 100 m3 .
Exercice supplémentaire 2
La production annuelle d’électricité pour les entreprises publiques d’un pays pendant ces 7
dernières années est :
1. Effectuez un ajustement hyperbolique ( prendre une hyperbole équilatère) sur ces données.
2. Sur base de cet ajustement, donnez une prévision de la production annuelle d’électricité
pour l’année 2005.
2
Université Libre de Bruxelles Année académique 2008-2009
STAT-D-101
Catherine Dehon
1
Séances 10 2 , 11 et 12 : Variables aléatoires et lois de
probabilité discrètes 1
Exercice 1
Soit X la variable aléatoire dont la loi est définie par le tableau suivant :
k 1 2 3 4 5
P (X = k) 0.25 0.1 0.2 p 0.35
1. Déterminer la valeur de p.
2. Calculer l’espérance mathématique et la variance de X.
3. Calculer le mode et la médiane de X.
4. Calculer la valeur de la fonction de répartition de X en 2, 2.76 et 7.
Exercice 2
On désigne par X la variable aléatoire qui représente le nombre de boules rouges obtenues
après cinq tirages avec remise dans une urne qui contient deux boules rouges et six boules
blanches.
1. Déterminer la loi de probabilité de X.
2. Calculer E(X) et V ar(X).
3. Calculer la probabilité de tirer au moins une boule rouge.
4. Calculer la probabilité que le nombre de boules rouges soit supérieur ou égal à 1 et
inférieur àu égal à 3.
5. Calculer les quantiles d’ordre 0.25, 0.5, 0.75 de X.
6. Déterminer la distribution du nombre de boules blanches, parmi les 5 boules tirées.
1
Les énoncés sont disponibles sur le site www.ulb.ac.be/soco/statrope
1
Exercice 3
Le nombre de micro-ordinateurs vendus chaque jour dans un magasin informatique suit
une loi de Poisson de moyenne 8. Calculer la probabilité que dans une journée :
1. on ne vende aucun micro-ordinateur,
2. on vende au moins un micro-ordinateur,
3. le nombre de micro-ordinateurs vendus soit supérieur ou égal à 2 et inférieur ou égal
à 6.
Exercice 4
On lance 8 balles pour atteindre une cible. Les différents lancements sont indépendants.
Si on lance une balle, la probabilité qu’elle atteingne la cible est 0.95. Soit X la variable
aléatoire qui compte le nombre de fois que la cible a été atteinte.
1. Déterminez la loi de probabilté de X.
2. Combien de balles seront nécessaires pour être sûr que la cible ait été atteinte au
moins une fois avec une probabilité supérieure ou égale à 0.99.
3. Calculez la probabilité que la cible soit atteinte au moins quatre fois.
4. Supposons qu’on lance 100 balles, calculez la probabilité que :
i) la cible soit atteinte exactement 96 fois,
ii) la cible soit atteinte plus que 92 fois.
Exercice 5
Un gardien de nuit doit ouvrir une porte dans le noir, avec 10 clefs dont une seule est
la bonne. Soit X la variable aléatoire qui compte le nombre d’essais nécessaires jusqu’à
l’ouverture de la porte. Le gardien étant ivre, il mélange toutes les clefs à chaque tentative.
1. Quelles sont les valeurs possibles de X ?
2. Calculez la probabilité de l’événement [X = k], où k est une valeur prise par X.
3. De quel type de distribution s’agit-il ?
4. Donnez les valeurs de la moyenne et de la variance de X.
5. Quelle est la probabilité que la porte soit ouverte après n tentatives ?
6. Le gardien se dit avant de commencer : “ Si j’essaie n fois, j’ai une probabilité d’au
moins 0.95 de réussir à ouvrir la porte”. Quelle est la valeur minimale de n ?
Exercice 6
Dans une urne qui contient 10 boules numérotées de 1 à 10, on extrait 3 boules avec
remise. Soient X la variable aléatoire égale au plus grand des 3 numéros tirés.
1. Quelles sont les valeurs possibles de X ?
2
2. Calculez la probabilité de l’événement [X ≤ k], où k est une valeur prise par X.
3. Déduire la loi de probabilité de X.
4. Calculez P (1 < X ≤ 3).
5. Les deux événements (X = 1) et (X = 3) sont-ils indépendants ? (Justifiez votre
réponse).
6. Calculez la probabilité que X soit paire.
Exercice 7
Soit X une variable aléatoire discrète qui ne peut prendre que les valeurs 1, 3 et 6 avec
des probabilités 14 , 12 et 14 .
1. Quelle est la fonction génératrice des moments de X ?
2. En utilisant le résultat précédent, calculez l’espérance mathématique et la variance
de X.
Exercice supplémentaire 1
Dans une entreprise travaillent 6 ouvriers et 5 employés. Le PDG, souhaitant prendre l’avis
de son personnel, interroge 7 personnes choisies au hasard parmi ces 11 personnes. Soit
X la variable aléatoire : ”nombre d’ouvriers interrogés”. Déterminer la loi de probabilité
de X.
Exercice supplémentaire 2
Une variable aléatoire X peut prendre l’une des trois valeurs 0, 1 ou 2 avec des probabilités
positives. Déterminer sa loi de probabilité sachant que E(X) = 1 et V ar(X) = 1/2.
Exercice supplémentaire 3
Soit X la variable aléatoire discrète qui associe à chaque enfant de 8 ans le nombre de
bonnes réponses qu’il fournit lors d’un test de discrimination droite-gauche des mains. X
obéit à la distribution de probabilité suivante :
3
2. Calculez le mode et la médiane de X.
3. Calculez la moyenne de X et la valeur de la fonction de répartition de X en 3.4.
4. Supposons que l’on sélectionne, par tirages aléatoires à probabilités égales avec re-
mise, un échantillon de 25 enfants de 8 ans.
i) Quelle est la distribution de probabilité de la variable aléatoire Y correspondant
au nombre d’enfants donnant 4 bonnes réponses dans l’échantillon ?
ii) A combien d’enfants donnant 4 bonnes réponses peut-on raisonnablement s’at-
tendre dans l’échantillon ?
Exercice supplémentaire 4
Soit X une loi binomiale de moyenne 3 et de variance 2. Calculez P (X = 7).
Exercice supplémentaire 5
Un gardien de nuit doit ouvrir une porte dans le noir, avec n clefs dont une seule est
la bonne. Soit X la variable aléatoire qui compte le nombre d’essais nécessaires jusqu’à
l’ouverture de la porte. Déterminez la loi de probabilité de X si le gardien essaie les clefs
une à une sans utiliser deux fois la même. Calculez l’espérance et la variance de X.
Exercice supplémentaire 6
On considère une succession d’épreuves de Bernoulli indépendantes de même paramètre.
A chaque épreuve la probabilité de succès est notée p (p ∈]0, 1[). On note X la longueur
aléatoire du “run” demarrant au premier coup, où l’on appelle “run” une succession soit de
succès ou d’échecs interrompue par l’événement contraire. Par exemple pour une séquence
débutant par SSSE...le premier run est de longueur 3 et est un run de succès. Trouver la
loi de X et son espérance.
Exercice supplémentaire 7
On considère un point M se déplaçant sur un axe d’origine O, en partant de O et par
sauts d’une unité vers la droite avec la probabilité 0.2 et vers la gauche avec la probabilité
0.8. Les sauts étant supposés indépendants.
Soit X la variable aléatoire égale à l’abscisse du point à l’issue du 8ième déplacement et
Y la variable aléatoire égale au nombre de sauts vers la droite.
1. Déterminer la loi de probabilité de Y .
2. Donner les valeurs de la moyenne et de la variance de Y .
3. Calculer les quantiles d’ordre 0.25, 0.5, 0.75 de Y .
4. Exprimer la variable aléatoire égale au nombre de sauts vers la gauche en fonction
de Y .
5. Déduire l’expression de X en fonction de Y .
4
6. Quelles sont les valeurs prises par X ?
7. Déterminer la loi de probabilité de X.
Exercice supplémentaire 8
Un fumeur dispose d’un nombre infini d’allumettes. La probabilité qu’une allumette
s’éteigne est 0.2 . Le fumeur tente d’allumer sa cigarette, chaque essai est indépendant
des autres. S’il allume sa cigarette, il cesse d’allumer des allumettes. Soit X la variable
aléatoire égale au nombre d’allumettes utilisées.
1. Quelles sont les valeurs prises par X ?
2. Calculez la probabilité de l’événement [X = k], où k est une valeur prise par X.
3. De quel type de distribution s’agit-il ?
4. Donnez les valeurs de la moyenne et de la variance de X.
5. Quelle est la probabilité qu’il réussisse à allumer sa cigarette avec n allumettes ?
6. Combien d’allumettes seront nécessaires pour qu’il réussisse à allumer sa cigarette
avec une probabilté supérieure ou égale à 0.95.
7. Pour tout k ≥ 1, montrez que
8. Sachant que le nombre d’allumettes utilisées est supérieure strictement à 10, quelle
est la probabilité qu’il réussisse à allumer sa cigarette avec exactement 18 allu-
mettes ?
Exercice supplémentaire 9
Les valeurs prises par une variable binômiale X de paramètres n et p sont affichées par
un compteur de la façon suivante :
– Si X prend une valeur non nulle, le compteur affiche correctement cette valeur.
– Si X prend la valeur 0, le compteur affiche n’importe quoi, au hasard, entre 1 et n.
On note Y la variable aléatoire “nombre affiché par le compteur”.
1. Quelle sont les valeurs prises par Y ?
2. Calculer la probabilité P (Y = k|X = 0), pour un k ∈ VY .
5
Université Libre de Bruxelles Année académique 2008-2009
STAT-D-101
Catherine Dehon
Exercices supplémentaires
Exercice 1
Questions à choix multiples : il y a au moins une réponse exacte par question.
(a) Pour une série d’observations d’une variable quantitative :
1. on peut calculer quatre quartiles ;
2. l’écart interquartile contient 50% des observations ;
3. le cinquième décile est égal à la médiane ;
4. 50% des observations sont supérieures au premier quartile ;
5. l’écart interdécile contient 90% des observations.
(b) Si on veut minimiser l’influence des valeurs extrêmes :
1. on préfère la médiane à la moyenne ;
2. on préfère l’étendue à l’écart interquartile ;
3. on préfère l’écart interdécile à l’étendue ;
4. on préfère le coefficient empirique de Yule et Kendall au coefficient de Fisher ;
5. on préfère l’écart interquartile à l’écart-type.
(c) Une étude des notes obtenues par deux groupes de première bachelor à l’ULB en
sciences économiques à un test commun a fourni les résultats suivants :
1. la note moyenne des deux groupes réunies est comprise strictement entre 14, 25
et 14, 45 ;
2. l’écart-type des notes des deux groupes réunies est supérieur strictement à
6, 12 ;
3. la médiane des notes des deux groupes réunies est égale à 12 ;
4. la distribution du premier groupe présente une asymétrie à gauche ;
5. la dispersion dans le deuxième groupe est plus importante que dans le premier.
1
(d) Soit {x1 , x2 , . . . , xn } un échantillon de données numériques, déterminez la ou les
affirmation(s) toujours exacte(s) :
1. n1 ni=1 (xi − x̄) = 0 ;
P
4. pout tout j = 1, . . . , J, Nj = n1 + n2 + . . . + nj ;
5. Nj∗ est le nombre d’observations ≤ xj ;
6. la courbe cumulative à gauche est une fonction en escalier (continue à droite).
(f) Considérons une série statistique {x1 , . . . , xn } relative à un caractère quantitatif X
et le changement d’origine et d’unité suivant :
yi = (xi − 2)/10, i = 1, . . . , n.
2
(g) Pour une variable quantitative de distribution symétrique, déterminez la ou les
affirmation(s) toujours exacte(s) :
1. 50% des observations sont supérieures à la moyenne ;
2. la moyenne est égale au mode ;
3. x3/4 − x1/4 = 2(x1/2 − x1/4 ) ;
4. n1 ni=1 (xi − x1/2 ) = 0 ;
P
(h) Pour comparer des distributions de variables statistiques exprimées dans des unités
différentes (par exemple des distributions de salaires exprimés dans des monnaies
différentes), on peut utiliser les caractéristiques suivantes :
1. la médiane ;
2. l’écart interquartile ;
3. le coefficient de variation ;
x9/10
4. le rapport interdécile x1/10
;
5. la moyenne.
(i) Soient deux événements indépendants A et B d’un même espace probabilisé tels
que : P (A) = 0, 3 et P (B) = 0, 2. Déterminez la ou les affirmation(s) correcte(s) :
1. P (A ∪ B) = 0, 44 ;
2. P (A ∩ B) = 0, 6 ;
3. P (A ∩ B) = 0, 06 ;
4. P (A \ B) = 0, 24 ;
5. P (Ā ∪ B) = 0, 84 ;
6. Ā et B̄ sont indépendants ;
7. P (Ā|B) = 0, 7 ;
8. Ā et B ne sont pas indépendants.
(j) Trois chasseurs visent simultanément un même lièvre et tirent en même temps.
Soient p1 , p2 et p3 les probabilités respectives de toucher le lièvre pour chaque
chasseur (p1 ≤ p2 ≤ p3 ), alors la probabilité que le lièvre soit touché par au moins
un des chasseurs :
1. peut être inférieure à p1 ;
2. est égale à (p1 + p2 + p3 ) ;
3. est égale à [1 − (1 − p1 )(1 − p2 )(1 − p3 )] ;
4. est comprise entre (p1 .p2 .p3 ) et (p1 + p2 + p3 ) ;
5. est comprise entre [1 − (1 − p1 )3 ] et [1 − (1 − p3 )3 ].
(k) Soient A et B deux événements d’un espace probabilisé tels que P (A) = P (B) = 43 .
Déterminez la ou les affirmation(s) toujours exacte(s) :
3
1. A et B sont des évènements mutuellement exclusifs ;
2. P (A ∩ B) ≤ P (A ∪ B) ;
3 1
3. 4
≤ P (A ∪ B) ≤ 1 et 2
≤ P (A ∩ B) ≤ 43 ;
1 3 3
4. 2
≤ P (A ∪ B) < 4
et 4
< P (A ∩ B) ≤ 1 ;
5. aucune des affirmations ci-dessus n’est correcte.
(l) Dans une classe, on a mesuré la taille (en pouces) et le poids (en livres) de 10
élèves. L’objectif est d’étudier le poids en fonction de la taille. Le tableau ci-dessous
présente les résultats obtenus pour 10 élèves (4 décimales dans cet exercice).
Nom Albert Alice Cindy Carol Henry July Jane Janet Jack John
Taille 69.0 56.5 65.3 62.8 63.5 57.3 59.8 62.5 62.5 59.0
Poids 112.5 84.0 98.0 102.5 102.5 83.0 84.5 112.5 84.0 99.5
Sachant que 1 pouce = 2.54 cm et 1 livre = 0.454 kg, déterminez la ou les affirma-
tion(s) toujours exacte(s) :
1. La pente de la droite de régression de y en x est inférieure strictement à 2.1997 ;
2. La prévision du poids chez un élève qui mesure 177.8 cm est une valeur inférieure
strictement à 116 livre ;
3. La prévision du poids chez un élève qui mesure 177.8 cm est une valeur comprise
strictement entre 53 et 55 kg ;
4. Le résidu correspondant à l’étudiant Henry est supérieure strictement à 1 kg ;
5. L’equation de la droite de régression de y en x est bien adaptée aux données.
(m) Le tableau suivant donne la répartition de 200 étudiants de première année uni-
versitaire selon deux caractères statistiques : l’âge X et le principal sport pratiqué
Y.
4
(n) Un jouet se trouve caché dans l’une des N boı̂tes fermées où un enfant le cherche.
Celui-ci ouvre une boı̂te au hasard et recommence jusqu’à ce qu’il trouve le jouet.
On suppose qu’à chaque tentative il a oublié le résultat de toutes les précédentes.
Soit X le nombre de tentatives effectuées jusqu’à la découverte du jouet. Déterminez
la ou les affirmation(s) toujours exacte(s) :
1. V ar(X) = (E(X))2 − E(X) ;
2. Il faut 5 boı̂tes pour que l’enfant ait environ trois chances sur quatre de trouver
le jouet à l’issue de ses trois premières tentatives ;
3. Aucune des affirmations ci-dessus n’est correcte ;
4. X suit une distribution géométrique de paramètre 1/N ;
5. Le jouet est trouvé à l’issue de n tentatives avec une probabilité égale à 1 −
(1 − n1 )N .
(o) Dans une urne qui contient 10 boules numérotées de 1 à 10, on extrait 3 boules
avec remise. Soient X la variable aléatoire égale au plus grand des 3 numéros tirés.
Déterminez la ou les affirmation(s) toujours exacte(s) :
1. X est une variable aléatoire Binomiale de moyenne 0.3 ;
2. La probabilité que X soit paire est comprise strictement entre 0.567 et 0.578 ;
3. La probabilité que X soit impaire est inférieure à 0.578 ;
4. 0.025 < P (1 < X ≤ 3) < 0.03 ;
5. Les deux événements (X = 1) et (X = 3) sont dépendants.
Exercice 2
Considerons la distribution des salaires (en euros) dans les entreprises du secteur privé en
france pour les années 1975 et 2005. L’intervalle de variation des salaires est partagé en 5
classes. Notons xcj le centre de la classe j et nj l’effectif de la classe j pour (j = 1, . . . , 5).
1975 2005
Classe xcj nj Classe xcj nj
1 1130 20 1 1706 20
2 1400 20 2 2030 20
3 1850 20 3 2475 20
4 2590 20 4 3200 20
5 5150 20 5 5815 20
1. Construisez les courbes de Lorentz pour les années 1975 et 2005. Comparez la
concentration des salaires entre ces deux années.
2. Calculez le coefficient de Gini pour les deux années. Interprétez ces coefficient.
5
Exercice 3
Le tableau ci-dessous présente les prix et les quantités de Coca-Cola et de BigMac achetées
par un consommateur en 2000 et 2005.
BigMac (j = 1) BigMac (j = 2)
Prix en $ (à la pièce) Quantité (pièce) Prix en $ (au litre) Quantité (litre)
(1) (1) (2) (2)
pi qi pi qi
2000(i = 0) 2 12 1.5 7
2005(i = 1) 3 13 2 10
Comment donner une mesure de la variation de prix du panier composé des ces deux
produits ?
Exercice 4
Une même somme S a été confiée à deux banques B1 et B2 pour une durée de 10 ans. Les
rendements successifs des placements effectués par les dux banques ont été les suivants :
– Bnaque B1 : 12% pendant 2 ans, puis 8% pendant 4 ans, puis 6% pendant 4 ans ;
– Bnaque B2 : 10% pendant 3 ans, puis 8% pendant 3 ans, puis 7% pendant 4 ans.
1. Calculez le taux moyen de croissance dans chaque banque.
2. A quel taux la moins performante des deux banques aurait-elle dû placer l’argent
pendant la troisième période pour égaler l’autre ?
Exercice 5
Un jeu de cartes ordinaire comprend 52 cartes. Chacune de ces 52 cartes appartient à une
couleur (le carreau, le coeur, le trèfle et le pique) et possède une valeur (2, 3, 4, 5, 6, 7, 8,
9, 10, J (valet), Q (dame), K (roi) et A (as)). Pour les questions qui suivent, on considère
une main de poker, c’est-à-dire une combinaison de 5 cartes tirées au hasard à partir d’un
jeu de 52 cartes. Quelle est la probabilité qu’une main contienne :
1. une paire, c’est-à-dire une main de poker contenant en tout 4 valeurs différentes ?
2. deux paires, (Les deux paires ne peuvent pas avoir la même valeur et la valeur de
la cinquième cartes doit être différente des valeurs des deux paires) ?
3. un brelan, c’est-à-dire une main de poker contenant trois cartes de la même valeur
(Les deux autres cartes doivent être de valeurs différentes entre elles et différentes
de la valeur commune aux trois premières cartes) ?
4. une main pleine, c’est-à-dire une main de poker contenant trois cartes d’une valeur
et deux cartes d’une autre valeur ?
5. un carré, c’est-à-dire une main de poker contenant quatre cartes de la même valeur
(et une cinquième carte quelconque) ?