Sunteți pe pagina 1din 433

i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page iii — #3


i i

Table des matières

Introduction ix

ANALYSE 1
1 Nombres réels, nombres complexes et suites numériques 3
1.1 L’ensemble des réels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 L’ensemble des complexes . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Les suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 Etude des fonctions réelles d’une variable réelle 31


2.1 Limite d’une fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3 Dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5 Complément sur les fonctions classiques . . . . . . . . . . . . . . . . . 41
2.6 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.7 Développements limités . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.8 Fonctions équivalentes, définition et opérations . . . . . . . . . . . . . 54
2.9 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3 Séries numériques 67
3.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4 Séries à termes positifs . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.5 Série quelconques. Convergence Absolue. . . . . . . . . . . . . . . . . . 70
3.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4 Intégration des fonctions réelles d’une variable réelle 77


4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 Techniques de calcul d’une intégrale . . . . . . . . . . . . . . . . . . . 80
4.3 Calcul pratique des intégrales . . . . . . . . . . . . . . . . . . . . . . . 82

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page iv — #4


i i

iv Table des matières

4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5 Equations différentielles 91
5.1 Équations différentielles linéaires du premier ordre . . . . . . . . . . . 91
5.2 Étude de l’équation avec second membre . . . . . . . . . . . . . . . . . 92
5.3 Équations différentielles linéaires du second ordre . . . . . . . . . . . . 93
5.4 Compléments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

ALGEBRE 101

6 Espaces vectoriels et applications linéaires 103


6.1 L’espace vectoriel Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.2 Espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.3 Combinaisons linéaires, sous-espaces vectoriels . . . . . . . . . . . . . . 106
6.4 Indépendance linéaire, base . . . . . . . . . . . . . . . . . . . . . . . . 108
6.5 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

7 Matrices, déterminant et systèmes linéaires 123


7.1 Calcul matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.2 Systèmes d’équations linéaires . . . . . . . . . . . . . . . . . . . . . . . 135
7.3 Le déterminant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

8 Diagonalisation des endomorphismes - matrices 157


8.1 Valeurs propres et vecteurs propres . . . . . . . . . . . . . . . . . . . . 157
8.2 Caractéristique d’une valeur propre . . . . . . . . . . . . . . . . . . . . 158
8.3 Diagonalisation d’une matrice carrée . . . . . . . . . . . . . . . . . . . 160
8.4 Application de la diagonalisation . . . . . . . . . . . . . . . . . . . . . 162
8.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

9 Polynômes et fractions rationnelles 175


9.1 Polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
9.2 Fractions rationnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
9.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

10 Applications bilinéaires et formes quadratiques 193


10.1 Applications bilinéaires . . . . . . . . . . . . . . . . . . . . . . . . . . 193
10.2 Formes quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
10.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page v — #5


i i

Table des matières v

PROBABILITES 209
11 Notion de probabilité 211
11.1 Modèle probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . 211
11.2 Probabilités conditionelles et indépendance . . . . . . . . . . . . 216
11.3 Analyse combinatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 220
11.4 Formule du binôme de Newton . . . . . . . . . . . . . . . . . . . 222
11.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

12 Variables Aléatoires Discrètes - Lois Discrètes 231


12.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
12.2 Espérance, Moments et Variance . . . . . . . . . . . . . . . . . . 235
12.3 Lois usuelles discrètes . . . . . . . . . . . . . . . . . . . . . . . . . 239
12.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

13 Variables Aléatoires Continues - Lois Continues 255


13.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
13.2 Espérance, Moments et Variance . . . . . . . . . . . . . . . . . . 258
13.3 Lois usuelles continues . . . . . . . . . . . . . . . . . . . . . . . . . 261
13.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

14 Notions de convergence 279


14.1 Convergence en probabilité . . . . . . . . . . . . . . . . . . . . . . 279
14.2 Convergence en loi . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
14.3 Convergence des lois usuelles . . . . . . . . . . . . . . . . . . . . . 284
14.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286

STATISTIQUES 295
15 Statistique descriptive 297
15.1 Séries statistiques à une dimension . . . . . . . . . . . . . . . . . . . . 297
15.2 Séries statistiques à deux dimensions . . . . . . . . . . . . . . . . . . . 304
15.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310

16 Echantillonnage et Estimation 323


16.1 Echantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
16.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
16.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

17 Tests d’hypothèse et tests de comparaison 337


17.1 Tests de conformité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
17.2 Tests de comparaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
17.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page vi — #6


i i

vi Table des matières

ANALYSE NUMERIQUE 351


18 Introduction à l’analyse numérique 353
18.1 Représentations des nombres . . . . . . . . . . . . . . . . . . . . . . . 353
18.2 Arithmétique flottante . . . . . . . . . . . . . . . . . . . . . . . . . . . 355
18.3 Normes de vecteurs et de matrices . . . . . . . . . . . . . . . . . . . . 356
18.4 Conditionnement d’une matrice . . . . . . . . . . . . . . . . . . . . . . 358
18.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

19 Méthodes directes de résolution des systèmes linéaires 367


19.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367
19.2 Méthode de Gauss-Jordan . . . . . . . . . . . . . . . . . . . . . . . . . 368
19.3 Méthode de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
19.4 Décomposition LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
19.5 Décomposition de Cholesky . . . . . . . . . . . . . . . . . . . . . . . . 374
19.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375

20 Méthodes itératives de résolution des systèmes linéaires 385


20.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
20.2 Définition et convergence . . . . . . . . . . . . . . . . . . . . . . . . . 385
20.3 Méthodes itératives linéaires . . . . . . . . . . . . . . . . . . . . . . . . 386
20.4 La méthode de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
20.5 La méthode de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . 389
20.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391

21 Résolution des équations non linéaires 397


21.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
21.2 Méthodes à base géométrique . . . . . . . . . . . . . . . . . . . . . . . 398
21.3 Méthodes itératives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
21.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405

22 Méthodes d’intégration numérique 413


22.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
22.2 Méthodes des trapèzes . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
22.3 Méthode de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
22.4 Méthode de Romberg . . . . . . . . . . . . . . . . . . . . . . . . . . . 418
22.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419

ANNEXE 423

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page vii — #7


i i

Preface

L’ouvrage
Le but de ce cours est d’introduire de façon simple et élémentaire les concepts
et les outils mathématiques de bases que l’étudiant en première et deuxième année
de Licence Informatique doit maîtriser. Il s’agit d’initier l’étudiant non seulement au
raisonnement mathématique en commençant à faire les démonstrations des premiers
résultats d’analyse et algèbre, mais aussi à la modélisation mathématique de problèmes
concrets dont la résolution s’appuie sur le calcul des probabilités effectué notamment
dans des ensembles dénombrables. L’initiation à la statistique mathématique des échan-
tillons est articulée autour de la problématique d’estimation et de tests paramétriques
pour une proportion ou une moyenne. Enfin, ce cours introduira des méthodes et des
applications fondamentales de l’analyse numérique.
Table des matières :
I. ANALYSE
Suites de nombres réels/complexes – Étude des fonctions réelles d’une variable
réelle – Séries numériques et séries de Fourier – Intégration des fonctions réelles d’une
variable réelle.
II. ALGÈBRE
Polynômes et fractions rationnelles – Espaces vectoriels – Matrices et systèmes
linéaires – Diagonalisation de matrices – Applications bilinéaires et formes quadra-
tiques.
III. PROBABILITÉS
Introduction à la théorie des probabilités – Variables aléatoires discrètes – Variables
aléatoires continues – Théorèmes des limites
IV. STATISTIQUES
Statistique descriptive – Théorie de la décision statistique – Généralité sur les tests
d’hypothèses
V. ANALYSE NUMÉRIQUE
Introduction à l’analyse numérique – Résolution des équations non linéaires –
Méthodes d’intégration numérique – Méthodes de résolution des systèmes linéaires
Les auteurs
Docteur en mathématiques appliquées, Skander Belhaj est spécialiste d’algèbre
matricielle rapide. Chercheur à l’École nationale d’ingénieurs de Tunis (LAMSIN), il
enseigne actuellement à l’Institut Supérieur des Arts du Multimédia de la Manouba
(Tunisie).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page viii — #8


i i

viii Table des matières

Maître assistant à l’Institut Supérieur des Sciences Appliquées et de Technologie


de Sousse (Tunisie), Anis Ben Aïssa est spécialiste des probabilités et statistiques.
Le public
Étudiants en première et deuxième année de Licence Informatique (effectifs : 15000)
La concurrence
• J.-P. Ramis, A. Warusfel, X. Buff, J. Garnier, et al., Mathématiques Tout-en-un
pour la Licence - Niveau L1 Cours complet avec 270 exercices corrigés, Dunod 2006 -
896 pages - 170x240 mm, 49,70 e
• J.-P. Lecoutre, Statistique et probabilités, Collection : Éco Sup, Dunod 2009 -
4ème édition - 320 pages
• A. Fortin, Analyse numérique pour ingénieurs, Press. Internationales Polytech-
niques, 2011 (4ème édition), 475 pages, 63,23 e
Les points forts
• Un manuel tout en un avec cours et exercices d’application corrigés couvrant
l’ensemble du programme.
• Un ouvrage écrit par deux spécialistes avérés du nouveau programme de mathé-
matiques en LMD.
• On notera que, les deux auteurs enseignant aussi en Tunisie, ce livre a un
débouché pour notre service export.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page ix — #9


i i

Introduction

Le but de ce cours est d’introduire de façon simple et élémentaire les concepts et


les outils mathématiques de bases que l’étudiant en première et deuxième année de
Licence Informatique doit maîtriser. Il s’agit d’initier l’étudiant non seulement au
raisonnement mathématique en commençant à faire les démonstrations des premiers
résultats d’analyse et algèbre, mais aussi à la modélisation mathématique de problèmes
concrets dont la résolution s’appuie sur le calcul des probabilités effectué notamment
dans des ensembles dénombrables. L’initiation à la statistique mathématique des échan-
tillons est articulée autour de la problématique d’estimation et de tests paramétriques
pour une proportion ou une moyenne. Enfin, ce cours introduira des méthodes et des
applications fondamentales de l’analyse numérique.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page x — #10


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 1 — #11


i i

Première partie

ANALYSE

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 2 — #12


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 3 — #13


i i

CHAPITRE 1

Nombres réels, nombres complexes et suites numériques

1.1 L’ensemble des réels


1.1.1 Ensembles ordonnés
Un ensemble E non vide est dit ordonné s’il est suivi d’une relation d’ordre, notée
” ≤ ”.
” ≤ ” est une relation binaire vérifiant :
1. reflexivité : x ≤ x, ∀x ∈ E
2. symétrique : x ≤ y et y ≤ x alors x = y, ∀x, y ∈ E
3. transitivité : x ≤ y et y ≤ z alors x ≤ z, ∀x, y, z ∈ E
Si de plus, ∀x, y ∈ E, x ≤ y ou y ≤ x, on dit que la relation ” ≤ ” est d’ordre
totale (et E est dit un ensemble totalement ordonné).
Exemple 1.1.1 (N, ≤) est un ensemble totalement ordonné.
Exemple 1.1.2 Soit E un ensemble non vide. P (E) : l’ensemble des parties de E est
un ensemble ordonné mais pas totalement. En effet, la relation ” ⊆ ” est une
relation d’ordre puisqu’elle vérifie
– la reflexivité (A ⊆ A, ∀A ∈ P (E)),
– la symétrie (A ⊆ B et B ⊆ A alors A = B, ∀A, B ∈ P (E))
– la transitivité (A ⊆ B et B ⊆ C alors A ⊆ C, ∀A, B, C ∈ P (E)).

Majorants, minorants et ensemble bornés


Soit E un ensemble ordonné et soit A une partie de E.
1. On dit qu’un élément M de E (m ∈ E) majore A (minore A) si on a : x ≤ M
(x ≥ m), ∀x ∈ A.
2. On dit que A majorée (respectivement, minorée) si A possède un majorant (respec-
tivement, un minorant).
3. Un majorant (respectivement, minorant) de A qui appartient à A est appelé le plus
grand élément de A (respectivement, le plus petit élément de A).
4. La partie A est dite bornée si et seulement si A est majorée et minorée.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 4 — #14


i i

4 Chapitre 1. Nombres réels, nombres complexes et suites numériques

0
Exemple 1.1.3 E = Q muni de la relation d’ordre pq ≤ pq0 ⇐⇒ p.q 0 ≤ p0 .q. Soit
 
1
A = 1 − tel que n ∈ N\ {0} ⊂ Q.
n
Vérifier que A est bornée de Q. En effet, on a
1
0≤1− ≤ 1, ∀n ∈ N\ {0} .
n
Donc, 1 majore A et 0 minore A. Le plus petit élément de A est 0 = 1 − 11 . Par
contre, A n’admet pas de plus grand élément ! Supposons que la valeur maximale
de A :
1
max A = 1 − avec n0 ∈ N\ {0} .
n0
1 1
Or, 1 − 2n0 >1− n0 = max A. D’où la contradiction.

Borne supérieure, borne inférieure et caractérisation de R


Soit E un ensemble ordonné et soit A une partie de E.
Définition 1.1.1 On dit qu’un élément e ∈ E est la borne supérieure de la partie A
et on note e = sup A si :
1. e majore A
2. tout majorant M de A est tel que : e ≤ M. (autrement dit e est le plus petit des
majorants de A).
Remarque 1.1.1 e = inf A ⇐⇒ e est le plus grand des minorants de A
 
e minore A
⇔ .
tout minorant m de A est tel que : e ≥ m

Proposition 1.1.1 (Caractérisation de la borne sup et inf) : Soit E un ensemble


ordonné et soit A une partie de E. Un élément e ∈ E est la borne supérieure de
A (e = sup A) si et seulement si :
1. e majore A
2. ∀e0 ∈ E : e0 < e, ∃a ∈ A tel que e0 ≤ a ≤ e.
Exemple 1.1.4 Soit
 
1
A = 1 − tel que n ∈ N\ {0} ⊂ Q.
n
On sait que min A = 0 et 1 majorant de A mais n’est pas max A. A admet-elle
une borne supérieure ? Oui, 1 = sup A en utilisant le fait que 1 majore A et pour
p
e0 = ∈ Q : e0 < 1 (p 6= q) ,
q
existe t-il un élément a ∈ A tel que e0 ≤ a ≤ e ? C’est à dire ∃?n ≥ 1, a = 1 − n1
tel que e0 = pq ≤ a = 1 − n1 ≤ 1 (toujours vrai pour n ≥ q−pq
). D’où, sup A = 1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 5 — #15


i i

1.1 L’ensemble des réels 5

Remarque 1.1.2 e ∈ E est la borne inférieure de A (e = inf A) si et seulement si


 
e minore A
⇔ .
∀e0 ∈ A : e < e0 , ∃a ∈ A tel que e ≤ a ≤ e0 .

Définition 1.1.2 On dit qu’un ensemble ordonné E vérifie l’axiome de la borne


supérieure si toute partie non vide majoré de E admet une borne supérieure.
Exemple 1.1.5 Z vérifie l’axiome de la borne supérieure. Q ne le vérifie pas !
Théorème 1.1.1 Il existe un seul corps (à isomorphisme près) commutatif totalement
ordonné vérifiant l’axiome de la borne supérieure. Ce corps est appelé le corps
des nombres réels et est noté R.

1.1.2 Propriétés des nombres réels


Théorème 1.1.2 (Principe d’Archimède) : Soit x un nombre réel strictement
positive alors, pour tout y ∈ R il existe un entier relatif n unique vérifiant :

(n − 1) x ≤ y ≤ nx

Théorème 1.1.3 (Densité de Q dans R) : Entre deux réels distincts, il existe un


rationnel.
Preuve : Soit a et b deux nombres réels distincts tels que a < b. Comme b − a > 0
d’après le principe d’Archimède, il existe un unique entier n (non nul) tel que
n (b − a) > 1. Soit m = [na] : partie entière de na ∈ R signifie que
m m+1 na + 1 1
≤a≤ ≤ = a + < b.
n n n n


1.1.3 Propriétés topologiques de la droite réelle


Intervalles de R
Un intervalle I de R est un sous-ensemble I ⊆ R tel que : ∀x, y ∈ I, le segment joignant
x à y est tout entier inclus dans I.
Définition 1.1.3 (intervalle) : On dit que I ⊆ R est un intervalle, si

∀x, y ∈ I, ∀λ > 0 : λx + (1 − λ) y ∈ I.

Définition 1.1.4 (intervalle fermé) : Soit a < b. On définit l’intervalle fermé d’ex-
trimité a et b par
[a, b] = {x ∈ R / a ≤ x ≤ b} .
Définition 1.1.5 (intervalle ouvert) : Soit a < b. On définit l’intervalle ouvert
d’extrimité a et b par

]a, b[ = {x ∈ R / a < x < b} .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 6 — #16


i i

6 Chapitre 1. Nombres réels, nombres complexes et suites numériques

Voisinage d’un point


Soit x0 ∈ R, on dit qu’une partie V de R est un voisinage de x0 s’il existe α > 0 tel
que ]x0 − α, x0 + α[ 1 ⊂ V.
Exemple 1.1.6 V = 21 , 72 est un voisinage de 2 car ]2 − 1, 2 + 1[ ⊂ V. Par contre,
 

V = 12 , 2 n’est pas un voisinage de 2 car pour tout α > 0, ]2 − α, 2 + α[ * V.


Remarques 1.1.3 Si V est un voisinage de x0 dans R alors, x0 ∈ V (donc V 6= ∅).
Remarques 1.1.4 Si V est un voisinage de x0 et si V ⊆ V 0 alors V 0 est un voisinage
de x0 .
Remarques 1.1.5 L’intersection de deux voisinages de x0 dans R est un voisinage
de x0 .

Points d’accumulation d’une partie de R


Soit A ⊆ R et soit x0 ∈ R. On dit que x0 est un point d’accumulation de la partie A
si pour tout voisinage V de x0 on a : V ∩ (A\ {x0 }) 6= ∅.
Autrement dit, si tout voisinage V de x0 rencontre A au moins en un point distinct
de x0 .
Exemple 1.1.7 Soit A = ]1, 3[ ∪ {4} et x0 = 1 est-il un point d’accumulation de A ?
La réponse est oui car ∀α > 0, (]1 − α, 1 + α[) ∩ (A\ {1}) 6= ∅.

1.2 L’ensemble des complexes


1.2.1 Construction de l’ensemble des complexes
La résolution de l’équation x2 + 1 = 0, dans R est impossible et nous conduit à
introduire un nouvel ensemble, comprenant les nombres réels et d’autres nombres
parmi lequels se trouvent des solutions de x2 + 1 = 0 ou les équations de même type :
3x2 + 5 = 0, ... . Pour cette raison, nous avons construit l’ensemble des complexes.
Définition 1.2.1 Un nombre complexe est un couple de réels. L’ensemble des nombres
complexes est donc l’ensemble R2 . On peut alors écrire

C = {(x, y) / x, y ∈ R}

ou encore,
∀z ∈ C, ∃x, y ∈ R, z = x + iy
avec i est un nombre nouveau tel que i2 = −1. De plus les réels x et y sont
uniques. Le réel x est appelé partie réelle de z, noté Re(z), et le réel y est
appelé partie imaginaire de z, noté Im(z).
Exemple 1.2.1 z1 = 2 + 4i, Re(z1 ) = 2 et Im(z1 ) = 4.

1 Intervalle ouvert de centre x0 et de rayon α.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 7 — #17


i i

1.2 L’ensemble des complexes 7

1.2.2 Notation algébrique (ou cartésienne) des complexes


Définition 1.2.2 Les complexes de la forme iy sont appelés imaginaires purs.
L’ensemble des imaginaires purs est noté iR.
Théorème 1.2.1 Tout complexe z s’écrit sous la forme z = x + iy où x est la partie
réelle de z et y est la partie imaginaire de z. C’est la notation algébrique (ou
cartésienne) de z.
Propriétés 1.2.1
Re (z) = Re (z 0 )

0
1. z = z ⇔
Im (z) = Im (z 0 )
2. z ∈ R ⇔ Im (z) = 0
3. z ∈ iR ⇔ Re (z) = 0
4. Re (z + z 0 ) = Re (z) + Re (z 0 ) et Im (z + z 0 ) = Im (z) + Im (z 0 )
5. Si α ∈ R, alors Re (αz) =α Re (z) et Im (αz) =α Im (z)
6. Formule du Binôme de Newton :
n n
n−k k
X X
∀z, z 0 ∈ C, ∀n ∈ N, (z + z 0 ) = Cnk z k (z 0 ) = Cnk z n−k (z 0 )
k=0 k=0

n!
où Cnk = k!(n−k)! est le nombre de combinaison de n par k
Exemple 1.2.2 z1 = 2 + bi, z2 = a − 5i, si z1 = z2 alors a = 2 et b = −5.

1.2.3 Module et conjugué d’un nombre complexe


Définition 1.2.3 Soit z = x+iy un complexe. On appelle conjugué de z le complexe
_ _ _ _
noté z et défini par z = x − iy. On a donc Re ( z) = Re (z) et Im ( z) = − Im (z) .
_
Exemple 1.2.2 z1 = 2 + 3i ⇒ z 1 = 2 − 3i.
Théorème 1.2.2 Soient z, z 0 ∈ C, on a :
1. z + z 0 = z + z 0
2. zz 0 = zz 0
3. z = z.
Remarques 1.2.1
– z + z = 2 Re (z) et z − z = 2i Im (z)
– z∈R⇒z=z
– z est un imaginaire pur si et seulement si z = −z
Définition 1.2.4 Soit z = x + iy un√ complexe, on appelle module de z, le réel positif
noté |z| et défini par : |z| = zz avec zz = x2 + y 2 .
Propriétés 1.2.2
1. |z| = 0 ⇔ z = 0
2. |Re (z)| ≤ |z| et |Im (z)| ≤ |z|

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 8 — #18


i i

8 Chapitre 1. Nombres réels, nombres complexes et suites numériques

3. Si z ∈ R, alors son module coïncide avec sa valeur absolue


n
4. |zz 0 | = |z| |z 0 | , en particulier, ∀n ∈ N, |z n | = |z| (ceci reste valable pour n ∈ Z,
si z 6= 0
_
5. |z| = | z|
_
6. ||z| − | z|| ≤ |z − z 0 | ≤ |z| + |z 0 | (Inégalité triangulaire)
7. Pour mettre le complexe zz0 sous forme algébrique ou cartésienne, il suffit de
multiplier en haut et en bas par z 0 .
Théorème 1.2.3 Soient z et z 0 deux complexes non nuls, |z + z 0 | = |z| + |z 0 | si et
seulement s’il existe un réel strictement positive α telque z = αz 0 .

1.2.4 Equation du second degré


Théorème 1.2.4 Soit a ∈ C, l’équation z 2 = a admet dans C deux solutions opposées
(toutes deux nulles lorsque a = 0).
Théorème 1.2.5 Soient a, b, c ∈ C avec a 6= 0, l’équation az 2 + bz + c = 0 admet
deux solutions complexes qui sont
−b + δ −b − δ
z1 = et z2 =
2a 2a
avec δ ∈ C tel que δ 2 = ∆ = b2 − 4ac (discriminant). De plus, lorsque les
coefficients a, b, c sont réels et que le discriminant b2 − 4ac est strictement négatif,
ces deux solutions sont complexes non réelles et conjuguées.
Remarque 1.2.2 La somme et le produit de ces deux solutions, sont données par les
relations :
∀z ∈ C, az 2 + bz + c = a (z − z1 ) (z − z2 ) .

Notation exponentielle
Pour tout réel x, on pose eix = cos x + i sin x. On a alors les propriétés suivantes :
1. ∀x ∈ R, e−ix = cos x − i sin x = eix
q 2 2
2. ∀x ∈ R, eix = (cos x) + (sin x) = 1
3. ∀x, y ∈ R, eix eiy = ei(x+y)
4. Soit z = x + iy un complexe et |z| = 1 = x2 + y 2 , donc il existe un réel θ tel que
x = cos θ et y = sin θ, c’est à dire z = eiθ .

cos x = cos y
5. Soient x, y ∈ R, eix = eiy ⇔ ⇔ {x ≡ y [2π] .
sin x = sin y

Formules d’Euler et de Moivre


n n
Formule de Moivre : ∀n ∈ Z, ∀x ∈ R, eix = eix = (cos x + i sin x) . On en
déduit que :
n
cos (nx) = Re ((cos x + i sin x) )
n
sin (nx) = Im ((cos x + i sin x) ) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 9 — #19


i i

1.2 L’ensemble des complexes 9

A l’aide du binôme de Newton, ces formules permettent d’exprimer cos (nx) et


sin (nx) sous forme d’un polynôme en cos (x) et sin (x) .
Formule d’Euler :
eix + e−ix eix − e−ix
∀x ∈ R, cos x = et sin x = .
2 2i
n n
Ces formules permettent la linéarisation de (cos x) et (sin x) .

Forme trigonométrique (ou polaire)


iθ ∗
Soit z ∈ C tel que |z| = 1, on sait qu’il existe θ tel que z = e . Si maintenant z ∈ C
z z iθ iθ
alors |z| = 1 donc il existe θ ∈ R tel que |z| = e , c’est à dire z = |z| e .
Définition 1.2.5 Soit z ∈ C∗ , on appelle argument de z tout réel θ tel que
z = |z| eiθ , cette égalité est appelée forme trigonométrique (ou polaire)
 z. L’ensemble iθdes
de arguments de z est noté arg (z) , on a donc arg (z) =
θ ∈ R / z = |z| e , et si θ0 est un argument de z, alors arg (z) = {θ0 + 2kπ / k ∈ Z} .
Définition 1.2.6 Soit z ∈ C∗ , z possède un unique argument dans ]−π; π] , par
définition cet argument est appelé argument principal de z et noté arg (z) .
Propriétés 1.2.3 Soient z, z 0 ∈ C∗ avec θ = arg (z) et θ0 = arg (z 0 ) .
|z| = |z 0 |

0
1. z = z ⇔
θ ≡ θ0 [2π]
2. z ∈ R∗ ⇔ θ ≡ 0 [π]
_ _
3. z = |z| e−iθ donc arg ( z) ≡ −θ [2π]
4. −z = |z| ei(θ+π) donc arg (−z) ≡ θ + π [2π]
0
5. zz 0 = |zz 0 | ei(θ+θ ) donc arg (zz 0 ) ≡ θ + θ0 [2π]
0
6. zz0 = |z|z|0 | ei(θ−θ ) donc arg zz0 ≡ θ − θ0 [2π]


7. ∀n ∈ Z, z n = |z n | einθ donc arg (z n ) ≡ nθ [2π] .

Exponentielle complexe
Définition 1.2.7 Soit z = x + iy un complexe, on appelle exponentielle de z le
complexe noté exp (z) et défini par :

exp (z) = ex [cos y + i sin y] .

Remaques 1.2.3
1. Si z ∈ R (y = 0), alors l’exponentielle de z correspond à l’exponentielle réelle
de z. D’autre part on peut écrire (pour x, y ∈ R)

exp (x + iy) = ex eiy .

2. exp (0) = 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 10 — #20


i i

10 Chapitre 1. Nombres réels, nombres complexes et suites numériques

1
3. exp (−z) = exp(z)

4. Re (exp (z)) = eRe(z) cos (Im (z)) et Im (exp (z)) = eRe(z) sin (Im (z))

5. |exp (z)| = eRe(z) et arg (exp (z)) ≡ Im (z) [2π]


_
6. exp (z) = exp ( z) .

Racine n-ièmes d’un nombre complexe

Soit a, z0 deux complexes et n ∈ N, on dit que z0 est une racine n-ième de a lorsque
z0n = a.

Théorème 1.2.6 Soit n ∈ N tel que n ≥ 2, et a ∈ C∗ . L’ensemble des racines n-ièmes


de a (que l’on note Rn (a)) est un ensemble fini de cardinal n, et pour tout
argument θ de a on a :

np θ+2kπ
o
Rn (a) = n
|a|ei n / 0≤k ≤n−1 .

Càs particuliers : racine n-ièmes de l’unité : (noté par Un )

n 2kπ o
Un = {z ∈ C∗ et |z| = 1 / z n = 1} = ei n / 0 ≤ k ≤ n − 1 .

Exemple 1.2.3 Résoudre dans C l’équation z 5 + 1 = 0.

1.2.5 Représentation géométrique des complexes


 → →
Le plan complexe est un plan ℘ muni d’un repère orthonormé direct < = o, u , v .

1.2.6 Affixe

Chaque point M du plan complexe est repéré par ses coordonnées : une abscisse x
et une ordonnée y, c’est à dire par le couple de réel (x, y) . Plus précisement, M est
repéré par le complexe z = x + iy. Par définition, ce complexe est l’affixe du point M.
Réciproquement, tout
 →complexe
  → z est l’affixe d’un point M du plan que l’on appelle
image de z. Les axes o, u et o, v sont appelés respectivement axes des réels et

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 11 — #21


i i

1.2 L’ensemble des complexes 11

axes des imaginaires.

1.2.7 Angles orientés

Soit z un complexe non nul et M le pointdu plan d’affixe z, l’argument


 −−→principal de z est
−−→
une mesure de l’angle orienté u , OM , ce que l’on écrit →

− −
u , OM ≡ Arg (z) [2π] .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 12 — #22


i i

12 Chapitre 1. Nombres réels, nombres complexes et suites numériques

1.3 Les suites


1.3.1 Généralités
Soit E un ensemble.
Une suite d’éléments de E est une application

u: N −→ E
n 7−→ u (n) = un
 
L’élément un est dit le n-ème terme de la suite u u = (un )n≥0 .
Lorsque E = R ou C, on dit que la suite est réelle (ou de nombres réels) ou
complexe (ou de nombres complexes).
 √ 
Exemple 1.3.1 n2 n≥0 , sin n π3 n≥0 , 2n + i 23
 
.
n≥0

Opérations sur les suites réelles


Soit (un )n≥0 et (vn )n≥0 deux suites de nombres réels et soit λ ∈ R.
Somme :
(un )n≥0 + (vn )n≥0 = (un + vn )n≥0 .
Produit :
(un )n≥0 . (vn )n≥0 = (un vn )n≥0 .
Produit par un scalaire :

λ. (vn )n≥0 = (λvn )n≥0 .

Remarques 1.3.1
– Une relation d’ordre est définie sur un ensemble des suites A (N,R) de la façon
suivante :
(un )n≥0 ≤ (vn )n≥0 ⇐⇒ ∀n ∈ N, un ≤ vn .
– La suite (un )n≥0 est dite inférieure ou égale à la suite (vn )n≥0 à partir d’un
certain rang s’il existe n0 ∈ N tel que ∀n ≥ n0 , un ≤ vn .

Quelques propriétés des suites de nombres réels


– Une suite (un )n≥0 est dite majoré (respectivement, minoré) à partir d’un certain
rang s’il existe M ∈ R tels que un ≤ M, ∀n ≥ 0 (respectivement, il existe m ∈ R,
un ≥ m, ∀n ≥ 0).
– Une suite (un )n≥0 est dite bornée si elle est à la fois majorée et minorée : s’il
existe m ∈ R, M ∈ R : m ≤ un ≤ M, ∀n ≥ 0 (c’est à dire, il existe M ≥ 0 :
|un | ≤ M, ∀n ≥ 0).
– Une suite (un )n≥0 est dite croissante si un ≥ um , ∀n ≥ m.
– Une suite (un )n≥0 est dite décroissante si un ≥ um , ∀n ≤ m.
– Une suite (un )n≥0 est dite monotone si elle est croissante ou décroissante.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 13 — #23


i i

1.3 Les suites 13

– Suites extraites : Soit u = (un )n≥0 : N −→ R une suite de nombres réels et


ρ : N −→ N une application strictement croissante. La suite

uρ ≡ u ◦ ρ : N −→ R

est une suite de nombres réels appelée suite extraite de u.


Exemple 1.3.2 La suite (u2n )n≥0 est une suite extraite de (un )n≥0 . En effet, u2n =
u ◦ ρ (n) où ρ (n) = 2n (strictement croissante). De même, la suite (u2n+1 )n≥0
est une suite extraite de (un )n≥0 .

1.3.2 Suites convergentes


Définition 1.3.1 On dit que la suite (un )n≥0 de nombres réels converge vers l ∈ R
quand n tend vers +∞ et on écrit : lim un = l si :
n→+∞

∀ > 0, ∃N ∈ N, ∀n ≥ N : |un − l| < .

1
Exemple 1.3.2 Vérifier que lim = 0. En effet, soit  > 0 : montrons qu’il existe un
n→+∞ n
tout n ≥ N : |un − l| = n1 < . Posons N = 1 + 1 ∈ N.
 
entier N tel que
 1 pour
Soit n ≥ N =  + 1 > 1 ⇒ n1 < .


Exemple 1.3.3 Trouver un rang N tel que pour tout n ≥ N, sin n14 < 10−6 . En
1 1 −6
effet,
h √ on i a sin n4 ≤ n4 < 10 pour tout n ≥ 0. D’où, le rang cherché est

4
106 + 1.
Proposition 1.3.1 (Unicité de la limite) : La limite d’une suite de nombres réels
convergente est unique.
Preuve : Supposons que

lim un = l et lim un = l0 avec l 6= l0 .


n−→+∞ n−→+∞

Comme un converge vers l alors par définition ∀ > 0, ∃N ∈ N, ∀n ≥ N :


|un − l| < . et comme un converge vers l0 alors par définition ∀0 > 0, ∃N0 ∈ N,
∀n ≥ N0 : |un − l0 | < 0 . Considérons |l − l0 | = |l − un + un − l0 | ≤ |un − l| +
| {z }
<
|un − l0 |. Posons M = max (N , N0 ) ,  > 0 et 0 > 0 fixés. Donc, ∀k ≥ M :
| {z }
<0
|l − l0 | <  + 0 . En particulier pour  = η2 et 0 = η
2,η > 0, on peut écrire
|l − l0 | < η. Donc, l = l0 . Ce qui est absurde.
Proposition 1.3.2 Soit (un )n≥0 une suite de nombres réels convergente vers l > 0
alors, il existe N ∈ N : ∀n ≥ N : un > 0.
Proposition 1.3.3 Toute suite convergente est bornée.
Proposition 1.3.4 Soit (un )n≥0 une suite de nombres réels convergente vers l ∈ R.
Toute suite (vk )k≥0 extraite de (un )n≥0 est convergente vers la même limite l.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 14 — #24


i i

14 Chapitre 1. Nombres réels, nombres complexes et suites numériques

Opérations sur les limites convergentes


Soit (un )n≥0 et (vn )n≥0 deux suites de nombres réels et soit λ ∈ R.
Proposition 1.3.5
 
(un + vn )n≥0 −→ l1 + l2
un −→ l1
! n→+∞
n→+∞ (u .v ) −→ l .l
 
1. =⇒ 
 n n n≥0 n→+∞ 1 2

vn −→ l2 
n→+∞ (λvn )n≥0 −→ λl1
n→+∞
   
2. un −→ l =⇒ |un | −→ |l|
n→+∞ n→+∞

un −→ l1
!  

n→+∞ un l1
3. =⇒ −→ .
vn −→ l2 6= 0 vn l
n≥0 n→+∞ 2
n→+∞
q
n+1 1
Exemple 1.3.4 Convergence de la suite : un = n sin n , n ≥ 1 puisque an =
q
n+1
n −→ 1 et bn = sin n1 −→ 0 et alors (un )n≥0 est convergente vers 0.
n→+∞ n→+∞
Proposition 1.3.6 (Passage à la limite dans les inégalités) :
Soit (un )n≥0 et (vn )n≥0 deux suites de nombres réels convergentent, respectivement
vers l1 et l2 . Si un ≤ vn alors l1 ≤ l2 .
Exemple 1.3.5 Etude de la suite un = an avec a ∈ R+ .
– Si a = 0, lim un = 0.
n→+∞
h in
1 −1
– Si 0 < a < 1 : écrivons a = 1+b , b > 0. Alors, un = (1 + b) . Par la formule
1
de binôme, on a 0 ≤ un ≤ 1+nb . Par passage à la limite dans les inégalités :
lim un = 0.
n→+∞
– Si a = 1, lim un = 1.
n→+∞
n
– Si a > 1, a = 1 + b, b > 0. Alors, un = (1 + b) ≥ 1 + nb −→ +∞. Ainsi,
n→+∞
(un )n≥0 est divergente 2 .

Quelques critères de convergence


Théorème 1.3.1 Toute suite de nombres réels croissante et majorée (respectivement,
décroissante et minorée) est convergente. Sa limite est sa borne supérieure
(respectivement inférieure).
Exemple 1.3.6 Soit
n
X 1 1 1
un = =1+1+ + ··· + .
p=0
p! 2 n!

2 Voir paragraphe "Suites divergentes et limite infinie"

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 15 — #25


i i

1.3 Les suites 15

Trouver la borne supérieure de (un )n≥0 . Poucela, il suffit de vérifier la convergence


de (un )n≥0 : croissante et majorée. En effet, on a
1 1
≤ p−1 , ∀p ≥ 1.
p! 2
Il en resulte que
n n
X 1 X 1
un = 1 + ≤1+ p−1
.
p=1
p! p=1
2
Or, n
n
X 1 1 − 21
=
p=1
2p−1 1 − 12
(progression géométrique). D’où,
3 = lim un = sup (un )n≥0 .
n→+∞

Définition 1.3.2 (Suites adjacentes) : On dit que deux suites (un )n≥0 et (vn )n≥0
sont adjacentes si :
1. L’une est croissante et l’autre est décroissante.
2. lim (un − vn ) = 0
n→+∞

Théorème 1.3.2 Deux suites adjacentes sont convergentes et ont même limite.
Exemple 1.3.7 Montrer que les deux suites suivantes sont adjacentes :
n
X 1 1
un = et vn = un + .
p=0
p! n!

1.3.3 Suites de Cauchy


Définition 1.3.3 On dit qu’une suite (un )n≥0 de nombres réels est de Cauchy si :
∀ > 0, ∃N ∈ N, ∀n, m ∈ N, n ≥ N et n ≥ m : |un − um | < .
Autrement dit :
∀ > 0, ∃N ∈ N, ∀n ∈ N, n ≥ N et ∀p ∈ N : |un+p − un | < .
n
!
X
1
Exemple 1.3.8 p! est de Cauchy. Car,
p=0 n≥0

n+p m−1 m
X 1 1 X 1 1 1 − 21 1
|un+p − un | ≤ = = ≤ n−1 .
p=n+1
2p−1 2n p=1 2p 2n 1 − 12 2

Proposition 1.3.7 Toute suite de Cauchy de nombres réels est bornée.


Théorème 1.3.3 (de Cauchy) : Une suite de nombres réels est convergente si et
seulement si elle est de Cauchy.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 16 — #26


i i

16 Chapitre 1. Nombres réels, nombres complexes et suites numériques

1.3.4 Suites divergentes et limite infinie


Définition 1.3.4 On dit qu’une suite de nombres réels (un )n≥0 tend vers +∞ (res-
pectivement, vers −∞) quand n tend vers +∞ si :

∀A ∈ R, ∃NA ∈ N, ∀n ≥ NA : un ≥ A.

(respectivement, ∀B ∈ R, ∃NB ∈ N, ∀n ≥ NB : un ≤ B).


Exemple 1.3.9 La suite un = an avec a > 1 tend vers +∞ quand n tend vers +∞ :
lim un = +∞. En effet, soit A ∈ R cherchons NA ∈ N, ∀n ≥ NA : an ≥ A.
n→+∞ 
 ln A0 si A ≤ 0
Posons NA =
ln a + 1 si A > 0
Définition 1.3.5 Une suite de nombres réels (un )n≥0 est dite divergente si elle
n’admet pas de limite ou si elle tend vers ±∞ quand n tend vers +∞.
Proposition 1.3.8
– Une suite de nombres réels croissante et non majorée tens vers +∞ quand n
tend vers +∞.
– Une suite de nombres réels décroissante et non minorée tens vers −∞ quand n
tend vers +∞.

1.3.5 Suites de nombres complexes


Proposition 1.3.9 La suite (zn = xn + iyn )n≥0 de nombres complexes converge vers
l = x + iy si et seulement si lim xn = x et lim yn = y.
n→+∞ n→+∞

Preuve :
” ⇒ ” On suppose lim zn = l. Par définition, on a
n→+∞

∀ > 0, ∃N ∈ N, ∀n ≥ N : |zn − l| < .

Or,
q
2 2
|zn − l| = (xn − x) + (yn − y) .

Ainsi, |xn − x| ≤ |zn − l| et |yn − y| ≤ |zn − l| . Donc,

∀n ≥ N : |xn − x| <  et |yn − y| < .

xn −→ x xn −→ x
! !
n→+∞ n→+∞
”⇐” ⇒ ⇒
yn −→ y iyn −→ iy
n→+∞ n→+∞

zn = xn + iyn −→ x + iy = l.
n→+∞

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 17 — #27


i i

1.4 Exercices 17

1.4 Exercices
1.4.1 Enoncés
Exercice 1 :
Soient a et b deux nombres réels vérifiant :

0 ≤ a ≤ 5 et 3 ≤ b < 8.

Donner un encadrement de a + b, a − b, ab et a × b.
Exercice 2 :
Déterminer chacun des ensembles suivants :
 
x−1
A = x ∈ R tels que ≥0
(x + 1) (x − 2)
B = {x ∈ R tels que |x + 1| < |x − 3|}
C = {x ∈ R tels que |x + 1| + |x + 2| < 1} .

Exercice 3 :
Soient A et B deux parties non vides et majorées de R.
1. Montrer que si A ⊂ B alors sup A ≤ sup B.
2. Montrer que

sup (A ∪ B) = max (sup A, sup B) ,


inf (A ∪ B) = min (inf A, inf B) .

3. Montrer que

max (inf A, inf B) ≤ inf (A ∩ B) ≤ sup (A ∩ B) ≤ min (sup A, sup B) .

Exercice 4 :
Soit A une partie de R définie par :

A = r ∈ Q / r2 − 3r + 1 < 0 .


1. Montrer que A est non vide et bornée.


2. La partie A admet-elle une borne supérieure, une borne inférieure dans R ?
Exercice 5 :
Donner lorsqu’ils existent le plus grand élément, le plus petit élément, la borne
supérieure et la borne inférieure des ensembles suivants :
 
n−1
A = N, B = {1} ∪ ]2, +∞[ , C = , n∈N .
n+1

Exercice 6 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 18 — #28


i i

18 Chapitre 1. Nombres réels, nombres complexes et suites numériques

Calculer
[ 1  \ [
,1 , [n, +∞[ , [n, n + 1[ ,
n
n≥1 n≥0 n≥0
[ 1
 \
1 1

−∞, , 1 − ,1 + .
n n n
n≥1 n≥1

Exercice 7 :
Ecrire sous forme cartésienne les nombres complexes suivants :

2 − 3i 3 + 4i  π
z1 = √ , z2 = , z3 = exp (3iπ) , z4 = π exp −i ,
3 − 2i (2 + 3i) (4 + i) 3
  9
5π (1 + i)
z5 = exp −i , z6 = 5.
4 (1 − i)
Exercice 8 :
n+1
1. Montrer que si z ∈ C\{1} alors 1 + z + z 2 + · · · + z n = z z−1−1 .
n
P Pn
2. En déduire, pour θ ∈ ]0, 2π[ , cos (kθ) et sin (kθ) .
k=0 k=0
Exercice 9 :
Résoudre dans C les équations suivantes :
(E1) z 2 + (−3 + i) z + 4 − 3i = 0,
(E2) z 8 + z 4 +√1 = 0,
1+i√3
(E3) z 6 = 1−i 3
.

Exercice 10 :
1. Trouver le module et l’argument des nombres complexes suivants :
√  √ 5
z1 = −2 + 2i , z2 = −1 + 3i , z3 = −1 + 3i .

2. En déduire la forme polaire de ces nombres complexes.


Exercice 11 : 
Soit z = exp 2iπ
7 , S = z + z 2 + z 4 et T = z 3 + z 5 + z 6 .
1. Montrer que S et T sont conjugués et que la partie imaginaire de S est positive.
2. Calculer S + T et ST. En déduire S et T .
Exercice 12 :
Soit α ∈ ]−π/2, π/2[ , n ∈ N∗ et λ ∈ C, |λ| = 1.
1+i tan α 2iα
1. Soit z0 = 1−i tan α . Vérifier que z0 = e .
2. Montrer que
i (1 − λ) Im (λ)
=
λ+1 1 + Re (λ)
où Im (λ) et Re (λ) désignent la partie imaginaire
 et la partie réelle du complexe
λ. (On pourra vérifier que (1 + λ) 1 + λ = 2 + 2 Re (λ))

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 19 — #29


i i

1.4 Exercices 19

3. Déterminer les complexes z solutions de l’équation


 n
1 + iz 1 + i tan α
= .
1 − iz 1 − i tan α

Exercice 13 :
Soit (un )n≥0 la suite définie par :

1 si n = 0
un = 1 1
2 un−1 + 4 si n ≥ 1

1. Montrer que (un )n≥0 est décroissante.


2. Montrer que (un )n≥0 est minorée.
3. Vérifier que 12 est la borne inférieure de (un )n≥0 (Indication : inf (un )n≥0 = inf E
avec E = {u0 , u1 , . . . , un , . . .}).
Exercice 14 :
Soit (un )n≥0 la suite de terme générale définie par :

u0 = 0  n1
et un+1 = n + un−1
n , n ≥ 1.
u1 = 1
 1
 n−1
n(n−1)
1. Montrer que un = 1 + 2 , n ≥ 2.
2. Montrer que la suite (ln un )n≥1 est convergente et calculer sa limite.
3. En déduire que la suite (un )n≥0 est convergente et sa limite est égale à 1.
Exercice 15 :
Soit la suite (un )n≥0 de nombres réels définie par :

u0 = 0 1
1 + un+1 + u2n .

et un+2 =
u1 = 12 3

1. Montrer que la suite (un )n≥0 est croissante et à valeurs dans [0, 1] (on pourra
raisonner par récurrence sur n).
2. Montrer que la suite (un )n≥0 est convergente et calculer sa limite.
Exercice 16 :
On considère (un ) une suite réelle. On suppose que les suites (u2n ) et (u2n+1 ) sont
convergentes. La suite (un ) est-elle convergente ? Discuter.
Exercice 17 :
On se propose d’étudier la nature de la suite :
1 1 n−1 1
un = 1 − + + · · · + (−1) , n ∈ N∗ .
2 3 n
1. Montrer que la suite (u2n ) est croissante, majorée par 1.
2. Montrer que la suite (u2n+1 ) est décroissante, minorée par 21 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 20 — #30


i i

20 Chapitre 1. Nombres réels, nombres complexes et suites numériques

3. Montrer que pour tout n ≥ 1, u2n < u2n−1 et que les suites (u2n ) et (u2n+1 )
tendent vers la même limite. Conclure.
Exercice 18 :
On considère deux suites (un ) et (vn ) définies par :
 
u1 = 1 v1 = 1
un+1 = 5un6+vn vn+1 = un +2v
3
n

1. Etudier le signe de vn − un et la limite de vn − un .


2. Montrer que la suite (un )n≥1 (respectivement, (vn )n≥0 ) est croissante (respecti-
vement décroissante).
3. Déduire des équations précédentes que (un ) et (vn ) sont deux suites adjacentes,
donc convergent vers la même limite l.
4. Calculer l.
Exercice 19 :
En utilisant le critère de Cauchy, étudier les suites suivantes :
n−1
1 1 (−1)
1. un = 1 − 2 + 3 + ··· + n
1 1
2. un = 1 + 2 + · · · + n
3. un = 1 + √1 + · · · + √1
2 n

Exercice 20 : q
1
Soit (un ) une suite réelle définie par u0 = 1 et un+1 = u2n + 2n .

1. Montrer que ∀n ∈ N∗ , 1 ≤ un+1 < un + 1


2n+1 .
2. Montrer que (un ) est de Cauchy. Donner une valeur approchée de sa limite à
10−3 prés.

1.4.2 Corrigés
Exercice 1 :
– 3 ≤ a + b ≤ 13
– −8 ≤ a − b ≤ 2
– 0 ≤ ab ≤ 35
– 0 ≤ a × b ≤ 40.
Exercice 2 :
– A = ]−1, 1] ∪ ]2, +∞[
– B = ]−∞, 1[
– C = ∅.
Exercice 3 :
Soient A et B deux parties non vides et majorées de R.
1. Comme R vérifie l’axiome de la borne supérieure alors A admet une borne
supérieure dans R. Il suffit donc de montrer que sup B est un majorant de
A ? Soit x ∈ A ⊂ B alors x ∈ B et comme sup B et un majorant de B alors
x ≤ sup B. D’où, sup A ≤ sup B.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 21 — #31


i i

1.4 Exercices 21

2. Montrer que sup (A ∪ B) = max (sup A, sup B) ? On a

A ⊂ A ∪ B ⇒ sup (A) ≤ sup (A ∪ B) ,


B ⊂ A ∪ B ⇒ sup (B) ≤ sup (A ∪ B) .

alors sup (A ∪ B) ≥ max (sup A, sup B) . Il suffit de montrer que max (sup A, sup B)
est un majorant de A ∪ B. En effet, soit x ∈ A ∪ B alors x ∈ A ou x ∈ B c’est
à dire x ≤ sup A ou y ≤ sup B. Donc, x ≤ sup (A ∪ B) . D’où, le résultat. On
montre de même inf (A ∪ B) = min (inf A, inf B) .
3. On a

(A ∩ B) ⊂ A ⇒ sup (A ∩ B) ≤ sup (A) ,


(A ∩ B) ⊂ B ⇒ sup (A ∩ B) ≤ sup (B) .

Donc,
sup (A ∩ B) ≤ min (sup A, sup B) .
De même, on a
max (inf A, inf B) ≤ inf (A ∩ B) .
Exercice 4 :
 √ √ 
3− 5 3+ 5
A = r ∈ Q / r2 − 3r + 1 < 0 =

, ∩ Q.
2 2
√ √
1. Comme Q dense dans R, alors il existe r dans Q tel que 3−2 5 < r < 3+2 5 . Donc,
√ √
A est non vide. De plus, 3+2 5 est un majorant de A et 3−2 5 est un minorant
de A donc A est bornée.
2. Comme R vérifie l’axiome de la borne supérieure alors la partie A admet une
borne supérieure et une borne inférieure dans R.
Exercice 5 :
– A = N : 0 est le plus petit élément de N car 0 est un minorant de N et 0 ∈ N,
donc 0 est la borne inférieure de N et aussi un minorant. N n’admet pas un
majorant. En effet, soit M ∈ R, montrer qu’il existe n ∈ N / n > M. Pour
n0 = E (M ) + 1, on a n0 > M donc M n”est pas un majorant de N. Ainsi, N
n’admet pas ni de majorant, ni de borne supérieure, ni de plus grand élément.
– B = {1} ∪ ]2, +∞[ . On voit que 1 est le plus petit élément de B donc inf B = 1.
D’autre part, B n’admet pas de majorant car si M est un majorant, on a M > 2.
On a M + 1 > r et M + 1 ∈ B donc c’est la contradiction. Ainsi, B n’admet pas
ni denborne supérieure,
o ni de plus grand élément.
n−1
– C = n+1 , n ∈ N . On remarque que −1 est le plus petit élément de C. ∀n ∈ N,
on a n−1
n+1 ≥ −1 et −1 ∈ C donc −1 est le plus petit élément de C et −1 = inf C.
On vérifie aussi que 1 est la borne supérieure. En effet, 1 ∈
/ C sinon il existe
n ∈ N tel que n−1
n+1 = 1 absurde. Donc, C n’admet pas de plus grand élément.
Pour montrer que 1 = sup C. On a 1 est un majorant de C. Soit e un majorant
de C, montrons que e ≥ 1. Sinon, e < 1. Montrons qu’il existe x ∈ C tel que

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 22 — #32


i i

22 Chapitre 1. Nombres réels, nombres complexes et suites numériques

 
n0 −1
e < x < 1 avec x = n−1 1+e
n+1 . Ainsi, pour n0 = E 1−e + 1, on a e < n0 +1 < 1.
Contradiction avec e un majorant de C. D’où, 1 = sup C.
Exercice
S  1 6 : 1 
– n , 1 = ]0, 1[ . Car, ∀n ≥ 1, n , 1 ⊂ ]0, 1[ . Et, pour x ∈ ]0, 1[ , il existe
n≥1
h h
n0 = E x1 + 1 6= 0 tel que x ∈ n10 , 1 donc x ∈
 S 1 
n, 1 .
T n≥1
– [n, +∞[ = ∅. Montrons que si x ∈ R alors
n≥0

\
x∈
/ [n, +∞[ (x ∈
/ [n, +∞[).
n≥0

S effet, il suffit de prendre n0 = E (x) + 1 pour vérifier l’absurdité.


En
– [n, n + 1[ = [0, +∞[ . Car, ∀n ≥ 0, [n, n + 1[ ⊂ [0, +∞[ . De plus, soit x ∈
n≥0
[0, +∞[ . Montrons qu’il existe n0 ∈ N tel que x ∈ [n, n + 1[ . Il suffit de prendre
n0 = E (x) + 1. i h
−∞, n1 = ]−∞, 1[ . Car, on a ∀n0 ≥ 1, −∞, n10 ⊂ −∞, n1 . Il suffit
S   S  

n≥1 n≥1
−∞, n1 . De plus, soit
S  
de prendre n0 = 1 donc ]−∞, 1[ ⊂
n≥1

[ 1

x∈ −∞, .
n
n≥1

que x ∈ ]−∞, 1[ . On a x ∈ −∞, n1 ⊂ ]−∞, 1[ ( n1 ≤ 1).


 
Montrons
1 − n1 , 1 + n1 = {1} . En effet,
T 

n≥1

\ 1 1
 \  1
 
1

1 − ,1 + = 1 − , 1 ∩ 1, 1 +
n n n n
n≥1 n≥1
 
\ 1
= {1} ∪ 1, 1 + .
n
n≥1

1, 1 + n1 = ∅. Pourcela, supposons qu’il existe


T  
Il suffit de montrer que
n≥1
 
x < 1+ n1 ⇔ x−1 1 1
> n, ∀n ≥ 1, absurde car il suffit de prendre n0 = E x−1 +1.
D’où, le résultat.
Exercice √7 :
– z1 = 47 3 + 17 i
71 22
– z2 = 221 − 221 i
– z3 = −1 √
– z4 = −π 12 i 3 − 12


– z5 = − 12 − 12 i 2


– z6 = −4i.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 23 — #33


i i

1.4 Exercices 23

Exercice 8 :

1. Il suffit de remarquer que z n+1 − 1 = (z − 1) 1 + z + z 2 + · · · + z n .
n
2. Remplacer z par eiθ pour θ ∈ ]0, 2π[ dans la question 1. pour déduire
P
cos (kθ)
k=0
n
P
et sin (kθ) .
k=0
Exercice 9 :

(E1) SC = {1 − 2i, 2 + i} .

√ √ 1 √
q q q
1 1
(E2) SC = { 2 − 2i 3, − 2 − 2i 3, 2i 3 + 2,
2q 2 2
1 √ 1 √ 1 1 √ 1 1 √ 1 1 1 √
− 2i 3 + 2, i 3 − , − i 3 − , i 3 + , − i 3}
2 2 2 2 2 2 2 2 2

1 √ 1 √
  
1 
(E3) SC = sin π 3 + i − cos π i 3 − 1 ,
2 9 9
1 √ 1 √
 
1 
sin π 3 − i − cos π i 3 + 1 ,
2 9 9
1 √ 1 √
 
1 1 1 
− cos π − i sin π, − sin π 3 + i + cos π i 3 − 1 ,
9 9 2 9 9
1 √ 1 √
  
1  1 1
− sin π 3 − i + cos π i 3 + 1 , cos π + i sin π .
2 9 9 9 9
Exercice 10 :
1.
√ 3
|z1 | = |−2 + 2i| = 8 et arg (z1 ) = arg (−2 + 2i) = π.
4
√  √  2
|z2 | = −1 + 3i = 2 et arg (z2 ) = arg −1 + 3i = π.

3 
√ 5 √ 5
 
2
|z3 | = −1 + 3i = 32 et arg (z3 ) = arg −1 + 3i = − π.
3
2. √ 3 2 2
z1 = 8ei 4 π , z2 = 2ei 3 π , z3 = 32e−i 3 π .
Exercice 11 :
1. S = T car
2 1 3
Re (S) = Re (T ) = cos π − cos π − cos π
7 7 7
2 1 3
Im (S) = − Im (T ) = sin π − sin π + sin π > 0.
7 7 7

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 24 — #34


i i

24 Chapitre 1. Nombres réels, nombres complexes et suites numériques

2.
 
2 1 3
S + T = 2 Re (S) = 2 cos π − cos π − cos π
7 7 7
 2  2
2 1 2 3 2 1 3
ST = |S| = cos π − cos π + cos π + sin π − sin π + sin π
7 7 7 7 7 7
Ainsi,
   
1 2 3 2 1 3
S= cos π − cos π + cos π + i sin π − sin π + sin π
7 7 7 7 7 7
   
1 2 3 2 1 3
T = cos π − cos π + cos π − i sin π − sin π + sin π .
7 7 7 7 7 7

Exercice 12 :
Soit α ∈ ]−π/2, π/2[ , n ∈ N∗ et λ ∈ C, |λ| = 1.
1.
cos α+i sin α
1 + i tan α cos α + i sin α eiα
z0 = = cos α
cos α−i sin α
= = −iα = e2iα .
1 − i tan α cos α
cos α − i sin α e
2.
 
i (1 − λ) i (1 − λ) 1 + λ i 1 + λ − λ − λλ
=  =
λ+1 (λ + 1) 1 + λ 2 + 2 Re (λ)
i (1 − 2i Im (λ) − 1) Im (λ)
= = .
2 + 2 Re (λ) 1 + Re (λ)
1+iz
3. On pose λ = 1−iz , le problème ce ramène à déterminer les complexes z solutions
de l’équation
λn = z0 = e2iα
comme suit :
np θ+2kπ
o
Rn (z0 ) = n
|z0 |ei n / 0 ≤ k ≤ n − 1
n θ+2kπ o
= ei n / 0 ≤ k ≤ n − 1 .

Or,
1 + iz λ−1 i (1 − λ) Im (λ)
λ= ⇔z= = = .
1 − iz iλ + i λ+1 1 + Re (λ)
Ainsi,
  θ+2kπ  
 Im ei n 
SC =  θ+2kπ  / 0 ≤ k ≤ n − 1
 1 + Re ei n 
( )
sin θ+2kπ

n
=  / 0≤k ≤n−1 .
1 + cos θ+2kπ
n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 25 — #35


i i

1.4 Exercices 25

Exercice 13 :
1. un − un−1 = 12 un−1 + 14 − un−1 = − 12 un−1 + 14 < 0 (On la vérifie par récurrence).
Donc, (un )n≥0 est décroissante.
2. Pour n = 0, u0 = 1 ≥ 0. supposons que un−1 ≥ 0, montrons par récurrence que
un ≥ 0, ∀n ≥ 0. On sait que un = 12 un−1 + 14 ≥ 0 donc un ≥ 0, d’où (un )n≥0 est
minorée par 0.
3. Tout d’abord, on remarque que (un )n≥0 est minorée par 12 . Puis qu’elle est
décroissante : un = 12 un−1 + 14 ≤ un−1 , ∀n ≥ 1. Ainsi, un−1 ≥ 12 , ∀n ≥ 1.
Montrons alors que 12 = inf (un )n≥0 . C’est à dire pour tout  > 0, ∃n ∈ N tel que
e = 12 ≤ un ≤ 12 +  = e0 ? Il suffit de prendre un entier n tel que n ≥ − ln
ln 
2 − 1,
en utilisant :
1
un ≤ +  ⇔
2
1 1
un−1 ≤ +  ⇔
2 4
1 1 1 1
un−2 ≤ +  ⇔ · · · ⇔ n u0 ≤ n+1 + .
4 8 2 2
Exercice 14 :
1. Posons vn = un−1
n . On a v1 = 1 et
vn+1 − vn = unn+1 − un−1
n = n + un−1
n − un−1
n = n.

Donc, par récurrence on a vn − v1 = n(n−1)2 . D’où, le résultat.


2. Pour n ≥ 2, on a
  1
n (n − 1) n−1
ln un = ln 1 +
2
 
1 n (n − 1)
= ln 1 +
n−1 2
ln n2
 
1 n n (n − 1) ln n
≤ ln + = + −→ 0.
n−1 2 2 n − 1 n − 1 n→+∞
Ainsi, (ln un )n≥1 converge vers 0.
3. La fonction ln : ]0, +∞[ → R vérifie une bijection, sa fonction réciproque est
alors exponentiel donc (un )n≥1 converge vers exp(0) = 1.
Exercice 15 :
1. On a u0 et u1 sont dans [0, 1] et u1 ≥ u0 , u2 ≥ u1 . Suppsons que la propriété
(P) : un ∈ [0, 1] et un ≥ un−1 est vraie à l’ordre n. Montrons par récurrence
que (P) est vraie à l’ordre (n + 1) . On a 0 ≤ un−1 < 1 et 0 ≤ un−2 < 1 donc
0 ≤ 13 1 + un+1 + u2n < 1. Ainsi, ∀n ≥ 0 : 0 ≤ un < 1. De plus,


1
un+2 − un+1 = ((un+1 − un ) + (un − un−1 ) (un + un−1 )) > 0.
3
Donc, la suite (un )n≥0 est croissante et à valeurs dans [0, 1].

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 26 — #36


i i

26 Chapitre 1. Nombres réels, nombres complexes et suites numériques

2. (un )n≥0 est croissante, majorée par 1 donc elle converge vers l :
1
1 + l + l2 ⇒ l = 1.

l=
3
Exercice 16 :
Soient l = limn→+∞ u2n et l0 = limn→+∞ u2n+1 . Si l 6= l0 alors (un ) diverge. Si
l = l0 , montrons que la suite (un ) converge vers l. En effet,
l = lim u2n ⇔ ∀ > 0, ∃N0 ∈ N / n > N0 : |u2n − l| < ,
n→+∞

l = lim u2n+1 ⇔ ∀ > 0, ∃N00 ∈ N / n > N00 : |u2n+1 − l| < .


0
n→+∞

Soit  > 0, on prend N = sup (2N0 , 2N00 + 1) tel que n > N .


– Si n = 2m on a n > 2N0 ⇒ m ≥ N0 ⇒ |u2m − l| <  ⇒ |un − l| < .
– Si n = 2m + 1 on a n > 2N00 + 1 ⇒ m ≥ N00 ⇒ |u2m+1 − l| <  ⇒ |un − l| < .
Conclusion : ∀ > 0, ∃N = sup (2N0 , 2N00 + 1) / N ∈ N / n > N : |un − l| <
 ⇔ (un ) converge vers l.
Exercice 17 :
1 1
1. u2n+2 − u2n = − 2n+2 + 2n+1 > 0. De plus,
     
1 1 1 1 1 1 1
u2n = 1 + − + + − + + ··· + − + −
2 3 4 5 2n − 2 2n − 1 2n
n−1
X 1 
1 1
=1+ − − − ≤ 1.
2k 2k + 1 | {z 2n}
k=1
| {z } <0
<0

Donc, la suite (u2n ) est croissante, majorée par 1.


1 1
2. u2n+3 − u2n+1 = 2n+3 − 2n+2 < 0. De plus,
     
1 1 1 1 1 1 1 1
u2n+1 = 1 − + − + − + ··· + − +
2 3 4 5 6 2n − 1 2n 2n + 1
n+1  
1 X 1 1 1 1
= + − − ≥ .
2 2k + 1 2k + 2 2n + 1 2
k=1 | {z }
| {z } ≥0
≥0

Donc, la suite (u2n+1 ) est décroissante, minorée par 21 .


1
3. Pour tout n ≥ 1, u2n < u2n−1 car u2n − u2n−1 = − 2n < 0. limn→+∞ u2n −
u2n−1 = 0. Comme (u2n ) est croissante et (u2n+1 ) est décroissante donc (u2n )
et (u2n+1 ) sont adjacentes et tendent vers la même limite. Conclusion : (un )
converge.
Exercice 18 :
On considère deux suites (un ) et (vn ) définies par :
 
u1 = 1 v1 = 1
un+1 = 5un6+vn vn+1 = un +2v
3
n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 27 — #37


i i

1.4 Exercices 27

1
1. vn − un = 2 (vn−1 − un−1 ) . On peut montrer par récurrence que
 n−1  n−1
1 1
vn − un = (v1 − u1 ) = 5 >0
2 2
et limn→+∞ (vn − un ) = 0.
2. On a un+1 −un = vn −u 6
n
> 0. Donc, (un )n≥1 est croissante. De plus, vn+1 −vn =
un −vn
3 < 0. Alors, (vn )n≥0 est décroissante.
3. (un )n≥1 est croissante et (vn )n≥0 est décroissante ainsi que limn→+∞ (vn − un ) =
0. Donc, (un ) et (vn ) sont deux suites adjacentes.
4.  n−1
5un + vn 1
un+1 = et vn = 5 + un .
6 2
Donc,
 n−1
5 1
un+1 − un = .
6 2
Ainsi, on peut vérifier par récurrence
n−1  k n !
5X 1 5 1 − 12
un+1 = + u1 = × 1 1 + 1.
6 2 6 2
k=0

D’où, l = limn→+∞ un+1 = 38 .


Exercice 19 :
1.

(−1)n (−1)
n+1
(−1)
n+r−1
|un+r − un | = + + ··· +

n+1 n+2 n+r


1 r−1
1 (−1)
= − + ··· + .

n + 1 n + 2 n+r

– 1er càs : si r = 2k, k ∈ Z.




   
1 1 1 1
|un+r − un | = − + ··· + −

n+1 n+2 n + 2k − 1 n + 2k

| {z } | {z }
>0 >0

1 1 1 1
= − + ··· + − .
n+1 n+2 n + 2k − 1 n + 2k
   
1 1 1 1 1 1
= − − + ··· − − − .
n+1 n+2 n+3 n + 2k − 2 n + 2k − 1 n + 2k
| {z } | {z }
>0 >0

Donc,
1
|un+r − un | ≤ .
n+1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 28 — #38


i i

28 Chapitre 1. Nombres réels, nombres complexes et suites numériques

– 2ème càs : si r = 2k + 1, k ∈ Z.



   
1 1 1 1 1
|un+r − un | = − + ··· + − +

n+1 n+2 n + 2k − 1 n + 2k n + 2k + 1

| {z } | {z }
>0 >0

1 1 1 1 1
= − + ··· + − + .
n+1 n+2 n + 2k − 1 n + 2k n + 2k + 1
   
1 1 1 1 1
= − − + ··· − − .
n+1 n+2 n+3 n + 2k n + 2k + 1
| {z } | {z }
>0 >0

Donc,

1
|un+r − un | ≤ .
n+1

1 1
Ainsi, ∀r ∈ N, |un+r − un | ≤ n+1 . Et on a, limn→+∞ n+1 = 0. Donc,
limn→+∞ |un+r − un | = 0. D’où, (un ) est de Cauchy.

2. un = 1 + 12 + · · · + 1
n n’est pas de Caychy. En effet, on peut montrer que
|u2n − un | ≥ 21 .

3. un = 1 + √12 + · · · + √1
n
n’est pas de Caychy. En effet, on peut montrer que
|u2n − un | ≥ √12 .

Exercice 20 :
q
1
Soit (un ) une suite réelle définie par u0 = 1 et un+1 = u2n + 2n .

1. On vérifie facilement par récurrence que ∀n ∈ N∗ , 1 ≤ un+1 . De plus,

r
1
un+1 − un = u2n + n − un
2
1 n

2
= .
un+1 − un

Or, un+1 − un > 2 pour n ∈ N∗ . Ainsi,

 n+1
1
un+1 < un + .
2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 29 — #39


i i

1.4 Exercices 29

2.

|un+r − un | ≤ |un+r − un+r−1 | + · · · + |un+1 − un |


 n+r  n+1
1 1
≤ + ··· +
2 2
 n+1  r−1 !
1 1
≤ + ··· + 1
2 2
 n+1 n !
1 1 − 21
=
2 1 − 12
 n
1
≤ −→ 0.
2 n→+∞

Donc, (un ) est de Cauchy. De plus, quand r → +∞ alors


 n
1 ln 10
|l − un | ≤ ≤ 10−3 ⇔ n ≥ 3 .
2 ln 2
−3
D’où, si n ≥ 3 lnln10
2 alors un est une valeur approchée de l à 10 prés.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 30 — #40


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 31 — #41


i i

CHAPITRE 2

Etude des fonctions réelles d’une variable réelle

Soit
f: Df −→ R
x 7−→ f (x)
une fonction réelle d’une variable réelle telle que Df = {x ∈ R / f (x) a un sens} est
le domaine de définition de f .

2.1 Limite d’une fonction


Soit x0 ∈ R. On dit que f est définie au voisinage de x0 , sauf peut être en x0 , s’il
existe α > 0 : ]x0 − α, x0 + α[ \ {x0 } ⊆ Df.
Exemple 2.1.1 Soit f (x) = x1 . f est définie au voisinage de 0, sauf peut être en 0,
∀ > 0 : ], [ \ {0} ⊆ Df = R\ {0} .
Définition 2.1.1 On dit qu’une fonction f , définie au voisinage de x0 ∈ R, sauf
peut être en x0 , admet une limite l ∈ R quand x tend vers x0 et on écrit :
lim f (x) = l
x−→x0

si ∀ > 0, ∃η > 0; ∀x ∈ R tels que |x − x0 | < η alors |f (x) − l| < .

Remarque 2.1.1 Une fonction peut avoir une limite quand x tend vers x0 sans
qu’elle soit définie en x0 .
Remarque 2.1.2 Dire que x tend vers x0 c’est à dire que x s’approche de x0 sans
jamais l’atteindre.
Remarque 2.1.3 On définit la limite à droite et à gauche de f comme suit :
1. Limite à droite : limx−→x0 f (x) = l si
x>x0

∀ > 0, ∃η > 0; ∀x ∈ R tels que 0 < x − x0 < η alors |f (x) − l| < ,

et on note
lim f (x) = l.
x−→x+
0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 32 — #42


i i

32 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2. Limite à gauche : limx−→x0 f (x) = l si


x<x0

∀ > 0, ∃η > 0; ∀x ∈ R tels que 0 < x0 − x < η alors |f (x) − l| < ,

et on note
lim f (x) = l.
x−→x−
0

Proposition 2.1.1 La limite d’une fonction, lorsqu’elle existe, est unique.


Preuve. Supposons que

lim f (x) = l et lim f (x) = l0 avec l 6= l0 .


x−→x0 x−→x0

Ainsi, ∀ > 0, ∃η > 0; ∀x ∈ R tels que |x − x0 | < η alors |f (x) − l| <  et


∀0 > 0, ∃η 0 > 0; ∀x ∈ R tels que |x − x0 | < η 0 alors |f (x) − l0 | < 0 . On a
|l − l0 | = |l − f (x) + f (x) − l0 | ≤ |f (x) − l| + |f (x) − l0 |. Alors, |l − l0 | <  + 0 .
| {z } | {z } | {z }
< <0 00
Pour 00 << 1 , on peut écrire |l − l0 | < 00 . Donc, l = l0 . Ce qui est absurde.
Proposition 2.1.2 Supposons que lim f (x) = l1 et lim g (x) = l2 et soit λ ∈ R.
x−→x0 x−→x0
Alors,
1. lim (f + g) (x) = l1 + l2 , lim (f × g) (x) = l1 × l2 , lim |f (x)| = |l1 | ,
x−→x0 x−→x
 0 x−→x0

lim (λf ) (x) = λl1 et lim fg (x) = l1


l2 , (l2 6= 0 et g 6= 0 au V (x0 )) .
x−→x0 x−→x 0

2. Si f ≥ g au voisinage de x0 alors l1 ≥ l2 .
Exemple 2.1.2 Vérifier que f (x) = x − [x] 2 n’a pas de limite quand x tend vers 1.
En effet, il suffit de calculer lim + x − [x] = 0 et lim − x − [x] = 1.
x−→1 x−→1
Théorème 2.1.1 (critère utilisant les suites) : Soit

f : Df ⊆ R →R, x 7→ f (x)

une fonction définie au voisinage de x0 ∈ R, sauf peut être en x0 . Un nombre


réel l est la limite de f quand x tend vers x0 si et seulement si pout toute
suite (un )n≥0 d’éléments Df \ {x0 } convergente vers x0 alors la suite (f (un ))n≥0
converge vers l.

2.1.1 Limites infinies, limites quand x tends vers ±∞ et les formes indéterminées
Définition 2.1.2 On définit les limites infinies et limites quand x tends vers ±∞ de
f comme suit :
– lim f (x) = +∞ ⇔ ∀A > 0, ∃ηA > 0; ∀x ∈ R tels que 0 < |x − x0 | < η alors
x−→x0
f (x) > A,

1 Négligeable.
2 partie entière de x.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 33 — #43


i i

2.2 Fonctions continues 33

– lim f (x) = −∞ ⇔ ∀B < 0, ∃ηB > 0; ∀x ∈ R tels que 0 < |x − x0 | < η alors
x−→x0
f (x) < B,
– lim f (x) = l ⇔ ∀ > 0, ∃A > 0; ∀x ∈ R tels que x > A alors |f (x) − l| < ,
x−→+∞
– lim f (x) = l ⇔ ∀ > 0, ∃B < 0; ∀x ∈ R tels que x < B alors |f (x) − l| < .
x−→−∞

Remarque 2.1.4 Les quatres formes indéterminées les plus connues sont :
0 ∞
, , ∞ − ∞, 0 × ∞.
0 ∞
Exemple 2.1.3 Trouver que
r
√ √ 1
q
lim x+ x+ x− x= .
x−→+∞ 2

2.2 Fonctions continues


Soit
f: Df −→ R
x 7−→ f (x)
et x0 ∈ R.
Définition 2.2.1 On dit que f est continue en x0 ∈ R si :
1. f est définie en x0 (x0 ∈ Df ) ,
2. lim f (x) = f (x0 ) .
x−→x0

Remarque 2.2.1
1. f est continue en x0 ⇔ (f définie en x0 . Pour toute (xn )n≥0 convergent vers x0 ,
(f (xn ))n≥0 converge vers f (x0 )).
2. On dit que f est continue sur une partie A ⊆ Df si f est continue en tout point
de A.
3. Soient f et g deux fonctions continues en x0 et soit λ un réel alors (f + g) ,
(f × g) , (λf ) , fg (g (x0 ) 6= 0) et |f | sont aussi continues en x0 .
Conséquences
1. La fonction f ≡ id : R →R, x 7→ x est continue sur R (utiliser la définition et
prendre η = ). Alors, la fonction
n
X
f : R →R, x 7→ f (x) = a p xp
p=0

est continue sur R (ap ∈ R, p = 1, . . . , n).


2. Les fonctions trigonométriques sont continues là où elles sonts définies.
3. Fonctions composées : Soient f continue en x0 ∈ R et g continue en y0 =
f (x0 ) ∈ R. Alors, g ◦ f est continue en x0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 34 — #44


i i

34 Chapitre 2. Etude des fonctions réelles d’une variable réelle

r  
tan x
Exemple 2.2.1 Etudier la continuité de la fonction f (x) = sin √
x+1
sur R.
(Indication : f est continue sur son Df comme composée de fonctions continues).
Définition 2.2.2 (Prolongement par continuité)
Soit f : ]x0 − α, x0 + α[ \ {x0 } −→ R une fonction et soit x0 ∈ R. Si f admet une
limite l ∈ R en x0 , alors la fonction fe : I ∪ {x0 } −→ R définie par

f (x) si x ∈ ]x0 − α, x0 + α[ \ {x0 }
f (x) =
e
l si x = x0

est continue sur I ∪ {x0 } . Cette fonction est dite prolongement par continuité de f
en x0 .
sin x sin x
Exemple 2.2.2 Soit f (x) = x . Puisque limx−→0 x = 1. On peut vérifier que

f (x) si x 6= 0
fe(x) =
1 si x = 0

est le prolongement par continuité de f en 0.

2.2.1 Propriétés des fonctions continues


Théorème 2.2.1 Soit I = [a, b] , a < b, un intervalle fermé borné sur R. Toute
fonction continue sur I est bormée et atteint ses bornes.
Théorème 2.2.2 (de la valeur intermédiaire) Soit f : I−→ R continue sur I, f
une fonction continue sur I, m = inf f (I) et M = sup f (I) . Alors, ∀y0 ∈ ]m, M [ ,
∃x0 ∈ I tel que y0 = f (x0 ) .
Preuve : On peut supposer m = 6 M car sinon le problème est clair. Soit y0 ∈ ]m, M [ ,
d’après la caractérisation de la borne inférieure et la borne supérieure il existe
x1 , x2 ∈ I (par exemple x1 < x2 ) tel que

m ≤ f (x1 ) < y0 < f (x2 ) ≤ M.

Soit
E = {x ∈ [x1 , x2 ] / f (x) ≤ y0 } ⊆ R.
E 6= ∅ car x1 ∈ E par contradiction. E est majoré par x2 donc E admet une
borne supérieure x0 = sup E. On va montrer que f (x0 ) = y0 . Soit n ≥ 1,
∃un ∈ E : x0 − n1 < un < x0 (caractérisation de la borne supérieure) donc
lim un = x0 . Comme f est continue donc lim f (un ) = f (x0 ) . Or, un ∈
n→+∞ n→+∞
E ⇒ f (un ) ≤ y0 donc f (x0 ) ≤ y0 . Cette dernière montre aussi que x0 ∈ E
⇒ x0 = max E : pour x0 < x < x2 ⇒ f (x) > y0 . Par passage à la limite et la
continuité de f , on a f (x0 ) ≤ y0 . D’où le résultat. 
Corollaire 2.2.1 L’image d’un intervalle de R par une fonction continue est un
intervalle de R

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 35 — #45


i i

2.2 Fonctions continues 35

2.2.2 Théorème des fonctions réciproques


Théorème 2.2.3 Soit I un intervalle de R. Toute fonction f : I−→ R, continue et
strictement monotone admet une fonction réciproque, notée f −1 , qui est continue,
strictement monotone et de même sens de variation que f .
Remarque 2.2.2
– Les graphes de f et f −1 sont définies, respectivement comme suit :

Γf = (x, y) ∈ R2 / y = f (x)


Γf −1 = (z, t) ∈ R2 / t = f −1 (z)


– Le graphe de f −1 s’obtient à partir de celui de f par la symétrie par rapport à


la première bissectrice.

Exemples de fonctions réciproques


1. Fonction racine n-ème : La fonction
n
() : [0, +∞[ −→ [0, +∞[
, n≥1
x 7−→ xn

continue et strictement croissante sur [0, +∞[, donc il existe une fonction notée
√ 1
n = () n telle que :


n : [0, +∞[ −→ [0, +∞[
1
y 7−→ yn
1
 1 n
vérifiant (xn ) n = x, ∀x ∈ [0, +∞[ et y n = y, ∀y ∈ [0, +∞[ . Les graphes de
f et f −1 sont comme suit :

2. Fonctions réciproques des fonctions trogonométriques :


(a) La  fonction Arcsin : La fonction sin est strictement croissante sur
I = − π2 ; π2 , elle définit une bijection de I sur


h  π  π i
J = sin − ; sin = [−1; 1] .
2 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 36 — #46


i i

36 Chapitre 2. Etude des fonctions réelles d’une variable réelle

La bijection réciproque est notée arcsin [arcsinus], elle est définie par :
 π π
arcsin : [−1; 1] −→ −2; 2
arcsin (x) = y tel que y ∈ − π2 ; π2 et sin (y) = x.
 
x 7−→

Les graphes de sin et arcsin sont comme suit :

(b) La fonction Arccos : La fonction f : [0; π] −→ [−1; 1] définie par


f (x) = cos (x), est continue et strictement décroissante, elle définit donc
une bijection de [0; π] sur [−1; 1] . Par définition, la bijection réciproque est
appelée fonction arccosinus et notée arccos, elle est définie par :

arccos : [−1; 1] −→ [0; π]


x 7−→ arccos (x) = y tel que y ∈ [0; π] et cos (y) = x.

Les graphes de cos et arccos sont comme suit :

(c) La fonction Arctan : La fonction f : − π2 ; π2 −→ R définie par f (x) =


 

tan (x), est continue et strictement croissante, elle définit donc une bijec-
tion de − π2 ; π2 sur R. Par définition, la bijection réciproque est appelée


fonction arctangente et notée arctan, elle est définie par :


 π π
arccos : R −→ −2; 2
arctan (x) = y tel que y ∈ − π2 ; π2 et tan (y) = x.
 
x 7−→

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 37 — #47


i i

2.2 Fonctions continues 37

Les graphes de tan et arctan sont comme suit :

3. Les fonctions exponentielle et logarithme : Il existe une fonction notée e


(ou exp) définie sur R comme suit :

e: R −→ R
x 7−→ ex

continue et strictement croissante sur R avec e(R) = R∗+ , donc il existe une
fonction notée log telle que :

log : ]0, +∞[ −→ R


y 7−→ log (y)

vérifiant log(ex ) = x, ∀x ∈ R et exp(log(y)) = y, ∀y ∈ R∗+ . Les graphes de exp


et log sont comme suit :

2.2.3 Continuité uniforme


Définition 2.2.3 f : Df ⊆ R −→ R. On dit que f est uniformément continue sur
Df si :

∀ > 0, ∃η > 0; ∀x, x0 ∈ Df tels que |x − x0 | < η alors |f (x) − f (x0 )| < .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 38 — #48


i i

38 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Exemple 2.2.3 La fonction f (x) = x est uniformément continue sur R. En effet, soit
 > 0, on cherche η > 0; ∀x, x0 ∈ R tels que |x − x0 | < η alors |f (x) − f (x0 )| <
. Il suffit de prendre η = .
Théorème 2.2.4 Soit I = [a, b] , a < b, un intervalle de R (fermé et bormé). Toute
fonction continue sur I est uniformément continue sur I.

2.3 Dérivabilité
Soit f : Df ⊆ R −→ R une fonction continue en x0 ∈ Df.
Définition 2.3.1 On dit que f est dérivable en x0 si et seulement si la fonction

f (x) − f (x0 )
x 7−→
x − x0
admet une limite finie quand x tend vers x0 . Lorsque cette limite existe et finie,
elle sera notée f 0 (x0 ) et elle est appelée la dérivée de f en x0 .
Remarque 2.3.1
f (x)−f (x0 ) f (x0 +h)−f (x0 )
1. On peut remplacer x−x0 par la quantité h avec x = x0 + h et
x → x0 ⇔ h → 0.
2. f est dérivable en x0 si et seulement si il existe une fonction  définie au voisinage
de x0 et un nombre réel α tels que :

f (x) = f (x0 ) + α (x − x0 ) + (x − x0 )  (x) , avec lim  (x) = 0.


x−→x0

3. Si f est dérivable en x0 alors f 0 (x0 ) est unique.


Exemple 2.3.1 Soit f (x) = sin x, x0 ∈ R.

sin (x0 + h) − sin (x0 ) 2 sin (h/2) cos (x0 + h/2)


lim = lim
h−→0 h h−→0 h
sin (h/2)
= lim cos (x0 + h/2) = cos (x0 ) .
h−→0 h/2
0
Donc, (sin x) (x0 ) = cos (x0 ) .

2.3.1 Opérations sur les fonctions dérivables


Théorème 2.3.1 Soit f : Df ⊆ R −→ R et g : Dg ⊆ R −→ R deux fonctions
dérivables en x0 ∈ Df ∩ Dg, et soit λ ∈ R. Alors,
1. (f + g) est dérivable en x0 et on a (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).
2. (λf ) est dérivable en x0 et on a (λf )0 (x0 ) = λf 0 (x0 ).
3. (f × g) est dérivable en x0 et on a

(f × g)0 (x0 ) = f 0 (x0 ) × g(x0 ) + f (x0 ) × g 0 (x0 ).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 39 — #49


i i

2.3 Dérivabilité 39

f
4. Si g(x0 ) 6= 0, g est dérivable en x0 et on a

f 0 (x0 ) × g(x0 ) − f (x0 ) × g 0 (x0 )


(f × g)0 (x0 ) = .
g 2 (x0 )

5. Si de plus f est dérivable en g(x0 ), alors (f ◦ g) est dérivable en x0 et on a :

(f ◦ g)0 (x0 ) = f 0 (g(x0 )) × g 0 (x0 ).

6. Calculer la dérivée de la fonction



log x2 + 1
f (x) = .
x

Dérivée d’une fonction réciproque


Théorème 2.3.2 Soit f :]a, b[⊆ R −→ R une fonction continue et strictement mono-
tone, on note f −1 sa fonction réciproque. Si f est dérivable en x0 (avec x0 ∈ ]a, b[)
et si f 0 (x0 ) 6= 0 alors f −1 est dérivable en y0 = f (x0 ) et on a :
0 1
f −1 (y0 ) = .
f 0 (f −1 (y0 ))

Applications :
1. La fonction arcsinus
 π π
arcsin : [−1; 1] −→ −2; 2
arcsin (x) = y tel que y ∈ − π2 ; π2 et sin (y) = x.
 
x 7−→

est strictement croissante et continue sur [−1; 1] , elle est dérivable sur ]−1; 1[
mais pas en −1 ni en 1 [tangente verticale en ces points], on a la formule suivante :
1 1
∀x ∈ ]−1; 1[ , arcsin0 (x) = =√ .
cos (arcsin (x)) 1 − x2
2. La fonction arccosinus
arccos : [−1; 1] −→ [0; π]
x 7−→ arccos (x) = y tel que y ∈ [0; π] et cos (y) = x.

Cette fonction est strictement décroissante et continue sur [−1; 1] , elle est
dérivable sur ]−1; 1[ mais pas en −1 ni en 1 [tangente verticale en ces points],
on a la formule suivante :
1 −1
∀x ∈ ]−1; 1[ , arccos0 (x) = =√ .
sin (arccos (x)) 1 − x2
3. La fonction arctangente
 π π
arctan : R −→ −2; 2
arctan (x) = y tel que y ∈ − π2 ; π2 et tan (y) = x.
 
x 7−→

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 40 — #50


i i

40 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Cette fonction est strictement croissante, continue et dérivable sur R et on a la


formule suivante :
1 1
∀x ∈ R, arctan0 (x) = 2 = .
1 + tan (arctan (x)) 1 + x2

Remarque 2.3.2
f (x)−f (x0 )
1. Dérivée à droite en x0 : limx−→x0 x−x0 = fd0 (x0 ) .
x>x0

f (x)−f (x0 )
2. Dérivée à gauche en x0 : limx−→x0 x−x0 = fg0 (x0 ) .
x<x0

3. f dérivable en x0 si et seulement si fd0 (x0 ) = fg0 (x0 ) (= f 0 (x0 )) .

2.3.2 Propriétés des fonctions dérivables


Définition 2.3.2 Soit f une fonction définie sur un intervalle I ⊆ R. f admet un
maximum (respectivement, minimum) en x0 ∈ I si : f (x) ≤ f (x0 ) , ∀x ∈ I
(respectivement, f (x) ≥ f (x0 ) , ∀x ∈ I). On dit que f admet un maximum local
(respectivement, minimum) en x0 ∈ I s’il existe h > 0, ∀x ∈ I : |x − x0 | < h
alors f (x) ≤ f (x0 ) (respectivement, f (x) ≥ f (x0 )).
Proposition 2.3.1 (Extremum local) : Soit f une fonction définie sur un inter-
valle I ⊆ R. Si f admet un extrêmum local en x0 ∈ I et si f est dérivable en x0
alors f 0 (x0 ) = 0.
Théorème 2.3.3 (Rolle) Soit f : [a, b] −→ R (a 6= b) continue sur [a, b], dérivable
sur ]a, b[. Si on a f (a) = f (b) alors ∃c ∈]a, b[ tel que f 0 (c) = 0.
Preuve : Comme f est continue sur [a, b] alors f ([a, b]) est un intervalle borné
et atteint ses bornes. Il existe donc x0 ∈ [a, b] tel que f (x0 ) = max f (x) . Il
x∈[a,b]
existe aussi x1 ∈ [a, b] tel que f (x1 ) = min f (x) . Si f est constante c’es à dire
x∈[a,b]
∀c ∈ ]a, b[ , f 0 (c) = 0. Supposons que f est non constante c’est à dire qu’il existe
un nombre α dans ]a, b[ : f (α) 6= (f (a) = f (b)) . Si f (α) > (f (a) = f (b)) alors
x0 ∈ ]a, b[ donc f 0 (x0 ) = 0. 
Corollaire 2.3.1 (Formule des accroissements finis) Soit f : [a, b] −→ R conti-
nue sur [a, b], dérivable sur ]a, b[ alors il existe c ∈]a, b[ tel que : f (b) − f (a) =
(b − a) f 0 (c) .
 
Preuve : Posons, pour a 6= b, g (x) = f (x)− f (b)−fb−a
(a)
(x − a)−f (a) et appliquons
le théorème de Rolle. 
Théorème 2.3.4 (Formule d’inégalité des accroissements finis) Soit

f : [a, b] −→ R

continue sur [a, b], dérivable sur ]a, b[ et s’il existe deux réels m et M tels que
∀x ∈ ]a, b[ , m ≤ f 0 (x) ≤ M alors

m (b − a) ≤ f (b) − f (a) ≤ M (b − a) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 41 — #51


i i

2.4 Fonctions convexes 41

Remarque 2.3.2 ∀x ∈ ]a, b[ , |f 0 (x)| ≤ M alors |f (b) − f (a)| ≤ M (b − a) et plus


généralement,
∀x, y ∈ [a, b] , |f (x) − f (y)| ≤ M |x − y| .

Exemple 2.3.4 Donner un encadrement de 10001. En effet, appliquons √ la formule
d’inégalité des accroissements finis pour la fonction f (x) = x sur l’intervalle
0 1
 4   
10 , 10001 . On vérifie facilement
que |f
(x)| ≤ 200 , ∀x ∈ 104 , 10001 . Ainsi,
f (10001) − f 104 ≤ 1 10001 − 104 = 1 . D’où,

200 200
1 √ 1
99. 995 = 100 − ≤ 10001 ≤ 100 + = 100, 005.
200 200
Théorème 2.3.5 (du point fixe) : Soit f une fonction dérivable sur R. On suppose
qu’il existe une constante réel k : 0 < k < 1 telle que |f 0 (x)| ≤ k, pour tout
x ∈ R alors, l’équation f (x) = x admet une solution unique.

2.4 Fonctions convexes


Définition 2.4.1 Une fonction f est convexe sur un intervalle I de R si ∀ (x, y) ∈ I 2
et λ ∈ [0, 1] ;
f (λx + (1 − λ) y) ≤ λf (x) + (1 − λ) f (y) .
Remarque 2.4.1 La fonction f est concave si (−f ) est convexe.
Géométriquement : f convexe c’est à dire quelque soit A et B deux points de
gaphe de f, la droite (AB) est située au "dessus" de l’arc AB.
Remarque 2.4.2 Si f est convexe définie sur I intervalle de R alors ∀ (x, y) ∈ I 2 ,
on a f x+y
2 ≤ 12 [f (x) + f (y)] .
Exemple 2.4.1 f (x) = |x| est convexe. En effet, soient x, y ∈ R, λ ∈ [0, 1] ,
f (λx + (1 − λ) y) = |λx + (1 − λ) y|
≤ |λx| + |(1 − λ) y|
≤ λf (x) + (1 − λ) f (y) .
D’où, f est convexe.
Théorème 2.4.1 Si f est deux fois dérivable sur I alors f convexe sur I si et seulement
si ∀ x ∈ I, f 00 (x) ≥ 0.
Exemple 2.4.2 f (x) = x2 , f 0 (x) = 2x, f 00 (x) = 2 > 0. Alors, f est convexe.
Exemple 2.4.3 f (x) = log x, f 0 (x) = x1 , f 00 (x) = − x12 < 0. Alors, (−f ) est convexe.
D’où, f est concave.

2.5 Complément sur les fonctions classiques


2.5.1 Fonctions hyperboliques
x −x
Définition 2.5.1 Pour x ∈ R, on pose ch (x) = e +e 2 [cosinus hyperbolique],
x −x sh(x) x −x
sh (x) = e −e
2 [sinus hyperbolique], et th (x) = ch(x) = eex −e
+e−x [tangente
hyperbolique].

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 42 — #52


i i

42 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Le cosinus hyperbolique
La fonction ch est paire, définie continue dérivable sur R et ch0 (x) = sh (x) , on en
définit le tableau de variation et la courbe :

x 0 0 +∞
+∞ +∞
ch (x) & %
1

Propriété 2.5.1
1. ∀x ∈ R, ch (x) ≥ 1.
ch(x) ch(x)
2. lim x = +∞ et lim x = 12 .
x→+∞ x→+∞ e

Le sinus hyperbolique
La fonction sh est impaire, définie continue dérivable sur R et sh0 (x) = ch (x) , on en
déduit le tableau de variation et la courbe :

x −∞ 0 +∞
+∞
%
sh (x) 0
%
−∞

Propriété 2.5.2
1. ∀x ∈ R, ch (x) + sh (x) = ex et ch (x) − sh (x) = e−x .
2. ∀x > 0, x < sh (x) < ch (x) .
sh(x) sh(x)
3. lim x = +∞ et lim x = 12 .
x→+∞ x→+∞ e

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 43 — #53


i i

2.5 Complément sur les fonctions classiques 43

La tangente hyperbolique
ch2 (x)−sh2 (x)
La fonction th est impaire, définie continue dérivable sur R et th0 (x) = ch2 (x) =
1
ch2 (x) , on en déduit le tableau de variation et la courbe :

x −∞ 0 +∞
1
%
th (x) 0
%
−1

Propriété 2.5.3
1. ∀x ∈ R, −1 < th (x) < 1.
2. ∀x > 0, th (x) < x.

Trigonométrie hyperbolique
1. ∀x ∈ R, ch2 (x) − sh2 (x) = 1.
2. Formules d’addition : ∀x, y ∈ R on a :
– ch (x + y) = ch (x) ch (y) + sh (x) sh (y) .
– sh (x + y) = sh (x) ch (y) + ch (x) sh (y) .
th(x)+th(y)
– th (x + y) = 1+th(x)th(y) .
– En particulier :

ch (2x) = 2ch2 (x) − 1 = 1 + 2sh2 (x) .


sh (2x) = 2sh (x) ch (x) .
2th (x)
th (2x) = .
1 + th2 (x)
x+y x−y
3. Transformations de somme en produit : ∀x, y ∈ R, en posant p = 2 et q = 2 ,
on a x = p + q et y = p − q, on obtient :
– ch (x) + ch (y) = 2ch x+y x−y
 
2  ch 2 .
– ch (x) − ch (y) = 2sh x+y2  sh
x−y
2 .
x+y x−y
– sh (x) + sh (y) = 2sh 2 ch 2 .
sh(x+y)
– th (x) + th (y) = ch(x)ch(y) .
Remarque 2.5.1 Il est possible d’étendre ces fonctions aux complexes, en posant
z −z z −z
pour z ∈ C : ch (x) = e +e
2 et sh (x) = e −e
2 . On peut déduire des formules
d’Euler que pour tout réel x, cos (x) = ch (ix) et i sin (x) = sh (ix) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 44 — #54


i i

44 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2.5.2 Inversion des fonctions hyperboliques

La fonction ch définit une bijection de ]0; +∞[ sur l’intervalle [1; +∞[ , la bijection
réciproque est notée arg ch [argument cosinus hyperbolique] et définie par :

arg ch : [1; +∞[ −→ [0; +∞[


x 7−→ arg ch (x) = y tel que y ≥ 0 et ch (y) = x.

Cette fonction est continue sur [1; +∞[ , strictement croissante, dérivable sur ]1; +∞[
mais pas en 1 (car la dérivée de ch s’annule en 0 et ch (0) = 1), sa dérivée est :

1 1
∀x > 1, arg ch0 (x) = =√ .
sh (arg ch (x)) 2
x −1

Courbe représentative

x 1 +∞
+∞
arg ch (x) %
0

Propriété 2.5.4 1. ∀x ≥ 0, arg ch (ch (x)) = x.


2. ∀x ≥ 1, ch (arg ch (x)) = x.
√ 
3. ∀x ≥ 1, arg ch (x) = log x + x2 − 1 .
arg ch(x) arg ch(x)
4. lim x = 0 et lim = 1.
x→+∞ x→+∞ log(x)

La fonction sh définit une bijection de R sur R, la bijection réciproque est notée


arg sh [argument sinus hyperbolique] et définie par :

arg sh : R −→ R
x 7−→ arg sh (x) = y tel que sh (y) = x.

Cette fonction est continue sur R, strictement croissante, dérivable sur R (car la dérivée
de sh ne s’annule pas), sa dérivée est :

1 1
∀x ∈ R, arg sh0 (x) = =√ .
ch (arg sh (x)) 2
x +1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 45 — #55


i i

2.5 Complément sur les fonctions classiques 45

Courbe représentative

x −∞ 0 +∞
+∞
%
arg sh (x) 0
%
−∞

Propriété 2.5.5 1. ∀x ∈ R, arg sh (sh (x)) = x et sh (arg sh (x)) = x.


2. ∀x ∈ R, arg sh (−x) = − arg sh (x) .
√ 
3. ∀x ∈ R, arg sh (x) = log x + x2 + 1 .
4. ∀x > 0, x < arg sh (x) .
arg sh(x) arg sh(x)
5. lim x = 0 et lim = 1.
x→+∞ x→+∞ log(x)
La fonction th définit une bijection de R sur ]−1; 1[ , la bijection réciproque est
notée arg th [argument tangente hyperbolique] et définie par :
arg th : ]−1; 1[ −→ R
x 7−→ arg th (x) = y tel que th (y) = x.
Cette fonction est continue sur ]−1; 1[ , strictement croissante, dérivable sur ]−1; 1[
(car la dérivée de sh ne s’annule pas), sa dérivée est :
1 1
∀x ∈ ]−1; 1[ , arg th0 (x) = = .
1 − th2 (arg th (x)) 1 − x2
Courbe représentative

x −1 0 1
+∞
%
arg th (x) 0
%
−∞

Propriété 2.5.6 1. ∀x ∈ R, arg th (th (x)) = x et


∀x ∈ ]−1; 1[ , th (arg th (x)) = x.
2. ∀x ∈ ]−1; 1[ , arg th (−x) = − arg th (x) .
3. ∀x > 0, arg th (x) > x.
 
1+x
4. ∀x ∈ ]−1; 1[ , arg th (x) = 21 log 1−x .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 46 — #56


i i

46 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2.6 Formules de Taylor


2.6.1 Généralités sur les dérivée d’ordre supérieur
Soit une fonction f : I ⊆ −→ R. On pose f (0) = f et on définit par récurrence la
fonction dérivée n-ième de f sur I, notée f (n) , comme la dérivée de f (n−1) si elle
existe.
Exemple 2.6.1
1. f (x) = xn , f 0 (x) = nxn−1 , f 00 (x) = n (n − 1) xn−2 , . . . ,
f (n) (x) = n (n − 1) · · · 1 = n!.
2. f (x) = sin x, f 0 (x) = cos x, f 00 (x) = − sin x, . . . , f (n) (x) = sin x + n π2 .


3. f (x) = cos x, f 0 (x) = − sin x, f 00 (x) = − cos x, . . . , f (n) (x) = cos x + n π2 .




Théorème 2.6.1 (Formule de Leibnitz) Soient f, g deux fonctions n fois dérivable


sur I alors f × g est n fois dérivables sur I et on a :
n
X
n
(f × g) = Cnp f p g n−p .
p=0

p
Preuve : Récurrence sur n et utiliser Cnp + Cnp−1 = Cn+1 .
Remarque 2.6.1 On dit que f est de classe C n si et seulement si f (n) (x) est continue.
On dit que f est de classe C ∞ si elle est indéfiniment et continûment dérivable.

2.6.2 Formule de Taylor-Lagrange


Théorème 2.6.2 Soit f une fonction de classe C n sur un intervalle [a, b] de R et telle
que f (n+1) soit définie sur ]a, b[ , alors il existe c ∈ ]a, b[ tel que
n n+1
(b − a) (n) (b − a)
f (b) = f (a) + (b − a) f 0 (a) + · · · + f (a) + f (n+1) (c).
| {z n! } (n + 1)!
| {z }
Partie régulière du développement de Taylor-Lagrange de f Reste de Lagrange

2.6.3 Formule de Taylor-Young


Théorème 2.6.3 Soit f une fonction de classe C n sur un intervalle I contenant x0 ,
alors ∀x ∈ I, on a
n
(x − x0 ) (n) n
f (x) = f (x0 ) + (x − x0 ) f 0 (x0 ) + · · · + f (x0 ) + (x − x0 )  (x) ,
n!
avec lim  (x) = 0.
x→x0
Corollaire 2.6.1 (Formule de Mac-Laurin) Dans le càs particulier (x0 = 0), on
obtient la formule de Mac-Laurin suivante :
xn (n)
f (x) = f (0) + xf 0 (0) + · · · + f (0) + xn  (x) ,
n!
avec lim  (x) = 0.
x→0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 47 — #57


i i

2.7 Développements limités 47

Exemple 2.6.2
xn

1. ∀x ∈ R, ex = 1 + x + · · · + + xn  (x) avec lim  (x) = 0. f (n) (0) = 1 .
n! x→0
2. ∀x ∈ R, sin x est de classe C ∞ sur R et on a : f (n) (x) = sin x + n π2 alors

k
f (2k) (0) = 0 et f (2k+1) (0) = (−1) , k ∈ N. D’où, ∀x ∈ R,
n
X k x2k+1
sin x = (−1) + x2n+1  (x) (x → 0)
(2k + 1)!
k=0
x3 n x
2n+1
=x− + · · · + (−1) + x2n+1  (x) (x → 0) .
3! (2n + 1)!

3. ∀x ∈ R, cos x est de classe C ∞ sur R et on a : f (n) (x) = cos x + n π2 alors



k
f (2k) (0) = (−1) et f (2k+1) (0) = 0, k ∈ N. D’où, ∀x ∈ R,
n
X k x2k
cos x = (−1) + x2n  (x) (x → 0)
(2k)!
k=0
x2 n x
2n
=1− + · · · + (−1) + x2n  (x) , (x → 0) .
2! (2n)!

2.7 Développements limités


Soient f : ]−α, α[ −→ R, α ∈ R∗+ , une fonction définie au voisinage de 0, sauf peut
être en 0, et n un entier naturel.
Définition 2.7.1 On dit que f admet un développement limité (DL) à l’ordre n en 0
s’il existe des coefficients réels a0 , a1 , a2 , ..., an et une fonction ε : ]−α, α[ −→ R,
sauf peut être en 0, tels que :
n
X
f (x) = ak xk + xn  (x) , ∀x ∈ ]−α, α[ \ {0} , avec lim  (x) = 0.
x−→0
k=0

Remarque 2.7.1 1. Dans certains ouvrages, on peut écrire O (xn ) à la place de


xn  (x) , ∀n ∈ N.
2. Aucune propriété de f n’est demandée.
3. Si f admet un DL en zéro à l’ordre n alors limx−→0 f (x) = a0 . Donc si f
n’admet pas de limite finie en 0 alors f n’admet pas de DL en 0 (Exemples :
f (x) = x1 , f (x) = log(x)).
4. Si f admet un DL en 0 à l’ordre n, on aura :
n
X
f (x) = ak xk + xn  (x), avec lim  (x) = 0
| {z } x−→0
k=0
| {z } Rn (x)
Pn (x)

Pn (x) : La partie principale du DL de f en 0 et Rn (x) : Le reste du DL


de f en 0.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 48 — #58


i i

48 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Exemple 2.7.1 Pour x 6= 1, on sait que : 1 − xn+1 = (1 − x) (1 + x + · · · + xn ) ,


n ≥ 0. Alors,
1 − xn+1
= 1 + x + · · · + xn , n ≥ 0.
1−x
Ainsi,
1 x
= 1 + x + · · · + xn + xn .
1−x | {z } 1−x
Pn (x) | {z }
Rn (x)
1 x
C’est le DL de la fonction 1−x en zéro à l’ordre n avec limx−→0 1−x = 0.

2.7.1 Propriétés des développements limités


Proposition 2.7.1 1. Si f admet un DL en 0 à l’ordre n et si 0 ≤ p ≤ n alors f
admet un DL en 0 à l’ordre p.
2. Une fonction f admet au plus un DL en 0 à un ordre donné n.
Exemple 2.7.2 1. Déterminer le DL en 0 à l’ordre 2 de la fonction suivante :
x sin x1 , si x 6= 0
 3
f (x) =
0 sinon

En effet, x3 sin x1 = 0 + x2 x sin x1 , limx−→0 x sin x1 = 0.


 

2. f admet-elle un DL en 0 à l’ordre 3 ? Non, car sin x1 n’admet pas de limite


en 0.
Remarque 2.7.2 Si f est une fonction paire (resp : impaire) admet un DL en zéro à
l’ordre n alors sa partie principale est un polynôme pair (resp : impair).

2.7.2 Dévelppoments limités des fonctions classiques


Théorème 2.7.1 Soit f : ]−α, α[ −→ R, α ∈ R∗+ , une fonction n fois dérivable sur
l’intervalle ]−α, α[, alors f admet un DL en 0 à l’ordre n donné par la formule
de Mac-Laurin :
n
X f (k) (0)
f (x) = xk + xn  (x) , avec lim  (x) = 0.
k! x−→0
k=0

Exemple 2.7.3 1. La fonction exponentielle est infiniment dérivable donc elle


admet un DL à n’importe quelle ordre n. On a f (k) (x) = f (x) et f (k) (0) = 1,
∀k ∈ N, d’où le DL de ex en 0 à l’ordre n est donné par :
n
X 1 k
ex = x + xn  (x) , avec lim  (x) = 0.
k! x−→0
k=0

2. Le DL de sin x en 0 à l’ordre 2n + 1 est donné par :


n
X k x2k+1
sin x = (−1) + x2n+1  (x) , avec lim  (x) = 0.
(2k + 1)! x−→0
k=0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 49 — #59


i i

2.7 Développements limités 49

3. Le DL de cos x en 0 à l’ordre 2n est donné par :


n
X k x2k
cos x = (−1) + x2n  (x) , avec lim  (x) = 0.
(2k)! x−→0
k=0

Les DL en zéro de quelques fonctions usuelles


n
α
X α (α − 1) (α − 2) · · · (α − k + 1)
(1 + x) = xk +xn  (x) , avec lim  (x) = 0, α ∈ R.
k! x−→0
k=0
n
X k xk+1
log (1 + x) = (−1) + xn+1  (x) , avec lim  (x) = 0.
k+1 x−→0
k=0
n
−1
X k
(1 + x) = (−1) xk + xn  (x) , avec lim  (x) = 0.
x−→0
k=0
n
−1
X
(1 − x) = xk + xn  (x) , avec lim  (x) = 0.
x−→0
k=0
n k+1
X x
log (1 − x) = − + xn+1  (x) , avec lim  (x) = 0.
k+1 x−→0
k=0

2.7.3 Opérations sur les développements limités


Supposons que
f (x) = Pn (x) + xn 1 (x) , avec lim 1 (x) = 0,
x−→0
n
g (x) = Qn (x) + x 2 (x) , avec lim 2 (x) = 0.
x−→0

2.7.4 La somme
Théorème 2.7.2 La fonction (λf + βg), λ et β ∈ R, admet un DL en zéro à l’ordre
n qui est donné par :
(λf +βg) (x) = Rn (x)+xn  (x) , avec Rn (x) = λPn (x)+βQn (x) et lim  (x) = 0.
x−→0

Exemple 2.7.4 1. Calculer le DL de la fonction ch(x) en 0 à un ordre donné. On


sait que :
ex + e−x
ch(x) = .
2
D’où,
n
X x2k
ch(x) = + x2n  (x) , avec lim  (x) = 0.
(2k)! x−→0
k=0
2. De même on démontre que
n
X x2k+1
sh(x) = + x2n+1  (x) , avec lim  (x) = 0.
(2k + 1)! x−→0
k=0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 50 — #60


i i

50 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2.7.5 Le produit
Théorème 2.7.3 La fonction (f × g) admet un DL en zéro à l’ordre n dont la partie
principale s’obtient en effectuant le produit Pn (x) × Qn (x) et ne conservant que
les termes de degré inférieur ou égal à n

(f × g) (x) = ”Pn (x) × Qn (x) ” + xn  (x) , avec lim  (x) = 0.


| {z } x−→0
Ne garder que les termes de degré ≤n

Exemple 2.7.5 Calculer le DL de la fonction sin2 (x) en 0 à l’ordre 6. On sait que le


DL de la fonction sin(x) est donné par

x3 x5
sin x = x − + + x6  (x) , avec lim  (x) = 0.
3! 5! x−→0

Donc,

x3 x5 x3 x5
  
2
sin (x) = ” x − + x− + ” + x6  (x) , avec lim  (x) = 0.
3! 5! 3! 5! x−→0
| {z }
Ne garder que les termes de degré ≤6

D’où,
x4 2
sin2 (x) = x2 − + x6 + x6  (x) , avec lim  (x) = 0.
3 45 x−→0

2.7.6 Fonctions composées


Développements limités au voisinage de x0 ∈ R∗
Définition 2.7.2 Soit f une fonction définie au voisinage de x0 et non nécessairement
en x0 . f admet un DL à l’ordre n au voisinage de x0 veut dire qu’il existe des
coefficients réels a0 , a1 , a2 , ..., an tels que pour tout x ∈ V (x0 ), on a
n n
f (x) = a0 +a1 (x − x0 )+· · ·+an (x − x0 ) +(x − x0 )  (x) , avec lim  (x) = 0.
x−→0

Marche à suivre 1. Si f vérifie les conditions de la formule de Taylor-Lagrange,


on a
f (n) (x0 )
an = , ∀n ∈ N.
n!
2. Ou bien on applique un changement de variables comme dans l’exemple
suivant.
Exemple 2.7.6 On calcule le DL de ex au voisinage de 1 à un ordre donné. On pose
y = x − 1 −→ 0 ⇔ x = y + 1.
x→π

n
X 1 k
ex = e(y+1) = eey = e y + y n  (y) , avec lim  (y) = 0.
k! y−→0
k=0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 51 — #61


i i

2.7 Développements limités 51

Donc,
n
X 1 k n
ex = e (x − 1) + (x − 1)  (x) , avec lim  (x) = 0.
k! x−→0
k=0

C’est le DL de ex au voisinage de 1.
Développement limité de (f ◦ g) au viosinage de zéro Supposons que g admet
un DL en 0 à l’ordre n donné par

g (x) = b0 + b1 x + · · · + bn xn + xn 1 (x) , avec lim 1 (x) = 0


x−→0

et f admet un DL en b0 à l’ordre n comme suit


n n
f (x) = a0 +a1 (x − b0 )+· · ·+an (x − b0 ) +(x − b0 ) 2 (x) , avec lim 2 (x) = 0.
x−→b0

Théorème 2.7.4 La fonction h = (f ◦ g) admet un DL en 0 à l’ordre n dont la partie


principale s’obtient en développant l’expression
n
a0 + a1 (b1 x + · · · + bn xn ) + · · · + an (b1 x + · · · + bn xn )

et ne gardant que les termes de degré ≤ n. Ainsi,


n
h (x) = ”a0 + a1 (b1 x + · · · + bn xn ) + · · · + an (b1 x + · · · + bn xn ) ” + xn  (x) ,
| {z }
Ne garder que les termes de degré ≤n

avec limx−→0  (x) = 0.


Exemple 2.7.7 Calculons le DL de esin x en zéro à l’ordre 3. On pose f (x) = ex et
g(x) = sin x.

x3
g (x) = sin x = x − + x3 1 (x) , avec lim 1 (x) = 0, b0 = 0.
6 x−→0

x2 x3
f (x) = ex = 1 + x + + + x3 2 (x) , avec lim 2 (x) = 0.
2 6 x−→b0 =0.

Alors,
2 3
x3 x3 x3
   
sin x 1 1
h (x) = e = ”1 + x − + x− + x− ” + x3  (x) ,
6 2 6 6 6
| {z }
Ne garder que les termes de degré ≤3

avec limx−→0  (x) = 0. D’où,

x2
h (x) = esin x = 1 + x + + x3  (x) , avec lim  (x) = 0.
2 x−→0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 52 — #62


i i

52 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2.7.7 Le Quotient
Soit h(x) = fg(x)
(x)
une fonction définie au voisinage de zéro (la fonction g ne s’annule
pas au voisinage de 0). On se propose de calculer le DL de h en 0 sachant que

f (x) = Pn (x) + xn 1 (x) = a0 + a1 x + · · · + an xn + xn 1 (x) , avec lim 1 (x) = 0,


x−→0

g(x) = Qn (x) + xn 2 (x) = b0 + b1 x + · · · + bn xn + xn 2 (x) , avec lim 2 (x) = 0.


x−→0

Il est à noter que b0 6= 0 car g ne s’annule pas au voisinage de 0. C’est une condition
nécessaire pour pouvoir faire la division suivant les puissances croissantes de Pn (x)
par Qn (x).
Théorème 2.7.5 La fonction h(x) = fg(x) (x)
admet un DL en zéro à l’ordre n dont la
partie principale est le quotient de la division suivant les puissances croissantes
de Pn (x) par Qn (x) à l’ordre n, c’est à dire

Pn (x) = S (x) × Qn (x) + xn+1 R (x) , avec S(x) = 0 ou deg (S) ≤ n.

Ainsi le DL de h est donné par

h(x) = S(x) + xn  (x) , avec lim  (x) = 0.


x−→0

ex
Exemple 2.7.8 Calculer le DL de h(x) = 1+sin x en 0 à l’ordre 3. En effet,

x2 x3
ex = 1 + x + + + x3 1 (x) , avec lim 1 (x) = 0,
2 6 x−→0

x3
1 + sin x = 1 + x − + x3 2 (x) , avec lim 2 (x) = 0.
6 x−→0

En faisant la division suivant les puissances croissantes à l’ordre 3 de

x2 x3 x3
   
1+x+ + par 1 + x − ,
2 6 6

on obtient,

x2 x3 x2 x3 x3 x2
      
1 x
1+x+ + = 1+ − 1+x− + x4 + − .
2 6 2 6 6 6 12 36

D’où,
x2 x3
h (x) = 1 + − + x3  (x) , avec lim  (x) = 0.
2 6 x−→0

Remarque 2.7.3 Le Théorème 2.2.4 reste valable même si la fonction g s’annule au


voisinage de 0, mais dans ce cas il faut que la puissance du monôme de plus petit
degré dans le polynôme Qn (x) soit inférieure ou égale à celle dans le polynôme
Pn (x), donc la fonction h serait prolongeable à l’origine.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 53 — #63


i i

2.7 Développements limités 53

2.7.8 Autre propriétés des développements limités

Théorème 2.7.6 Soit f une fonction dérivable sur un voisinage de 0 telle que sa
fonction dérivée f 0 admet un DL en 0 à l’ordre n donné par

f 0 (x) = a0 + a1 x + · · · + an xn + xn 1 (x) , avec lim 1 (x) = 0.


x−→0

Alors, f admet le DL en 0 à l’ordre (n + 1) suivant

x2 xn+1
f (x) = cste + a0 x + a1 + · · · + an + xn+1 1 (x) ,
2 n+1

avec cste = f (0) et limx−→0 1 (x) = 0.

Donner le DL de la fonction arctan(x) en zéro à l’ordre 4. En effet, la fonction en


question est dérivable au voisinage de 0 avec arctan0 (x) = 1+x
1
2 , son DL à l’ordre 3 en
1 2 3
0 est donné par 1+x2 = 1 − x + x  (x) , avec limx−→0  (x) = 0. D’où,
Z
1 + x2 dx + x4  (x) , avec lim  (x) = 0,

arctan(x) = arctan(0) +
x−→0
3
x
=x− + x4  (x) , avec lim  (x) = 0.
3 x−→0

Développements limités au voisinage de l’infini

Pour calculer le DL d’une fonction f au V (∞), on pourra effectuer le changement de


variables suivant
1 1
y= −→ 0 ⇐⇒ x = .
x x→∞ y

D’où, la fonction f ( y1 ) admet un DL en zéro si et seulement si f (x) admet un DL à


l’∞.
1
Exemple 2.7.9 Donner le DL à l’∞ à l’ordre 4 de la fonction f (x) = 1−x−x2 . En
effet, on pose
1 1
y= −→ 0 ⇐⇒ x = .
x x→∞ y
Ainsi,

1 y2
f (x) = f ( ) = 2 = −y 2 + y 3 − 2y 4 + y 4  (y) , avec lim  (y) = 0.
y y −y−1 y−→0

D’où,
1 1 2 1
f (x) = − 2
+ 3 − 4 + 4  (x) , avec lim  (x) = 0.
x x x x x−→∞

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 54 — #64


i i

54 Chapitre 2. Etude des fonctions réelles d’une variable réelle

2.8 Fonctions équivalentes, définition et opérations


Définition 2.8.1 On dit que deux fonctions f et g définies au voisinage de x0 (avec
x0 fini ou infini) sont équivalentes quand x tend vers x0 et on note f ∼ g s’il
x→x0
existe une fonction h définie au voisinage de x0 telle que :

f (x) = g(x) × h(x), avec lim h (x) = 1.


x→x0

Remarque 2.8.1 Si la fonction g ne s’annule pas au voisinage de x0 alors


   
f (x)
f ∼ g ⇐⇒ lim =1 .
x0 x→x0 g (x)

Exemple 2.8.1 Montrer que sin x ∼ x. En effet, on sait que


x→0

x3
sin x = x − + x3  (x) , avec lim  (x) = 0
6 x−→0
x2
 
=x 1− + x2  (x) .
6
| {z }
h(x)−→1 quand x−→0

Ou encore,
sin x
lim = 1.
x−→0 x
Marche à suivre
Si une fonction f admet un DL au voisinage de x0 alors f (x) ∼ Pn (x) . La
x→x0
proposotion suivante traduit l’impotance des fonctions équivalentes.
 
Proposition 2.8.1 1. Si f ∼ g alors lim f (x) = lim g (x) . (La réciproque est
x0 x→x0 x→x0
fausse).
2. Si f et g ont la même limite l quand x tend vers x0 et si l est finie non
nulle alors f ∼ g.
x0

2.8.1 Opérations sur les fonctions équivalentes


Le produit
On suppose f ∼ g et f1 ∼ g1 alors f × f1 ∼ g × g1 .
x0 x0 x0

Le quotient
f
On suppose f ∼ g et f1 ∼ g1 alors ∼ gg1 ,
f1 x (f1 × g1 6= 0 au voisinage de x0 ) .
x0 x0 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 55 — #65


i i

2.9 Applications 55

La somme
La relation d’équivalence n’est pas compatible avec la somme. Contre exemple :

x + x2 ∼ x + x3 et − x ∼ −x.
 
x→0 x→0

En faisant la somme composante par composante, on obtient x2 et x3 qui ne sont pas


équivalentes puisque
x3
lim 2 = 0 6= 1.
x→0 x

2.9 Applications
Un DL d’une fonction f au voisinage d’un point x0 permet d’obtenir un équivalent de
f en x0 sous forme polynomiale
n n
f (x) = a0 + a1 (x − x0 ) + · · · + an (x − x0 ) + (x − x0 )  (x) , avec lim  (x) = 0
x−→x0

et donc au voisinage de x0
n
f (x) ∼ a0 + a1 (x − x0 ) + · · · + an (x − x0 ) .
x→x0

Ceci permet de remplacer f par son DL dans l’étude locale en x0 .


Exemple 2.9.1 On considère la fonction f définie par
(
log(2−e−x )
f (x) = x si x 6= 0
1 si x = 0

1. Le DL de f à l’ordre 3 au voisinage de 0

f (x) = 1 − x + x2 + x2  (x) , avec lim  (x) = 0.


x−→x0

2. L’équation de la tangente de f au voisinage de 0

y = f 0 (0) x + f (0) = (−1) × x + (1) = 1 − x.

Au voisinage de 0, f (x) − y = x2 + x2  (x) , avec limx−→x0  (x) = 0. D’où,


la courbe de f est située au dessus de la tengante au point d’abscisse 0.
Exemple 2.9.2 (Recherche des asymptotes) Chercher les asymptotes au graphe
de la fonction f définie sur R par
x
f (x) = 1 .
1 + ex
On a, limx−→∞ f (x) = ∞. Donc, pour déterminer les asymptotes de f au
voisinage de ∞, il suffit de calculer limx−→∞ f (x)
x . Ainsi, le DL à l’ordre 3 de f

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 56 — #66


i i

56 Chapitre 2. Etude des fonctions réelles d’une variable réelle

au voisinage de l’∞ est donnée par


1 1
f (x) = f ( ) =
y y (1 + ey )
 
1 1 1 1 3
= − y + y + y 2  (y) , avec lim  (y) = 0.
y 2 4 48 y−→0

Alors,
f (x) 1 11 1 1 1
= − + + 3  (x) , avec lim  (x) = 0.
x 2 4 x 48 x3 x x−→∞
Finalement,
1 1 1 1 1
f (x) = x− + + 2  (x) , avec lim  (x) = 0.
2 4 48 x2 x x−→∞

Ainsi, y = 12 x − 14 est une asymptote du graphe de f au voisinage de l’∞. D’où,


le graphe est située au dessus de son asymptote.

2.10 Exercices
2.10.1 Enoncés
Exercice 1 :
1. Calculer les limites suivantes :
 
1 3 1−2 cos x
lim 1−x − 1−x 3 lim sin 5x lim π−3x
x→1 x→0 sin 2x x→ π
3

2. En utilisant le fait que, pour tout a ∈ R


 a x
lim 1 + = ea ,
x→+∞ x
trouver les limites suivantes :
 x
x−1 a x

lim x+1 lim 1+ x
x→+∞ x→−∞

Exercice 2 :
Soit la fonction réelle f définie sur R par :
 
1
f (x) = sin si x 6= 0 et f (0) = 1.
x
n
1. Trouver une suite de réels xn vérifiant limn→+∞ xn = 0 et f (xn ) = (−1) .
2. En déduire que f n’est pas continue en 0.
Exercice 3 :
Soit f : ]0, 1] −→ R définie par
x+1
f (x) = .
x2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 57 — #67


i i

2.10 Exercices 57

1. Montrer que f est uniformément continue sur [h, 1] , h > 0.


2. Est-elle uniformément continue sur ]0, 1] ?
Exercice 4 :

3

1. Calculer arccos 2 , arcsin 12 , arctan 3.
1 4
2. Vérifier que 2 arctan 2 = arctan 3.
3. Simplifier les expressions suivantes :

tan (2 arctan x) , cos (4 arctan x) , sin (2 arcsin x) .

Exercice 5 :
Etudier la dérivabilité de la fonction f dans chacun des cas suivants :
( 1

1. f (x) = e x2 −4 si |x| < 2


0 sinon

2. f (x) = cos x
x4 −1
3. f (x) = x−1 (on commence par prolonger f en 1)
Exercice 6 :
1
Soit f la fonction définie sur R∗+ par f (x) = xe ln x . Montrer que f admet un
prolongement de classe C 1 sur R+ \ {1} .
Exercice 7 :
1. Calculer la fonction dérivée de la fonction f dans chacun des cas suivants :
q
x
(a) f (x) = arcsin 1+sin2
√ 
(b) f (x) = 2 arctan 1 + x2 − x + arctan x
2. Etudier la dérivabilité de la fonction définie par :
 
2x
f (x) = arcsin .
1+x

Exercice 8 :
1. Résoudre les équations suivantes :
(a) arcsin x + arcsin 2x = arccos x + arccos 2x
π
(b) arctan 2x + arctan 3x = 4

2. Montrer que :
(a) tan (arcsin (tanh x)) = sinh x, ∀x ∈ R
q
(b) arg cosh cosh2x+1 = |x|2 , ∀x ∈ R

(c) 2 arctan (tanh x) = arctan (sinh 2x) , pour x appartient à un intervalle que
l’on précisera.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 58 — #68


i i

58 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Exercice 9 :
Calculer, en utilisant le théorème des accroissements finis, les limites suivantes :
 1 1

1. lim e x − e 1+x x2
x→+∞
1 1 1

2. lim 2 ln
n→+∞ 2 + 3 ln 3 + · · · + n ln n

Exercice 10 :
Donner un développement limité des fonctions suivantes au voisinage de 0 à l’ordre
n:
 
1+x
f1 (x) = ln , n=4
1−x
x
f2 (x) = , n=5
sin x √
f3 (x) = ex − 1 + 2x, n = 2
x
f4 (x) = x , n=4
e −1
 
arg tanh x
f5 (x) = ln , n=3
x

f6 (x) = ex − x − 1, n = 3
 2

f7 (x) = arcsin e−x , n = 5

Exercice 11 :
Donner un développement limité des fonctions suivantes au voisinage du point x0
à l’ordre n :
x π
f1 (x) = (sin x) , x0 = , n=4
2
π
f2 (x) = arctan (2 sin x) , x0 = , n = 3
3
ln x
f3 (x) = 2 , x0 = 1, n = 4
x
Exercice 12 :
Donner un développement limité généralisé des fonctions suivantes au voisinage de
l’∞ à l’ordre n :
 
1
f1 (x) = ln x tan , n=4
x
r
2
3 x + x + 1
f2 (x) = , n=2
x2 + 1
r
x+1
f3 (x) = arctan , n=3
x+2

Exercice 13 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 59 — #69


i i

2.10 Exercices 59

Calculer les limites suivantes :


sin x−ln(ex cos x) x
lim x sin x lim e −cos x−x
x→0 x→0 x−ln(1+x)
  1
1
2 1 e x −cos
lim cos2 ( x
+ ln(sin( x
lim p x
x→π 2) 2 )) x→+∞ 1− 1− x12

Exercice 14 :

1+sin x
1. Trouver un équivalent au voisinage de 0 de f (x) = e − e.
p √ √ 
2. Trouver un équivalent au voisinage de +∞ de g (x) = x x2 + x4 + 1 − x 2 .

Exercice 15 :
Déterminer α ∈ R et β ∈ R tels que :

ex
 
α
lim + +β = 0.
x→0 ln (1 + x) x

2.10.2 Corrigés

Exercice 1 :

1.
   
1 3 1 3
lim − = lim 1−
x→1 1 − x 1 − x3 x→1 1 − x 1 + x + x2
x + x2 − 2
  
1
= lim
x→1 1 − x 1 + x + x2
  
1 (x − 1) (x + 2)
= lim
x→1 1 − x 1 + x + x2
= −1.

sin 5x sin 5x x 5
lim = lim = .
x→0 sin 2x x→0 x sin 2x 2

1 − 2 cos π3 − h

1 − 2 cos x
lim = lim
h→0 π − 3 π − h

x→ π3 π − 3x 3

1 − 2 cos π3 cos h + sin π3 sin h

3
= lim =− .
h→0 3h 3

2. En utilisant le fait que, pour tout a ∈ R


 a x
lim 1+ = ea ,
x→+∞ x

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 60 — #70


i i

60 Chapitre 2. Etude des fonctions réelles d’une variable réelle

trouver les limites suivantes :


 x  x
x−1 x+1−2
lim = lim
x→+∞ x + 1 x→+∞ x+1
 x
2
= lim 1−
x→+∞ x+1
 x+1
2
1 − x+1 1
= lim 2 = 2.
x→+∞ 1 − x+1 e

 a x  a −x
lim 1+ = lim 1 −
x→−∞ x x→+∞ x
1
= lim  x = ea .
x→+∞ a
1 + −x

Exercice 2 :
1
 π
 n
1. Il suffit de prendre Soit n ∈ N, xn = (2n+1) π car sin (2n + 1)
2 = (−1) et
2
n
donc limn→+∞ xn = 0 et f (xn ) = (−1) .
2. Supposons que f est continue en 0, en particulier, comme limn→+∞ xn = 0
n
alors limn→+∞ f (xn ) = f (0) = 1. Or, limn→+∞ f (xn ) = limn→+∞ (−1) qui
n’existe pas. D’où, f n’est pas continue en 0.
Exercice 3 :
1. f est continue sur [h, 1] , h > 0 avec [h, 1] un intervalle fermé borné. Donc, f est
uniformément continue sur [h, 1] , h > 0.
2. f n’est pas uniformément continue sur ]0, 1]. C’est à dire, montrer qu’il existe
 > 0, ∀η0 > 0, ∃x, y ∈ ]0, 1] tel que |x − y| < η0 et

|f (x) − f (y)| ≥ .

En effet,

x + 1 y + 1 (x + 1) (xy + x + y)
|f (x) − f (y)| = 2 −
= .
x y2 x2 y 2

2 1
Soit y = n et x = Pour que x, y ∈ ]0, 1] , il suffit que n ≥ 2 :
n.

2n + 3n2 4 + 12

|f (x) − f (y)| =

≥ 4 = 4.

4

Ainsi, pour  = 4 > 0, ∀η0 > 0, ∃x = n1 , y = n2 ∈ ]0, 1] avec n ≥ 2 et n ≥ η10


    
n = sup 2, E η10 + 1 tel que |x − y| = n1 < η0 et |f (x) − f (y)| ≥ 4. D’où
le résultat.
Exercice 4 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 61 — #71


i i

2.10 Exercices 61

1.

y ∈ [0, π]

3 √
π
arccos =y⇔ 3 ⇒y = .
2 cos y = 2 6
y ∈ − π2 , π2
  
1 π
arcsin = y ⇔ 1 ⇒y= .
2 cos y = 2 6

  π π
y ∈ − 2 ,√2 π
arctan 3 = y ⇔ ⇒y= .
tan y = 3 3

– Posons y = 2 arctan 21 . Montrons que

y ∈ − π2 , π2
  

tan y = 43

2 tan arctan 21
  
1
tan y = tan 2 arctan =
1 − tan2 arctan 12

2
1
2× 2 4
= = .
1 2 3

1− 2

1
On a 0 < 2 < 1. Comme la fonction arctan est croissante donc

1 π
0 = arctan 0 < arctan
< arctan 1 = .
2 4
1 π i π πh
⇒ 0 < 2 arctan < ⇒ y ∈ − , .
2 2 2 2
– Posons f (x) = tan (2 arctan x) .
n n π π oo
Df = R\ x / 2 arctan x ∈
/ − ,
2 2
= R\ {−1, 1} .

Ainsi,
2 tan (arctan x) 2x
tan (2 arctan x) = 2 = .
1 − tan (arctan x) 1 − x2
– Posons f (x) = cos (4 arctan x) . Df = R.

1 − tan2 (2 arctan x)
cos (4 arctan x) =
1 + tan2 (2 arctan x)
 2
2x
1 − 1−x 2 x4 − 6x2 + 1
= 2 = 2 .
(x2 + 1)

2x
1 + 1−x 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 62 — #72


i i

62 Chapitre 2. Etude des fonctions réelles d’une variable réelle

– Posons f (x) = sin (2 arcsin x) . Df = [−1, 1] .

sin (2 arcsin x) = 2x cos (arcsin x)


q
= 2x 1 − sin2 (arcsin x) (car cos (arcsin x) ≥ 0)
p
= 2x 1 − x2 .

Exercice 5 :
1. Comme f est pair, le domaine d’étude est R+ .
– Continuité en 2 :

lim f (x) = 0 = f (2) = lim− f (x) = 0.


x→2+ x→2

Donc, f est continue en 2. D’où, la continuité de f sur R+ .


– Dérivabilité en 2 :
f (x) − f (2) f (x) − f (2)
lim+ = 0 = lim− .
x→2 x−2 x→2 x−2

Donc, f est dérivable en 2. D’où, la dérivable de f sur tout R.



2. f (x) = cos x. Df = R+ . f est continue sur R+ , dérivable sur R∗+ .
– Dérivabilité en 0+ :

f (x) − f (0) cos x − 1
lim+ = lim+
x→0 x−0 x→0 x
cos y − 1 1
= lim+ =− .
y→0 y2 2

Donc, f est dérivable en 0+ . D’où, la dérivable de f sur R+ .


x4 −1
3. f (x) = x−1 . Df = R\ {1} .

x4 − 1
= lim x2 − 1 (x + 1) = 4.

lim f (x) = lim
x→1 x→1 x − 1 x→1

Donc, f admet un prolongement par continuité en 1 définie par

x4 −1

x−1 si x 6= 1
g (x) =
4 si x = 1

Dérivabilité de g en 1 :

x4 −1
g (x) − g (1) x−1 −4
= lim x2 + 2x + 3 = 6.

lim = lim
x→1 x−1 x→1 x−1 x→1

Donc, g est dérivable en 1. D’où, la dérivable de g sur tout R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 63 — #73


i i

2.10 Exercices 63

Exercice 6 :
Df = R∗+ \ {1} .
1
lim f (x) = lim+ xe ln x = 0.
x→0+ x→0

Donc, f admet un prolongement par continuité en 0 définie par


 1
xe ln x si x ∈ R∗+ \ {1}
g (x) =
0 si x = 0

Soit x ∈ R∗+ \ {1} ,


 
0 0 1 1
g (x) = f (x) = e ln x 1− 2 .
ln x
Donc, g 0 est continue sur R∗+ \ {1} .

g (x) − g (0) 1
lim = lim+ e ln x = 1 = g 0 (0) = lim+ g 0 (x) .
x→0+ x−0 x→0 x→0

Donc, g 0 est continue en 0. Ainsi, g 0 est continue sur R+ \ {1} . D’où, f admet un
prolongement de classe C 1 sur R+ \ {1} .
Exercice 7 :
2 (−1)k
1. (a) f 0 (x) = √cos x
2 1−sin2 x
= cos x
2|cos x| = 2 , k ∈ N.
(b) f 0 (x) = π
2.
2. Df = − 13 , 1 . Le domaine de dérivabilité :
 

     
1 2x 1
Dd = x ∈ − ,1 / ∈
/ {1, −1} = − , 1 .
3 1+x 3

Soit, x ∈ − 13 , 1 ,
 
2 1
f 0 (x) = √ .
1 + x 1 − 3x2 + 2x
Exercice 8 :
n√ o
1. (a) SR = 55 .

(b) SR = 16 .


(a)

sin (arcsin (tanh x)) tanh x


tan (arcsin (tanh x)) = =p
cos (arcsin (tanh x)) 2
1 − sin (arcsin (tanh x))
sinh x
tanh x cosh x
=p = 1
1 − tanh2 x |cosh x|

= sinh x. (car cosh x ≥ 1, ∀x ∈ R).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 64 — #74


i i

64 Chapitre 2. Etude des fonctions réelles d’une variable réelle

(b)

r
cosh x + 1   x   x  x
arg cosh = arg cosh cosh = arg cosh cosh = ,

2 2 2 2

car cosh x ≥ 1 et cosh x est pair, ∀x ∈ R.

(c) En passant par la dérivée, on vérifie pour tout x ∈ R,

2 arctan (tanh x) = arctan (sinh 2x) .

Exercice 9 :

1
1. Soit f (x) = e x . Soit x > 0, f est continue sur [x, x + 1] , dérivable sur ]x, x + 1[ .
D’après le théorème des accroissements finis,

f (x + 1) − f (x) 1 1
∃c ∈ ]x, x + 1[ , = f 0 (c) = − 2 e c .
x+1−x c

Ainsi, en réalisant cet encadrement :

x2  1 1

2 < e x − e 1+x x2 < 1
(x + 1)

 1 1

on peut conclure que lim e x − e 1+x x2 = 1.
x→+∞
!
n
1 1 1 1
 P
2. lim 2 ln 2 + 3 ln 3 + ··· + n ln n = lim p ln p . On applique le théo-
n→+∞ n→+∞ p=2
rème des accroissements finis pour f (x) = ln (ln x) sur [p, p + 1] . On obtient
n
1
P
ainsi un minorant de p ln p qui tend vers +∞ quand n tend vers +∞ :
p=2

n
X 1
ln (ln (n + 1)) − ln (ln 2) ≤ .
p=2
p ln p

1 1 1

D’où, lim 2 ln 2 + 3 ln 3 + ··· + n ln n = +∞.
n→+∞

Exercice 10 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 65 — #75


i i

2.10 Exercices 65

 
1+x 2
= 2x + x3 + O x4

f1 (x) = ln
1−x 3
1 2 7 4
x + O x5

f2 (x) = 1 + x +
6 360
f3 (x) = x2 + O x2
1 1 1 4
f4 (x) = 1 − x + x2 − x + O x4

2 12 720
1 2 3

f5 (x) = x + O x
3  
signe (x) 1 1
x + x2 + x3 + O x3

f6 (x) = √
2 6 36

 
1 1 1 5
f7 (x) = π − 2signe (x) x − x3 + x + O x5

2 6 120
Exercice 11 :
 2   
x π π 2 1  π 3 π π  π 4 π 4
f1 (x) = (sin x) = 1 − x− − x− + − x− +O x−
4 2 2 2 32 24 2 2
√   
π 1  π  3 3 π 2 3  π  3 π  3
f2 (x) = + x− − x− + x− +O x−
3 4 3 16 3 16 3 3
5 2 13 3 77 4

4

f3 (x) = (x − 1) − (x − 1) + (x − 1) − (x − 1) + O (x − 1)
2 3 12
Exercice 12 :
 
1 1 7 1 1
f1 (x) = + + O
3 x2 90 x4 x4
 
11 1 1 1
f2 (x) = 1 + − + O
3 x 9 x2 x2
 
1 11 3 1 55 1 1
f3 (x) == π − + − + O
4 4 x 8 x2 96 x3 x3
Exercice 13 :
sin x−ln(ex cos x) x
lim x sin x = 1
lim e −cos x−x =2
x→0 2 x→0 x−ln(1+x)
  1
1
2 1 e x −cos
lim x + ln(sin( x
=1 lim p x
= +∞
x→π cos2 ( )
2 2 )) x→+∞ 1− 1− x12

Exercice 14 :
√ √
− e = 2e x + O x2 . Donc e 1+sin x − e ∼ 2e x.
1+sin x

1. On a f (x) = e
0
p √ √  √
2 1

2. On a g (x) = x 2 4
x + x + 1 − x 2 = 8x2 + O x4 . Donc


q 
2
p
4
2
x x + x +1−x 2 ∼ .
+∞ 8x2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 66 — #76


i i

66 Chapitre 2. Etude des fonctions réelles d’une variable réelle

Exercice 15 :
ex
On a ln(1+x) = x1 + 3
2 + 11
12 x + O (x) . Donc,

ex α 1 3 11 α
+ + β = + + x + + β + O (x)
ln (1 + x) x x 2 12 x
 
3 (α + 1) 11
= +β + + x + O (x) .
2 x 12
 x 
e
Or, lim ln(1+x) + αx + β = 0. Ainsi,
x→0

3 3
+β =0⇒β =−
2 2
α + 1 = 0 ⇒ α = −1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 67 — #77


i i

CHAPITRE 3

Séries numériques

3.1 Définitions
Définition 3.1.1 On appelle série à termes dans R, (Sn )n∈N , une suite définie par :

X
∀n ∈ N, Sn = uk
k=0

où (uk )0≤k≤n désigne une suite numérique réelle appelée terme général de la
série. Le réel Sn est appelé la n-ème somme partielle de la série. La série sera
notée X X X
uk ou un ou encore un .
k≥0 n≥0 n∈N
P
Définition 3.1.2 On dit que la série un converge si et seulement si la suite
n≥0
(Sn )n∈N des sommes partielles converge dans R. Dans ce cas, la limite de la suite
P +∞
P
(Sn )n∈N est appelée somme de la série un et notée un .
n≥0 n=0
P
Définition 3.1.3 On dit que la série un diverge si et seulement si elle ne converge
n≥0
pas.
Définition 3.1.4 Deux séries sont dites de même nature si et seulement si elles sont
toutes deux convergentes ou toutes deux divergentes.

3.2 Exemples
3.2.1 Série géométrique
n
Soit q ∈ R∗ . On s’intéresse à la série géométrique q n . On pose Sn = qk =
P P
n≥0 n=0
1 + q + q2 + · · · + qn .
– Si q = 1, alors Sn = 1 + n et lim Sn = +∞.
n→+∞
1−q n+1
– Si q 6= 1, alors Sn = 1−q .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 68 — #78


i i

68 Chapitre 3. Séries numériques

1
– Si −1 < q < 1, alors lim q n+1 = 0 donc Sn −→ 1−q . Donc, la série
n→+∞ n→∞
converge.
– Si q ≥ 1 ou q ≤ −1, alors Sn n’admet pas de limite dans R. Donc, la série
diverge.

3.2.2 Série harmonique


n
1 1
Pour tout n ∈ N∗ , on
P P
La série n est appelé série harmonique. Notons Hn = k.
n>0 k=1
note m = E (ln2 (n)) ∈ N. On a alors, m ≤ ln2 (n), soit n ≥ 2m .
Ainsi,
n 2m
X 1 X1
Hn = ≥ .
k k
k=1 k=1

Or,

2m      
X 1 1 1 1 1 1 1 1
=1+ + + + + ··· + + ··· + + · · · + .
k 2 3 4 5 8 2m−1 + 1 2m
k=1 | {z } | {z } | {z }
> 14 + 14 > 18 +···+ 18 > 21m +···+ 21m

Donc,
1 1 1 1 1
Hn ≥ 1 + + 2 × + 4 × + · · · + 2m−1 × m = 1 + m × .
2 4 8 2 2
D’où, Sn −→ ∞. Par conséquent, la série harmonique diverge.
n→∞

3.3 Propriétés
P
Proposition 3.3.1 (fondamentale) : Considérons un une série numérique réelle
P n≥0
de terme général (un )n∈N . Si un est convergente alors lim un = 0.
n≥0 n
P
Preuve : Si un converge vers S.
n≥0

n+1
X n
X
uk − uk = Sn+1 − Sn = un .
n=0 n=0

Or, lim Sn = lim Sn+1 = S. Donc, lim un = S − S = 0.


n n n
Remarque 3.3.1
– Attention la réciproque est fausse : voir la série harmonique.
– Cette propriété peut être utile pour démontrer la divergence d’une série : lim un 9
P P n
0, alors un diverge. On dit alors que un diverge grossièrement.
n≥0 n≥0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 69 — #79


i i

3.4 Séries à termes positifs 69

P P
Proposition 3.3.2 (algébrique) : Considérons un et vn deux séries conver-
n≥0 n≥0
gentes de somme U et V et λ ∈ R. Alors,
X
(un + λvn ) converge vers U + λV.
n≥0

3.4 Séries à termes positifs


3.4.1 Théorèmes de comparaison
un une série à termes dans R+ . Alors,
P P
– Soit un est convergente si et
n≥0 n≥0
n
+
P
seulement si il existe M ∈ R tel que ∀n ∈ N, uk ≤ M. En effet, la suite des
k=0
sommes partielles est une suite positive croissante. Donc, dire qu’elle converge
équivaut à direPqu’elle est
Pmajorée.
– On considère un et vn deux séries à termes réels positifs.
n≥0 n≥0 P
– S’il existe un entier n0 , tel que ∀n ≥ n0 , 0 ≤ un ≤ vn , et si vn converge,
P P P n≥0
alors un converge et dans ce cas on a : vn ≤ un . En effet, d’après
n≥0 n≥0 n≥0 P
le théorème précédent, la série des sommes partielles de vn est majorée,
n≥0 P
par comparaison, il en va de même pour les sommes partielles de un .
P n≥0
– S’il existe un entier n0 , tel que ∀n ≥ n0 , 0 ≤ un ≤ vn , et si un diverge,
P n≥0
alors vn diverge.
n≥0 P P
– On considère un et vn deux séries à termes réels positifs. Si
n≥0 n≥0

un ∼ vn ,
n→+∞

P P
alors les séries un et vn sont de même nature.
n≥0 n≥0

3.4.2 Critères de convergence


P
Critère D’Alembert : Soit un une série à termes strictement positifs (un > 0) .
n≥0
 
On suppose que uvnn admet une limite finie l dans R+ . Alors,
n∈N
X
Si l < 1, alors un converge,
n≥0
X
Si l > 1, alors un divverge.
n≥0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 70 — #80


i i

70 Chapitre 3. Séries numériques

Exemple 3.4.1 Appliquer le critère d’Alembert aux séries de terme général : un = nn!n ,
n
un = n1 , un = n12 , un = (2 + (−1) ) 2−n .
Comparaison fonction / série : Soit n0 ∈ N, f : [n0 , +∞[ −→ R+ , continue par
P R +∞
morceaux et décroissante. Alors, f (n) et n0 f (t) dt sont de même nature.
n≥0
Et dans ce cas de convergence : ∀n ≥ n0
Z +∞ +∞
X Z +∞
f (t) dt ≤ f (n) ≤ f (t) dt.
n+1 k=n+1 n

1
P
Conséquence (Série de Riemann) : Soit α ∈ R. nα converge si et seulement
n≥0
si α > 1.
P
Critère de Riemann : Soit un une série à termes positifs. Si
n≥0
X
∃α ∈ ]1, +∞[ / nα un −→ 0 alors un converge,
n→∞
n≥0
X
∃α ∈ ]0, 1] / nα un −→ +∞ alors un diverge.
n→∞
n≥0
P √ 
Critère de Cauchy : Soit un une série à termes positifs. On suppose que n un n∈N
n≥0
+
admet une limite finie l dans R . Alors
X
Si l < 1, alors un converge,
n≥0
X
Si l > 1, alors un diverge.
n≥0

3.5 Série quelconques. Convergence Absolue.


P
Définition 3.5.1 Soit un une série à termes réels (ou complexes). On dit que
P n≥0 P
un est absolument convergente si |un | est convergente.
n≥0 n≥0
P P
Proposition 3.5.1 Soit un et vn deux séries absolument convergentes et
Pn≥0 n≥0
λ ∈ R ou C. Alors (un + vn ) est absolument convergente.
n≥0
P P
Théorème 3.5.1 Soit un une série à termes réels (ou complexes). Si un est
n≥0 P n≥0
absolument convergente, alors un est convergente.
n≥0
Remarque 3.5.1
– Attention, la réciproque
 de ce théorème est fausse, il suffit de considérer la série

(−1)n
de terme général n .
n∈N
– Une série convergente mais non absolument convergente est dite semi-convergente.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 71 — #81


i i

3.6 Exercices 71

3.5.1 Série alternées


P
Définition 3.5.2 On dit qu’une série un à termes réels est alternée si et seulement
n≥0
n n
si ∀n ∈ N, un = (−1) |un | ou bien un = − (−1) |un | .
P
Proposition 3.5.2 (Critère spécial) : Soit un une série à termes réels.
n≥0
 P

 un est alternée
 n≥0 X
Si un −→ 0 alors un est convergente.
 (|u n→∞

 n≥0
n |)n∈N est décroissante

+∞
P
De plus, ∀n ∈ N, un ≤ |un+1 | .
n+1
P (−1)n
Exemple 3.5.2 Montrer que la série n est semi-convergente.
n≥0

3.6 Exercices
3.6.1 Enoncés
Exercice 1 : P
Etudier la convergence des séries un suivantes :

n n  √n
1. un = n sin( n1)  2. un = 2n 3. un = 1
2
1 1 π
 (−1)n +n
4. un = √n ln 1 + √n 5. un = 1 − cos n 6. un = n2 +1
√ 
n2 +n+1
7. un = an n!, a ∈ R 8. un = ne− n
9. un = ln n2 +n−1

ln(n2 +3) 2n +1
10. un = 4 n

Exercice 2 :
Etudier les séries de terme général suivant :
 n  n(−1)n
n! n−1 n−1
1. un = nan , a∈R 2. un = 2n+1 3. un = 2n+1

Exercice 3 : P
Donner la nature des séries numériques un suivantes :
q  n2
n
1. un = cosh n1 − 1 2. un = n+1
nα √ √
3. un = n sin n1 , α≥0 4. un = 3
n3 + an − n2 + 3, a ∈ R

Exercice 4 : P
Donner la nature des séries numériques un suivantes :

sin n2 (−1)n ln n cos(n2 π )


1. un = n2 2. un = n 3. un = n ln n .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 72 — #82


i i

72 Chapitre 3. Séries numériques

Exercice 5 :
Soit f : [0, 1] → R une fonction continue. Montrer que la série de terme général

1 1 n
Z
t f (t) dt
n 0
est absolument convergente.
Exercice 6 :
1. Démontrer que, pour tout x > 0, on a
1 2 1
√ −√ +√ ≥ 0.
x x+1 x+2

2. On note
+∞ k
X (−1)
Rn = √ .
k=n
k
P
Etudier la nature de la série Rn .
Exercice 7 :
Etudier la convergence de la série de terme général
n  q
Y (−1)
un = 1+ √ .
q=2
q

3.6.2 Corrigés
Exercice 1 :
1. On a limn→+∞ n sin( n1 ) = 1, et la série est grossièrement divergente.
nn
2. on a limn→+∞ 2n = +∞, et la série est grossièrement divergente.
3. On a :   √n √ √
1

− n √n
ln 2−2 ln
2
n un = n 2
= e(2 ln n− n ln 2) = e n .
2
Donc, limn→+∞ n2 un = 0. Ainsi, d’après le critère de Riemann, la série est
convergente.
4. Puisque ln(1 + x) ∼ x, on obtient
0

1
un ∼
0 n
et la série est donc divergente.
x2
5. Puisque 1 − cos x ∼ 2 alors
0
π2
un ∼
+∞ 2n2
et la série est convergente.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 73 — #83


i i

3.6 Exercices 73

n
6. On a (−1) + n ∼ n et n2 + 1 ∼ n2 donc
+∞ +∞

n
(−1) + n 1
2

n +1 +∞ n
Ainsi, d’après la conséquence de Riemann, la série est divergente.
7. Par croissance comparée des suites géométriques et P la suite factorielle, le terme
général ne tend pas vers 0, sauf si a = 0. La série un un est donc convergente
si et seulement si a = 0.
√ √
8. On a un = ne− n = eln n− n . Alors,

eln n− n √
−2 ln n
= e3 ln n− n → 0
e +∞

et donc  
1
un = O .
n2
La série est convergente.
9. On écrit simplement
 2   
n +n+1 2 2
un = ln = ln 1 − 2 ∼ − .
n2 + n − 1 n + n − 1 +∞ n2
La série est donc convergente.
10. On vérifie aisément que
√
ln n2 + 3 2n + 1 2 ln (n)
un = ∼  n .
4n +∞
√4
2

Puisque √4 > 2, on obtient


2  
1
un = O
2n
et donc la série est convergente.
Exercice 2 :
1. Une série dont le terme général est constitué de puissances et de factorielles est
très bien adaptée à l’utilisation du critère de D’Alembert. Dans le cas particulier
ce cette question, on a
(n+1)!  an
un+1 (n+1)an n 1
= n!
= × a−1 .
un nan
n+1 (n + 1)
Or, on peut écrire  an
n 1
= e−an ln(1+ n )
n+1
et donc ce terme converge vers e−a . On distingue alors trois cas :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 74 — #84


i i

74 Chapitre 3. Séries numériques

– Si a > 1, uun+1
P
n
tend vers 0, la série un converge.
– Si a = 1, uun+1 −1
P
n
tend vers e ∈ [0, 1[, et donc la série un converge.
un+1 P
– Si a < 1, un tend vers +∞, et donc la série un diverge.
2. Les séries dont le terme général porte une puissance n-ième sont bien adaptées à
l’utilisation du critère de Cauchy. On a ici :
√ n−1 1
n
un = → .
2n + 1 +∞ 2
La série converge.
3. On sépare les termes pairs et impairs. On a :
√ 2p − 1 1
2p u2p = →
4p + 1 +∞ 2
et par application du critère de Cauchy, la série de terme général u2p converge.
D’autre part,
 −1
√ 2p
2p+1 u
2p+1 = → 2
4p + 3 +∞

et par application du critère de Cauchy, la série de terme général u2p+1 diverge.


Ainsi, la série de terme général un diverge.
Exercice 3 :
1. Le terme général un est positif et on sait que cosh( n1 ) = 1 + 1
2n2 + O( n12 ), on
déduit que
1
un ∼ √ .
+∞ 2n
Par conséquent, la série est divergente.
2. On a : 2
un = e−n ln(1+ n ) ∼ e−n .
1

+∞
2
On en déduit que n un → 0 et la série de terme général un converge.
+∞
3. On a   nα
1
= e− 6n2−α +0( n2−α ) , α ≥ 0.
1 1
un = n sin
n
Ainsi, trois cas sont à distinguer :
P
– Si α < 2, un → 1 ⇒ un diverge.
+∞
1
– Si α = 2, un → e− 6 ⇒
P
un diverge.
+∞
2
P
– Si α > 2, n un → 0 ⇒ un converge.
+∞
4. On a
   
p
3
p 1 a 3 1
un = n3 + an − n2 + 3 = − +0 , a ∈ R.
n 3 2 n3
Ainsi,

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 75 — #85


i i

3.6 Exercices 75

– Si a 6= 29 , alors
P
un diverge.
– Si a = 92 , un → 0 ⇒
P
un converge.
+∞

Exercice 4 :
1
1. On a |un | ≤ n2 donc la série converge absolument.
2. La série est alternée, et le module du terme général décroît vers 0 à partir d’un
certain rang : la série converge par application du critère des séries alternées.
3. Il s’agit d’une série alternée bien cachée. En effet, n2 a la parité de n, et
k
cos (kπ) = (−1) . Le terme général vaut donc
n
(−1)
un = .
n ln n
La série converge par application immédiate du critère spécial des séries alternées.
Exercice 5 :
Soit f : [0, 1] → R une fonction continue. Puisque f est continue sur [0, 1], bornée
par M , et on a :
M 1 n
Z
M
|un | ≤ t dt ≤ .
n 0 n (n + 1)
Donc, la série de terme général (un ) est absolument convergente.
Exercice 6 :
1. Il suffit de remarquer que

1 1 1 1
√ −√ ≥√ −√ .
x x+1 x+1 x+2

Ainsi, pour tout x > 0, on a

1 2 1
√ −√ +√ ≥ 0.
x x+1 x+2
P
2. Il suffit de vérifier que la série Rn vérifie le critère des séries alternées. En
n
effet, le signe de Rn est le signe de (−1) (premier terme de la série). De plus,

1
|Rn | ≤ √ .
n

Ce qui prouve que (|Rn |) tend vers 0. Reste à prouver que (|Rn |) décroît vers 0.
Pour cela, on vérifie que
+∞  
X 1 2 1
|Rn+1 | − |Rn | = √ −√ +√ .
k=n
n+k n+k+1 n+k+2
P
Or, d’après 1., on a |Rn+1 | ≤ |Rn | . D’où, la série Rn est convergente.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 76 — #86


i i

76 Chapitre 3. Séries numériques

Exercice 7 :
On a
n   q 
X (−1)
ln (un ) = ln 1 + √
q=2
q
n  q  
X (−1) 1 1
= √ − + O 3 .
q=2
q 2q q 2

On reconnait ici deux séries convergentes et une série divergente dont l’estimation
des sommes partielles est bien connue. Précisément, on a
n  q n   
X (−1) X 1
√ et O 3
q=2
q q=2 q2

admettent une limite quand n tend vers +∞ et


n
X 1
= ln n + Dn
q=2
q

où Dn admet une limite lorsque n tend vers +∞. On peut donc écrire que :
1
un = − ln n + Cn
2
avec (Cn ) admet une limite lorsque n tend vers +∞, que l’on note C. Passant par
l’exponentielle :
eCn eC
un = √ ∼ √ .
n +∞ n
La série de terme général (un ) est donc divergente.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 77 — #87


i i

CHAPITRE 4

Intégration des fonctions réelles d’une variable réelle

Soient f et g deux fonctions continues sur un intervalle I de R et soient a et b dans I.

4.1 Généralités

4.1.1 Définition de l’intégrale

Définition 4.1.1 (Notion de primitive) : On dit que la fonction F est définie et


dérivable sur I est une primitive de f si l’égalité suivante a eu lieu : F 0 = f c’est
à dire F 0 (x) = f (x) , ∀x ∈ I.
Proposition 4.1.1 Si F est une primitive de f sur I. Alors, toute primitive de f sur
I s’obtiennent à partir de F en ajoutant une constante.
Preuve : Supposons que F et G deux primitives sur I. Alors, F 0 = f et G0 = g sur
0
I. Ainsi, (G − F ) = 0 ⇒ G − F = constante. D’où, G = F + constante sur I. 
Rx
Définition 4.1.2 La fonction F : x 7−→ a f (t) dt est l’unique primitive de f sur I
s’annulant en a.
Définition 4.1.3 L’intégrale de f entre a et b est le nombre définie par :
Z b
t=b
f (t) dt = [F (t)]t=a = F (b) − F (a) .
a

4.1.2 Propriétés élémentaires

Relation de Chasles

Proposition 4.1.2 Si c est dans I, alors


Z c Z b Z b
f (t) dt + f (t) dt = f (t) dt.
a c a

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 78 — #88


i i

78 Chapitre 4. Intégration des fonctions réelles d’une variable réelle

Preuve Par définition,


Z b
f (t) dt = F (b) − F (a)
a
= [F (b) − F (c)] + [F (c) − F (a)]
Z b Z c
= f (t) dt + f (t) dt.
c a

Linéarité
Proposition 4.1.3 Si α et β sont des constantes, alors :
Z c Z b Z b
[αf (t) + βg (t)] dt = α f (t) dt + β g (t) dt.
a c a

Preuve Par définition,


Z b
f (t) dt = F (b) − F (a) .
a
Donc, pour g = αf, on a
Z b Z b
g (t) dt = G (b) − G (a) = αf (t) dt
a a
= αF (b) − αF (a) = α (F (b) − F (a))
Z b
=α f (t) dt.
a

Positivité
Notation 4.1.1 Une écriture fonctionnelle du type f ≤ g signifie que, quel que soit
t ∈ I, f (t) ≤ g (t) .
Proposition 4.1.4 Si a ≤ b et si f ≥ 0, alors
Z b
f (t) dt ≥ 0.
a

Preuve Puisque f est positive, donc F est croissante (F 0 = f ≥ 0) . Donc F (a) ≤


Rb
F (b) car a ≤ b. D’où, F (b) − F (a) = a f (t) dt ≥ 0.
Corollaire 4.1.1 Si a ≤ b et si f ≤ g, alors
Z b Z b
f (t) dt ≤ g (t) dt.
a a

Preuve Posons h = g − f ≥ 0, alors H est croissante avec H 0 = h. On a H (a) ≤ H (b)


pour b ≥ a. D’où,
Z b Z b
H (b) − H (a) = h (t) dt = (g − f ) (t) dt ≥ 0.
a a

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 79 — #89


i i

4.1 Généralités 79

Théorème 4.1.1 (Méthode des rectangles pour le calcul approché d’une intégrale)
Soit f définie sur [a; b] −→ R une fonction continue. Alors,
Z b " n  #
b−a X b−a
f (x) dx = lim f a+k .
a n→+∞ n n
k=1

n
1
P
Exemple 4.1.1 Montrons que log 2 = lim .
n→+∞ k=1 n+k

Soit
f: [0; 1] −→ R
1
x 7−→ x+1
continue sur [0; 1] . Soient a = 0 et b = 1. Remarquons que
Z 1
1 1
dx = [log |x + 1|]0 = log 2.
0 x + 1
Appliquons la méthode des rectangles pour le calcul approché d’une intégrale,
Z 1 n   n  
1 1−0 X 1−0 1X k
dx = lim f 0+k = lim f
0 x + 1 n→+∞ n n n→+∞ n n
k=1 k=1
n n
1X 1 1X n
= lim k
= lim = log 2.
n→+∞ n + 1 n→+∞ n k=1 k + n
k=1 n

4.1.3 Inégalités
Proposition 4.1.5 (Inégalité de la moyenne) Si a ≤ b, et m ≤ f ≤ M, alors
Z b
m (b − a) ≤ f (t) dt ≤ M (b − a)
a

ou encore, si a 6= b
Z b
1
m≤ f (t) dt ≤ M.
b−a a

Preuve f continue sur [a; b] , alors m ≤ f ≤ M (bornée). Donc,


Z b Z b Z b
m (b − a) = mdt ≤ f (t) ≤ M dt = M (b − a) .
a a a

Corollaire 4.1.2 Si a ≤ b et si |f | ≤ k alors


Z b
0≤ |f (t)| dt ≤ k (b − a) .
a

Proposition 4.1.5 (Inégalité triangulaire) On a l’inégalité suivante :


Z Z
b b
f (t) dt ≤ |f (t)| dt.


a a

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 80 — #90


i i

80 Chapitre 4. Intégration des fonctions réelles d’une variable réelle

Preuve Remarquons que − |f | ≤ f ≤ |f | .


Définition 4.1.4 On dit que f est de classe C 1 si f est dérivable et si f 0 est continue.
Théorème 4.1.2 (Inégalité des accroissements finis) Supposons que f soit C 1
sur I. Si a ≤ b et si |f 0 | ≤ k, alors

|f (b) − f (a)| ≤ k (b − a) .

Preuve f soit C 1 , donc f 0 est continue, donc intégrable. On utilise


Z
b
0
|f (b) − f (a)| = f (t) dt

a
Z b
≤ |f 0 (t)| dt (f 0 bornée)
a
≤ k (b − a) .

4.2 Techniques de calcul d’une intégrale


4.2.1 Fonctions à valeurs complexes
Définition 4.2.1 Si f + ig est une fonction continue à valeur complexes, une de ses
primitives est F + iG et si on intègre
Z b Z b Z b
[f (t) + ig (t)] dt = f (t) dt + i g (t) dt.
a a a
at R 2π
Exemple 4.2.1 Soit a ∈ C∗ . La primitive de t 7−→ eat : e
a . Calculer 0
eit dt.
On a 2π

eit ei2π ei0
Z 
it 1 1
e dt = = − = − = 0.
0 i 0 i i i i
Ou bien,
Z 2π Z 2π Z 2π Z 2π
eit dt = (cos t + i sin t) dt = cos tdt + i sin tdt = 0.
0 0 0 0

Exemple 4.2.2 Calculons 0
cos te3t dt.
Cette intégrale est la partie réelle de
Z π Z π  (i+3)t π 
it 3t (i+3)t e −3 e3π + 1 e3π + 1
e e dt = e dt = = +i .
0 0 i+3 0 10 10
D’où,
π

−3 e3π + 1
Z
3t
cos te dt = .
0 10
Remarque 4.2.1 Comme va le montrer l’exemple précédent, il peut parfois passer
dans C pour faire des calculs dans R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 81 — #91


i i

4.2 Techniques de calcul d’une intégrale 81

4.2.2 Intégration par parties

Théorème 4.2.1 Si f et g sont C 1 , alors


Z b Z b
b
f 0 (t) g (t) dt = [f (t) g (t)]a − f (t) g 0 (t) dt.
a a

0
Preuve On a f et g sont C 1 , donc (f g) = f 0 g + g 0 f. Alors,
Z b Z b Z b
0 0
(f (t) g (t)) dt = f (t) g (t) dt − f (t) g 0 (t) dt.
a a a

D’où,
Z b Z b
b
f 0 (t) g (t) dt = [f (t) g (t)]a − f (t) g 0 (t) dt.
a a

Rx
Exemple 4.2.3 Calculons e
log tdt.

On a
Z x Z x
log tdt = 1 × log tdt.
e e

On pose
f 0 (t) = 1 ⇒ f (t) = t
g (t) = log t ⇒ g 0 (t) = 1t

D’après le théorème d’intégration par parties,


Z x Z x
x 1
log tdt = [t log t]e − t × dt = x log x − x.
e e t

4.2.3 Changement de variables

Théorème 4.2.2 Soit ϕ une fonction de classe C 1 sur [a; b] , dont les valeurs sont
dans I. Alors,
Z b Z ϕ(b)
0 0
f (ϕ (t)) ϕ (t) dt = f (u) du.
a ϕ(a)

Remarque 4.2.2 Expliquons concrètement la méthode :


R ϕ(b)
Dans ϕ(a) f (u) du, on pose u = ϕ (t) (Changement de variables, donné ou à le
trouvé). Si t = a ou t = b alors u = ϕ (a) respectivement u = ϕ (b) . Ce qui conduit
0 0
à changer les bornes de l’intégrale. Ensuite, du
dt = ϕ (t) ⇐⇒ du = ϕ (t) dt que l’on
remplace dans l’intégrale.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 82 — #92


i i

82 Chapitre 4. Intégration des fonctions réelles d’une variable réelle

Exemple 4.2.4 Calculons, après avoir mis t2 + t + 1 sous forme canonique :


Z 1 Z 1
1 1
2+t+1
dt =  2  dt
0 t 0 3 2 1
√ t+ √ +1
4 3 3
Z √
3
√  
4 1 3 2 1 2
= du avec u = √ t + √ ⇒ du = √ dt
3 √1 u2 + 1 2 3 3 3
3


2 3 2 π π
  π 3
= √ [arctan (u)] √1 = √ − = .
3 3 3 3 6 9

4.3 Calcul pratique des intégrales


xn+1 n+1
 a
Rx n n+1 − n+1 , n 6= −1
1. a
t dt = x
log a , x = −1, a 6= 0.
Rx
2. In (x) = dt
a (λt+β)n
, λ 6= 0, n > 0 et − βλ ∈
/ [a, x] .
 h ix
1 1−n
 (λt + β)
λ(1−n) , n>1
In (x) = a
 log λx+β , n = 1.

λa+β

3. Pour calculer les intégrales de type


Z x   12 !
αt + β
F (x) = < t, dt
a γt + δ

avec αδ− βγ 6= 0 (permet d’écrire t en fonction de u lorqu’on fait le changement


  12  q 
de variable u = αt+β
γt+δ ). < t, αt+β
γt+δ est une expression qui regroupe t et
q
αt+β
γt+δ . Par exemple,
q
t+2
√  t+1
< t, = .
t+1
4. Pour calculer les intégrales de type
Z x
< cht, sht, et dt

F (x) =
a

on fait toujours le changement de variable u = et .


5. Pour calculer les intégrales de type
Z x
F (x) = < (sin t, cos t) dt
a
on pose
t
u = tan
2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 83 — #93


i i

4.4 Exercices 83

et donc
2u 1 − u2 2
sin t = 2
, cos t = 2
et dt = du.
1+u 1+u 1 + u2

4.4 Exercices
4.4.1 Enoncés
Exercice 1 :
En utilisant la notion d’intégrale, calculer les limites suivantes :

n−1 n
X 1 1 X√
lim (α, β > 0) , lim √ k
n→+∞ nα + kβ n→+∞ n n
k=0 k=1
n   n  1
1 X kπ Y 2k n
lim k sin , lim 1+ .
n→+∞ n2 2n n→+∞ n
k=1 k=1

Exercice 2 :
Calculer les primitives suivantes :

x2
Z Z Z
dx dx
, 2 , 2 dx,
(x + 2) (x2 + 2x + 5) x (1 + x2 ) (1 + x3 )
Z Z
x+2 x
√ dx, √ dx,
2
x − 5x + 6 2
x +x+2

ln x2 + 4x + 5
Z Z Z
dx dx
2 dx, x + e−x
, p x
(1 + x) e 1 + e2
Exercice 3 :
Calculer les primitives suivantes :
Z Z Z
dx dx dx
, ,
1 + 2 cos x 2 + sin x 5 cosh x + 3 sinh x + 4
Z Z Z
cosh x sin (2x) dx, x arcsin xdx, x arctan xdx

Exercice 4 :
Calculer pour n ∈ N, Z
In = xn arctan xdx

Exercice 5 :
On se propose d’étudier la fonction
Z x2
dt
f (x) = 2.
x (ln t)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 84 — #94


i i

84 Chapitre 4. Intégration des fonctions réelles d’une variable réelle

1. Déterminer le domaine de définition Df de f.


2. Calculer f 0 (x) pour x ∈ Df ainsi que limx→0 f 0 (x) et limx→1 f 0 (x) .
3. En minorant convenablement f (x) par une fonction simple, déterminer limx→0 f (x) .
2
4. A l’aide d’un développement limité de la fonction t 7→ (ln t) au voisinage de
t = 1 et de majorants et de minorants simple de f (x) , déterminer limx→1− f (x)
et limx→1+ f (x) .
f (x)
5. Etudier le comportement de f (x) et x lorsque x → +∞.
6. Tracer la courbe de f.
Exercice 6 :
1. Montrer que pour tout x ∈ ]0, +∞[ , on a :
x 2
0≤ <
1 + x arctan x π
x
(On pourra étudier la fonction x 7→ 1+x arctan x ).
2. On considère la fonction
Z 3x
t
F (x) = dt.
x 1 + t arctan t
(a) Montrer que la fonction F est définie pour tout x ∈ R.
(b) Montrer que F est une fonction paire.
(c) Montrer que F est dérivable et calculer F 0 (x) , pour tout x ∈ R.
(d) En déduire que pour tout y ∈ [0, F (1)] , il existe un unique x ∈ [0, 1] tel
que : Z 3x
t
dt = y.
x 1 + t arctan t

4.4.2 Corrigés
Exercice 1 :
1
– Soit f (x) = α+βx (α, β > 0) une fonction continue sur [0, 1] . D’après, la méthode
des rectangles, on a :
n−1 n−1 n−1  
X 1 1X 1 1X k
lim = lim k
= lim f
n→+∞ nα + kβ n→+∞ n α + n β n→+∞ n n
k=0 k=0 k=0
Z 1 Z 1  
1 1 α+β
= f (x) dx = dx = ln .
0 0 α + βx β α

– Soit f (x) = x une fonction continue sur [0, 1] . D’après, la méthode des
rectangles, on a :
n n r n−1  
1 X√ 1X k 1X k
lim √ k = lim = lim f
n→+∞ n n n→+∞ n n n→+∞ n n
k=1 k=1 k=0
Z 1 Z 1
√ 2
= f (x) dx = xdx = .
0 0 3

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 85 — #95


i i

4.4 Exercices 85

πx

– Soit f (x) = x sin 2 une fonction continue sur [0, 1] . D’après, la méthode des
rectangles, on a :
n   n   n−1  
1 X kπ 1Xk kπ 1X k
lim k sin = lim sin = lim f
n→+∞ n2 2n n→+∞ n n n2 n→+∞ n n
k=1 k=1 k=0
Z 1 Z 1  πx  4
= f (x) dx = x sin dx = 2 .
0 0 2 π
– On a 1
n  
Y 2k n Pn 1
ln(1+ 2k
n )
lim 1+ = lim e k=1 n .
n→+∞ n n→+∞
k=1

Ainsi, Soit f (x) = ln (x) une fonction continue sur [1, 3] . D’après, la méthode
des rectangles, on a :
n   n  
X 1 2k 1 2X 2k
lim ln 1 + = lim ln 1 +
n→+∞ n n 2 n→+∞ n n
k=1 k=1
n−1  
1 2X k
= lim f
2 n→+∞ n n
k=0
Z 3
1
= f (x) dx
2 1
1 3
Z
= ln (x) dx
2 1
3
= ln 3 − 1.
2
Puisque, la fonction x 7→ ex est continue sur tout R alors
n   n1
Y 2k 3
lim 1+ = e 2 ln 3−1 .
n→+∞ n
k=1

Exercice 2:
dx 1 x+1 1
ln x2 + 2x + 5 + 15 ln (x + 2) + cste.
R  
– (x+2)(x 2 +2x+5) = 10 arctan 2 − 10
dx 1 1
R 2 2
 1 1
– x(1+x 2 )2 = 2 ln x − 2 ln x + 1 + 2 x2 +1 + cste.
R x2 1
– (1+x 3 )2 dx = − 3(x3 +1) + cste.
√ √
– √x2x+2 dx = 92 ln 2x − 5 + x2 − 5x + 6 + 12 x2 − 5x + 6 + cste.
R 
−5x+6 √
x
dx = x2 + x + 2 − 12 arg sinh x + 21 + cste.
R 
– √x2 +x+2
x + 4x + 5 + ln |x + 1| + ln|x +4x+5| + cste.
R ln(x2 +4x+5) 1
2 2
– (1+x) 2 dx = arctan (x + 2) − 2 ln x+1
R dx x
– ex +e −x = arctan (e ) + cste.
p X

– √ dx x = 4 arg tanh
R
1 + e 2 + cste.
1+e 2
Exercice 3 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 86 — #96


i i

86 Chapitre 4. Intégration des fonctions réelles d’une variable réelle


R dx √1
3+tan x
– 1+2 cos x = ln √3−tan x2 + cste.
3
 2
dx

= √23 arctan √23 tan x2 + 21 + cste.
R

R 2+sin x dx 1
– 5 cosh x+3 sinh x+4 = − 4ex +2 + cste.
– cosh x sin (2x) dx = − 25 cos 2x cosh x + 5 sin 2x sinh x + cste.
R

– R x arcsin xdx = 41 x 1 − x2 − 14 arcsin 1 − 2x2 + cste.
R 

– x arctan xdx = 12 arctan x − 12 x + 21 x2 arctan x + cste.


Exercice 4 :
On pose
1
u = arctan x ⇒ u0 =
1 + x2
n+1
x
v 0 = xn ⇒ v = .
n+1
En passant par une Intégration par parties : pour n ∈ N,
xn+1 xn+1
Z Z
1
In = xn arctan xdx = arctan x − dx.
n+1 n+1 x2 + 1
Or, on a
k k+1
X
2 p
 1 − −x2
−x = .
p=0
1 − (−x2 )
Ainsi,
k+1 k+1 k
−x2 x2k+2 (−1) 1 X p
2
= 2
= 2
− −x2 .
1+x 1+x 1+x p=0
Alors,
k+1 k
x2k+2 (−1) k+1
X p
2
= 2
− (−1) −x2 .
1+x 1+x p=0
– 1er cas : Si n = 2k + 1,
k+1 k Z
xn+1
Z Z 2k+2 Z
x (−1) k+2
X p
dx = dx = dx + (−1) −x2 dx
x2 + 1 x2 + 1 1 + x2 p=0
k p
k+1 k+2
X (−1) x2p+1
= (−1) arctan x + (−1) + cste.
p=0
2p + 1

– 2ème cas : Si n = 2k,


xn+1
Z 2k+1
x2k
Z Z
x
dx = dx = x dx
x2 + 1 x2 + 1 x2 + 1
Z k−1
XZ
k x k+1 p
= (−1) dx + (−1) (−1) x2p+1 dx
1 + x2 p=0
k k−1
X (−1)p x2p+2
(−1) k+1
ln 1 + x2 + (−1)

= + cste.
2 p=0
2p + 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 87 — #97


i i

4.4 Exercices 87

Exercice 5 :
On se propose d’étudier la fonction
Z x2
dt
f (x) = 2.
x (ln t)

1. Df = ]0, 1[ ∪ ]1, +∞[ .


2. f est dérivable Df et pour x ∈ Df
 
0 2x 1 x−2 1
f (x) = − = .
4 ln2 x ln2 x 2 ln2 x

ainsi que limx→0 f 0 (x) = 0 et limx→1 f 0 (x) = −∞.


3. On peut minorer f (x) comme suit :

x2
x2 − x
Z
dt
= ≤ f (x) ≤ 0 pour x ∈ ]0, 1[
ln2 x x (ln x)
2

ainsi,
x2 − x
lim f (x) = lim = 0.
x→0 x→0 ln2 x

2
4. Le développement limité t 7→ (ln t) au voisinage de t = 1 :
2 2
ln2 t = (t − 1) + (t − 1)  (t − 1) .

Comme limt→1  (t − 1) = 0 donc il existe α > 0 tel que  (t − 1) ≤ 1 pour


2
1 − α ≤ t ≤ 1 + α. Donc, ln2 t ≤ (t − 1) pour 1 − α ≤ t ≤ 1 + α.
– Minorant de f (x) : si x > 1 : 1 − α ≤ x < t < x2 ≤ 1 + α :
Z x2
1 dt x
f (x) ≥ 2 = .
2 x (t − 1) 2 (x2 − 1)

et
x
lim f (x) = lim+ = +∞.
x→1+ x→1 2 (x2 − 1)
– Majorants de f (x) : si x < 1 : 1 − α ≤ x2 < t < x ≤ 1 + α :
Z x
1 dt x
f (x) ≤ − 2 = .
2 x2 (t − 1) 2 (x2 − 1)

et
x
lim f (x) = lim− = −∞.
x→1− x→1 2 (x2 − 1)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 88 — #98


i i

88 Chapitre 4. Intégration des fonctions réelles d’une variable réelle

5. Soit x > 1,
x2 − x x2 − x
2 < f (x) < 2.
(ln x2 ) (ln x)
Donc,
f (x)
lim f (x) = +∞ et lim = +∞.
x→+∞ x→+∞ x
6.
Courbe représentative de f

Exercice 6 :
x
1. Soit f (x) = 1+x arctan x . Df = R car x arctan x > 0 (arctan x est impaire). f est
dérivable sur Df et on a :
1
f 0 (x) = 2 > 0.
(1 + x2 ) (1 + x arctan x)
x 2
Donc, f continue, croissante sur ]0, +∞[ et limx→+∞ 1+x arctan x = π. Ainsi,
x 2
0≤ < .
1 + x arctan x π
2. On considère la fonction
Z 3x
t
F (x) = dt.
x 1 + t arctan t
(a) On sait que f est définie, continue sur tout R et les applications x 7→ x et
x 7→ 3x sont bien définies sur tout R. Donc, F est définie pour tout x ∈ R.
(b) il suffit de justifier que F (−x) = F (x) pour tout x ∈ R.
(c) Les applications x 7→ x et x 7→ 3x sont dérivables sur tout R. De plus, f
est continue sur tout R. Donc, F est dérivable sur tout R et
F 0 (x) = 3f (3x) − f (x)
pour tout x ∈ R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 89 — #99


i i

4.4 Exercices 89

(d) F est une fonction continue sur [0, 1] . De plus, f (3x) − f (x) + 2f (3x)
| {z } | {z }
≥0 ≥0
= F 0 (x) ≥ 0, pour tout x ∈ [0, 1] . Donc, F est strictement croissante [0, 1] .
Ainsi, F réalise une bijection sur [0, 1]. D’après le théorème des valeurs
intérmédaires, pour tout y ∈ [0, F (1)] , il existe un unique x ∈ [0, 1] tel
que : Z 3x
t
dt = y.
x 1 + t arctan t

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 90 — #100


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 91 — #101


i i

CHAPITRE 5

Equations différentielles

5.1 Équations différentielles linéaires du premier ordre


5.1.1 Définitions
Définition 5.1.1 Une équation différentielle scalaire linéaire d’ordre 1 est une équa-
tion différentielle de la forme :

a(t)y 0 (t) + b(t)y(t) = c(t)

(notée plus simplement : a(t)y 0 + b(t)y = c), où a, b, c : I → K sont trois fonctions


définies continues sur un intervalle I de R et y : I → K une fonction dérivable
inconnue. On suppose de plus que la fonction a n’est pas la fonction nulle.
Définition 5.1.2 Soit (E) : a(t)y 0 + b(t)y = c(t) une équation différentielle linéaire,
on appelle équation homogène associée à (E) l’équation différentielle :

(H) : a(t)y 0 + b(t)y = 0.

La fonction c est souvent appelée second membre de l’équation (E).


Dans la pratique on a souvent en plus une condition sur la fonction inconnue y du
type : y(t0 ) = α où t0 et α sont des données. Cette condition est appelée condition
initiale, et on appelle problème de Cauchy ((1789 – 1857) : mathématicien français) le
système :
a(t)y 0 + b(t)y = c(t)

y (t0 ) = α

5.1.2 Étude de l’équation homogène


Soit SI (H) l’ensemble des solutions sur I de l’équation homogène (H).
Résolution de (H) : On se place sur un intervalle I où la fonction a ne s’annule
pas, on a alors ∀t ∈ I, y 0 = − ab y.
Soit F une primitive de la fonction − ab sur I, on a alors :
d  −F 
y ∈ SI (H) ⇔ y 0 = F 0 y ⇔ ye = 0 ⇔ ∃λ ∈ K, ∀t ∈ I, y (t) = λeF (t) .
dt

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 92 — #102


i i

92 Chapitre 5. Equations différentielles

Conséquences : Si la fonction a ne s’annule pas sur I :


– Le problème de Cauchy pour l’équation (H) a une unique solution. Puisque la
condition initiale détermine complètement la constante λ.
– L’unique solution sur I qui s’annule en un point donné est la fonction nulle. Par
conséquent toutes les autres solutions ne s’annulent jamais sur I, lorsque K = R
elles ont toutes un signe constant (car elles sont continues).

5.2 Étude de l’équation avec second membre


On revient au cas général :

a(t)y 0 (t) + b(t)y(t) = c(t)

et soit SI (E) l’ensemble des solutions de (E) sur l’intervalle I.


Théorème 5.2.1 Si SI (E) n’est pas vide et si y1 est une solution de (E), alors les
solutions de (E) sont les fonctions s’écrivant comme somme de y1 avec une
solution de (H), c’est à dire

SI (E) = {y : I → K / ∃f ∈ SI (H), y = y1 + f } ,

ce que l’on note : SI (E) = y1 + SI (H).


Pour déterminer toutes les solutions de (E) on est donc ramené à résoudre l’équation
homogène puis à trouver une solution particulière de (E).
Recherche d’une solution particulière : on se place de nouveau sur un intervalle
I où la fonction a ne s’annule pas et on applique la méthode de la variation des
constantes :
Soit F une primitive de − ab sur I, on cherche une solution particulière sous la
forme λeF où λ est une fonction dérivable sur I. La fonction y est solution de (E) si
et seulement si

a λ0 eF + λF 0 eF + bλeF = c ⇔ aλ0 eF + λ F 0 eF + beF = c


   

c −F
⇔ λ0 = e
a
car eF est solution de (H).
Comme la fonction ac e−F est continue sur I, elle admet des primitives sur cet
intervalle, ce qui prouve l’existence de λ. Une solution de (E) est donc :
Z t Z t
F c (s) −F (s) b (s)
y1 = λe avec λ (t) = e ds et F (t) = − ds,
t0 a (s) t0 a (s)
et les solutions de (E) sont les fonctions :

y = y1 + αeF avec y0 ∈ K quelconque [et y(t0 ) = α].

Remarque 5.2.1 Lorsque la fonction a ne s’annule pas sur l’intervalle I le problème


de Cauchy a une unique solution.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 93 — #103


i i

5.3 Équations différentielles linéaires du second ordre 93

5.3 Équations différentielles linéaires du second ordre


On s’intéressera uniquement au cas où les coefficients sont des constantes, c’est à dire
aux équations différentielles de la forme :
y 00 + ay 0 + by = f où a, b ∈ K
et f : I → K une fonction continue (second membre). Pour de telles équations, le
problème de Cauchy est :  00
 y + ay 0 + by = f
y (t0 ) = α
 0
y (t0 ) = β
où t0 , α, β sont des données.

5.3.1 Étude de l’équation homogène


Théorème 5.3.1 Soit S(H) l’ensemble des solutions de l’équation homogène sur R
: y 00 + ay 0 + by = 0, il existe deux fonctions ϕ1 , ϕ2 solutions de (H) telles que :
S(H) = {αϕ1 + βϕ2 / α, β ∈ K}.
Marche à suivre : solutions de l’équation homogène : soit x2 + ax + b = 0 l’équation
caractéristique et ∆ = a2 − 4b son discriminant :
– Si K = C
– Si ∆ 6= 0, alors l’équation caractéristique à deux solutions distinctes : λ1 et
λ2 , on peut prendre alors Φ1 : t → eλ1 t et Φ2 : t → eλ2 t . Les solutions sont les
fonctions
t → αeλ1 t + βeλ2 t avec α, β ∈ C.
– Si ∆ = 0, alors l’équation caractéristique à une solution double : λ1 = λ2 ,
on peut prendre alors Φ1 : t → eλ1 t et Φ2 : t → eλ1 t . Les solutions sont les
fonctions
t → (α + βt) eλ1 t avec α, β ∈ C.
– Si K = R
– Si ∆ > 0, alors l’équation caractéristique à deux solutions distinctes : λ1 et
λ2 , on peut prendre alors Φ1 : t → eλ1 t et Φ2 : t → eλ2 t . Les solutions sont les
fonctions
t → αeλ1 t + βeλ2 t avec α, β ∈ R.
– Si ∆ = 0, alors l’équation caractéristique à une solution double : λ1 = λ2 ,
on peut prendre alors Φ1 : t → eλ1 t et Φ2 : t → eλ1 t . Les solutions sont les
fonctions
t → (α + βt) eλ1 t avec α, β ∈ R.
– Si ∆ < 0, alors l’équation caractéristique possède deux solutions complexes
non réelles et conjuguées : λ et λ,en posant λ = r + iω (forme algébrique), on
peut prendre alors Φ1 : t → cos (ωθ) ert et Φ2 : t → sin (ωθ) ert . Les solutions
sont les fonctions
t → (α cos (ωθ) + β sin (ωθ)) ert avec α, β ∈ R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 94 — #104


i i

94 Chapitre 5. Equations différentielles

5.3.2 Étude de l’équation avec second membre

Théorème 5.3.2 Si f : I → K est une fonction continue, alors l’équation (E) :


y 00 + ay 0 + by = f admet des solutions sur I. Si y1 est une solution de (E), alors
SI (E) = y1 + SI (H). De plus, le problème de Cauchy a une unique solution.
Remarque 5.3.1 Dans le cas réel avec ∆ < 0, l’unique solution complexe au problème
de Cauchy est une solution réelle.

Dans la suite on s’intéressera seulement au cas où le second membre est de la forme


f (t) = P (t)eλt où P est une fonction polynomiale à coefficients dans K, et λ ∈ K.

Théorème 5.3.3 L’équation y 00 + ay 0 + by = P (t)eλt admet une solution particulière


de la forme y(t) = Q(t)eλt où Q est une fonction polynomiale.

5.4 Compléments

5.4.1 Équations à variables séparées

Définition 5.4.1 Une équation différentielle à variables séparées est une équation de
la forme : y 0 b(y) = a(t) où a, b sont deux fonctions continues données.
Méthode de résolution : Si a est continue sur un intervalle I et b sur un intervalle
J, on peut considérer une primitive A de a sur I et une primitive B de b sur J,
d
dans ce cas l’équation équivaut à : dt [B(y)] = A0 (t), et donc B(y) = A(t) + λ
où λ désigne une constante. On regarde ensuite si la fonction B est localement
ou globalement bijective, auquel cas on pourra écrire y(t) = B −1 (A(t) + λ).

5.4.2 Équation de Bernoulli

Définition 5.4.1 Une équation de Bernoulli ((1654 – 1705) : mathématicien suisse)


est une équation différentielle de la forme y 0 = a(t)y λ + b(t)y où a et b sont deux
fonctions continues sur un intervalle I, et λ ∈ R∗ \{1}.
Méthode de résolution : La fonction nulle est solution. S’il existe une solution
y non constamment nulle, alors il doit exister un intervalle J sur lequel y ne
s’annule pas, sur un tel intervalle y est de signe constant, on peut donc faire le
changement de fonction y = z α avec  = ±1 suivant le signe de y, l’équation
devient alors : αz 0 = b(t)z + a(t)z α(λ−1) + 1, en prenant α = 1−λ 1
, on a une
équation différentielle linéaire du premier ordre, on sait donc la résoudre.

5.5 Exercices

5.5.1 Enoncés

Exercice 1 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 95 — #105


i i

5.5 Exercices 95

Intégrer les équations différentielles suivantes :


2
−1
1. xy 0 − y = ln x 2. xy 0 + 2xtan y = 0
3. xy 0 ln x = (1 + 3 ln x) y 4. y 0 + y cos x = 21 sin 2x
0 2 α
5. xyy − y = x , α ∈ Z 6. x2 (y − x) + y 2 (x − y) y 0 = 0
0 3
7. x (x − 3) yp− 4y = 0 8. (1 + x) y 0 − x2 y = 0
0 0
9. xy − y − x − y = 02 2 10. 2xy + y + 3x2 y 2 = 0
2 0 2 2
11. x y = x y + xy + 1 12. y 0 + y = xex
2
13. y 0 + 2xy = 2xe−x 14. (cos x) y 0 − y sin x = 2x
0
15. y − xy = −xy 3
16. y 0 − y = xy 2
2 0
17. 1 − x y − xy = 1 pour |x| < 1

Exercice 2 :
1. Intégrer l’équation différentielle
1
(E) : 2xy 0 + y = .
1−x
2. Montrer qu’il existe une unique fonction continue sur ]−∞, 1[ qui soit une solution
de (E) pour x 6= 0.
Exercice 3 :
On considère l’équation différentielle

(E) : x (x − 1) y 0 + y = x.

1. Déterminer les solutions maximales de (E) sur ]−∞, 0[ , ]0, 1[ et ]1, +∞[ .
2. Montrer qu’il existe une solution unique de (E) sur ]0, +∞[ .
3. Montrer qu’il n’existe pas de solution (dérivable de (E) sur R mais qu’il existe
une infinité de fonctions continues sur R qui sont solutions pour x 6= 0.
Exercice 4 :
Intégrer les équations différentielles suivantes :

1. y 00 − 3y 0 + 2y = 2x2 − 5x + 3
2. y 00 − 6y 0 + 9y = (x + 1) e3x
3. y 00 − y 0 − 2y = cos x − 3 sin x
4. y 00 − 4y 0 − 4y = ex + (3x − 1) e2x + x − 2
5. y 00 + y = tan x
6. y 00 + 3y 0 + 2y = x−1x2 e
−x
00 −x 1

7. y −y =e ln |x| − 2x
8. x2 y 00 + xy 0 − 4y = x3 sur ]0, +∞[ (poser x = et ).

Exercice 5 :
Montrer que l’équation différentielle

(E) : y 00 cos x + y 0 sin x − y cos3 x = 0

possède une solution de la forme eα sin x et donner la solution générale de (E) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 96 — #106


i i

96 Chapitre 5. Equations différentielles

5.5.2 Corrigés
Exercice 1 :
y y
1. On a (E) : xy 0 − y = ln x ⇔ y 0 − x = ln x
x . Soit (e) : y 0 − x = 0 l’équation
homogène. (e) ⇔ yy0 = x1 .
(e)
– Si x < 0 : yy0 = x1 ⇔ ln |y| = ln (−x) + c avec c ∈ R. Donc, yG (x) = −ec x =
Kx, avec K = −ec ∈ R.
(e)
– Si x > 0 : ln y = ln x ⇒ yG (x) = Kx. Ainsi,
(e)
yG (x) = Kx avec K constante dans R.

En passant par la méthode de la variation de la constante :


ln x
(E) ln x
yP (x) = K (x) x ⇒ K 0 (x) = x
= , x > 0.
x x2
Donc, Z
ln x ln x 1
K (x) = dx = − − + cste.
x2 x x
Ainsi,
(e) (E)
y (x) = yG (x) + yP (x) = Kx − ln x − 1, K ∈ R et x > 0.
2
n     o
−1 x2 x2
2. xy 0 + 2x
tan y = 0 ⇔ y (x) ∈ arccos Kxe + 2kπ, − arccos Kxe + 2kπ ,
k ∈ Z et K ∈ R.
3. xy 0 ln x = (1 + 3 ln x) y ⇔ y (x) = Kx3 ln x, K ∈ R et x ∈ R\ {0, 1} .
4. y 0 + y cos x = 1
2 sin 2x ⇔ y (x) = sin x + Ke− sin x − 1, K ∈ R et x ∈ R.
5. (E) : xyy 0 − y = xα , α ∈ Z, est une équation de Bernouilli (Poser z = y 2 ) :
2

 r   
2 2 α
± x K + α−2 x si α 6= 2
 
y (x) = , x ∈ R.
 p 2
± x (K − 2 ln |x|) si α = 2

6. x2 (y − x) + y 2 (x − y) y 0 = 0, y est une solution si y = x ou x2 + y 2 y 0 = 0. Ainsi,


n 1 o
y (x) ∈ x, x3 + K 3 , K ∈ R et x ∈ R.

 43
7. x (x − 3) y 0 − 4y = 0 ⇔ y (x) = K x−3
x , K ∈ R et x ∈ R\ {0, 3} .
1 4x+3
3
8. (1 + x) y 0 − x2 y = 0 ⇔ y (x) = K (x + 1) e 2 (x+1)2 , K ∈ R et x ∈ R\ {−1} .
p
9. xy 0 − y− x2 − y 2 = 0 ⇔ y (x) = x sin (ln |x| + K) , K ∈ R et (ln |x| + K) ∈
− π2 , π2 .
10. 2xy 0 + y + 3x2 y 2 = 0 ⇔ y (x) = √ 1 2 , K ∈ R et x ∈ R\ {0} .
K |x|+x

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 97 — #107


i i

5.5 Exercices 97

11. x2 y 0 = x2 y 2 + xy + 1 est une équation de Riccati ((1707-1775) un mathématicien


italien) : Trouver une solution de la forme : y (x) = (−xn ) , n ∈ Z.
12. y 0 + y = xex ⇔ y (x) = Ke−x − 14 ex + 12 xex , K ∈ R et x ∈ R.
2 2
13. y 0 + 2xy = 2xe−x ⇔ y (x) = K + x2 e−x , K ∈ R et x ∈ R.


14. (cos x) y 0 −y sin x = 2x ⇔ y (x) = cos1 x x2 + K , K ∈ R et x ∈ − π2 + kπ, π2 + kπ ,


  

k ∈ R.
15. y 0 − xy = −xy 3 est une équation de Bernouilli (Poser z = y −2 ) :
 2
− 12 2
y (x) = ± Ke−x + 1 , K ∈ R et Kex + 1 > 0.

16. y 0 − y = xy 2 ⇔ y (x) = Ke−x1+1−x , K ∈ R et x ∈ R.


17. 1 − x2 y 0 − xy = 1 ⇔ y (x) = √1−x K
+ arcsin x

2

1−x2
pour |x| < 1 et K ∈ R.
Exercice 2 :
(E) : x (x − 1) y 0 + y = x.
y0
1. Soit (e) : 2xy 0 + y = 0 ⇒ y
1
= − 2x si x 6= 0. Sur ]0, +∞[ , ln y = − 21 ln x ⇒

(e) 1 K
yG (x) = Ke− 2 ln x = √ .
x
(E) K(x)
Soit yP (x) = √ .
x
D’après, la méthode de la variation de la constante, on
vérifie que  √  
1 1+√x
(E)
 √
x
ln si x ∈ ]0, 1[ 
yP (x) =
2  √x 
1−
.
1 1+ x
 √
2 x
ln √x−1
si x ∈ ]1, +∞[ 

De même, sur ]−∞, 0[ , on vérifie aussi que



(E) K arctan −x
yG (x) = √ + √ .
−x −x

Ainsi, √
√K1 + arctan −x
 
 −x

−x
si x ∈ ]−∞, 0[ 

  √  

(E) K2 1 1+√x
yG (x) = √
x
+ 2√ x
ln 1− si x ∈ ]0, 1[
  √x  
 K3 1 1+ x 
 √
x
+ 2√ x
ln √ x−1
si x ∈ ]1, +∞[ 

avec K1 , K2 , K3 ∈ R.
2. On a √
arctan −x (E)
lim √ = 1 ⇒ yG (x) est finie ⇔ K1 = 0.
x→0− −x
 √ 
1 1+ x (E)
lim √ ln √ = 1 ⇒ yG (x) est finie ⇔ K2 = 0.
x→0+ 2 x 1− x

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 98 — #108


i i

98 Chapitre 5. Equations différentielles

Ainsi, si K1 = K2 = 0, il existe une unique fonction f continue sur ]−∞, 1[ qui


soit une solution de (E) pour x ∈ ]−∞, 0[ ∪ ]0, 1[ :
 arctan √−x 
 √
−x
si x ∈ ]−∞, 0[ 
√ 
 
(E) 1+ x
f (x) = yG (x) = 1
√ ln √ si x ∈ ]0, 1[ .
 2 x
 1− x 

1 si x = 0

Exercice 3 :
(E) : x (x − 1) y 0 + y = x.
1.  x 
 x−1 (K1 + ln (−x)) si x ∈ ]−∞, 0[ 
(E) x
yG (x) = x−1 (K2 + ln (x)) si x ∈ ]0, 1[
x
(K3 + ln (x)) si x ∈ ]1, +∞[
 
x−1

2. On a
(E) x
lim yG (x) = lim− (K2 + ln (x))
x→1 − x→1 x − 1
 
1 si K2 = 0
= .
∞ si K2 6= 0
(E)
Alors, il faut prendre K2 = 0. De même, limx→1+ yG (x) est finie si et suelement
si K3 = 0. Posons, alors
 x 
x−1 ln (x) si x > 0, x 6= 1
f (x) =
1 si x = 1

et montrons que f est une solution unique de (E) sur ]0, +∞[ . En effet,

lim f (x) = 1 = f (1) .


x→1

Etudiant la dérivabilité de f en 1 :
f (x) − f (1) 1
lim = = f 0 (1) .
x→1 x−1 2
Donc, f est bien dérivable en 1. d’où, f est une solution unique de (E) sur
]0, +∞[ .
3. Soit g une solution de (E) pour x 6= 0 alors d’après 1. et 2.,
 x 
x−1 (K1 + ln (−x)) si x < 0
g (x) = .
f (x) si x > 0

Continuité de g en 0 :

lim g (x) = lim+ f (x) = 0


x→0+ x→0
lim g (x) = lim+ f (x) = 0.
x→0− x→0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 99 — #109


i i

5.5 Exercices 99

Donc, g est bien continue sur tout R. Ainsi, (E) admet une infinité de fonctions
continues sur R qui sont solutions pour x 6= 0. De plus,

g (x) − g (0)
lim = +∞.
x→1 x−0
Donc, g n ’est pas dérivable en 0. Ce qui prouve que (E) n’admet pas de solution
sur tout R.
Exercice 4 :
(E)
1. y 00 − 3y 0 + 2y = 2x2 − 5x + 3 ⇔ yG (x) = 12 x + λe2x + βex + x2 + 54 , λ, β ∈ R.
2. y 00 − 6y 0 + 9y = (x + 1) e3x ⇔
 
(E) 1 2 1 3
yG (x) = λ + x + x + βx e3x , λ, β ∈ R.
2 6

(E)
3. y 00 − y 0 − 2y = cos x − 3 sin x ⇔ yG (x) = 4
5 sin x − 3
5 cos x + λe−x + βe2x ,
λ, β ∈ R.
4. y 00 − 4y 0 − 4y = ex + (3x − 1) e2x + x − 2 ⇔
√ 1 3 1 √ 1 3
yG (x) = λe−x(2 2−2)
− ex − xe2x − x + βex(2 2+2) + e2x + , λ, β ∈ R.
(E)
7 8 4 8 4

5. y 00 + y = tan x ⇔

(E) 1 1
yG (x) = λ cos x−β sin x+ ln (2 − 2 sin x) cos x− ln (2 sin x + 2) cos x, λ, β ∈ R.
2 2
(E)
6. y 00 + 3y 0 + 2y = x−1 −x
x2 e ⇔ yG (x) = e1x ln x + λe−x + βe−2x , λ, β ∈ R.
(E)
7. y 00 − y = e−x 1
⇔ yG (x) = λex + βe−x − x2 (x + ln |x|) e−x , λ, β ∈ R.

ln |x| − 2x
(E)
8. x2 y 00 + xy 0 − 4y = x3 ⇔ yG (x) = λ
x2 + βx2 + 51 x3 , λ, β ∈ R et x > 0.
Exercice 5 :
(E) : y 00 cos x + y 0 sin x − y cos3 x = 0
Soit eα sin x une solution de (E) . Donc, y = eα sin x ⇒ y 0 = α cos xeα sin x et
00
y = α2 cos2 xeα sin x − α sin xeα sin x . On remplace dans (E) :

α = 1 ou α = −1.

Ainsi, esin x et e− sin x sont solutions de (E) . La solution générale de (E) :


(E)
yG (x) = λesin x + βe− sin x , λ, β ∈ R

car esin x et e− sin x sont linéairement indépendant.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 100 — #110


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 101 — #111


i i

Deuxième partie

ALGEBRE

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 102 — #112


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 103 — #113


i i

CHAPITRE 6

Espaces vectoriels et applications linéaires

6.1 L’espace vectoriel Rn


Pour n ∈ N∗ , on définit Rn l’ensemble des suites finies de n termes :
X = (x1 , x2 , x3 , . . . , xn )

√ x11∈
avec  R, x2 ∈ R, x3 ∈ R, . . . , xn ∈ R. Par exemple, les couples suivants (0, 2) et
3, − 2 sont des éléments de R2 .

6.1.1 Addition
On définit sur Rn une loi de composition interne (une application qui à deux éléments
de Rn , fait correspondre un élément de Rn ), l’addition, notée +, par :
∀X = (x1 , x2 , x3 , . . . , xn ) ∈ Rn , ∀Y = (y1 , y2 , y3 , . . . , yn ) ∈ Rn ,
X + Y = (x1 + y1 , x2 + y2 , x3 + y3 , . . . , xn + yn ) ∈ Rn .

6.1.2 Propriétés de l’addition dans Rn


Comme dans R :
1. Associativité
X + (Y + Z) = (X + Y ) + Z = X + Y + Z, ∀X, Y, Z ∈ Rn .

2. Commutativité
X + Y = Y + X, ∀X, Y ∈ Rn .
3. Elément neutre
0Rn = (0, 0, 0, . . . , 0) ,
∀X ∈ Rn , X + 0Rn = 0Rn + X = X.

4. Elément opposé
Tout élément X a un opposé noté − X = (−x1 , −x2 , −x3 , . . . , −xn )
X + (−X) = (−X) + X = 0Rn .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 104 — #114


i i

104 Chapitre 6. Espaces vectoriels et applications linéaires

6.1.3 Produit par un réel


On définit aussi sur Rn une loi de composition externe (une application qui a tout
élément de R et a tout élément de Rn associe un élément de Rn ), le produit par un
réel, notée ·, ou parfois sans signe, par :

∀λ ∈ R, ∀Y = (y1 , y2 , y3 , . . . , yn ) ∈ Rn ,
λ · X = λ · (x1 , x2 , x3 , . . . , xn ) = (λx1 , λx2 , λx3 , . . . , λxn ) .

6.1.4 Propriété du produit par un réel


1. ∀λ, µ ∈ R et X ∈ Rn
(λ + µ) · X = λ · X + µ · X
n
2. ∀λ ∈ R et X, Y ∈ R
λ · (X + Y ) = λ · X + µ · Y
3. ∀λ, µ ∈ R et X ∈ Rn
λ · (µ · X) = (λµ) · X
4. ∀X ∈ Rn
1·X =X
L’ensemble Rn , muni de ces deux lois : (Rn , +, ·) est un espace vectoriel sur R.

6.2 Espace vectoriel


Tout ensemble V, muni d’une loi de composition interne (qui à deux élément de V fait
correspondre un élément de V) et une loi de composition externe (qui à un élément de
R et à un élément de V fait correspondre un élément de V) ayant les huits propriétés
suivantes :
La loi interne vérifie :
1. Associativité :

X + (Y + Z) = (X + Y ) + Z = X + Y + Z, ∀X, Y, Z ∈ V.

2. Commutativité
X + Y = Y + X, ∀X, Y ∈ V.
3. Elément neutre

0V = (0, 0, 0, . . . , 0) ,
∀X ∈ V, X + 0V = 0V + X = X.

4. Elément opposé

∀X ∈ V, X + (−X) = (−X) + X = 0V .

La loi externe vérifie :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 105 — #115


i i

6.2 Espace vectoriel 105

1. ∀λ, µ ∈ R et X ∈ V
(λ + µ) · X = λ · X + µ · X
2. ∀λ ∈ R et X, Y ∈ V
λ · (X + Y ) = λ · X + µ · Y
3. ∀λ, µ ∈ R et X ∈ V
λ · (µ · X) = (λµ) · X
4. ∀X ∈ V
1·X =X
est appelé espace vectoriel sur R. Ses éléments sont appélés des vecteurs.

6.2.1 Règles de calcul


1. λ · (X − Y ) = λ · X − µ · X, ∀λ ∈ R et ∀X, Y ∈ V
2. λ · 0V = 0V
3. λ · (−X) = (−λ) · X, ∀λ ∈ R et ∀X ∈ V
4. (λ − µ) · X = λ · X − µ · X, ∀λ ∈ R et ∀X ∈ V
5. 0 · X = 0V , ∀X ∈ V
6. λ · X = 0V ⇐⇒ λ = 0 ou X = 0V .

6.2.2 Exemples
a. On peut définir des espaces vectoriels sur C et Q.
b. L’ensemble des fonctions définie de R dans R

F = {f : R −→ R, fonctions}

est un espace vectoriel sur R. En effet,


Loi interne vérifie :
1. Associativité : Soient f, g, h ∈ F, f + (g + h) = (f + g) + h = f + g + h.
2. Commutativité : Soient f, g ∈ F, f + g = g + f.
3. Elément neutre : la fonction
0F : R −→ R
x 7−→ 0F (x) = 0

∀f ∈ F, 0F + f = f + 0F = f.
4. Elément opposé : trouver g ∈ F / f + fb = fb + f = 0F c’est à dire ∀x ∈ R,
f (x) + fb(x) = fb(x) + f (x) = 0 =⇒ fb(x) = −f (x) .
La loi externe vérifie :
1. ∀λ, µ ∈ R et f ∈ F
(λ + µ) · f = λ · f + µ · f

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 106 — #116


i i

106 Chapitre 6. Espaces vectoriels et applications linéaires

2. ∀λ ∈ R et f, g ∈ F
λ · (f + g) = λ · f + µ · g
3. ∀λ, µ ∈ R et f ∈ F
λ · (µ · f ) = (λµ) · f
4. ∀f ∈ F
1·f =f
D’où, F est un espace vectoriel de R.

6.3 Combinaisons linéaires, sous-espaces vectoriels


Soit V un espace vectoriel sur R.
Définition 6.3.1
On appelle combinaison linéaire de p vecteurs X1 , X2 , . . . , Xp de V, un vecteur de
la forme
Xp
λ1 X1 + λ2 X2 + · · · + λp Xp = λi Xi
i=1

avec λi ∈ R, i = 1, 2, . . . , p.
Exemple 6.3.1
(−7, −7, 6) = 3 (1, −1, 2)−2 (5, 2, 0) . Donc, (−7, −7, 6) est une combinaison linéaire
des vecteurs (1, −1, 2) et (5, 2, 0) .
Remarque 6.3.1
Tout vecteur de R2 est une combinaison linéaire de (1, 0) et (1, 1) . En effet, soit
α, β ∈ R
α (1, 0) + β (1, 1) = (α + β, β) ∈ R2
=⇒ R2 est une combinaison linéaire de (1, 0) et (1, 1) .
D’une manière générale, soit (x, y) ∈ R2 , (x, y) = (x − y) (1, 0) + y(1, 1). Alors,
| {z } | {z }
∈R ∈R
∀ (x, y) ∈ R2 , (x, y) est une combinaison linéaire de R2 .

6.3.1 Sous-espace vectoriel


Définition 6.3.2
Si V est un espace vectoriel sur R, on appelle sous-espace vectoriel de V, toute
partie de V qui elle-même un espace vectoriel sur R.
Exemple 6.3.2
{0} , V sont deux sous-espace vectoriel de V.
Propriété 6.3.1
Une partie W de V est un sous-espace vectoriel de V, si et seulement si les deux
conditions suivantes sont satisfaites :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 107 — #117


i i

6.3 Combinaisons linéaires, sous-espaces vectoriels 107

1. W est non vide (elle doit contenir au moins l’élément neutre de l’addition).
2. W est stable par rapport aux deux lois. C’est à dire :
(a) ∀X, Y ∈ W, X + Y ∈ W.
(b) ∀λ ∈ R, ∀X ∈ W, λX ∈ W.
Autrement dit :
W est un sous-espace vectoriel de V si et seulement si
1. W 6= ∅
2. ∀X, Y ∈ W, ∀λ ∈ R, λX + Y ∈ W.
Exemple 6.3.3

Montrer que D = (x, y) ∈ R2 / x = y est un sous-espace vectoriel de R2 .
1. D =
6 ∅
2. Soient (x, y) , (x0 , y 0 ) ∈ D, soit λ ∈ R, on vérifie que
λ (x, y) + (x0 , y 0 ) = (λx, λy) + (x0 , y 0 )
= (λx + x0 , λy + y 0 ) ∈ D
car x = y et x0 = y 0 =⇒ λx + x0 = λy + y 0 . D’où, le résultat.
Propriété 6.3.2
L’intersection de deux dous-espaces vectoriels de V est un sous-espace vectoriel de
V.
Propriété 6.3.3
La réunion de deux sous-espaces vectoriels n’est pas obligatoirement un espace
vectoriel.

6.3.2 Sous-espace vectoriel engendré


Définition 6.3.3
On note hX1 , X2 , . . . , Xp i , l’ensemble de toutes les combinaisons linéaires des vec-
teurs X1 , X2 , . . . , Xp de V. hX1 , X2 , . . . , Xp i est appelé sous-espace vectoriel engendré
par X1 , X2 , . . . , Xp .
Propriété 6.3.3
1. R= h1i ,
2. R2 = h(1, 0) , (0, 1)i .

6.3.3 Sous-espace vectoriel supplémentaire


Soient V1 et V2 deux sous-espaces vectoriels de V. On dit que V1 et V2 sont supplé-
mentaire dans V et on écrit V = V1 ⊕ V2 (⊕ : somme directe) si
1. V = V1 + V2 ⇐⇒ ∀X ∈ V, X s’écrit d’une manière unique : X = X1 + X2 ,
X1 ∈ V1 , X2 ∈ V 2 .
2. V1 ∩ V2 = {0V } .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 108 — #118


i i

108 Chapitre 6. Espaces vectoriels et applications linéaires

6.4 Indépendance linéaire, base


6.4.1 Systèmes générateurs (Familles génératrices)
Soit V un espace vectoriel sur R.
Définition 6.4.1
On dit que p vecteurs X1 , X2 , . . . , Xp de V forment une famille génératrice de
V si tout vecteur de V peut s’écrire sous la forme d’une combinaison linéaire des
X1 , X2 , . . . , Xp . Autrement dit, F = {X1 , X2 , . . . , Xp } est génératrice de V ⇐⇒ ∀X ∈
X p
V, ∃ (λi )i=1,2,...,p ∈ R tels que X = λi Xi .
i=1
On dit que les vecteurs X1 , X2 , . . . , Xp engendrent V : V = hX1 , X2 , . . . , Xp i .
Exemple 6.4.1

Soit E = (x, y, z) ∈ R3 / x − 4y + 6z = 0 . Déterminer une famille génératrice
de E.
E = (x, y, z) ∈ R3 / x − 4y + 6z = 0


= {(4y − 6z, y, z) / y, z ∈ R}
= {(4, 1, 0) y + (−6, 0, 1) z / y, z ∈ R} .
D’où, E = h(4, 1, 0) , (−6, 0, 1)i et {(4, 1, 0) , (−6, 0, 1)} est une famille génératrice de
E.

6.4.2 Familles libres, Familles liées


On cherche dans ce paragraphe à reconnaitre si, dans un ensemble de vecteurs, certains
peuvent être engendrés à partir des autres, par combinaison linéaire.
Définition 6.4.2 (Familles liées)
On dit qu’une famille {X1 , X2 , . . . , Xp } est liée si et seulement si, il existe des
m
X
éléments λ1 , λ2 , . . . , λm de R non tous nuls tels que λi Xi = 0V .
i=1
Dans ce cas, on dit aussi que les vecteurs X1 , X2 , . . . , Xp sont linéairement indé-
pendants.
Autrement dit, une famille est liée si et seulement si un de ses éléments est une
combinaison linéaire des autres éléments.
Définition 6.4.3 (Familles libres)
Un ensemble de vecteurs {X1 , X2 , . . . , Xm } est dit libre (et ses vecteurs sont
linéairement indépendants) lorsqu’il n’est pas lié. C’est à dire, lorsqu’il n’existe pas de
m
X
nombres λ1 , λ2 , . . . , λm de R non tous nuls tels que λi Xi = 0V .
i=1
Autrement dit, {X1 , X2 , . . . , Xp } est une famille libre si et seulement si
m
!
X
λi Xi = 0V =⇒ λi = 0, ∀i = 1, 2, . . . , m.
i=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 109 — #119


i i

6.4 Indépendance linéaire, base 109

Exemple 6.4.2
Montrer que les familles suivantes sont libres.

F1 = {f1 = (1, 0, 0) , f2 = (0, 1, 0) , f3 = (1, 1, −3)} ,


F2 = {f1 = (1, −1, 0) , f2 = (2, 1, 3) , f3 = (1, 0, 0)} .

3
X
Pour F2 : soit α, β, γ ∈ R, λi fi = 0 ⇐⇒ λ1 f1 + λ2 f2 + λ3 f3 = 0R3 ⇐⇒
i=1
λ1 (1, −1, 0) + λ2 (2, 1, 3) + λ3 (1, 0, 0) = (0, 0, 0) ⇐⇒

 λ1 + 2λ2 + λ3 = 0
−λ1 + λ2 = 0
3λ2 = 0

D’où, λ1 = λ2 = λ3 = 0. Ainsi, F2 est libre.

6.4.3 Rang d’une famille de vecteurs


Définition 6.4.4
On appelle rang d’un ensemble (ou d’une famille) de vecteurs la plus grande taille
possible pour une famille de vecteurs linéairement indépendants de cet ensemble.
Exemple 6.4.3
1. Le rang de la famille {(1, 2) , (3, 6) , (4, 8)} est 1.
2. Soit une famille de vecteurs de R3 : {(1, 0, 0) , (2, 0, 0) , (0, 1, 0)} . Ces vecteurs
sont-ils liés ? quel est le rang de cette famille ? En effet,

1
(1, 0, 0) = (2, 0, 0) + (0, 1, 0) .
2
Cette famille est liée, donc son rang est inférieur ou égale à 2. Cherchons alors,
une sous-famille libre ? On voit {(1, 0, 0) , (0, 1, 0)} est une famille libre. Donc, le
rang de cette famille est égale à 2.

6.4.4 Bases et dimension d’un espace vectoriel


On se donne des espaces vectoriels engendrés par un nombre fini n de vecteurs.
La notion de base d’un espace vectoriel est celle d’une famille génératrice minimale,
c’est à dire comportant le moins possible de vecteurs : une famille génératrice, libre.
Définition 6.4.5
Soit V un espace vectoriel sur R. On appelle base de V, toute famille génératrice
libre de V.
Propriété 6.4.1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 110 — #120


i i

110 Chapitre 6. Espaces vectoriels et applications linéaires

Une famille de vecteurs B est une base de V, si et seulement si tout vecteur de V


peut s’écrire de façon unique comme combinaison linéaire d’éléments de B.
Autrement dit, Si B = {e1 , e2 , . . . , en } base de V, alors tout vecteur X de V s’écrit
Xn
X= λi ei et les λi sont uniques pour ∀i = 1, 2, . . . , n.
i=1

Exemple 6.4.4
Soit

V= (x, y, z) ∈ R3 / x + y + z = 0


= {(−y − z, y, z) / y, z ∈ R}
= {(−1, 1, 0) y + (−1, 0, 1) z / y, z ∈ R}
= h(−1, 1, 0) , (−1, 0, 1)i .

Tout élément de V s’écrit en fonction des vecteurs (−1, 1, 0) et (−1, 0, 1) . Donc,


{(−1, 1, 0) , (−1, 0, 1)} est génératrice de V. On peut vérifier aussi que {(−1, 1, 0) , (−1, 0, 1)}
est libre de V. Conclusion, {(−1, 1, 0) , (−1, 0, 1)} est une base de V.
Définition 6.4.6
Lorsqu’un espace vectoriel V admet au moins une base, toutes ses bases sont
constituées d’un même nombre de vecteurs. Ce nombre, entier naturel non nul, est
appélé la dimension de V, noté dim (V) .
Par convntion, on pose dim (0V ) = 0.
Exemple 6.4.5
L’exemple fondamentale est Rn .
Soit n ∈ N∗ et X = (x1 , x2 , . . . , xn ) ∈ Rn ,

X = (x1 , x2 , . . . , xn ) = x1 (1, 0, . . . , 0) + x2 (0, 1, 0, . . . , 0) + · · · + xn (0, . . . , 0, 1).


| {z } | {z } | {z }
e1 e2 en

Donc,
∀X ∈ Rn , X = x1 e1 + x2 e2 + · · · + xn en .
D’où, {e1 , e2 , . . . , en } est une famille génératrice de Rn . De plus, e1 , e2 , . . . , en sont
linéairement indépendants alors {e1 , e2 , . . . , en } est une famille libre de Rn . Conclusion,

Bc = {e1 , e2 , . . . , en }

est une base de Rn , appelée base canonique et contient n éléments.


Propriété 6.4.2
Soit V un espace vectoriel sur R de dimension n, n ∈ N∗ .
1. Toute famille libre de vecteurs de V contient au plus n vecteurs.
2. Toute famille génératrice de V contient au moins n vecteurs.
Théorème 6.4.1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 111 — #121


i i

6.5 Applications linéaires 111

Soit V un espace vectoriel sur R de dimension n, n ∈ N∗ .


1. Toute famille libre constituée de n vecteurs de V est une base de V.
2. Toute famille génératrice constituée de n vecteurs de V est une base de V.
Exemple 6.4.6
Soit B = {(1, 0, 0) , (1, 1, 0) , (1, 1, 1)} est-elle une base de R3 ? En effet, soient α, β
et γ ∈ R, α (1, 0, 0) + β (1, 1, 0) + γ (1, 1, 1) = (0, 0, 0) ⇐⇒

 α+β+γ =0
β+γ =0
γ=0

=⇒ α = β = γ = 0. Alors, B est libre. D’après le théorème précédent,


 
B est libre
⇐⇒ B est une base de R3 .
dim R3 = rg (B) = 3

6.5 Applications linéaires


Définition 6.5.1
Soient E et F deux espaces vectoriels sur R et f une application de E dans F.
f est dite linéaire lorsque ∀ (X, Y ) ∈ E × E, λ ∈ R,
f (X + Y ) = f (X) + f (Y ) ,
f (λX) = λf (X) .
Exemple 6.5.1
Vérifier que l’application suivante
f: R3 −→ R
(x, y, z) 7−→ 2z − x
est linéaire.
Soient X = (x, y, z) ∈ R3 , Y = (x0 , y 0 , z 0 ) ∈ R3 et λ ∈ R, on
f (X + Y ) = f ((x, y, z) + (x0 , y 0 , z 0 )) = 2 (z + z 0 ) − (x + x0 )
= (2z − x) + (2z 0 − x0 ) = f (X) + f (Y ) .
et
f (λX) = f (λ (x, y, z)) = 2 (λz) − (λx) = λ (2z − x) = λf (X) .
D’où, f est une application linéaire.
Vocabulaire 6.5.1
– On note par LK (E, F ) l’ensemble des applications linéaires de E dans F. Cet
ensemble est lui même un K-espace vectoriel.
– Si dim E = n et dim F = p alors dim LK (E, F ) = n × p.
– LK (E, E) est noté LK (E) : endomorphisme de E.
– Une application linéaire bijective est dite isomorphisme.
– Un isomorphisme de E dans E est dit un automorphisme de E.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 112 — #122


i i

112 Chapitre 6. Espaces vectoriels et applications linéaires

6.5.1 Propriétés des applications linéaires


Proposition 6.5.1
Soit f : E −→ F une application linéaire. Alors,
1. f (0E ) = 0F (Poser λ = 0 dans la précédente définition) et
n
! n
X X
f λi Xi = λi f (Xi ) (Par réccurrence).
i=1 i=1

2. f (E) : l’ensemble des images des éléments de E par f, appelé "l’image de f " est
noté Im f, est un sous-espace vectoriel de F.

Im f = {Y ∈ F, ∃X ∈ E / f (X) = Y } .

3. L’ensemble des éléments de E par f ayant le vecteur nul de F, appelé "le noyau
de f " et noté ker f, est un sous-espace vectoriel de E.

ker f = {X ∈ E / f (X) = 0F } .

Exemple 6.5.2
1. Soit
f: R2 −→ R3
(x, y) 7−→ (x − y + 3, x + 4y, −y)
On a, f (0R2 ) = f ((0, 0)) = (3, 0, 0) 6= (0, 0, 0) donc f n’est pas une application
linéaire.
2. Soit
f: R2 −→ R2 
2
(x, y) 7−→ x − y , −x + 2y
n’est pas une application linéaire car pour (x, y) = (1, 2) et λ = 2, on a
f (2 (1, 2)) = f (2, 4) = (−14, 6) et 2f (1, 2) = 2 (−3, 3) = (−6, 6) . C’est à
dire f (2 (1, 2)) 6= 2f (1, 2) .
3. Soit
f: R3 −→ R3
(x, y, z) 7−→ (x − y + z, 2x − y, x + z)
Cherchons ker f puis Im f.

ker f = X = (x, y, z) ∈ R3 / f ((x, y, z)) = (0, 0, 0) .




f ((x, y, z)) = (0, 0, 0) ⇐⇒ 


 x−y+z =0
2x − y = 0
x+z =0

=⇒ ker f = {(0, 0, 0)} est un sous-espace vectoriel de R3 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 113 — #123


i i

6.5 Applications linéaires 113

Im f = {Y ∈ F, ∃X ∈ E / f (X) = Y }
= f (X) / X = (x, y, z) ∈ R3


= (x − y + z, 2x − y, x + z) , (x, y, z) ∈ R3


= x (1, 2, 1) + y (−1, −1, 0) + z (1, 0, 1) , (x, y, z) ∈ R3




= h(1, 2, 1) , (−1, −1, 0) , (1, 0, 1)i .

Donc, Im f = h(1, 2, 1) , (−1, −1, 0) , (1, 0, 1)i est un sous-espace vectoriel de R3 .


Théorème 6.5.1 (Théorème des dimensions)
Soit E un espace vectoriel sur R de dimension finie n et soit f définie de E dans
F, on peut démontrer que

dim E = dim ker f + dim Im f.

De plus, si on appelle rang de f et on note rg (f ) la dimension de Im f , (dim Im f = dim f (E) = rg (f ))


alors
rg (f ) = dim E − dim ker f.
Exemple 6.5.3
Soit
f: R3 −→ R2
(x, y, z) 7−→ (2x + 3y, y + 2z)
une application linéaire. Déterminer une base de ker f et une base de Im f .

= (x, y, z) ∈ R3 / f ((x, y, z)) = (0, 0)



ker f = X
= (x, y, z) ∈ R3 / (2x + 3y, y + 2z) = (0, 0)

= X
= (x, y, z) ∈ R3 / 2x + 3y = 0 et y + 2z = 0

= X
= (x, y, z) ∈ R3 / x = 3z et y = −2z

= X
= h(3, −2, 1)i .

ker f est engendré par un seul vecteur (3, −2, 1) . Donc, on peut construire une base
de ker f à partir de (3, −2, 1) : Bker f = {(3, −2, 1)} .

Im f = Y ∈ R2 , ∃X ∈ R3 / f (X) = Y


= f (X) / X = (x, y, z) ∈ R3


= (2x + 3y, y + 2z) , (x, y, z) ∈ R3




= x (2, 0) + y (3, 1) + z (0, 2) , (y, z) ∈ R2




= h(2, 0) , (3, 1) , (0, 2)i .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 114 — #124


i i

114 Chapitre 6. Espaces vectoriels et applications linéaires

Pour chercher une base de Im f , il suffit d’utiliser le théorème des dimensions :

dim Im f = dim R3 − dim ker f


= 3 − 1 = 2.

Donc, pour former une base de Im f, il suffit de prendre deux vecteurs non-colinéaire
de Im f : par exemple, on peut poser

BIm f = {(2, 0) , (0, 2)} .

Proposition : Soient dim E = dim F = n et f ∈ LK (E, F ) . Alors, il est équivalent


de dire :
f injective ⇔ f surjective ⇔ f isomorphisme.

6.6 Exercices
6.6.1 Enoncés
Exercice 1 :
Lequel de ces ensembles est un espace vectoriel ?

E1 = Rn [X]
E2 = F (R,R) = {f : R → R}
E3 = S (R) = {(un )n≥0 / un ∈ R}

Exercice 2 :
Les ensembles suivants possèdent-ils une structure d’espace vectoriel ?

E1 = {(x, y, z) ∈ R3 , x = z}
E2 = {(x, y, z) ∈ R3 , x + y = 1}
E3 = {(x, y, z) ∈ R3 , x − z = 0 ; y + x = 0 et x − y + z = 0}.

Exercice 3 :
Soit E = F (R,R) ,
F = {f ∈ E/ f paire}
et
F = {f ∈ E/ f impaire}.
Montrer que F et G sont deux sous-espaces supplémentaires de E.
Exercice 4 :
1. Dans l’espace vectoriel R4 , rapporté à sa base canonique, B c = {e1 , e2 , e3 , e4 },
vérifier que les vecteurs :

a = (1, 2, −1, −2), b = (2, 3, 0, −1), c = (1, 3, −1, 0), d = (1, 2, 1, 4)

sont libres.
2. Calculer les coordonnées du vecteur V = (7, 14, −1, 2)Bc dans la base B = {a, b, c, d} .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 115 — #125


i i

6.6 Exercices 115

Exercice 5 :
Déterminer une base des espaces vectoriels suivants :

E1 = {(x, y, z) ∈ R3 , x + 3y + z = 0}
E2 = {(x, y, z) ∈ R3 , x + y + z = 0 et z = 0}

Exercice 6 :
1. Soit E = {(x, y, z) ∈ R3 , −x + y + z = 0}.
(a) Montrer que E est un espace vectoriel.
(b) Montrer que tout vecteur V = (x, y, z) de E s’écrit de manière unique sous
la forme :
V = xU1 + yU2 où (Ui )1≤i≤2 ∈ E.
(c) Montrer que B = {U1 , U2 } est une base de E. En déduire dimR E.
2. Soit F = {(x, y, z, t) ∈ R4 , x + y = z et z − y = t}.
(a) Montrer que F est un sous-espace vectoriel de R4 .
(b) Déterminer dimR F.
Exercice 7 :
R4 est rapporté à une base orthonormée B = {e1 , e2 , e3 , e4 } , f est une application
définie par :
 0
 x = y + z,
 0

f: R4 −→ R4 y = x − z − t,

(x, y, z, t) 7−→ (x0 , y 0 , z 0 , t0 )  z 0 = x − y − t,
 0

t = x − y − z − t.

1. Vérifier que f est linéaire.


2. Déterminer le noyau et l’image de f en donnant la dimension et une base.
3. Déterminer la matrice de f relativement à la base B.
Exercice 8 :
Soit f : R4 → R3 l’application définie par :

f (x1 , x2 , x3 , x4 ) = (x1 + 2x2 − 2x3 , 4x1 + x2 + 2x3 + 5x4 , −x1 + 3x2 + 2x3 − 5x4 ) .

1. Montrer que f est linéaire.


2. Donner une base du noyau de f . En déduire le rang de f.
3. Soit B = {u1 , u2 , u3 , u4 } où

u1 = e1 + αe4 , α ∈ R
u2 = e1 + e2
u3 = e1 + e2 + e3
u4 = λe1 + e4 , λ ∈ R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 116 — #126


i i

116 Chapitre 6. Espaces vectoriels et applications linéaires

(a) A quelles conditions sur α et λ, B est une base de R4 ?


(b) Trouver les coordonnées du vecteur V = (1, 2, 3, 4) ∈ R4 dans la base B.

Exercice 9 :
Soit E désigne l’espace vectoriel des fonctions numériques d’une variable réelle
continue sur [0, 1] .
1. Vérifier que l’application
Z x
ϕ: E→E
où F (x) = f (t) dt.
f →F 0

est un endomorphisme de E.
2. Démontrer que le noyau de ϕ est nul.
Exercice 10 :
Soit E l’ensemble des applications de classe C ∞ de R dans R et admettant la
période 1. On considère l’application

d: E→E
f → d (f ) = f 0

1. Montrer que E est un espace vectoriel sur R.


2. Montrer que d est linéaire.
3. Déterminer Im d et ker d.
4. Prouver que E = Im d ⊕ ker d.

6.6.2 Corrigés
Exercice 1 :
1. On a E1 = Rn [X] = {P ∈ R [X] / deg (P ) ≤ n} ∪ {0} ⊂ R [X] . Ainsi, il suffit de
vérifier que Rn [X] est un sous-espace vectoriel de R [X] . En effet, 0 ∈ Rn [X]
et pour λ ∈ R et P, Q ∈ Rn [X] , on vérifie bien que λP + Q ∈ Rn [X] (car
λP + Q ∈ R [X] et deg (λP + Q) ≤ max (P, Q) ≤ n). D’où, Rn [X] est un espace
vectoriel.
2. On sait que pour E un K-espace vectoriel et X un ensemble alors

A (X, E) = {f : X→E}

est un K-espace vectoriel. Ainsi,

E2 = F (R,R)
= {f : R → R}
= A (R, R)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 117 — #127


i i

6.6 Exercices 117

et

E3 = S (R)
= {(un )n≥0 /un ∈ R}
= {u : N → R, n 7→ un }
= A (N, R)

sont des K-espaces vectoriels.


Exercice 2 :

E1 = {(x, y, z) ∈ R3 , x = z}
= h(1, 0, 1), (0, 1, 0)i

est un sous-espace vectoriel de R3 .

E2 = {(x, y, z) ∈ R3 , x + y = 1}

n’est pas un sous-espace vectoriel car (0, 0, 0) ∈


/ E2 .

E3 = {(x, y, z) ∈ R3 , x − z = 0 ; y + x = 0 et x − y + z = 0}
= {(x, y, z) ∈ R3 , x = z ; y = −z et z = 0}
= {(0, 0, 0)} .

est un sous-espace vectoriel de R3 .


Exercice 3 :
Soit E = F (R,R) , F = {f ∈ E / f paire} et F = {f ∈ E / f impaire}. Montrer
que F et G sont deux sous-espaces supplémentaires de E. C’est à dire, E = F ⊕ G :
1. F et G sont des sous-espaces vectoriels de E car
1. (a) 0 ∈ F (La fonction nulle est paire).
(b) Soient f1 , f2 ∈ F et λ ∈ R :

(λf1 + f2 ) (−x) = (λf1 ) (−x) + f2 (−x)


= λf1 (−x) + f2 (−x)
= λf1 (x) + f2 (x)
= (λf1 + f2 ) (x) .

Donc, λf1 + f2 est paire. D’où, λf1 + f2 ∈ F . De même, on vérifie G est un


sous-espace vectoriel de E.
2. Montrer que F ∩ G = {0} . En effet, pour f ∈ F ∩ G

∀x ∈ R, f (x) = f (−x) = −f (x) .

Donc,
∀x ∈ R, 2f (x) = 0 ⇒ f ≡ 0.
D’où, F ∩ G = {0} .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 118 — #128


i i

118 Chapitre 6. Espaces vectoriels et applications linéaires

3. Montrons que E = F + G, c’est à dire ∀h ∈ E, ∃f ∈ F et ∃g ∈ G tels que h ≡ f + g.


En effert,
∀x ∈ R, h (x) = (f + g) (x) = f (x) + g (x) .
et
∀x ∈ R, h (−x) = (f + g) (−x) = f (x) − g (x) .
Ainsi, il existe
h (x) + h (−x)
f (x) = ∈F
2
et il existe
h (x) − h (−x)
g (x) = ∈G
2
tels que h ≡ f + g.
Exercice 4 :
1. On vérifie que B = {a, b, c, d} est une base de R4 avec

a = (1, 2, −1, −2), b = (2, 3, 0, −1), c = (1, 3, −1, 0), d = (1, 2, 1, 4).

En effet, B est libre car pour α1 , α2 , α3 , α4 ∈ R, on a

α1 a + α2 b + α3 c + α4 d = 0

alors α1 = α2 = α3 = α4 = 0 et puisque dim R4 = 4 = rang (B) donc


B = {a, b, c, d} est une base de R4 .
2. On a V = 7e1 + 14e2 − e3 + 2e4 = α1 a + α2 b + α3 c + α4 d avec α1 , α2 , α3 , α4 ∈ R.
Ainsi, par identification, nous avons un système à résoudre

α1 + 2α2 + α3 + α4 = 7
2α1 + 3α2 + 3α3 + 2α4 = 14
−α1 − α3 + α4 = −1
−2α1 − α2 + 4α4 = 2

⇒ α1 = 0, α2 = 2, α3 = 2, α4 = 1.D’où,
 
0
 2 
V =
 2 .

Exercice 5 :

E1 = {(x, y, z) ∈ R3 , x + 3y + z = 0}
= {(x, y, z) ∈ R3 , x = −3y − z}
= {(−3y − z, y, z), (y, z) ∈ R2 }
= {y(−3, 1, 0) + z(−1, 0, 1), (y, z) ∈ R2 }.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 119 — #129


i i

6.6 Exercices 119

Donc, {u1 = (−3, 1, 0), u2 = (−1, 0, 1)} est une famille génératrice. La famille {u1 , u2 }
est bien libre. D’où, u1 et u2 forment une base de R3 et dim E1 = 2.

E2 = {(x, y, z) ∈ R3 , x + y + z = 0 et z = 0}
= {(x, y, z) ∈ R3 , x = −y − z et z = 0}
= {(y, −y, 0), y ∈ R}
= hu = (1, −1, 0)i .

Ainsi, u = (1, −1, 0) 6= (0, 0, 0) donc, u forme une base de R3 et dim E2 = 1.


Exercice 6 :
1. Soit E = {(x, y, z) ∈ R3 , −x + y + z = 0}.
(a) On a E ⊂ R3 est un sous-espace vectoriel de R3 . Donc, E est un espace
vectoriel.
(b) On a

E = {(x, y, z) ∈ R3 , −x + y + z = 0}
= {x(1, 0, 1) + y(0, 1, −1), x, y ∈ R}
= hU1 = (1, 0, 1), U2 = (0, 1, −1)i

D’où, pour tout vecteur V = (x, y, z) de E s’écrit de manière unique sous


la forme :
V = xU1 + yU2 où (Ui )1≤i≤2 ∈ E.
(c) On a vérfié que B = {U1 , U2 } est génératrice d’après b. et on a B est une
famille libre. Ainsi, B est une base de E et

dimR E = rang (B) = 2.

2. On peut écrire

F = {(x, y, z, t) ∈ R4 , x + y = z et z − y = t}
= {x(1, 0, 1, 1) + y(0, 1, 1, 0), x, y ∈ R}
= hV1 = (1, 0, 1, 1), V2 = (0, 1, 1, 0)i .

(a) On vérifie alors que F est un sous-espace vectoriel de R4 .


(b) {V1 , V2 } est une base de R4 . Ainsi, dimR F = rang ({V1 , V2 }) = 2.
Exercice 7 :
1. Pour vérifier que f est linéaire il suffit de choisir α ∈ R et x, y ∈ R tq f (αx + y) =
αf (x) + y.
2.

ker(f ) = X ∈ R4 / f (X) = 0R4




= X ∈ R4 / x = t, y = z = 0


= h(1, 0, 0, 1)i .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 120 — #130


i i

120 Chapitre 6. Espaces vectoriels et applications linéaires

Bker(f ) = {(1, 0, 0, 1)} et dim(ker(f )) = rg(Bker(f ) ) = 1.

Im(f ) = f (X) / X ∈ R4


= (y + z, x − z − t, x − y − t, x − y − z − t) / X = (x, y, z, t) ∈ R4


= {x.(0, 1, 1, 1) + y.(1, 0, −1, −1) + z.(1, −1, 0, −1) + t.(0, −1, −1, −1)} .

Donc,
Im(f ) =< (0, 1, 1, 1), (1, 0, −1, −1), (1, −1, 0, −1) >,

puisque
dim(Im f ) = dim R4 − dim(ker(f )) = 3.

BIm(f ) = {(0, 1, 1, 1), (1, 0, −1, −1), (1, −1, 0, −1)}

est une base de Im(f ).


Exercice 8 :
1. Soient X = (x1 , x2 , x3 , x4 ) et Y = (y1 , y2 , y3 , y4 ) deux vecteurs de R4 et soit
λ ∈ R. On vérifie facilement que

f (X + Y ) = f ((x1 , x2 , x3 , x4 ) + (y1 , y2 , y3 , y4 ))
= f (x1 , x2 , x3 , x4 ) + f (y1 , y2 , y3 , y4 )
= f (X) + f (Y )

et

f (λX) = f (λ (x1 , x2 , x3 , x4 ))
= λf (x1 , x2 , x3 , x4 )
= λf (X) .

Ainsi, f est linéaire.


2.

ker f = (x1 , x2 , x3 , x4 ) ∈ R4 / f (x1 , x2 , x3 , x4 ) = 0



   
5 1 5
= x1 1, − , − , − / x1 ∈ R
8 8 8
 
5 1 5
= 1, − , − , − .
8 8 8

D’où, Bker f = 1, − 85 , − 18 , − 85 est une base du noyau de f et dim ker f = 1.


 

Ainsi, d’après le théorème des dimensions, on a

rang (f ) = dim Im f = dim E − dim ker f = 4 − 1 = 3.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 121 — #131


i i

6.6 Exercices 121

3. Soit B = {u1 , u2 , u3 , u4 } où

u1 = e1 + αe4 , α ∈ R
u2 = e1 + e2
u3 = e1 + e2 + e3
u4 = λe1 + e4 , λ ∈ R.
P4
(a) B est une base de R4 c’est à dire B est libre (si i=1 βi ui = 0 alors βi = 0
pour tout i = 1, . . . , 4).Ainsi, il suffit de résoudre le système linéaire suivant
pour récupérer des conditions sur α et λ :

β1 + β2 + β3 = 0
β2 + β3 = 0
β3 + λβ4 = 0
αβ1 + β4 = 0

Ceci étant vérifié pour tout α et λ dans R.


(b) V = −u1 + (4 + α) u2 + (3 − λ (4 + α)) u3 + (−1 + λ (4 + α)) u4 .
Exercice 9 :
Soit E désigne l’espace vectoriel des fonctions numériques d’une variable ré lle
continue sur [0, 1] .
Rx
1. ∀x ∈ [0, 1] , F (x) = 0 f (t) dt donc ∀x ∈ [0, 1] , F 0 (x) = f (x) et F est dérivable
sur [0, 1]. Ainsi, F est continue sur [0, 1] . On vérifie aussi ϕ est linéaire :
(a) i. Soient f, g ∈ E et λ ∈ R. ∀x ∈ [0, 1] ,
Z x
ϕ (f + λg) (x) = (f + λg) (t) dt
Z0 x Z x
= f (t) dt + λ g (t) dt
0 0
= (ϕ (f ) + λg) (x) .

D’où, ϕ est un endomorphisme de E.


2.

ker ϕ = {f ∈ E / ϕ (f ) = 0}
= {f ∈ E / F (x) = 0, ∀x ∈ [0, 1]}
= {f ∈ E / F 0 (x) = 0, ∀x ∈ [0, 1]}
= {f ∈ E / f (x) = 0, ∀x ∈ [0, 1]}
= {0} .

Ainsi, le noyau de ϕ est nul.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 122 — #132


i i

122 Chapitre 6. Espaces vectoriels et applications linéaires

Exercice 10 :
Soit E = {f : R → R, C ∞ avec une période} : ∀x ∈ R, f (x + 1) = f (x) .
1. On a C ∞ (R) = {f : R → R, C ∞ } est un R-espace vectoriel. On peut vérifier que
E est un sous-espace vectoriel de C ∞ (R) .
2. La linéarité de d est facile à vérifier.
3.

ker d = {f ∈ E / f 0 = 0}
= {f ∈ E / f = cste}
= {f ∈ E / ∀x ∈ R, f (x) = cste.1}
= h1i .

et

Im d = {f ∈ E / ∃g ∈ E : d (g) = f }
= {f ∈ E / ∃g ∈ E : g 0 (x) = f (x) , ∀x ∈ R} .
Rx Rx
Or, on a g (x) = g (0) + 0 g 0 (t) dt = g (0) + 0 f (t) dt et pour x = 1 : g (1) =
R1 R1
g (0) + 0 f (t) dt ⇒ 0 f (t) dt = 0. Ainsi,

Im d = {f ∈ E / ∃g ∈ E : d (g) = f }
 Z 1 
= f ∈E / f (t) dt = 0 .
0

4. Vérifions Im d ∩ ker d = {0} . En effet, pour f ∈ Im d ∩ ker d ⇔



f (x) = cste, ∀x ∈ R
R1
0
f (t) dt = 0
⇔ Z 1
(cste) dt = 0 ⇒ cste = 0.
0
Montrons que ∀f ∈ E, ∃g ∈ Im d et ∃cste ∈ ker d tels que f ≡ g + cste. En effet,
soit f ∈ E : f = (f − cste) + |{z}
cste . D’où, E = Im d ⊕ ker d.
| {z }
∈Im d ∈ker d

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 123 — #133


i i

CHAPITRE 7

Matrices, déterminant et systèmes linéaires

7.1 Calcul matriciel


7.1.1 Généralité sur les matrices
Définition 7.1.1
Une matrice (réelle) A est un tableau rectangulaire de nombres (réels). Elle est
dite de taille n × p si le tableau possède n lignes et p colonnes. Les nombres du tableau
sont appelés les éléments de A. L’élément situé à la i-ème ligne et à la j-ème colonne
est noté aij . La matrice A est également notée

A = (aij )1≤i≤n
1≤j≤p

ou simplement
A = (aij )
si le nombre de lignes et de colonnes est connu par ailleurs.
Exemple 7.1.1
 
1 0 3
A=
0 −2 1
est une matrice 2 × 3 avec, par exemple, a11 = 1 et a23 = 1.
Vocabulaire 7.1.1
1. On note Mn,p (R) l’ensemble des matrices de taille n × p à coefficients dans R.
2. Si n = p, la matrice est dite carrée.
 
a11 a12 ··· a1n
 a21 a22
 ··· a2n 

 .. .. .. .. 
 . . . . 
an1 an2 ··· ann
matrice carrée n × n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 124 — #134


i i

124 Chapitre 7. Matrices, déterminant et systèmes linéaires

Dans le cas d’une matrice carrée, les éléments a11 , a22 , . . . , ann sont appelés les
éléments diagonaux.
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
..  .
 
 .. .. ..
 . . . . 
an1 an2 · · · ann

3. Deux matrices sont égales lorsqu’elles ont la même taille et que les éléments
correspondants sont égaux.
4. Une matrice carrée est dite diagonale si aij = 0, ∀i 6= j
 
a11 0 ··· 0
 .. .. 
 0
 a22 . . 
.
 . .. ..
 ..

. . 0 
0 ··· 0 ann

5. Une matrice est dite ligne si i = 1 et 1 ≤ j ≤ n



a11 a12 ··· a1n

6. Une matrice est dite colonne si j = 1 et 1 ≤ i ≤ n


 
a11

 a21 

 .. 
 . 
an1

7. La matrice In est dite unitaire si elle est diagonale de taille n × n et aii = 1 et


1≤i≤n
 
1 0 ··· 0
.. .
. ..
 
 0 1 
In =  .

 .. .. .. 
. . 0 
0 ··· 0 1

8. La matrice nulle est la matrice dans laquelle aij = 0, ∀i = j


 
0 0 ··· 0
.. .
. ..
 
 0 0 
.
0n =  ..
 .. .. 
 . . . 0 
0 ··· 0 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 125 — #135


i i

7.1 Calcul matriciel 125

7.1.2 Matrice d’une application linéaire


Soient E et F deux  sous-espaces vectoriels tels que dim E = p et dim F = p et soient
{e1 , e2 , . . . , ep } et e01 , e02 , . . . , e0p les bases respectives de E et F.
On donne f : E −→ F une application f est entièrement déterminée par
linéaire.
les images des vecteurs de la base e01 , e02 , . . . , e0p .


La connaissance de f (e1 ) , f (e2 ) , . . . , f (ep ) détermine f comme suit


p
X
X ∈ E =⇒ X = ai ei ,
i=0
Pp
ai f (ei ) . Les vecteurs f (ei ) ∈ F se décomposent selon la base e01 , e02 , . . . , e0p .

f (X) = i=0

Définition 7.1.2
La matrice de l’application linéaire f : E = he1 , e2 , . . . , ep i −→ F = he01 , e02 , . . . , e0n i
relativement aux bases BE = {e1 , e2 , . . . , ep } de E et BF = {e01 , e02 , . . . , e0n } de F est

f (e1 ) f (e2 ) . . . f (ep )


α11 α12 · · · α1p e01
M atBE ,BF (f ) = Mf =  . .. .. ..  ..
 .. . . .  .
αn1 αn2 · · · αnp e0n

Cette matrice admet n = dim F lignes et p = dim E colonnes.


Exemple 7.1.2
Soit
f: R3 −→ R2
(x, y, z) 7−→ (x − y, z)
La matrice de f ?
En effet, R3 = he1 = (1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1)i, R2 = he01 = (1, 0) , e02 = (0, 1)i

f (e
 1 ) f (e2 ) f (e
3 ) 0
Mf = 1 −1 0 e1
0 0 1 e02

f (e1 ) = f ((1, 0, 0))) = (1, 0) = e01 .


f (e2 ) = f ((0, 1, 0))) = (−1, 0) = −e01 .
f (e3 ) = f ((0, 0, 1)) = (0, 1) = e02 .

7.1.3 Rang d’une matrice


Définition 7.1.3
Le rang d’une matrice est le rang de la famille de ses vecteurs colonnes.
Remarque 7.1.1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 126 — #136


i i

126 Chapitre 7. Matrices, déterminant et systèmes linéaires

Le rang d’une application linéaire f est le rang de sa matrice associée Mf


(rg (f ) = rg (Mf )) .
Exemple 7.1.3
Trouver le rang de  
3 −1 1
A= 2 2 1 .
−1 0 1
Pour
  A,
trouverlerang de  il faut
 et il suffit de chercher le rang de la famille
 3 −1 1 
FA =  2  ,  2  ,  1  . Pourcela, il faut chercher une sous-famille
−1 0 1
 
libre de FA ?
Dans cet exemple, on peut vérifier facilement que FA est libre. Ainsi,

rg (A) = rg (FA ) = 3.

7.1.4 Opérations sur les matrices


Définition 7.1.4 (Somme de deux matrices) On peut définir la somme de deux
matrices si elles sont de même taille. Soient A et B deux matrices de taille n × m.
On définit leur somme C = A + B, de taille n × m par

cij = aij + bij .

En d’autres termes, on somme composante par composante.


Exemple 7.1.4
     
3 −2 5 0 3 3
A= , B= , A+B =
1 7 −1 2 3 6
   
4 1 −2
A= , B= , A + B n’est pas définie.
−3 2 8

La matrice (de taille n × m) dont tous les éléments sont zéros est appelée la
matrice nulle et notée 0nm ou plus simplement 0. C’est l’élément neutre
pour l’addition, c’est à dire que A + 0 = A.
Définition 7.1.5 (Produit d’une matrice par un scalaire) Le produit d’une ma-
trice A par un scalaire λ est formé en multipliant chaque élément de A par k. Il
est noté λA.
Exemple 7.1.5 Soient
   
3 −2 −9 6
A= et λ = −3. Alors, λA = .
0 6 0 18

La matrice (−1) A est notée −A et la différence A − B est définie par A + (−B) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 127 — #137


i i

7.1 Calcul matriciel 127

Exemple 7.1.6    
2 −1 0 −1 4 2
A= , B=
4 −5 2 7 −5 3
 
3 −5 −2
A−B = .
−3 0 −1

7.1.5 Le produit matriciel


Le produit AB de deux matrices A et B est défini seulement si le nombre de colonnes
de A est égal au nombre de lignes de B :

Definition 1 Définition 7.1.6 (Produit de deux matrices). Soit A = (aij ) une


matrice n × p et B = (bij ) une matrice p × m. Alors le produit C = AB est une
matrice n × m dont les éléments cij sont définis par

cij = ai1 b1j + ai2 b2j + · · · + aip bpj


  b ··· b1m
 
c11 c12 ··· c1m

a11 ··· ··· a1p 11
a21 a22 ··· a2p  ..   .. 
b21 ··· .   c21 .

  =

 .. ..  . .. ..   . ..

. .  ..
   ..

 . . . 
an1 ··· ··· anp bp1 ··· bpm cn1 ··· ··· cnm
c21 = a21 b11 + a22 b21 + · · · + a2p bp1 .

Exemple 7.1.7

1.  
4 
2 3 −1  −2  = (8 − 6 − 3) = (−1) .
3
| {z } | {z }
1×3 1×1
| {z }
3×1

2.    
3 −3 6 9 0
 −2  −1 2 3 0 = 2 −4 −6 0 .
1 | {z
1×4
} −1 2 3 0
| {z } | {z }
3×1 3×4

7.1.6 Matrice identité


Définition 7.1.7 La matrice carrée n × n
 
1 0 ··· 0
 0 1 ··· 0 
In =  . .
 
.. ..
 .. ..

. . 
0 0 ··· 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 128 — #138


i i

128 Chapitre 7. Matrices, déterminant et systèmes linéaires

s’appelle la matrice identité. Ses éléments diagonaux sont égaux à 1 et tous


ses autres éléments sont égaux à 0. Dans le calcul matriciel, la matrice identité
joue un rôle analogue à celui du nombre 1 dans l’arithmétique des scalaires. C’est
l’élément neutre pour la multiplication. En d’autres termes, si A une matrice
m × n, alors
Im A = A et AIn = A.

7.1.7 Règles du calcul matriciel


Sous l’hypothèse que les tailles des matrices soient compatibles avec les opérations
indiquées, on a les règles suivantes :
1. Commutativité de la somme : A + B = B + A.
2. Associativité de la somme : A + (B + C) = (A + B) + C.
3. Associativité du produit : A (BC) = (AB) C.
4. Distributivité du produit par rapport à la somme :
A (B + C) = AB + AC
(B + C) A = BA + CA.
5. A + 0 = A.
6. AI = IA = A.
7. A.0 = 0.A = 0.
Remarque 7.1.2 Le produit des matrices n’est pas nécessairement commutatif. On
peut avoir
AB 6= BA.
Exemple 7.1.8    
1 0 2 −1
A= B=
−2 5 3 0
   
2 −1 4 −5
AB = BA = .
11 2 3 0
Remarque 7.1.3 Il peut arriver que le produit de deux matrices non nulles soit nul.
En d’autres termes, on peut avoir A 6= 0, B 6= 0 et AB = 0.
Exemple 7.1.9
1.      
0 −1 2 −3 0 0
A= , B= et AB = .
0 5 0 0 0 0
Ce qui précède implique, par distributivité que l’on peut avoir AB = AC et
B 6= C.
2.      
0 −1 4 −1 2 5
A= , B= , C=
0 3 5 4 5 4
 
−5 −1
AB = AC = .
15 12

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 129 — #139


i i

7.1 Calcul matriciel 129

7.1.8 Inversion des matrices


Définition 7.1.8 (Matrice inverse). Soit A une matrice carrée de taille n × n. S’il
existe une matrice carrée B de taille n × n telle que
AB = I et BA = I,
on dit que A est inversible et on appelle B un inverse de A.
Exemple 7.1.10
1. La matrice  
2 1
5 3
est inversible et un de ses inverses est
 
3 −1
.
−5 2
En effet, on a
    
2 1 3 −1 1 0
=
5 3 −5 2 0 1
    
3 −1 2 1 1 0
= .
−5 2 5 3 0 1
2. La matrice  
3 0
A=
5 0
n’est pas inversible. En effet, soit
 
b11 b12
B=
b21 b22
une matrice quelconque. Alors le produit
    
b11 b12 3 0 ∗ 0
BA = =
b21 b22 5 0 ∗ 0
ne peut jamais être égal à la matrice identité.
Théorème 7.1.1 Si B et C sont des inverses de A, alors B = C.
Preuve Comme B est l’inverse de A, on a
BA = I
et donc
BAC = IC = C.
La multiplication étant associative, ceci revient à
B (AC) = C.
Mais par hypothèse AC = I et donc B = C.
Notation 7.1.1 Si A est une matrice inversible, son inverse est noté A−1 . On a donc
AA−1 = I et A−1 A = I.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 130 — #140


i i

130 Chapitre 7. Matrices, déterminant et systèmes linéaires

Matrice 2 × 2
Considérons les matrices 2 × 2
   
a b d −b
A= et B= .
c d −c a

On vérifie que  
1 0
AB = BA = (ad − bc) .
0 1
Donc A est inversible si ad − bc 6= 0, et on a alors
  
1 d −b
A−1 = .
ad − bc −c a

Puissances d’une matrice


Soit A une matrice n × n. On définit

Am = AA . . . A} .
| {z
m facteurs

Si A est inversible, on définit


m
A−m = A−1 = |A−1 A−1 −1
{z. . . A } .
m facteurs

Théorème 7.1.2 Soit A une matrice inversible. Alors


−1
1. A−1 est inversible et A−1 = A;
2. Am est inversible et
−1
(Am ) = |A−1 A−1 −1
{z. . . A }
m facteurs
−1 m −m

= A =A ;

−1
3. λA est inversible si λ 6= 0 et (λA) = λ1 A−1 .
Théorème 7.1.3 Soit A et B deux matrices n × n inversibles. Alors
1. AB est inversible et
−1
2. (AB) = B −1 A−1 .
Preuve On montre que B −1 A−1 (AB) = (AB) B −1 A−1 = I.
 

−1
De façon analogue, on montre que si A1 , A2 , . . . , Am sont inversibles, alors (A1 A2 . . . Am ) =
−1
A−1
m Am−1 . . . A−1
1 .

Exemple 7.1.11    
2 1 −1 3 −1
A= A =
5 3 −5 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 131 — #141


i i

7.1 Calcul matriciel 131

   
−9 −4 −1 −1 −4
B= B =
2 1 2 9
    
2 1 −9 −4 −16 −7
AB = =
5 3 2 1 −39 −17
    
−1 −1 −1 −4 3 −1 17 −7
B A = = .
2 9 −5 2 −39 16
On a alors
  
−16 −7 17 −7
(AB) B −1 A−1 =

−39 −17 −39 16
 
−272 + 273 0
=
0 273 − 272
 
1 0
= .
0 1

7.1.9 Matrices triangulaires


Définition 7.1.9 Soit A une matrice de taille n × n. On dit que A est triangulaire
inférieure si ses éléments au dessus de la diagonale sont nuls, autrement dit si
i < j =⇒ aij = 0.
Une matrice triangulaire inférieure a donc la forme suivante :
··· ···
 
a11 0 0
 .. .. 
 a21 a22
 . . 
 .. .. .. .. ..  .
 .
 . . . . 

 . .. ..
 ..

. . 0 
an1 an2 · · · · · · ann
On dit que A est triangulaire supérieure si ses éléments en dessous de la
diagonale sont nuls, autrement dit si
i > j =⇒ aij = 0.
Une matrice triangulaire inférieure a donc la forme suivante :
a11 a12 · · · · · · · · · a1n
 
 0 a22 · · · · · · · · · a2n 
 .. .. 
 
.. ..
 . . . . 
..  .
 
 .. .. ..
 .
 . . . 

 . . . .
 .. .. .. .. 

0 · · · · · · · · · 0 ann

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 132 — #142


i i

132 Chapitre 7. Matrices, déterminant et systèmes linéaires

Exemple 7.1.12

1. Matrices triangulaires inférieures :


 
4 0 0  
5 0
 0 −1 0  .
1 −2
3 −2 0

2. Matrices triangulaires supérieures :


 
1 1 −1  
1 −3
 0 −1 −1  .
0 6
0 0 −1

Définition 7.1.10 Une matrice triangulaire inférieure et triangulaire supérieure est


dite diagonale.
Exemple 7.1.13
 
−1 0 0  
 0 2 0
6 0  .
0 3
0 0 0

7.1.10 La transposition

Soit A la matrice de taille m × n


 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
A= .
 
.. .. .. ..
 . . . . 
am1 am2 ··· amn

Définition 7.1.11 On appelle matrice transposée de A, la matrice AT de taille n × m


définie par :
 
a11 a21 · · · am1
 a12 a22 · · · am2 
AT =  . ..  .
 
.. ..
 .. . . . 
a1n a2n · · · amn

Autrement dit, la i-ème colonne de AT est la i-ème ligne de A, ou encore

aTij = aij .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 133 — #143


i i

7.1 Calcul matriciel 133

Exemple 7.1.14
 
T 1
1 −2 5 =  −2 
5
 T
0 3  
 1 −5  = 0 1 −1
3 −5 2
−1 2
 T  
−1 0 −1 0
=
0 2 0 2
T
(4) = (4) .
Propriété 7.1.1
T
1. (A + B) = AT + B T
T
2. (λA) = λAT , pout tout λ ∈ R
T
3. (AB) = B T AT
T
4. AT =A
−1 T
5. Si A est inversible, alors AT l’est aussi et on a A−T , AT = A−1 .

7.1.11 La trace
Soit A la matrice n × n
 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
A= .
 
.. .. .. ..
 . . . . 
an1 am2 ··· ann
Définition 7.1.12 On appelle trace de A, et on note tr (A) , le nombre obtenu en
additionnant les éléments diagonaux de A. Autrement dit,
tr (A) = a11 + · · · + ann .
Exemples 7.1.15
 
  1 1 2
2 1
A= et B=  5 2 8 .
0 5
11 0 −10
Alors, tr (A) = 2 + 5 = 7 et tr (B) = 1 + 2 − 10 = −7.
Propriétés 7.1.2 Soient A et B deux matrices n × n. Alors
1. tr (A + B) = tr (A) + tr (B)
2. tr (λA) = λtr (A) pout tout λ ∈ R

3. tr AT = tr (A)
4. tr (AB) = tr (BA) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 134 — #144


i i

134 Chapitre 7. Matrices, déterminant et systèmes linéaires

7.1.12 Matrices symétriques


Définition 7.1.13 Une matrice A de taille n × n est dite symétrique si elle est égale
à sa transposée, c’est à dire si
A = AT
ou encore si aij = aji pour tout i, j = 1, . . . , n.
Exemple 7.1.15
 
−1 0 5  
0 2
 0 2 −1  , , In et 0n,n
2 4
5 −1 0
sont symétriques.
Théorème 7.1.4 Pour une matrice A quelconque, les matrices AAT et AT A sont
symétriques.
T T
Preuve Il suffit de vérifier que AAT = AAT et AT A = AT A.

7.1.13 Matrice antisymétriques


Définition 7.1.14 Une matrice A de taille n × n est dite antisymétrique si
AT = −A
c’est à dire si aij = −aji pour tout i, j = 1, . . . , n.
Exemple 7.1.16
 
    0 4 2
0 −1 0 0
, ,  −4 0 −5  .
1 0 0 0
−2 5 0
On remarque que les éléments diagonaux d’une matrice antisymétrique sont tous
nuls.

7.1.14 Changement de base


Soit E un espace vectoriel sur R. Soient B = {e1 , e2 , . . . , en } et B 0 = {e01 , e02 , . . . , e0n }
deux bases de E.
Définition 7.1.15
On appelle matrice de passage de la base B à la base B 0 , la matrice de {e01 , e02 , . . . , e0n }
dans la base B ; on la note PBB0 .
Exemple 7.1.17
E = R3 , B = {e1 , e2 , e3 } base canonique de E et les vecteurs e01 = e1 + e2 , e02 =
e1 − e2 , e03 = e3 , B 0 = {e01 , e02 , e03 } .
0 0 0
 e1 e2 e3 
1 1 0 e1
=⇒ PBB0 = 
1 −1 0  e2
0 0 1 e3

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 135 — #145


i i

7.2 Systèmes d’équations linéaires 135

Remarque 7.1.4
1. Soit
IdE : E −→ E
X 7−→ X
une application linéaire, appelée identité et

B = {e1 , e2 , . . . , en } et B 0 = {e01 , e02 , . . . , e0n }

deux bases de E alors PBB0 = M atB,B0 (IdE ) .


−1 0
2. PBB0 est inversible et PBB 0 est la matrice de passage de B à B.

Théorème 7.1.4 (Effet d’un changement de base sur la matrice d’une ap-
plication linéaire)
Soit f une application linéaire d’un espace vectoriel E de dimension p dans un
espace F de dimension n.
0
Soient BE = {u1 , u2 , . . . , un } et BE = {u01 , u02 , . . . , u0n } deux bases de E et P la
0
matrice de passage de BE à BE .
Soient BF = {v1 , v2 , . . . , vn } et BF0 = {v10 , v20 , . . . , vn0 } deux bases de E et Q la
matrice de passage de BF à BF0 .
Soient A la matrice de f dans les bases BE à BF et A0 la matrice de f dans les
0
bases BE à BF0 :
A = M atBE ,BF (f ) et A0 = M atBE0 ,BF0 (f ) .
On a alors,
A0 = Q−1 AP.
De plus, si E = F alors Q = P et on a

A0 = P −1 AP.

On dira dans ce cas, que les matrices A et A0 sont semblables.

7.2 Systèmes d’équations linéaires


7.2.1 Introduction aux systèmes d’équations linéaires
L’équation d’une droite dans le plan xy s’écrit

a1 x + a2 y = b

où a1 , a2 et b sont des paramètres réels. Cette équation s’appelle équation linéaire


dans les variables (ou inconnues) x et y.
Exemple 7.2.1
1.
2x + y = −2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 136 — #146


i i

136 Chapitre 7. Matrices, déterminant et systèmes linéaires

2. Les équations suivantes ne sont pas des équations linéaires :


2x + y 2 = 1
y = sin (x)

x= y.
Définition 7.2.1 De manière générale, on appelle équation linéaire dans les variables
x1 , . . . , xn toute relation de la forme
a1 x1 + · · · + an xn = b
où a1 , · · · , an et b sont des nombres réels.
Une solution de l’équation linéaire çi-dessus est un n-uplet s1 , . . . , sn de valeurs
des variables x1 , . . . , xn qui satisfont à l’équation çi-dessus. Autrement dit
a1 s1 + · · · + an sn = b.

7.2.2 Système linéaires et matrices


Considérons un système quelconque de m équations à n inconnues,


 a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2


 ···
am1 x1 + am2 x2 + · · · + amn xn = bm

où le nombre réel aij est le coefficient de la j-ème inconnue dans la i-ème équation.
Définition 7.2.2 (Matrice augmentée). Nous obtenons la matrice augmentée as-
sociée au système en "oubliant" les variables xi et les signes "+" et "=". La
matrice augmentée associée au système çi-dessus est alors
 
a11 a12 · · · a1n b1
 a21 a22 · · · a1n b1 
..  .
 
 .. .. .. ..
 . . . . . 
am1 am2 · · · amn bm

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 137 — #147


i i

7.2 Systèmes d’équations linéaires 137

Exemple 7.2.2 Considérons le système linéaire



 x1 + x2 + 7x3 = −1
2x1 − x2 + 5x3 = −5
−x1 − 3x2 − 9x3 = −5

Sa matrice augmentée est


 
1 1 7 −1
 2 −1 5 −5  .
−1 −3 −9 −5
La méthode de base pour résoudre un système d’équations linéaires est de
remplacer le système par un autre, plus simple, ayant le même ensemble de
solutions. Ceci se fait par une succession d’opérations, appelées opérations
élémentaires :
(1) multiplier une équation par une constante non nulle ;
(2) permuter deux équations ;
(3) ajouter un multiple d’une équation à une autre équation.
Les opérations (1), (2) et (3) ne changent pas l’ensemble des solutions. Elles
correspondent à des opérations élémentaires sur les lignes de la matrice augmentée.
Ces opérations sont les suivantes :
(1) multiplier une ligne par une constante non nulle ;
(2) permuter deux lignes ;
(3) ajouter un multiple d’une ligne à une autre ligne.
Exemple 7.2.3 Utilisons ces opérations élémentaires pour résoudre le système sui-
vant : 
 x + y + 7z = −1
2x − y + 5z = −5
−x − 3y − 9z = −5

Nous calculons la matrice augmentée associée au système :


 
1 1 7 −1
 2 −1 5 −5  .
−1 −3 −9 −5
puis faisons les opérations élémentaires nécessaires sur le système et sur la
matrice augmentée.
(3) l2 ←− l2 − 2l1
  
 x + y + 7z = −1 1 1 7 −1
−3y − 9z = −3 et  0 −3 −9 −3 
−x − 3y − 9z = −5 −1 −3 −9 −5

Nous remarquons que les opérations élémentaires peuvent être faites uniquement sur
la matrice augmentée pour revenir à la fin au système d’équations. C’est ce que nous
faisons dans la suite.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 138 — #148


i i

138 Chapitre 7. Matrices, déterminant et systèmes linéaires

(3) l3 ←− l3 + l1  
1 1 7 −1
 0 −3 −9 −3 
0 −2 −2 −6
(1) l2 ←− − 31 l2  
1 1 7 −1
 0 1 3 1 
0 −2 −2 −6
(3) l3 ←− l3 + 2l2  
1 1 7 −1
 0 1 3 1 
0 0 4 −4
(1) l3 ←− 41 l3  
1 1 7 −1
 0 1 3 1 
0 0 1 −1
(3) l1 ←− l1 − 7l3  
1 1 0 6
 0 1 3 1 
0 0 1 −1
(3) l2 ←− l2 − 3l3  
1 1 0 6
 0 1 0 4 
0 0 1 −1
(3) l1 ←− l1 − l2  
1 0 0 2
 0 1 0 4 .
0 0 1 −1
Cette matrice augmentée correspond au système

 x =2
y =4
z = −1

On obtient ainsi l’unique solution au système : x = 2, y = 4 et z = −1.

7.2.3 Ecriture matricielle des systèmes d’équations linéaires


Le système linéaire


 a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2


 ···
am1 x1 + am2 x2 + · · · + amn xn = bm

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 139 — #149


i i

7.2 Systèmes d’équations linéaires 139

peut s’écrire sous forme matricielle :


    
a11 · · · a1n x1 b1
 a21 · · · a2n  x2   b2 
= .
    
 .. ..  .. ..
 . .  .   . 
am1 ··· amn xn bm
| {z }| {z } | {z }
A X b

On appelle A la matrice des coefficients du système. Le vecteur x est une solution du


système si et seulement si
AX = b.
Théorème 7.2.1 Un système d’équations linéaires n’a soit aucune solution, soit une
seule solution, soit une infinité de solutions.

7.2.4 Système linéaires et inversions des matrices


Théorème 7.2.2 Pour toute matrice A de taille n × n, les affirmations suivantes sont
équivalentes :
(a) A est inversible.
(b) Le système AX = b a une et une seule solution pour toute matrice b de taille
n × 1. Cette solution est donnée par X = A−1 b.
(c) AX = 0 n’a que la solution trivaile X = 0.

Méthode pratique pour le calcul de l’inverse d’une matrice


La méthode consiste à faire des opérations élémentaires sur la forme matricelle :

A : In

jusqu’à aboutir à une matrice de la forme :

: A−1

In .

L’objectif est d’obtenir la matrice In à la place de A, alors on pourra conclure que A


est inversible, et là ou il y avait In on aura A−1 .
Exemple 7.2.4 Résoudre dans R le système d’équations linéaires suivant :

 x + 2y + z = 2
4x − z = 4
−x + 2y + 2z = −4

Calculons l’inverse de  
1 2 1
A= 4 0 −1  .
−1 2 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 140 — #150


i i

140 Chapitre 7. Matrices, déterminant et systèmes linéaires

 
 1 2 1 : 1 0 0
A : I3 = 4 0 −1 : 0 1 0 
−1 2 2 : 0 0 1
l2 ←− l2 − 4l1  
1 2 1 : 1 0 0
 0 −8 −5 : −4 1 0 
−1 2 2 : 0 0 1
l3 ←− l3 + l1  
1 2 1 : 1 0 0
 0 −8 −5 : −4 1 0 
0 4 3 : 1 0 1
l2 ←− − 81 l2  
1 2 1 : 1 0 0
 0 1 5/8 : 1/2 −1/8 0 
0 4 3 : 1 0 1
l3 ←− l3 − 4l2  
1 2 1 : 1 0 0
 0 1 5/8 : 1/2 −1/8 0 
0 0 1/2 : −1 1/2 1
l3 ←− 2l3  
1 2 1 : 1 0 0
 0 1 5/8 : 1/2 −1/8 0 
0 0 1 : −2 1 2
l2 ←− l2 − 85 l3  
1 2 1 : 1 0 0
 0 1 0 : 7/4 −3/4 −5/4 
0 0 1 : −2 1 2
l1 ←− l1 − 2l2 − l3
 
1 0 0 : −1/2 1/2 1/2
−1

I3 : A = 0 1 0 : 7/4 −3/4 −5/4 
0 0 1 : −2 1 2
=⇒  
−2 2 2
1
A−1 = 7 −3 −5 
4
−8 4 8
La solution est alors
    
−2 2 2 2 −1
−1 1
X=A b= 7 −3 −5   4  =  11
2
.
4
−8 4 8 −4 −8
11
D’où, x = −1, y = 2 et z = −8.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 141 — #151


i i

7.3 Le déterminant 141

7.3 Le déterminant
Nous allons construire dans cette partie une fonction appelée le déterminant qui
associe un nombre réel à chaque matrice carrée et qui permettra de caractériser
facilement les matrices inversibles puisque ce sont celles dont le déterminant est nul.
Exemple 7.3.1 Soit  
a b
A= .
c d
On a vu que si ad − bc 6= 0, alors A est inversible. On a alors
 
−1 1 d −b
A = .
ad − bc −c a

On définit alors le déterminant de A comme étant

det (A) = ad − bc.

On va maintenant généraliser cette notion à des matrices carrées de taille n × n.

7.3.1 Calcul des déterminants des matrice 2 × 2 et 3 × 3


Nous décrivons ici la règle de Sarrus pour calculer des déterminants 2 × 2 et 3 × 3

Matrice 2 × 2
 +

& a11 a12 %
− 
 

 + 
a21 % & a22

det (A) = a11 a22 − a21 a12 .

Matrice 3 × 3
On recopie les colonnes 1 et 2 à la suite de la colonne 3 et on calcule comme suit :
+ + +
& a11 & a12 & a13 % a11 % a12 %
− − −
+ + +
a21 & a22 % & a23 % & a21 % a22
− − −
+ + +
a31 % a32 % & a33 % & a31 & a32
− − −

det (A) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a32 a23 a11 − a33 a21 a12 .
Exemple 7.3.2 Calculer  
2 1 0
det  1 0 1 
0 0 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 142 — #152


i i

142 Chapitre 7. Matrices, déterminant et systèmes linéaires

0 0 −1
+ + +
&2 &1 &0% 2% 1%
− − −
+ + +
1 &0% &1% &1% 0
− − −
+ + +
0% 0% &1% &0 &0
− − −
0 0 0
donc det = −1
ATTENTION : Cette méthode ne s’applique pas pour les matrices de dimensions
supérieures à 3.

7.3.2 Calcul des déterminants des matrices n × n


Mineur et cofacteur
Définition 7.3.1 Soit A = (aij ) une matrice de taille n × n. On appelle mineur de
l’élément aij le déterminant de la sous-matrice obtenue en éliminant la i-ème
ligne et la j-ème colonne de la matrice A. On le note Mij . On appelle cofacteur
de aij la quantité
i+j
Cij = (−1) .Mij .

··· ···
 
a11 a12 a1j a1n
 a21 a22 ··· a2j ··· a2n 
.. .. .. .. .. ..
 
 
 . . . . . . 
A= 
 ai1
 ai2 ··· aij ··· ain 

 . .. .. .. .. ..
 ..

. . . . . 
an1 an2 ··· anj ··· ann
 
a11 ··· a1,j−1 a1,j+1 ··· a1n
 .. .. .. .. 

 . . . . 

 ai−1,1 ··· ai−1,j−1 ai−1,j+1 ··· ai−1,n 
Mij = det  
 ai+1,1
 ··· ai−1,j−1 ai+1,j+1 ··· ai+1,n 

 .. .. .. .. 
 . . . . 
an1 ··· an,j−1 an,j+1 ··· ann

Exemple 9.2.3 Calculons M11 , C11 , M32 , C32 :



+* * *
 1 2 3

2 1
M11 =  4 2 1 = + 1 = 1.

1
0 1 1

1+1
C11 = (−1) M11 = 1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 143 — #153


i i

7.3 Le déterminant 143


1 2 3
1 3
M32 = 4
2 1 = −

= −11.
0 1  1 4 1
+ +− +
3+2
C32 = (−1) (−11) = 11.
Pour déterminer si Cij = Mij ou Cij = −Mij , on peut utiliser le schéma suivant :
 
+ − + − ···
 − + − + ··· 
A= +
 
− + − ··· 
.. .. .. ..
 
. . . .

C11 = M11 , C12 = −M12 , C21 = −M21 , etc. . .

Calcul du déterminant par la méthode des cofacteurs


Soit A une matrice de taille 3 × 3
 
a11 a12 a13
A =  a21 a22 a23  .
a31 a32 a33

Le déterminant de A :

det (A) = a11 (a22 a33 − a23 a32 ) + a12 (a23 a31 − a21 a33 ) + a13 (a21 a32 − a22 a31 ) .

Les termes entre parenthèses sont les cofacteurs des éléments a11 , a12 , a13 . Donc

det (A) = a11 C11 + a12 C12 + a13 C13 .

Exemple 7.3.4  
1 2 3
A= 4 2 1 
0 1 1

det (A) = 1C11 + 2C12 + 3C13



2 1 4 1 4 2
= 1
+ 2. (−1) + 3
1 1 0 1 0 1
= 1 − 8 + 12
= 5.

De manière analogue en obtient

det (A) = a11 C11 + a12 C12 + a13 C13


= a21 C21 + a22 C22 + a23 C23
= a31 C31 + a32 C32 + a33 C33 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 144 — #154


i i

144 Chapitre 7. Matrices, déterminant et systèmes linéaires

Nous avons vu que les propriétés du déterminant relatives aux lignes conduisent
à des propriétés analogues relatives aux colonnes. On a donc aussi :

det (A) = a11 C11 + a21 C21 + a31 C31


= a12 C12 + a22 C22 + a32 C32
= a13 C13 + a23 C23 + a33 C33 .

Ces expressions sont appelées les développements du déterminant en cofacteurs


par rapport aux lignes, respectivement aux colonnes, de la matrice A.
Pour une matrice A de taille n × n, on a les développements en cofacteurs analogues.
Nous résumons ceci dans le théorème suivant :
Théorème 7.3.1 Développement par rapport à la i-ème ligne :

det (A) = ai1 Ci1 + ai2 Ci2 + · · · + ain Cin .

Développement par rapport à la j-ème colonne :

det (A) = a1j C1j + a2j C2j + · · · + anj Cnj .

Calcul de l’inverse par la méthode des cofacteurs


Théorème 7.3.2 Considérons la matrice des cofacteurs : comatrice
 
C11 C12 · · · C1n
 C21 C22 · · · C2n 
C= .
 
.. .. 
 .. . . 
Cn1 Cn2 · · · Cnn

et soit la transposée de C : C T est notée adj (A) est appelée la matrice adjointe
de A.
Théorème 7.3.3 Soit A une matrice carrée n × n. On a la formule

A.adj (A) = adj (A) .A = det (A) .In .

En particulier, si det (A) 6= 0 alors A est inversible et on a


1
A−1 = adj (A) .
det (A)

Exemple 7.3.5  
1 1 0
A= 0 1 1 .
1 0 1
On a det(A) = 2. La matrice formée des Mij est
 
1 −1 −1
M =  1 1 −1  .
1 1 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 145 — #155


i i

7.3 Le déterminant 145

La matrice des signes est


 
+ − +
A= − + − .
+ − +

La matrice des cofacteurs est


 
1 1 −1
C=  −1 1 1 .
1 −1 1

On a donc  
1 −1 1
adj (A) = C T =  1 1 −1  .
−1 1 1
Donc  
1 −1 1
1
A−1 = 1 1 −1  .
2
−1 1 1

7.3.3 Systèmes linéaires : règle de Cramer


Le théorème suivant, appelé règle de Cramer, donne une formule explicite pour la
résolution de certaines systèmes d’équations linéaires. Soit


 a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2


 ···
an1 x1 + an2 x2 + · · · + ann xn = bn

un système d’équations linéaires à n équations et n inconnues. Ce système peut aussi


s’écrire AX = b où
     
a11 · · · a1n x1 b1
 a21 · · · a2n   x2   b2 
A= . , X =   et b =  .
     
.. .. ..
 .. .   .   . 
an1 · · · ann xn bn

La matrice A est appelée la matrice des coefficients du système et la matrice b est


appelée le second membre.
Définissons Aj par
 
a11 ··· a1,j−1 b1 a1,j+1 ··· a1n
 a21 ··· a2,j−1 b2 a2,j+1 ··· a2n 
Aj = 
 
.. .. .. 
 . . . 
an1 ··· an,j−1 bn a2,j+1 ··· ann

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 146 — #156


i i

146 Chapitre 7. Matrices, déterminant et systèmes linéaires

Autrement dit, Aj est la matrice obtenue en remplaçant la j-ème colonne de A


par le second membre b. La règle de Cramer va nous permettre de calculer la
solution du système dans le cas où det (A) 6= 0 en fonction des déterminants des
matrices A et Aj .
Théorème 7.3.4 Soit
AX = b
un système de n équations à n inconnues. Supposons que det (A) 6= 0. Alors
l’unique solution du système est donnée par

det (A1 ) det (A2 ) det (An )


x1 = , x2 = , . . . , xn = .
det (A) det (A) det (A)

Exemple 7.3.6 Résolvons le système suivant :



 x1 + 2x3 = 6
−3x1 + 4x2 + 6x3 = 30
−x1 − 2x2 + 3x3 = 8

On a    
1 0 2 6 0 2
A =  −3 4 6  A1 =  30 4 6 
−1 −2 3 8 −2 3
   
1 6 2 1 0 6
A2 =  −3 30 6  A3 =  −3 4 30 
−1 8 3 −1 −2 8
et

det (A) = 44 det (A1 ) = −40


det (A2 ) = 72 det (A3 ) = 152.

La solution est alors


det (A1 ) 40 10
x1 = =− =−
det (A) 44 11
det (A2 ) 72 18
x2 = = =
det (A) 44 11
det (A3 ) 152 38
x3 = = = .
det (A) 44 11

7.4 Exercices
7.4.1 Enoncés
Exercice 1 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 147 — #157


i i

7.4 Exercices 147

On considère les matrices


 
1 1 0
A =  0 1 1  et B = A − I (où I désigne la matrice identité, I ∈ M3 (R) .
0 0 1

Calculer B n puis An , n ∈ N.
Exercice 2 :
On considère pour tout x ∈ R, la matrice
 
cosh x sinh x
A (x) = .
sinh x cosh x

1. Calculer A (x) A (y) , pour x, y ∈ R.


n
2. Calculer (A (x)) , n ∈ N.
Exercice 3 :
Soient E = R2 , F = R3 et f ∈ LR (E, F ) définie par :

f (x, y) = (x + y, x − y, y − x) .

Ecrire la matrice M (f ) relativement aux bases canoniques de E et F.


Exercice 4 :
Soit  
0 −1 −1
A =  −1 −2 0 .
1 3 1
1. On note B = {e1 , e2 , e3 } la base canonique de R3 . Soit f l’application de R3
vers lui-même de matrice A dans la base B. Vérifier que

f (x, y, z) = (−y − z, − x − 2y, x + 3y + z) , pour tout (x, y, z) ∈ R3 .

2. Déterminer le noyau et l’image de f en donnant la dimension et une base.


3. Soient
u1 = (2, − 1, 1) , u2 = (−3, 1, 2) , u3 = (0, 1, − 1)
trois vecteurs de R3 . Montrer que B 0 = {u1 , u2 , u3 } est une base de R3 .
4. Calculer f (u1 ) , f (u2 ) , f (u3 ) .
5. En déduire la matrice de f dans la base B 0 et conclure.
Exercice 5 :
R3 muni de la base canonique B = {e1 = (1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1)} ,

f: R3 −→ R3
(x, y, z) 7−→ (2x − y, y + 2z, x + z) .

1. Vérifier que f est linéaire.


2. Déterminer une base de ker f et une base de Im f.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 148 — #158


i i

148 Chapitre 7. Matrices, déterminant et systèmes linéaires

3. Déterminer la matrice de f relativement à la base B.


4. Soient
u = (1, 2, 3) , v = (2, 0, 1) , w = (0, −1, 2) .
0
Vérifier que B = {u, v, w} est une base de R3 . Déterminer alors la matrice de
passage P de B à B 0 et calculer l’inverse de P.
5. Déterminer la matrice de f relativement à la base B 0 .
Exercice 6 :
Déterminer le rang des matrices suivantes :
 
1 2 3 4 5  
  1 1 −1 2
−1 1 0  2 3 4 5 6 
 
 a 1 1 1 
 , a ∈ R.
A= 0 1 1 ;B=  3 4 5 6 7  ; C =  1 −1
 
3 3 
2 0 1  4 5 6 7 8 
4 2 0 a
5 6 7 8 9

Exercice 7 :
Déterminer l’inverse des matrices suivantes :
   
4 4 2 −3 2 −1
A =  −3 0 1  ; B =  2 0 −1  (par la méthode des cofacteurs)
2 −1 0 1 2 1
 
−1 −1 −3
C= 1 2 0  (par la méthode de Gauss-Jordan)
0 0 1
Exercice 8 :
Soit  
a −b −c −d
 b a −d c 
M (a, b, c, d) =  .
 c d a −b 
d −c b a
1. Calculer det (M (a, 0, 0, 0)) .
2. Calculer M M T .
3. En déduire det M. Donner une condition pour que M soit inversible.
Exercice 9 :
Soit m, p deux entiers naturels tel que m ≥ p ≥ 1. Calculer les déterminants d’ordre
(p + 1) suivants :
0 1 2 p

a0 a1 a2 · · · ap Cm Cm Cm ··· Cm
0 1 2 p
−1 x 0 · · · 0 Cm+1 Cm+1 C m+1 · · · Cm+1

. . . . . .

. .
.. .. . . . .. , ∆
.. .. .. .. ..
∆p = 0 m,p =


. . . . .
.. .
.. .
.. .
.. .
..
.. .. .. .. 0


p

0 · · · 0 −1 x C0 C 1
C 2
··· C
m+p m+p m+p m+p

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 149 — #159


i i

7.4 Exercices 149

Exercice 10 :
Résoudre dans R les systèmes suivants :
 
 3x − y + z = 5  2x − y + z = 4
(S1 ) : x + y − z = −2 ; (S2 ) : −x + 3y − 5z = 1 ;
−x + 2y + z = 3 8x − 9y + 13z = 2
 

 
 2x + y − z = 0  x+y−z−t+u=0
(S3 ) : x + 2y + z = 0 ; (S4 ) : 2x + y − 4t + 4u = 0 ;
3x + y − 2z = 0 x + 2y − 3z + t − u = 0
 

Exercice 11 :
Résoudre et discuter selon le parmètre réel p, le système linéaire suivant :


 x+y+z =1
x + py + z = p

(Sp ) :

 x + y + p2 z = p2
x + y + (p + 1) z = p2 − p + 1

Exercice 12 :
Soient a et b dans R. Résoudre et discuter selon les paramètres a et b les systèmes
linéaires suivants :

 (1 − a) x + (2a + 1) y + (2 + 2a) z = a
(Sa ) : ax + ay = 2a + 2
2x + (a + 1) y + (a − 1) z = a2 − 2a + 9



 x + y + 2z = −2
x + 2y + 3z = a

(Sa,b ) :

 3x + 5y + 8z = 2
5x + 9y + 14z = b

7.4.2 Corrigés
Exercice 1 :      
1 1 0 1 0 0 0 1 0
B =A−I = 0 1 1 − 0 1 0 = 0 0 1 .
0 0 1 0 0 1 0 0 0
    
0 1 0 0 1 0 0 0 1
B2 = B × B =  0 0 1  0 0 1  =  0 0 0 .
0 0 0 0 0 0 0 0 0
    
0 1 0 0 0 1 0 0 0
B3 = B2 × B =  0 0 1  0 0 0  =  0 0 0 .
0 0 0 0 0 0 0 0 0
 
0 0 0
Ainsi, B n =  0 0 0  , pour n ≥ 3.
0 0 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 150 — #160


i i

150 Chapitre 7. Matrices, déterminant et systèmes linéaires

Puisque B et I commute entre eux, on peut appliquer la formule de binôme de


Newton :
n
n
X n!
An = (B + I) = Cnk B k I n−k , où Cnk = .
k! (n − k)!
k=0

Ainsi,

An = B n + Cnn−1 B n−1 + · · · + Cn3 B 3 + Cn2 B 2 + Cn1 B + I


| {z }
=0
n (n − 1) 2
= B + nB + I.
2
D’où,
n(n−1)
 
1 n 2
An =  0 1 n  , pour n ≥ 3.
0 0 1

Exercice 2 :

1. Soient x, y ∈ R,
  
cosh x sinh x cosh y sinh y
A (x) A (y) =
sinh x cosh x sinh y cosh y
 
cosh x cosh y + sinh x sinh y cosh x sinh y + cosh y sinh x
=
cosh x sinh y + cosh y sinh x cosh x cosh y + sinh x sinh y
 
cosh (x + y) sinh (x + y)
=
sinh (x + y) cosh (x + y)
= A (x + y) .

2
2. Si n = 2 : (A (x)) = A (2x) . Pour n ∈ N, on vérifie facilement par récurrence
n
que (A (x)) = A (nx) .

Exercice 3 :
On a f (1, 0) = (1, 1, −1) et f (0, 1) = (1, −1, 1) . Donc, la matrice de f relativement
aux bases canoniques de E et F :
 
1 1
M (f ) =  1 −1 
−1 1

Exercice 4 :
Soit  
0 −1 −1
A =  −1 −2 0 .
1 3 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 151 — #161


i i

7.4 Exercices 151

1. On note B = {e1 , e2 , e3 } la base canonique de R3 . Soit f l’application de R3


vers lui-même de matrice A dans la base B. On a, par définition,

f (X) = AX
  
0 −1 −1 x
=  −1 −2 0  y 
1 3 1 z
 
−y − z
=  −x − 2y  .
x + 3y + z

D’où,

f (x, y, z) = (−y − z, − x − 2y, x + 3y + z) , pour tout (x, y, z) ∈ R3 .

2.

ker f = X = (x, y, z) ∈ R3 / f (x, y, z) = (0, 0, 0)




= X = (x, y, z) ∈ R3 / (−y − z, − x − 2y, x + 3y + z) = (0, 0, 0)




= X = (x, y, z) ∈ R3 / x = −2y, z = −y


= {(−2y, y, −y) / y ∈ R}
= h(−2, 1, −1)i .

Donc, dim ker f = 1 et une base du noyau de f est donnée par :

Bker f = {(−2, 1, −1)} .

Im(f ) = f (X) / X ∈ R3


= (−y − z, − x − 2y, x + 3y + z) / X = (x, y, z) ∈ R3




= x.(0, −1, 1) + y.(−1, −2, 3) + z.(−1, 0, 1) / X = (x, y, z) ∈ R3 .




Donc,
Im(f ) =< (0, −1, 1), (−1, 0, 1) >
puisque
dim(Im f ) = dim R3 − dim(ker(f )) = 2
et (−1, −2, 3) = 2.(0, −1, 1) + (−1, 0, 1). Ainsi,

BIm(f ) = {(0, −1, 1), (−1, 0, 1)}

est une base de Im(f ).


3. Soient
u1 = (2, −1, 1) , u2 = (−3, 1, 2) , u3 = (0, 1, −1)
trois vecteurs de R3 . Il est évident de vérifier que B 0 = {u1 , u2 , u3 } est une base
de R3 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 152 — #162


i i

152 Chapitre 7. Matrices, déterminant et systèmes linéaires

4.

f (u1 ) = (0, 0, 0)
f (u2 ) = (−3, 1, 2) = u2 .
f (u3 ) = (0, 2, −2) = 2.u3 .

5. La matrice de f dans la base B 0 :

f (u
1 ) f (u2 ) f (u
3)
0 0 0 u1
M atB 0 (f ) =  0 1 0  u2
0 0 2 u3

Conclusion : A est diagonalisable.


Exercice 5 :
R3 muni de la base canonique B = {e1 = (1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1)} ,

f: R3 −→ R3
(x, y, z) 7−→ (2x − y, y + 2z, x + z) .

1. Soient X = (x, y, z), X 0 = (x0 , y 0 , z 0 ) et λ ∈ R

f (λX + X 0 ) = f (λ (x, y, z) + (x0 , y 0 , z 0 ))


= f ((λx + x0 , λy + y 0 , λz + z 0 ))
= (2 (λx + x0 ) − (λy + y 0 ) , (λy + y 0 ) + 2 (λz + z 0 ) , (λx + x0 ) + (λz + z 0 ))
= (2λx + 2x0 − λy − y 0 , λy + y 0 + 2λz + 2z 0 , λx + x0 + λz + z 0 )
= (λ(2x − y) + (2x0 − y 0 ) , λ (y + 2z) + (y 0 + 2z 0 ) , λ (x + z) + (x0 + z 0 ))
= λ ((2x − y, y + 2z, x + z) + ((2x0 − y 0 , y 0 + 2z 0 , x0 + z 0 )
= λf (x, y, z) + f (x0 , y 0 , z 0 )
= λf (X) + f (X 0 ) .

D’où, f est linéaire.


2.

ker f = X = (x, y, z) ∈ R3 / f (X) = 0R3




= (x, y, z) ∈ R3 / (2x − y, y + 2z, x + z) = (0, 0, 0)




= (x, y, z) ∈ R3 / 2x − y = 0, y + 2z = 0, x + z = 0


= {(x, 2x, −x) / x ∈ R}


= h(1, 2, −1)i .

Donc,
Bker f = {(1, 2, −1)}

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 153 — #163


i i

7.4 Exercices 153

est une base de ker f.

Im f = f (X) / X ∈ R3


= (2x − y, y + 2z, x + z) / (x, y, z) ∈ R3




= x (2, 0, 1) + y (−1, 1, 0) + z (0, 2, 1) / (x, y, z) ∈ R3 .




Puisque dim Im f = dim R3 − dim ker f = 3 − 1 = 2, alors il suffit de choisir


deux vecteurs de Im f linéairements indépendants. Par exemple, on vérifie que
la famille
BIm f = {(2, 0, 1) , (−1, 1, 0)}

est libre et puisque dim Im f = 2, alors BIm f est une base de Im f.


3.
f
(e1 ) f (e2 ) f (e
3 )
2 −1 0 e1
M atB,B (f ) = Mf = 
0 1 2  e2
1 0 1 e3

est la matrice de f relativement à la base B.


4. Soient
u = (1, 2, 3) , v = (2, 0, 1) , w = (0, −1, 2) .

Vérifier que B 0 = {u, v, w} est une base de R3 (B 0 est libre et rang (B 0 ) =


dim R3 = 3).La matrice de passage P de B à B 0

 u v w 
1 2 0 e1
P = PB,B0 = 
2 0 −1  e2
3 1 2 e3

et
1 4 2
 
− 13 13 13
P −1 =  7
13
2
− 13 1
− 13 .
2 5 4
− 13 − 13 13

5. D’après le théorème de changement de base : On vérifie

(a) i. f est une application linéraire de R3 dans R3 .


ii. B = {e1 = (1, 0, 0) , e2 = (0, 1, 0) , e3 = (0, 0, 1)} est une base de R3 .
iii. B 0 = {u = (1, 2, 3) , v = (2, 0, 1) , w = (0, −1, 2)} est une base de R3 .
iv. P est la matrice de passage de B à B 0 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 154 — #164


i i

154 Chapitre 7. Matrices, déterminant et systèmes linéaires

Alors,

M atB0 (f ) = P −1 M atB (f ) P
1 4 2
   
− 13 13 13 2 −1 0 1 2 0
7 2 1 
=  13 − 13 − 13 0 1 2  2 0 −1 
2 5 4
− 13 − 13 13
1 0 1 3 1 2
 40 10 15

13 13 13
=  − 20
13
21
13
1 
− 13
24 6 9
− 13 − 13 − 13
 
40 10 15
1 
= −20 21 −1  .
13
−24 −6 −9

Exercice 6 :
– Par définition, le rang (A) ≤ 3. Puisque, det A = 1 6= 0, alors rang (A) = 3. De
même
– Pour B : le rang (B) ≤ 4. En effectuant des transformations sur les colonnes :
Ci ← Ci − Ci−1 , i = 2, . . . , 5

1 2 3 4 5 1 1 1 1 1

2 3 4 5 6 2 1 1 1 1

det B = 3 4 5 6 7 = 3 1 1 1 1 = 0.
4 5 6 7 8 4 1 1 1 1

5 6 7 8 9 5 1 1 1 1

Donc, rang (B) ≤ 4 et puisque les mineurs d’ordre 4 et d’ordre 3 sont tous nuls
alors rang (B) ≤ 2. On constate que le mineur d’ordre 2 :

1 1
2 1 = −1 6= 0

alors rang (B) = 2.


– Pour C : le rang (C) ≤ 4. On a det C = 2 (a − 9) (−a + 3) donc il faut distinguer
trois càs :
– Si a ∈ R\ {3, 9} alors rang (C) = 4.
1 1 1

– Si a = 3 alors rang (C) = 3 puisque det C = 0 et −1 3 3 = 12 6= 0.
2 0 3

1 1 1

– Si a = 9 alors rang (C) = 3 puisque det C = 0 et −1 3 3 = 36 6= 0.
2 0 9
Exercice 7 :
 1
− 19 2
  1 1 1
  
18 9 −8 4 8 −2 −1 −6
A−1 =  19 − 29 − 59  ; B −1 =  16 3 1
8
5 
16 ; C −1 =  1 1 3 .
1 2 2 1 1 1
6 3 3 − 4 − 2 4
0 0 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 155 — #165


i i

7.4 Exercices 155

Exercice 8 :
Soit  
a −b −c −d
 b a −d c 
M (a, b, c, d) =  .
 c d a −b 
d −c b a

a 0 0 0

0 a 0 0
1. det (M (a, 0, 0, 0)) = = a4 .
0 0 a 0


0 0 0 a
 2
a + b + c2 + d2
2

0 0 0
2 2
 0 a + b + c2 + d2 0 0 
2. M M T =  .
 0 0 a2 + b2 + c2 + d2 0 
0 0 0 a2 + b2 + c2 + d2
2
3. On a det M = det M T . Puisque det M det M T = (det M ) et det (M (a, 0, 0, 0)) > 0
alors,
2
det M = a2 + b2 + c2 + d2 .
2
Pour que M soit inversible, il faut et il suffit que det M = a2 + b2 + c2 + d2 6= 0,
c’est à dire quand (a, b, c, d) 6= (0, 0, 0, 0) .
Exercice 9:


a0 a1 a2 ··· ap


a1 a2 ··· ··· ap

−1 x 0 ··· 0 −1 x ··· ··· 0
.. ..

.. .. .. = a 0 xp + 1
.. .. ..
∆p = 0 . . . . 0 . . . .

.. .. .. .. .. .. .. ..

. . . . 0
. . . . 0
0 ··· 0 −1 x 0 ··· 0 −1 x
Donc,
∆p = a0 xp + a1 xp−1 + a2 xp−2 + · · · + ap−1 x + ap .
q q−1
On a Cpq −Cp−1 = Cp−1 pour q ≥ p ≥ 1. En effectuant des transformations élémentaires
sur lignes : Li+1 ← Li+1 − Li avec i = 1, . . . , p
0 1 2 p

Cm Cm Cm ··· Cm
0 1 2
Cm+1 Cm+1 Cm+1 · · · Cm+1 p
.. .. .. .. ..


∆m,p =
. . . . .

.. .. .. .. ..
. . . . .
p

C0 1 2
Cm+p Cm+p · · · Cm+p
m+p
1 2 p
···

1 Cm Cm Cm
0 1 p−1
···

0 Cm Cm Cm
.. .. .. .. ..

= . .

. . . .
0 1 p−1
0 Cm+p−2
Cm+p−2 · · · Cm+p−2
0 C0 1 p−1
m+p−1 Cm+p−1 · · · Cm+p−1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 156 — #166


i i

156 Chapitre 7. Matrices, déterminant et systèmes linéaires

Donc, on remarque que

∆m,p = ∆m,p−1 = ∆m,p−2 = · · · = ∆m,0 = 1.

Exercice 10 :
Pour résoudre dans R les systèmes (Si ) 1 ≤ i ≤ 4, il suffit d’appliquer Cramer.
(S1 ) : x = 43 , y = 13 , z = 37
 
12 .
(S2 ) : ∅.
(S3 ) : x = z, y = −z et z ∈ R.
(S4 ) : x = 2z − 32 y, t = u − 12 y + z et y, z, u ∈ R.
Exercice 11 :

 {[x = 2, y = 1, z = −2]} si p = −1
 y = 1 − x, z = 0 et x ∈ R si p = 1


(Sp ) : {[x = −1, y = 1, z = 1]} si p = 2
 {[x = −1, y = 1, z = 1]} si p = 0



∅ si p ∈ R \ {0, 1, −1, 2}

Exercice 12 :
Soient a et b dans R.
1
 
4a − a2 + 2a3 + 6  , 

  x = − 2a−a 2
1
6a − 3a2 + 2a3 + 10 , 

y = 2a−a si a ∈ R \ {0, 1, 2}
 

 2
 1 2 3
z = − 12a − 6a + 3a + 2
  
(Sa ) : 2a−a2
x = 3 − 5−6z , y = 5−6z
 

 6 6 et z ∈ R si a = 2
11+4z 1−4z
 




 x = 3 , y = 3 et z R si a = 1


si a = 0

{[x = −z − 6, y = −z + 4 et z ∈ R]} si (a, b) = (2, 6)
(Sa,b ) :
∅ si (a, b) 6= (2, 6)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 157 — #167


i i

CHAPITRE 8

Diagonalisation des endomorphismes - matrices

8.1 Valeurs propres et vecteurs propres


Soient E un R-espace vectoriel et f ∈ LR (E) : f est un endomorphisme de E.
Définition 8.1.1 Un vecteur x de E est dit vecteur propre de f si :
1. x 6= 0
2. Il existe λ ∈ K tel que f (x) = λx.
On dit alors que λ est une valeur propre de f. On dit aussi que x est un vecteur
propore de f associé à λ.
Définition 8.1.2 L’ensemble des valeurs propres d’un endomorphisme f est appelé
le spectre de f .
Proposition 8.1.1 Soit λ une valeur propre de f alors
Eλ = {x ∈ E / f (x) = λx} = ker (f − λi) 6= {0} .
où i est l’application identique de E dans E. De plus, Eλ est un sous-espace
vectoriel de E (l’ensemble de tout les vecteurs propres associé à λ et du vecteur
nul), appelé, sous-espace propre de f associé à λ.
Théorème 8.1.1 Soit E de dimension finie n. Soient f ∈ LR (E) et
E = Eλ1 ⊕ Eλ2 ⊕ · · · ⊕ Eλk
avec Eλ1 , Eλ2 , . . . , Eλk sont les sous-espaces propres de E associés à des valeurs
propres distinctes (Eλp = ker (f − λp i) 6= {0} ; λi 6= λj si i 6= j). Alors, toute
matrice représentative de f est semblable à la matrice diagonale
D = diag (λ1 , . . . , λ1 , λ2 , . . . , λ2 , . . . , λk , . . . , λk )
où λi figure autant de fois que ri = dim Eλi .
Définition 8.1.3 Soit E un R-espace vectoriel de dimension n finie et
f ∈ LR (E) .
On dit que f est diagonalisable si on peut la représenter par une matrice
diagonale.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 158 — #168


i i

158 Chapitre 8. Diagonalisation des endomorphismes - matrices

8.2 Caractéristique d’une valeur propre


Soient E un R-espace vectoriel de dimension n finie et f ∈ LR (E) : f est un endomor-
phisme de E. On rappelle que det f est définie par det f = det A où A est une matrice
représentative de f . Soient λ ∈ R et A ∈ Mn (R) représente f alors (f − λi) est
représentée par (A − λI) et det (f − λi) = det (A − λI) avec I est la matrice identité
d’orde n.
Or, λ est une valeur propre de f si et seulement si det (f − λi) = |f − λi| = 0
avec |f − λi| est un polynôme de degré n en fonction de λ, appelé, le polynôme
caractéristique de f (aussi de A) et on le note

Pf (λ) = |f − λi| (aussi PA (λ) = |A − λI|).

Proposition 8.2.1 Un scalaire λ ∈ K est une valeur propre de f (ou A) si et seule-


ment si λ est une racine du polynôme caractéristique. Ainsi, les valeurs propres
de f (ou A) sont les racines de Pf (λ) = PA (λ) = 0.
Exemple 8.2.1
Soit  
1 1
A=
1 1
Chercher les valeurs propres de A.

1−λ 1 2
PA (λ) = |A − λI2 | = = (1 − λ) − 1 = λ (λ − 2) .
1 1−λ

D’où, les valeurs propres de A vérifient PA (λ) = 0 ⇐⇒ λ1 = 0 ou λ2 = 2.


Propriété 8.2.1
1. A est non inversible si et seulement si 0 est une valeur propre de A.
2. PA (λ) est un polynôme de degré n en fonction de λ.
3. Pour une matrice carrée d’ordre n
n n−1
PA (λ) = (−λ) + tr (A) (−λ) + · · · + det (A) .

On admet

tr (A) = λ1 + λ2 + · · · + λn ,
det (A) = λ1 λ2 · · · λn .

4. Si X est un vecteur propre de A associé à une valeur propre λ alors X est un


vecteur propre de A2 associé à λ2 . Plus généralement, λk est une valeur propre
de Ak .
5. Si A est inversible et X un vecteur propre de A associé à une valeur propre de
A alors X est un vecteur propre de A−1 associé à la valeur propre de λ1 .
6. Eλ = {X ∈ Rn / AX = λX} = {X ∈ Rn / (A − λI) X = 0} = ker (A − λI)
est un sous-espace vectoriel de Rn (l’ensemble de tout les vecteurs propres
associé à λ et du vecteur nul), appelé, sous-espace propre de A associé à λ.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 159 — #169


i i

8.2 Caractéristique d’une valeur propre 159

Exemple 8.2.2
1. Soit  
1 1
A=
1 1

PA (λ) = λ (λ − 2) ⇐⇒ λ1 = 0 ou λ2 = 2.

E0 = X ∈ R2 / (A − 0I) X = 0


= {X ∈ Rn / AX = 0} .

x+y =0
Ainsi, =⇒ x = −y. Donc,
x+y =0

E0 = (x, y) ∈ R2 / x = −y


= {(−y, y) / y ∈ R}
= h(−1, 1)i .

2. Soit  
−2 −2 1
B =  −2 1 −2  .
1 −2 −2
2
PB (λ) = (3 + λ) (3 − λ) .

Il y a deux valeurs propres λ1 = 3 de multiplicité 1 ou λ2 = −3 de multiplicité


2. Les sous espaces propres sont

E3 = h(1, −2, 1)i et E−3 = h(2, 1, 0) , (−1, 0, 1)i .

3. Soit  
3 0 8
C= 3 −1 6 .
−2 0 −5
3
PC (λ) = − (1 + λ)

=⇒ C admet une seule valeur propre λ = −1 de multiplicité 3. Le sous-espace


propre de C associé à λ = −1

E−1 = X ∈ R3 / (C − (−1) I) X = 0


= X ∈ R3 / (C + I) X = 0 .


     
x 3 0 8 x 0
Ainsi, pour X =  y  ∈ R3 ⇐⇒  3 −1 6   y  =  0  ⇐⇒
z −2 0 −5 z 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 160 — #170


i i

160 Chapitre 8. Diagonalisation des endomorphismes - matrices


 3x + 8z = 0
3x + 6z = 0 =⇒
−2x − 4z = 0

E−1 = (x, y, z) ∈ R3 / x = −2z




= (−2z, y, z) / (x, z) ∈ R2


= (0, 1, 0) y + (−2, 0, 1) z / (x, z) ∈ R2




= h(0, 1, 0) , (−2, 0, 1)i .

8.3 Diagonalisation d’une matrice carrée

Définition 8.3.1

Soit A ∈ Mn (R) . A est diagonalisable s’il existe une matrice diagonale D et une
matrice inversible P tels que A = P DP −1 .

8.3.1 Cas des valeurs propres distinctes

Théorème 8.3.1

Soit A ∈ Mn (R) . Si A admet n valeurs propres distincts λ1 , λ2 , . . . , λn alors A


est diagonalisable.
Autrement dit,
soit A = M atBc (f ) : matrice associée à f dans la base canonique. A admet n valeurs
propres distincts λ1 , λ2 , . . . , λn donc A admet n vecteurs propres X1 , X2 , . . . , Xn . Alors,
B 0 = {X1 , X2 , . . . , Xn } est une base de Rn et on

A = P DP −1

avec
 
λ1 0 ··· 0
 .. .. 
 0 λ2 . . 
P = [X1 X2 · · · Xn ] et D =  ..
.
 .. .. 
 . . . 0 
0 ··· 0 λn

Exemple 8.3.1

Soit
 
−1 2 1
A= 0 2 0 .
1 2 −1

Vérifier que A est diagonalisable. Donner alors la diagonalisation de A.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 161 — #171


i i

8.3 Diagonalisation d’une matrice carrée 161

Cherchons le polynôme caractéristique de A ?



−1 − λ 2 1

PA (λ) = 0 2−λ 0

1 2 −1 − λ

−1 − λ 1
= (2 − λ)
1 −1 − λ
= (2 − λ) (2 + λ) λ.

Ainsi, A admet 3 valeurs propres distincts. Donc, A est diagonalisable.


Comment déterminer la diagonalisation de A ?
Cherchons les espaces propres : E0 , E−2 , E2 ?

E0 = X ∈ R3 / (A − (0) I) X = 0 =< (1, 0, 1)>,



| {z }
,X1

E−2 = X ∈ R3 / (A − (−2) I) X = 0 =< (−1, 0, 1)>,



| {z }
,X2

E2 = X ∈ R3 / (A − (2) I) X = 0 =< (1, 0, 1)> .



| {z }
,X3

Donc, B 0 = {X1 , X2 , X3 } est une base de R3 .

 X1 X2 X3 
1 −1 1 e1
P = M atBc ,B0 (f ) = 
0 0 0  e2
1 1 1 e3
 
1 −2 1
1
P −1 = −1 0 1 .
2
0 2 0

   
1 −2 1 −1 2 1 1 −1 1
1
D= −1 0 1   0 2 0  0 0 0 
2
0 2 0 1 2 −1 1 1 1
 
0 0 0
=  0 −2 0  .
0 0 2

8.3.2 Condition nécessaire et suffisante de diagonalisation


Théorème 8.3.2
Soit A ∈ Mn (R) . A est diagonalisable si et seulement si
1. PA (λ) admet toutes ses racines dans R.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 162 — #172


i i

162 Chapitre 8. Diagonalisation des endomorphismes - matrices

2. dim Eλi = ni , i = 1, . . . , k (k ≤ n)
avec λ1 , λ2 , . . . , λk sont les valeurs propres de A de multiplicité respectives m1 , m2 , . . . , mk .
Autrement dit
Soit A = M atBc (f ) : matrice associée à f dans la base canonique. A admet
λ1 , λ2 , . . . , λk valeurs propres de multiplicité respectives m1 , m2 , . . . , mk tels que
k
X
mi = n
i=1

Pour B1 , B2 , . . . , Bk sont les bases de Eλ1 , Eλ2 , . . . , Eλk , respectivement, on a


k
[
0
B = Bi
i=1

une base de Rn . Alors,


A = P DP −1
avec
 m1 
z }| {
  λ1 
 
  ..  
 
 .  


 λ1 


P = [X1 X2 · · · Xn ] et D =  .. 
.
 .
  

 λk 

  ..  

  .  

λk
 
 
| {z }
mk

Exemple 8.3.2
Soit  
3 0 3
A= 3 −1 6 .
−2 0 −5
3
PA (λ) = − (λ + 1) . A admet une seule valeur propre λ = −1 de multiplicité m = 3.

E−1 = X ∈ R3 / (A − (−1) I) X = 0 = < (0, 1, 0) > .




Puisque, dim E−1 = 1 6= m = 3. D’où, A n’est pas diagonalisable.

8.4 Application de la diagonalisation


8.4.1 Puissance et exponentielle d’une matrice
Puissance d’une matrice

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 163 — #173


i i

8.4 Application de la diagonalisation 163

Soit A ∈ Mn (R) une matrice diagonalisable : A = P DP −1 avec


 
λ1 0 ··· 0
.. . 
. .. 

 0 λ2
D=  . .
.
 .. .. .. 
. 0 
0 ··· 0 λn

Donc, A2 = P DP −1 P DP −1 = P D2 P −1 . Ainsi, par récurrence sur k, on vérifie que


∀k ∈ N, Ak = P Dk P −1 . Or,
 k 
λ1 0 · · · 0
. 
 0 λk2 . . . .. 

k
D = .
 .
 .. . . . . . . 0 

0 · · · 0 λkn

Donc, dans le cas où A est diagonalisable, il sera très facile de calculer une puissance
quelconque de A.

Exponentielle d’une matrice


Par extention avec ce qui précède, pour toute matrice carrée A, on peut définir son
exponentielle de la manière suivante :
+∞
X Ak
eA = .
k!
k=0

Si A est diagonalisable, on obtient plus simplement :


 λ1 
e 0 ··· 0
.. 
 0 eλ 2 . . .

. 
eA = P eD P −1 =   .
.
 .. .. .. 
. . 0 
0 ··· 0 eλn

8.4.2 Système différentiel : étude d’un exemple


Un système différentiel est un système du type :
 0
x = 3x + 2y
(S) :
y 0 = x + 2y

où x : t 7→x (t) et y: t 7→


 y (t) sont deux fonctions à déterminer. Si on note
0
x x
F0 = et F = , on a : F 0 = AF. en diagonalisant la matrice A, on
y0 y
trouve :    
1 0 1 2
PA = P avec P = .
0 4 −1 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 164 — #174


i i

164 Chapitre 8. Diagonalisation des endomorphismes - matrices

Notons
x0 X0
       
x X
=P et =P .
y0 Y0 y Y
La système devient donc :

X0
    
1 0 X
=
Y0 0 4 Y

c’est à dire
X0 = X X = αet
 
soit avec α, β ∈ R.
Y 0 = 4Y Y = βe4t
D’où,
x = αet + 2βe4t
    
x X
=P soit avec α, β ∈ R.
y Y Y = −αet + βe4t

8.5 Exercices
8.5.1 Enoncés
Exercice 1 :
Soit f l’application de R [X] dans R [X] définie par :

f (P ) = XP 0 − P où P 0 est la dérivée de P.

1. Montrer que f est une application linéaire.


2. Montrer que le spectre de f est contenu dans {−1} ∪ N et que tout vecteur
propre de f est de la forme an X n .
3. Soit m ∈ {−1} ∪ N et Pm (X) = X m+1 . Montrer que Pm est un vecteur propre
de f.
4. En déduire l’ensemble des valeures propres de f.
5. Soit λ une valeur propre de f. Déterminer le sous-espace propre Eλ associé à λ.
Exercice 2 :
Soit E un R-espace vectoriel de dimension finie n et f ∈ L (E) un endomorphisme
de rang 1. Montrer que f est diagonalisable si et seulement si la trace de f n’est pas
nulle.
Exercice 3 :
Soit f un endomorphisme de R3 et A la matrice de f relative à la base canonique
B de R3 :  
1 2 −2
A =  2 1 −2 
2 2 −3
1. Calculer les valeurs propres de A.
2. Déterminer une base B 0 de R3 dans laquelle f est représenté par une matrice
diagonale D.
3. Donner la matrice de passage P de B à B 0 et exprimer D en fonction de A.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 165 — #175


i i

8.5 Exercices 165

Exercice 4 :
Soient a et b deux réels non nuls. La matrice
 
0 a b
M = a 0 b 
b a 0

est-elle diagonalisable ?
Exercice 5 :
Soit les matrices :
   
1 0 0 1 0 1
D= 0 2 0 , P =  0 1 1 .
0 0 2 1 0 2

1. Montrer que P est inversible et calculer son inverse.


2. Soit la matrice A = P DP −1 . Calculer A.
3. Soit n ∈ N.
a. Montrer par récurrence que
 
1 0 0
Dn =  0 2n 0 .
0 0 2n

b. Montrer par récurrence que An = P Dn P −1 .


c. En déduire que
2 − 2n 2n − 1
 
0
An =  0 2n 0 .
2 − 2n+1 0 2n+1 − 1
Exercice 6 :
Pour α ∈ R, soit  
α+3 1 4
Aα =  1 α+3 4 .
2 −2 α
1. Montrer que Aα est diagonalisable, pour tout α ∈ R.
2. On choisit α = 2.
a. Déterminer une matrice D diagonale et une matrice P inversible telles que :
A = P DP −1 .
b. Pour n ∈ N, calculer Dn . En déduire pour, n ∈ N, la valeur de An .
3. Résoudre le système d’équations récurrentes suivant :

 xn+1 = 5xn + yn + 4zn
yn+1 = xn + 5yn + 4zn
zn+1 = 2xn − 2yn + 2zn

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 166 — #176


i i

166 Chapitre 8. Diagonalisation des endomorphismes - matrices

Exercice 7 :
1. La matrice  
0 1 0
J = 0 0 1 
1 0 0
est-elle diagonalisable dans M3 (R) ? dans M3 (C) ?
2. On considère la matrice circulante
 
a b c
A =  c a b  ∈ M3 (C) .
b c a

(a) Vérifier que A = aI + bJ + cJ 2 avec J 3 = I.


(b) Trouver les valeurs propres et vecteurs propres de aI + bJ + cJ 2 = A.
(c) En déduire que A est diagonalisable.

8.5.2 Corrigés
Exercice 1 :
1. Soient P1 ∈ R [X], P2 ∈ R [X] et α ∈ R. On a
f (P1 + αP2 ) = (XP10 − P1 ) + α (XP20 − P2 )
= X (P10 + αP20 ) − (P1 + αP2 )
= (XP10 − P1 ) + α (XP20 − P2 )
= f (P1 ) + αf (P2 ) .
Donc, f est une application linéaire.
2. On sait que Sp (f ) = spectre de f = {λ ∈ R / f (P ) = λP } . Soit λ ∈ Sp (f ) ,
donc il existe P ∈ R [X]  {0} tel que f (P ) = λP. Ainsi, ona f (P ) = λP
⇔ XP 0 − P = λP ⇔ XP 0 = (λ + 1) P.
– Si P = cste ∈ R, alors P 0 = 0 donc λ = −1.
– Si P 6= cste, alors XP 0 = (λ + 1) P donc P = αX λ+1 avec α ∈ R∗ . Or,
P ∈ R [X] donc λ + 1 ∈ N ⇒ λ ∈ N.
Ainsi, Sp (f ) ⊂ {−1} ∪ N et tout vecteur propre de f est de la forme an X n .
3. Soit m ∈ {−1} ∪ N et Pm (X) = X m+1 . On a
0
f (Pm ) (X) = XPm (X) − Pm (X)
= X (m + 1) X m − X m+1
= mPm (X) (or, Pm (X) = X m+1 6= 0).
Donc, Pm est un vecteur propre de f.
4. D’après 2. et 3., Sp (f ) ⊂ {−1} ∪ N signifie que
{λ ∈ R / f (Pm ) = λPm = mPm avec m ∈ {−1} ∪ N}
. Donc, Sp (f ) = {−1} ∪ N.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 167 — #177


i i

8.5 Exercices 167

5. λ une valeur propre de f alors λ ∈ {−1} ∪ N. Le sous-espace propre

Eλ = {P ∈ R [X] / f (P ) = λP }
= αX λ+1 / α ∈ R = X λ+1 .


Exercice 2 :
Soit E un R-espace vectoriel, dim E = n et f ∈ L (E) un endomorphisme, rg (f ) =
1.
1. – ” ⇐= ” On a dim E = n et rg (f ) = 1 donc d’après le théorème du rang, on
a dim ker f = n − rg (f ) = n − 1. Donc, 0 est une valeur propre de f d’ordre
(n − 1). Alors, 0 est une racine du polynôme caractéristique d’ordre au moins
(n − 1) . Ainsi, il existe α ∈ K, tel que
n
Pf (X) = (−1) X n−1 (X − α) .

Or, on a tr (f ) = somme des valeurs propres. D’où, tr (f ) = α. D’après


l’hypothèse, on a tr (f ) = α 6= 0 donc α est une valeur propre simple alors
dim Eα = 1 et puisque

dim E0 + dim Eα = n − 1 + 1 = n

alors f est diagonalisable.


– ” =⇒ ”Si f est diagonalisable alors tr (f ) 6= 0 car sinon α = 0 serait la seule
valeur propre de f. Comme hypothèse, f est diagonalisable (f ≡ 0) ce qui est
absurde.
Exercice 3 :
Soit f un endomorphisme de R3 et A la matrice de f relative à la base canonique
B de R3 :  
1 2 −2
A =  2 1 −2 
2 2 −3
1. On commence par calculer le polynôme caractéristique
 
1−x 2 −2
PA (x) = det (A − xI) = det  2 1−x −2  = − (x − 1) (x + 1)2 .
2 2 −3 − x

Ainsi, les valeurs propres de A sont


– λ1 = 1 valeur propre simple.
– λ2 = −1 valeur propre double.
2. On a λ1 = 1 valeur propre simple donc dim Eλ1 = 1 et λ2 = −1 valeur propre
double donc dim Eλ2 ≤ 2. Pourque A soit diagonalisable il faut et il suffit
que dim Eλ2 = 2. Or, il est simple de vérifier que le rg (A + I) = 1. Donc,
dim ker (A + I) = 3 − 1 = 2. D’où, A est diagonalisable. Pour déterminer une
base B 0 de R3 dans laquelle f est représenté par une matrice diagonale D, nous
allons chercher les sous espaces propres associés à λ1 = 1 et λ2 = −1 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 168 — #178


i i

168 Chapitre 8. Diagonalisation des endomorphismes - matrices

– Pour λ1 = 1 : on vérife bien que


 
* 1 +
Eλ1 = ker (A − I) = u1 =  1 
1
.
– Pour λ2 = −1 : on vérife bien que
   +
* 1 0
Eλ2 = ker (A − I) = u2 =  0  , u3 =  1 
1 1
.
Ainsi, B 0 = {u1 , u2 , u3 } est la base de R3 cherchée.
3. La matrice de passage P de B à B 0 est construite à partir des vecteurs u1 , u2 et
u3 :  
1 1 0
P =  1 0 1 .
1 1 1
Ainsi,  
1 0 0
D = P −1 AP =  0 −1 0 .
0 0 −1
Exercice 4 :
Soient a et b deux réels non nuls. Le polynôme caractéristique de M :
 
−x a b
PM (x) = det (M − xI) = det  a −x b  = (b + x) (a + x) (a + b − x) .
b a −x

Ainsi, les valeurs propres de M sont λ1 = a + b, λ2 = −a et λ3 = −b.


– 1er càs : Si λ1 6= λ2 6= λ3 alors M est diagonalisable et semblable à
 
a+b 0 0
D= 0 −a 0  .
0 0 −b

De plus, les sous-espaces propres associés aux valeurs propres sont :


* + * + * +
1 a b
Eλ1 =  1  , Eλ2 =  −a − b  et Eλ3 =  b 
1 a −a − b

– 2ème càs : Si λ1 = λ2 et λ2 6= λ3 alors b = −2a et a 6= b. Dans ce càs, (−a) est


une valeur propre double donc dim E−a ≤ 2 et (2a) est une valeur propre simple
donc dim E2a = 1. Or, rg (M + aI) = 2 ⇒ dim ker (M + aI) = 3 − 2 = 1 < 2.
Donc, M n’est pas diagonalisable.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 169 — #179


i i

8.5 Exercices 169

– 3ème càs : Si λ1 = λ3 et λ2 =6 λ3 alors a = −2b et a =


6 b. Dans ce càs, (−b) est
une valeur propre double donc dim E−b ≤ 2 et (2b) est une valeur propre simple
donc dim E2b = 1. Or, rg (M + bI) = 2 ⇒ dim ker (M + aI) = 3 − 2 = 1 < 2.
Donc, M n’est pas diagonalisable.
– 4ème càs : Si λ2 = λ3 , λ1 = a + b = 2a. Dans ce càs, (2a) est une valeur
propre simple et (a) est une valeur propre double. Or, rg (M + aI) = 1 donc
dim E−a = 2 alors M est diagonalisable et semblable à
 
−a 0 0
D =  0 −a 0  .
0 0 2a

De plus, les sous-espaces propres associés aux valeurs propres sont :


* + *   +
1 1 0
E2a =  1  et E−a =  0 , 1  .
1 −1 −1

Exercice 5 :
1. det(P ) = 1, donc P est inversible.
 
2 0 −1
P −1 = 1 1 −1  .
−1 0 1

2.

A = P DP −1
   
1 0 1 1 0 0 2 0 −1
=  0 1 1  0 2 0  1 1 −1 
1 0 2 0 0 2 −1 0 1
 
0 0 1
=  0 2 0 .
−2 0 3

3. Soit n ∈ N.
(a) Pour n = 0, D0 = In vrai. Supposons que la propriété
 
1 0 0
D n =  0 2n 0 .
n
0 0 2

est vrai à l’ordre n. Montrer par récurrence que


 
1 0 0
Dn+1 =  0 2n+1 0 .
0 0 2n+1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 170 — #180


i i

170 Chapitre 8. Diagonalisation des endomorphismes - matrices

Dn+1 = D × Dn
    
1 0 0 1 0 0 1 0 0
=  0 2 0   0 2n 0 = 0 2n+1 0 .
0 0 2 0 0 2n 0 0 2n+1

(b) Pour n = 0, A0 = In = P D0 P −1 vrai. Supposons que la propriété

An = P Dn P −1

est vrai à l’ordre n. Montrer par récurrence que

An+1 = P Dn+1 P −1

An = An × A = P Dn P −1 P DP −1 = P Dn In DP −1 = P Dn+1 P −1 .

(c)
   
1 0 1 1 0 0 2 0 −1
An =  0 1 1   0 2n 0  1 1 −1 
1 0 2 0 0 2n −1 0 1
2 − 2n n
 
0 2 −1
= 0 2n 0 .
2 − 2n+1 0 2n+1 − 1

Exercice 6 :
Pour α ∈ R, soit  
α+3 1 4
Aα =  1 α+3 4 .
2 −2 α
1.

PAα (λ) = det (Aα − λI3 )



α+3−λ 1 4

= 1 α+3−λ 4

2 −2 α−λ
= (α − λ) (α − λ + 2) (α − λ + 4) .

Alors, Aα admet des valeurs propres distincts. Ainsi, Aα est diagonalisable, pour
tout α ∈ R.
2. On choisit α = 2.

a. On pose  
5 1 4
A= 1 5 4 .
2 −2 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 171 — #181


i i

8.5 Exercices 171

PA (λ) = (2 − λ) (4 − λ) (6 − λ) . Puisque , A est diagonalisable alors


 
2 0 0
D= 0 4 0 .
0 0 6

Chercher les sous-espaces propres associés à chaque valeur propre :


* −1 +
E2 = ker (A − 2I3 ) =  −1  .
1
* − 3  +
2
E4 = ker (A − 4I3 ) =  − 52  .
1
* 1 +
E6 = ker (A − 6I3 ) =  1  .
0
Alors,

− 23
   
−1 1 −1 1 1
P =  −1 − 52 1  ⇒ P −1 =  1 −1 0 .
3
1 1 0 2 − 21 1

telles que : A = P DP −1 .
b. Pour n ∈ N,
2n
 
0 0
n
D = 0 4n 0 .
0 0 6n
Pour n ∈ N,

An = P DP −1 P DP −1 · · · P DP −1 = P Dn P −1 .
  
| {z }
n fois

−1 − 32 1 2n
   
0 0 −1 1 1
An =  −1 − 52 1   0 4n 0  1 −1 0 
3
1 1 0 0 0 6n 2 − 21 1
 n 3 n 3 n 3 n
− 2n − 12 6n 6n − 2n

2 − 24 + 26 24
=  2n − 52 4n + 32 6n 5 n
24 − 2n − 12 6n 6n − 2n  .
4n − 2n 2n − 4n 2n

3. Le système d’équations récurrentes suivant :



 xn+1 = 5xn + yn + 4zn
yn+1 = xn + 5yn + 4zn
zn+1 = 2xn − 2yn + 2zn

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 172 — #182


i i

172 Chapitre 8. Diagonalisation des endomorphismes - matrices

est équivalent à
Xn+1 = AXn
avec  
xn
Xn =  yn  .
zn
Xn+1 = AXn = A (AXn−1 ) = · · · = An+1 X0 ,
 
x0
avec X0 =  y0  ∈ R3 . D’où,
z0
 n 3 n 3 n 3 n n 1 n
6n − 2n
 
2 − 24 + 26 24 − 2 − 26 x0
Xn =  2n − 52 4n + 32 6n 25 4n − 2n − 12 6n 6n − 2n   y0 
4n − 2n 2n − 4n 2n z0
3 n 3 n 3 n 1 n
 n
 n n n
 
x0 2 − 2 4 + 2 6  − z0 (2 − 6 ) − y0 2 − 2 4 + 26 
=  x0 2n − 52 4n + 32 6n − z0 (2n − 6n ) − y0 2n − 52 4n + 1 n
26
.
y0 (2n − 4n ) − x0 (2n − 4n ) + 2n z0

Exercice 7 :
1. Calculons le polynôme caractéristique de la matrice J :

PJ (x) = (1 − x) x2 + x + 1 .



Ainsi, J n’est pas diagonalisable dans M3 (R) car le polynôme x2 + x + 1
n’admet pas de racines dans R. Par contre, dans C [X] ,
π
PJ (x) = (1 − x) (x − j) x − j 2 avec j = e2i 3 .


Ainsi, les valeurs propres de la matrice J sont λ1 = 1, λ2 = j et λ3 = j 3 qui sont


distinctes donc J est diagonalisable dans M3 (C) :

j2
   
1 0 0 1 j
D = P −1 JP =  0 j 0  et P =  1 j2 j .
0 0 j2 1 1 1

2. On considère la matrice circulante


 
a b c
A =  c a b  ∈ M3 (C) .
b c a

(a) Il est facile de vérifier que A = aI + bJ + cJ 2 avec J 3 = I.


(b) On sait que Juk = λk uk pour k = 1, 2, 3 et
     2 
1 j j
u1 =  1  , u2 =  j 2  et u3 =  j 
1 1 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 173 — #183


i i

8.5 Exercices 173

sont les vecteurs propres associés aux valeurs propres λ1 = 1, λ2 = j,


λ3 = j 3 de la matrice J, respectivement. Alors,

Juk = λk uk pour k = 1, 2, 3

⇐⇒

Auk = aI + bJ + cJ 2 uk = a + λk b + λ2k c uk pour k = 1, 2, 3.


 

Ainsi, les valeurs propres de A sont

α1 = a + b + c, α2 = a + jb + j 2 c et α3 = a + j 2 b + jc.

De plus, les vecteurs propres de A sont uk pour k = 1, 2, 3.


(c) Ainsi, d’après ce qui précède, A est diagonalisable et semblable à la matrice
diagonale :
 
a+b+c 0 0
D0 =  0 a + jb + j 2 c 0 .
2
0 0 a + j b + jc

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 174 — #184


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 175 — #185


i i

CHAPITRE 9

Polynômes et fractions rationnelles

9.1 Polynômes
9.1.1 Définitions et notations
Définition 9.1.1 L’ensemble des polynômes à coeffcients dans K = R ou C est
noté K [X], on a donc :

K [X] = {a0 + a1 X + · · · + an X n , ai ∈ K, 0 ≤ i ≤ n, n ≥ 0}

Les éléments de K [X] sont dits des polynômes de variable X à coefficients dans
n
ai X i . Les ai ∈ K, 0 ≤ i ≤ n, n ≥ 0, sont appelés les coefficients du
P
K :
k=0
polynôme.
n
ai X i , et on le note
P
Définition 9.1.2 On appelle degré du polynôme P (X) =
k=0
deg P, le plus grand entier n tel que an 6= 0. (Le polynôme nul n’a pas de degré,
par convention deg 0 = −∞).
n
ai X i est de degré n (an 6= 0) et si an = 1, on dit
P
Remarque 9.1.1 Si P (X) =
k=0
que P est unitaire.
Exemple 9.1.1 Le polynôme X 2 + X + 1 est unitaire.

deg X 2 + X + 1 = deg(X 2 ) = 2.


Proposition 9.1.1 Soient P, Q ∈ K [X]


1. Si deg P 6= deg Q alors P + Q 6= 0 et deg (P + Q) = Sup (deg P, deg Q) .
2. Si deg P = deg Q et si P + Q 6= 0 alors deg (P + Q) ≤ Sup (deg P, deg Q) .
3. Si P Q 6= 0 alors deg(P Q) ≤ deg (P ) + deg Q.
4. Si P 6= 0, Q 6= 0 alors deg (P Q) = deg P + deg Q.
Preuve

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 176 — #186


i i

176 Chapitre 9. Polynômes et fractions rationnelles

n p
ai X i , an 6= 0 (deg P = n) et Q (X) = bi X i , bp 6= 0
P P
1. Soient P (X) =
k=0 k=0
(deg Q = p) . On a p = 6 n (p < n) donc P + Q 6= 0 (P (X) + Q (X) = (a0 + b0 ) +
(a1 + b1 ) X +· · ·+(ap + bp ) X p +ap+1 X p+1 +· · ·+an X n , an 6= 0) donc P +Q 6= 0
et on a : deg (P + Q) = n = sup (n, p) .
2. Supposons n = p. Dans ce cas, an = 6 0 et bp 6= 0. On a P (X) + Q (X) =
(a0 + b0 ) + (a1 + b1 ) X + · · · (an + bn ) X n et P + Q =
6 0 c’est à dire il existe
0 ≤ i0 ≤ n tel que ai0 + bi0 6= 0, donc deg (P + Q) ≤ n.
3., 4. De la même façon que 2.
Corollaire 9.1.1 Les seuls éléments inversibles de K [X] sont les éléments inversibles
de K.
Preuve Soit P ∈ K [X] , P 6= 0, inversible dans K [X] : il existe Q ∈ K [X] tel que
P.Q = 1 et deg (P Q) = deg(1) = 0 = deg P + deg Q. D’où, deg P = deg Q = 0
et P, Q ∈ K.

9.1.2 Formule de Taylor pour les polynômes


Définition 9.1.3
n
ai X i , an 6= 0. On définit la dérivée de P
P
Soient P ∈ K [X] tel que P (X) =
k=0
n
par : P 0 (X) = iai X i−1 . Par convention ; X 0 = 1. C’est à dire pour P (X) =
P
k=1
a0 + a1 X + · · · + an X n , on a P 0 (X) = a1 + · · · + nan X n−1 . Généralement, par
récurrence, on définit la dérivée k-ième de P par :

P (X) si k = 0
P (k) (X) = 0
P (k−1) (X) si k ≥ 1.

Propriété 9.1.1 Soient P, Q ∈ K [X] et soit λ ∈ K :


0 0
1. (P + Q) = P 0 + Q0 et (λP ) = λP 0 .
0
2. (P × Q) = P 0 × Q + P × Q0 , plus généralement, on a la formule de Liebniz :
n
X
(n)
(P × Q) = Cnk P (k) Q(n−k) .
k=0

0 0
3. (P ◦ Q) = P (Q) = Q0 × P 0 (Q) (dérivée d’une composée).
Proposition 9.1.2 Soit P ∈ K [X] tel que, pour tout 1 ≤ k ≤ n : P (k) (X) est non
nul de degré (n − k) et deg P = n. On a la formule suivante de Taylor pour les
polynômes :
n k
X (X − a) (k)
∀a ∈ K, P (X) = P (a)
k!
k=0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 177 — #187


i i

9.1 Polynômes 177

Preuve Il suffit de montrer la formule de Taylor pour P (X) = X n : X n =


n
(X−a)k (k) (k) n!
(X n ) (a) . On a (X n ) = n (n − 1) · · · (n − k + 1) X n−k = (n−k)! X n−k
P
k!
k=0

n k n k
X (X − a) (k)
X (X − a) n!
(X n ) (a) = an−k
k! k! (n − k)!
k=0 k=0
Xn
k
= Cnk (X − a) an−k
k=0
n
= ((X − a) + a) = X n .

9.1.3 Division euclidienne des polynômes


Proposition 9.1.3 Soient P, S ∈ K [X] , S 6= 0. Il existe un couple unique de poly-
nômes Q et R ∈ K [X] tel que

R = 0, ou
P = SQ + R avec
deg R < deg S.

Si R = 0, on dit que S divise P (ou P est divisible par S).


Exemple 9.1.2 Division euclidienne de P (X) = 3X 5 − X 4 + X − 1 ∈ R [X] par
S (X) = X 2 − X + 1 ∈ R [X] :

P (X) = S (X) 3X 3 + 2X 2 − X − 3 + (−X + 2) .




9.1.4 Méthode pratique de recherche du p.g.c.d.


Soient P1 , P2 ∈ K [X] non nuls

R = 0, ou
P1 = P2 Q + R avec
deg R < deg P2

R1 = 0, ou
P2 = RQ1 + R1 avec
deg R1 < deg R

R2 = 0, ou
R = R1 Q2 + R2 avec
deg R2 < deg R1

..
.

Rk = 0, ou
Pk−2 = Rk−1 Qk + Rk avec
deg Rk < deg Rk−1

Rk−1 = Rk Qk+1
Rk : dernier reste non nul. On vérifie que le p.g.c.d. de P1 et P2 est égal à Rk .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 178 — #188


i i

178 Chapitre 9. Polynômes et fractions rationnelles

Exemple 9.1.3 Calculer le p.g.c.d. de P1 (X) = X 4 − X + 1 et P2 (X) = X 2 + 1.


X 4 − X + 1 = X 2 + 1 X 2 − 1 + (−X + 2)
 
←− P1 −→ ←− P2 −→←− Q −→ ←− R −→

X2 + 1 = (−X + 2) (−X − 2) + 5
←− P2 −→ ←− R −→←− Q1 −→ ←− R1 −→
 
X 2
−X + 2 = 5 − + .
←− R −→ ←− R1 −→ 5 5
←− Q2 −→

On a, le dernier reste non nul est R1 (X) = 5. Donc, R15(X) = 1 = "unitaire"


= p.g.c.d (P1 , P2 ) . On dit que P1 et P2 sont premier entre eux.

9.1.5 Polynômes irreductibles dans K [X]


Un polynôme P ∈ K [X] est dit irréductible s’il est non nul et s’il est divisible que
par λ ∈ K\ {0} et par λP.
Exemple 9.1.4 P (X) = X − 1 ∈ R [X] est irréductible dans R [X]. En effet, X − 1 =
S (X) Q (X) et deg S ≥ 1. Donc,
 
1 = deg S + deg Q deg S = 1

deg S ≥ 1 deg Q = 0
⇒ P (X) = X − 1 = α (aX + b) ⇒ S(X) = λP (X) .
Remarque 9.1.2 Un polynôme P ∈ K [X] est dit réductible si P = P1 P2 avec
deg P1 , deg P2 ≥ 1.
Proposition 9.1.4
1. Les seuls polynômes irréductible dans C [X] sont les polynômes de degré un.
2. Les seuls polynômes irréductible dans R [X] sont les polynômes de degré un et
les polynômes de degré deux de la forme aX 2 + bX + c avec b2 − 4ac < 0.
Propriété 9.1.2 Tout polynôme P ∈ K [X] de degré non nul s’écrit de manière unique
P = λP1k1 P2k2 . . . Pm
km
où λ ∈ K\ {0} et P1 , . . . , Pn sont des polynômes irréduc-
tibles de K [X] deux à deux distincts et k1 , . . . , km sont des entiers strictement
positif..
Exemple 9.1.5 X 2 + 1 ∈ C [X] , X 2 + 1 = (X − i) (X + i) = 1.P11 (X) P22 (X) avec
P1 (X) = (X − i) et P2 (X) = (X + i).
Application 9.1.1 Décomposer en facteur irréductible le polynôme P (X) = X 6 − 1 ∈ K [X] ,
avec K = R, C.
1. Si K = C,
n
Y
P (X) = (X − αi )
i=1
h π  5π
i h 2π
 4π
i
= [(X − 1) (X + 1)] X − ei 3 X − ei 3 X − ei 3 X − ei 3 .
 
2. Si K = R, P (X) = (X − 1) (X + 1) X 2 − X + 1 X2 + X + 1 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 179 — #189


i i

9.1 Polynômes 179

9.1.6 Racine d’un polynôme


Soit P ∈ K [X] . On dit que a ∈ K est une racine du polynôme P, si P (a) = 0.
Proposition 9.1.5 Un élément a ∈ K est racine de P ∈ K [X] si et seulement si le
polynôme P est divisible par le polynôme X − a.
Preuve Comme deg P ≥ 1, la division euclidienne de P par le polynôme X − a :
P (X) = (X − a) Q (X) + R (X) avec deg R < 1 ou R = 0. On a P (a) = R (a) ∈
K.
– Si R = 0 alors a est une racine de P car P est divisible par X − a.
– Si P (a) = 0 alors R (a) = 0 = R (X) (car deg R < 1 : R = Constante). D’où, P
est divisible par X − a.

9.1.7 Racine d’ordre supérieur à un


On appelle ordre de multiplicité d’une racine a ∈ K de polynôme P ∈ K [X] le
k
plus grand entier k ≥ 1 tel que P soit divisible par (X − a) .
Proposition 9.1.6 Soit P ∈ K [X] de degré n au plus (P = 0 ou deg P ≤ n).
k k k
1. P (X) = (X − a1 ) 1 (X − a2 ) 2 · · · (X − an ) m Q (X) où a1 , a2 , . . . , an ∈ K sont
racines de P deux à deux distincts d’ordre k1 , k2 , . . . , km respectivement et
Q ∈ K [X] .
m
P
2. Si P 6= 0 alors ki ≤ n.
i=1
m
P
3. Si ki > n alors P = 0.
i=1

Preuve
m
Q k
1. P (X) = (X − a1 ) Q1 (X) = · · · = (X − ai ) i Q (X) .
i=1
m
P m
P
2. Si P 6= 0, n = deg P = ki + deg Q ≥ ki .
i=1 i=1

Proposition 9.1.7 Soit P ∈ K [X] . Les propriétés suivantes sont équivalentes :


1. a ∈ K est racine d’ordre k de P ∈ K [X] .
2. a ∈ K est racine de P et a est racine d’ordre (k − 1) de P 0 .
3. P (a) = P 0 (a) = · · · = P (k−1) (a) = 0 et P (k) (a) 6= 0.

9.1.8 Division suivant les puissances croissantes


Proposition 9.1.8 Soient P, S ∈ K [X] .
n
X n
X
P (X) = aj X j , S (X) = bj X j , b0 6= 0.
j=1 j=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 180 — #190


i i

180 Chapitre 9. Polynômes et fractions rationnelles

Soit k ∈ N, il existe un unique couple de polynôme (Q, R) d’éléments de K [X]


vérifiant :

Q = 0, ou
P (X) = S (X) Q (X) + X k+1 R (X) avec
deg Q ≤ k.

Méthode pratique
En utilisant un exemple, il s’agit de diviser suivant les puissance croissante P (X)=
X + X 4 + X 5 avec S (X) = 1 + X 2 , k = 4. On trouve P (X) = S (X) X − X 3 + X 4 +
X 5 (2 − X) .

9.2 Fractions rationnelles


9.2.1 Généralités
Définition d’une fraction rationnelle
P
Une fraction rationnelle à coeffcients dans K = R ou C est sous la forme F = Q,
P et Q étant des polynômes de K [X] tels que Q 6= 0.

Degré d’une fraction rationnelle


P (X)
Soit F (X) = Q(X) une fraction rationnelle. On appelle degré de F l’entier relatif
deg P − deg Q.

Partie entière d’une fraction rationnelle


Si deg F ≥ 0 c’est à dire deg P − deg Q ≥ 0. La division euclidienne de P par Q s’écrit
alors : 
R = 0 ou
P (X) = Q (X) E (X) + R (X) ,
deg R < deg Q.
On a donc :

R (X) R = 0 ou
F (X) = E (X) + ,
z }| { Q (X) deg R < deg Q.
Partie entière
de F (X)

9.2.2 Décomposition d’une fraction rationnelle en éléments simples


Cas de C [X]
P (X)
Soit F (X) = Q(X) ∈ C [X] une fraction rationnelle écrite sous sa forme irréductible
et soit Q (X) unitaire.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 181 — #191


i i

9.2 Fractions rationnelles 181

k kn
Proposition 9.2.1 Soit Q (X) = (X − a1 ) 1 . . . (X − an ) , la décomposition en
éléments simples de la fraction F (X) est :
kr
n X
X αr,s
F (X) = E (X) + s , avec αr,s ∈ C et E (X) ∈ C [X] .
z }| { r=1 s=1
(X − ar )
Partie entière z }| {
Termes de
de F (X)
première espèce

Exemple 9.2.1
1. Décomposer en élément simple la fraction rationnelle à coefficients complexes
suivante :
X4 + 1 2X 3 − 2X 2 + 2X
F (X) = 2 = 1 + 2 .
(X − 1) (X 2 + 1) z }| { (X − 1) (X 2 + 1)
Division euclidienne
de X 4 + 1 par
2 
(X − 1) X 2 + 1

3 2
2X − 2X + 2X T1 (X) T2 (X) T3 (X)  deg T1 < 2
(1) : 2 = 2 + + , avec deg T2 < 1
(X − 1) (X + i) (X − i) (X − 1) (X + i) (X − i) 
deg T3 < 1.
Donc,
2X 3 − 2X 2 + 2X α α0 λ β
2 = + 2 + + , avec α, α0 , λ, β ∈ C.
(X − 1) (X + i) (X − i) X − 1 (X − 1) (X + i) (X − i)

2
Multiplier (1) par (X − 1)(X=1) ⇒ α0 = 1,
1
Multiplier (1) par (X − i)(X=i) ⇒ β = ,
2
1
Multiplier (1) par (X + i)(X=−i) ⇒λ= ,
2
Multiplier (1) par (X − 1)(x→±∞) ⇒ 2 = α + λ + β ⇒ α = 1.
X4 + 1 1 1 1 1
2 =1+ + + + .
(X − 1) (X 2 + 1) X − 1 (X − 1)2 2 (X + i) 2 (X − i)
2. Décomposer en élément simple la fraction rationnelle à coefficients complexes
suivante :
X +1 X +1
G (X) = 4 = √  4 √ 
(X − 1) + 2) (X 2(X − 1) X − i 2 X + i 2
α1 α2 α3 α4 β γ
= 4 + 3 + 2 + (X − 1) +
√ + √ ,
(X − 1) (X − 1) (X − 1) X −i 2 X +i 2

avec α1 , α2 , α3 , α4 , β, γ ∈ C.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 182 — #192


i i

182 Chapitre 9. Polynômes et fractions rationnelles

Pour trouver α1 , α2 , α3 , α4 , on pose h = X − 1. On obtient la fraction rationnelle


suivante :
h+2
G (h) = 4 2 .
h (h + 2h + 3)
On fait la division suivant les puissances croissantes de 2 + h par 3 + 2h + h2 à l’ordre
3 = (4 − 1) :
   
2 1 4 11 10 11
− h − h2 + h3 3 + 2h + h2 − h4

2+h= + h .
3 9 27 81 81 81
Donc,
10 11
2 1 1 1 4 1 11 1 81 + 81 h
G (h) = − − + − .
3 h4 9 h3 27 h2 81 h 3 + 2h + h2
D’où,
10 11
2 1 1 1 4 1 11 1 81 + 81 (X − 1)
G (X) = − − + − .
3 (X − 1) 9 (X − 1) 27 (X − 1) 81 (X − 1) 3 + 2 (X − 1) + (X − 1)2
4 3 2

On a,
10 11 10
81 + 81 (X − 1) 81 + 11
81 (X − 1) β γ
2 = = √ + √ .
3 + 2 (X − 1) + (X − 1) X2 + 2 X −i 2 X +i 2

Or, on remarque que γ = β. D’où,


√  √ 
1 i + 11 2 1 i − 11 2
β=− √ et γ = √ .
81 2 2 81 2 2

Cas de R [X]
P (X)
Soit F (X) = Q(X) ∈ R [X] une fraction rationnelle écrite sous sa forme irréductible
et soit Q (X) unitaire. On suppose
k k  k1 k p
Q (X) = (X − a1 ) 1 . . . (X − am ) m X 2 + α1 X + β1 . . . X 2 + α p X + βp .
z }| { z }| {
∆<0 ∆<0
Théorème 9.2.2 La décomposition en éléments simples de F (X) est :
kr
m X p X lu
X λr,s X γu,v X + δu,v
F (X) = E (X) + s + 2 v.
z }| { r=1 s=1
(X − ar ) u=1 v=1
(X + αu X + βu )
Partie entière z }| { z }| {
Termes de Termes de
de F (X)
première espèce deuxième espèce

Exemple 9.2.2 Soit à décomposer la fraction rationnelle à coefficients réels suivante :


P (X)
F (X) = q.
X p (aX 2 + bX + c)
(Il n’y a pas de E (X) c’est à dire :deg P < p + 2q).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 183 — #193


i i

9.2 Fractions rationnelles 183

– 1er cas : p > 0 et q = 1


On a une décomposition en éléments simples en faisant une division suivant les
puissances croissantes de P par c + bX + aX 2 à l’ordre (p − 1) .

S = 0 ou
P (X) = S (X) c + bX + aX 2 + X p R (X) avec

deg S < p.

Donc,
S (X) R (X)
F (X) = + .
Xp aX 2 + bX + c
Exemple 9.2.3 Décomposition de F (X) = X 3X+1 (X 2 +1) , p = 3 et q = 1. En effectuant

la division suivant les puissances croissantes de (1 + X) et 1 + X 2 à l’ordre 2,
on obtient,

1 + X = 1 + X − X 2 1 + X 2 + X 3 (−1 + X) .
 

D’où,
X +1 1 1 1 X −1
F (X) = = 3+ 2− + 2 .
X3 2
(X + 1) X X X X +1
– 2ème cas : p = 0 et q ≥ 1

b2 − 4ac < 0

P (X)
F (X) = q avec
(aX 2 + bX + c) deg P < 2q.
La décomposition en éléments simples de F (X) est la suivante :
q
X α i X + βi
F (X) = i
.
i=1 (aX 2 + bX + c)

(i) Si deg P ≤ 1 alors la décomposition est déja donnée

αX + β
F (X) = q.
(aX 2 + bX + c)

(ii) Si deg P ≥ 2. On fait la division euclidienne de P (X) par aX 2 + bX + c :



R (X) = 0 ou
P (X) = aX 2 + bX + c T (X) + R (X) avec

deg R < 2.

On obtient :
T (X) R (X)
F (X) = q−1 + q.
(aX 2 + bX + c) (aX 2 + bX + c)
z }| { z }| {
On refait le même travail Un élément du
que précédemment second espèce

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 184 — #194


i i

184 Chapitre 9. Polynômes et fractions rationnelles

– 3ème cas : p > 0 et q > 0


b2 − 4ac < 0

P (X)
F (X) = p q avec
X (aX 2 + bX + c) deg P < p + 2q.
Dans ce càs, on fait la division suivant les puissances croissantes de P (X) par
aX 2 + bX + c à l’ordre (p − 1) .

S (X) = 0
P (X) = aX 2 + bX + c S (X) + X p R (X) avec

deg S < p.
On remplace P (X) par sa valeur, on obtient :
S (X) R (X)
F (X) = q−1 + q .
X p (aX 2 + bX + c) (aX 2 + bX + c)
z }| { z }| {
q est remplacé par (q − 1) C’est la càs p = 0 et q ≥ 1

Exemple 9.2.4 Décomposer en éléments simples dans R [X] la fraction rationnelle :


X
F (X) = 2 2
(X − 1) (X 2 + X + 1)
α1 α2 a1 X + b1 a2 X + b2
= + + 2 + .
X − 1 (X − 1)2 X + X + 1 (X 2 + X + 1)2
Posons h = x − 1
1+h
F (h) = 2 (p = q = 2) .
h2 (h2 + 3h + 3)

La division suivant les puissances croissantes de (1 + h) par 3 + 3h + h2 à
l’ordre 1 :
1  h2
1+h= 3 + 3h + h2 − .
3 3
D’où,
1 1 1 1
F (h) = − .
3 h (3 + 3h + h2 )
2 3 (3 + 3h + h2 )2
z }| { z }| {
(p = 2, q = 1) Un terme de la
décomposition

La division suivant les puissances croissantes de 1 par 3 + 3h + h2 à l’ordre 1 :
1 h2
1 = 3 + 3h + h2 (1 − h) − (2 + h)
3 3
D’où,
1 1 (1 − h) 1 (2 + h)
= +
h2 (3 + 3h + h2 ) 3 h2 3 (3 + 3h + h2 )
1 1 11 1 (2 + h)
= − + .
3 h2 3 h 3 (3 + 3h + h2 )

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 185 — #195


i i

9.3 Exercices 185

Conclusion,
1 1 1 1 1 1+X 1 1
F (X) = − + 2 + 2
− 2
9 (X − 1) 9 (X − 1) 9X +X +1 3X +X +1

9.3 Exercices
9.3.1 Enoncés
Exercice 1 :
Déterminer les zéros du polynôme P (X) = X 3 + 5X 2 − 8X − 48, sachant qu’il
admet deux zéros distincts dont la somme est égale à −1.
Exercice 2 :
On considère le polynôme P (X) = X 4 − 9X 3 + 30X 2 − 44X + 24 et un polynôme
Q (X) = a0 + a1 X + · · · + an X n .
1. En notant que 2 est un zéro de P, déterminer les zéros de P avec leur ordre de
multiplicité.
2. Donner une condition nécessaire et suffisante portant sur les zéros de P pour
que Q soit multiple de P.
Exercice 3 :
Soit P (X) = X 3 − 3X + 2.
Calculer PGCD(P, P 0 ) , où P 0 est le polynôme dérivé de P.
En déduire une factorisation de P sur R [X] .
Exercice 4 :
Montrer que le polynôme Pn (X) = nX n+1 − (n − 1) X n + 1 est divisible par
2
(X − 1) et déterminer le quotient.
Exercice 5 :
Factoriser sur C [X] puis qur R [X] le polynôme X 5 − 1. En déduire que
 π   


4 3 2 2 2
X + X + X + X + 1 = X + 2 cos X +1 X − 2 cos X +1 .
5 5
Exercice 6 :
Soit Pn (X) = X n+2 − X n − 2X + 2.
2
1. Montrer que Pn est divisible par (X − 1) .
2. Calculer Pn+1 − Pn et en déduire Qn+1 − Qn .
Exercice 7 :
Déterminer le reste de la division euclidienne de
n
P (X) = 2X 2n + (X + 1) + 3 par X (X + 1) .
Exercice 8 :
Déterminer un polynôme de degré 3 tel que
P (X + 1) − P (X − 1) = X 2 + 1.
Exercice 9 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 186 — #196


i i

186 Chapitre 9. Polynômes et fractions rationnelles

1. Décomposer en facteurs irréductibles dans R [X] le polynôme suivant :

P (X) = X 8 + X 4 + 1.
1
2. Décomposer en éléments simples dans R [X] la fraction rationnelle P (X) .

Exercice 10 :
Décomposer dans R [X] en éléments simples les fractions suivantes :
1 X 2 +2X+5 2X 3 +X+1
(a) (X+1)(X+2) (b) X 2 −3X+2 (c) X 2 (X−1)2
X 2 +1 X 6 +2 1
(d) (X 2 −1)(X 2 +X+1) (e) (X−1)(X 2 +1)2
(f ) (X+1)3 (X 2 +X+1)

Exercice 11 :
Décomposer dans C [X] et puis dans R [X] les fractions suivantes :

(a) 1
X 2n −1 , n ∈ N∗ (b) 1
X 2n+1 −1 , n ∈ N.

9.3.2 Corrigés
Exercice 1 :
P (X) = X 3 + 5X 2 − 8X − 48 admet deux zéros distincts dont la somme est égale
à −1 c’est à dire
P (X0 ) + P (X1 ) = −1

X03 + 5X02 − 8X0 − 48 + X13 + 5X12 − 8X1 − 48 = −1

X0 X1 = −12.
Ainsi, X0 et X1 sont les solutions de l’équation X 2 + X − 12 = 0 : X0 = −4 et X1 = 3.
Donc,
P (X) = (X − 3) (X + 4) (X − a) , a ∈ C.
En remarquant que 3 × (−4) × a = 48 ⇒ a = −4. D’où,
2
P (X) = (X − 3) (X + 4) .

Exercice 2 :
On considère le polynôme P (X) = X 4 − 9X 3 + 30X 2 − 44X + 24 et un polynôme
Q (X) = a0 + a1 X + · · · + an X n .
000
1. On vérifie facilement que P (2) = P 0 (2) = P 00 (2) = 0 et P (2) 6= 0. Donc, 2 est
une racine de P avec ordre de multiplicité 3. D’où,
3
P (X) = (X − 2) (X − a) , a ∈ C.
3
Puisque, (−2) × a = 24 alors a = 3. Donc,
3
P (X) = (X − 2) (X − 3) et 3 est une racine simple de P.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 187 — #197


i i

9.3 Exercices 187

2. On a Q multiple de P donc il existe S (X) ∈ R [X] tel que

Q (X) = S (X) P (X) .

Or, P (X) divise Q (X) si et seulement si 3 est au moins une racine simple de
Q (X) et 2 est une racine d’ordre supérieur ou égale à 3. En effet, si (X − 3)
3
divise Q (X) et (X − 2) divise Q (X) alors
3
P (X) = (X − 2) (X − 3)

divise Q (X) . Inversement, si Q (X) = S (X) P (X) , on a Q (3) = Q (2) = 0.


Ainsi, Q0 (X) = S 0 (X) P (X) + S (X) P 0 (X) ⇒ Q0 (2) = 0 (car P (2) = P 0 (2) =
0) et Q00 (2) = 0 (car P (2) = P 0 (2) = P 00 (2) = 0). D’où,

Q (2) = Q0 (2) = Q00 (2) = 0 et 2 est une racine d’ordre ≥ 3.

Exercice 3 :
Soit P (X) = X 3 − 3X + 2 ⇒ P 0 (X) = 3X 2 − 3. Ainsi, PGCD(P, P 0 ) = X − 1. De
plus, (X − 1) divise P (X) donc 1 est une racine de P (X) (de même 1 est une racine
de P 0 (X)). Ainsi, 1 est une racine de P (X) d’ordre ≥ 2. On remarque que −2 est une
2
racine de P (X) . Alors, P (X) = (X − 1) (X + 2) . Une factorisation de P sur R [X] .
Exercice 4 :
En effectuant une division euclidienne de Pn (X) = nX n+1 − (n − 1) X n + 1 par
2
(X − 1) , il suffit de montrer par récurrence que pour tout n ∈ N,
2
Pn (X) = (X − 1) nX n−1 + (n − 1) X n−2 + · · · + 1 .


Exercice 5 :
Dans C [X] , résoudre X 5 = 1. Soit X = eiθ , θ ∈ R. e5iθ = 1 = e2ikπ , k ∈ Z. Donc,
θ = 2kπ
5 , k ∈ {0, 1, 2, 3, 4} . D’où,
 2iπ
 8iπ
 4iπ
 6iπ

P (X) = (X − 1) X − e 5 X −e 5 X −e 5 X −e 5 dans C [X] ,

et
P (X) = (X − 1) X 4 + X 3 + X 2 + X + 1 dans R [X] .


On peut déduire alors que


  π  


4 3 2 2 2
X + X + X + X + 1 = X + 2 cos X +1 X − 2 cos X +1 .
5 5
Exercice 6 :
1. On a,
2
P0 (X) = X 2 − 2X + 1 = (X − 1)
et
2
P1 (X) = X 3 − 3X + 2 = (X − 1) (X + 2) .
Pour n ≥ 2, Pn (1) = Pn0 (1) = 0 et Pn00 (1) 6= 0 donc, 1 est une racine double de
2
Pn (X). Ainsi, ∀n ≥ 0, Pn est divisible par (X − 1) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 188 — #198


i i

188 Chapitre 9. Polynômes et fractions rationnelles

2. D’une part,
2
Pn+1 (X) − Pn (X) = X n (X − 1) (X + 1)
2
et d’autre part, Pn+1 (X) − Pn (X) = (X − 1) [Qn+1 (X) − Qn (X)] . Donc,

Qn+1 (X) − Qn (X) = X n (X + 1) .

Exercice 7 :
La division euclidienne de
n
P (X) = 2X 2n + (X + 1) + 3 par X (X + 1)

est donnée par :

P (X) = Q (X) S (X) + R (X) avec deg (R) < deg (Q) = 2.

C’est à dire, deg (R) = 1 ⇒ R (X) = aX + b, a ∈ R et b ∈ R. Donc,

P (X) = Q (X) S (X) + aX + b.

Ainsi, P (0) = b = 4 et P (−1) = −a + 4 = 5. D’où,

R (X) = −X + 4.

Exercice 8 :
Un polynôme de degré 3 : P (X) = aX 3 + bX 2 + cX + d, a 6= 0, b, c, d ∈ R tel que

P (X + 1) − P (X − 1) = X 2 + 1.

En appliquant Taylor au voisinage de X à l’ordre 3 :


1 1 000
P (X + 1) = P (X) + P 0 (X) + P 00 (X) + P (X) ,
2 6
0 1 00 1 000
P (X − 1) = P (X) − P (X) + P (X) − P (X) .
2 6
Ainsi,
1
P (X + 1) − P (X − 1) = 2P 0 (X) + P 000 (X) = X 2 + 1.
3
Or, P 0 (X) = 3aX 2 + 2bX + c, P 00 (X) = 6aX + 2b et P 000 (X) = 6a. Donc,
 1
P (X + 1) − P (X − 1) = 2 3aX 2 + 2bX + c + [6a] = X 2 + 1.

3
Par identification, on a
1 3 1
P (X) = X + X + d, d ∈ R.
6 3
Exercice 9 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 189 — #199


i i

9.3 Exercices 189


1. On pose Y = X 4 : P (X) = Y 2 + Y + 1 = (Y − j) Y − j avec j = − 12 + i 23 .


Les solutions de Y = X 4 = j et Y = X 4 = j sont données, respectivement :

X 4 − j = (x − j) (x + j) (x + ij) (x − ij) ,
X 4 − j = x − j x + j x + ij x − ij .
   

Ainsi, dans R [X] le polynôme :

P (X) = X 8 + X 4 + 1
 √  √ 
= X2 + X + 1 X2 − X + 1 X2 − X 2 + 3X + 1 .

3X + 1

2. La décomposition en éléments simples dans R [X] de


1 1
= √  √ 
P (X) (X + X + 1) (X − X + 1) X 2 − 3X + 1 X 2 + 3X + 1
2 2

α1 X + β1 α2 X + β2 α3 X + β3 α4 X + β4
= √ + √ + +
X 2 − 3X + 1 X 2 + 3X + 1 X 2 − X + 1 X 2 + X + 1
1

avec αi , βi ∈ R et 1 ≤ i ≤ 4. En multipliant P (X) par X 2 + X + 1 :

X2 + X + 1
 
α1 X + β1 α2 X + β2 α3 X + β3 α4 X + β4
= X2 + X + 1

√ + √ + 2 + 2
P (X) X 2 − 3X + 1 X 2 + 3X + 1 X − X + 1 X + X + 1
 
α1 X + β1 α2 X + β2 α3 X + β3
= X2 + X + 1

√ + √ + 2 + α4 X + β4 .
X 2 − 3X + 1 X 2 + 3X + 1 X − X + 1
1 1 1
Pour X = j, α4 j + β4 = 4 ⇒ α4 = 0 et β4 = 4. En multipliant P (X) par

X2 − X + 1 :

X2 − X + 1
 
2
 α1 X + β1 α2 X + β2 α3 X + β3 α4 X + β4
= X −X +1 √ + √ + +
P (X) X 2 − 3X + 1 X 2 + 3X + 1 X 2 − X + 1 X 2 + X + 1
 
α1 X + β1 α2 X + β2 α4 X + β4
= X2 − X + 1

√ + √ + 2 + α3 X + β3 .
2 2
X − 3X + 1 X + 3X + 1 X +X +1
1
Pour X = −j, −α3 j + β3 = 4 ⇒ α3 = 0 et β3 = 41 . De la même façon, on a
1
√ 1 1
√ 1
1 1 6 3X + 4 6 3X − 4 1
= + √ − √ + .
P (X) 4 (X − X + 1) X 2 + 3X + 1 X 2 − 3X + 1 4 (X 2 + X + 1)
2

Exercice 10 :
1 1 1
(a) = − .
(X + 1) (X + 2) X +1 X +2

X 2 + 2X + 5 13 8
(b) = − + 1.
X 2 − 3X + 2 X −2 X −1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 190 — #200


i i

190 Chapitre 9. Polynômes et fractions rationnelles

2X 3 + X + 1 4 1 3 1
(c) 2 = 2 − + + 2.
X 2 (X − 1) (X − 1) X −1 X X
2
X2 + 1 X + 13 1 1
(d) = 23 + − .
(X 2 2
− 1) (X + X + 1) X + X + 1 3 (X − 1) X + 1
1 1 7
X6 + 2 2X + 2 4X + 74 3
(e) 2 =X− 2 − + + 1.
(X − 1) (X 2 + 1) (X 2 + 1) X2 +1 4 (X − 1)
1 1 1 1
(f ) 3 = 2 + 3 − .
(X + 1) (X 2 + X + 1) (X + 1) (X + 1) X2 +X +1
Exercice 11 :
1 1 kπ
F (X) = = p−1 où Xk = e2i p .
Xp − 1 Q
(X − Xk )
k=0

Ainsi, dans C [X] ,


p−1
X αk kπ
F (X) = , où Xk = e2i p et αk ∈ C.
X − Xk
k=0

Cherchons αk ? Pourcela, en multipliant F (X) par (X − Xk ) :

lim (X − Xk ) F (X) = αk .
X→Xk

1 P (X)
En posant, F (X) = X p −1 = Q(X) , on a,

P (X)
αk = lim (X − Xk )
X→Xk Q (X)
P (X)
= lim , Q (Xk ) = 0
X→Xk Q(X)
X−Xk
P (X) P (Xk )
= lim = .
X→Xk Q(X)−Q(Xk ) Q0 (Xk )
X−Xk

Ainsi,
P (Xk ) 1 Xk Xk
αk = 0
= p−1 = p = .
Q (Xk ) pXk p Xk p
|{z}
=1

D’où, la décomposition de F dans C [X] est donnée par :


p−1
1 X Xk kπ
F (X) = , où Xk = e2i p .
p X − Xk
k=0

Ainsi, la décomposition de F sur C [X] est indépendante de la paritée de p.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 191 — #201


i i

9.3 Exercices 191

– Sur R [X] , si p = 2n :
n
Xp − 1 = X2 −1
= X − 1 X 2n−2 + X 2n−4 + · · · + X 2 + 1
2
 

= (X − 1) (X + 1) X 2n−2 + X 2n−4 + · · · + X 2 + 1 .


Ainsi,
2n−1
1 X Xk kπ
F (X) = , où Xk = e2i p .
2n X − Xk
k=0
  2n−1
1 1 1 1 X Xk
= − +
2n X − 1 X + 1 2n X − Xk
k=1
k6=n
| {z }
2n−2 termes
  n−1  
1 1 1 1 X Xk Xk
= − + + .
2n X −1 X +1 2n X − Xk X − Xk
k=1

Or,

X cos kπ

Xk Xk 2X Re (Xk ) − 2 4 −1
+ = 2 =2 2 kπ
 .
X − Xk X − Xk X − 2 Re (Xk ) X + 1 X − 2 cos 4 X + 1

D’où,
n−1
X cos kπ

n −1
 
1 1 1 1 1X
(a) 2n = − + .
X 2 − 2 cos kπ

X −1 2n X −1 X +1 n n X +1
k=1

– Sur R [X] , si p = 2n + 1 :
n
X cos kπ

1 1 1 1X n −1
(b) 2n+1 = + .
X 2 − 2 cos kπ

X −1 2n X − 1 n n X +1
k=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 192 — #202


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 193 — #203


i i

CHAPITRE 10

Applications bilinéaires et formes quadratiques

10.1 Applications bilinéaires


Défnition 10.1.1 Soit K = R ou C. Soient E et F deux espaces vectoriels sur K. Une
application bilinéaire est l’analogue à deux variables d’une application linéaire.
Il nous faut donc trois espaces vectoriels sur K : E, F et G, et l’application
f : E × F → G est K-bilinéaire, si les égalités suivantes sont vériées pour toutes
valeurs de x, x0 ∈ E, y, y 0 ∈ F, λ ∈ K :
f (x + x0 , y) = f (x, y) + f (x0 , y)
f (λx, y) = λf (x, y)
f (x, y + y 0 ) = f (x, y) + f (x, y 0 )
f (x, λy) = λf (x, y) .
C’est à dire, en disant que f est bilinéaire si elle est linéaire par rapport à
chacune de ses deux variables.
Remarque 10.1.1
– Dans le cas où G est identique à K, on dit que f est une forme bilinéaire.
– L’ensemble des applications K-bilinéaires de E × F vers G est noté LK (E, F, G).
C’est un espace vectoriel sur K. En effet, il est clair que les axiomes des espaces
vectoriels sont vérifiés.
– Si E = F et si de plus l’application bilinéaire f : E × F → G vérifie :
∀x, y ∈ E : f (x, y) = f (y, x) ,
elle est dite symétrique. Elle est dite antisymétrique si elle vérifie :
∀x, y ∈ E : f (x, y) = −f (y, x) .
Exemple 10.1.1 Sur Rn , le produit scalaire usuel :
Rn × Rn → R
(x, y) 7−→ x.y
défini par ((x1 , . . . , xn ) , (y1 , . . . , yn )) 7−→ x1 y1 , . . . , yn yn , est une forme bili-
néaire.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 194 — #204


i i

194 Chapitre 10. Applications bilinéaires et formes quadratiques

10.1.1 Le dual d’un espace vectoriel


Définition 10.1.2 Soit E un espace vectoriel sur K. L’espace vectoriel LK (E, K) des
applications K-linéaires de E vers K, est appelé le dual de E, et noté E ∗ . Les
éléments de E sont donc les formes linéaires sur E.
Si E est de dimension finie n, et si B = (e1 , . . . , en ) est une base de E, tout vecteur
x de E s’écrit d’une façon unique sous la forme :

x = a1 e1 + · · · + an en ,

où a1 , . . . , an sont les coordonnées de x dans la base B. L’application qui a tout vecteur


x associe sa i-ème coordonnée (relativement à la base B) est notée e∗i et appelée la
i-ème projection relativement à la base B. On a donc : e∗i (x) = ai .
Notons par e∗1 , . . . , e∗n des formes linéaires sur E (des éléments de E ∗ ). Si l : E → K
est un élément quelconque de E, on peut écrire :

l (x) = l (a1 e1 + · · · + an en )
= a1 l (e1 ) + · · · + an l (en )
= e∗1 (x) l (e1 ) + · · · + e∗n (x) l (en ) .

Ainsi, l = l (e1 ) e∗1 + · · · + l (en ) e∗n ∈ E ∗ , donc (e∗1 , . . . , e∗n ) est un système générateur
de E ∗ . De plus, on vérifie facilement que (e∗1 , . . . , e∗n ) est un système libre de E ∗ . D’où,
(e∗1 , . . . , e∗n ) est une base de E ∗ , qu’on appelle la base duale de B et qu’on note B ∗ .
Remarque 10.1.2 Si E est un espace vectoriel de dimension finie n, son dual E ∗ est
de la même dimension n. On retiendra qu’on a les relations suivantes :

∗ 1 si i = j
ei (ej ) = δij =
0 sinon

10.1.2 Représentation d’une forme bilinéaire symétrique par une matrice


On suppose E de dimension finie n. Soit B = (e1 , . . . , en ) est une base de E. Soit f
une forme bilinéaire symétrique sur E × E.
Définition 10.1.3 La matrice MB (f ) de f dans la base B est la matrice symétrique
n×n qui a pour coefficients f (ei , ej )1≤i,j≤n . Si x et y sont des éléments de E dont
les vecteurs colonnes de coordonnées dans la base B sont X et Y respectivement,
on a
f (x, y) = t XMB (f ) Y.
Inversement, si M est une matrice symétrique dans Mn (K) , alors

(x, y) 7→t XM Y

est bien une forme bilinéaire symétrique.


Exemple 10.1.2  
3 2
2 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 195 — #205


i i

10.1 Applications bilinéaires 195

est la matrice (dans la base canonique) de la forme bilinéaire symétrique


   
x1 y1
, 7→ 3x1 y1 + x2 y2 + 2x1 y2 + 2x2 y1 .
x2 y2

Proposition 10.1.1 Soit B 0 une autre base de E et P la matrice de changement de


base de B à B 0 . La matrice de la forme bilinéaire symétrique dans la nouvelle
base B 0 est
MB0 (f ) = t P MB (f ) P.

10.1.3 Forme bilinéaire et dualité

Soit f : E × E → K une forme bilinéaire symétrique. Pour tout x ∈ E, l’application

f (., x) : E → K
y 7−→ f (y, x)

est une forme linéaire sur K, c’est à dire un élément du dual E ∗ .

Proposition 10.1.2 L’application

ϕf : E → E∗
x 7−→ f (., x)

est linéaire. On appelle ϕf l’application linéaire de E dans son dual associée à


la forme bilinéaire symétrique f . Si E est de dimension finie et B est une base
de E, alors la matrice de f dans E est égale à la matrice de ϕf : E → E ∗ où E
est muni de la base B et E ∗ de la base duale B ∗ .
Définition 10.1.4 Le noyau de la forme bilinéaire symétrique f , noté ker f est le
noyau de ϕf , c’est à dire :

ker f = {x ∈ E / ∀y ∈ E : f (y, x) = 0} .

La forme bilinéaire symétrique f est dite non dégénérée quand son noyau est
réduit à {0}. Si E est de dimension finie, le rang de f est le rang de l’application
ϕf ,
c’est à dire aussi le rang de la matrice de f dans une base de E.
Remarque 10.1.3 En dimension finie, une forme bilinéaire symétrique f sur E × E
est donc non dégénérée si et seulement si sa matrice dans une base de E est
inversible.
Proposition 10.1.3 Soit f une forme bilinéaire symétrique non dégénérée sur E × E,
où E est de dimension finie. Alors, pour toute forme linéaire l ∈ E ∗ , il existe un
unique x ∈ E tel que
∀y ∈ E, l (y) = f (y, x) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 196 — #206


i i

196 Chapitre 10. Applications bilinéaires et formes quadratiques

10.1.4 Orthogonalité
Dans ce paragraphe, f est une forme bilinaire symétrique sur E × E.
Définition 10.1.5 Soit F un sous-espace vectoriel de E. L’orthogonal de F pour f
est le sous-espace de E défini par
F ⊥ = {x ∈ E / ∀y ∈ F : f (y, x) = 0} .
Exemple 10.1.3 Dans R3 muni d’un produit scalaire, l’orthogonal d’une droite
vectorielle D est bien le plan vectoriel orthogonal (au sens usuel) à D.
Théorème 10.1.1 On suppose E de dimension finie n.
1. Si f est non dégénérée, alors dim F ⊥ = n − dim (F ) .


2. En général dim F ⊥ = n − dim (F ) + dim (F ∩ ker (f )) .



⊥
Proposition 10.1.4 On a toujours F ⊂ F ⊥ . Si E est de dimension finie et f
⊥
non dégénérée, on a F = F ⊥ .

10.2 Formes quadratiques


Soit E un espace vectoriel sur K = R.
Définition 10.2.1 Une application q : E → K est appelée forme quadratique sur E
s’il existe une forme bilinéaire symétrique f sur E × E telle que
∀x ∈ E, q (x) = f (x, x) .
La forme quadratique q est dite associée à la forme bilinéaire symétrique f .
Proposition 10.2.1 Si q est une forme quadratique sur E, alors il existe une unique
forme bilinéaire symétrique f sur E × E telle que q soit associée à f . On l’appelle
la forme polaire de q, et elle est définie par
1
f (x, y) = (q (x + y) − q (x) − q (y)) .
2
Si E est de dimension finie et B une base de E, la matrice M de la forme quadratique
q dans la base B est la matrice de sa forme polaire. La forme quadratique s’exprime alors
matriciellement comme q(x) = t XM X, où X est le vecteur colonne des coordonnées
de X dans B.
Une forme quadratique q s’exprime comme un polynôme homogène du second degré
en fonction des coordonnées (x1 , ..., xn ) : c’est une somme de monômes en x2i ou xi xj .
Par exemple, la forme quadratique q(x1 , x2 , x3 ) = x21 + 7x22 + 6x1 x2 − 2x1 x3 + 8x2 x3
a pour matrice  
1 3 −1
 3 7 4 .
−1 4 0
Une forme quadratique q est dite non dégénérée quand sa forme polaire l’est. On
définit le noyau et le rang d’une forme quadratique comme ceux de sa forme polaire. De
même, l’orthogonal d’un sous-espace pour une forme quadratique est son orthogonal
pour la forme polaire.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 197 — #207


i i

10.2 Formes quadratiques 197

Définition 10.2.2 Un élément x de E est dit isotrope pour la forme quadratique q


quand q(x) = 0.
Proposition 10.2.2 Soit q une forme quadratique sur E. Si x est un élément non

isotrope de E, alors hxi est un hyperplan de E supplémentaire de hxi.

10.2.1 Base orthogonale, décomposition en carrés


Définition 10.2.3 Soit q une forme quadratique sur un espace vectoriel E de di-
mension finie n, et soit f sa forme polaire. Une base (e1 , ..., en ) de E est dite
orthogonale (pour q) quand f (ei , ej ) = 0 pour tout couple (i, j) avec i 6= j.
Autrement dit, une base est orthogonale pour q quand la matrice de q dans cette
base est diagonale.
Théorème 10.2.1 Toute forme quadratique sur un espace vectoriel de dimension
finie admet des bases orthogonales.
Le carré d’une forme linéaire est une forme quadratique. Le théorème suivant
permet de décomposer n’importe quelle forme quadratique sur un espace vectoriel de
dimension finie en carrés de formes linéaires.
Théorème 10.2.2 (Décomposition en carrés) : Soit q une forme quadratique sur
un espace vectoriel E de dimension finie n. Alors il existe des formes linéaires
linéairement indépendantes l1 , ..., lr ∈ E ∗ et des constantes non nulles c1 , ..., cr ∈
K telles que
q = c1 l12 + · · · + cr lr2 .
Dans toute décomposition de ce type (avec les li linéairement indépendantes), le
nombre r de formes linéaires est égal au rang de q.
Le théorème de décomposition en carrés est une conséquence du théorème d’exis-
tence de bases orthogonales. Mais on l’obtient aussi de manière algorithmique, au
moyen de l’algorithme de Gauss. Cet algorithme, étant donné une forme quadratique
q(x1 , ..., xn ) en n variables, produit une décomposition en carrés. Il procède par ré-
currence sur le nombre de variables. Pour éliminer les variables, on distingue deux
cas :
1. La forme quadratique q contient le carré d’une variable. On peut supposer qu’il
s’agit de x21 , et q peut alors s’écrire
q(x1, ..., xn) = cx21 + x1 l(x2 , ..., xn ) + r(x2 , ..., xn ),
où c est une constante non nulle, l une forme linéaire et r une forme quadratique.
On complète alors le carré en
 2
1 1
q = c x1 + l + r − l 2 .
2c c
1
On a bien que x1 + 2c l(x2 , ..., xn ) est une forme linéaire, et
1
q 0 (x2 , ..., xn ) = r(x2 , ..., xn ) − l(x2 , ..., xn )2
c
est une forme quadratique qui ne dépend plus de la variable x1 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 198 — #208


i i

198 Chapitre 10. Applications bilinéaires et formes quadratiques

2. La forme quadratique q ne contient aucun carré de variable. Si elle est non nulle,
elle contient au moins un produit de variables xi xj . On peut supposer qu’il
s’agit de x1 x2 , et alors q peut s’écrire
q(x1 , ..., xn ) = cx1 x2 + x1 l(x3 , ..., xn ) + x2 m(x3 , ..., xn )r(x3 , ..., xn ),
où c est une constante non nulle, l et m des formes linéaires et r une forme
quadratique. On complète le produit en
  
1 1 1
q = c x1 + m x2 + l + r − lm.
c c c
On transforme le produit des formes linéaires k1 = x1 + 1c m et k2 = x2 + 1c l
1h 2 2
i
k1 k2 = (k1 + k2 ) − (k1 − k2 ) ,
4
qui est une combinaison linéaire des carrés de formes linéaires k1 + k2 et k1 − k2 .
Il reste après la forme quadratique
1
q 0 (x3 , ..., xn ) = r(x3 , ..., xn ) − l(x3 , ..., xn )m(x3 , ..., xn ),
c
qui ne dépend plus des variables x1 et x2 .
L’algorithme de Gauss produit une décomposition en carrés
q = c1 l12 + · · · + cr lr2
avec c1 , ..., cr éléments non nuls de K et l1 , ..., lr des formes linéaires linéairement
indépendantes sur Kn . On peut alors compléter cette famille libre en une base
(l1 , ..., lr , lr+1 , ..., ln ) de (Kn )∗ . La base duale (e1 , ..., en ) de Kn sera une base or-
thogonale pour q, dans laquelle la matrice de q est diagonale avec c1 , ..., cr , 0, ..., 0
comme coefficients diagonaux.
Ainsi, la méthode de Gauss nous montre que toute forme quadratique est diagona-
lisable.

10.2.2 Signature d’une forme quadratique


Définition 10.2.4 Une forme quadratique q sur un espace vectoriel réel E est dite
définie positive (resp. négative) quand, pour tout x ∈ E non nul, on a q(x) > 0
(resp. q(x) < 0).
Définition 10.2.5 Soit E un espace vectoriel de dimension n sur R, et q une forme
quadratique sur E et B une base de E orthogonale pour q. Soit
 
a1 0
 .. 
 . 
0 an
la matrice de q dans B. Soit s le nombre d’indices i tels que ai > 0, t le nombre
d’indices i tels que ai < 0. Alors le couple (s, t) ne dépend pas du choix de la
base orthogonale. On l’appelle la signature de la forme quadratique q.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 199 — #209


i i

10.3 Exercices 199

L’entier s (resp. t) de la signature est le maximum des dimensions des sous-espaces


de E sur lesquels la restriction de q est définie positive (resp. négative). La somme
s + t est le rang de q.
L’algorithme de décomposition en carrés de Gauss fournit un moyen de calculer la
signature : si
X r
q= ci li2
i=1

où les li sont des formes linéaires linéairement indépendantes, alors s (resp. t) est le
nombre de coefficients ci positifs (négatifs).
Proposition 10.2.3 Soit q une forme quadratique de signature (s, t) sur un R-espace
vectoriel E de dimension n. Alors il existe une base de E dans laquelle la matrice
de q est  r s

z }| { z }| {
 1 
 

 . .. 0


 

 1 

 −1 
.
 

 . .. 
 

 −1 


 0 


0 . .

 . 
0
Définition 10.2.6 Deux matrices A et B de Mn (R) sont dites congruentes quand il
existe une matrice P inversible dans Mn (R) telle que B = t P AP.
Théorème 10.2.3 Deux matrices symétriques réelles sont congruentes sur R si et
seulement si elles ont même signature.

10.3 Exercices
10.3.1 Enoncés
Exercice 1 :
On considère l’application :

b : M2 (R) × M2 (R) −→ R

définie par :
b (A, B) = T r (A) T r (B) .
1. Montrer que b est une forme bilinéaire symétrique.
2. On note :
        
1 0 0 1 0 0 0 0
B = E11 = , E12 = , E21 = , E22 = .
0 0 0 0 1 0 0 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 200 — #210


i i

200 Chapitre 10. Applications bilinéaires et formes quadratiques

Vérifier que B est une base de M2 (R) . Ecrire la matrice S de b dans cette base
et calculer son déterminant.
3. La forme bilinéaire symétrique b est-elle non dégénérée ?
Exercice 2 :
Soit E l’espace vectoriel des polynômes sur R de degré ≤ 2. Pour (f, g) ∈ E × E,
on pose : Z 1
σ (f, g) = f (t) g (t) dt.
0
1. Montrer que σ est une forme bilinéaire symétrique sur E.
2. Trouver une base du sous-espace F orthogonal à h (t) = 2t + 1.
Exercice 3 :
Soit
b : Mn (R) × Mn (R) −→ R
l’application définie par :
b (A, B) = T r (AB) .
1. Montrer que b est une forme bilinéaire symétrique.
2. Montrer que si A est une matrice symétrique non nulle alors

b (A, A) > 0.

3. Montrer que si A est une matrice antisymétrique non nulle alors

b (A, A) < 0.

4. Quelle est la signature de b.


Exercice 4 :
Soit E un espace vectoriel réel de dimension 4 de base B = {e1 , e2 , e3 , e4 } et soit q
la forme quadratique définie par :

q (X) = 4xy + 6z 2 + 6zt + 2t2 ; X = (x, y, z, t) ∈ E.

1. Définir la forme polaire f associée à q.


2. Ecrire la matrice de f dans la base B.
3. f est-elle dégénérée ?
4. Soit P = he1 , e2 i . Déterminer P ⊥ .
Exercice 5 :
Soit C une constante réelle strictement positive. On munit l’espace vectoriel Rn ,
rapporté à sa base canonique, de la forme bilinéaire de Lorentz définie par :

b (v, w) = xx0 + yy 0 + zz 0 − c2 tt0 où v = (x, y, z, t) et w = (x0 , y 0 , z 0 , t0 ) .

On note Q la forme quadratique associée à b. On dit qu’un vecteur v est Temporel si


Q (v) < 0. On dit qu’un vecteur v est Spatial si Q (v) > 0.
Dans tout l’exercice, on fixe une fois pour toute, un vecteur Temporel u = (x, y, z, t) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 201 — #211


i i

10.3 Exercices 201

1. Soit w = (x0 , y 0 , z 0 , t0 ) un vecteur non nul orthogonal à u.


(a) Montrer que l’on a alors :
2  2 2 2

c4 t2 (t0 ) ≤ x2 + y 2 + z 2 (x0 ) + (y 0 ) + (z 0 ) .

(b) En déduire que w est un vecteur Spatial.


(c) Montrer que pour tout vecteur v, il existe un unique λ ∈ R, tel que
w = v − λu soit orthogonal à u.
(d) En déduire que pour tout v ∈ R4 , on a :
2
Q (u) Q (v) ≤ (b (u, v)) .

2. Pour v et w appartenant à R4 , on pose :

b0 (u, w) = b (v, w) + 2b (u, v) b (v, w) .

(a) Vérifier que b0 est une forme bilinéaire symétrique.


(b) On note Q0 la forme quadratique associée à b0 . Montrer que si Q0 est définie
positive, on a : Q (u) < − 21 .
(c) Réciproquement, montrer que si Q (u) < − 12 alors Q0 est définie positive.
(on utilise la question 1.(a) et 1.(d)).
Exercice 6 :
Soit l’application

q : Mn,1 (R) −→ R
t ; M ∈ Mn (R) .
X 7−→ XM X

1. Montrer que q est une forme quadratique sur Mn,1 (R) .


2. Donner la forme polaire ϕ associée à q.
3. Montrer que q = 0 ⇐⇒ M est une matrice antisymétrique.
Exercice 7 :
Soit f une forme bilinéaire dont la matrice relativement à la base canonique de R3
est :  
1 2 3
A= 2 3 4 .
3 4 5
1. Déterminer ker f ; f admet-elle des vecteurs isotropes ?
2. Soit q la forme quadratique définie par :

q (X) = x21 − 2x3 x2 − 2x1 x3 .

q est-elle dégénérée ? admet-elle des vecteurs isotropes ?

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 202 — #212


i i

202 Chapitre 10. Applications bilinéaires et formes quadratiques

10.3.2 Corrigés
Exercice 1 :
On considère l’application :

b : M2 (R) × M2 (R) −→ R

définie par :
b (A, B) = T r (A) T r (B) .
1. Soient A ∈ M2 (R) , A ∈ M2 (R), B ∈ M2 (R), λ ∈ R et λ0 ∈ R. On a
0

b (λA + λ0 A0 , B) = tr (λA + λ0 A0 ) tr (B)


= [λtr (A) + λ0 tr (A0 )] tr (B) (car tr est une forme linéaire sur M2 (R))
= λtr (A) tr (B) + λ0 tr (A0 ) tr (B)
= λb (A, B) + λ0 b (A0 , B) .

Donc, b est linéaire par rapport à la première variable. Soient A ∈ M2 (R) ,


B ∈ M2 (R), B 0 ∈ M2 (R), µ ∈ R et µ0 ∈ R. On a

b (A, µB + µ0 B 0 ) = tr (A) tr (µB + µ0 B 0 )


= tr (A) [µtr (B) + µ0 tr (B 0 )] (car tr est une forme linéaire sur M2 (R))
= µb (A, B) + µ0 b (A, B 0 ) .

Donc, b est linéaire par rapport à la deuxième variable. Ainsi, b est une forme
bilinéaire. De plus, Soient A ∈ M2 (R) et B ∈ M2 (R) , on a

tr (A) tr (B) = tr (B) tr (A)

donc b est symétrique. D’où, b est une forme bilinéaire symétrique.


2. On note :
        
1 0 0 1 0 0 0 0
B = E11 = , E12 = , E21 = , E22 = .
0 0 0 0 1 0 0 1

On vérifie facilement que B est libre et que rg (B) = 4 = dim M2 (R) donc B est
une base de M2 (R) . Soit
 
b (E11 , E11 ) b (E11 , E12 ) b (E11 , E21 ) b (E11 , E22 )
 b (E12 , E11 ) b (E12 , E12 ) b (E12 , E21 ) b (E12 , E22 ) 
S = M (b, B) =   b (E13 , E11 ) b (E21 , E12 ) b (E21 , E21 ) b (E21 , E22 )
.

b (E14 , E11 ) b (E22 , E12 ) b (E22 , E21 ) b (E22 , E22 )

Ainsi,  
1 0 0 1
 0 0 0 0 
S=
 0

0 0 0 
1 0 0 1
et det (S) = 0.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 203 — #213


i i

10.3 Exercices 203

3. Puisque det (S) = 0 donc la forme bilinéaire symétrique b dégénérée.


Exercice 2 :
Soit E l’espace vectoriel des polynômes sur R de degré ≤ 2. Pour (f, g) ∈ E × E,
on pose : Z 1
σ (f, g) = f (t) g (t) dt.
0
1. Soient f ∈ E, f 0 ∈ E, g ∈ E, λ ∈ R et λ0 ∈ R. On a
Z 1
σ (λf + λ0 f 0 , g) = (λf + λ0 f 0 ) (t) g (t) dt
0
Z 1 Z 1
= λf (t) g (t) dt + λ0 f 0 (t) g (t) dt
0 0
Z 1 Z 1
0
=λ f (t) g (t) dt + λ f 0 (t) g (t) dt
0 0
= λσ (f, g) + λ0 σ (f 0 , g) .
Donc, σ est linéaire par rapport à la première variable. Puisque σ est symétrique
donc σ est linéaire par rapport à la deuxième variable. Ainsi, σ est une forme
bilinéaire symétrique sur E.
2. On a

F = hhi = {f ∈ F / σ (f, h) = 0} ,
et dim F = 2. σ est non dégénérée donc
dim F = dim E − dim F ⊥ = 3 − 1 = 2.
Soit f ∈ F alors il existe un unique (a, b, c) ∈ R3 / f (t) = at2 + bt + c. On a,
Z 1
σ (f, h) = 0 ⇐⇒ f (t) h (t) dt = 0.
0

Soit
Z 1
at2 + bt + c (2t + 1) dt

I=
0
10a + 14b + 24c
= .
12
Ainsi,
F = at2 + bt + c / 5a + 7b + 12c = 0

 
b  c
= − 7t2 − 5t − 12t2 − 5 / b, c ∈ R .

5 5
Posons f1 (t) = 7t2 − 5t et f2 (t) = 12t2 − 5. On a alors {f1 , f2 } est un système
générateur de F,
F = hf1 , f2 i et dim F = 2
D’où, {f1 , f2 } est une base du sous-espace F orthogonal à h (t) = 2t + 1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 204 — #214


i i

204 Chapitre 10. Applications bilinéaires et formes quadratiques

Exercice 3 :

1. Soient A ∈ Mn (R) , A0 ∈ Mn (R), B ∈ Mn (R), λ ∈ R et λ0 ∈ R. On a

b (λA + λ0 A0 , B) = tr ((λA + λ0 A0 ) B)
= λtr (AB) + λ0 tr (A0 B) (car tr est une forme linéaire sur M2 (R))
= λb (A, B) + λ0 b (A0 , B) .

Donc, b est linéaire par rapport à la première variable. Puisque b est symétrique
(pour tout A ∈ Mn (R), B ∈ Mn (R) , tr (AB) = tr (BA)) donc b est linéaire
par rapport à la deuxième variable. D’où, b est une forme bilinéaire symétrique.
2. Soit q une forme quadratique associée à b. On a q (A) = b (A, A) , pour tout
A ∈ Mn (R) . Soit A une matrice symétrique
 non nulle, montrons que b (A, A) =
q (A) > 0. En effet, q (A) = tr A2 et A = AT donc

n
X n
X 2
tr A2 =

aik aki = (aik ) > 0 car A non nulle.
i,k=1 i,k=1

Alors, q (A) > 0 et q est définie positive sur Sn (R) : ensemble des matrices
symétriques d’ordre n.
3. Soit A une matrice antisymétrique non nulle, montrons que b (A, A) < 0. En
effet, q (A) = tr A2 et A = −AT donc

n
X n
X 2
tr A2 =

aik aki = − (aik ) < 0 car A non nulle.
i,k=1 i,k=1

Alors, q (A) < 0 et q est définie négative sur An (R) : ensemble des matrices
antisymétriques d’ordre n.
4. On sait que Mn (R) = Sn (R) ⊕ An (R) et dim Mn (R) = n2 , dim Sn (R) =
n(n+1)
2 et dim An (R) = n(n−1)
2 . Soit A ∈ Sn (R) et B ∈ An (R) , on a

b (A, B) = tr (AB) = tr AT B = tr B T AT = tr (−BA) = −tr (BA) = −tr (AB)


 

=⇒ b (A, B) = 0. Donc, Sn (R) et An (R) sont orthogonaux. n Comme b est uneo


forme bilénaire symétrique sur Sn (R) donc il existe une base u1 , u2 , . . . , u n(n+1)
2
base orthogonale de Sn (R) c’est à dire b (ui , uj ) = 0 ∀i 6= jnet comme b est une o
forme bilénaire symétrique sur An (R) donc il existe une base v1 , v2 , . . . , v n(n−1)
2
base orthogonale de An (R) c’est à dire b (us , ut ) = 0 ∀s 6= t. Alors, il existe une
base
n o
B = u1 , u2 , . . . , u n(n+1) , v1 , v2 , . . . , v n(n−1)
2 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 205 — #215


i i

10.3 Exercices 205

orthogonale de Mn (R) dont la matrice de b dans la base B est donnée par :


 
b (u1 , u1 )
 .. 

 .  


b u n(n+1) , u n(n+1)
 
 
M at (b, B) =  2 2 .

 b (v1 , v1 ) 

 .. 

 .  


b v n(n−1) , v n(n−1)
2 2
 
n(n+1) n(n−1)
Ainsi, la signature de b est égale à : sign (b) = 2 , 2 = sign (q) .
Exercice 4 :
Soit E un espace vectoriel réel de dimension 4 de base B = {e1 , e2 , e3 , e4 } et soit q
la forme quadratique définie par :
q (X) = 4xy + 6z 2 + 6zt + 2t2 ; X = (x, y, z, t) ∈ E.
1. Soient X = (x, y, z, t) ∈ E et Y = (x0 , y 0 , z 0 , t0 ) ∈ E, on a
1
f (X, Y ) = [q (X + Y ) − q (X) − q (Y )]
2
1
= [q (X + Y ) − q (X − Y )]
4
= 2xy 0 + 2x0 y + 6zz 0 + 3zt0 + 3z 0 t + 2tt0
définit la forme polaire associée à q.
2. La matrice de f dans la base B est définie par :
 
0 2 0 0
 2 0 0 0 
A = M (f, B) = 
 0 0

6 3 
0 0 3 2
3. On a det A = −12 6= 0 donc f est non dégénérée.
4. Soit P = he1 , e2 i . On a
P ⊥ = {X ∈ E / f (X, Y ) = 0, ∀Y ∈ P }
= {X = (x, y, z, t) ∈ E / f (X, e1 ) = f (X, e2 ) = 0} .
Soit 
 X = xe1 + ye2 + ze3 + te4
X = (x, y, z, t) ∈ P ⊥ ⇐⇒ X T Ae1 = 0
 T
X Ae2 = 0

2y = 0
⇐⇒ ⇐⇒ x = y = 0.
2x = 0
Ainsi,
P ⊥ = ze3 + te4 / (z, t) ∈ R2 = he3 , e4 i .


i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 206 — #216


i i

206 Chapitre 10. Applications bilinéaires et formes quadratiques

Exercice 5 :
1. Soit w = (x0 , y 0 , z 0 , t0 ) un vecteur non nul orthogonal à u c’est à dire w ⊥ u ⇐⇒
b (u, w) = 0.
(a) On a
Q (u) < 0 ⇐⇒ b (u, u) = 0 ⇐⇒ x2 + y 2 + z 2 < c2 t2 .
De plus,
b (u, w) = 0 ⇐⇒ xx0 + yy 0 + zz 0 = c2 tt0 .
Or,
 2 2 2

x2 + y 2 + z 2 (x0 ) + (y 0 ) + (z 0 ) − (xx0 + yy 0 + zz 0 ) ≥ 0.

D’où,
2  2 2 2

c4 t2 (t0 ) ≤ x2 + y 2 + z 2 (x0 ) + (y 0 ) + (z 0 ) .

(b) En déduire que w est un vecteur Spatial c’est à dire il faut justifier que
Q (w) > 0. En effet,
2 2 2 2
Q (w) = (x0 ) + (y 0 ) + (z 0 ) − c2 (t0 )

et on sait que

x2 + y 2 + z 2 < c2 t2
2  2 2 2

c4 t2 (t0 ) ≤ x2 + y 2 + z 2 (x0 ) + (y 0 ) + (z 0 ) .

Donc,
2 2 2 2
Q (w) = (x0 ) + (y 0 ) + (z 0 ) − c2 (t0 ) > 0.
(c) Montrer que pour tout vecteur V, il existe un unique λ ∈ R, tel que
w = v − λu soit orthogonal à u. En effet, on a

b (u, w) = b (u, v − λu) = 0 = b (u, v) − λb (u, u) .

Donc,
b (u, v) b (u, v)
λ= = car Q (u) 6= 0.
b (u, u) Q (u)
D’où, λ existe et unique.
(d) Si w 6= 0, on a

Q (w) = b (v − λu, v − λu)


= Q (v) − 2λb (u, v) + λ2 Q (u)
 2
b (u, v) b (u, v)
= Q (v) − 2 b (u, v) + Q (u)
Q (u) Q (u)
b2 (u, v)
= Q (v) − > 0 car Q (u) < 0.
Q (u)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 207 — #217


i i

10.3 Exercices 207

Alors,
2
Q (u) Q (v) < (b (u, v)) .
Si w = 0, on a
b2 (u, v)
Q (w) = 0 = Q (v) − .
Q (u)
D’où, pour tout v ∈ R4 , on a :
2
Q (u) Q (v) ≤ (b (u, v)) .

2. Pour v et w appartenant à R4 , on pose :


b0 (u, w) = b (v, w) + 2b (u, v) b (v, w) .
(a) Il est facile de vérifier que b0 est une forme bilinéaire symétrique.
(b) On note Q0 la forme quadratique associée à b0 . Montrer que si Q0 est définie
positive, on a : Q (u) < − 21 . En effet,

Q0 (v) = Q (v) + 2b2 (u, v) .


Pour u = v, on a Q0 (u) = Q (u) + 2Q2 (u) = Q (u) (1 + 2Q (u)) . On sait
que Q0 est définie positive c’est à dire Q0 (u) > 0, ∀u 6= 0. Or,

Q (u) (1 + 2Q (u)) > 0
Q (u) < 0
donc
(1 + 2Q (u)) < 0,
et par la suite
1
Q (u) < − .
2
(c) Réciproquement, montrer que si Q (u) < − 12 alors Q0 est définie positive.
(on utilise la question 1.(a) et 1.(d)). En effet, montrons que
∀v ∈ R4 , v 6= 0, Q0 (v) > 0.
On a, Q0 (v) = Q (v) + 2b2 (u, v) :
– Si Q (v) > 0 alors Q0 (v) > 0.
– Si Q (v) = 0 alors Q0 (v) = 2b2 (u, v) . Ainsi, d’après 1.(a) : b (u, v) 6= 0
et donc Q0 (v) > 0.
– Si Q (v) < 0 alors Q0 (v) = Q (v) + 2b2 (u, v) ≥ Q (v) + 2Q (u) Q (v) .
Donc, Q0 (v) ≥ Q (v) (1 + 2Q (u)) > 0 =⇒ Q0 (v) > 0.
Ainsi, ∀v ∈ R4 , v 6= 0, Q0 (v) > 0.
Exercice 6 :
Soit l’application
q : Mn,1 (R) −→ R
t ; M ∈ Mn (R) .
X 7−→ XM X

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 208 — #218


i i

208 Chapitre 10. Applications bilinéaires et formes quadratiques

1. Soit λ ∈ R, q (λX) = t (λX) M (λX) = λ2 q (X) . Donc q est une forme quadra-
tique sur Mn,1 (R) .
2. Soit X, Y ∈ Mn,1 (R) , la forme polaire ϕ associée à q est donnée par :
1
ϕ (X, Y ) = [q (X + Y ) − q (X) − q (Y )]
2
t
1
= X M + t M Y.

2
1t
3. q (X) = 0, ∀X ∈ Mn,1 (R) ⇐⇒ ϕ (X, X) = 0, ∀X ∈ Mn,1 (R) ⇐⇒ 2 X (M + t M ) X =
0, ∀X ∈ Mn,1 (R) ⇐⇒
∀X ∈ Mn,1 (R) , M = −t M.
D’où, q = 0 ⇐⇒ M est une matrice antisymétrique.
Exercice 7 :
Soit f une forme bilinéaire dont la matrice relativement à la base canonique de R3
est :  
1 2 3
A= 2 3 4 .
3 4 5
1.
ker f = X ∈ R3 / f (X, Y ) = 0, ∀Y ∈ R3 = h(1, −2, 1)i .


On a ker f 6= {0} donc fest dégénérée (nous pouvons


vérifier det A = 0). Puisque
par définition, ker f ⊂ X ∈ R3 / f (X, X) = 0 = ensemble des vecteurs iso-
tropes, de plus, X0 = (1, −2, 1) ∈ ker f alors X0 est un vecteur isotrope.
2. Soit q la forme quadratique définie par :
q (X) = x21 − 2x3 x2 − 2x1 x3 .
Soit la matrice  
1 0 −1
B = M (q, B) =  0 0 −1 
−1 −1 0
associée à q avec B est la base canonique de R3 . On a det A = −1 6= 0, alors q
est non dégénérée. Soit ϕ la forme polaire associé à q. On a
ker ϕ ⊂ X ∈ R3 / ϕ (X, X) = 0 = X ∈ R3 / q (X) = 0 .
 

Existe t-il X0 = (x1 , x2 , x3 ) ∈ R3 / q (X0 ) = 0 ? On a


q (X0 ) = 0 ⇐⇒ x21 − 2x3 x2 − 2x1 x3 = 0 ⇐⇒ x1 (x1 − 2x1 x3 ) − 2x3 x2 = 0.
On pose x2 = 0, on a x1 (x1 − 2x1 x3 ) = 0. Si x1 =6 0, alors x1 = 2x3 . Ainsi,
q (X0 ) = 0 et X0 ∈
/ ker ϕ donc
X ∈ R3 / ϕ (X, X) = 0 .

ker ϕ
Conclusion : ϕ est une forme bilinéaire symétrique non dégénérée et non positive.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 209 — #219


i i

Troisième partie

PROBABILITES

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 210 — #220


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 211 — #221


i i

CHAPITRE 11

Notion de probabilité

Dans ce chapitre, nous allons introduire la notion de probablité et l’analyse combinatoire


qui est nécessaire pour comprendre la résolution de certains problèmes de probabilité.
Ensuite nous allons donner un certain nombres de définitions des termes utilisés
couramment dans le milieu des probabilistes et des statisticiens ; pour finir avec la
notion d’indépendance d’événements qui joue un rôle très important en probabilité et
en statistique.

11.1 Modèle probabiliste

11.1.1 Espace d’épreuves

Jeter un dé ou tirer un carte dans un jeu est une expérience qui représente un
phénomène aléatoire, c’est à dire non déterministe (on ne peut pas déterminer de façon
rigoureuse le résultat de l’expérience qu’on cherche à modéliser). Le résultat d’une
expérience aléatoire est appelé événement noté souvent ω. La notion de probabilité
correspond donc aux "chances" qu’un tel événement se réalise. L’ensemble des n
résultats possibles, appelés événements élémentaires ωi , noté Ω, est appelé "univers"
ou ensemble fondamental ou espace d’épreuves : Ω = {ω1 , ω2 , ω3 , ..., ωn }.
Exemple 11.1.1
Jet d’un dé à six faces numérotées : Ω = {1, 2, 3, 4, 5, 6}
Exemple 11.1.2
On tire une carte dans un jeu de 32 cartes ; l’ensemble fondamental retenu est :
Ω = {coeur, carreau, pique, trèf le}
Chaque ω ∈ Ω représente donc un événement élémentaire et toute partie A ⊂ Ω
sera un événement.
Souvent l’univers Ω est appelé l’ensemble des cas possibles et les événements
élémentaires sont des singletons {ωi } (ensemble réduit à un seul élément).
L’ensemble Ω dépend donc de l’expérience aléatoire considérée, mais aussi de celui
qui construit le modèle.
Exemple 11.1.3

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 212 — #222


i i

212 Chapitre 11. Notion de probabilité

Dans l’expérience de tirage de carte dans un jeu de 32 cartes, on peut choisir


également

Ω = {rouge, noire}
ou Ω = {coeur, carreau, pique, trèf le}
ou Ω = {7, 8, 9, 10, V, D, R, AS}.

Exemple 11.1.4
Jet d’un dé à 6 faces, on peut retenir les univers suivants :

Ω = {pair, impair} ou Ω = {{1, 3, 5} , {2, 4, 6}}


Exemple 11.1.5
Lancement d’une pièce de monnaie jusqu’à obtenir face, l’événement choisit étant
le nombre de jets effectués :

Ω = {1, 2, 3, ..., n, ...} = N∗


C’est un ensemble fini dénombrable.
Exemple 11.1.6
On observe la durée de vie d’une machine :

Ω = [0, +∞[= R+
C’est un ensemble fini non dénombrable.

11.1.2 Algèbre et tribu d’événements


Définition 11.1.2.1
Soit un ensemble Ω composé de différents élèments, alors on peut regrouper ces
différents éléments de plusieurs manières possibles (singletons, couples, triplets, etc.).
Ces parties de l’ensemble Ω forment l’ensemble des parties noté P(Ω). Si A désigne
un événement, on note alors A ⊂ Ω ou A ∈ P(Ω).
Un événement étant un élément de P(Ω) obeit donc à la théorie des ensembles.
Propriétés 11.1.1
P1- Si le résultat ω est observé et ω ∈ A alors l’événement A est réalisé.
P2- Deux événements A et B sont dits identiques si A = B.
P3- L’événement impossible est ∅.
P4- L’événement certain est l’univers Ω.
P5- Un au moins des deux événements A et B est réalisé : A ∪ B.
P6- Les deux événements A et B sont réalisés : A ∩ B.
P7- Deux événements A et B sont incompatibles ou disjoints si A ∩ B = ∅
P8- L’événement contraire (ou complémentaire) de A est A = Ω\A ou Ac
Exemple 11.1.7
Jet d’un dé à 6 faces numérotées de 1 à 6. Soit les événements suivants :
A :"Obtenir un chiffre pair" et B :"Obtenir un chiffre impair".
- L’événement C :"Obtenir le chiffre 7" est un événement impossible = ∅
- L’événement D :"Obtenir un chiffre < 7" est un événement certain = Ω

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 213 — #223


i i

11.1 Modèle probabiliste 213

- L’événement A ∪ B = "Obtenir un chiffre pair ou impair" = Ω =⇒ c’est un


événement certain.
- L’événement A∩B ="Obtenir un chiffre pair et impair" =∅ =⇒ c’est un événement
impossible.
donc les événements A et B sont incompatibles et on a A ∩ B = ∅.
- L’événement A= "Obtenir un chiffre non pair donc impair"=B
Définition 11.1.2
On appelle espace probabilisable, le couple (Ω, P(Ω))
Pour que le résultat des opérations ensemblistes (union, intersection, complémen-
taire) soit encore un événement, il est nécessaire que cette famille d’événement retenue
soit fermée ou stable, vis à vis de ces opérations, c’est à dire qu’il soit bien un élément
de la famille. De plus, les événements "certain", Ω, et "impossible", ∅, doivent également
appartenir à cet ensemble.
Définition 11.1.3.
Soit A un ensemble non vide de parties de Ω, associé à une épreuve aléatoire. Si A
vérifie, les propriétés suivantes :
P1 : pour tout A ∈ A alors A ∈ A
(stable par le complementaire)
P2 : pour tout A ∈ A et tout B ∈ A alors A ∪ B ∈ A
(stable par l’union finie)
alors A est appelé une algèbre de partie de Ω.

On a une définition équivalente de la propriété P2 :


P3 : pour tout A ∈ A et tout B ∈ A alors A ∩ B ∈ A
(stable par l’intersection)
Exemple 11.1.8
L’algèbre la plus élémentaire est réduite à

A = {∅, Ω}

Exemple 11.1.9
A partir d’un événement quelconque A, on peut construire une algèbre définie par :

A = ∅, A, A, Ω
Exemple 11.1.10
Soit Ω = {a, b, c, d}.On peut partitionner cet ensemble en trois ensembles {a} , {b} , {c, d}
afin d’obtenir l’algèbre suivante :

A = {∅, {a} , {b} , {c, d} , {a, b} , {a, c, d} , {b, c, d} , Ω}


avec card(Ω) = 23
Exemple 11.1.11
L’algèbre la plus complète est P (Ω) .
Propriétés 11.1.2 (d’une algèbre)
P1 : La famille étant non vide, on en conclut que :

∅ ∈ A, Ω ∈ A

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 214 — #224


i i

214 Chapitre 11. Notion de probabilité

P2 : Si Aj ∈ A,pour 1 ≤ j ≤ n, on démontre par réccurence que :


n
S
Aj ∈ A
j=1

P3 : Si Aj ∈ A,pour 1 ≤ j ≤ n, on démontre par passage au complémentaire que :


n
T
Aj ∈ A
j=1

Cependant, quelques experience peuvent durer longtemps, comme par exemple le


jet d’un dé jusqu’à l’événement A :"obtenir le chiffre 3".
donc

S
A= An
n=1

Afin d’avoir la stabilité pour l’union dénombrable, la propriété suivante est néces-
saire pour la prochaine définition
P4. : Si An ∈ N,pour n ∈ N, alors :

S
An ∈ A
n=0

Cette propriété permet de confirmer que toute union dénombrable d’événements


est aussi un événement.
Définition 11.1.4.
On appelle une σ-algèbre ou une tribu d’événements, tout ensemble de parties
A vérifiant la stabilité par passage au complémentaire et la stabilité pour l’union
dénombrable.

S
Si pour tout A ∈ A alors A ∈ A et si pour n ∈ N, An ∈ A,alors An ∈ A.
n=0
Le couple formé donc de l’univers Ω et de la tribu d’événements associée A s’appelle
un espace probabilisable. Une application P appelée probabilité sera associée au modèle
(Ω, A) .

11.1.3 Probabilité
Définition 11.1.5
On appelle probabilité P sur (Ω, A) une application P : A −→ [0; 1] telle que :
(i) P (Ω) = 1
(ii) pour toute suite d’événements An , An 6= 0, deux à deux incompatibles, (An ∈ A
avec Am ∩ An = ∅ pour m 6= n) :
∞  ∞
S P
P An = P (An )
n=0 n=0

propriété dite de σ-additivité.


Remarque 11.1.1 : Inégalité de Boole
Pour toute suite d’événements non disjoints, on a :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 215 — #225


i i

11.1 Modèle probabiliste 215

∞ ∞
 
S P
P An ≤ P (An )
n=0 n=0

Une probabilité est donc une application qui a une événement va associer un
nombre. Le triplet (Ω, A, P ) s’apelle un espace probabilisé noté souvent (Ω, P ).
Propriétés 11.1.3 (d’une probabilité)
P1 : La probabilité d’un événement impossible est toujours nulle :

P (∅) = 0
P2 : La probabilité d’un événement certain est toujours égale à 1 :

P (Ω) = 1
P3 : La probabilité de l’événement complémentaire A d’un événement quelconque
A est :

A = Ω\A =⇒ P A = P (Ω) − P (A) = 1 − P (A)
P4 : Si un événement A en implique un autre B, sa probabilité est plus petite :

A ⊂ B =⇒ P (A) ≤ P (B)
P5 : La probabilité de l’union de deux événements A et B est donnée par la formule
de Poincarré :

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P6 : Si deux événements A et B sont disjoints (A ∩ B = ∅) alors

P (A ∪ B) = P (A) + P (B)
Définition 11.1.6
On appelle un système complet d’événements de Ω, une partition finie ou dé-
nombrable de Ω, c’est à dire une suite d’événements (An )n≥0 vérifant les conditions
suivantes :

(i) :∀n ∈ N, An 6= 0
(ii) : ∀n ∈ N, les An sont deux à deux disjoints Am ∩ An = ∅ pour m 6= n
Sn
(iii) : Ai = Ω
i=0

Exemple 11.1.12
A partir d’un événement
 quelconque
A , on peut construire un système complet
d’événements défini par A, A .
Exemple 11.1.13
L’ensemble des événements élémentaires {ωn } , n ∈ N, forme un système complet
d’événements.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 216 — #226


i i

216 Chapitre 11. Notion de probabilité

Exemple 11.1.14
Jet d’un dé à 6 faces, soit A :"Obtenir un nombre pair" et B "Obtenir un chiffre
impair", donc A = {2, 4, 6} et B = {1, 3, 5}, alors l’ensemble {A, B} forme un système
complet d’événements.
Propriété 11.1.4
Soit (An )n≥0 un système complet d’événements alors
P
P (An ) = 1
n≥0

Remarque 11.1.2 : Equiprobabilité


L’équiprobabilité est un cas particulier d’une probabilité. En effet, il s’agit du cas
où tous les événements élémentaires ont la même probabilité.
Ce qui correspond à la loi uniforme discrète (qui sera plus détaillée dans le chapitre
suivant), définie par :
1
pi = ,1 ≤ i ≤ n
n
Exemple 11.1.15
Jet d’un dé non pipé à 6 faces numérotées de 1 à 6. Toutes les faces ont la même
probabilité d’apparaître et elle est égale à :
1
p(1) = p(2) = p(3) = p(4) = p(5) = p(6) =
6
Exemple 11.1.16
Lancement d’une pièce de monnaie. Le côté pile a la même probabilité que le côté
face d’être réalisé :
1
p(P ile) = p(F ace) =
2

11.2 Probabilités conditionelles et indépendance


11.2.1 Probabilités conditionnelles
La notion de probabilité conditionnelle intervient au cours d’une expérience aléatoire,
à chaque fois que l’on dispose d’une information supplémentaire.
On considère l’espace probabilisé (Ω, A, P ) et un événement B de A tel que
P (B) > 0. La connaissance de la réalisation de B modifie la probabilité de la réalisation
d’un événement élémentaire, puisque l’ensemble des résultats possibles est devenu B
et non plus Ω.
Exemple 11.2.1
Jet de deux dés à 6 faces numérotés de 1 à 6.
L’univers est Ω = {(i, j) ; 1 ≤ i ≤ 6; 1 ≤ j ≤ 6} et card(Ω) = 62 = 36
Soit l’événement B :"La somme des deux chiffres obtenus est égale à 8"
Alors Ω|B = {(2, 6), (3, 5), (4, 4), (6, 2), (5, 3)} et card(B) = 5
Soit l’événement A :"Obtenir deux faces paires". Alors A|B = {(2, 6), (4, 4), (6, 2)}
et card(A|B) = 3.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 217 — #227


i i

11.2 Probabilités conditionelles et indépendance 217

5
Initialement on avait P (B) = 36 et maintenant P (A|B) = 35 > 36 5

Définition 11.2.1
Soit (Ω, A, P ) un espace probabilisé et un événement B de A tel que P (B) > 0,
alors l’application P (.|B) de P(Ω) dans [0, 1] est définie sur la tribu conditionnelle :
A|B = {A ∩ B/A ∈ A} par :

P (A ∩ B)
P (A|B) =
P (B)

P (A|B) est appelée probabilité conditionnelle de l’événement A sachant l’événement


B.

La probabilité conditionnelle définie ci-dessus, peut se réecrire d’une autre manière,


appelée la formule des probabilitées composées : si P (A) > 0

P (A ∩ B) = P (B)P (A|B) = P (A)P (B|A).


Cette formule se généralise par récurrence pour donner la :

P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 )...P (An |A1 ∩ .. ∩ An−1 )
n
 k−1

Q T
= P (A1 ) P Ak | Ai
k=2 i=1

Exemple 11.2.2
Dans une urne qui contient deux boules blanches et trois boules noires, quatre
personne A, B, C et D tirent succéssivement une boule sans la remettre ; la première
personne qui tire une boule blanche gagne.
Calculons la probabilité de gain de chacune de ces quatre personnes :
P (A) = P (B1 ) = 25
P (B) = P (N1 )P (B2 |N1 ) = 35 × 42 = 10
3

P (C) = P (N1 )P (N2 |N1 )P (B3 |N1 N2 ) = 35 × 24 × 23 = 15


P (D) = P (N1 )P (N2 |N1 )P (N3 |N1 N2 )(B4 |N1 N2 N3 ) = 53 × 24 × 13 × 22 = 10
1

On vérifie bien que la somme de toutes les probabilités est égale à 1.

11.2.2 Théorème de Bayes


Soit (Ai )1≤i≤n un système complet d’événements i.e. une partition de Ω en événements
{A1 , A2 , ..., An } de probabilités strictement positives, P (Ai ) > 0 pour 1 ≤ i ≤ n, et
n
P
deux à deux disjoints, i.e. avec Ai ∩ Aj = ∅ pour i 6= j et P (Ai ) = 1. On suppose
i=1
que les probabilités des événements inclus dans chacun des Ai sont connues et on va
donc décomposer un événement quelconque B sur ce système :
 n  n
S S
B =B∩Ω=B∩ Ai = (Ai ∩ B)
i=1 i=1

En appliquant la probabilité au système précédent, on obtient

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 218 — #228


i i

218 Chapitre 11. Notion de probabilité

n
P n
P
P (B) = P (Ai ∩ B) = P (Ai )P (B|Ai )
i=1 i=1

appelée la formule de probabilté totale.

A partir de la formule de la probabilité totale et de la probabilité composée, on


aboutit au théorème suivant.
Théorème 11.2.1 : Théorème de Bayes
Soit (Ai )1≤i≤n un système complet d’événements telle que P (Ai ) > 0, ∀i = 1, ..., n
et B un événement quelconque, alors :

P (Ai ∩ B) P (Ai )P (B|Ai )


P (Ai |B) = = P
n
P (B)
P (Aj )P (B|Aj )
j=1

Cette formule de Bayes permet de claculer les probabilités a posteriori P (Ai |B),
après réalisation d’un événement B à partir des probabilités a priori P (Ai ), 1 ≤ i ≤ n.
Exemple 11.2.3.
On tire au hasard entre trois urnes remplies de boules de trois couleurs comme
l’indique le tableau ci-dessous. Sachant qu’on a obtenu une boule verte, on se pose la
question de savoir quelle est la probabilité qu’elle provienne de l’urne U2 .

Verte Blanche Noire


U1 2 4 1
U2 3 1 2
U3 1 3 4
3 3
 
P P 1 2 3 1
P (V ) = P (V ∩ Ui ) = P (Ui )P (V |Ui ) = + +
i=1 i=1 3 7 6 8
La probabilité a posteriori de l’Urnue U2 est donc :

P (U2 )P (V |U2 ) 3/6 51 102 112


P (U2 |V ) = = = = < = P (U2 ).
P (V ) 2/7 + 3/6 + 1/8 112 336 336

11.2.3 Indépendance en probabilité


Définition 11.2.2.
Deux événements A et B sont dits indépendants, relativement à la probabilité P ,
si :

P (A ∩ B) = P (A) × P (B)
La probabilité de réalisation simultanée de deux événements indépendants est égale
au produit des probabilités que chacun de ces événements se produise séparément.
Conséquence 11.2.1
Soit A et B deux événements tels que P (A) > 0 et P (A) > 0
Alors A et B sont indépendants ⇐⇒ P (A|B) = P (A)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 219 — #229


i i

11.2 Probabilités conditionelles et indépendance 219

La réalisation d’un événement ne modifié par la probabilité de réalisation de l’autre.


Remarque 11.2.1 : ATTENTION ! ! !
Il ne faut pas confondre la notion d’indépendance et d’incompatibilité, car dans
cette dernière notion,deux événements A et B sont incompatibles (ou disjoints) alors
A ∩ B = ∅ et P (A ∩ B) = 0, alors que dans la notion d’indépendance on a P (A ∩ B) =
P (A) × P (B).
Proposition 11.2.1
Si deux événements A et B sont indépendants alors :
· A et B sont indépendants
· A et B sont indépendants
· A et B sont indépendants
Exemple 11.2.4
Une expérience consiste à jeter deux dés à six faces, un blanc et un rouge, numérotées
de 1 à 6.
Soit les deux événements suivants :
A :"le dé blanc donne un chiffre pair" et B :" le dé rouge donne le chiffre 1"

Montrons que ces deux événements sont indépendants.

On a déjà vu que Ω = {(i, j) ; 1 ≤ i ≤ 6; 1 ≤ j ≤ 6} et card(Ω) = 62 = 36.


1
De plus, il y a une équiprobabilité donc : P ({ω}) = 36 et

18 1 6 1 3 1
P (A) = = , P (B) = = , P (A ∩ B) = =
36 2 36 6 36 12

P (A ∩ B) 1/12 1
P (B|A) = = = = P (B)
P (A) 1/2 6
P (B|A) = P (B) ⇐⇒ les deux événements A et B sont alors indépendants.
On remarque aussi que
1 1 1
P (A ∩ B) = = P (A) × P (B) = ×
12 2 6
Définition 11.2.3
Les événements A1 , A2 , ..., An (où n > 2) sont dits mutuellement indépendants si
pour tout k-uplet {i1 , i2 , ..., ik } de {1, 2, ..., n} on a :

P (Ai1 ∩ Ai2 ∩ ..., Aik ) = P (A1 )P (A2 )...P (Aik ); 2≤k≤n


qui s’écrit encore :
k
T k
Q
P( Aij ) = P (Aij )
j=1 j=1

Exemple 11.2.5
Pour montrer que trois événements A, B et C sont mutuellement indépendants, il
faut montrer que :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 220 — #230


i i

220 Chapitre 11. Notion de probabilité

P (A ∩ B) = P (A) × P (B)
P (A ∩ C) = P (A) × P (C)
P (B ∩ C) = P (B) × P (C)
P (A ∩ B ∩ C) = P (A) × P (B) × P (C)

11.3 Analyse combinatoire


Nous allons définir quelques types de comptage utilisés souvent dans la résolution des
problèmes en probabilités.

11.3.1 Parties
Définition 11.3.1 : Soit un ensemble Ω composé de n différents élèments, alors le
nombre d’éléments de l’ensemble Ω est Card(Ω) = n, appelé cardinal de l’ensemble Ω.
L’ensemble des parties de Ω est noté P(Ω), et le nombre de parties (ou sous-
ensembles) de Ω est égal à :

Card(P(Ω)) = 2card(Ω) = 2n
Exemple 11.3.1
Jet d’un dé à 6 faces numérotées de 1 à 6, on a alors. Card(Ω) = 6 et

Card(P(Ω)) = 26 = 64.

Exemple 11.3.2
Une course comportant quatre vélos alors. Card(Ω) = 4 et

Card(P(Ω)) = 24 = 16

Exemple 11.3.3
Soient Ω un ensemble formé par a, b, c et d quatre voitures de rally prenant part à
une course.
Combien de façon y a-t-il de grouper les voitures ?
Réponse : ∅, {a}, {b}, {c}, {d},
{a,b},{a,c},{a,d},{a,e},
{a,b,c},{a,b,d},{a,b,e},....,
{a,b,c,d},{a,b,c,e},{a,c,d,e},{b,c,d,e},{a,b,d,c,e}

Card(P(Ω)) == 25 = 32

11.3.2 Factorielle
Etant donné un entier positif n, on note n! et on lit factorielle n, le nombre obtenu
par le produit de tous les nombres entiers de 1 à n.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 221 — #231


i i

11.3 Analyse combinatoire 221

n
Q
n! = 1 × 2 × 3 × ... × n = k
k=1

De même on a : (n + 1)! = (n + 1) × (n!)

n! n−m
Q
si m < n alors = (m + k)
m! k=1

Par convention 0! = 1.
Dans toute la suite p ∈ N, n ∈ N et p ≤ n.

11.3.3 Arrangements
On appelle arrangement p à p des n éléments d’un ensemble E tout sous ensemble
ordonné de E ayant p éléments.
Le nombre total de ces arrangements est noté Apn et on a :

n!
Apn = n(n − 1)(n − 2)...(n − p + 1) =
(n − p)!
C’est également le nombre d’injections d’un ensemble E à p éléments distincts
dans un ensemble F à n éléments.

11.3.4 Permutations
On appelle permutation de n éléments de l’ensemble E, tout ensemble ordonné formé
par ces n éléments.
Le nombre total de ces permutations est noté Pn .
C’est également le nombre de bijections de l’ensemble E dans lui même.

Pn = n(n − 1)(n − 2)...3 × 2 × 1 = n!

11.3.5 Combinaisons
On appelle combinaisons p à p des n éléments de l’ensemble E de n éléments distincts
tout sous-ensemble de E ayant p éléments.
Le nombre total de ces combinaisons est noté Cnp .

n(n − 1)(n − 2)...(n − p + 1) n!


Cnp = =
p! p!(n − p)!
Propriétés 11.3.1

(i) Cnp = Cnn−p


p−1 p
(ii) Cnp = Cn−1 + Cn−1
(iii) Apn = p!Cnp = Pp × Cnp

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 222 — #232


i i

222 Chapitre 11. Notion de probabilité

11.4 Formule du binôme de Newton


Soient a et b deux éléments d’un anneau commutatif A et n un entier positif. On
appelle binôme de Newton l’élément (a + b)n de l’aneeau A.
Le développement de (a + b)n est donné par la formule du binôme de Newton
suivante :

n
(a + b)n = Cnp ak bn−k = ak + Cn1 an−1 b + Cn2 an−2 b2 + ... + Cnk ak bn−k + ... + bk
P
k=0

Le triangle de Pascal permet de donner les coefficients Cnk de la formule (a + b)n

11.5 Exercices
11.5.1 Enoncés
Exercice 1
Soit Ω = {α, β, γ} et considérons les ensembles A1 = {∅, {α}, {β, γ}, Ω} et A2 =
{∅, {β}, {α, γ}, Ω}
1) Montrer que A1 et A2 sont des tribus sur Ω.
2) Les ensembles A1 ∩ A2 et A1 ∪ A2 sont-ils des tribus sur Ω ?
Exercice 2
On jette 12 fois un dé non truqué à 6 faces.
Soient A0 : ”on n’a pas obtenue la face 6"
A1 : ”on a obtenue exactement une seule fois la face 6"
B : ”on a obtenue au moins deux fois la face 6"
1) Montrer que A0 , A0 et B forment un système complet d’événements.
2) Calculer P (A0 ) et P (A0 ). En déduire P (B).
Exercice 3
Un étudiant doit tirer 3 questions d’oral sur les 22 préparées par un examinateur ;
ces 22 questions comprennent :
- 10questions d’algèbre
- 7 questions d’analyse
- 5 questions de probabilité
L’étudiant tire successeivement les trois questions sans remettre dans le tas une
question déjà tirée.
Quelle est la probabilité de tirer dans l’ordre une questoin d’algèbre, une d’analyse
et une de probabilité.
Exercice 4
Deux Chasseurs C1 et C2 aperçoivent ensemble un lièvre et tire simultanément.
1) Sachant uqe le chasseur C1 atteint et tue d’habitude 5 lièvres sur 6 et le chasseur
C2 tue 4 lièvres sur 5. Quelle est laprobabilité pour que le lièvre soit tué.
2) En fait c’est le chasseur C2 qui a tiré.
a) Quelle est la probabilité pour que C1 tue le lièvre sachant que si C2 tire est
manque, les chance de C1 d’atteindre le lièvre se trouvent diminuées de moitié ?

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 223 — #233


i i

11.5 Exercices 223

b) Dans ces conditions C2 a tiré le premier puis C1 , quelle est la probabilité


pour le lièvre d’en échapper ?
Exercice 5
Des pièces de mécaniques sont fabriquées en grande série. On effectue un test sur
chacune d’elles pour en contrôler la qualité.
Soient :
p la probabilité pour qu’une pièce choisie au hasard soit bonne,
b la probabilité pour que le test indique comme bonne une pièce qui est effectivement
bonne,
d la probabilité pour que le test indique comme bonne une pièce qui est effectivement
défectueuse.
1) Calculer la probabilité pour qu’une pièce indiquée comme bonne par le test soit
effectivement bonne.
2) A quelle condition cette probabilité est-elle supérieur à p ? Ce qui traduit l’utilité
du test.
Exercice 6
On tire quatre cartes d’un jeu de 32 cartes.
1) Quelle est la probabilité d’avoir en main deux as ou deux rois ?
2) Sachant que l’une des cartes tirées est un roi, quelle est la probabilité d’obtenir
deux as et deux rois ?
Exercice 7
Dans une entreprise, la probabilité pour qu’un ouvrier X quitte l’entreprise dans
l’année est égale à 1/5 et la probabilité pour qu’un cadre Y quitte l’entreprise est 1/8.
En supposant ces deux événements indépendants, calculer la probabilité que :
a) X et Y quittent l’entreprise
b) l’un des deux quitte l’entreprise
c) ni X, ni Y ne quitte l’entreprise
d) Y seulement quitte l’entreprise
Exercice 8
Dans une société d’informatique, lors d’une réunion comprenant 5 cadres, 7 employés
et 15 ouvriers, on choisit au hasard succéssivement n personnes.
1) si n = 2, calculer la probabilité de choisir un cadre puis un employé.
2) si n = 3, calculer la probabilité de choisir un cadre puis un employé puis un
ouvrier.
Exercice 9
Une boîte A, contient une boule blanche et trois boules rouges.
Une boîte B, contient cinq boules blanches et trois boules rouges.
On tire au hasard une boule de A et une boule de B et on les change de boîte.
1) Quelle est la probabilité pour qu’après l’échange la boîte A ne contienne que
des boules rouges ?
2) Quelle est la probabilité pour qu’après l’échange chaque boîte ait retrouvé, en
nombre de boules de chaque couleur, sa composition initiale ?
Exercice 10
15 chevaux sont au départ du grand prix de France. Combien y a-t-il de tiercés
possibles :
a) au total ?

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 224 — #234


i i

224 Chapitre 11. Notion de probabilité

b) dans lesquels les 3 chevaux de tête sont dans l’ordre ?


c) dans lesquels ils sont dans l’ordre ou le désordre ?
d) dans le désordre ?
Exercice 11
On range cinq paires de gants de couleurs différentes dans cinq tiroirs. On prend
un gant de chaque paire et on les répartit dans les cinq tiroirs, un par tiroir. On prend
les cinq gants restant et on en met une dans chaque tiroir.
De combien de façons peut-on ranger les gants, les cinq premiers gants pouvant
être déplacés ?
Exercice 12
1/Combien de mots de 7 lettres toutes différentes peut-on former avec les lettres
ABCDEFG ?
2/ Combien y a-t-il de ces mots où les lettres EFG sont toujours ensemble :
a) dans cet ordre ?
b) dans un ordre quelconque ?
Exercice 13
Une association unniversitaire comprenant 20 étudiants, dont 12 garçons et 8 filles,
désire former un comité de 5 étudiants dans lequel doivent se trouver au mois 2 garçons
et 2 filles.
Trouver de combien de façons différentes on peut former ce comité si
1) chaque membre de l’association accepte de faire partie du comité.
2) deux garçons refusent d’en faire partie.
Exercice 14
A partir du développement de (1 + x)n , calculer en donnant à x des valeurs
particulière les sommes suivantes :
S = Cn0 + Cn1 + Cn2 + ... + Cnn
D = Cn0 − Cn1 + Cn2 − Cn3 + ... + (−1)n Cnn
En déduire la valeur des quantités :

P = Cn0 + Cn2 + Cn4 + ...


et
I = Cn1 + Cn3 + Cn5 + ...

11.5.2 Corrigés
Exercice 1
1) Si on note A1 = {α} et A2 = {β}, les deux ensembles A1 = {∅, {α}, {β, γ}, Ω}
et A2 = {∅, {β}, {α, γ}, Ω},
s’écrivent Ai = {∅, Ai , Ai , Ω}, avec i = 1, 2, et sont donc des tribus sur Ω.
2) L’ensemble A1 ∩ A2 = {∅, Ω} est une tribu grossière.
L’ensemble A1 ∪A2 = {∅, {α}, {β}, {α, γ}, {β, γ}, Ω} n’est pas une tribu car {α, γ}∩
{β, γ} = {γ} ∈ / A1 ∪ A2
Exercice 2
Jet d’un dé 12 fois, et on s’interesse à la face numéro 6.
On a les événements :
A0 : ”on n’a pas obtenue la face 6",

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 225 — #235


i i

11.5 Exercices 225

A1 : ”on a obtenue exactement une seule fois la face 6"


et B : ”on a obtenue au moins deux fois la face 6"
1) On remarque d’une part que A0 ∩ A1 = ∅, A0 ∩ B = ∅ et A1 ∩ B = ∅ donc les
événements A0 , A1 et B sont deux à deux disjoints (i)
D’autre part on A0 ∪ A1 ∪ B = Ω (ii)
Par conséquent, d’après (i) et (ii) l’ensmble {A0 , A1 , B} forme un système complet
d’événements.

2) A0 : ”on n’a pas obtenue la face 6"


 12
5
P (A0 ) =
6
A1 : ”on a obtenue exactement une seule fois la face 6"
   11  11
1 5 5
P (A1 ) = 12 × × =2
6 6 6
B : ”on a obtenue au moins deux fois la face 6"

C’est l’événement contraire de l’événement B 0 : ”Obtenir au plus une fois la face


6”(c’est ne pas obtenir la face 6 ou obtenir exatement une seule fois la face 6)
B 0 = A0 + A1
Par conséquent,
"   11 #
12
5 5 511
P (B) = 1 − [P (A0 ) + P (A1 )] = 1 − +2 = 1 − 17 12
6 6 6

Exercice 3
C’est la probabilité de tirer dans l’ordre une question d’algèbre, une d’analyse et
une de probabilité.
Soient
A1 l’événement "la première question tirée est une question d’algèbre"
B2 l’événement "la deuxième question tirée est une question d’analyse"
C3 l’événement "la troisième question tirée est une question de probabilité"
L’objectif est de calculer P (A1 ∩ B2 ∩ C3 ).
Les événements A1 , B2 et C3 sont dépendants puisqu’on ne remet pas la question
tirée dans le tas, on a donc :

P (A1 ∩ B2 ∩ C3 ) = P (A1 ) × P (AB2 /A1 ) × P (C3 /A1 ∩ B2 )


10 7 5 5 1 1 5
= × × = × × = ≈ 0, 04
22 21 20 11 3 4 132
Exercice 4
1) Probabilité que le lièvre soit tué
Soit A l’événement "C1 tue le lièvre" et B l’événement "C2 tue le lièvre"
Alors l’événement A ∪ B est "le lièvre est tué"

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 226 — #236


i i

226 Chapitre 11. Notion de probabilité

En supposant que les événements A et B soient indépendants, ils sont compatibles


puisqu’ils peuvent avoir lieu en même temps, donc

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
5 4
or P (A) = 6 et P (B) = 5 donc
 
5 4 5 4 29
P (A ∪ B) = + − × = ≈ 0, 97
6 5 6 5 30

2) a- Quand C2 tire et manque (événement C2 ) les chances de A de tuer le lièvre


sont diminuées de moitié, donc
1 5 5
× =
P (C1 /C2 ) =.
2 6 12
Calculons la probabiliré pour que le chasseur C1 tue le lièvre si le chasseur C2 le
manque : c’est lévénement C2 ∩ C1 .

P (C2 ∩ C1 ) = P (C2 ) × P (C1 /C2 )


4 5 1
= (1 − ) × = ≈ 0, 08
5 12 12
b- Si C2 tire le premier puis C1 alors l’événement "le lièvre en réchappe" est alors
C2 ∩ C1

 
P (C2 ∩ C1 ) = P (C2 ) × P (C1 /C2 ) = [1 − P (C2 )] × 1 − P (C1 /C2 )
4 5 7
P (C2 ∩ C1 ) = (1 − ) × (1 − ) = ≈ 0, 12
5 12 60
Exercice 5
1) Dans un espace probabilisé (Ω, P(Ω), P ), on considère les événements :
B : " La pièce est bonne "
D : " La pièce est défectueuse "
T : " Le test indique que la pièce est bonne ".
Le texte indique
p = P (B) : la probabilité pour qu’une pièce choisie au hasard soit bonne.
a = P (T /B) : la probabilité pour que le test indique comme bonne une pièce qui
est effectivement bonne.
b = P (T /D) : la probabilité pour que le test indique comme bonne une pièce qui
est effectivement défectueuse.

L’objectif est de calculer P (B/T ) la probabilité pour qu’une pièce indiquée comme
bonne par le test soit effectivement bonne.

P (B) × P (T /B) pa
P (B/T ) = =
P (B) × P (T /B) + P (B) × P (T /M ) pa + (1 + p)b

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 227 — #237


i i

11.5 Exercices 227

2) Le test est utilse si P (B/T ) > p.


c’est à dire
pa
> p =⇒ pa > pa2 + p(1 − p)b
pa + (1 + p)b
que l’on peut écrire sous la forme p(1 − p)(a − b) > 0, car les nombres sont tous
positifs donc a > b.
Exercice 6
Soit Ω l’univers des cas possibles c’est à dire l’ensemble des parties à quatre cartes
4
prises parmi les 32 cartes du jeu. Card(Ω) = C32
1) L’événement A1 "avoir en main deux as ou deux rois", est la réunion des
événements :
A : "Avoir deux as" et R : "Avoir deux rois".
Les probabilités des événements A et R sont

C42 × C28
2
C2 × C2
P (A) = 4 et P (R) = 4 4 28 .
C32 C32

Puisque les événements A et R sont compatibles, on a donc

P (A1 ) = P (A ∪ R) = P (A) + P (R) − P (A ∩ R).


C42 ×C42
avec P (A ∩ R) = 4
C32
d’où
Au final on a
C42 × C282
C2 × C2 C2 × C2
P (A1 ) = P (A ∪ R) = 4 + 4 4 28 − 4 4 4
C32 C32 C32
2 2 2 2 2 2
C × C28 + C4 × C28 − C4 × C4
= 4 4
C32
225
P (A1 ) = = 0, 125.
1798
2) Soit l’événement C " ne pas avoir de roi", c’est l’ensemble des parties à quatre
4
prises parmi les 24 qui ne sont pas des rois. Card(C) = C28 .
Avoir au moins un roi est l’événement contraire de C,noté C.
4 4
Card(C) = Card(Ω) − Card(C) = C32 − C28

Sachant que l’une des cartes tirées est un roi, on demande de calculer la probabilité
d’obtenir deux as et deux rois. Il s’agit donc de calculer :
 
Card C ∩ (A ∩ R)
P (A ∩ R/C) = .
Card(C)
On remarque bien que A ∩ R ⊂ C donc C ∩ (A ∩ R) = A ∩ R. Finalement on
obtient :

Card(A ∩ R) C 2 × C42 36
P (A ∩ R/C) = = 44 4 = 15485 ≈ 0, 0023.
Card(C) C 32 − C 28

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 228 — #238


i i

228 Chapitre 11. Notion de probabilité

Exercice 7
Soient les événement suivants :
X : " L’ouvrier X quitte l’entreprise "
Y : " Le cadre Y quitte l’entreprise "
Les événements Xet Y sont supposés indépendants.
a) Soit l’événement A : " X et Y quittent l’entreprise ", alors on a A = X ∩ Y

P (A) = P (X ∩ Y ) = P (X) × P (Y )
1 1 1
P (A) = × = ≈ 0, 025
5 8 40
b) Soit l’événement B : " l’un des deux quitte l’entreprise ", alors on a B = X ∪ Y

P (B) = P (X ∪ Y ) = P (X) + P (Y ) − P (X ∩ Y )
1 1 1 12
P (B) = + − = = 0, 3
5 8 40 40
c) Soit l’événement C : " ni X, ni Y ne quittent l’entreprise ", alors on a C = X ∩ Y

P (C) = P (X ∩ Y ) = P (X ∪ Y ) = 1 − P (X ∪ Y )
P (C) = 1 − 0, 3 = 0, 7
Remaque :
Vu que les événements X et Y sont indépendants, alors X et Y sont aussi indé-
pendants.
et on a
4 7 28
P (X ∩ Y ) = P (X) × P (Y ) = × = = 0, 7
5 8 40

d) Soit l’événement D : " Y seulement quitte l’entreprise ",.alors on a D = X ∩ Y


On a les événements X et Y sont indépendants, donc X et Y sont aussi indépen-
dants, par suite on a :
4 1 4
P (D) = P (X ∩ Y ) = P (X) × P (Y ) = × = = 0, 1
5 8 40
Exercice 8
Soient les événements suivants :
C :"Choisir, un cardre ", E :"Choisir, un employé " et O :"Choisir, un ouvrier ".
On choisit au hasard et succéssivement n personnes sachant que le nombre total
dans l’entreprise est N = 27.
1) si n = 2, la probabilité de choisir un cadre puis un employé.est

P (C ∩ E) = P (C) × P (E/C)
5 7
P (C ∩ E) = × ≈ 0, 05
27 26

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 229 — #239


i i

11.5 Exercices 229

2) si n = 3, la probabilité de choisir un cadre puis un employé puis un ouvrier est

P (C ∩ E ∩ O) = P (C) × P (E/C) × P (O/C ∩ E)


5 7 15
P (C ∩ E ∩ O) = × × ≈ 0, 03
27 26 25
Exercice 9
1) Soit l’événement C : "la boule tirée dans A est blanche ". P (C) = 14 .
Soit l’événement D : "la boule tirée dans B est rouge ". P (D) = 83 .
L’événement X :" la boîte A ne contient que des boules rouges " est constitué de
l’intersection des événement C et D donc X = C ∩ D.
De plus les événements C et D sont indépendants puisque les tirages ont lieu dans
deux boîtes distinctes, donc

1 3 3
P (C ∩ D) = P (C) × P (D) = × = ≈ 0, 09.
4 8 32
2) Soit l’événement C : "la boule tirée dans A est rouge ". P (E) = 34 .
Soit l’événement D : "la boule tirée dans B est blanche ". P (D) = 58 .
L’événement Y :"Avoir retrouvé pour chaque boîte sa composition initiale " est
constitué par les événements C, D, E et F, et on a : Y = (C ∩ F ) ∪ (D ∩ E).
Or (C ∩ F ) et (D ∩ E) sont incompatibles, d’où

P [(C ∩ F ) ∪ (D ∩ E)] = P (C ∩ F ) + P (D ∩ E)
Les événements C et F sont indépendats, ainsi que les événements D et E donc

P [(C ∩ F ) ∪ (D ∩ E)] = P (C) × P (F ) + P (D) × P (E)


1 5 3 3 7
= × + × = ≈ 0, 44.
4 8 8 4 16
Exercice 10
L’ordre des chevaux à l’arrivée intervient bien entendu et on choisit 3 chevaux
parmi les 15, donc
a) le nombre de tiercés possibles au total est un arrangement :

A315 = 15 × 14 × 13 = 2730 tiercés possibles.

b) Il existe un seul tiercé possible pour lesquels les 3 chevaux de tête sont dans
l’ordre.
c) le nombre de tiercés possibles dans lesquels ils sont dans l’ordre ou le désordre
est égal à 3! = 6, autant que de permutations dans un ensemble de trois chevaux.
d) le nombre de tiercés possibles dans le désordre est : 6 − 1 = 5.
Exercice 11
Il y a 5! façons de placer les 5 premiers gants et 5! façons de placer les 5 autres,
donc :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 230 — #240


i i

230 Chapitre 11. Notion de probabilité

le nombre de cas possibles de ranger les gants, sachant que les cinq premiers gants
pouvant être déplacés est :
(5!)2 = 1202 manières de ranger les 10 gants.
Exercice 12
1) Le nombre de mots de 7 lettres.
Chaque mot formé de 7 lettres différentes A, B, C, D, E, F , G, représente une
permutation de ces 7 lettres. Avec 7 lettres différentes on peut donc former 7! = 5040
mots différents.
2) a- Nombre de mots où les lettres EF G sont toujours ensemble dans cet ordre
est :
Posons {EF G} = ∆, tout mot formé avec les lettres {EF G} dans cet ordre
représente une permutation de 5 éléments de l’ensemble {A, B, C, D, ∆}. On peut
donc former 5! = 120 mots différents où les lettres E, F et G sont ensemble dans cet
ordre.
b- les lettres EF G sont toujours ensemble dans un ordre quelconque.
Remarquons que ces lettres EF G peuvent être rangées de 3! = 6 manières diffé-
rentes, et ainsi on peut associer aux 120 disposition précédentes, 6 disposition des
trois lettre E, F et G, donc 120 × 3! = 720 mots où {EF G} sont ensemble mais dans
un ordre quelconque.
Exercice 13
2
1) Il peut y avoir dans un comité de 5 étudiants, 2 garçons (C12 ) et 3 filles (C83 )
3 2
ou l’inverse 3 garçons (C12 ) et 2 filles (C8 ).
Par conséquent, au total il y a :
2
C12 × C83 + C12
3
× C82 = 9856.

2) Au total la composition du comité se fait avec seulement 10 garçons, vu qu’il y


a deux étudiants garçons qui refusent d’y participer à la formation du comité.
2
Donc le comité de 5 étudiants sera formé par 2 garçons (C10 ) et 3 filles (C83 ) ou
3 2
l’inverse 3 garçons (C10 ) et 2 filles (C8 )
On en conclut qu’au total il y a :
2
C10 × C83 + C10
3
× C82 = 5880.

Exercice 14
S et D sont les développement respectifs de (1 + 1)n et (1 − 1)n .

S = (1 + 1)n = 2n = Cn0 + Cn1 + Cn2 + ... + Cnn

D = (1 − 1)n = 0 = Cn0 − Cn1 + Cn2 − Cn3 + ... + (−1)n Cnn


On a
S + D = 2(Cn0 + Cn2 + Cn4 + ...) = 2P = 2n

S − D = 2(Cn1 + Cn3 + Cn5 + ...) = 2I = 2n
Donc :
P = 21 (S + D) = 12 2n = 2n−1


I = 12 (S − D) = 12 2n = 2n−1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 231 — #241


i i

CHAPITRE 12

Variables Aléatoires Discrètes - Lois Discrètes

Dans ce second chapitre de probabilité, nous allons définir la variable aléatoire discrète,
sa loi de probabilité, sa fonction de répartition, le calcul de différentes quantités comme
l’espérance, la variance et la covariance, et nous terminerons par énoncer les diiférentés
lois discrètes.

12.1 Définitions
Dans cette section, et après avoir définie une variable aléatoire discrète, nous allons
énoncés quelques propriétés, théorèmes et remarques liés à cette variable.

12.1.1 Variable aélatoire discrète


Au cours d’une expérience aléatoire, on associe souvent au résultat un nombre réel.
Exemple 12.1.1
La taille d’une personne en mètre, le résultat est

{1, 67; 1, 85; 1, 75; 1, 98; 2, 01; 1, 78; ...}


Exemple 12.1.2
La température en degrè celsius, le résultat est

{5; 12, 4; −1; 2; 34, 6; 25; −8, 7; −14; 45; −6; ...}
Définition 12.1.1
Soit (Ω, A, P ) un espace de probabilité, une variable aléatoire discrète (notée,
v.a.d.) est une application X : Ω −→ R prenant un nombre fini ou dénombrable de
valeurs.
Exemple 12.1.3
Jet d’un dé à six faces, le résultat est

X(Ω) = {1, 2, 3, 4, 5, 6}
Propriété 12.1.1
Soit X v.a.d. et xk (k ∈ N) une valeur prise par X, alors {w; X(w) = xk } est un
événement noté {X = xk }.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 232 — #242


i i

232 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

Propriété 12.1.2
Soit X v.a.d. à valeurs dans N, alors {w ∈ Ω; X(w) = k} est un événement noté
{X = k}.
Propriété 12.1.3
Soit X v.a.d. à valeurs dans R, alors {w ∈ Ω; X(w) ≤ k} est aussi un événement.
Exemple 12.1.4
Un jeu consiste à jetter deux dés et calculer la somme S des deux chiffres obtenus.
S est alors un v.a.d. définie par :

S : Ω −→ R
(i, j) −→ i + j
On a

Ω = {(i, j); 1 ≤ i ≤ 6; 1 ≤ j ≤ 6}
et S(Ω) = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

et {S = 5} est un événement et on a

{S = 5} = {w ∈ Ω; S(w) = 5}
= {(1, 4); (2, 3); (3, 2); (4, 1)}
{S = 5} ⊂ Ω

et la probabilité de l’événement {S = 5} est égale à


4 1
P ({S = 5}) = =
36 9
On a aussi {S ≤ 3, 5} est un événement et on a

{S ≤ 3, 5} = {S ≤ 3} = {S = 2} ∪ {S = 3}
{S ≤ 3, 5} = {(1, 1); (1, 2); (2, 1)}

et la probabilité de cet événement est


3 1
P ({S ≤ 3, 5}) = = .
36 12

12.1.2 Loi de probabilité


Définition 12.1.2
La loi de probabilité ou la distribution d’une variable aléatoire discrète X est la
donnée des probabilités P ({X = xk }) pour toutes les valeurs xk (k ∈ N) prises par la
v.a.d. X.
Donc pour xk ∈ X(Ω) on calcule toutes les probabilités

PX (X = xk ) = P {X −1 (xk )} = P {ω ∈ Ω/X(ω) = xk }
Exemple 12.1.5

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 233 — #243


i i

12.1 Définitions 233

La loi uniforme associé à un jet de dé à six faces numérotées de 1 à 6 est présentée


dans le tableau ci-après :

xk 1 2 3 4 5 6 Total
pk 1/6 1/6 1/6 1/6 1/6 1/6 1
Définition 12.1.3
La variable certaine est une v.a. qui est constante i.e. qui prend la même valeur
connue a quel que soit le résultat de l’épreuve :

P ({X = a}) = 1.
On parle alors de loi de Dirac associée à cette variable certaine.
Définition 12.1.4
Soit A ∈ A un événement quelconque.La fonction indicatrice de cet événement A
est l’application définie par :

−→ R
1A : Ω 
1 si w ∈ A
w 7−→
0 si w ∈ A
1A est une v.a.d. prenant les valeurs {0; 1} .
Exemple 12.1.6
Soit S la somme de deux chiffres obtenus d’un lancer de deux dés.
Alors on peut donner des exemples suivants de l’indicatrice de l’événement {S = 5} :
- 1{S=5} ((4; 2)) = 0 car le couple (4; 2) ∈
/ {S = 5}, en effet on a 4 + 2 = 6 6= 5.
- 1{S=5} ((2; 3)) = 1 car le couple (2; 3) ∈ {S = 5}, et on a 2 + 3 = 5.
Propriété 12.1.4
Soit A un événement quelconque alors on a :

1A = 1 − 1A
Propriété 12.1.5
Soient A et B deux événements quelconques alors on a :

1A∩B = 1A × 1B

12.1.3 Fonction de répartition


Définition 12.1.5
La fonction de répartition d’une v.a.d. X, est l’application F définie pour x réel
par :

F : R −→ [0; 1]
x 7−→ P ({X ≤ x})
F est une fonction croissante, en escalier, constante par morceaux, continue à
droite et on a X
F (x) = {pi /xi ≤ x}

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 234 — #244


i i

234 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

Conséquence 12.1.1
On peut déduire de la fonction de répartition F les porbabilités individuelles par :

pi = F (xi+1 ) − F (xi ) pour 1 ≤ i ≤ n − 1


et pn = 1 − F (xn )

Exemple 12.1.7
Pour une variable aléatoire certaine, on a F (x) = 0 pour x < a et F (x) = 1 pour
x ≥ a.

Exemple 12.1.8
La fonction de répartition d’une variable indicatrice est :

 0 pour x < 0
F (x) = 1 − p pour 0 ≤ x < 1
1 pour x ≥ 1

Exemple 12.1.9

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 235 — #245


i i

12.2 Espérance, Moments et Variance 235

La fonction de répartition d’une v.a.d. X prenant les valeurs les faces d’un dé à 6
faces est :

 0P pour x < 1
F (x) = PX (X = k) pour 1 ≤ x < 6
1 pour x ≥ 6

avec PX (X = k) = 1/6 aux points k = 1, 2, ..., 6.


La répresentation graphique correspondante à cette fonction de répartition est la
suivante :

12.2 Espérance, Moments et Variance


12.2.1 Espérance
Définition 12.2.1.
P Soit X une v.a.d.prenant les valeurs {xk , k ∈ N} alors si la série numérique
|xk | P ({X = xk }) est finie, on appelle espérance mathématique de la v.a.d X la
k≥0
quantité
P P
E(X) = xk P ({X = xk }) = xk p k
k≥0 k≥0

Remarque 12.2.1
Si X prend un nombre fini de valeurs {x1 , x2 , ..., xn } alors E(X) est finie et si de
plus il y a une équiprobabilité i.e. P (X = xk ) = 1/n ∀k ∈ {1, ..., n}, alors

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 236 — #246


i i

236 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

x1 + x2 + ... + xn 1P n
E(X) = = xk
n n k=1
qui est dans ce cas la moyenne arithmétique x des xk , d’où l’utilisation de la
moyenne au lieu de l’espérance, uniquement dans le cas d’une équiprobabilité.
Exemple 12.2.1
Pour un lancer d’une pièce de monnaie, soit X la v.a. qui code 0 le résultat pile et
1 le résultat face alors :
E(X) = 0 × P (X = 0) + 1 × P (X = 1) = 0 × 12 + 1 × 21 = 21 .
Exemple 12.2.2
Pour un jet de dé à six faces numérotés, l’espérance de la v.a. X est

1P 6 7
E(X) = xk = = 3, 5
6 k=1 2
Il y a une équiprobabilité entre les différentes faces du dé.
Propriété 12.2.1
Soient X et Y deux v.a.d. et (α, β) ∈ R2 deux réels quelconques, on suppose que
l’espérance existe, alors on a :

i) E(α) = α, ∀α ∈ R
ii) E(X + α) = E(X) + α
iii) E(αX) = αE(X)
iv) E(X + Y ) = E(X) + E(Y )
v) E(αX + βY ) = αE(X) + βE(Y )
vi) Si les deux v.a. X et Y sont indépendantes, alors
E(XY ) = E(X) × E(Y )
vii) Soit A ∈ P(Ω), alors E(1A ) = P (A)
Définition 12.2.2
Soit X une v.a.d.et
P f une fonction numérique telle que f (X) est une v.a.d. alors si
la série numérique |f (xk )| P ({X = xk }) converge, alors E(f (X)) existe et vaut :
k≥0
P
E(f (X)) = f (xk )P ({X = xk })
k≥0

12.2.2 Moments
Définition 12.2.3
Le moment non centré d’ordre k ∈ N∗ , est la quantité, si elle existe, définie par :

xki P ({X = xi }) = xki pi = E(X k )


P P
mk (X) =
i≥0 i≥0

Remarque 12.2.2
L’espérance mathématique d’une v.a. est le moment d’ordre k = 1, en effet :
P
m1 (X) = xi pi = E(X)
i≥0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 237 — #247


i i

12.2 Espérance, Moments et Variance 237

Exemple 12.2.3 P 2
Si la série numérique xi pi es convergente alors le moment d’ordre 2 d’une v.a.d.
i>0
est donnée par la quantité :

x2i pi = E(X 2 )
P
m2 (X) =
i≥0

Définition 12.2.4
Le moment centré d’ordre k ∈ N∗ , est la quantité, si elle existe, définie par :

pi [xi − E(X)]k = E[X − E(X)]k


P
µk (X) =
i≥0

Exemple 12.2.4
Le moment centré d’ordre k = 1 est

µ1 (X) = E[X − E(X)] = E(X) − E[E(X)] = E(X) − E(X) = 0

12.2.3 Variance, Covaraince et Coefficient de corrélation


Définition 12.2.5
Soit X une v.a.d. ademettant un moment d’ordre 2 fini (i.e. E(X 2 ) < +∞). On
appelle variance la quantité définie par :

pi [xi − E(X)]2 = E[X − E(X)]2


P
V (X) =
i≥0

La variance est un indicateur qui mesure la dispersion des valeurs xk que peut
prendre une v.a.d. X.
Remarque 12.2.3
La variance est le moment centré d’ordre 2 et on a :

µ2 (X) = m2 (X) − m21 (X) = E[X − E(X)]2 = V (X)


Propriété 12.2.2
Soient X et Y deux v.a.d. telles que E(X 2 ) < +∞ et E(Y 2 ) < +∞ et α un réel
quelconque, alors on a :

i) V (X) ≥ 0,(par définition)


ii) V (α) = 0, ∀α ∈ R
iii) V (X + α) = V (X)
iv) V (αX) = α2 V (X)
v) V (X) = E(X 2 ) − [E(X)]2
vi) Si les deux v.a. X et Y sont indépendantes, alors
V (X + Y ) = V (X) + V (Y )
Définition 12.2.6
Soit X une v.a.d. ademettant un moment d’ordre 2 fini. On appelle écart-type la
quantité définie par :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 238 — #248


i i

238 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

p
σ(X) = V (X)
Exemple 12.2.5
Si on reprend l’exemple du lancer d’une pièce de monnaie on a calculé l’espérance
qui vaut E(X) = 1/2 et donc la variance est :

 2  2
1 1 1 1 1 1
V (X) = 0− + 1− = +
2 2 2 2 8 8
1
V (X) =
4
Exemple 12.2.6
S’il existe une équiprobabilité alors E(X) = x et
n 1P n
pk (xk − x)2 = (xk − x)2
P
V (X) =
k=1 n k=1
c’est la variance empirique des valeurs possibles de la v.a. X.
Définition 12.2.7
Soient X et Y deux v.a.d. ayant des moments d’ordre 2 finis. On appelle covaraince
de X et de Y la quantité

Cov(X, Y ) = E(XY ) − E(X)E(Y )


Propriété 12.2.3
Soient X et Y deux v.a. ayant un moment d’ordre 1 fini alors on a :

i) Cov(X, X) = V (X)
ii) Cov(X, Y ) = Cov(Y, X)
iii) Si X et Y sont indépendantes alors
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(X)E(Y ) − E(X)E(Y )
Cov(X, Y ) = 0
iv) Cov(αX + γ, βY + ε) = αβCov(X, Y ) avec α, β, γ et ε des réels quelconques.
v) Cov(X + Y, Z + T ) = Cov(X, Z) + Cov(X, T ) + Cov(Y, Z) + Cov(Y, T )
avec Z et T deux v.a. ayant un moment d’ordre 1 fini
vi) Si X et Y ont un moment d’ordre 2 fini alors
V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y )

Définition 12.2.8
Soient X et Y deux v.a. ayant des moments d’ordre 2 finis. On appelle coefficient
de correlation de X et de Y , notée ρ(X, Y ) la quantité :

Cov(X, Y )
ρ(X, Y ) =
σ(X) σ(Y )
Remarque 12.2.4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 239 — #249


i i

12.3 Lois usuelles discrètes 239

La corrélation entre deux v.a. est d’étudier l’intensité de la liaison qui peut exister
entre ces variables (la liaison recherchée est une relation affine)
Plus le coefficient de corrélation est proche des valeurs extrêmes −1 et +1, plus la
corrélation entre les deux variables est forte ; on emploie alors l’expression « fortement
corrélées » pour qualifier les deux variables.
Une corrélation égale à 0 signifie que les variables ne sont pas corrélées.

12.3 Lois usuelles discrètes


Nous allons présenter dans cette section, les principales lois de probabilité discrètes
pouvant être retenues pour la modélisation statistique.

12.3.1 Loi de Dirac


Définition 12.3.1
Soit α ∈ R un point fixé. La loi de Dirac, notée δα , est la loi de la v.a. certaine X
qui est constante, prenant la même valeur α quel que soit le résultat de l’épreuve :
X(ω) = α, ∀ω ∈ Ω.
Par conséquent, on a : X(Ω) = {α}, P (X = α) = P (Ω) = 1 et la fonction de
répartition est :

0 si x < α
F (X) =
1 si x ≥ α
La représentation graphique de cette loi est la suivante :

On obtient les moments suivants :


E(X) = a et V (X) = 0

12.3.2 Loi uniforme discrète


Définition 12.3.2
Quand on tire un objet numéroté X parmi n objets numérotés de façon équiprobable,
on obtient la loi uniforme discrète, notée, U U U U (n) et on a :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 240 — #250


i i

240 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

X(Ω) = {1, 2, ..., n} et P (X = k) = 1/n; n ∈ N∗


Exemple 12.3.1
Une urne contient 10 boules numérotées de 1 à 10.
La probabilité d’avoir le boule numéro 7 est

P (X = 7) = 1/10
Exemple 12.3.2
Un jet de dé non truqué à 8 faces, numérotées de 1 à 8.
La probabilité d’avoir la face numéro 6 est

P (X = 6) = 1/8

12.3.3 Loi de Bernouilli


Définition 12.3.3
Quand on s’intéresse qu’à la réalisation ou non d’un événement A, on obtient la
loi de Bernouilli de paramètre la probabilité de cet événement A i.e. p = P (A) et elle
est notée X B(1, p) ou X B(p)

1 p
X=
0 q =1−p
Dans ce cas on a : X(Ω) = {0, 1} , P (X = 1) = p et P (X = 0) = q = 1 − p
La fonction de répartition est définie par :

 0 si x < 0
F (x) = q si 0 ≤ x < 1
1 si x ≤ 1

et elle est représentée graphiquement comme suit :

Lorsqu’on s’intéresse au nombre de réalisation d’un événement A de probabilité


strictement positive aucours de n épreuves succéssives d’une même expérience aléatoire
(i.e.indépendantes), on obtient alors la loi Binomiale.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 241 — #251


i i

12.3 Lois usuelles discrètes 241

Les moments de la loi de Bernouilli sont :

E(X) = 1 × P (A) + 0 × P (A) = P (A) = p

E(X 2 ) = P (A) = p

2
V (X) = E(X 2 ) − [E(X)] == p − p2 = p(1 − p) = pq

12.3.4 Loi Binomiale


Définition 12.3.4
Lorsqu’on s’intéresse au nombre de réalisations X d’un événement A de probabilité
p strictement positive (p > 0) aucours de n épreuves succéssives d’une même expérience
aléatoire (i.e.indépendantes), on obtient alors la loi Binomiale notée X B(n, p)
On a donc X(Ω) = {1, 2, ..., n} = N∗ et pour k ∈ X(Ω), on a :
 
n k
PX (X = k) = p (1 − p)n−k
k
On remarque que la loi Binomiale est la répétition de la loi de Bernouilli n fois.
Donc si pour chaque épreuve i, 1 ≤ i ≤ n, on lui associe la v.a. de Bernouilli Xi , définie
par :

1 si A est réalisé
Xi = ,
0 si A est réalisé
par conséquent la v.a. Binomiale X peut s’écrire :

X = X1 + X2 + ... + Xn

on peut alors déduire les moments de la variable Binomiale X :


n
! n
X X
E(X) = E Xi = E(Xi ) = np
i=1 i=1
et
n
! n
X X
V (X) = V Xi = V (Xi ) = npq
i=1 i=1

car les v.a. Xi sont indépendantes par définition.


Exemple 12.3.7
Le nombre de résultats pile apparus aucours de n jets d’une pièce de monnaie
truquée, telle que la prbabilité d’avoir pile est égale à 2/3 suit une loi Binomiale de
paramètre n et p = 2/3; X B(n, 2/3)
et on a  k  n−k
k 2 1 2k
PX (X = k) = Cn = Cnk n
3 3 3

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 242 — #252


i i

242 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

12.3.5 Loi Géométrique


Définition 12.3.5
Lorsqu’on s’intéresse au nombre (aléatoire) X d’épreuves effectuées jusqu’à la
première réalisation d’un événement A de probabilité p aucours de n épreuves succésives
et indépendantes (i.e. d’une même expérience aléatoire), on obtient la loi Géométrique
de paramètre p, notée X G(p)
L’univers est donc Ω = {A, A} et X(Ω) = N∗
La probabilité de l’événement A s’écrit alors :

PX (X = k) = (1 − p)k−1 p; ∀k ∈ N∗

L’espérance est

X p 1
E(X) = kpq k−1 = 2
=
(1 − p) p
k=1

Le calcul de la variance s’obtient à partir du moment factoriel suivant :

∞ ∞
X X 2pq
E [X(X − 1)] = k(k − 1)pq k−1 = pq k(k − 1)q k−2 =
(1 − p)3
k=2 k=2
2q
E [X(X − 1)] = 2
p
On en déduit :
2 q
V (X) = E [X(X − 1)] + E(X) − [E(X)] =
p2

12.3.6 Loi Hypergéométrique


Définition 12.3.6
Lorsque X représente le nombre de boules rouges NR tirées dans n tirages sans
remise dans une urne contenant N boules (dont NR boules rouges) et vu que les tirages
succéssifs sont dépendants (car le nombre de boules dans l’urne change après chaque
tirage), on obtient alors la loi Hypergéométrique, notée X H(N, n, NR )
La probabilité da la v.a. X dans le cas de la loi hypergéométrique est donnée par :
k n−k
CN R
CN −NR
PX (X = k) = n pour tout k ≤ NR et n − k ≤ N − NR
CN
et
L’espérance d’une telle v.a. est

E(X) = np

et la variance est
N −n
V (X) = npq avec q = 1 − p = 1 − NR /N
N −1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 243 — #253


i i

12.3 Lois usuelles discrètes 243

Remarque 12.3.5
Si la taille N de la population est grande par rapport à la taille n de l’échantillon,
la variance peut être approchée par : V (X) ' npq car le rapport
N −n 1 − n/N
= '1
N −1 1 − 1/N
Par conséquent , pour une petite taille d’échantillon n et une taille de la population
N grande, la loi hypergéométrique peut être approximée par la loi binomiale et on
aura :

H(N, n, NR ) ' B(n, p) (avec p = NR /N )

12.3.7 Loi de Poisson


Définition 12.3.7
La modélisation du nombre de réalisation X d’un événement "rare", fournie la loi
de Poisson. Si la v.a. X suit la loi de Poisson de paramètre λ > 0 , notée X P(λ),
alors X est à valeurs entières et on a X(Ω) = N et

λk
PX (X = k) = e−λ ;k ∈ N
k!

λk
Le développement en série entière de l’exponentielle donne : eλ =
P
k! , ce qui
k=0
permet de vérifier facilement que la somme des probabilités est égale à 1 :
∞ ∞ ∞
X X λk X λk
PX (X = k) = e−λ = e−λ = e−λ eλ = 1
k! k!
k=0 k=0 k=0
Le calcul de l’espérance mathématique repose aussi sur l’utilisation du développe-
ment en série entière de l’exponentielle :

∞ ∞ k ∞
X X
−λ λ −λ
X λk
E(X) = kPX (X = k) = ke =e k
k! k!
k=0 k=0 k=0
∞ ∞
X λk X λk−1
= e−λ = λe−λ = λe−λ eλ
(k − 1)! (k − 1)!
k=1 k=1
= λ.
Pour calculer la variance, nous allons calculer le moment factoriel suivant :

∞ ∞
X X λk
E [X(X − 1)] = k(k − 1)PX (X = k) = e−λ k(k − 1)
k!
k=0 k=0
∞ k ∞
X λ X λk−2
= e−λ 2 −λ
=λ e = λ2 e−λ eλ
(k − 2)! (k − 2)!
k=2 k=1
= λ2 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 244 — #254


i i

244 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

On en déduit la variance qui se calcule comme suit :

2
V (X) = E [X(X − 1)] + E(X) − [E(X)] = λ2 + λ − λ2
V (X) = λ.

Remarque 12.3.6
Si deux variables aléatoires X et Y sont indépendantes et suivent deux lois de
Poisson de paramètre λ > 0 et µ > 0, (X P(λ) et Y P(µ)), alors leur somme
X + Y suit aussi la loi de Poisson de paramètre (λ + µ) et on a :

X +Y P(λ + µ)

12.4 Exercices
12.4.1 Enoncés
Exercice 1
Une urne contient cinq boules, deux qui portent le numéro 1 et trois qui portent le
numéro 2. On effectue deux tirages succéssifs sans remise dans cette urne.
On appelle coïncidence le fait de tirer une boule de numéro i au ième tirage, avec
i = 1, 2.
1) Déterminer la loi de probabilité de la variable aléatoire X qui représente le
nombre de coïncidences observées.
2) Calculer l’espérance E(X) et la variance V (X).
Exercice 2
Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro 1,
et quatre qui portent le numéro 3.
On extrait simultanément deux boules dans cette urne.
1) Déterminer la loi de probabilité de la variable aléatoire X qui représente la
somme des numéros obtenus.
2) Calculer l’espérance E(X) et la variance V (X).
Exercice 3
Trois urnes A, B, C contiennent respectivement :
A : une boule blanche et trois boules noires
B : deux boules blanches et deux boules noires
C : trois boules blanches et une boule noire.
On tire au hasard une boule dans chacune des trois urnes.Soit X le nombre total
de boules blanches obtenues.
1) Donner la loi de probabilité de X et son diagramme en bâtons.
2) Donner la fonction de répartition de X et sa courbe cumulative.
Exercice 4
Lors d’une enquête, on a intérogé cinq hommes et 3 femmes. On choisit au hasard
et sans remise les personnes une à une jusqu’à obtenir un homme.
Soit X le nombre de tirage nécessaire pour avoir le premier homme.
Déterminer la loi de probabilité de X, son espérance et sa variance.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 245 — #255


i i

12.4 Exercices 245

Exercice 5
Soit X une variable aléatoire de densité f (x) définie comme suit :

 x + 2, pour x ∈ [−2, −1]
f (x) = −x + 2, pour x ∈ [1, 2]
0 sinon.

1) Déterminer la fonction de répartition de X.


2) Calculer l’espérance E(X) et la variance V (X).
Exercice 6
Soit Y une variable aléatoire de densité g(y) définie comme suit :
y
 2
g(y) = a (1 − a ), pour 0 ≤ y ≤ a
0 sinon.
où a est un réel strictement postif.
1) Déterminer la fonction de répartition de Y.
2) Calculer l’espérance E(Y ) et la variance V (Y ).
Exercice 7
Un commentateur sportif affirmait que le gain du match de double en coupe Davis,
était généralement synonyme de victoire finale. Le pays gagnant est celui qui remporte
le plus de maths, la rencontre comportant 4 maths en simple et un match en double.
On fait l’hypothèse que pour ces cinq matchs, chaque pays a la même probabilité
de l’emporter.
1) Déterminer la loi de probabilité de X qui représente le nombre de matchs gagnés
par une équipe.
2) En déduire la probabilité que le pays gagnant ait effectivement remporté le
match de double.
3) Calculer la probabilité qu’un pays ait remporté le match de double, sachant
qu’il a gagné.
Que penser de l’affirmation de ce commentateur ?
Exercice 8
Un étudiant a besoin d’aide d’un groupe d’amis de sa classe pour réviser ses
examens. Quand il téléphone à un ami, il y a une chance sur quatre qu’il accepte.
Soit X la variable aléatoire qui représente le nombre d’amis que l’étudiant doit
contacter pour obtenir cette aide.
1) Déterminer la loi de probabilité de X.
2) Calculer la probabilité d’avoir au plus trois amis dans le groupe.
3) Calculer l’espérance E(X).
Exercice 9
Lors d’un examen oral, on demande à un étudiant de tirer les trois sujets qu’il
aura à traiter dans une urne qui en contient dix sujets. Parmi ces dix sujets, il y en a
trois que l’étudiant ne connaît pas.
Soit X la variable aléatoire qui représente le nombre de sujets qui seront inconnus
à l’étudiant à l’issu de ce tirage.
1) Calculer les probabilités des différentes valeurs possibles de X.
2) En déduire l’espérance de X.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 246 — #256


i i

246 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

Exercice 10
Trois usines A, B et C fournissent respectivement 25%, 35% et 40% des bois de
hêtre nécessaires à une entreprise de fabrication de meubles. Dans leurs livraison, il y
a en moyenne 5%, 4% et 2% de bois inutilisables. Un bois est choisi au hasard dans
un stock important, ce bois est mauvais et inutilisable. Notons M l’événement " le
bois est mauvais".
Calculer les probabilités conditionelles suivantes P (A/D), P (B/D) et P (C/D)
pour que ce bois inutilisable provienne des usines A, B ou C ?

12.4.2 Corrigés
Exercice 1
1) Le nombre possible de coïncidence est 0, 1, ou 2. Aucune coïncidence correspond
au tirage d’une boule 2, puis d’une boule 1 :

3 2 3
P (X = 0) = P (21) = × =
5 4 10
P (X = 0) = 0, 3
Une coïncidence unique peut se produire au premier ou au second tirage :

P (X = 1) = P (11) + P (22)
2 1 3 2 4
= × + × =
5 4 5 4 10
P (X = 1) = 0, 4
Pour deux coïncidences :
2 3 3
P (X = 2) = P (12) = × = = 0, 3
5 4 10
2) L’espérance est par définition égale à
P
E(X) = k.P (X = k)
k≥0

E(X) = 0 × P (X = 0) + 1 × P (X = 1) + 2 × P (X = 2)
 
4 3
E(X) = + 2× =1
10 10
Pour calculer la variance, calculons avant le moment d’ordre 2 :

E(X 2 ) = k 2 .P (X = k)
P
k≥0

= 02 × P (X = 0) + 12 × P (X = 1) + 22 × P (X = 2)
 
2 4 3 16
E(X ) = + 4× =
10 10 10

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 247 — #257


i i

12.4 Exercices 247

On en déduit la variance :

2
V (X) = E(X 2 ) − [E(X)]
16 6 3
V (X) = −1= = = 0, 6
10 10 5
Exercice 2
1) On note (i, j) l’événement "avoir tiré les boules i et j" ; pour i = j il y a une
seule façon d’obtenir ce couple et deux pour i 6= j.
On obtient ainsi :

P (X = 0) = P (0; 0) = 0
1 2 2
P (X = 1) = P (0; 1) = 2 × × =
10 9 45
4
P (X = 2) = P (0; 2) + P (1; 1) =
45
10
P (X = 3) = P (0; 3) + P (2; 1) =
45
11
P (X = 4) = P (2; 2) + P (3; 1) =
45
12
P (X = 5) = P (3; 2) =
45
6
P (X = 6) =
45
2) L’espérance est :

P
E(X) = k.P (X = k)
k≥0
2 8 30 44 60 36 180
E(X) = + + + + + =
45 45 45 45 45 45 45
E(X) = 4
le moment d’ordre 2 est
E(X 2 ) = k 2 .P (X = k)
P
k≥0

160
E(X 2 ) =
9
Par suite la variance est égale à

2
V (X) = E(X 2 ) − [E(X)]
160 160 − 144
= − 16 =
9 9
16
V (X) = ≈ 1, 78
9

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 248 — #258


i i

248 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

Exercice 3
1) Soient les événements suivants :
E1 : ” tirer une boule blanche de A” : P (E1 ) = 41
E2 : ” tirer une boule blanche de B” : P (E2 ) = 12
E3 : ” tirer une boule blanche de C” : P (E3 ) = 34
Pour i 6= j, Ei et Ej , ainsi que Ei et Ej , sont indépendants.
Ne pas avoir de boule blanche :

[X = 0] = E1 ∩ E2 ∩ E3

donc

P (X = 0) = P (E1 ∩ E2 ∩ E3 ) = P (E1 ) × P (E2 ) × P (E3 )


     
1 1 3 3
= 1− × 1− × 1− =
4 2 4 32

Avoir une seule boule blanche :


  
[X = 1] = E1 ∩ E2 ∩ E3 ∪ E1 ∩ E2 ∩ E3 ∪ E1 ∩ E2 ∩ E3

donc

P (X = 1) = P (E1 ∩ E2 ∩ E3 ) + P (E1 ∩ E2 ∩ E3 ) + P (E1 ∩ E2 ∩ E3 )


= P (E1 ) × P (E2 ) × P (E3 ) + P (E1 ) × P (E2 ) × P (E3 ) + P (E1 ) × P (E2 ) × P (E3 )
           
1 1 3 1 1 3 1 1 3
= × 1− × 1− + 1− × × 1− + 1− × 1− ×
4 2 4 4 2 4 4 2 4
13
P (X = 1) =
32
Avoir deux boules blanches :
  
[X = 2] = E1 ∩ E2 ∩ E3 ∪ E1 ∩ E2 ∩ E3 ∪ E1 ∩ E2 ∩ E3

donc

P (X = 2) = P (E1 ∩ E2 ∩ E3 ) + P (E1 ∩ E2 ∩ E3 ) + P (E1 ∩ E2 ∩ E3 )


= P (E1 ) × P (E2 ) × P (E3 ) + P (E1 ) × P (E2 ) × P (E3 ) + P (E1 ) × P (E2 ) × P (E3 )
     
1 1 3 1 1 3 1 1 3
= × × 1− + × 1− × + 1− × ×
4 2 4 4 2 4 4 2 4
13
P (X = 2) =
32
Et enfin avoir toirs boules blanches :

[X = 3] = (E1 ∩ E2 ∩ E3 )

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 249 — #259


i i

12.4 Exercices 249

donc

P (X = 3) = P (E1 ∩ E2 ∩ E3 )
= P (E1 ) × P (E2 ) × P (E3 )
1 1 3
= × ×
4 2 4
3
P (X = 2) =
32

D’où le tableau de la loi de probabilité de X :

k 0 1 2 3 Total
3 13 13 3
P (X = k) 32 32 32 32 1

Et le diagramme en bâtons est le suivant :

2) La fonction de répartition de X est définie par :


Pour

x<0 F (x) = P (X < 0) = P (∅) = 0


3
0≤x<1 F (x) = P (X < 1) = P (X = 0) = 32
1≤x<2 F (x) = P (X = 0) + P (X = 1) = 32 + 13
3 1
32 = 2
3 13 13 29
2≤x<3 F (x) = P (X = 0) + P (X = 1) + P (X = 2) = 32 + 32 + 32 = 32
x≥3 F (x) = 29 3
32 + 32 = 1

La courbe de la fonction de répartition cumulative est :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 250 — #260


i i

250 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

Exercice 4
Le nombre de tirage minimum pour avoir un homme est 1 ; et le nombre maximun
est 4 tirages (si les 3 premiers tirages correspondent au choix des femmes).
La variable aléatoire X prend donc les valeurs 1, 2, 3 et 4.
La loi de X est

5
P (X = 1) =
8
3 5 15
P (X = 2) = × =
8 7 56
3 2 5 5
P (X = 3) = × × =
8 7 6 56
3 2 1 5 1
P (X = 4) = × × × =
8 7 6 5 56
Donc en résumé on a :

k 1 2 3 4 Total
35 15 5 1
P (X = k) 56 56 56 56 1
L’espérance de X est
P
E(X) = k.P (X = k)
k≥0
35 30 15 4 84
= + + + =
56 56 56 56 56
E(X) = 1, 5

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 251 — #261


i i

12.4 Exercices 251

Le moment d’ordre 2 de X :

156
E(X 2 ) = k 2 .P (X = k) =
P
k≥0 56
On en déduit la variance de X :

2
V (X) = E(X 2 ) − [E(X)]
 2
156 84 1680
= − =
56 56 3136
V (X) ≈ 0, 54

Exercice 5
1) Fonction de répartition :

0 si x < −2,

 Rx x2

 −2 (t + 2)dt = 2 + 2x + 2 si − 2 ≤ x ≤ −1


F (x) = F (−1) = 12 si − 1 ≤ x ≤ 1
 Rx x2



 F (1) + 1
(−t + 2)dt = − 2 + 2x − 1 si 1 ≤ x ≤ 2
1 si x ≥ 2

2) L’espérance est :

R −1 R2
E(X) = (x + 2)dx + 1 (−x + 2)dx
−2
2
x2
 2
x
= + 2x−1
−2 + − + 2x
2 2 1
E(X) = 1

Le moment d’ordre deux est :

R −1 R2
E(X 2 ) = (x3 + 2x2 )dx + 1 (−x3 + 2x2 )dx
−2
 4 −1  4 2
x x3 x x3
= +2 + − +2
4 3 −2 4 3 1
30 28
=− +
4 3
2 11
E(X ) =
6
Par suite la variance de X est :
2
V (X) = E(X 2 ) − [E(X)] .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 252 — #262


i i

252 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

11 5
V (X) = −1= .
6 6
Exercice 6
1) La fonction de répartition de Y est
- pour y < 0, G(y) = 0
- pour y ≥ a, G(y) = 1 h iy
Ry t2 2y y
- pour 0 ≤ y ≤ a, G(y) = a2 0 (1 − at )dt = 2

a t− 2a = a 1− 2a
0
2) L’espérance de Y est :

y2 a2 a3
 
2R a 2 a
E(Y ) = 0
(y − )dy = − =
a a a 2 3a 3
Le moment d’ordre 2 est :

2 R a 2 y3 a3 a4 a2
 
2 2
E(Y ) = 0
(y − )dx = − = .
a a a 3 4a 6
D’où la variance de Y est égale à
2
V (Y ) = E(Y 2 ) − [E(Y )]

a2  a 2 a2
V (Y ) = − =
6 3 18
Exercice 7
1) La variable aléatoire X qui représente le nombre de matchs gagnés par une
équipe suit une loi binômiale de paramètre 5 et 1/2 :
1
X B(5; ).
2
On a donc  k  5−k
1 1
P (X = k) = C5k
2 2
2) Soit l’événement G : " Gain du match de double en coupe Davis "
Un pays est gagnant s’il remporte 3 matchs, donc pour X ≥ 3. la probabilité que
le pays gagnant ait effectivement remporté le match de double est donc :

5
P 5
P
P {G ∩ (X ≥ 3)} = P {G ∩ (X = k)} = P (X = k) .P (G/ (X = k)
k=3 k=3

Si un pays a gagné k matchs, tous les choix parmi les cinq rencontres sont équipro-
bables, donc :

C4k−1
P (G/ (X = k) =
C5k

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 253 — #263


i i

12.4 Exercices 253

Ainsi
5 C k C k−1 11
P 5 4
P (G ∩ (X ≥ 3)) = 5 k
= 5 ≈ 0, 34
k=3 2 C5 2
3) Soit l’événement D : " Gain de la rencontre en coupe Davis "

P (G ∩ (X ≥ 3)) 11/32 11
P (G/D) = = = ≈ 0, 69.
P (X ≥ 3) 1/2 16
L’affirmation de ce commentateur paraît fondée puisque cette probabilité est
supérieur à 1/2.
Exercice 8
Un étudiant a besoin d’aide d’un groupe d’amis de sa classe pour réviser ses
examens. Quand il téléphone à un ami, il y a une chance sur quatre qu’il accepte.
1) La variable aléatoire X représente le nombre d’amis que l’étudiant doit contacter
pour obtenir cette aide, donc X.suit une loi géométrique et on a pour tout entier
k≥1:

3k−1
P (X = k) =
4k
2) La probabilité d’avoir au plus trois amis dans le goupe est
3
P 37
P (X ≤ 3) = P (X = k) =
k=1 64
1
3) Le paramètre de la loi géométrique est 4 donc l’espérance est égale à

E(X) = 4
Exercice 9
1) La variable aléatoire X suit une loi hypergéométrique ; alors on a pour tout
entier 0 ≤ k ≤ 3 :

C4k C63−k
P (X = k) = 3
C10
On obtient alors les probabilités des différentes valeurs possibles de X :
1 1 3 1
P (X = 0) = ; P (X = 1) = ; P (X = 2) = ; P (X = 3) =
6 2 10 30
2) L’espérance d’une loi hypergéométrique est :
4
E(X) = np = 3 × = 1, 2
10
Exercice 10
En utilisant la formule des probabilités totales, on obtient :
0, 25 × 0, 05 125
P (A/D) = = = 0, 36
0, 25 × 0, 05 + 0, 04 × 0, 35 + 0, 02 × 0, 40 345

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 254 — #264


i i

254 Chapitre 12. Variables Aléatoires Discrètes - Lois Discrètes

0, 04 × 0, 35 140
P (B/D) = = = 0, 41
0, 25 × 0, 05 + 0, 04 × 0, 35 + 0, 02 × 0, 40 345
et
0, 02 × 0, 40 80
P (C/D) = = = 0, 23
0, 25 × 0, 05 + 0, 04 × 0, 35 + 0, 02 × 0, 40 345

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 255 — #265


i i

CHAPITRE 13

Variables Aléatoires Continues - Lois Continues

Dans ce chapitre, nous allons définir la variable aléatoire continue, sa loi de probabilité,
sa fonction de densité et nous terminerons par présenter les différentes lois usuelles
continues avec leurs espérances et variances respectives.

13.1 Définitions
13.1.1 Variable aélatoire continue
Au cours d’une expérience aléatoire continue dans le temps, on associe souvent au
résultat un nombre réel positif.
Exemple 13.1.1
Durée de vie d’une ampoule, le résultat en heure est

{100; 105, 67; 99, 85; ...}

Exemple 13.1.2
Temps d’attente en minute dans une file devant un guichet

{7; 14, 5, 6; 3, 4, 8, 2; 10, 9; ...}

On remarque que dans ces deux exemples, les résultats obtenus sont des réels
positifs et non dénombrables, on a donc Ω = R+ .

On admettera dans ce chapitre que l’on peut construire une probabilité P sur Ω,
non dénombrables vérifiant les propriétés de la définition d’une probabilité dans le cas
discret.
Définition 13.1.1
On appelle variable aléatoire réelle, v.a.r., définie sur (Ω, A) un espace de probabilité,
une application X : Ω −→ R telle que pour tout intervalle I ⊂ R on ait :

X −1 (I) = {ω ∈ Ω/X(ω) ∈ I} ∈ A

cela exprime que l’image inverse d’un ontervalle quelconque est un événement.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 256 — #266


i i

256 Chapitre 13. Variables Aléatoires Continues - Lois Continues

Il suffit de vérifier que pour tout réel x on a :

X −1 (] − ∞, x]) ∈ A

Exemple 13.1.3
La durée de vie d’un téléphone portable est représentée par une v.a.réelle continue.

13.1.2 Loi de probabilité


Définition 13.1.2
La loi de probabilité ou la distribution d’une variable aléatoire réelle continue, X
est la donnée des probabilités P ({X ≤ x}) pour toutes les valeurs x ∈ R prise par la
v.a.c. X.
Autrement dit elle est déterminée dans le cas continue par la fonction de répartition
(f.r.) F , définie pour tout réel x par :

F (x) = PX (X ≤ x) = P {X −1 (] − ∞, x])} = P {ω ∈ Ω/X(ω) ≤ x}

Exemple 13.1.4
La loi de probabilité associé à une durée de vie d’un téléphone portable ou le temps
passé dans une file d’attente devant un guichet, sont représentés par des v.a. continues.

13.1.3 Fonction de répartition


Définition 13.1.3
La fonction de répartition d’une v.a.réelle X, est l’application F définie pour x
réel par :
F : R −→ [0; 1]
x 7−→ P ({X ≤ x})
F est une fonction croissante au sens large.
Remarque 13.1.1
Dans le cas continue la f.r.F n’est plus en fonction en escalier.
Propriété 13.1.1
F est fonction croissante au sens large.
En effet, pour x ≤ y, on a (X ≤ x) =⇒ (X ≤ y) et par conséquent

F (x) = P (X ≤ x) ≤ P (X ≤ y) = F (y).

Propriété 13.1.2
La fonction de répartition prend ses valeurs dans l’intervalle [0; 1] et on a :

0 ≤ F (x) ≤ 1

avec lim F (x) = 0 et lim F (x + h) = 1.


x→−∞ x→+∞
Propriété 13.1.3
La f.r. est continue à droite et on a : lim+ F (x + h) = F (x)
h→0
Propriété 13.1.4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 257 — #267


i i

13.1 Définitions 257

La probabilité de l’intervalle ]a, b], pour a < b, est égale à :

PX (a < X ≤ b) = F (b) − F (a)

Définition 13.1.4
Soit X une v.a. réelle définie sur un espace de probabilité et F sa fonction de
répartition.
On dit que X est v.a. continue s’il existe une fonction numérique f définie sur R
telles que :
(i) pour tout x ∈ R, f (x) ≥ 0
(ii) f est continue sur R Rx
(iii) pour tout x ∈ R, F (x) = −∞ f (t)dt et sa limite existe et vaut 1
Rx R +∞
lim F (x) = lim −∞ f (t)dt = −∞ f (t)dt = 1
x→+∞ x→+∞
Dans ce cas la fonction f est alors appelée une densité de probabilité de la v.a. X.

Remarque 13.1.2
La dérivée de la fonction de répartition donne la densité de probabilité et on a :

F 0 (x) = f (x)
Et il faut faire très attention à la notation entre F et f qui n’ont pas du tout la
même définition.
Définition 13.1.5
Soit f une fonction continue sur R, on définit alors on a les intégrales généralisées
suivantes :
R +∞ Rx
(i) pour a ∈ R, a f (t)dt = lim ( a f (t)dt)
x→+∞
Rb Rb
(ii) pour b ∈ R, −∞ f (t)dt = lim ( x f (t)dt)
x→−∞
R +∞ Rc R +∞
(iii) pour c ∈ R, −∞ f (t)dt = −∞ f (t)dt + c f (t)dt (la relation de Chasles)

Lorsque ces limites existent, on dit que l’intégrale est convergente. Dans le cas
contraire elle sera divergente (i.e. si la limite vaux ±∞ ou si elle n’existe pas)
Propriété 13.1.5
La probabilité d’un intervalle s’obtient en intégrant la densité sur cet intervalle :
Rx
PX {X ∈ [x1 , x2 ]} = x12 f (t)dt.

En effet :
PX (x1 ≤ X ≤ x2 ) = F (x
R x22) − F (x1 ) R x1
= −∞ f (t)dt − −∞ f (t)dt
R x2 R −∞
= −∞ f (t)dt + x1 f (t)dt
Rx
PX (x1 ≤ X ≤ x2 ) = x12 f (t)dt.
Propriété 13.1.6
Si la fonction F est continue on dit que X est une variable aléatoire réelle continue,
et on a :
∀x ∈ R, PX (X = x) = 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 258 — #268


i i

258 Chapitre 13. Variables Aléatoires Continues - Lois Continues

c’est à dire que la probabilité d’un point est toujours nulle, dans ce cas la loi est
dite diffuse.
Dans le cas où certains points ont une probabilité non nulle, alors la loi est dite
mixte, comprtant une partie continue et une partie discrète correspondante à ces
points.
Exemple 13.1.4
Soit la fonction de répartition F définie par :


 0 si x < 0
x/2 si 0 ≤ x < 3

F (x) =

 x/5 si 3 ≤ x < 5
1 si 5 ≤ x

Cette fonction est continue pour x = 0 et x = 5. Par contre, si elle est bien continue
à droite en x = 3, comme toute f.r., avec lim+ F (3 + h) = F (3) = 3/4, elle n’est pas
h→0
continue en ce point car :

1 3
lim F (3 − h) = lim+ (3 − h) = = F (3) + PX (X = 3)
h→0+ h→0 2 2

et par conséquent il s’agit d’une loi mixte, avec une partie continue sur les intervalles
]−∞, 1[ et ]1, +∞[, et une partie discrète concentrée au point 3 avec PX (X = 3) = 3/4.

13.2 Espérance, Moments et Variance


13.2.1 Espérance
Définition 13.2.1 R +∞
Soit X une v.a.c.et si −∞ xf (x)dx existe c’est à dire convergente alors on appelle
espérance mathématique de la v.a.c X la quantité :
R +∞
E(X) = −∞
xf (x)dx

Remarque 13.2.1
Les propriétés de l’espérance sont celles de l’intégrale et sont identiques au cas
discret i.e. il s’agit d’un opérateur linéaire :
Propriété 13.2.1
si X et Y sont deux v.a.c. et α, β deux réels quelconques, on suppose que l’espérance
existe, alors on a :

(i) E(X + α) = E(X) + α


(ii) E(αX) = αE(X)
(iii) E(X + Y ) = E(X) + E(Y )
(iv) E(αX + βY ) = αE(X) + βE(Y )

Exemple 13.2.1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 259 — #269


i i

13.2 Espérance, Moments et Variance 259

Soit une v.a.c. X suivant une loi de probabilité de densité f (x) = 5x3 définie sur
l’intervalle [0, 2] alors l’esperance de X est :
R2 R2
E(X) = 0 xf (x)dx = 0 x × 5x3 dx
 5 2
R2 4 x  2
= 5 0 x dx = 5 = x5 0
5 0
E(X) = 25 = 32

Définition 13.2.2
Soit X une v.a.c.de densité f et ϕ une fonction numérique définie sur R (ϕ :
X(Ω) −→ R), telle que P (ϕ(X) ≤ x) existe pour tout x ∈ R, alors l’espérance de
ϕ(X) existe et vaut :
Z +∞
E(ϕ(X)) = ϕ(t)f (t)dt
−∞

si cette intégrale est absolument convergente.

13.2.2 Moments
Définition 13.2.3
Le moment non centré d’ordre k ∈ N∗ , est la quantité, si elle existe, définie par :
R +∞
mk (X) = E(X k ) = −∞ xk f (x)dx

Remarque 13.2.2
L’espérance mathématique d’une v.a. est le moment d’ordre k = 1, en effet :
R +∞ R +∞
m1 (X) = −∞ x1 f (x)dx = −∞ xf (x)dx = E(X)

Exemple 13.2.2
Si la série numérique R x2 f (x)dx est convergente alors le moment d’ordre 2 d’une
R

v.a.c. est donnée par la quantité :


Z
m2 (X) = x2 f (x)dx = E(X 2 )
R

Définition 13.2.4
Le moment centré d’ordre k ∈ N∗ , est la quantité, si elle existe, définie par :
Z
µk (X) = E[X − E(X)] = [x − E(X)]k f (x)dx
k
R

13.2.3 Paramètre d’asymétrie


Le moment centré d’ordre trois définie l’asymétrie d’une distribution. Cette dernière
est symétrique si µ3 = 0, dissymétrique étalée vers la droite (respectivement la gauche)
si µ3 > 0 (respectivement µ3 < 0).
Les coefficients de symétrie (appelés aussi skewness) permettent d’obtenir un
paramètre indépendant des unités. Il en existe deux :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 260 — #270


i i

260 Chapitre 13. Variables Aléatoires Continues - Lois Continues

- le coefficient de symétrie de Pearson définie par :

µ23
β1 =
µ32

- le coefficient de symétrie de Fisher définie par :


µ3
γ1 =
σ3
où σ définie l’écart-type.

13.2.4 Paramètres d’aplatissement


Les coéfficients d’aplatissement (appelés aussi kurtosis) sont calculés à partir du
moment centré d’ordre 4. Il en existe aussi deux connus, qui sont :
- le coefficient d’aplatissement de Pearson définie par :
µ4
β2 =
σ4
où σ définie l’écart-type.
- le coefficient d’aplatissement de Fisher définie par :
µ4
γ 2 = β2 − 3 = − 3.
σ4

13.2.5 Variance, Covariance et Quantiles


Définition 13.2.5
Soit X une v.a.c. ademettant un moment d’ordre 2 fini (i.e. E(X 2 ) < +∞). On
appelle variance la quantité définie par :
Z
V (X) = E[X − E(X)]2 = [x − E(X)]2 f (x)dx
R
V (X) = E(X 2 ) − [E(X)]2 = σ 2 (X)

avec σ 2 (X) définissant l’écart-type de la v.a.c. X.


Les propriétés de la variance dans le cas continue sont identiques à celle dans le
cas discret. De même pour la covariance et le coefficient de corrélation.
Propriétés 13.2.2
Soient X et Y deux v.a.c. telles que E(X 2 ) < +∞ et E(Y 2 ) < +∞ et α un réel
quelconque, alors on a :

(i) V (X) ≥ 0
(ii) V (α) = 0, ∀α ∈ R
(iii) V (X + α) = V (X)
(iv) V (αX) = α2 V (X)
(v) Si les deux v.a. X et Y sont indépendantes, alors
V (X + Y ) = V (X) + V (Y )

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 261 — #271


i i

13.3 Lois usuelles continues 261

Définition 13.2.6
Soient X et Y deux v.a.d. ayant des moments d’ordre 2 finis. On appelle covaraince
de X et de Y la quantité

Cov(X, Y ) = E(XY ) − E(X)E(Y )

Propriétés 13.2.3
Soient X et Y deux v.a. ayant un moment d’ordre 1 fini :

i) Cov(X, X) = V (X)
ii) Cov(X, Y ) = Cov(Y, X)
iii) Si X et Y sont indépendantes alors
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(X)E(Y ) − E(X)E(Y ) = 0
iv) Cov(αX + γ, βY + ε) = αβCov(X, Y ) avec α, β, γ et ε des réels quelconques
v) Cov(X + Y, Z + T ) = Cov(X, Z) + Cov(X, T ) + Cov(Y, Z) + Cov(Y, T )
avec Z et T deux v.a. ayant un moment d’ordre 1 fini
vi) Si X et Y ont un moment d’ordre 2 fini alors
V (X + Y ) = V (X) + E(Y ) + 2Cov(X, Y )

Définition 13.2.7
Soient X et Y deux v.a. ayant des moments d’ordre 2 finis. On appelle coefficient
de correlation de X et de Y la quantité :

Cov(X, Y )
ρ(X, Y ) = .
σ(X) σ(Y )

Définition 13.2.8
Soit X une v.a. de fonction de répartition F et α ∈]0; 1[. On appelle quantite
d’ordre α, tout réel xα tel que :

F (xα ) = α ⇐⇒ P (X < xα ) = α

La médiane est le quantile d’ordre 1/2.


Le 1er quartile est le 3ème quartile sont les quantiles d’ordre respectifs 1/4 et 3/4.
De même le ième décile est le quatile d’ordre i/10.

13.3 Lois usuelles continues


Nous allons présenter dans cette section, les principales lois de probabilité continues
pouvant être retenues pour la modélisation statistique.

13.3.1 Loi uniforme continue


Soient (a, b) ∈ R2 avec a < b, on dit que la v.a. X suit une loi uniforme continue, et
on note X U([a; b]), si sa densité est constante sur l’intervalle fini [a; b]et on a :
 1
b−a si x ∈ [a; b]
1
f (x) = 1[a;b] (t) =
b−a 0 sinon

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 262 — #272


i i

262 Chapitre 13. Variables Aléatoires Continues - Lois Continues

Par conséquent, on a la fonction de répartition qui est définie par :



Rx  0 si x ≤ a
x−a
F (x) = −∞ f (t)dt = si a < x ≤ b
 b−a
1 si b < x

Le fractile d’ordre α ∈]0; 1[, qui est défini par F (xα ) = α,a pour valeur ici

xα = a + (b − a)α.

L’espérance de la loi uniforme continue se calcule comme suit :


R +∞
E(X) = −∞ xf (x)dx
1 Rb
= xdx
b−a a
 2 b
1 x
=
b−a 2 a
b+a
= .
2
Dans le cas particulier où a = 0 et b = 1, on a E(X) = 1/2.
Afin de calculer la variance, il faut aupravant calculer le moment d’ordre 2 :
R +∞
E(X 2 ) = −∞ x2 f (x)dx
1 Rb 2
= x dx
b−a a
 3 b
1 x
=
b−a 3 a
3
(b − a)
=
2(b − a)
(b − a)(b2 + ab + a2 )
=
3(b − a)
= (b2 + ab + a2 )/3

On en déduit la variance :

V (x) = E(X 2 ) − [E(X)]2


2
(b2 + ab + a2 )

b+a
= −
3 2
2
(b − a)
= .
12
Donc V (X) = 1/12 dans le cas de la loi uniforme sur [0; 1].

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 263 — #273


i i

13.3 Lois usuelles continues 263

13.3.2 Loi exponentielle


Soit a un réel strictement positif (a > 0), on dit que la v.a. X suit une loi exponentielle
de paramètre λ, et on note X E(λ), si sa densité f est :
λe−λx si 0 < x

f (x) =
0 sinon
Par conséquent, on a la fonction de répartition qui est définie par :
Rx Rx
F (x) = −∞ f (t)dt = λ 0 e−λt dt
x  x
= λ −e−λt /λ 0 = −e−λt 0


= −e−λx − (−e−λ0 )
F (x) = 1 − e−λx

⇐⇒ P (X ≤ x) = P (X < x) = 1 − e−λx

On déduit que :
P (X ≥ x) = P (X > x) = 1 − P (X ≤ x) = 1 − 1 − e−λx = e−λx .


L’espérance d’une loi exponentielle se calcule en utilisant l’intégration par parties :


R +∞ R +∞
E(X) = −∞ tf (t)dt = λ 0 te−λt dt
Z +∞
+∞
= −te−λt /λ 0 + e−λt dt

0
+∞
= −e−λt /λ 0


= 1/λ
On calcule aussi le moment d’ordre 2 de la même manière en utilisant l’intégration
par parties :
R +∞
E(X 2 ) = λ 0 t2 e−λt dt
Z +∞
 2 −λt +∞
= −t e /λ 0 + 2 te−λt dt
0
2 2 1
= E(X) = ×
λ λ λ
2
= 2.
λ
Par conséquent, la variance d’une loi exponentielle de paramètre λ > 0 est :
 2
2 2 2 1
V (X) = E(X ) − [E(X)] = 2 −
λ λ
1
= 2
λ

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 264 — #274


i i

264 Chapitre 13. Variables Aléatoires Continues - Lois Continues

13.3.3 Loi normale ou de Laplace-Gauss


Soient m un réel quelconque (m ∈ R) et σ un réel strictement positif (σ > 0), on dit
que la v.a. X suit une loi normale de paramètre m et σ, et on note X N (m, σ 2 ), si
sa densité f s’écrit sous la forme suivante :
(x − m)2
 
1
f (x) = √ exp −
σ 2π 2σ 2
On sait par ailleurs que l’intégrale de la densité sur son domaine de définition est
égale à l’unité. Par conséquent, on a :
(x − m)2
 
R +∞ R +∞ 1
−∞
f (x)dx = −∞
√ exp − dx = 1
σ 2π 2σ 2
(x − m)2 √
 
R +∞
⇐⇒ −∞ exp − 2
dx = σ 2π

Remarque 13.3.1
On peut vérifier que le graphe de la densité f symétrique par rapport à la droite
verticale x = m en vérifiant que :
f (2m − x) = f (x)
Remarque 13.3.2
Pour x = m l’expression (x − m)2 atteint son minimum, ce qui traduit que la
densité f atteint son maximum pour la valeur :
1
f (m) = √
σ 2π
R +∞
L’intégrale −∞ xf (x)dx est convergente, par conséquent, l’espérance E(X) existe
et vaut m car la densité est symétrique par rapport à m.
R +∞ R +∞
E(X) = −∞ xf (x)dx = −∞ (x − m + m)f (x)dx
R +∞ R +∞
= m −∞ f (x)dx + −∞ (x − m)f (x)dx
R +∞
= m + −∞ (x − m)f (x)dx
et l’intégrale est impaire de x − m = t, donc l’intégrale est nulle car elle est
convergente et impaire sur un intervalle centré à l’origine.
On obtient donc E(X) = m, l’espérance est égale à la moyenne de la loi qui est le
premier paramètre de la loi normale.
Calculons le moment d’ordre 2 afin de déduire la variance, en faisant un changement
de variable z = (x − m)/σ.
(x − m)2
 
2 1 R +∞ 2
E(X ) = √ x exp − dx
σ 2π −∞ 2σ 2
1 R +∞ 2 2 2
=√ −∞
(σ z + 2mσz + m2 )e−z /2 dz

σ 2 R +∞ 2 −z2 /2
=√ z e dz + m2
2π −∞

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 265 — #275


i i

13.3 Lois usuelles continues 265

En utilisant l’intégration par parties, on obtient :


" 2
#+∞
2 σ 2 ze−z /2
σ 2 R +∞ −z2 /2
E(X ) = − √ +√ e dz + m2
2π 2π −∞
−∞
E(X 2 ) = σ 2 + m2

Par conséquent, on la variance est égale à :

V (X) = .σ 2

Le second paramètre de la loi normale n’est autre que l’écart-type.


 Loi normale centrée réduite
Soit X une v.a. suivant une loi normale de paramètre m et σ (X N (m, σ 2 ).
Si la v.a. Z = (X − m)/σ, alors

1
E(Z) = [E(X) − m] = 0
σ

et

V (Z) = E(Z 2 ) = E[(X − m)2 /σ 2 ] = V (X)/σ 2


V (Z) = 1

Donc on dit que Z est une v.a.normale centrée réduite, de densité :

1 2
ϕ(z) = √ e−z /2

On en déduit, d’après la définition d’une densité, que
R +∞ 2 √
−∞
e−z /2
dz = 2π

et que la fonction de répartition est définie par :

1 R x −z2 /2
Φ(x) = √ e dz
2π −∞

Cette fonction de répartition Φ(x) n’est pas exprimable au moyen d’une fonction
usuelle et par conséquent les valeurs de Φ(x) sont fournies dans les tables statistiques
(Annexe : loi normale centrée réduite) pour x ≥ 0.
Pour x < 0, et vu que la fonction ϕ est paire (ϕ(−x) = ϕ(x)) alors on a P (Z <
−x) = P (Z > x) (symétrie de la loi normale par rapport au centre 0)
Ce qui signifie que
Φ(−x) = 1 − Φ(x).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 266 — #276


i i

266 Chapitre 13. Variables Aléatoires Continues - Lois Continues

13.3.4 Autres lois continues


Loi gamma
On dit que la v.a. X suit une loi gamma de paramètre p > 0 et θ > 0, notée,
X γ(p, θ), si X est positive et sa densité s’écrit comme suit :

θp −θx p−1
f (x) = e x ; x ≥ 0.
Γ(p)

La fonction gamma étant définie pour tout p > 0, par :


R +∞
Γ(p) = 0 e−x xp−1 dx.

Propriété 13.3.1
Pour tout p > 1, on a :

Γ(p) = (p − 1)Γ(p − 1).

Propriété 13.3.2
Pour tout p > 0, on a :
Γ(p) = (p − 1)!
L’espérance mathématique d’une v.a. suivant une loi gamma est E(X) = pθ ,
p(p+1)
le moment d’ordre 2 est E(X 2 ) = θ2 ,
et la variance est V (X) = θp2

13.3.5 Loi du khi-deux


On dit que X suit une loi de khi-deux à n degrès de liberté, notée X Xn2 , si X suit
la loi gamme de paramètre n/2 et 1/2 (X γ(n/2, 1/2)) où n ∈ N.
Sa densité est la fonction f définie par :

1
f (x) = e−x/2 x(n/2)−1
2n/2 Γ(n/2)

n/2
L’espérance d’une v.a. suivant une loi de khi-deux est E(X) = 1/2 = n,
n/2
et la variance est V (X) = 1/4 = 2n

Loi log-normale
On dit que X suit une loi log-normale de paramètre m et σ > 0, si ln(X) suit la loi
normale de paramètre m et σ > 0, (ln(X) N (m, σ 2 )).
Sa densité est la fonction f définie par :

(ln(x) − m)2
   
1 ln(x) − m 1
f (x) = ϕ = √ exp − ; ∀x > 0
σx σ σx 2π 2σ 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 267 — #277


i i

13.4 Exercices 267

Et sa fonction de répartition est :

F (x) = P (X < x) = P (ln(X) < ln(x))


 
ln(X) − m ln(x) − m
=P <
σ σ
 
ln(x) − m
F (x) = Φ ; ∀x > 0
σ

13.4 Exercices
13.4.1 Enoncés
Exercice 1
Soit la fonction F définie par :
ex

2pour x ≤ 0
F (x) =
1 pour x > 0

1) Montrer que la fonction F est une fonction de répartition.


2) La fonction f (x) = F 0 (x) est-elle une densité de probabilité ?
Exercice 2
On considère la fonction f définie par :

 0 pour x ≤ 0
1
f (x) = √ pour 0<x≤1
 2 x
0 pour x > 1

1) Montrer que la fonction f est une densité de probabilité sur son domaine de
continuité.
2) Déterminer sa fonction de répartition.
Exercice 3
Soit la fonction g définie sur R, par g(x) = ke−|x| .
1) Déterminer la valeur de k pour que g soit la densité de probabilité d’une variable
aléatoire X.
2) Déterminer la fonction de répartition de X admettant g pour densité de proba-
bilité.
3) Soit Y = X 2 . Déterminer la fonction de répartition et la densité de Y.
Exercice 4
On suppose que la durée de vie d’un individu est une variable aléatoire D, dont la
densité est définie par :

f (d) = kd2 (100 − d)2 si 0 ≤ d ≤ 100



f (d) = 0 sinon.

1) Déterminer la valeur de k.
2) Calculer E(D) l’espérance de la variable D.
3) Qu’elle est la probabilité pour qu’un individu meure entre 60 et 70 ans ?

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 268 — #278


i i

268 Chapitre 13. Variables Aléatoires Continues - Lois Continues

Exercice 5
Soit la fonction h définie comme suit :

h(x) = 0 pour x > 1 et x < 0
h(x) = α pour 0 ≤ x ≤ 1

1) Calculer la valeur de α, pour que la fonction h soit une densité de probabilité


d’une variable aléatoire X.
2) Déterminer la fonction de répartition de X admettant h pour densité de proba-
bilité.
3) Calculer E(X) l’espérance de X et V (X) la variance X
Exercice 6
Soit f la fonction définie par :


 f (x) = 0 pour x < −1
f (x) = x + 1 pour − 1 ≤ x ≤ 0


 f (x) = −x + 1 pour 0 ≤ x ≤ 1
f (x) = 0 pour x > 1

1) Montrer que f est une densité de probabilité d’une variable aléatoire X.


2) Déterminer la fonction de répartition F.
3) Calculer l’espérance et la variance X (E(X) et V (X)).
4) Montrer que pour k > 0 :
1
P (|x| > k) ≤
6k 2
Exercice 7
On considère une fonction g définie par :

y k+2
g(y) = , k > 0.
4
1) Calculer k pour que g(y) soit une densité de probabilité d’une variable aléatoire
Y sachant que g(y) = 0 pour y < 0 et y > 2.
2) Calculer E(Y ) l’espérance et V (Y ) la variance de la variable aléatoire Y.
3) Donner un minorant de la probabilité que Y soit supérieur à 1 en utilisant
l’inégalité de Bienaymé-Tchebychev.
4) Calculer P (Y ≥ 1) en utilisant la fonction de répartition de Y.
Exercice 8
Considérons une population d’atomes radioactifs à l’instant t = 0. On accepte
que, pour l’atome, la durée de vie, entre l’instant t = 0 et le moment où le noyau
se désintègre, est distribuée suivant une loi exponentielle de paramètre λ positif, de
densité : 
0 pour t ≤ 0
f (t) =
λe−λt pour t > 0
1) Calculer la probabilité que la durée de vie soit comprise entre −2 et 5.
2) Calculer la probabilité F (t) que la durée de vie soit inférieure à t.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 269 — #279


i i

13.4 Exercices 269

3) Déterminer α tel que F (α) = 0, 5.


4) Calculer l’espérance et la variance de la durée de vie d’un atome.
Exercice 9
Soit f l’application de R dans R définie par :
(
0 pour x < 0
f (x) = x − x8
2

4e pour x ≥ 0

1) Montrer que f est la densité de probabilité d’une variable aléatoire X.


2) Calculer l’espérance et la variance de la variable X, sachant que
R +∞ 1 − t2
−∞
√ e 2 dt = 1

Exercice 10
Une entreprise d’exportation de prêt à porter estime que la demande (en millier
d’unités, par mois) concernant l’un des articles qu’elle produit est une variable aléatoire
continue D dont la densité de probabilité est une fonction f de R dans R définie par :


 0 si x < 0
 −3x + 2 si 0 ≤ x < 31


f (x) = 1 si 13 ≤ x < 32
−3x + 3 si 23 ≤ x < 1




0 si x ≥ 1

1) Calculer la demande moyenne et l’écart-type de D.


2) Déterminer la fonction de répartition F de D.
3) Quelle est la probabilité que la demande d’un mois soit :
a. inférieure à 500 unités ?
b. comprise entre 200 et 600 unités ?
c. supérieure à 1000 unités ?
4) Déterminer le nombre d’unités tel que la moitié des demandes lui soit inférieure,
c’est-à-dire le nombre d tel que P (D < d) = 0, 5.
Que représente d. ?
Exercice 11
Soit U une variable aléatoire de loi uniforme continue sur [0, 1].
Démontrer que la variable aléatoire X = −ln(U ) suit une loi exponentielle.

13.4.2 Corrigés
Exercice 1
x
1) (i) La fonction F (x) = e2 est croissante pour x ∈ R− (évident pour une fonction
exponentielle), et constante pour x ∈ R∗+ donc elle croissante au sens large sur R.
(ii) Calculs de F aux limites

F (+∞) = lim F (x) = 1


(
x→+∞
ex
F (−∞) = lim =0
x→−∞ 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 270 — #280


i i

270 Chapitre 13. Variables Aléatoires Continues - Lois Continues

x
(iii) Pour x = 0, F (0) = 1
2 et lim+ e2 = 1
2, donc F est continue à droite pour
x→0
x = 0.
Pour x 6= 0, F est continue, donc F est continue à droite.
Les trois conditions (i), (ii) et (iii) sont statisfaites, donc la fonction F est bien
une fonction de répartition.
2) La fonction f est telle que f (x) = F 0 (x) donc on a :
 ex
0
f (x) = F (x) = 2 pour x ≤ 0
0 pour x > 0
Pour vérifier que la fonction f est une densité de probabilité, il faut que :
R +∞
−∞
f (x)dx = 1.
Ici on a :
 x 0
R +∞ R 0 ex e e0 ex
−∞
f (x)dx = −∞ 2
dx = = − lim
2 −∞ 2 x→−∞ 2
R +∞ 1
−∞
f (x)dx = .
2
R +∞
Par consquent −∞ f (x)dx = 12 6= 1, on en déduit que la fonction f n’est pas une
densité de probabilité.
Exercice 2
1) On a 
 0 pour x ≤ 0
1
f (x) = √ pour 0<x≤1
 2 x
0 pour x > 1
(i) f est positive ou nulle sur R.
(ii) f est continue par morceaux sur R
R +∞ R1 √ 1
(iii) −∞ f (x)dx = 0 2dx
√ = [ x] = 1.
x 0
Donc les trois conditions pour que f soit une densité de probabilité sont vérifiées.
2) La fonctionRde répartition correspondante est :
x
- pour x ≤ 0, −∞ f (t)dt = 0
Rx Rx √ x √
- pour 0 < x ≤ 1, −∞ f (t)dt = 0 2dt √ =
t
t 0= x
Rx R 1 dt √ 1
- pour x > 1, −∞ f (t)dt = 0 2√t = t 0=1
D’où : 
 √0 pour x ≤ 0
F (x) = x pour 0 < x ≤ 1
1 pour x > 1

F satisfait donc bien aux conditions classiques d’une fonction de répartition.


Exercice 3
Pour que g(x) = ke−|x| soit une densité de probabilité, il faut que :

 g(x) ≥ 0 d’où k > 0
f est continue par morceaux, ici g est continue sur R
 R +∞
−∞
g(x)dx = 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 271 — #281


i i

13.4 Exercices 271

Etudions la dernière conditions :


R +∞
⇐⇒ −∞ g(x)dx = 1
R +∞
⇐⇒ −∞ ke−|x| dx = 1
R0 R +∞
⇐⇒ k −∞ ex dx + k 0 e−x dx = 1
0 +∞
⇐⇒ k [ex ]−∞ + k −e−x 0 = 1


1
⇐⇒ 2k = 1 ⇐⇒ k =
2
car |x| = x si x ≥ 0 et |x| = −x si x ≤ 0.
En conclusion, pour que g soit une densité de probabilité il faut que k = 12 , on
aura alors g(x) = 12 e−|x| .
2) La Rfonction de répartition de X admettant g pour densité de probabilité.est
x
G(x) = 12 −∞ e−|t| dt.
- si x ≤ 0 :
1R x 1  t x 1
G(x) = −∞ et dt = e −∞ = ex
2 2 2
- si x ≥ 0 :
1R 0 t 1R x
G(x) = e dt + 0 e−t dt
2 −∞ 2
1  t 0 1  −t x
= e −∞ + −e 0
2 2
x
1 e 1 ex
= − + =1−
2 2 2 2

3) Soit Y = X 2 . La fonction de répartition de Y est G définie par :

G(y) = P (Y < y) pour y ∈ R+ .


√ √
L’événement Y < y se traduit par X 2 < y d’où − y < X < y
donc :
√ √ √ √
G(y) = P (− y < X < y) = F ( y) − F (− y)
1 √ 1 √ √
G(y) = 1 − e− y − e− y = 1 − e− y
2 2
On obtient la densité g(y) en dérivant G(y) :

e− y
g(y) = G0 (y) = √ .
2 y

Exercice 4
1) On doit avoir :
R +∞ R 100 R 100
−∞
f (t)dt = 0 kt2 (100 − t)2 dt = k 0 t2 (100 − t)2 dt = 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 272 — #282


i i

272 Chapitre 13. Variables Aléatoires Continues - Lois Continues

3
100
t4 t5

2t
R 100 2 2 3 4
⇐⇒ k 0
(100 t − 200t + t )dt = k 100 − 200 + =1
3 4 5 0
Après le calcul, on trouve
30
k = 10 .
10
2) L’espérance de la variable D.est :
R +∞ R 100
E(D) = −∞ t.f (t)dt = 0 kt3 (100 − t)2 dt = 50
3) La probabilité pour qu’un individu meure entre 60 et 70 ans est donnée par :
R 70
P (60 < D < 70) = 60 kt2 (100 − t)2 dt = 0, 154
Exercice 5
1) Pour que la fonction h soit une densité de probabilité d’une variable aléatoire
X, il faut que :
R +∞ R1 R1 1
−∞
h(t)dt = 0 h(t)dt = 0 αdt = [αt]0 = α = 1
2) Soit H la fonction de répartition de X admettant h pour densité de probabilité,
alors : Rx
H(x) = P (X ≤ x) = −∞ h(t)dt
On obtient alors : 
 0 si x < 0
H(x) = x si 0 ≤ x < 1
1 si x > 1

3) L’espérance de X est :
1
x2

R1 1
E(X) = 0
xdx = =
2 0 2
Le moment d’ordre 2 est :
R1 1
E(X 2 ) = 0
x2 dx =
3
Par suite la variance de X est égale à :
2 1
V (X) = E(X 2 ) − [E(X)] = .
12
Exercice 6
1) Il est clair que f est positive et que :
R +∞ R0 R1
−∞
f (x)dx = −1 (x + 1)dx + 0 (−x + 1)dx
 2 0  2 1
x x
= +x + − +x
2 −1 2 0
1 1
= (− + 1) + (− + 1)
2 2
=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 273 — #283


i i

13.4 Exercices 273

Donc f est une densité de probabilité.d’une variable aléatoire X.


2) La fonction de répartition F (x) = P (X ≤ x) est définie par :


 0 pour x < −1
 (x+1)2
pour − 1 ≤ x ≤ 0

F (x) = 2
(1−x)2


 1 − 2 pour 0≤x≤1
1 pour x > 1

3) On remarque que la fonction f est symétrique par rapport à l’axe des ordonnées.
Par suite l’espérance E(X) = 0.
On en déduit que la variance V (X) = E(X 2 ).

(x + 1)2 (1 − x)2
 
R0 R1
V (X) = −1 x dx + 0 x 1 − dx
2 2
1
V (X) =
6
4) L’inégalité de Bienaymé Tchebychev donne :
V (X)
P (|X − E(X)| > k) ≤
k2
1
Dans ce cas présent, ona E(X) = 0 et V (X) = 6 par suite on pour k > 0 :
1
P (|x| > k) ≤
6k 2
Exercice 7
1) Pour que g(y) soit une densité de probabilité d’une variable aléatoire Y , on doit
avoir :
R2
0
g(y)dy = 1
R 2 y k+2
= 0 dy
4
2k+3
=
4(k + 3)
on a donc :
2k+3 = 4(k + 3) ⇐⇒ k = 1
k = 1 est la seule solution positive.
2) L’espérance de Y est :
 5 2
R 2 y4 y 32
E(Y ) = 0 4
dy = = = 1, 6
20 0 20
 6 2
2
R 2 y5 y 64
E(Y ) = 0 dy = = ' 2, 67
4 24 0 24

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 274 — #284


i i

274 Chapitre 13. Variables Aléatoires Continues - Lois Continues

Donc la variance de la variable Y est :


 2
64 32
V (Y ) = − ' 0, 11
24 20

3)

P (X ≥ 1) = P (1 ≤ X ≤ 2, 2) (car P (X > 2, 2) = 0)
= P (E(X) − 0, 6 ≤ X ≤ E(X) + 0, 6)

L’inégalité de Bienaymé-Tchebychev donne alors :


0, 11
P (X ≥ 1) ≥ 1 − ' 0, 694
0, 62

4) Calculons directement

R 2 y3
P (Y ≥ 1) = 1 − F (1) = 1 − 0 4
dy
P (Y ≥ 1) = 0, 94

Exercice 8
Considérons une population d’atomes radioactifs à l’instant t = 0. On accepte
que, pour l’atome, la durée de vie, entre l’instant t = 0 et le moment où le noyau
se désintègre, est distribuée suivant une loi exponentielle de paramètre λ positif, de
densité : 
0 pour t ≤ 0
f (t) =
λe−λt pour t > 0
1) Soit D la variable correspondante à la durée de vie
R2 5
λe−λt dt = −e−λt 0 = 1 − e−5λ .

P (−2 ≤ D ≤ 5) = 0

2)
Rt t
λe−λu du = −e−λu 0 = 1 − e−5t

F (t) = 0

3)
ln 2
F (α) = 0, 5 ⇐⇒ α = .
λ
4) En utilisant l’intégration par parties, l’espérance de la durée de vie d’un atome
est
R +∞
E(D) = λte−λt dt
0
  +∞
1
= −t − − e−λt
λ 0
1
E(D) =
λ

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 275 — #285


i i

13.4 Exercices 275

et
R +∞
E(D2 ) = 0
λt2 e−λt dt
  +∞
2 2 2 −λt
= −t − t − 2 e
λ λ 0
2
E(D) = 2
λ
et sa variance est :
1
V (D) =
λ2
Exercice 9
Soit f l’application de R dans R définie par :
(
0 pour x < 0
f (x) = x − x8
2

4 e pour x≥0

1) La fonction f est positive.


D’autre part :
R +∞ x − x2 h x2 i+∞
0
e 8 dx = e− 8 =1
4 0
f est donc une densité de probabilité d’une variable aléatoire X.
2) L’espérance de la variable X est :
R +∞ x2 − x2
E(X) = 0
e 8 dx
4
En utilisant l’intégration par parties comme suit :
f (x) = x ⇒ f 0 (x) = 1
x 2 x2
g0(x) = x4 e− 8 ⇐ g(x) = e− 8
on a donc : R +∞ x2
E(X) = 0 e− 8 dx
En effectuant un changement de variable t = x2 , (dx = 2dt), on obtient finalement :
R +∞ x2 R +∞ t2 R +∞ t2 √
E(X) = 0
e− 8 dx = 2 0 e− 2 dt = −∞ e− 2 dt = 2π
R +∞ t2
car √1 e− 2 dt = 1 donc
−∞ 2π
R +∞ t2 √
−∞
e− 2 dt = 2π

En utilisant de nouveau l’intégration par parties, on calcule le moment d’ordre 2 :


R +∞ x3 − x2
E(X 2 ) = 0
e 8 dx
4
h x2
i+∞ R x2
+∞
= x2 e− 8 + 0 2xe− 8 dx
0
E(X 2 ) = 8

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 276 — #286


i i

276 Chapitre 13. Variables Aléatoires Continues - Lois Continues

On en déduit que la variance est :

V (X) = 8 − 2π

Exercice 10
1) La demande moyenne est :
R +∞
E(D) = −∞ xf (x)dx
R 1/3 R 2/3 R1
= 0 (−3x2 + 2x)dx + 1/3 xdx + 2/3 (−3x2 + 3x)dx
10
E(D) =
27
Le moment d’ordre 2 est :
R +∞
E(D2 ) = −∞ x2 f (x)dx
R 1/3 R 2/3 R1
= 0 (−3x3 + 2x2 )dx + 1/3 x2 dx + 2/3 (−3x3 + 3x2 )dx
11
E(D2 ) =
54
La variance est égale à
 2
2 11 10 97
V (D) = E(D2 ) − [E(D)] = − =
54 27 1458
V (D) ' 0, 067

On en déduit l’écart-type.de D qui est :


r
p 97
σ(D) = V (D) =
1458
σ(D) ' 0, 258

2) La fonction de répartition F de D est définie par :




 0 si x < 0
3 2
− x + 2x si 0 ≤ x < 31


Rx  2
1
F (x) = −∞ f (t)dt = x+ 6 si 31 ≤ x < 23
− x + 3x − 2 si 23 ≤ x < 1
3 2 1


 2


1 si x ≥ 1

3) a-
1 2
P (D < 0, 5) = F ( ) = .
2 3
b-
3 1 32
P (0, 2 < D < 0, 6) = F ( ) − F ( ) =
5 5 75
c-
P (D > 1) = 1 − P (D ≤ 1) = 1 − F (1) = 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 277 — #287


i i

13.4 Exercices 277

4) Le nombre d’unités tel que la moitié 50% des demandes lui soit inférieure
représente la médiane M e.
1
F (M e) = P (D < M e) = .
2
Or F ( 13 ) = 12 .
Donc M e = d = 333 unités.
Exercice 11
On calculera la fonction de répartition de la variable aléatoire X.
On remarque que X ≤ x si et seulement si U ≥ e−x car on a X = −lnU.
Puisque la fonction f (x) = e−x est décroissante sur R.
On a donc
F (x) = P (X ≤ x) = P (U ≥ e−x )
Si x < 0 alors e−x > 1 donc F (x) = 0
Si x ≥ 0 alors e−x ∈ [0; 1] car on a U U[0,1] ; donc F (x) = 1 − e−x .

0 si x < 0
F (x) =
1 − e−x si x ≥ 0

On reconnaît donc la fonction de répartition d’une loi exponentielle de paramètre


1.
(On pourra aussi dériver la fonction de répartition afin de retrouver la densité).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 278 — #288


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 279 — #289


i i

CHAPITRE 14

Notions de convergence

Dans ce chapitre, nous allons présenter les deux théorèmes fondamentaux de la


statistique asymptotique, à savoir la loi des grands nombres et le théorème central limite
(TCL), associés aux deux principaux modes de convergence qui sont la convergence en
loi et la convergence en probabilité.

14.1 Convergence en probabilité


L’inégalité de Bienaymé-Tchebychev permet de lier une probabilité à une variance.
Nous allons présenter quelques propriétés nécessaires pour la compréhension de cette
inégalité.

14.1.1 Inégalité de Markov


Soit X une v.a. positive dont l’espérance existe, l’inégalité de Markov établit que pour
tout λ > 0 :
1 E(X)
P {X ≥ λE(X)} ≤ ⇐⇒ P (X ≥ λ) ≤
λ λ
Exemple 14.1.1
Pour λ = 5, l’inégalité de Markov s’écrit P (X ≥ 5E(X)) ≤ 0, 2 ; dans le cas
particulier de la loi exponentielle de paramètre 1, E(1).
On obtient P (X ≥ 5) = e−5 = 0, 0067.
Dans le cas d’une v.a. de signe quelconque, on utilise la deuxième écriture de
k k
l’inégalité de Markov en l’appliquant à |X| , pour tout k tel que E(|X| ) existe :

  E(|X|k )
k
P |X| ≥ λ ≤
λ

En faisant un changement de variable λ = εk , pour ε > 0, on obtient pour tout


ε>0:
k
E(|X| )
P (|X| ≥ ε) ≤
εk

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 280 — #290


i i

280 Chapitre 14. Notions de convergence

14.1.2 Inégalité de Bienaymé-Tchebychev


L’inégalité de Bienaymé-Tchebychev est l’application de l’inégalité de Markov à la v.a.
X − E(X) et en choisissant k = 2, par conséquent, si la variance V (X) de la v.a. X
existe alors :
pour tout ε > 0 fixé,

V (X)
P (|X − E(X)| ≥ ε) ≤ .
ε2
On remarque que cette inégalité relie la probabilité pour X de s’écarter de sa
moyenne E(X), à sa variance qui est un indicateur de dispersion autour de la moyenne
de la loi.
L’inégalité de Bienaymé-Tchebychev appliquée à une variable centrée-réduite avec
ε = aσ(X) avec a > 1 et σ(X) l’écart-type de la v.a. X, fournie une nouvelle inégalité
qui s’écrit :  
|X − E(X)| 1
P ≥a ≤ 2
σ(X) a

14.1.3 Inégalité de Jensen


Soit x et y deux réels appartenant à l’intervalle I ∈ R, on dit que la fonction réelle g
est convexe sur l’intervalle I si on a :

∀α ∈ [0, 1], g[(αx + (1 − α)y] ≤ αg(x) + (1 − α)g(y)

ou si g 00 (x) ≥ 0 dans le cas où g est deux fois dérivable.


Si g est une fonction réelle convexe sur I de R qui contient X(Ω), ensemble des
valeurs possibles de la v.a. X, telle que E(X) et E[g(x)] existent, alors :

g[E(X)] ≤ E[g(X)]

L’ordonée (au sens de la fonction g) de la moyenne (au sens d’espérance) est plus
petite que la moyenne des ordonnées.
Exemple 14.1.2
En appliquant l’inégalité de Jensen à la fonction g(t) = t2 , on obtient :

[E(X)]2 ≤ E(X 2 ),

résultat connu de la propriété de la variance qui est toujours positive :

V (X) = E(X 2 ) − [E(X)]2 ≥ 0

14.1.4 Convergence en probabilité


Définition 14.1.1
On dit que la suite de v.a. (Xn ) converge en probabilité vers une v.a. X si, pour
tout ε > 0 :
P (|Xn − X| < ε) −→ 1 quand n → +∞

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 281 — #291


i i

14.1 Convergence en probabilité 281

ce qui est aussi équivalent à :


P (|Xn − X| > ε) −→ 0 quand n → +∞
On écrit :
Xn −→ X
p

Cela signifie que si la suite (Xn ) converge vers une v.a. X alors (Xn ) se rapproche
de X quand n est assez grand. On mesure alors la distance |Xn − X| qui sera très
petite quand n est assez grand.
Mais en terme de probabilité, on calculera la probabilité de l’événement "|Xn − X| <
ε" qui sera réalisé avec une probabilité presque certaine (proche de 1) quand n sera
assez grand, ce qui se traduit par la convergence en probabilité.
Propriété 14.1.1
Si. (Xn ) est une suite de v.a. telle que :

E(Xn ) −→ a
quand n → +∞
V (Xn ) −→ 0
alors :
Xn −→ a.
p

En posant Yn = Xn − X, avec (Xn ) qui converge vers la v.a. X puisque avec ces
conditions on a : Yn −→ 0 ⇐⇒ Xn −→ X quand n → +∞.
p
Les condition suffisantes de convergence en probabilité sont alors les suivantes :

E(Xn − X) −→ 0
quand n → +∞
V (Xn − X) −→ 0
alors :
Xn −→ X
p

Définition 14.1.2
On dit que la suite de v.a. (Xn ) converge en moyenne d’ordre p, avec
0 < p < ∞ vers la v.a. X si :
p
E(|Xn − X| ) −→ 0 quand n → +∞
et on écrit :
Xn −→ X.
Mp

Dans le cas particulier où p = 2, la convergence en moyenne d’odre 2, s’appelle


la convergence en moyenne quadratique, et elle plus forte que la convergence en
probabilité.
En posant Yn = Xn − X, on a par définition de la vairance
V (Yn ) = E(Yn 2 ) − [E(Yn )]2
⇐⇒ V (Xn − X) = E[(Xn − X)2 ] − [E(Xn − X)]2
⇐⇒ E[(Xn − X)2 ] = V (Xn − X) + [E(Xn − X)]2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 282 — #292


i i

282 Chapitre 14. Notions de convergence

Cette dernière égalité traduit les conditions suffissantes de convergence en probabi-


lité, qui sont donc les conditions nécessaires de convergence en moyenne quadratique :

E(Xn − X) −→ 0
Xn −→M p X ⇐⇒
V (Xn − X) −→ 0

Par conséquent, pour p > 0, la convergence en moyenne d’ordre p est plus forte
que la convergence en probabilité, au sens où :

Xn −→ X =⇒ Xn −→ X
Mp p

En particulier on a :
Xn −→ X =⇒ Xn −→ X
Mp m.q.

Donc pour obtenir la convergence en probabilité, on étudie souvent la convergence en


moyenne quadratique qui implique la convergence en probabilité et qui est plus simple
à étudier puisque ça concerne l’étude de la convergence de deux suites numériques.
Théorème 14.1.1 : Théorème de Slutsky
si f est une application réelle continue, alors :

Xn −→ X =⇒ f (Xn ) −→ f (X)
Mp p

Le téorème de Slutsky exprime qu’une application continue conserve la convergence


en probabilité au sens où la limite de la suite des images est l’image de la limite de la
suite.
Théorème 14.1.2
si f est une application de R2 dans R uniformément continue et si (Xn ) et (Yn )
sont deux suites de v.a. qui convergent en probabilité respectivement vers les v.a. X
et Y, alors :
f (Xn , Yn ) −→ f (X, Y )
p

En appliquant ce théorème aux applications f, g et h définies respectivement par :


f (x, y) = x + y, g(x, y) = xy et h(x, y) = xy (y 6= 0) et si Xn −→ X et Yn −→ Y alors
p p
on a :

∗ Xn + Yn −→ X + Y,
p

∗ Xn Yn −→ XY
p
Xn X
∗ −→ (avec P (Y = 0) = 0)
Yn p Y

14.1.5 Loi des grands nombres


A partir de l’inégalité de Bienaymé-Tchébychev, on obtient un théorème fondamentale
de la statistique asymptotique, quand la taille n de l’échantillon devient infinie.
Théorème 14.1.3 : Loi faible des grands nombres

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 283 — #293


i i

14.2 Convergence en loi 283

Si (Xn ) est une suite de v.a. mutuellement indépendantes qui admettent les mêmes
moments d’ordre 1 et d’ordre 2, c’est à dire pour tout entier n, E(Xn ) = m et
V (Xn ) = σ 2 , alors quand n → +∞ on a :

 V (Xn ) σ2
P Xn − m ≥ ε ≤ 2
= 2 −→ 0
ε nε

⇐⇒ Xn −→ m
p

Ce théorème est applicable pour des v.a. Xn ayant un même moment d’ordre 1 et
d’ordre 2, mais pas nécessairement la même loi : c’est la loi faible des grands nombres.
Définition 14.1.2 : Convergence presque sûre
On dit que la suite (Xn ) converge presque surement vers la v.a. X si :
n o
P ω ∈ Ω/ lim Xn (ω) = X(ω) = 1
n→∞

et s’écrit :
Xn −→ X; n → +∞
p.s.

Si les v.a. Xn aient un même moment d’ordre 1 et la même loi on obtient alors la
loi forte des grands nombres.
Théorème 14.1.4 : Loi forte des grands nombres
Si (Xn ) est une suite de v.a. indépendantes et de même loi qui admettent une
espérance m, alors :
Xn −→ m; n → +∞
p.s.

14.2 Convergence en loi


14.2.1 Définition
On dit que la suite de v.a. (Xn ) de fonction de répartition Fn , converge en loi vers
une v.a. X de fonction de répartition F si la suite {F (Xn )} converge vers F (x) en
tout point x où F est continue ; et on écrit :

Xn −→ X
loi

Les v.a. Xn ont toutes des lois différentes de fonctions de répartition notées Fn .
Théorème 14.2.1
La convergence en probabilité d’une suite (Xn ) implique sa convergence en loi :

Xn −→ X =⇒ Xn −→ X
p loi

La réciproque de ce résultat est en général fausse, sauf pour le cas particulier où la


limite est une v.a. certaine X = a, c’est à dire quand la loi limite est une loi de Dirac.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 284 — #294


i i

284 Chapitre 14. Notions de convergence

14.2.2 Propriété
Si (Xn ) et (Yn ) sont deux suites de v.a. telles que pour n → +∞ :

Xn −→ X et Yn −→ a
loi p

où a ∈ R,alors :

i) Xn + Yn −→ X + a
loi
ii) Xn Yn −→ aX
loi
Xn X
iii) −→ si a 6= 0
Yn loi a
Théorème 14.2.2 : Théorème de Slutsky
Si g est une application réelle continue, alors :

Xn −→ X =⇒ g(Xn ) −→ g(X)
loi loi

14.2.3 Théorème Central Limite : TCL


Théorème 14.2.3
Si (Xn ) est une suite de v.a. indépendantes et de même loi, admettant des moments
d’ordres 1 et 2, notés E(Xn ) = m et V (Xn ) = σ 2 , alors :

√ Xn − m
n −→ N (0, 1)
σ loi

La loi des grands nombres montre la convergence de la suite Xn des moyennes


empiriques vers la moyenne théorique m. Si on centre puis on réduit les v.a. de cette√
suite ((Xn −m)/σ), on obtient une nouvelle suite qui converge vers zéro quand n
tend vers l’infini ; la forme indéterminée obtenue aura une limite qui sera celle d’une
loi non dégénérée à savoir la loi normale : c’est le théorème central limite.
C’est ce qui prouve que la loi normale est la loi de probabilité la plus utilisée en
statistique, puisque souvent le phénomène étudié résulte d’un grand nombre d’évé-
nements indépendants et le théorème central limite assure que la loi normale est la
mieux adaptée pour la résolution du problème.

14.3 Convergence des lois usuelles


14.3.1 Loi binomiale
Soit X une v.a. de loi binômiale B(n, p) et supposons que n −→ +∞, deux cas se
présentent :
Cas 1 : Si p −→ 0 quand n −→ +∞, avec np −→ λ fini, alors en utilisant la formule
de Stirling √
n! = nn e−n 2πn(1 + εn ),

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 285 — #295


i i

14.3 Convergence des lois usuelles 285

on obtient que pour tout entier k fixé, 0 ≤ k ≤ n :


λk
P (X = k) = Cnk pk (1 − p)n−k −→ e−λ
k!
Ce qui se traduit d’après la condition suffisante de convergence en loi, que la loi binô-
miale B(n, p) converge vers la loi de Poisson P(λ), et on considère que l’approximation
est valable pour n ≥ 30 et np < 5.
Cas 2 : Si p reste fixe quand n −→ +∞, on utilise alors l’approximation normale
en écrivant la loi binômiale comme somme de v.a. Xi indépendantes et de même loi de
n
P
Bernouilli de paramètre p : X = Xi . Comme E(Xi ) = p et V (Xi ) = p(1 − p) = pq,
i=1
alors d’après le théorème central limite on a :
√ Xn − p
n √ −→ N (0, 1)
pq loi
où Xn = X/n, on peut réécrire la convergence précédente comme :
√ X/n − p X/n − p X − np
n √ =n √ = √ −→ N (0, 1)
pq npq npq loi

On peut donc approximer la loi binômiale B(n, p) par la loi normale N (np, npq),
et on considère que l’approximation est valable pour n ≥ 30 np ≥ 5 et nq ≥ 5.

14.3.2 Loi de Poisson


Si X suit une loi de Poisson dont le paramètre λ tend vers l’infini, alors on peut
approximer la loi de Poisson de paramètre λ, P(λ), par la loi normale centrée réduite
N (0, 1)
X −λ
√ −→ N (0, 1)
λ loi

14.3.3 Autres lois


Loi gamma
Si X suit une loi gamma de paramètre p, γ(p) avec p −→ +∞, alors :
X −p
√ −→ N (0, 1)
p loi
On peut donc approximer la loi gamma de paramètre p par la loi normale centrée
réduite N (0, 1) quand p −→ +∞.

Loi du Khi-deux
Si X suit une loi du Khi-deux dont le nombre de degrés de liberté ν −→ +∞, alors :
X −ν
√ −→ N (0, 1)
2ν loi
On approxime donc la loi du Khi-deux de paramètre ν par la loi normale centrée
réduite N (0, 1) quand ν −→ +∞.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 286 — #296


i i

286 Chapitre 14. Notions de convergence

Loi de Student
Si X suit une loi de Student dont le nombre de degrés de liberté n −→ +∞, alors :

X −→ N (0, 1)
loi

On approxime la loi de Student de paramètre n par la loi normale centrée réduite


N (0, 1) quand n −→ +∞.

14.4 Exercices
14.4.1 Enoncés
Exercice 1
Soit X une variable aléatoire de densité :
 1 2
4 (1 + 3x ) si −1≤x≤1
f (x) =
0 sinon

1) Déterminer un intervalle [−k, k] qui contienne X avec une probabilité supérieur


à 0, 75.
2) Calculer la probabilité exacte de cet intervalle.
Exercice 2
Soient X1 , X2 , . . . , Xn des variables aléatoires indépendantes et de même loi que
la variable X de densité :
 −(x−λ)
e si x ≥ λ
f (x) =
0 sinon

où λ est un nombre réel positif donné.


On définit la variable aléatoire mn = min{X1 , X2 , . . . , Xn }.
Etudier la convergence en moyenne et la convergence en probabilité de la suite
(mn ) lorsque n tend vers l’infini.
Exercice 3
La durée d’une communication téléphonique est représentée par une variable
aléatoire D uniformément distribuée sur un intervalle [0, t], où t est un nombre réel
positif donné.
On souhaite étudier le comportement de la plus longue durée de n communications,
définie par
Mn = max{D1 , D2 , . . . , Dn }
quand n devient infini. Les variables aléatoires Di étant supposées indépendantes
et de même loi que D.
Montrer que (Mn ) converge en probabilité vers t.
Exercice 4
Soient X1 , X2 , . . . , Xn des variables aléatoires indépendantes et de même loi que
la variable X de densité :
λ
f (x) = e−λ|x|
2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 287 — #297


i i

14.4 Exercices 287

où λ est un nombre réel positif donné.


Etudier la convergence en probabilité de la suite (Un ) des variables aléatoires
définie par :
1P n
Un = |Xi | .
n i=1
Exercice 5
Soient X1 , X2 , . . . , Xn des variables aléatoires indépendantes et de même loi que
la variable X de densité :
h i
f (x) = exp −(x − λ) − e−(x−λ)

où λ est un nombre réel positif donné.


Etudier la convergence en loi de la suite (Vn ) des variables aléatoires définie par :
1P n
Vn = e−(Xi −λ)
n i=1

Exercice 6
On jette n fois de suite un dé à six faces.
Comment peut-on choisir n pour que le nombre de six obtenus soit compris entre
0 et n3 avec une probabilité au moins égales à 0, 9 ?
Exercice 7
Une urne contient trois boules numérotées 1, 2, 3.
On effectue une suite de n = 100 tirages indépendants avec remise. On note Xi le
numéro de la boule tirée lors du ième tirage.
Soit S = X1 + X2 + . . . + X100 . Au moyen de l’inégalité de Bienaymé-Tchebychev,
indiquer le plus petit nombre s que l’on peut trouver tel que :

P (200 − s ≤ S ≤ 200 + s) ≥ 0, 9

Exercice 8
Une enquête statistique portant sur 10 000 automobilistes débutants a révélé que 10
d’entre eux avaient provoqué un accident mortel dans leur première année de conduite
et que 200 d’entre eux avaient provoqué un accident corporel dans leur première année
de conduite.
1) Déterminer les probabilités P1 de provoquer un accident mortel durant une
première année de conduite et P2 de provoquer un accident corporel durant une
première année de conduite.
2) On choisit 100 débutants au hasard, et on désigne par X le nombre d’entre eux
qui ont eu un accident mortel au cours de leur première année de consuite.
A l’aide de quelle loi de probabilité peut-on étudier X ?.
Calculer P (X = 0) et P (X = 2).
Exercice 9
Dans un grand laboratoire pharmaceutique, les employés d’un bloc A ont souvent
besoin d’appeler au téléphone un bloc B. Le bloc A a 300 employés et on a constate
qu’aux heures d’affluence chacun d’entre eux veut téléphoner pendant en moyenne 3
minutes par heure au bloc B.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 288 — #298


i i

288 Chapitre 14. Notions de convergence

Quel nombre minimum n0 de lignes téléphoniques faut-il établir entre A et B pour


qu’un employé de A qui désire téléphoner à une heure d’affluence ait une probabilité
inférieure ou égale à 0, 025 de ne pas avoir une ligne à sa disposition. On effectuera
une approximation par une loi normale.

14.4.2 Corrigés
Exercice 1
La densité est paire et l’espérance puisque l’intégrale se fait sur l’intervalle [−1, 1] ,
donc E(X) = 0.
La variance est alors égale à
R1
V (X) = E(X 2 ) = −1 xf (x)dx
1R 1
= −1 x2 (1 + 3x2 )dx
4
1
1 x3

3 5
= + x
2 3 5 0
7
V (X) =
15
on a :
P (|X| ≤ k) ≥ 0, 75 ⇐⇒ P (|X| > k) ≥ 0, 25
L’inégalité de Bienaymé-Tchebychev permet d’obtenir pour tout k > 0 fixé :
V (X)
P (|X| > k) ≤
k2
Si V (X) ≤ 0, 25k 2 alors l’inégalité est vérifiée.
Ce qui donne :
28
k2 ≥ ⇐⇒ k ≥ 1, 37
15
Or X prend ses valeurs dans l’intervalle [−1; 1], donc on retiendra cet intervalle
qui est de probabilité exacte égale à 1.
L’inégalité de Bienaymé-Tchebychev n’a pas permis dans ce cas de réduire l’inter-
valle demandé, par rapport à l’ensemble des valeurs possibles pour X.

2) Connaissant la loi de probabilité, on peut déterminer ici la valeur exacte de k


telle que P (−k ≤ X ≤ k) = 0, 75 et qui sera lsolution de l’équation :
1R k 1 k 1
0, 75 = −k
(1 + 3x2 )dx = x + x3 0 = (k + k 3 )
4 2 2
ceci est équivalent à

k + k 3 − 1, 5 = 0 ⇐⇒ k = 0, 86

Exercice 2
Déterminons la loi de probabilité de mn pour pouvoir ensuite calculer son espérance.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 289 — #299


i i

14.4 Exercices 289

Comme il s’agit de la plus petite observation parmi n, considérons alors l’événement


(mn > x) qui est équivalent à la réalisation de tous les événements (Xi > x), qui sont
d’ailleurs indépendants en raison de l’indépendance des variables Xi . Ainsi :
 n  n
P (Xi > x) = [1 − F (x)]n .
T Q
P (mn > x) = P (Xi > x) =
i=1 i=1

où F est la fonction de répartition commune des variables aléatoires Xi . La fonction


de répartition de la variable aléatoire mn est donc définie par :

G(x) = P (mn < x) = 1 − [1 − F (x)]n

et sa densité par :

g(x) = G0 (x) = nf (x)[1 − F (x)]n−1

Il faut déterminer la fonction de répartition de X, qui est nulle pour x < λ, et qui
a comme valeur pour x ≥ λ :
Rx h ix
F (x) = λ e−(u−λ) du = −e−(u−λ) = 1 − e−(x−λ)
λ

Par conséquent, pour x ≥ λ :

g(x) = ne−n(x−λ)

L’espérance de mn est donc :


R +∞
E(mn ) = λ xe−n(x−λ) dx
R +∞
= n λ (x − λ + λ)e−n(x−λ) dx
1 R +∞ −u R +∞
= ue du + λ λ ne−n(x−λ) dx
n 0
1
E(mn ) = + λ
n
où u = n(x − λ) et en faisant une intégration par parties.
On en conclut donc que :
1
E(|mn − λ|) = E(mn − λ) = −→ 0 quand n → +∞
n
et par suite mn converge en moyenne d’ordre 1 vers λ.
La convergence en probabilité s’obtient directement en appliquant l’inégalité de
Markov à la variable positive mn − λ = |mn − λ| :

E(mn − λ) 1
P (|mn − λ| ≥ ε) = P (mn − λ ≥ ε) ≤ = −→ 0
ε nε
pour tout ε > 0, ce qui permet d’écrire que mn converge en probabilité vers λ :

mn −→ λ
p

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 290 — #300


i i

290 Chapitre 14. Notions de convergence

Exercice 3
La fonction de répartition est définie par :
 n  n
P (Di < x) = F (x)n .
T Q
G(x) = P (Mn < x) = P (Di < x) =
i=1 i=1

car les Di sont indépendantes et de même loi, de fonction de répartition F (x) = 0


pour x ≤ 0.
Et pour 0 ≤ x ≤ t,
Rx1 x
F (x) = 0 dt =
t t
avec F (x) = 1 pour x ≥ t.
Pour tout ε > 0 fixé, on a :

P (|Mn − t| < ε) = P (t − ε < Mn < t + ε)


= G(t + ε) − G(t − ε)
 ε n
=1− 1−
t
si ε > t (pour ε ≥ t cette probabilité est égale à 1).
Comme 1 − εt < 1, cette quantité tend vers 1 et ceci montre donc que :

Mn −→ t
p

Exercice 4
Calculons les moments d’ordre 1 et d’ordre 2 de la variable aléatoire |X| :
R +∞
E(|X|) = −∞ |x| f (x)dx
R +∞
= λ 0 xe−λx dx
1
E(|X|) =
λ
ce résultat est obtenu en faisant une intégration par parties.
De la même manière on a :
R +∞
E(X 2 ) = −∞ x2 f (x)dx
R +∞
= λ 0 x2 e−λx dx
2
E(X 2 ) = 2
λ
Et la variance de |X| est :
1
V (|X|) =
λ2
La variable aléatoire Un étant la moyenne des variables aléatoire |Xi | indépendantes,
la loi des grands nombres permet d’obtenir :
1P n 1
Un = |Xi | −→
n i=1 p λ

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 291 — #301


i i

14.4 Exercices 291

Exercice 5
On a la variable aléatoire Vn définie par :
1P n
Vn = e−(Xi −λ)
n i=1

La variable aléatoire Vn est donc la moyenne des variables aléatoires indépendantes


Yi = e−(Xi −λ) de même loi que la variable aléatoire Y = e−(X−λ) , de fonction de
répartition définie par :

G(y) = P (Y < y) = P (e−(X−λ) < y)

probabilité nulle pour y ≤ 0, et qui a pour valeur, obtenue par passage au logarithme
pour y > 0 :

G(y) = P (−(X − λ) < ln y)


= P (X > λ − ln y)
= 1 − F (λ − ln y)

où F est la densité de X.
La densité est donc nulle pour y ≤ 0, et a pour valeur pour y > 0 :
1
g(y) = f (λ − ln y) = e−y
y

qui est la densité d’une loi exponentielle ou loi Gamma de paramètre 1.


Donc les moments sont :
E(X) = (X) = 1
et le théorème central limite permet donc d’obtenir :

n(Vn − 1) −→ N (0, 1).
loi

Exercice 6
On pose : Xi = 0 si le 6 n’a pas été tiré au ième jet de dé
Xi = 1 si le 6 a été tiré au ième jet de dé
Les variables aléatoires Xi sont indépendantes, puisque les jets eux-mêmes sont
indépendantes. D’autre part :
5 1
P (Xi = 0) = et P (Xi = 1) =
6 6
d’où X1 + X2 + . . . + Xn est une variable aléatoire qui représente le nombre de 6
apparus au cours de n jets, on le notera nSn avec :
X1 + X2 + . . . + Xn
Sn =
n
 n  1
On veut que : nSn ∈ 0, 3 d’où Sn ∈ 0, 3 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 292 — #302


i i

292 Chapitre 14. Notions de convergence

Mais
1
E(Sn ) = E(X1 + X2 + . . . + Xn )
n
1P n
= E(Xi )
n i=1
nE(X)
=
n
E(Sn ) = E(X)

c’est à dire
1
E(Sn ) = E(X) = E(Xi ) =
6
Donc Sn ∈ 0, 13 peut s’écrire Sn ∈ E(Sn ) − 16 ; E(Sn ) + 16 donc
   


Sn − 1 < 1

6 6
et d’après la loi faible des grands nombres on a :

1 1 V (X)
P ( Sn − < ) ≥ 1 −
6 6 nε2
V (X) 1
il faut donc nε2 ≤ 10 d’où

10V (X) 10 × 61 × 5
6
n≥ =
ε2 1 2

6
n ≥ 50.

Exercice 7
a) Les variables aléatoires Xi prennent les valeurs 1, 2 et 3 avec des probabilités
égales à 13 .
De plus on a : E(Xi ) = 2 et V (Xi ) = 0, 66667.
D’où.

E(S) = E(X1 + X2 + . . . + X100 ) = 100 × 2 = 200


V (S) = V (X1 + X2 + . . . + X100 ) = 1002 V (Xi ) ' 1002 × 0, 66667 = 6666, 7

or
200 − s ≤ S ≤ 200 + s ⇐⇒ −s ≤ S − 200 ≤ s ⇐⇒ |S − 200| ≤ s
Le problème revient donc à trouver le plus petit nombre s tel que :

P (|S − 200| ≤ s) ≥ 0, 9 ou aussi P (|S − E(S)| > s) ≥ 0, 1

d’après l’inégalité de Bienaymé-Tchebychev :


1 σ2 s
P (|S − E(S)| > s) ≤ s2
= ; s = tσ d’où t =
σ2
s2 σ

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 293 — #303


i i

14.4 Exercices 293

2
La probabilité P (|S − 200| ≤ s) ≥ 0, 9 pour σs2 ≤ 0, 1
d’où √
s ≥ 66666 ' 258, 2
Exercice 8
1) La probabilité de provoquer un accident mortel durant une première année de
conduite est :
10
P1 = = 0, 001
10 00
La probabilité de provoquer un accident corporel durant une première année de
conduite est
200
P2 = = 0, 02
10 00
2) La variable aléatoire X suit une loi dinomiale de paramètre n = 100 et p =
0, 001 : X B(100; 0, 001).
On a n > 50 et np = 0, 1 < 5, on peut donc approcher la loi binomiale par une loi
de Poisson de paramètre np = 0, 1.
D’où
0
(0, 1) e−0,1
P (X = 0) = ' 0, 9
0!
et
2
(0, 1) e−0,1
P (X = 2) = ' 0, 0045
2!
Exercice 9
Supposons qu’il y ait n lignes téléphoniques installées entre A et B et appelons
X le nombre d’emplyés de A désirant téléphoner B, à un instant donné pendant une
heure d’affluence.
On cherche le plus petit nombre n, noté n0 tel que :

P (X > k) ≤ 0, 025
1
X suit une loi binomiale B(300; 20 ), c’est à dire que :

1 19
npq = 300 × × ' 14, 25 < 10
20 20
n ≥ 30; np ≥ 15.

X suit donc une loi normale de paramètre m = np = 15


1
et σ 2 = npq = 300 × 20 × 19
20 ' 14, 25
D’où la variable aléatoire centrée réduite Z = √X−1514,25
suit une loi normale centrée
réduite N (0, 1).
n0 est le plus petit entier k tel que :
 
k − 15
P Z>√ ≤ 0, 025
14, 25
or
P (Z > 1, 96) = 0, 025

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 294 — #304


i i

294 Chapitre 14. Notions de convergence

on en déduit n0 , qui est le plus petit entier tel que :


k − 15 p
√ > 1, 96 =⇒ k > 15 + 1, 96 14, 25
14, 25
n0 = 23.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 295 — #305


i i

Quatrième partie

STATISTIQUES

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 296 — #306


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 297 — #307


i i

CHAPITRE 15

Statistique descriptive

15.1 Séries statistiques à une dimension

Introduction
Le double but de la statistique à une dimension est d’une part la présentation
des données statistiques sous forme de tableaux ou de graphiques, diagrammes en
batôns, histogrammes, courbe cumulative ; et d’autre part l’analyse de ces données, qui
consiste à résumer un tableau à l’aide d’un petit nombre de valeurs caractéristiques.
- Les valeurs caractéristiques de position : mode, médiane, moyenne.
- Les valeurs caractéristiques de dispersion : variance, écart-type.

15.1.1 Population et variable statistique

Définition 15.1.1
Tout ensemble P étudié en statistique s’appelle population. Les éléments sont
appelés individus. un sous-ensemble de P est un échantillon.
On appelle variable statistique ou caractère quantitatif toute application X de P
dans R. Une variable statistique peut être
- discrète : si elle ne prend que des valeurs isolées (nombre d’enfants d’une famille ;
nombre de pièces d’un appartement...)
- continue : si elle prend toutes les valeurs d’un intervalle (poids d’un individu,
taille d’un individu,...)
La statistique à une dimension a pour objet l’étude d’un caractère des éléments
d’une population.
- Caractère quantitatif (exprimable en un nombre : poids, taille, température, prix,
etc.)
- Caractère qualitatif (couleur, sexe, etc.). On donne un numéro et l’on se ramène
au caractère quantitatif.
Par conséquent,
- Série statistique quantitative : liste de la valeur du caractère pour les individus
de la population,
- Série statistique qualitative : liste des variétés du caractère.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 298 — #308


i i

298 Chapitre 15. Statistique descriptive

15.1.2 Distribution d’une série statistique quantitative


La distribution d’une série statistique quantitative est la donnée du tabeau des effectifs
des différentes valeurs du caractère.

Cas d’une variable statistique discrète


Définition 15.1.2
Soient {x1 , x2 , ..., xn } les valeurs distinctes prises par la variable X. On les appelle
aussi modalités du caractère X.
C’est le nombre d’individus ni correspondant à la valeur xi de X.
n
P
ni = effectif total = n
i=1

On appelle fréquence de la modalité xi le réel :


ni
fi =
n
et on a toujours :
n
P
fi = 1.
i=1

Exemple 15.1.1
On prélève un échantillon 200 individus dont on veut étudier leur taille (en cm), et
l’on a obtenu les résultats suivants :

Taille xi Nombre ni d’individus


195 4
190 7
185 11
180 27
175 41
170 47
165 39
160 16
155 5
150 3

Tableau 15.1.1

Remarque 15.1.1
Lorsque les effectifs ne sont pas précisés, ils sont sous -entendus égaux à 1, comme
par exemple : une production de céréale dans deux champs :
128 930 147 650 (ces deux valeurs sont les valeurs du caractère et non pas les
effectifs).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 299 — #309


i i

15.1 Séries statistiques à une dimension 299

Cas d’une variable statistique continue


Définition 15.1.3
On partage alors l’intervalle I sur lequel X prend ses valeurs en intervalles disjoints
appelés classes (en général de même amplitude).
L’effectif ni associé à l’intervalle [xi−1 , xi [⊂ I s’appelle effectif de cette classe.
On désigne souvent une classe par (ci , ni ), ci étant le centre de la classe et ni son
effectif.
On appelle fréquence de la classe, le réel :
ni
fi = .
n
Exemple 15.1.2
Distribution du poids d’animaux âgés d’un an

Poids à l’âge Effectifs


d’un an en gramme observés
[1 150 ; 1 250[ 2
[1 250 ; 1 350[ 1
[1 350 ; 1 450[ 3
[1 450 ; 1 550[ 4
[1 550 ; 1 650[ 6
[1 650 ; 1 750[ 3
[1 750 ; 1 850[ 1

Tableau 15.1.2

15.1.3 Fonction cumulative


Définition 15.1.4
Soit une série statistique à caractère quantitatif, les k, valeurs ou les k classes
représentées par leurs centres ci = xi sont données dans l’ordre croissant :

x1 < x2 < x3 < · · · < xi < · · · < xk .

Si ni est l’effectif de la valeur ou de la classe xi , on appelle fréquence cumulée


croissante la quantité définie par :
P n1 + n2 + · · · + nj effectif cumulé
fj = f1 + f2 + · · · + fj = =
j≤i n effectif total

Définition 15.1.5
a) Dans le cas où la variable statistique est discrète, on appelle fonction cumulative
ou fonction de répartition la fonction F définie sur R par :
P
F (t) = fj
j<t

c’est à dire la somme des fréquences des modalités inférieures à t.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 300 — #310


i i

300 Chapitre 15. Statistique descriptive

F est une fonction en escalier croissante, nulle sur ] − ∞, x1 [ et égale à 1 sur


[xn , +∞[
b) Dans le cas où la variable statistique est continue, on appelle fonction cumulative
ou fonction dont le graphique est la ligne polygonale obtenue en joignat par des segments
de droites successivement les points de coordonnées (x1 , 0), (xi , f1 + f2 + · · · + fi−1 )
les réels xi étant les centres des diverses classes.

15.1.4 Graphiques
Caractère à valeurs discrètes
 Le diagramme en bâtons, s’obtient en traçant à partir du point de l’axe des x
d’abscisse xi un segment de longueur proportionnelle à ni .
 Le polygone des effectifs s’obtient en joignant par un trait les différents points
de coordonnées (xi , ni ).
 La courbe cumulative des effectifs est la représentation de la fonction de ré-
partition définie sur R : x 7→(somme des effectifs xi < x) qui est une fonction en
escalier.
 La dominante ou mode est la valeur du caractère ayant le plus grand effectif.

Caractère à valeurs réparties en classe


La série statistique est définie par la donnée des classes qui sont des intervalles de R
et des effectifs correspondants. On supposera que les classes sont de même amplitude.
 L’histogramme est formé de bandes rectangulaires ayant la largeur de chaque
classe et dont la hauteur est proportionnelle à l’effectif de la classe considérée.
 Le polygone des effectifs s’obtient en joignant par un segment de droite les divers
points de coordonnéess (ci , ni ).
On complète éventuellement les classes par deux classes extrêmes de même ampli-
tude que les précédentes et d’effectif nul.
 La courbe cumulative des effectifs représente la fonction de répartition définie
sur R : x 7→(somme des effectifs xi < x)
Les valeurs xi du caratère étudié sont supposées réparties uniformément dans
chaque classe.

15.1.5 Caractéristiques de position


Moyenne
Définition 15.1.6
Soit une série statistique quantitative et sa distribution, on notera xi les valeurs
du caractère et ni les effectifs
- Cas discret :
La moyenne de la série statistique quantitative notée x est par définition :

1P p n1 x1 + n2 x2 + · · · + np xp
x= ni xi =
n i=1 n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 301 — #311


i i

15.1 Séries statistiques à une dimension 301

-Cas continu :
On remplace les classes de caractères par leur milieu (ou les extrémités droites ou
gauches lorsque le milieu n’existe pas) et l’on se ramène au cas précédent.
Dans ce cas, la moyenne x peut être interprétée comme l’espérance d’une variable
aléatoire X prenant les valeurs xi comme distribution :
ni
P (X = xi ) =
n

En posant yi = αxi + β, et en remplaçant xi par yi on obtient :

y = αx + β

Mode

Définition 15.1.7
Le mode est la valeur du caractère correspondant à l’effectif le plus grand.
Lorsqu’il s’agit de classe, on dit alors classe modale.

Médiane

Définition 15.1.8
La médiane M est la valeur d’un caractère quantitatif (cas continu) correspondant
à un effectif cumulé égal à la moitié de l’effectif. Autrement dit, M est la valeur telle
qu’il y ait 50% des effectifs pour lesquels la valeur du caractère soit inférieure à M. ’et
donc 50% supérieure).
En pratique, on rajoute une troisième colonne à un tableau dans lequel on calcule
les effectifs cumulés croissants en pourcentage.
Reprenons le tableau 15.1.2 et calculons les effectifs cumulés croissants en pourcen-
tage (3ème colonne) :

Poids à l’âge Effectifs Effectifs cumulés


d’un an en gramme observés croissants en %
[1 150 ; 1 250[ 2 10
[1 250 ; 1 350[ 1 15
[1 350 ; 1 450[ 3 30
[1 450 ; 1 550[ 4 50
[1 550 ; 1 650[ 6 80
[1 650 ; 1 750[ 3 95
[1 750 ; 1 850[ 1 100

Tableau 15.1.3

La valeur 50 correspond à la valeur 1550 du caractère qui est donc la médiane M.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 302 — #312


i i

302 Chapitre 15. Statistique descriptive

Dans le cas où la valeur n’est pas égale à 50, une interpolation est alors nécessaire
pour obtenir M.

Poids à l’âge Effectifs Effectifs cumulés


d’un an en gramme observés croissants en %
[1 150 ; 1 250[ 1 4
[1 250 ; 1 350[ 3 16
[1 350 ; 1 450[ 2 24
[1 450 ; 1 550[ 5 44
[1 550 ; 1 650[ 3 56
[1 650 ; 1 750[ 6 80
[1 750 ; 1 850[ 4 96
[1 750 ; 1 850[ 1 100

Tableau 15.1.4

On constate que la médiane M est comprise entre 1550 et 1650.


Une interpolation linéaire donne alors :

50 − 44
M = 1550 + × (1650 − 1550) = 1600.
56 − 44

Quartiles

Définition 15.1.9
Soit une série statistique quantitative dont le caractère est continue et soit X une
variable aléatoire de fonction de répartition F et un réel α ∈]0, 1[.
On appelle quantile d’ordre α, tout réel xα tel que :

F (xα ) = α ⇐⇒ P (X < xα ) = α.

Le premier quartile, noté Q1 , est la valeur du caractère, telle que pour 25% des
effectifs la valeur du caractère soit inférieur (et donc 75% supérieure).
Donc le premier quartile n’est autre que le quantile d’ordre 1/4.
Le troisième quartile, noté Q3 , est la valeur du caractère, telle que 75% des effectifs
présentent une valeur inférieure à celle-ci (et donc 25% supérieure).
Q3 est aussi le quantile d’ordre 3/4.
Le second quartile coïncide avec la médiane : Q2 = M et qui est aussi le quantile
d’ordre 1/2.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 303 — #313


i i

15.1 Séries statistiques à une dimension 303

Ces résultats sont présentés dans une figure appelée Boite à moustache (ou boxplot)

Déciles
Définition 15.1.10
Dans le cas d’une série statistique quantitative à caractère continu, le premier
décile correspond à la valeur du caractère, telle que 10% des effectifs présentent une
valeur inférieures à celle-ci.
Le ième décile, noté Di est le quantile d’ordre i/10.
Le cinquième décile coïncide avec la médiane M = D5 .

15.1.6 Caractère de dispersion


Variance
Définition 15.1.11
La variance d’une série statistique quantitative est la moyenne des carrés des écarts
à la moyenne. Elle est définie par :
1P n
V (X) = ni (xi − x)2
n i=1
Formule dans laquelle x désigne la moyenne de la série statistique.
Dans le cas d’un caractère continu on utilise le même procédé que pour la moyenne.
Propriétés 15.1.1
Comme la moyenne, la variance d’une série statistique s’interprète comme la
variance d’une variable aléatoire X.Il s’en suit les propriétés suivantes :
Pour (a, b) ∈ R2 on a :
V (X + a) = V (X) changement en translation
V (aX) = a2 V (X) changement en dilatation
V (aX + b) = a2 V (X) changement d’origine et d’échelle
 Calcul pratique
On utilise souvent :
 n

1P
V (X) = ni x2i − x2 = (x2 ) − (x)2
n i=1
où x2 désigne la moyenne des carrés.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 304 — #314


i i

304 Chapitre 15. Statistique descriptive

Autres paramètres de dispersion


 L’étendue d’une série
C’est la différence entre la plus grande et la plus petite valeur du caractère.
 Ecart absolu moyen EAM :
C’est par définition la quantité :
1P n
EAM = ni |xi − x|
n i=1
 Ecart inter-quartile EQ
C’est par définition la quantité :
EQ = Q3 − Q1
 L’écart-type σ
C’est par définition la racine carré de la variance. L’écart-type sera noté σ(x) ou
σx ,on a donc p
σ(x) = σx = V (x)
ou encore
σ 2 (x) = σx2 = V (x)

15.2 Séries statistiques à deux dimensions


15.2.1 Définition
Définition 15.2.1
On appelle série statistique à deux dimensions (ou série statistique double) d’une
population Ω d’effectif total N, pour les caractères X et Y, l’application qui à chaque
élément de Ω associe le couple (xi , yi ) où xi sont les valeurs du caractère X et yi les
valeurs du caractère Y.
La distribution à deux variables est la donnée du tableau des effectifs des différentes
valeurs du couple de caractères (xi , yi ) dans une population de n individus.
Les résultats de cette observation peuvent être présentés sous deux formes :
 Données non groupées
Individu 1 2 3 ··· n
Valeur X x1 x2 x3 ··· xn
Valeur Y y1 y2 y3 ··· yn

 Données groupées
X \Y y1 y2 ··· ys Totaux
x1 n11 n12 ··· n1s n1.
x2 n21 n22 ··· n2s n2.
.. .. .. .. .. ..
. . . . . .
xr nr1 nr2 ··· nrs nr.
Totaux n.1 n.2 ··· n.s N

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 305 — #315


i i

15.2 Séries statistiques à deux dimensions 305

15.2.2 Corrélations
Données non groupées
Dans le cas où les données sont non groupée, alors elle peuvent être présentées dans
un tableau comme le suivant :

xi yi x2i yi2 xi yi
x1 y1 x21 y12 x1 y1
x2 y2 x22 y22 x2 y2
.. .. .. .. ..
. . . . .
xn yn x2n yn2 xn yn
n n n n n
x2i yi2
P P P P P
xi yi xi yi
i=1 i=1 i=1 i=1 i=1

On peut alors effectuer les calculs de la covariance, et du coefficient de corrélation.

Covariance Définition 15.2.2


Soit une série statistique quantitative à deux variables. Notons, n, le nombre
d’individus de la population et (xi , yi ) les couples.
On a alors les moyennes x et y définies par :

1P n 1P n
x= xi et y= yi
n i=1 n i=1

Les variances et les écarts-types qui leur sont associés sont :

1P n 1P n
V (x) = σx2 = x2 − x2 et V (y) = σy2 = y2 − y2
n i=1 i n i=1 i
p p
σx = V (x) et σy = V (y)
On peut alors définir la covariance du couple (xi , yi ).
Définition 15.2.3
La covariance du couple (xi , yi ) est par définition le réel notée cov(x, y) ou σxy qui
vaut :
1Pn
cov(x, y) = σxy = (xi − x)(yi − y)
n i=1
Propriété 15.2.1
Pour un calcul numérique plus facile on a :
1)  n 
1P
cov(x, y) = xi yi − xy
n i=1
2) Soient α, β, λ, et µ quatre réels, alors on a :

cov(αx + β, λy + µ) = αλcov(x, y).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 306 — #316


i i

306 Chapitre 15. Statistique descriptive

Coefficient de corrélation Définition 15.2.4


Soient σx et σy les écarts-types des deux caractères et cov(x, y) la covariance du
couple (x, y).
Le coefficient de corrélation, noté ρ(x, y), est défini par :
cov(x, y)
ρ(x, y) = .
σx σy
Propriété 15.2.2
Pour le calcul numérique on utilise plutôt la formule suivante :
Soient α, β, γ et δ quatre réels :
αγ
cov(αx + β, γy + δ) = ερ(x, y) où ε = .
|αγ|

Corrélation On démontre que |ρ(x, y)| ≤ 1.


Théorème 15.2.1
Si ρ(x, y) = ±1, on montre qu’il existe deux réel a et b tels que y = ax + b. C’est à
dire :
∀i, yi = axi + b.
On dit qu’il y a une forte corrélation entre deux caractère si ρ(x, y) est proche de
±1, et donc qu’il y a une liaison entre ces mêmes deux caractères. Une telle liaison
peut être causale (prix des cigarettes et consommation des cigarettes) ou non (nombre
de ananas vendues chaque jour dans une épicerie, et temps mis chaque jour par une
personne pour se rendre à son travail).
Remarque 15.2.1
Généralement, on considère que la corrélation est forte lorsqu’on a :
0, 87 ≤ ρ(x, y) ≤ 1.

Données groupées
Dans le cas où les données sont non groupée, alors elle peuvent être présentées dans
un tableau comme le suivant :
s s
ni. x2i
P P
X\Y y1 y2 ··· ys ni. ni. xi nij yj xi nij yj
j=1 j=1
x1 n11 n12 ··· n1s n1.
x2 n21 n22 ··· n2s n2.
.. .. .. .. .. ..
. . . . . .
xr nr1 nr2 ··· nrs nr. !
r r
 r
 s
ni. x2i
P P P P
n.j n.1 n.2 ··· n.s N ni. xi xi × nij yj
i=1 i=1 i=1 j=1
s
P
n.j yj n.j yj
j=1
s
n.j yj2 n.j yj2
P
j=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 307 — #317


i i

15.2 Séries statistiques à deux dimensions 307

Définition 15.2.5
La somme des effectifs partiels contenus dans la ligne de xi est égale à l’effectif des
éléments dont la valeur du caractère X est xi .
Elle est notée ni. :
s
P
ni. = ni1 + ni2 + · · · + nij + · · · + nis = nij
j=1

La somme des effectifs partiels contenus dans la colonne yj est égale à l’effectif des
éléments dont la valeur du caractère est yi .
Elle est notée n.j :
r
P
n.j = n1j + n2j + · · · + nij + · · · + nrj = nij
i=1

Les deux sommes ni. et n.j sont appelées les effectifs partiels marginaux :
r
P s
P r P
P s
N= ni. = n.j = nij
i=1 j=1 i=1j=1

Définition 15.2.6
Les fréquences marginales, notée fij , sont définies comme le rapport entre l’effectif
partiel marginal et l’effectif total.

ni.  fi. fréquence marginale de xi
fi. = , où ni. effectif partiel marginal de xi
N
N effectif total

de la même manière on a :

n.j  f.j fréquence marginale de yj
f.j = , où n.j effectif partiel marginal de yj
N
N effectif total

et on vérifie que :
r
P s
P r P
P s
fi. = f.j = fij = 1
i=1 j=1 i=1j=1

Définition 15.2.7
Les fréquences conditionnelles, notée fi/j , sont définies comme le rapport entre
l’effectif correspondant partiel et l’effectif partiel marginal .

nij fij  fi/j fréquence conditionnelles de xi sachant yj
fi/j = = , où nij effectif correspondant partiel à X = xi et Y = yj
n.j f.j
nij effectif partiel marginal de yj

De même on définit la fréquence conditionnelle de la valeur yj sachant xi .

nij fij
fj/i = =
ni. fi.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 308 — #318


i i

308 Chapitre 15. Statistique descriptive

On a donc :
fij = fi. × fj/i = f.j × fi/j .
Définition 15.2.8
Les variables X et Y sont dites indépendantes si et seulement si, quel que soit le
couple (i, j), on a :

fij = fi. × f.j .

Covariance Soit une série statistique quantitative à deux variables. Notons, ni. et
n.j les sommes des effectifs partiels, N la taille de la population et (xi , yi ) les couples.
On les moyennes x et y sont définies par :
1 Pr 1 Ps
x= ni. xi et y= n.j yj
N i=1 N j=1

les variances et les écarts-types qui leur sont associés sont définis par :
  !
1 Pr 1 Ps
2 2
V (X) = σx2 = ni. x2i − (x) et V (Y ) = σy2 = n.j yj2 − (y)
N i=1 N j=1
p p
σx = V (X) et σy = V (Y )
On peut donc définir la covariance du couple (xi , yi ).
Définition 15.2.9
On appelle covariance du couple (X, Y ) et on la note cov(X, Y ) ou σxy la moyenne
de (X − X)(Y − Y ).
Elle est définie par :
1 Pr Ps
cov(X, Y ) = σxy = nij (xi − x)(yi − y)
N i=1j=1

et pour le calcul, en pratique on utilise la formule suivante :


!
1 Pr P s
σxy = cov(X, Y ) = nij xi yj − xy
N i=1j=1

Coefficient de corrélation Définition 15.2.10


Soient σ(X) et σ(X) les écarts-types des deux caractères et cov(X, Y ) la covariance
du couple (X, Y ).
On appelle le coefficient de corrélation la quantité définie par :
cov(X, Y )
ρ(X, Y ) =
σ(X).σ(Y )
On a toujours |ρ(X, Y )| ≤ 1, et une forte corrélation entre les deux caractères X
et Y lorsque :
ρ(X, Y ) = ±1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 309 — #319


i i

15.2 Séries statistiques à deux dimensions 309

15.2.3 Ajustement linéaire

Le problème consiste à déterminer une droite ajustant au mieux un nuage de points,


qui est la donnée de n points du plan (que l’on supposera distincts), c’est à dire qu’il
faut trouver une équation de la droite pour laquelle les points doivent être le plus près
possible d’elle.

Méthode des moidres carrés

Définition 15.2.11
Soient Mij les points du nuage de coordonnées (xi , yj ), dans un repère orthonormal,
et D la droite d’équation :
y = ax + b.

Désigons par Hij le point de D d’abscisse xi . La méthode des moindres carrés


consiste à choisir pour droite d’ajustement celle pour laquelle, la somme des carrés
des distances :
d2ij = f (a, b) = (Mij Hij )2 est minimale.
P

 Détermination des coefficients a et b


La distance entre les deux points Mij et Hij est

dij = |yj − axi − b| = |axi + b − yj |

La fonction f (a, b) = (axi + b − yj )2 peut être considérée comme une fonction


P
des deux variables a et b, et la condition nécessaire et suffisante pour que cette fonction
est minimale est que les dérivées partielles de f (a, b) soit simultanément nulles, donc
que :
 P 2 P P
 a xi + b xi − xi yj = 0
et
 P P
a xi + nb − yj = 0

En interprétant les couples (xi , yj ) comme la donnée d’une série statistique quanti-
tative à deux variables, on obtient alors :

cov(x, y) σxy
a= = 2 et b = y − ax
V (x) σx

Propriétés 15.2.3
Ce sont celles de cov(x, y) et de V (x).
On peut utiliser les formules suivantes des coefficients a et b plus facilement à
claculer :
P
(xi − x)(yi − y)
a= P et y = ax + b
(xi − x)2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 310 — #320


i i

310 Chapitre 15. Statistique descriptive

Droites de régression
Définition 15.2.12
La droite d’ajustement déterminée par la méthode des moindres carrés est aussi
appelée la droite de régression de y en x, et on la note Dy/x , la droite d’équation :

cov(x, y) σxy
Dy/x : y − y = a(x − x), avec a = = 2
V (x) σx

ou Dy/x : y = ax + b avec b = y − ax.


Définition 15.2.13
On peut faire aussi le même ajustement en permutant le rôle des coordonnées. On
définit ainsi la droite de régression de x en y, et on la note Dx/y , d’équation :

cov(x, y) σxy
Dx/y : x − x = a0 (y − y), avec a0 = = 2
V (y) σy

Par conséquent les deux droites de régressiosn possibles D et D0 sont d’équation :

cov(x, y)
D = Dy/x : y = ax + b avec a = et b = y − ax
V (x)

cov(x, y)
D0 = Dx/y : y 0 = a0 x + b0 avec a0 = et b0 = x − a0 y
V (y)
Remarque 15.2.1
Le produit des deux coefficients a et a0 n’est autre que le carré du coefficient de
corrélation : 2
2 
0 [cov(x, y)] cov(x, y)
aa = = = ρ2 (x, y)
V (x)V (y) σ(x)σ(y)
Les coefficients, a et a10 sont de même signe, d’où :

 si 0 < ρ < 1
 alors Dy/x et Dx/y sont ascendantes
si − 1 < ρ < 0 alors Dy/x et Dx/y sont descendantes


 si ρ = 1 alors Dy/x et Dx/y sont confondues et ascendantes
si ρ = −1 alors Dy/x et Dx/y sont confondues et descendantes

La corrélation est forte si 0, 87 ≤ ρ ≤ 1 ce qui justifie un ajustement linéaire.


Dans le cas où ρ = 0, on dit qu’il y a corrélation nulle entre X et Y , ce qui n’exclu
pas que l’on puisse ajuster X et Y par une courbe.

15.3 Exercices
15.3.1 Enoncés
Exercice 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 311 — #321


i i

15.3 Exercices 311

Le traitement thermique des pièces confère des caractéristiques mécaniques et des


avantages très utiles à la longévité des fonctionnements. L’essai de dureté Rockwell
HRC, par pénétration d’une bille dans le corps à contrôler permet suivant l’empreinte
de graduer la valeur de dureté et donc de la comparer au résultat prévu. Ce contrôle
est effectué par prélèvement et pour un échantillon de 30 pièces sur une production en
grande série, on obtient les résultats groupés par classe d’amplitude 0, 5 HRC.

Dureté HRC Effectifs


[52; 52, 5[ 1
[52, 5; 53[ 1
[53; 53, 5[ 2
[53, 5; 54[ 3
[54; 54, 5[ 5
[54, 5; 55[ 6
[55; 55, 5[ 4
[55, 5; 56[ 4
[56; 56, 5[ 2
[56, 5; 57[ 2

1) Dresser le tableau des fréquences, des fréquences cumulées croissantes et décrois-


santes, et des effectifs cumulés croissants et décroissants.
2) Déterminer la médiane de cet échantillon.
3) Calculer la dureté moyenne x et l’écart-type σ de cet échantillon.
Exercice 2
Un société fabrique en série des composants éléctriques du type resistances, capaci-
tés. Chaque produit est ensuite classé selon des critères de précision et de tolérance
calculés sur le lot fabriqué. Ainsi une même valeur de capacité peut être achetée à
différents prix suivant la classe de précision et de tolérance à laquelle elle appartient.
On mesure en Ohms 100 résistances prises au hasard dans une production en série,
on obtient les résultats suivants :

R en Ohms Effectifs
[16, 0; 16, 1[ 1
[16, 1; 16, 2[ 4
[16, 2; 16, 3[ 4
[16, 3; 16, 4[ 10
[16, 4; 16, 5[ 17
[16, 5; 16, 6[ 20
[16, 6; 16, 7[ 20
[16, 7; 16, 8[ 14
[16, 8; 16, 9[ 8
[16, 9; 17, 0[ 2

Calculer la moyenne et l’écart-type de cet échantillon, on posera

ui = (xi − 16, 5) × 100.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 312 — #322


i i

312 Chapitre 15. Statistique descriptive

Exercice 3
Le tableau suivant représente la distribution de la taille des coquilles d’individus
adultes des escargots en France Deux régions ont été étudiées :
A : région du centre et B : Région du sud.

Intervalle en Nombre Nombre


millimètres d’individus de A dindividus de B
[16; 17[ 0 20
[17; 18[ 100 40
[18; 19[ 200 110
[19; 20[ 950 280
[20; 21[ 210 80
[21; 22[ 200 60
[22; 23[ 45 66
[23; 24[ 8 1
[24; 25[ 0 0
[25; 26[ 1 0
[26; 27[ 0 0
[27; 28[ 1 0
[28; 29[ 0 0

Pour chacune des deux distributions, calculer la moyenne, la médiane, les quartiles
et l’écart-type.
Exercice 4
On a relevé le nombre d’enfants dans 850 ménages ayant au moins un enfant.
On a obtenu la série statistique suivante :

Nombre d’enfants Effectifs


1 282
2 273
3 148
4 70
5 35
6 42

Déterminer la moyenne, la variance, l’écart-type, l’écart absolu moyen de cette


série statistique.
Exercice 5
On a mesuré la taille de 86 individus mâles d’une espèce de rongeurs et l’on a
obtenu le tableau d’effectifs ci-dessus :
T =Taille en centimètre et E = Effectif :
T 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68
E 1 0 3 0 3 8 7 11 11 10 6 14 6 3 1 1 1

Calculer la médiane, la moyenne, l’écart-type, le coefficient de variation (rapport


de l’écart-type et de la moyenne).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 313 — #323


i i

15.3 Exercices 313

Exercice 6
Le tableau suivant donne la répartition du personnel d’une société suivant le salaire
annuel :
Salaire annuel
Cadres Employés Ouvriers
en miliers d’euros
[15; 16[ 0 5 15
[16; 17[ 2 13 37
[17; 18[ 3 15 58
[18; 19[ 3 18 74
[19; 20[ 4 14 40
[20; 25[ 3 4 16
[25; 30[ 8 5 10
[30; 40[ 3 0 0
[40; 50[ 4 0 0
1) Déterminer la médiane M e, les quartiles Q1 et Q3 et le dernier décile D9 des
trois catégories.
2) Trouver le pourcentage de personnel dans chaque catégorie dont le salaire est
inférieur à 20000 euros.
Exercice 7
Afin de mettre au point des méthodes d’action sanitaire sur la population d’un
pays en voie de développement, on étudie la répartition des poids et des tailles d’un
échantillon d’hommes de cette population, par comparaison avec la même répartition
dans un pays développé.
Dans ce but, on a relevé les poids et tailles d’un échantillon de N habitants de
chacun des deux pays. Cela a permis de présenter un tableau pour chaque pays donnant,
pour chaque taille xi et chaque poids yi le nombre nij d’individus ayant la taille xi et
le poids yj .
De ces tableaux, on a tiré, grâce aux calculs habituels, les caractéristiques suivantes :

Population du Population du
Caractéristiques
pays A pays B
Moyenne des tailles x 165 170
Variance des tailles V (x) 25 25
Moyenne des poids y 65 70
poids V (y)
Variance des P 9 25
(x−x)(y−y)
Covariance = N 12 12

1) Donner les équations des droites de régression de y en x et de x en y pour


chacune des deux populations
2) Calculer les coefficients de corrélation entre les poids et les mesures.
Exercice 8
Lors du dépouillement de l’enquête de nutrition, on a calculé, pour chacun des 38
ménages soumis à l’enquête,
- le nombre d’unité de nutrition x (en tenant compte du nombre de personnes
présentes et de leurs besoins physiologiques évidemment variables suivant le sexe, l’âge,
le travail effectué...)

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 314 — #324


i i

314 Chapitre 15. Statistique descriptive

- le nombre de miliers de calories y consommées par le ménage en une journée.


Ci-contre le tableau des 38 couples (x, y) correspondant chacun à un ménage :

x 5, 1 7, 3 7, 2 5, 6 7, 1 5, 6 3 3, 3 8, 9 5, 2
y 11, 9 16 18 9, 4 15, 4 12, 3 5, 8 9, 3 14, 6 10, 1

x 4, 5 4, 1 7, 3 5, 7 4, 7 4, 8 2, 6 7, 6 6, 7 10, 1
y 7, 1 8, 9 19 12, 1 11, 5 16, 3 10, 5 9 17, 9 25, 8

x 9, 8 3, 1 6, 7 3, 7 3, 1 9, 2 5, 9 7, 2 6, 4 5, 4
y 25, 8 7, 3 13, 4 8, 9 9, 3 13, 6 8, 2 28, 2 14, 3 8, 2

x 2, 4 3, 5 4 5, 7 5, 3 4, 6 2, 8 6, 1
y 6, 1 6, 3 9, 9 14, 9 14, 6 13, 2 8, 6 19, 4

1) Calculer les écart-types σ(x) et σ(y).


2) Déterminer l’équation de la droite de régression de y en x.
Que représente cette droite ?
3) Calculer le coefficient de corrélation entre x et y.
Que signifie le résultat obtenu ?

15.3.2 Corrigés
Exercice 1
1) Tableau des fréquences, les fréquences cumulées croissantes et décroissantes, les
effectifs cumulés croissants et décroissants.
Centre de
Dureté HRC ni fi % ni % fi % % ni & fi & %
classe xi
[52; 52, 5[ 52, 25 1 3, 33 1 3, 33 30 100
[52, 5; 53[ 52, 75 1 3, 33 2 6, 67 29 96, 67
[53; 53, 5[ 53, 25 2 6, 67 4 13, 33 28 93, 33
[53, 5; 54[ 53, 75 3 10 7 23, 33 26 86, 67
[54; 54, 5[ 54, 25 5 16, 67 12 40 23 76, 67
[54, 5; 55[ 54, 75 6 20 18 60 18 60
[55; 55, 5[ 55, 25 4 13, 33 22 73, 33 12 40
[55, 5; 56[ 55, 75 4 13, 33 26 86, 67 8 26, 67
[56; 56, 5[ 56, 25 2 6, 67 28 93, 33 4 13, 33
[56, 5; 57[ 56, 75 2 6, 67 30 100 2 6, 67
2) La médiane M e appartient à la classe [54, 5; 55[, on peut écrire par interpolation
linéaire :
 
50 − 40 10
M e = 54, 5 + (55 − 54, 5) × = 54, 5 + 0, 5 ×
60 − 40 20
M e = 54, 75 HRC

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 315 — #325


i i

15.3 Exercices 315

On pourra aussi déterminer la médiane en traçant les deux courbes des fréquences
croissantes et décroissantes en pourcentage, l’abscisse de leur intersection permet
d’obtenir la médiane M e.
3) Pour le calcul de la moyenne et de l’écart-type, on effectuera le changement de
variable ui = xi −54,75
0,5 .

Dureté HRC Centre xi ni ui ni ui u2i ni u2i


[52; 52, 5[ 52, 25 1 −5 −5 25 25
[52, 5; 53[ 52, 75 1 −4 −4 16 16
[53; 53, 5[ 53, 25 2 −3 −6 9 18
[53, 5; 54[ 53, 75 3 −2 −6 4 12
[54; 54, 5[ 54, 25 5 −1 −5 1 5
[54, 5; 55[ 54, 75 6 0 0 0 0
[55; 55, 5[ 55, 25 4 1 4 1 4
[55, 5; 56[ 55, 75 4 2 8 4 16
[56; 56, 5[ 56, 25 2 3 6 9 18
[56, 5; 57[ 56, 75 2 4 8 16 32
Total 30 −5 0 146

Calcul de la moyenne :
P
ni ui
u= =0
N

d’où

x = 54, 75 HRC

Calcul de l’écart-type :
rP
ni u2i
σ(u) = − u2
N
r
146
= −0
30
σ(u) = 2, 206 HRC

or σ(x) = 0, 5σ(u), par conséquent, on a :

σ(x) = 1, 103 HRC

Exercice 2
Soit le tableau avec les colonnes qui seront les diverses classes, leurs centres,

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 316 — #326


i i

316 Chapitre 15. Statistique descriptive

ui = (xi − 16, 5) × 100; u2i ; ni ; ni ui et ni u2i .

R en Ohms Centre xi ui u2i ni ni ui ni u2i


[16, 0; 16, 1[ 16, 05 −45 2025 1 −45 2025
[16, 1; 16, 2[ 16, 15 −35 1225 4 −140 4900
[16, 2; 16, 3[ 16, 25 −25 625 4 −100 2500
[16, 3; 16, 4[ 16, 35 −15 225 10 −150 2250
[16, 4; 16, 5[ 16, 45 −5 25 17 −85 425
[16, 5; 16, 6[ 16, 55 5 25 20 100 500
[16, 6; 16, 7[ 16, 65 15 225 20 300 4500
[16, 7; 16, 8[ 16, 75 25 625 14 350 8750
[16, 8; 16, 9[ 16, 85 35 1225 8 280 9800
[16, 9; 17, 0[ 16, 95 45 2025 2 90 4050
Total 100 600 39700

Calcul de la moyenne :
P
ni ui 600
u= = =6
N 100

d’où

x = x0 + hu
= 16, 5 + 0, 1 × 6
x = 16, 56 Ω

avec x0 = 16, 5 et h = 0, 01
Calcul de la variance :

ni u2i
P
σ 2 (u) = − u2
N
39700
= − 36 = 361
600
σ 2 (u) = 192

d’où σ 2 (x) = h2 × σ 2 (u) on en déduit donc l’écart-type :

σ(x) = |h| × σ(u)


= 0, 01 × 19
σ(x) = 0, 19 Ω

Exercice 3
En remplaçant chaque classe par son milieu, on obtient :
Région A : Moyenne xA = 19, 728 et l’écart-type σA = 1, 121
Région B : Moyenne xB = 19, 731 et l’écart-type σB = 1, 431

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 317 — #327


i i

15.3 Exercices 317

Afin de calculer les médianes et les quartiles, dressons les tableaux des fréquences
cumulées en pourcentages :

Région A Région B
[17; 18[ 5, 83
[16; 17[ 3, 04
[18; 19[ 17, 49
[17; 18[ 9, 13
[19; 20[ 72, 89
[18; 19[ 25, 87
[20; 21[ 85, 13
[19; 20[ 68, 49
[21; 22[ 96, 79
[20; 21[ 80, 67
[22; 23[ 99, 42
[21; 22[ 89, 80
[23; 25[ 99, 88
[22; 23[ 99, 85
[25; 27[ 99, 94
[23; 24[ 100
[27; 28[ 100

Pour la Région A :
La médiane est :
50 − 17, 49
M e = 19 + (20 − 19) = 19, 59
72, 89 − 17, 49
Le premier quartile est :
25 − 17, 49
Q1 = 19 + (20 − 19) = 19, 14
72, 89 − 17, 49
Le troisième quartile est :
75 − 17, 49
Q3 = 20 + (21 − 20) = 20, 17
85, 13 − 17, 49
Pour la Région B :
La médiane est :
50 − 25, 87
M e = 19 + (20 − 19) = 19, 57
68, 49 − 25, 87
Le premier quartile est :
25 − 9, 13
Q1 = 18 + (19 − 18) = 18, 98
25, 87 − 9, 13
Le troisième quartile est :
75 − 68, 49
Q3 = 20 + (21 − 20) = 20, 53
80, 67 − 68, 49
Exercice 4
La moyenne est
1P n
x= ni xi = 2, 33
n i=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 318 — #328


i i

318 Chapitre 15. Statistique descriptive

L’écart-type est égal à


s
1P n
σ(X) = ni (xi − x)2 = 1, 374
n i=1

Et l’écart absolu moyen EAM est par définition la quantité :


1P n
EAM = ni |xi − x| = 1, 09
n i=1
Exercice 5
La moyenne est
1 Pn
T = Ei Ti = 60, 43
N i=1
L’écart-type est égal à
s
1 Pn
σ(T ) = Ei (Ti − T )2 = 3, 04
N i=1

Et le coefficient de variation δ est :

T
δ= = 0, 05
σ(T )
On peut situer la médiane entre 59 et 60.
Exercice 6
En remplaçant chaque classe par son milieu, l’on obtient :

Cadres Employés Ouvriers


Moyennes 12, 72 7, 09 6, 93
Ecart-types 6, 20 2, 70 2, 41
Dressons les tableaux des fréquences cumulées en pourcentage :

Cadres Employés Ouvriers


[16; 17[ 6, 66
[15; 16[ 6, 75 [15; 16[ 6
[17; 18[ 16, 66
[16; 17[ 24, 32 [16; 17[ 20, 8
[18; 19[ 26, 66
[17; 18[ 44, 59 [17; 18[ 44
[19; 20[ 40
[18; 19[ 68, 92 [18; 19[ 73, 6
[20; 25[ 50
[19; 20[ 87, 84 [19; 20[ 89, 6
[25; 30[ 76, 66
[20; 25[ 93, 24 [20; 25[ 96
[30; 40[ 86, 66
[25; 30[ 100 [25; 30[ 100
[40; 50[ 100

Pour la catégorie des cadres on a :


La médiane :
M e = 25

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 319 — #329


i i

15.3 Exercices 319

Le premier quartile :

25 − 16, 66
Q1 = 18 + (19 − 18) = 18, 834
26, 66 − 16, 66

Le troisième quartile :

75 − 50
Q3 = 25 + (30 − 25) = 29, 689
76, 66 − 50

Le dernier décile :
90 − 86, 66
D9 = 40 + (50 − 40) = 42, 5
100 − 86, 66

Par des calculs analogues, on obtient :


Employés : M e = 18;
25−24,32
Q1 = 17 + 44,59−24,32 (18 − 17) = 17, 03;
75−68,92
Q2 = 19 + 87,84−68,92 (20 − 19) = 19, 32;
90−87,84
D9 = 20 + 93,24−87,84 (25 − 20) = 22.
 Ouvriers : M e = 18;
25−20,8
Q1 = 17 + 44−20,8 (18 − 17) = 17, 18;
75−73,6
Q2 = 19 + 89,6−73,6 (20 − 19) = 19, 09;
90−89,6
D9 = 20 + 96−89,6 (25 − 20) = 20, 31.
2) Pour chaque catégorie, les pourcentages de personnel dont le salaire est inférieur
à 20000 euros sont respectivement : 40% ; 87, 84% et 89, 60%.
Exercice 7
La droite de régression de y en x, notée Dy/x , est la droite d’équation y − y =
a(x − x), avec a = cov(x,y)
V (x) .
Pour la population A :

A 12
Dy/x : y − 65 = (x − 165)
25
A
Dy/x : y = 0, 48x − 14, 20

Pour la population B :
La droite de régression de y en x est :

B 12
Dy/x : y − 70 = (x − 170)
25
B
Dy/x : y = 0, 48x − 11, 60

La droite de régression de x en y, notée Dx/y , est d’équation :

cov(x, y) σxy
x − x = a0 (y − y), avec a0 = = 2.
V (y) σy

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 320 — #330


i i

320 Chapitre 15. Statistique descriptive

Pour la population A :
0
A 12
Dx/y : x − 165 = (y − 65)
9
0
A
Dx/y : x = 1, 33y + 78, 34

Pour la population B :
La droite de régression de x en y est :
0
B 12
Dx/y : x − 170 = (y − 70)
25
0
B
Dx/y : x = 0, 48y + 136, 4

2) Le coefficient de corrélation est définie par :

cov(x, y)
ρ(x, y) =
σ(x).σ(y)

On donc ici :
pour la population A :

cov(x, y) 12 12
ρA (x, y) = =√ √ = = 0, 8
σ(x).σ(y) 25 × 9 15

pour la population B, le coefficient de corrélation est :

cov(x, y) 12 12
ρB (x, y) = =√ √ = = 0, 48.
σ(x).σ(y) 25 × 25 25

Exercice 8
1) En appliquant les formules de la moyenne, variance et covariance, on trouve :

x = 5, 56; y = 12, 92

V (x) = 3, 97; V (y) = 23, 40


et
cov(x, y) = 7, 98
Donc les écart-types sont :
σ(x) = 1, 99 en nombre d’unité de nutrition
σ(y) = 4, 84 en milliers de calories
2) La droite de régression de y en x est :

Dy/x : y − y = a(x − x)
7, 98
Dy/x : y − 12, 92 = (x − 5, 56)
3, 97
Dy/x : y = 2, 01x + 1, 74

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 321 — #331


i i

15.3 Exercices 321

3) Le coefficient de corrélation entre x et y est :

cov(x, y) 7, 98
ρ(x, y) = = = 0, 83
σ(x).σ(y) 1, 99 × 4, 84

Le coéfficient de corrélation est proche de 1, on dit qu’il existe une relation causale
entre le nombre d’unités de nutrition et le nombre de milliers de calories consommées
par les ménages en une journée.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 322 — #332


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 323 — #333


i i

CHAPITRE 16

Echantillonnage et Estimation

Pour étudier une population statistique on a recours à deux méthodes l’une est coûteuse
et fiable, l’autre et beaucoup moins coûteuse mais moins fiable aussi.
1) la méthode exhaustive : ou recesement qui consiste à examiner chaque individu
de la population selon les caractères étudiés. Elle est peu employée, à cause de son
coût, sa durée, etc .
2) la méthode des sondage : qui consiste à examiner un échantillon de la population.
Cette méthode comprend deux parties
a- l’échantillonnage : qui permet de passer d’une population totale connue à
un échantillon.
b- l’estimation : qui consiste à induire à partir des résultats observés sur
l’échantillon des résultats concernant la population.

16.1 Echantillonnage
16.1.1 Distribution des moyennes d’échantillon

Soit une population mère P d’effectif N . On étudie un caractère pour lequel la moyenne
de la population est m et l’écart-type σ.
Soient tous les les échantillons Ei de taille n issus de la population
– E1 (effectif n,moyenne x1 , écart-type s1 = σ10 )
– E2 (effectif n,moyenne x2 , écart-type s2 = σ20 )
.
– ..
– Ek (effectif n,moyenne xk , écart-type sk = σk0 )
L’ensemble X = {x1 , x2 , x3 , . . . , xk } est une série statistique d’effectif k appelée
distribution des moyennes.
On peut montrer que :
1- La valeur espérée (espérance) de la moyenne de l’échantillon est la moyenne de
la population :

E X = m.

2- Si la population est infinie ou si l’échantillonnage est non exhaustif c’est à dire

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 324 — #334


i i

324 Chapitre 16. Echantillonnage et Estimation

remise à chaque fois dans la population de l’échantillon tiré, alors on :


σ
σX = √ .
n

3- Si l’échantillonnage est exhaustif alors on a :


r
σ N −n
σX = √ .
n N −1

Théorème 16.1.1
La variance d’un échantillon de taille n peut être considérée comme une variable
aléatoire s2 , définie sur Ω. On a alors :
n−1 2
E(s2 ) = σ .
n
Théorème 16.1.2
Soit n la taille d’un échantillon de moyenne X, m la moyenne de la population de
taille N et σ son écart-type.
1 - Si n ≥ 30 et si l’échantillon est non exhaustif alors :
A = X−m√σ suit une loi normale centrée réduite. A N (0, 1)
n
2 - Si n ≥ 30 et si l’échantillon est exhaustif alors :
B = σ X−m
p N −n suit une loi normale centrée réduite. B N (0, 1)

n N −1

16.1.2 Distribution des pourcentages ou fréquences ou proportions d’échantillon


Considérons une population mère P et une propriété telle que chaque élément :
- ou bien possède cette propriété (p pourcentage de ces éléments dans P )
- ou bien ne possède pas cette propriété (q = 1 − p le pourcentage de ces éléments)
On définit une variable aléatoire X en associant :
- la valeur 1 aux éléments de P possédant la propriété
- la valeur 0 aux éléments de P ne possédant pas la propriété
On remarque bien la variable aléatoire X suit une loi de Bernouilli de paramètre p.
On considère dans chaque échantillon le pourcentage ou fréquence f des éléments
possédant la propriété.
On définit ainsi une nouvelle variable aléatoire F et on montre que :

 E(F ) p
 =m=p
σf = q pq
n , pour un échantillon non exhaustif
 σf = pq . N −n , pour un échantillon exhaustif

n N −1

Théorème 16.1.3
Soit n la taille d’un échantillon de pourcentage p (avec q = 1−p) dans la population,
N la taille de la population, σ son écart-type et f la fréquence des éléments possédante
le pourcentage p.
1 - Si n ≥ 30, np ≥ 10 et si l’échantillon est non exhaustif alors :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 325 — #335


i i

16.2 Estimation 325

f −p
C=√ pq suit une loi normale centrée réduite. C N (0, 1)
n
2 - Si n ≥ 30, np ≥ 10 et si l’échantillon est exhaustif alors :
f −p
D = p pq N −n
suit une loi normale centrée réduite. D N (0, 1)
n . N −1

16.2 Estimation
Connaissant la moyenne X, et l’écart-type σ 0 d’un échantillon de taille n, il s’ageit
d’estimer la moyenne m inconnue de la population-mère P . On a alors recours à deux
méthodes
- Soit choisir une valeur m0 de m, on parle alors d’une estimation ponctuelle
- Soit choisir un intervalle contenant m avec une probabilité donnée, on parle dans
ce cas d’une estimation par intervalle de confiance.

16.2.1 Estimateur sans biais


Définition 16.2.1
Un estimateur sans biais d’un paramètre d’une population est une variable aléatoire
Y, définie sur Ω, telle que :
1- l’espérance de Y est égale au paramètre
2- la variance V (Y ) tend vers zéro quand n tend vers l’infini
Propriété 16.2.1
La moyenne d’un échantillon de taille n peut être considérée comme une variable
X définie sur Ω.
X est un estimateur sans biais de la moyenne m d’une population car on a
E(X) = m.
Propriété 16.2.2
La variance s2 n’est pas un estimateur sans biais de la variance d’une population,
mais la variable aléatoire s∗2 définie par :
n 2
s∗2 = s
n−1
appelée variance corrigée, l’est.
Théorème 16.2.1
Soit une population dans laquelle un caractère est distribué suivant une loi normale
de moyenne m. X désigne la variable aléatoire définie dans la propriété 16.2.1 et s∗2
la variance définie dans la propriété 16.2.2.
a- Si l’écart-type σ est connu dans la population, alors :

X −m
T = √ N (0, 1)
σ/ n
T suit une loi normale centrée réduite.
b- Si l’écart-type σ est inconnu dans la population, alors :

X −m
T = √ Tn−1
s∗ / n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 326 — #336


i i

326 Chapitre 16. Echantillonnage et Estimation

T suit une loi de Student à n − 1 degrès de liberté (d.d.l.).


Remarque 16.2.1
L’hypothèse de normalité dans la population n’est pas nécessaire lorsque la taille
de l’echantillon est assez grande (n ≥ 30)

16.2.2 Estimation ponctuelle


Estimation ponctuelle de la moyenne
On prend pour estimation de la moyenne m de la population-mère P , la moyenne x
de l’échantillon.
Donc l’estimation de m est x.
Autrement dit :

E(X) = m
σX = √σn tends vers 0 quand n −→ +∞.

Estimation ponctuelle d’un pourcentage


La valeur du caractère prend les valeurs 1 et 0 avec les probabilités inconnues p et
q = 1 − p. La moyenne de l’échantillon est remplacée par le pourcentage f et la
moyenne inconnue de la population-mère par p On a alors :

Estimation de (p) = f.

Estimation ponctuelle d’une variance


On peut montrer que pour une estimation correcte (sans biais) de la variance σ 2 de la
population P , on peut prendre.
r
0 n
Estimation de (σ) = σ
n−1
or σX = √σ , d’où l’estimation de σX .
n
0
σ
Estimation de σX = √n−1 :

 σ = écart-type de la population-mère
σ 0 = s = écart-type d’un échantillon
σX = écart-type de la distribution des moyennes d’échantillon

q
Si n −→ +∞ alors σ 0 n−1 n
∼ σ0 .

Estimation d’une moyenne et d’une variance à partir de deux échantillons


Dans une populations-mère P , on prend deux échantillons :
 P
 E taille n , moyenne x = xi
1 1 1 Pn1
 E taille n , moyenne x = xj
2 2 2 n2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 327 — #337


i i

16.2 Estimation 327

On a respectivementP pour estimation


P de
xi xj
 la moyenne de P, n1 et n2
P P
(xi −x1 )2 (xj −x2 )2
 la variance de P, n1 −1 et n2 −1
On peut prendre pourPestimation
P de
xi + xj
 la moyenne de P,
P n1 +n2 2 P
(xi −x1 ) + (xj −x2 )2
 la variance de P, (n1 −1)+(n2 −1)

16.2.3 Estimation par intervalle de confiance (IC)


Estimation d’une moyenne par IC
On suppose que la distribution des moyennes d’échantillon suit une loi normale
N (m, √σn ) ; m, σ sont la moyenne et l’écart-type de la population-mère, n la taille des
échantillons.
X−m
Soit T la variable aléatoire définie par T = σ/√ où X la moyenne d’un échantillon
n
de taille n ≥ 30 et α un réel donné compris entre 0 et 1 ; la table de la loi normale
centrée réduite (Annexe), ou la table de la loi de Student 5annexe) à n − 1 degrés de
liberté, permettent de déterminer le réel tα tel que :

P [|T | < tα ] = 1 − α
⇐⇒ P (m − tα √σn ≤ X ≤ m + tα √σn ) = 1 − α = 2Φ(t)

or |T | < tα équivant, suivant le cas où la variance de la population est connue ou


pas, à : h i
m ∈ X − tα √σn ; X + tα √σn (si σ est connu)
h ∗ ∗
i
ou m ∈ X − tα √s n ; X + tα √s n (si σ est inconnu)
h i
L’intervalle X − tα √σn ; X + tα √σn s’appelle l’intervalle de confiance de la moyenne
m de la population-mère avec le coefficient de confiance 2Φ(t) = 1 − α ou au seuil α
(ou au risque d’erreur α).
Si l’on se donne le coefficient de confiance 2Φ(t) les tables permettent de déterminer
tα , et par suite l’intervalle de confiance si on connaît σ (qui est choisi en général pour
une méthode d’estimation ponctuelle).
Pour un coefficient de confiance 0,95 (α = 5%), la table de la loi normale centrée
réduite donne tα = 1, 96, d’où
σ σ
X − 1, 96 √ ≤ m ≤ X + 1, 96 √
n n

Pour un coefficient de confiance 0,99 (α = 1%), la table de la loi normale centrée


réduite donne tα = 2, 576, d’où
σ σ
X − 2, 576 √ ≤ m ≤ X + 2, 576 √
n n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 328 — #338


i i

328 Chapitre 16. Echantillonnage et Estimation

Estimation d’un pourcentage par IC


Soit T la variable aléatoire définie par T = pff−p
(1−f )
où f le pourcentage (fréquence)
n
observé de l’échantillon de taille n ≥ 30, p le pourcentage dans la population et α un
réel donné compris entre 0 et 1 ; la table de la loi normale centrée réduite, permet de
déterminer le réel tα tel que :

q P [|T | < tα ] = 1q− α


f (1−f ) f (1−f )
⇐⇒ P (f − tα n ≤ p ≤ f + tα n ) = 1 − α = 2Φ(t)

or |T | < tα équivant à :
L’intervalle de confiance de 2Φ(t) est :
" r r #
f (1 − f ) f (1 − f )
p ∈ f − tα ; f + tα
n n

Une réalisation de cet intervalle aléatoire donne alors l’intervalle de confiance pour
le pourcentage p (ou fréquence) au seuil α (ou au risque d’erreur α). C’est à dire que
pour une valeur de f observée, l’intervalle aléatoire fournit un intervalle [a, b], dans
lequel p se trouvera avec une probabilité 1 − α = 2Φ(t).

16.3 Exercices
16.3.1 Enoncés
Exercice 1
On mesure les diamètres de pièces mécaniques dans un lot important fabriqué par
une même machine. Les valeurs observées suivent une loi normale de moyenne 10,06
mm et d’écart-type 0,18 mm.
Si l’on prélève dans ce lot 9 pièces au hasard, quelle est laprobabilité pour que le
diamètre moyen de cet échantillon soit :
1- inférieur à 10 mm
2- supérieur à 10,15 mm.
Exercice 2
Une machine automatique remplit des paquets de céréales, les poids en gramme
sur un échantillon de 10 paquets sont :

297; 300; 295; 297; 300; 310; 300; 295; 310; 300
1) Calculer le poids moyen du paquet de céréal de l’échantillon et son écart-type.
2) Donner une estimation de l’écart-type de la population.
Exercice 3
1) Soit X = {x1 , x2 , . . . , xn } une série statistique qui suit une loi normale de
moyenne inconnue m et d’écart-type σ = 0, 31.
On prélève un échantillon au hasard de taille n = 100, la moyenne des valeurs de
cet échantillon est x = 5, 2.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 329 — #339


i i

16.3 Exercices 329

Trouver un intervalle contenant m avec une confiance de 95%.


2) Soit p le pourcentage des ananas extra-sucrès dans la livraison hebdomadaire
d’un hypermarché.
Dans un échantillon de 100 ananas, on a constaté que 76 d’entre eux possédaient
cette qualité.
En déduire un intervalle de confiance de la proportion p, de centre 76 avec un
coefficient de confiance de 98%.
Exercice 4
On fabrique des billes en série. Leur diamètre est une variable aléatoire normale
X, de moyenne m = 32 mm.
Pour contrôler la fabrication, on prélève à un intervalle régulier un échantillon de
20 billes.
Soit x la moyenne de X dans un échantillon.
1) Quelle est la loi de probabilité de x ?
2) Entre quelles limites doit être située x pour que la machine puisse être considérée
comme bien réglée avec une probabilité de 0,99 ?
3) Les billes doivent être utilisées ensuite. Pour cela elles doivent satisfaire à la
norme 31 < x < 33.
Quelle est la probabilité pour qu’une pièce soit utilisable ?
Exercice 5
Si l’écart-type de la durée d’un modèle de lampe électrique est estimé à 100 heures,
quelle doit être la taille de l’échantillon à prélever pour que l’erreur sur l’estimation
de la durée de vie moyenne n’excède pas 20 heures aux seuils de confiance de 95% et
99% ?
Exercice 6
Dans un échantillon de 400 pièces prélevées (non exhaustif) dans une fabrication,
on dénombre 65 pièces défectueuses. Déterminer les bornes de la proportion de pièces
mauvaises dans la fabrication au seuil de confiance p = 0, 99
Exercice 7
On dit qu’une variable aléatoire Y suit une loi log-normale de paramètre (m, σ)
si X = Ln(Y ) suit une loi normale N (m, σ). On dispose d’un échantillon de neuf
observations d’une loi log-normale de paramètre (m, σ) inconnus :

11, 3 2, 1 1, 1 8, 9 4, 6 5, 7 13, 5 24, 5 16, 4

1- Construire un intervalle de confiance pour m au risque d’erreur α = 5%.


2- Construire un intervalle de confiance pour σ 2 au risque d’erreur α = 1%.
Exercice 8
Une laiterie produit des camemberts commercialisés sous la marque « Cœur de
Lion ». La masse X, exprimée en g, d’un camembert tiré au hasard dans la production,
est distribuée selon une loi normale.
On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau
suivant fournit les masses :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 330 — #340


i i

330 Chapitre 16. Echantillonnage et Estimation

250; 254; 254; 253; 256; 250; 257; 251; 253;


255; 250; 255; 252; 261; 252; 251; 255

1- a) Calculer la moyenne et la variance de cet échantillon.


b) Donner une estimation ponctuelle de la variance s2 de la production.
2- Déterminer une estimation par intervalle de confiance à 95% de la masse moyenne
m de la production.

16.3.2 Corrigés
Exercice 1
1- Si l’on extrait au hasard des échantillons de taille n d’une population-mère
 N (m, σ), la distribution des moyennes d’échantillon suit la loi
suivant une loi normale
normale N m, √σn .
Or ici on a m = 10, 06 et
σ 0, 18
√ = √ = 0, 06
n 9
La variable centrée réduite (normée) est :
m − 10, 06
z=
0, 06
Donc pour m < 10 on a :
10 − 10, 06
t<
0, 06
t < −1

D’après la table de la fonction de répartition de la loi normale centrée réduite, on


a Π(1) = 0, 841 et Π(−1) = 1 − Π(1) = 0, 159.
Par conséquent, la probabilité pour que le diamètre moyen de l’échantillon soit
inférieur à 10mm est égale à 0, 159, soit environ 15, 9%.
2- On doit avoir cette fois-ci :

m > 10, 15
10, 15 − 10, 06
=⇒ t >
0, 06
=⇒ t > 1, 5

D’après la table de la fonction de répartition de la loi normale centrée réduite, on


a Π(1, 5) = 0, 933
Donc Π(t < 1, 5) = 0, 9333, .d’où pour t > 1, 5, la probabilité sera :

P (t > 1, 5) = 1 − 0, 933 = 0, 067

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 331 — #341


i i

16.3 Exercices 331

soit 6, 7%.
Exercice 2
Après avoir rangé les poids par ordre croissant, effectuons le changement d’origine
x0 = 300 d’où ui = xi − x0 = xi − 300.

i xi ui = xi − 300 u2i
1 295 −5 25
2 295 −5 25
3 297 −3 9
4 297 −3 9
5 300 0 0
6 3000 0 0
7 3000 0 0
8 3000 0 0
9 310 10 100
10 310 10 100
Total 20 − 16 = 4 268

On a donc la moyenne :
10
P
ui
i=1 4
u= = = 0, 4
10 10
d’où :
x = x0 + u = 300, 4g
La variance est :
1 P10 268
σ 02 = u2 − u2 = − (0, 4)2 = 26, 8 − 0, 16
10 i=1 i 10
σ 02 = 26, 64

d’où l’écart-type :
σ 0 = 5, 16.
2) Une estimation de l’écart-type de la population, d’après l’écart-type de l’échan-
tillon sera : r √
0 10 10
σ=σ = 5, 16 × = 5, 43.
9 3
Exercice 3
Si l’on a un intervalle de confiance de 2Φ(t), on a d’après la loi Laplace-Gauss
(Normale) :  
σ σ
P x − t√ ≤ m ≤ x + t√ = 2Φ(t)
n n
or ici
2Φ(t) = 0, 95 ⇐⇒ Φ(t) = 0, 475

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 332 — #342


i i

332 Chapitre 16. Echantillonnage et Estimation

Calculons Π(t), afin de pouvoir utiliser la tableau de la loi normale :

Π(t) = Φ(t) + 0, 5 = 0, 975

La valeur correspondante de t, d’après la tableau de Π(t), est t = 1, 95


On a donc avec un coefficient de confiance de 95% :
σ σ
x − 1, 96 √ ≤ m ≤ x + 1, 96 √
n n
0, 31 0, 31
5, 2 − 1, 96 √ ≤ m ≤ 5, 2 + 1, 96 √
100 100
5, 13 ≤ m ≤ 5, 26

L’intervalle de confiance de la moyenne m, IC(m), avec une probabilité de 95% est

IC(m) = [5, 14; 5, 26]

2) Avec un coefficient de confiance égale à 2Φ(t) et en prenant pour f le pourcentage


observé dans l’échantillon, on a :
r r
pq pq
f −t ≤p≤f +t
n n
or ici
2Φ(t) = 0, 98 ⇐⇒ Φ(t) = 0, 49
Calculons Π(t), afin de pouvoir utiliser la tableau de la loi normale :

Π(t) = Φ(t) + 0, 5 = 0, 99

La valeur correspondante de t, d’après la tableau de Π(t), est t = 2, 33


De plus n = 100, et une estimation de pq est 0, 76 × 0, 24 = 0, 1824
On a donc avec un coefficient de confiance de 98% :

0, 76 − 2, 33 × 0, 04 ≤ p ≤ 0, 76 + 2, 33 × 0, 04
0, 66 ≤ p ≤ 0, 85

L’intervalle de confiance du pourcentage IC(p) (ou de la proportion) p avec une


probabilité de 98% est
IC(p) = [0, 66; 0, 85]
Exercice 4
1) La loi de la population est une loi normale d’écart-type connu. La loi de la
moyenne d’échantillon est aussi une loi normale de paramètre m = 32 et σ = √120 :
donc :  
1
x N 32; √
20
car σ(x) = √σ .
n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 333 — #343


i i

16.3 Exercices 333

2) Il faut au seuil de 99% :


x−m
−2, 58 ≤ ≤ 2, 58
σ
x − 32
−2, 58 ≤ 1 ≤ 2, 58

20
31, 42 ≤ x ≤ 32, 58

3) Les billes doivent satisfaire à la norme 31 < x < 33, donc :


x−m
−1 ≤ ≤1
σ
x − 32
−1 ≤ ≤1
1
et on trouve donc :  
X − 32
P
< 1 = 0, 68
1
Il y a donc 68 chances sur 100, pour qu’une bille soit utilisable.
Exercice 5
Supposons qu’on a un grand échantillon (tirage non exhaustif), les bornes de
l’intervalle de confiance au seuil de confiance 1 − α sont données par :
σ σ
x − t√ ≤ m ≤ x + t√
n n

D’après la table de la loi normale. t = 1, 96 pour un niveau de confiance de 95%.


et pour un niveau de confiance de 99%, t = 2, 58.
Donc il faut que :
σ
t √ ≤ 20 heures
n
 2

n≥
20

 pour une confiance de 95%, on obtient :


 2
100
n≥ 1, 96 × = 96, 04
20

donc il faut 97 lampes.


 pour une confiance de 99%, on obtient :
 2
100
n≥ 2, 58 × = 166, 41
20

donc il faut 167 lampes.


Exercice 6

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 334 — #344


i i

334 Chapitre 16. Echantillonnage et Estimation

65
L’estimateur ponctuel est pb = 400 = 0, 1625.
Grand échantillon n × p = 400 × 0, 1625 = 65 donc np > 20.
r r
pb(1 − pb) pb(1 − pb)
pb − t ≤ p ≤ pb + t
n n
pour n = 400, pb = 0, 1625
D’après la table de la loi normale on a t = 2, 58 pour un niveau de confiance de
99%.
Donc à 99% de confiance :

0, 12 < p < 0, 21

Exercice 7
1) On a xi = ln(yi )
La moyenne est
1P 1P
x= xi = ln(yi ) = 1, 92
n n
La variance est :
1 X 2 1 X 2
s2 = (xi − x) = (ln(yi ) − x) = 1
n−1 n−1
On a n < 30 et la variance de la population est inconnue, donc on utilisera la loi
de Student :
le degré de liberté ν = n − 1 = 8, et donc d’après la table de la li de Student on a :
tν,α = t8,0,05 = 2, 306
Donc :
s s
x − t√ ≤ m ≤ x + t√
n n
1, 15 ≤ m ≤ 2, 69

2) L’intervalle de confiance pour la variance est :

(n − 1)s2 2 (n − 1)s2
2 ≤ σ ≤
X1− α X α2
2 2

D’après la table de Chi-deux pour ν = 8 et un niveau d’erreur α = 5%, on a


2 2
X1− α = 17, 5 et X α = 2, 18
2 2

8×1 8×1
≤ σ2 ≤
17, 5 2, 18
2
0, 45 ≤ σ ≤ 3, 67

et donc l’écart-type
0, 68 ≤ σ ≤ 1, 92

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 335 — #345


i i

16.3 Exercices 335

Exercice 8
1
P
1) La moyenne est x = n xi = 253, 5g et la variance est

1 X 2
s2 = (xi − x) = 8, 01
n−1

2) L’estimation ponctuelle de la variance est


n 2
b2 =
σ s
n−1
b2 = 8, 51
σ

3) La population est normale, sa variance est inconnue, on utilise une loi de Student.
La variable aléatoire T définie par T = (x−m)
√s où x est la moyenne de l’échantillon
n−1
aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à
n − 1 degrè de liberté.n = 17, T = (x−m) s est distribuée selon la loi de Student à 16
4
d.d.l.
On a t = 2, 12 lue sur la table de student à 16 d.d.l. et un niveau de signification
5%.
On obtient donc l’intervalle de confiance où x = 253.5 et s = 2, 8
h s si
x − 2, 12 × ; x + 2, 12 × = [253, 5 ; 255, 0] au niveau 5%
4 4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 336 — #346


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 337 — #347


i i

CHAPITRE 17

Tests d’hypothèse et tests de comparaison

Dans les situations concrètes, il faut en général prendre des décisions sur des populations
à partir de renseignements recueillis sur des échantillons. On est alors amené à faire
des hypothèses sur la population concernée, hypothèses qui peuvent être vraies ou
fausses.
Ces hypothèses sont faites en général, soit pour les infirmer, soit pour les rejeter.
- Une hypothèse à rejeter est notée H0 on la désigne sous le nom d’hypothèse nulle.
- Toute hypothèse qui diffère d’une autre est notée H1 et on la désigne sous le nom
d’hypothèse alternative.
Il existe deux types de risque :
- Si l’on rejette une hypothèse vraie, on commet une erreur de première espèce.
- Si l’on accepte une hypothèse fausse, on commet une erreur de seconde espèce
Au cours du test d’une hypothèse, la probabilité maximale d’accepter de faire une
erreur de première espèce constitue le niveau de signification du test.

17.1 Tests de conformité

Dans une population, soit m la moyenne des valeurs d’un caractère quantitatif et p la
fréquence des éléments possédant le caractère A dans la population On voudrait savoir
si m (respectivement p) n’est pas différente d’une valeur fixée m0 (respectivement p0 ),
ou n’est pas plus petite, ou plus grande que cette valeur m0 (respectivement p0 ).
Si l’on ne peut pas mesurer le caractère sur tous les individus de la population,
on extrait de celle-ci un échantillon de taille n qui fournit une estimation M de m
(respectivement P de p).

17.1.1 Comparaison d’une moyenne observée et d’une moyenne théorique

Soient une population P de moyenne m et d’écart-type σ connu. et un échantillon E


de taille n (telle que n ≥ 30), de moyenne X et d’écart-type s∗
On se trouve dans les conditions du théorème de √ la limite centrale. La loi de la
moyenne d’échantillon est une loi normale N (m, σ/ n).

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 338 — #348


i i

338 Chapitre 17. Tests d’hypothèse et tests de comparaison

Test bilatéral
On veut tester l’hypothèse nulle H0 que la moyenne de la population m est égale à une
moyenne théorique m0 , contre l’hypothèse alternative m 6= m0 , .c0 est le cas bilatéral.
On a donc le système suivant :

H0 : m = m0
H1 : m 6= m0

Sous l’hypothèse H0 : m = m0 , M peut être considérée comme la réalisation d’une


variable aléatoire X.
On sait que :
a- Si l’écart-type σ est connu dans la population, alors :

X − m0
T = √ N (0, 1)
σ/ n

b- Si l’écart-type
Pn σ est inconnu dans la population, alors on l’estime par σ = s∗
(Xi −X)2
avec s∗2 = i=1n−1 :
X − m0
T = ∗ √ Tn−1
s / n
T suit une loi de Student à n − 1 degrès de liberté (d.d.l.).
Pour la valeur M observée, on obtient une valeur notée Tobs (valeur observée pour
T ). Soit, d’autre part, un réel α qui sera le seuil de signification du test.
On détermine le réel tα tel que :

P [|T | < tα ] = 1 − α

Si |Tobs | ≤ tα on accepte alors l’hypothèse H0 , sinon on la rejette.


Exemple 17.1.1
On accepte H0 au niveau de confiance 1 − α = 0, 95 si pour l’échantillon donnée
on a :
|X−m|
√σ ≤ 1, 96 soit
n

X −m
−1, 96 ≤ ≤ 1, 96.
√σ
n

Test unilatéral
On veut tester l’hypothèse que la moyenne de la population m est supérieure (respec-
tivement inférieure) à une valeur théorique m0 .
Dans ce cas le test est dit unilatéral à droite (respectivement à gauche)
On utilise toujours l’hypothèse nulle H0 qu’elle est égale à m0 .
On a donc le système suivant :

H0 : m = m0
test unilatéral à droite
H1 : m > m0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 339 — #349


i i

17.1 Tests de conformité 339

On détermine le réel tα tel que :


P [T < tα ] = 1 − α
Si Tobs ≤ tα on accepte alors l’hypothèse H0 , sinon on la rejette.
Le test unilatéral à gauche est le système définie par :

H0 : m = m0
test unilatéral à gauche
H1 : m < m0
On détermine le réel tα tel que :

P [T > tα ] = 1 − α
Si Tobs ≥ tα on accepte alors l’hypothèse H0 , sinon on la rejette
Exemple 17.1.2
On accepte H0 au niveau d’erreur α = 0, 05 ou un niveau de confiance 1 − α = 0, 95
si pour l’échantillon donnée on a :
X−m0
√σ < 1, 645 (respectivement X−m√σ
0
> 1, 645)
n n

17.1.2 Comparaison d’une variance observée à une variance théorique


Comparer une variance inconnue σ 2 de la population à une valeur de référence σ02
revient à tester l’hypothèse nulle H0 : σ 2 = σ02 contre l’hypothèse alternative qui peut
se présenter sous les trois formes suivantes :

 H1 : σ 2 6= σ02 (cas bilatéral)
H1 : σ 2 > σ02 (cas unilatéral à droite)
ou H1 : σ 2 < σ02 (cas unilatéral à gauche)

La variance σ 2 peut être soit d’une population unique représentée par un échantillon
de n valeurs expérimentales ; soit la variance commune à k populations représentées
par k échantillons.
Soit la variable de décision T définie par :
Pn
(n − 1)s∗2 ∗2 i=1 (Xi − X)
2
Tobs = 2 , avecs =
σ0 n−1
Si la population suit une loi normale alors sous l’hypothèse nulle H0 la loi statistique
de T suit une loi de Khi-deux à ν = (n − 1) degrés de liberté, et notée Xν2 .

Cas bilatéral
On se propose de tester H0 : σ 2 = σ02 contre l’hypothèse alternative H1 : σ 2 6= σ02 . Le
2
risque de première espèce est α = α1 + α2 , et les limites de la région de rejet Xν,α 1
et
2
Xν,1−α2 sont données par la table statistique de Khi-deux à ν d.d.l. (Annexe).
La décision est prise en comparant la valeur observée Tobs (calculée à partir des
2 2
résultats expérimentaux) aux limites Xν,α 1
et Xν,1−α 2
.
 2 
Si Tobs ∈ Xν,α1 ; Xν,1−α2 on accepte alors l’hypothèse H0 : σ 2 = σ02 , sinon on la
2

rejette.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 340 — #350


i i

340 Chapitre 17. Tests d’hypothèse et tests de comparaison

Cas unilatéral
On souhaite tester H0 : σ 2 = σ02 contre l’hypothèse alternative H1 : σ 2 > σ02 .
(resp.H1 : σ 2 < σ02 ) c’est le cas unilatéral à droite (resp. à gauche)
Pour un risuqe de première espèce α, l’hypothèse nulle qui consiste en l’égalité des
variances est rejetée si :

(n − 1)s∗2 2 2
Tobs = > Xν,α (resp.Tobs < Xν,α ).
σ02

17.1.3 Comparaison d’une fréquence observée à une fréquence théorique


Soient une population dont p est la fréquence des éléments possédant le caractère A,
et un échantillon E de taille n (n ≥ 30) dont la fréquence des éléments possédant le
caractère A dans E est f.
Le but est de comparer la fréquence p à une valeur fixée p0 .
L’hypothèse H0 est que la fréquence observée est égale à la valeur fixée p0
La quantité T = f√−p
pq , (avec q = 1 − p), suit une loi normale centrée réduite

n
N (0, 1).
Pour la valeur f observée, on obtient une valeur Tobs (valeur observée pour T )
Soit d’autre part, α un réel qui sera le seuil de signification du test.
L’hypothèse H1 est selon le cas f 6= p (cas bilatéral), f < p (cas unilatéral à
gauche) ou f > p (cas unilatéral à droite).

Cas Bilatéral
On veut tester l’hypothèse nulle H0 que la proportion de la population p est égale à
une valeur théorique p0 , contre l’hypothèse alternative p 6= p0 , .c0 est le cas bilatéral.
On a donc le système suivant :

H0 : p = p0
H1 : p 6= p0

On détermine le réel tα tel que :

P [|T | < tα ] = 1 − α

Si |Tobs | ≤ tα on accepte alors l’hypothèse nulle H0 , sinon on la rejette.

Cas unilatéral
On veut tester l’hypothèse nulle H0 que la proportion de la population p est égale à
une valeur théorique p0 , contre l’hypothèse alternative p > p0 (respectivement p < p0 ),
c0 est le cas unilatéral à droite (respectivement à gauche).
On a donc le système suivant :

H0 : p = p0
H1 : p > p0 (resp. p < p0 )

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 341 — #351


i i

17.2 Tests de comparaison 341

On détermine le réel tα tel que :

P [T < tα ] = 1 − α(resp.P [T > tα ] = 1 − α)


Si Tobs ≤ tα (resp. Tobs ≥ tα ) on accepte alors l’hypothèse nulle H0 , sinon on la
rejette.
Exemple 17.1.3
Un étudiant candidat aux élections, pour être le porte parole des étudiants d’une
faculté, commande un sondage pour connaître les chances de sa réussite. Il veut savoir
si la proportion des étudiants de tout le campus universitaire qui voteront pour lui
dépassera ou non les 50%.
Sur la base de 200 étudiants, 52% auront un vote favorable pour lui. Que peut on
conclure au seuil de α = 5% ?
C’est le cas unilatéral à droite, on a le système suivant :

H0 : p = 0, 5
H1 : p > 0, 5
r
0, 5(1 − 0, 5)
f = 52% et σp = = 0, 035
200
f −p 0, 52 − 0, 5
Tobs = = = 0, 57
σp 0, 035
D’après la table de la loi normale centrée réduite et pour un seuil de α = 0, 05, on
a la valeur tα = 1, 96.
On remarque que Tobs = 0, 57 ≤ tα = 1, 96 donc l’hypothèse nulle H0 est acceptée.
Par conséquent, l’étudiant sera élu à 95% de confiance.

17.2 Tests de comparaison


17.2.1 Comparaison de deux moyennes
Soient deux échantillons E1 et E2 de taille respectifs n1 et n2 , on ignore s’ils sont tirés
de la même population P.
Le but est de tester si ces deux échantillons ont la même moyenne X.
On observe deux moyennes X1 et X2 , et deux variances corrigées s∗2 ∗2
1 et s2 des
2 2
deux échantillons E1 et E2 et deux autres variances σ1 et σ2 de la population P1 et P2
La différence ∆X1 −X2 = X1 − X2 entre ces deux moyennes peut être due :
- soit aux variations d’échantillonnage dans le cas d’une même population P.
- soit à la différence des caractéristiques des populations d’origine.

On teste l’hypothèse H0 : X1 − X2 = 0

contre l’hypothèse alternative dans le cas bilatéral H1 : X1 − X2 6= 0.
Si les populations d’origine des deux échantillons sont distribuées normalement, les
moyennes sont alors des variables indépendantes normales.
Si les effectifs des échantillons sont supérieurs à 30, la différence des moyennes
∆X1 −X2 suit une loi normale.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 342 — #352


i i

342 Chapitre 17. Tests d’hypothèse et tests de comparaison

La différence des moyennes suit un loi normale :


- de moyenne la différence des moyennes :
E X1 − X2 = E(X1 ) − E(X2 ) = 0
- de variance :
2 2
VX1 −X2 = V (X1 ) + V (X2 ) = σX + σX
1 2
on a alors :
2 2 2
VX1 −X2 = σX = σX + σX
1 −X2 1 2

σ2 σ2
VX1 −X2 = 1 + 2
n1 n2

où σ12 et σ22 sont les variances respectives des échantillons E1 et E2 .

Cas variances connues


Si σ12 et σ22 les variances de P1 et P2 sont connues alors :
1- si le caractère est distribué normalement dans les deux populations, alors :
x1 − x2 x1 − x2
T = =q 2 N (0, 1)
σx1 −x2 σ1 σ22
n1 + n2

2- si n1 et n2 les tailles respectifs de E1 et E2 sont grands (n1 ≥ 30 et n2 ≥ 30)


alors :
x1 − x2
T = N (0, 1)
σx1 −x2
Dans le cas où σ1 = σ2 = σ alors :
x − x2
T = q1 N (0, 1)
σ n11 + n12

Cas variances inconnues mais égales


Si σ12 et σ22 les variances de P1 et P2 sont inconnues mais égales σ1 = σ2 = σ, on
estime alors σ 2 par s2 définie par :

n1 s21 + n2 s22
s2 =
n1 + n2 − 2
et on a :
1- si le caractère est distribué normalement dans les deux populations, alors :
x1 − x2
T = q Tn1 +n2 −2
s n11 + n12

T suit une loi de Student à ν = n1 + n2 − 2 d.d.l.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 343 — #353


i i

17.2 Tests de comparaison 343

2- si n1 et n2 les tailles respectifs de E1 et E2 sont grands (n1 ≥ 30 et n2 ≥ 30)


alors :
x1 − x2
T = q N (0, 1).
s n11 + n12

Cas variances inconnues mais différentes


Si σ12 et σ22 les variances de P1 et P2 sont inconnues et différentes (σ1 6= σ2 )
1 - si la taille des deux échantillons n1 et n2 est grande (n1 ≥ 30 et n2 ≥ 30) alors
les variances σ12 et σ22 sont estimées par s∗2 ∗2
1 et s2 . et on a :

x1 − x2
T = q ∗2 N (0, 1)
s1 s∗2
n1 + n2
2


Le test consiste à choisir entre deux hypothèses H0 : X1 − X2 = 0 contre

l’hypothèse alternative dans le cas bilatéral H1 : X1 − X2 6= 0
 
(ou H1 : X1 − X2 > 0 ou H1 : X1 − X2 < 0 : deux cas unilatéraux)
On détermine alors la loi de T et on calcule la valeur obervée Tobs .
Pour un niveau d’erreur α donné, la table de la loi normale centrée réduite (ou
celle de Student-Fischer) fournit le réel tα tel que :

P [|T | < tα ] = 1 − α
ou.P [T < tα ] = 1 − α,
ou P [T > tα ] = 1 − α

Si |Tobs | < tα (ou. Tobs < tα , ou Tobs > tα ) on accepte alors l’hypothèse nulle H0
au seuil de signification α, sinon on la rejette.

17.2.2 Comparaison de deux proportions ou deux fréquences


soient n1 et n2 les effectifs de deux échantillons E1 et E2 et f1 et f2 les fréquences ob-
servées.Le but est de tester si ces deux échantillons ont la même fréquence d’apparition
du caractère A.
On teste les hpothèses :

H0 : f1 − f2 = 0
(cas du test bilatéral)
H1 : f1 − f2 6= 0

Soit z = f1 − f2
E(z) = E(f1 ) − E(f2 ) sous H0 , E(Z) = 0
et V (z) = V (f1 ) + V (f2 ) = npq1 + npq2 toujours sous l’hypothèse H0
c’est à dire que les deux échantillons E1 et E2 sont issus de la même population
qui présnete une proportion p d’éléments ayant le caractère A.
Or p est inconnu. on l’estime alors soit par f1 soit par f2

f1 (1 − f1 ) f2 (1 − f2 )
V (z) = +
n1 n2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 344 — #354


i i

344 Chapitre 17. Tests d’hypothèse et tests de comparaison

On teste l’hypothèse nulle H0 en utilisant la variable réduite

f1 − f2
Z=q N (0, 1)
f1 (1−f1 ) f2 (1−f2 )
n1 + n2

Il faut alors connaître la valeur absolue de ce rapport et le comparer aux valeurs


critiques correspondant aux différents risques que l’on se fixe en utilisant la loi normale.
Le test consiste donc à choisir entre deux hypothèses H0 : f1 − f2 = 0 contre
l’hypothèse alternative dans le cas bilatéral H1 : f1 − f2 6= 0
(ou H1 : f1 − f2 > 0 ou H1 : f1 − f2 < 0 : deux cas unilatéraux)
On détermine alors la loi de Z et on calcule la valeur obervée Zobs .
Pour un niveau d’erreur α donné, la table de la loi normale centrée réduite fournit
le réel tα tel que :

P [|T | < tα ] = 1 − α (ou.P [T < tα ] = 1 − α, ou P [T > tα ] = 1 − α)


Si |Tobs | < tα (ou. Tobs < tα , ou Tobs > tα ) on accepte alors l’hypothèse nulle H0
au seuil de signification α, sinon on la rejette.

17.2.3 Comparaison de deux variances


Soient σ12 et σ22 les variances inconnues respectivement de la série statistique x1 et x2
des deux populations P1 et P2 .
Le but de ce test est de savoir s’il existe une différnce entre les deux variances
inconnues σ12 et σ22 , au vu de la variance connue s21 d’un échantillon aléatoire E1 de
taille n1 de la population P1 et de la variance connue s22 d’un échantillon aléatoire E2
de taille n2 de la population P2 .
Vu que les deux variances σ12 et σ22 sont inconnues, alors elles seront estimées
n1 n2
respectivement par s∗2 2 ∗2 2
1 = n1 −1 s1 et par s2 = n2 −1 s2 qui sont des estimateurs sans
biais de σ12 et σ22 .
On démontre que sous l’hypothèse où le caractère est distribué suivant une loi
normale dans les deux populations, la variable aléatoire définie par :

s∗2
1 s∗2
F = ∗2 (ou F = 2∗2 )
s2 s1
suit une loi de Fisher-Snedecor à ν1 = (n1 − 1) et ν2 = (n2 − 1) degrès de liberté (ou
ν2 = (n2 − 1) et ν1 = (n1 − 1) d.d.l.).
Le test d’égalité des variances consite à choisir entre les deux hypothèses :

H0 : σ12 = σ22

(cas du test bilatéral)
H1 : σ12 6= σ22
On calcule la valeur théorique Fα , obtenue par la lecture de la table de Fisher-
Snedecor (Annexe), en fonction du seuil de signification α (P [F ≥ Fα ] = α) où F est
la variable aléatoire définie ci-dessus.
La règle de décision est alors :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 345 — #355


i i

17.3 Exercices 345

a) si Fobs < Fα , alors on accepte l’hypothèse nulle H0 au seuil de signification


α et donc la différence n’est pas signifcative entre σ12 et σ22 . On peut admettre l’égalité
des variances inconnues.
b) si Fobs ≥ Fα , on rejette alors l’hypothèse nulle H0 au seuil de signification
α et donc la différence entre σ12 et σ22 est signifcative. Les variances inconnues sont
différentes.
Le test est d’autant plus significatif que Fobs s’éloigne de Fα .

17.3 Exercices
17.3.1 Enoncés
Exercice.1
La durée de vie moyenne d’un échantillon de 100 tubes fluorescents a été établie
par le calcul à 1570 heures avec un écart-type de 120 heures. Soit µ la moyenne de la
population.
1 / Est-ce que la durée de vie moyenne est significativement différente de 1600
heures à un niveau d’erreur α1 = 1% puis α2 = 5% ?
2 / Sur un autre échantillon, la moyenne observée a été de 1580 heures et au risque
d’erreur de 5% cet échantillon a été jugé représentatif de la population.
Quelle est la taille de cet échantillon ?
3 / Suite à des études préalables l’écart-type de la population a été établie à 100
heures. On réduit alors la taille initiale de l’échantillon de 75% et on a observé le même
écart-type. Est-ce que la variabilité des tubes fluorescents a augmenté à un niveau de
confiance de 90% ce qui induirait une baisse de leur qualité ?
Exercice.2
Le temps de réaction moyen des souris d’un certain élevage à un test déterminé est
de 19 minutes. On désire expérimenter un produit pharmaceutique sur ces souris. On
administre à huit d’entre elles une dose de ce produit et l’on observe le temps t de
réaction en minutes :

15 − 14 − 21 − 12 − 17 − 12 − 19 − 18
1 / L’action de ce produit est-elle significative à un niveau de confiance de 95% ?
2 / Un laboratoire affirme que son médicament est efficace à 90%. Sur 200 souris
atteintes, 160 sont guéries. Le laboratoire est-il un arnaqueur ? (α = 5%)
3 / Un autre test est appliqué sur un second échantillon, les temps de réaction
obtenus sont les suivants :

19 − 18 − 20 − 19 − 18 − 21 − 17
a-Peut-on admettre à une confiance de 99% que les deux tests ont un temps
de réaction moyen identique ?
b-La différence des variances du temps de réaction au test est-elle significative ?
α = 5%.
Exercice.3

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 346 — #356


i i

346 Chapitre 17. Tests d’hypothèse et tests de comparaison

La durée de vie moyenne d’un échantillon de 100 ampoules est de 1500 heures,
avec un écart-type de 200 heures.
En appelant m la moyenne de la population, vérifier l’hypothèse m = 1550h
relativement à l’hypothèse m =6 1550 heures avec un niveau de signification de 0, 05 et
de 0, 01.
Exercice.4
Des appareils éléctriques de chauffage ont une moyenne de vie fonctionnement de
2000 heures avec un écart-type de 100 heures. A l’aide d’un changement de l’un de ses
composants, le fabricant affirme que la durée de vie moyenne peut-être accrue.
On a testé un échantillon de 50 appareils et on a observé une durée de vie moyenne
de 2100 heures, Peut-on soutenir cette affirmation au niveau de signification de 0, 01.
Exercice.5
Dans une livraison de 600 yaourts à une épicerie, l’épicier constate que 5, 3% de ces
yaourts sont cassés. D’autre part le contrat de vente autorise 4% de perte. Il réclame.
Cette réclamation est-elle justifiée, au seuil de confiance de 5% ?
Exercice.6
Le fabricant d’un nouveau produit de dégraissant annonce que son produit est
efficace à 90%, en supprimant la matière grasse en 30 minutes.
Dans un échantillon de 300 pièces le résultat a été probant pour 260 d’entre eux.
L’affirmation du fabriquant est-elle légitime au risque de 1%.

17.3.2 Corrigés
Exercice.1
On a n = 100 et la moyenne de l’échantillon est x = 1570 et son écart-type est
sx = 120.
1) On effectuera un test de conformité de la moyenne :
La variance de la population σ 2 étant incinnue mais la taille de l’échantillon est

grande n ≥ 30 donc la variable aléatoire T = n |x−µ sx
0|
suit la loi normale centrée
réduite.

√ |x − µ0 | √ |1570 − 1600|
T = n = 100 = 2, 5
sx 120
Nous avons un test bilatéral et les hypothèses à tester sont :

H0 : µ = 1600
H1 : µ 6= 1600
Pour niveau d’erreur α1 = 1% = 0, 01, on a t = 2, 57, par conséquent on a
T ≤ t1−α/2 , on en déduit que l’hypothèse nulle est acceptée.
La durée de vie moyenne des tubes fluorescents est égale à 1600 heures avec une
confiance de 99%.
Pour niveau d’erreur α2 = 5% = 0, 01, on a t = 1, 96, par conséquent on a
T > t1−α/2 , on en déduit que l’hypothèse nulle est rejetée.
La durée de vie moyenne des tubes fluorescents est significativement différente de
1600 heures avec une confiance de 95%.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 347 — #357


i i

17.3 Exercices 347

2) On a

√ |x − µ0 |
n ≤t
sx
t × sX 2
 
⇐⇒ n ≤
|x − µ0 |
 2
1, 96 × 120
⇐⇒ n ≤ = 138, 29
|1580 − 1600|
n ≤ 138

3) On réduit alors la taille initiale de l’échantillon de 75% donc n0 = 25, et on a


observé le même écart-type donc s0x = 120.
On effectuera un test de conformité de la variance.
Les hypothèses à tester sont :

H0 : σ 2 = 1002 = σ02


H1 : σ 2 > 1002
02
(n−1)sx
La variable aléatoire T = σ02
suit une loi de Chi-deux à ν = n − 1 = 24 d.d.l.

24 × 1202
T = = 34, 56
1002
2
La lecture de la table de la loi de Chi-deux donne X24;0,1 = 33, 20.
2
On remarque que T > X24;0,1 donc l’hypothèse nulle est rejetée à une confiance de
90%
On en conclut que la variabilité des tubes fluorescents a augmenté à un niveau de
confiance de 90% donc il y a une baisse de la qualité de sces tubes.
Exercice.2
1) Soit la v.a. X égale au temps de réaction moyen dans l’ensemble des échantillons
de taille n = 8.
On effectuera un test de conformité de la moyenne où la variance de la population
est inconnue et la taille de l’échantillon n = 8 < 30, donc

X −m
Tobs = √ Tν
s/ n

T suit une loi de Student à ν = n − 1 = 7 d.d.l.


Les hypothèses à tester sont :

H0 : µ = 19
H1 : µ < 19

On calcule la moyenne et l’écart-type de l’échantillon :

(Xi − X)2
P
X = 16 et s2 = ' 10, 86
n−1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 348 — #358


i i

348 Chapitre 17. Tests d’hypothèse et tests de comparaison

La valeur obervée est


√ X − µ √ 16 − 19
Tobs = n = 8√ ' −2, 57
s 10, 86
La valeur de t lue sur la table de Student à ν = 7 et un niveau de confiance
1 − α = 0, 95 est t7;0,95 = 2, 365.
On remarque que Tobs < −t7;0,95 =⇒ H0 est rejetée et donc H1 acceptée.
On peut affirmer que l’action du produit est efficace dans la mesure où il diminue
le temps de réaction au test à 95% de confiance.
2) Soit Y v.a. égale au pourcentage de guérisons dans des échantillons de taille 200.
On effectuera un test de conformité de la proportion.
On a n = 200, p = nx = 160200 = 0, 8 et p0 = 0, 9.
Les hypothèses à tester sont :

H0 : p = 0, 9
H1 : p < 0, 9

La v.a. T suit une loi normale centrée réduite


r
p − p0 p0 (1 − p0 )
Tobs = N (0, 1) où σp =
σp n

On a donc Tobs ' 4, 76.


Tobs > t = 1, 96 =⇒ H0 est rejetée et donc H1 : p < 0, 9 est acceptée.
On en conclut que le laboratoire est bien un arnaqueur avec une confiance de 95%.
3) a- Nous allons effectuer un test de comparaison des moyennes.
On testera : 
H0 : µ1 − µ2 = 0
H1 : µ1 − µ2 6= 0
0
On a n0 = 7 et on calcule X = 18, 86 et la variance s02 = 1, 81.
La variance de la population étant inconnue et la taille est donc

ntotal = n + n0 − 2 = 13 < 30

Donc
0
X − X
r
s2 s02
Tobs = Tν , où sbX−X 0 = + 0
sbX−X 0 n n
Tobs = 2, 25 et la valeur de la table de Student à une confiance de 99% et un d.d.l.
ν = 13 est égale à t = 3, 01.
Tobs < t =⇒ H0 : µ1 − µ2 = 0 est acceptée, par conséquent, les deux tests ont un
temps de réaction identique à 99% de confiance.
b- On testera un test de comparaison des variances.
Les hupothèses à tester sont :

H0 : σ1 − σ2 = 0
H1 : σ1 − σ2 > 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 349 — #359


i i

17.3 Exercices 349

La v.a.
s2
F = F(ν1 , ν2 )
s02
F suit une loi de Fisher à ν1 = n − 1 = 7 et ν2 = n0 − 1 = 6 d.d.l.
Fobs = 10,86
1,81 ' 6 et

F(6, 6) + F(8, 6)
t = F(ν1 , ν2 ) = F(7, 6) = = 4, 22
2
Fobs > t =⇒ H0 : σ1 = σ2 est rejetée à 95% de confiance.
Donc la différence des variances du temps de réaction au test est significative à
95% de confiance.
Exercice.3
On doit choisir entre les deux hypothèses :

H0 : m = 1550
H1 : m 6= 1550
Pour un test bilatéral au niveau 0,05, la règle de décision est de :

Rejeter l’hypothèse nulle si T = n |x−m|
σ ∈/ [−1, 96; 1, 96], et acceptée H0 dans le
cas contraire.
La distribution d’échantillonnage de la moyenne de l’échantillon a pour moyenne
x = 1500 et un écart-type
σ0 200
s = σX = √ = √ ' 20, 1
n−1 99
On calcule
1500 − 1550
Tobs = = −2, 48 ∈ / [−1, 96; 1, 96]
20, 10
On rejette donc H0 au niveau de signification 0,05.
La durée de vie moyenne des ampoules n’est pas de 1500 heures avec une confiance
de 95%
Par contre au niveau de signification 0,01, l’intervalle devient [−2, 58; 2, 58] et dans
ce cas on :
Tobs = −2, 48 ∈ [−2, 58; 2, 58]
On accepte donc H0 au niveau de signification 0,01.
La durée de vie moyenne des ampoules est de 1500 heures avec une confiance de
99%.
Exercice.4
On va effectuer un test de conformité de la moyenne avec :

H0 : m = 2000 h, il n’y a pas de variation de la durée de vie
H1 : m > 2000 h, il y a une variation de la durée de vie
On utilise un test unilatéral au niveau 0,01, la valeur critique est t = 2, 33 d’après
la loi normale, et on calcule :
√ x−m 2100 − 200
Tobs = n = √ = 7, 07
σ 100/ 50

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 350 — #360


i i

350 Chapitre 17. Tests d’hypothèse et tests de comparaison

Tobs > t =⇒ H0 : m = 2000 est rejetée, par conséquent on retient l’hypothèse


alternative H1 : m > 2000 h.
On conclut qu’il y a une variation de la durée de vie des ampoules avec une
confiance de 99%.
Exercice.5
La taille de l’échantillon est de n = 600, et la fréquence de perte est f = 0, 053.
La population est ici l’ensemble de tout les yaourts que l’on va livrer à l’épicier et
la proportion de perte dans le contrat de vente est de

p = 0, 04, d’où q = 1 − p = 0, 96

Les hypothèses à tester sont :



H0 : f = p = 0, 04
H1 : f 6= 0, 04

On effectuera un test bilatéral de la conformité d’une fréquence dont sa v.a. suit


une loi normale centrée réduite.
On calcule
|f − p| 0, 053 − 0, 04
Tobs = p pq = q = 1, 625 < 1, 96 = t
0,04×0,96
n
600

L’hypothèse nulle H0 : f = p = 0, 04 est acceptée et la réclamation de l’épicier


n’est donc pas justifiée au risque de 5%.
Exercice.6
Soit p la probabilité d’efficacité du produit antidégraissant.
On a à choisir entre deux hypothèses :

H0 : p = 0, 9 : l’affirmation est valable
H1 : p < 0, 9 : l’affirmation est fausse

C’est un test unilatéral de la proportion pour un niveau de signification α = 0, 01.


La valeur critique d’après la loi normale centrée réduite est t = −2, 33, qu’il faut
comparer à
260
f −p − 0, 9 −0, 4
Tobs = p pq = 300 q = ' −3, 053
n
0,09 0, 131
300

On a Tobs < t =⇒ H0 : p = 0, 9 est rejetée, et on retient l’hypothèse alternative


H1 : p < 0, 9.
On conclut que l’affirmation du fabriquant n’est pas légitime au risque d’erreur de
1%.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 351 — #361


i i

Cinquième partie

ANALYSE NUMERIQUE

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 352 — #362


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 353 — #363


i i

CHAPITRE 18

Introduction à l’analyse numérique

Une méthode numérique est une suite finie d’opérations arithmétiques


(+, −, ×, ÷)
permettant d’avoir la solution à un problème avec une précision arbitrairement fixée.
Ainsi, l’analyse numérique est l’étude des méthodes numériques. Il en résulte deux
approches de l’analyse numérique :
– Approche mathématique où on étudie les propriétés mathématiques des méthodes
utilisées pour résoudre un problème. Elle se base sur le formalisme mathématique
et nécessite du papier et du crayon.
– Approche informatique où on met en application les méthodes sans s’occuper des
démonstrations de la valididté. Elle se base sur l’algorithmique et l’informatique.
Dans cette partie, nous allons étudié de l’analyse numérique en passant non
seulement par ces deux approches mais aussi par l’introduction de nouvelles types de
difficultés concernant les questions :
– de précision finie
– des erreurs d’arrondis
– des opérations arithmétiques "inexactes".
– ...

18.1 Représentations des nombres


Tout d’abord, un peu de treminologie est nécessaire.
Définition 18.1.1 (Erreur absolue) Soit x un nombre et x∗ une approximation de
ce nombre. L’erreur absolue est définie par :
∆x = |x − x∗ | .

Définition 18.1.2 (Erreur relative) Soit x un nombre et x∗ une approximation


de ce nombre. L’erreur relative est définie par :
|x − x∗ | |∆x|
Er (x) = = .
|x| |x|
De plus, en multipliant par 100%, on obtient l’erreur relative en pourcentage.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 354 — #364


i i

354 Chapitre 18. Introduction à l’analyse numérique

Remarque 18.1.1 En pratique, il est difficile d’évaluer les erreurs absolue et relative,
car on ne connait généralement pas la valeur exacte de x et on n’a que x∗ . On
dispose en revanche d’une borne supérieure pour l’erreur absolue qui dépond de
la précision des instruments de mesures utilisées. Cette borne est quand même
appelée erreur absolue :

|x − x∗ | ≤ ∆x ⇐⇒ x∗ − ∆x ≤ x ≤ x∗ + ∆x.

On l’a note :
x = x∗ ± ∆x
(on a estimé la valeur exacte x avec une incertitude ∆x.
Définition 18.1.3 Un nombre est connu numériqument si l’on dispose de son écriture
dans la base 10. On se connait exactement que les nombres rationnels. On
considère qu’un nombre réel est connu numériquement si on connait un certain
nombre de chiffre de son développement décimal et la précision avec laquelle ce
développement approché est donné.
Exemple 18.1.1 e = 2.7183 ± 10−4 .
Définition 18.1.4 (Chiffres significatifs) Si l’erreur absolue vérifie

∆x ≤ 0.5 × 10m

alors le chiffre correspond à la m-ème puissance de 10 est dit significatif et tous


ceux à gauche le sont aussi.
Exemple 18.1.2
Une 22
approximation de π ' 7 . En effet,−2 x∗ = 22
7 = 3.142857... donc
22
∆x = x − 7 = 0.00126... Puisque ∆x ≤ 0.5 × 10 , le chiffre des centièmes

est significatif. D’où, on a 3 chiffres significatifs.

18.1.1 Troncature d’un nombre


1
Soit x = 15 = 0.0666666... Dans une représentation tronquée à 5 chiffres, on peut
écrire ce nombre sous la forme x∗ = 0.66666 × 10−1 . Ainsi, l’erreur absolue et l’erreur
relative sont respectivement : ∆x = 6 × 10−7 et Er (x) = 1 × 10−5 .
Dans une représentation tronquée à S chiffres, l’erreur relative maximale est de
l’ordre de 10−S .

18.1.2 Arrondissement d’un nombre


Dans une représentation arrondie, lorsque la première décimale négligée est supérieure
1
à 5 on ajoute 1 à la dernière décimale conservée. Ainsi, on écrit pour x = 15 ,
∗ −1 −6
x = 0.66667 × 10 . L’erreur relative serait de 5 × 10 .
L’erreur relative dans une représentation arrondie à S chiffres est de

5 × 10−(S+1)

soit la moitié de celle d’une représentation tronquée.


Afin de minimiser la perte de précision, on arrondit en respectant les règles suivants :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 355 — #365


i i

18.2 Arithmétique flottante 355

– On n’arrondit que le résultat final et jamais les résultats intermédiaires.


– Un résultat final n’a jamais plus de précision que les données de départ.
– On arrondit un nombre approximatif au dernier chiffre significatif exact (ne pas
faire une suite d’arrondissement de droite vers la gauche pour éviter d’obtenir 1
à partir de 0.465).

18.1.3 Propagation des erreurs dans les opérations arithmétiques


Soient x et y deux nombres. x∗ et y ∗ sont les approximations de x et y, respectivement.
Le tableau suivant donne une idée sur la propagation des erreurs dans les opérations
arithmétiques :
Opération Erreur absolue Erreur relative
∆x+∆y
x∗ + y ∗ ∆x + ∆y |x∗ +y ∗ |
∆x+∆y
x∗ − y ∗ ∆x + ∆y |x∗ −y ∗ |
∗ ∗ ∆y
x ×y y ∆x + x∗ ∆y
∗ ∆x
x∗ + y ∗
y ∗ ∆x+x∗ ∆y ∆y
x∗ ÷ y ∗ (y ∗ )2
∆x
x∗ + y ∗

La soustraction est celle qui conduit à une erreur très "grande". Il est impossible de
faire une étude théorique de la propsgation des erreurs dans un calcul. Il est cependant
possible d’affirmer que la croissance de ces erreurs (arrondis) en fonctions du volume
des calculs (nombres d’opérations) à une allure exponentielle.

18.2 Arithmétique flottante


Les erreurs ont tendance à se propager et quelques fois à s’amplifier au fil des calculs.
Nous devons suivre la propagation des erreurs dans les opérations arithmétiques
élémentaires.
Tout nombre réel x s’écrtit sous la forme :
x = 0.d1 d2 d3 ...dn dn+1 ... × 10l , l ∈ N.
Définition 18.2.1 Soit x un nombre réel. On note f l (x) sa représentation en notation
flottante à n chiffres définie par :
x = 0.d1 d2 d3 ...dn × 10l , l ∈ N.
Remarque 18.2.1 La notation flottante d’un nombre dépend du nombre n, mais
aussi du procédé retenu pour éliminer les derniers chiffres. Ainsi, la troncature
consiste à retrancher les chiffres à partir de la position (n + 1) . Avec l’arrondi,
on rajoute 5 au (n + 1)-ème chiffre avant d’effectuer la troncature.
Exemple 18.2.1 Si on choisit n = 4, alors on a :
 
1
fl = f l (0, 33333333...) = 0.3333 × 100 ,
3
f l (π) = 0, 3142 × 101
et
f l (12.4551) = 0, 1246 × 102 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 356 — #366


i i

356 Chapitre 18. Introduction à l’analyse numérique

18.2.1 Opérations élémentaires


Soient x et y deux nombres réels. On a

x + y −→ f l (f l (x) + f l (y)) ,
x − y −→ f l (f l (x) − f l (y)) ,
x ÷ y −→ f l (f l (x) ÷ f l (y)) ,
x × y −→ f l (f l (x) × f l (y)) .

Exemple 18.2.2 31 × 3 s’écrit en arithmétique flottante à 4 chiffres :


   
1
+ f l (3) = f l f l 0.3333 × 100 + f l 0.3000 × 101
 
fl fl
3
= f l 0.09999000 × 101


= f l 0.9999 × 100 = 0.9999 × 100 .




On remarque une légère perte de précision par rapport à la valeur de cet opération
qui est 1.
Remarque 18.2.2 Les opérations mathématiquement équivalentes ne le sont pas
forcément en arithmétique flottante.
Exemple 18.2.3 Si on choisit n = 3, on a : f l (122 × (333 × 695)) = 0.126 × 106
et f l (122 × 333 + 122 × 695) = 0.125 × 106 . Donc, une légère différence entre
les résultats, ce qui indique que les deux façons ne sont pas équivalente en
arithmétique flottante.

18.3 Normes de vecteurs et de matrices


Définition 18.3.1 (Norme d’un vecteur) Soit E un espace vectoriel sur C. On
appelle norme toute application de E dans R qui, à tout x ∈ E, associe le nombre
réel kxk (appelé norme de x) qui vérifie les trois conditions suivantes :
1. kxk ≥ 0 et kxk = 0 si et seulement si x = 0 ∈ E,
2. kλxk = |λ| . kxk , λ ∈ C,
3. kx + yk ≤ kxk + kyk , ∀x, y ∈ E.
Remarque 18.3.1
1. Une norme sert à mesurer la distance kx − yk entre deux éléments.
2. Si dim E < ∞, toutes les normes sont équivalentes, c’est à dire, il existe des
inégalités entre elles.
Définition 18.3.2 (Norme de Hölder) Soit E = Cn ,
 
x1
 x2 
T
x = (x1 , x1 , . . . , xn ) =  .  ∈ E.
 
 .. 
xn

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 357 — #367


i i

18.3 Normes de vecteurs et de matrices 357

On appelle norme de Hölder d’indice k :


 1
k k k
kxkk = |x1 | + · · · + |xn | , k = 1, 2, . . .
kxk∞ = max |xi | .
1≤i≤n

Parmi ces normes, les plus utilisées sont kxk1 , kxk∞ et kxk2 . k.k2 s’appelle la
norme euclidienne.
√ Trouver les normes 1, 2 et ∞ de x = (1, 0, −1, −4) . kxk1 = 6,
Exemple 18.3.1
kxk2 = 18 et kxk∞ = 4.
Définition 18.3.3 (Norme d’une matrice) Une norme de matrice peut être dé-
finie à partir d’une norme pour les vecteurs. Soit A ∈ Cn×m une matrice. La
quantité
kAxk
kAk = sup
x6=0 kxk

est une norme pour la matrice A. Elle est appelée la norme matricielle subor-
donnée à la norme vectorielle x 7−→ kxk.
Remarque 18.3.2
1. Remplacer x par αx avec α ∈ C et kxk = 1 :

kAk = sup kAxk .


kxk=1

2. Ces normes de matrice vérifient les trois propriétés des normes, mais il existe
deux autres propriétés qui nous serons très utiles

kAxk ≤ kAk kxk et kABk ≤ kAk kBk .

3. Les normes de matrices les plus utilisées sont celles qui sont reliées à une norme
de Hölder pour les vecteurs, c’est à dire,
kAxkk
kAkk = sup
x6=0 kxkk

où k.kk est la norme de vecteur de Hölder d’indice k.


4. Les normes de matrices semblent être difficiles à calculer en pratique puisqu’elles
font intervenir une borne supérieure.
Proposition 18.3.1 Les expressions exactes des normes 1, 2 et ∞ sont comme suit :
n
X
kAk1 = max |aij | ,
1≤j≤m
i=1
m
X
kAk∞ = max |aij | ,
1≤i≤n
j=1
q
kAk2 = ρ (AT A),

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 358 — #368


i i

358 Chapitre 18. Introduction à l’analyse numérique


où ρ AT A désigne le rayon spectral de AT A ∈ Cm×m , c’est à dire sa plus
grande valeur propore :

ρ AT A = max |λi | où λi sont les valeurs propores de AT A.



1≤i≤m

Exemple 18.3.2 Trouver les nomres matricielles 1, 2, ∞ de la matrice


 
1 −2 1
A= 0 2 0 .
3 2 1

En effet,

kAk1 = max {4, 5, 2} = 5,


kAk∞ = max {4, 2, 6} = 6,
√ √
De plus, les valeurs propres de la matrice A sont 3 + 1, 1 − 3 et 2. Ainsi,
r n√ √ o q√
kAk2 = max 3 + 1, 1 − 3, 2 = 3 + 1 ' 1. 652 9.

18.4 Conditionnement d’une matrice

Soit A ∈ Cn×n . Pour toute norme de Hölder, on a


−1
AA = kIk ≤ kAk A−1

or kIk = 1, alors
K (A) = kAk A−1 ≥ 1.

Ce nombre K (A) s’appelle conditionnement de A.


Si le problème est bien conditionné, le nombre de conditionnement K (A) sera
proche de 1. On peut constater cela en calculant le nombre de conditionnement de la
matrice identité, qui est très bien conditionnée.
Par contre, plus K (A) est grand, moins le système est bien conditionné (on dit que
A est mal conditionnée) et on doit utiliser des méthodes exactes au lieu des méthodes
itératives qui sont plus rapides.

Exemple 18.4.1 Pour une matrice A ∈ Cm×m avec K (A) = 50000 en norme ∞.
Alors, K (A) est "grand" par rapport à 1. Ainsi, A est mal conditionnée.
Remarque 18.4.1 Si la précision de l’ordinateur avec laquel on travail est de 10−7 ,
un conditionnement de 105 sera considéré comme "grand". Par contre, si la
précision est de 10−16 , un tel conditionnement sera "petit".

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 359 — #369


i i

18.5 Exercices 359

18.5 Exercices
18.5.1 Enoncés
Exercice 1 :
On considère la fonction f (x) = (1 + x)3 − 1 : (E).
1
1. Calculez f ( 1111 ) avec le maximum de précision puis arrondir le résultat à 4
chiffres.
2. Refaire le même calcul en arithmétique à 4 chiffres avec arrondi. Comparer les
résultats et commenter.
3. Trouver une expression équivalente à (E), qui vous permette d’obtenir le même
résultat qu’en (1) tout en travaillant à 4 chiffres.
Exercice 2 :
10
1
P
En arithmétique fottante, avec s = 3 trouver la valeur numérique de i2 :
i=1
1 1 1
1. En calculant 1 + 4 + ··· + 100 .
1 1
2. Puis, en calculant 100 + 81 + · · · + 11 .
3. Quel résultat est le plus précis, pourquoi ?
Exercice 3 :
Si on utilise l’arithmétique finie avec b = 10, s = 3, quelle est l’erreur relative
commise dans les calculs de

A = (3.28 × 10−2 ) ∗ (6.98 × 103 )

B = (3.28 × 10−2 ) ∗ (6.98 × 103 ) ÷ 4.82 × 10−8


 

lorsqu’on tronque ou qu’on arrondit ?


Exercice 4 : √
−b+ b2 −4ac
Une des racines de l’équation ax2 + bx + c = 0 est donnée par r1 = 2a .
1. Calculer r1 avec le maximum de précision possible dans le cas ou a = 1, b = 111, 11
et c = 1, 2121.
2. Calculer la même racine dans une arithmétique flottante a 5 chiffres. Commenter.
3. Proposer une formule équivalente mieux adaptée au calcul de cette racine (dans
une arithmétique flottante a 5 chiffres).
Exercice √ 5:
Si f (x) = 4 + x.
1. Trouver le développement de Taylor P2 (x) à l’ordre 2 de la fonction f (x) au
voisinage de x0 = 0.
√ √
2. En utilisant P2 (x), approcher 3.9. En utilisant la valeur "exacte" de 3.9
donnée par la calculatrice, estimer l’erreur absolue et l’erreur relative commises.
3. Quels sont les chiffres signifcatifs de l’approximation obtenue en 1. ?

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 360 — #370


i i

360 Chapitre 18. Introduction à l’analyse numérique

Exercice 6 :
Soient A = (aij )1≤i,j≤n et B = (bij )1≤i,j≤n deux matrices triangulaires supérieures
de Mn (C). Montrer que la matrice AB est triangulaire supérieure.
Exercice 7 :
Soit A ∈ Mn,p (C). On pose B = AA∗ et C = A∗ A. Montrer que les matrices B et
C admettent les mêmes valeurs propres non nulles. En déduire que ρ (B) = ρ (C) .
Exercice 8 :
Soit D = (dij )1≤i,j≤n ∈ Mn (R) une matrice diagonale. Montrer que

kDk1 = kDk∞ = kDk2 = max |dkk | .


1≤k≤n

Exercice 9 :
Soit A ∈ Mn (R) et soient U, V ∈ Mn (R) deux matrices orthogonales. Montrer
que kV AU k2 = kAk2 .
Exercice 10 :
Soient k.kv une norme vectorielle de Rn et k.km la norme matricielle subordonnée
associée.
1. Soit A ∈ Mn (R) inversible et soit λ une valeur propre de A. Montrer que
1
kAkm ≥ |λ| ≥ .
kA−1 k m

2. Montrer que pour tout x ∈ Rn \{0}, on a

1 kAxkv
≤ ≤ kAkm .
kA−1 km kxkv

Exercice 11 :
Soit A ∈ Mn (R) la matrice donnée par :
 
4 1
1 4 1 
 
 . .
.. .. .. 
A=  . .

 .. .. 
 . . 1
1 4

1. En écrivant A sous la forme A = 4(In − N ), où N est à déterminer, montrer que


A est inversible et que kA−1 k∞ ≤ 12 . En déduire un majorant de Cond∞ (A).
2. Soit λ une valeur propre de A. Montrer que 2 ≤ |λ| ≤ 6.
Exercice 12 :
1. Montrer que le conditionnement d’une matrice est supérieur ou égal à 1 pour
n’importe quelle norme subordonnée.
 
1 100
2. Calculer le conditionnement de A = pour la norme 1.
0 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 361 — #371


i i

18.5 Exercices 361

   
100 100
3. Résoudre Ax1 = b1 puis Ax2 = b2 avec b1 = et b2 = .
1 0
4. Calculer
kx1 − x2 k1 kb1 − b2 k1
et .
kx1 k1 kb1 k1

5. Conclure.

18.5.2 Corrigés
Exercice 1 :
1. La valeur à 15 chiffres significatifs est 0.00270270124229435, ce qui arrondi à 4
chiffres donne 0.002703.
2. Si on travaille à 4 chiffres, avec x = f l(1/1111) = 0.0009001, x + 1 = 1.001 =⇒
(1 + x)3 = 1.003 =⇒ (1 + x)3 − 1 = 0.003. Nous n’avons qu’un chiffre significatif.
3. f (x) = (1 + x)3 − 1 = 3x + 3x2 + x3 = x(3 + x(3 + x)) = 0.002703 (si on travaille
à 4 chiffres).
Exercice 2 :
1 1 1

1. f l 1 + 4 + ··· + 100 = 0.153 × 101 .
1 1
+ · · · + 11 = 0.154 × 101 .

2. f l 100 + 81
3. La deuxième façon est la plus précise (moins d’erreurs possible).
Exercice 3 :

A = (3.28 × 10−2 ) ∗ (6.98 × 103 ) = 228.944.

A∗t = 0.228 × 103 et A∗a = 0.229 × 103 .


A − A∗t ∗

= 0.4% et A − Aa = 0.02%.


A A

B = (3.28 × 10−2 ) ∗ (6.98 × 103 ) ÷ 4.82 × 10−8 = 4.749875 × 109 .


 

Bt∗ = 4.74 × 109 et Ba∗ = 4.75 × 109 .


B − Bt∗ ∗

= 0.41% et B − Ba = 0.002%.


B B

Exercice 4 : √
−b+ b2 −4ac
Une des racines de l’équation ax2 + bx + c = 0 est donnée par r1 = 2a .
1. r1 = −0.0109100804.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 362 — #372


i i

362 Chapitre 18. Introduction à l’analyse numérique

2.
f l b2 = f l (b × b)


= f l 0.11111 × 103 × 0.11111 × 103




= f l 0.123454321 × 105


= 0.12345 × 105 .
f l (4ac) = f l 0.4000 × 101 × 0.12121 × 101


= 0.48484 × 101 .
f l b2 − 4ac = f l 0.12345 × 105 − 0.48484 × 101
 

= f l 0.123401516 × 105


= 0.12340 × 105 .
p 
b2 − 4ac = f l 0.1110855526991 × 103

fl
= 0.11109 × 103 .
 p 
f l −b + b2 − 4ac = −0.02.
√ !
−b + b2 − 4ac
fl = −0.01.
2a

−b+ b2 −4ac

3. On multiplie la 2a b2 − 4ac en haut et en bas :
par b +
√ √
−b + b2 − 4ac b + b2 − 4ac −2c
× √ = √ .
2a 2
b + b − 4ac b + b2 − 4ac
Exercice 5 √:
Soit f (x) = 4 + x.
1. Le développement de Taylor P2 (x) à l’ordre 2 de la fonction f (x) au voisinage
de x0 = 0 est donné par
x2 00
f (x) = f (0) + xf 0 (0) + f (0) + x2  (x)
2
x x2
=2+ − + x2  (x) .
4 64
2. La valeur approchée de

3.9 = f (−0.1) = P2 (−0.1)
2
1 (−0.1)
'2+ (−0.1) −
4 64
' 1.97484375.
L’erreur absolue est

Eabs = 3.9 − 1.97484375 = 1. 984 2 × 10−6 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 363 — #373


i i

18.5 Exercices 363

L’erreur relative est



3.9 − 1.97484375
Erel = √ = 1. 004 7 × 10−6 .
3.9

3. Eabs ≤ 0.5 × 10−5 ⇒ le chiffre correspond à la position 5 est significatif et tout


eux à gaucje le sont aussi :
1.97484
Exercice 6 :
Soient A = (aij )1≤i,j≤n et B = (bij )1≤i,j≤n deux matrices triangulaires supérieures
de Mn (C) :
aij = 0 si i > j et bij = 0 si i > j.
Montrer que C = AB est triangulaire supérieure : cij = 0 si i > j. En effet, soit i > j,
on a
Xn Xj Xn
cij = aik bkj = aik bkj + aik bkj = 0
|{z} |{z}
k=1 k=1 k=j+1
=0 (i>k) =0 (k>j)

Exercice 7 :
Soit A ∈ Mn,p (C). On pose B = AA∗ et C = A∗ A.
– Montrer que les matrices B et C admettent les mêmes valeurs propres non nulles.
En effet, les matrices B et C sont hermitiennes. Soit λ 6= 0 une valeur propre de
B = AA∗ . Il existe alors v ∈ Cn \ {0} tel que Bv = λv, c’est à dire AA∗ v = λv. D’où,
AA∗ (A∗ v) = λA∗ v. Or, w = A∗ v 6= 0, car sinon λv = 0 ce qui est impossible car
λ 6= 0 et v 6= 0.
De même, on motre que toute valeur propre non nulle de C est une valeur propre
de B. D’où, le résultat.
– En déduire que ρ (B) = ρ (C) . On a ρ (B) = maxi |λi | , λi valeur propre de B.
1er cas : ρ (B) 6= 0. Alors, il est clair, d’après ce qui précède, que ρ (B) = ρ (C) .
2ème cas : ρ (B) = 0. Alors, nécessairement ρ (C) = 0, car sinon il existe λ 6= 0
valeur propre de C, qui serait aussi valeur propre de B (ρ (B) = 0 alors toutes
les valeurs propres de B sont nulles.
Exercice 8 :
Soit D = (dij )1≤i,j≤n ∈ Mn (R) une matrice diagonale : dij = 0, i 6= j. Montrer
que
kDk1 = kDk∞ = kDk2 = max |dkk | .
1≤k≤n

On a :
n
X
kDk1 = max |dij | = max |djj | = ρ (D) ,
1≤j≤m 1≤j≤m
i=1
m
X
|dij | = DT 1 = kDk1 = ρ (D) ,

kDk∞ = max
1≤i≤n
j=1
q p
kDk2 = ρ (DT D) = ρ (D2 ) = ρ (D) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 364 — #374


i i

364 Chapitre 18. Introduction à l’analyse numérique

Exercice 9 :
Soit A ∈ Mn (R) et soient U, V ∈ Mn (R) deux matrices orthogonales : U U T =
U U = I et V V T = V T V = I. Montrer que kV AU k2 = kAk2 .
T

On a :
2
2 kV AU xk2 hV AU x, V AU xi
kV AU k2 = sup 2 = sup 2
x6=0 kxk2 x6=0 kxk2


AU x, V T V AU x hAU x, AU xi
= sup 2 = sup 2
x6=0 kxk2 x6=0 kxk2
hAy, Ayi
= sup 2 (car y = U x)
y6=0 kU −1 yk2
2
kAyk2
car U −1 y 2 = U T y 2 = kyk2

= sup 2
y6=0 kyk2
2
= kAk2 .
Exercice 10 :
Soient k.kv une norme vectorielle de Rn et k.km la norme matricielle subordonnée
associée.
1. Soit A ∈ Mn (R) inversible et soit λ une valeur propre de A. Montrer que
1
kAkm ≥ |λ| ≥ .
kA−1 km
kAvk kAv k
On a : kAkm = supv6=0 kvk v ≥ kv00k v où v0 est un vecteur propre associé à
v v
λ : Av0 = λv0 .D’où, kAkm ≥ |λ| . Par ailleurs, comme λ = 6 0 est une valeur propre
de A alors λ1 est une valeur propre de A−1 : il existe w0 telque A−1 w0 = λ1 w0 .
kA−1 vk kAw k
Ainsi, A−1 m = supv6=0 kvk v ≥ kw00k v = |λ| 1 1
, d’où |λ| ≥ kA−1 k .
v v m

2. Montrer que pour tout x ∈ Rn \{0}, on a


1 kAxkv
≤ ≤ kAkm .
kA−1 km kxkv
On a, par définition d’une norme matricielle subordonné, que ∀x ∈ Rn \{0},
−1
kAxkv A = supy6=0 kA ykv = supx6=0 kxkv . D’où,
−1
kxkv ≤ kAk m . De plus, m kykv kAxkv
A ≥ kxkv , ∀x ∈ Rn \{0}.
−1
m kAxkv

Exercice 11 :
Soit A ∈ Mn (R) la matrice donnée par :
 
4 1
1 4 1 
 
. . . ..
. ..
 
A=  . .

 .. .. 
 . . 1
1 4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 365 — #375


i i

18.5 Exercices 365

1. A = 4(In − N ), où

− 14
 
0
− 1 0 − 41 
 4 
 .. .. .. 
N =
 . . . .

 .. .. 
 . . − 41 
− 41 0
1
kN k∞ = 2 < 1, d’où In − N est inversible, et par suite A est inversible. De plus,
on a
1
−1 1 1 1
kA−1 k∞ = (In − N ) ≤ = .

4 ∞ 4 1 − kN k∞ 2
1
Ainsi, Cond∞ (A) = kAk∞ kA−1 k∞ ≤ 2 kAk∞ . Or,
n
X
kAk∞ = max |aij | = 6.
1≤i≤m
j=1

D’où, Cond∞ (A) ≤ 3.


2. Soit λ une valeur propre de A. Montrer que 2 ≤ |λ| ≤ 6. En effet, soit v0 un
vecteur propre associé à λ : Av0 = λv0 . On a alors,
kAv0 k∞
6 = kAk∞ ≥ = |λ| .
kv0 k∞

Puisque A est inversible, alors 1


λ est une valeur propre de A−1 . Soit v1 un vecteur
propre associé à λ1 . On a
−1
1 A v1 1
−1 ∞

≥ A


≥ = .
2 kv1 k∞ |λ|
Ainsi, 2 ≤ |λ| ≤ 6.
Exercice 12 :
1.
1 = kIk = AA−1 ≤ kAk A−1 = k (A) .

2.
k (A) = kAk1 A−1 1 = 101 × 101 = 10201.

3.    
0 100
x1 = et x2 = .
1 0
4.
kx1 − x2 k1 kb1 − b2 k1 1
= 101 et = .
kx1 k1 kb1 k1 101
5. Le système est mal conditionné.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 366 — #376


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 367 — #377


i i

CHAPITRE 19

Méthodes directes de résolution des systèmes linéaires

19.1 Introduction

Soit à résoudre le système matriciel :

AX = b,

avec
   
a11 a12 ··· a1n b1
 a21 a22 ··· a2n   b2 
A=  ∈ Cn×n , b =   ∈ Cn .
   
.. .. .. .. ..
 . . . .   . 
an1 ··· ··· ann bn

On sait que, si A inversible,


X = A−1 b.

Mais, l’inversion des matrices n’est pas simple numériquement. Comme ces systèmes
apparaissent dans la résolution des équations différentielles, aux dérivées partielles et
dans différents problèmes pratiques nous allons apprendre de méthodes à les résoudre.
Par ailleurs, les systèmes linéaires s’attachent à un problème réel pouvent être classé
en deux types :
– à matrice dense mais d’ordre pas élevé
– à matrice creuse (à beaucoup d’éléments nuls) mais avec un ordre élévé.
A chaque type, il existe des méthodes adaptées.

Définition 19.1.1 (Méthodes directes) Une méthode de résolution d’un système


linéaire est dite directe si la solution du système peut être obtenue par cette
méthode en un nombre fini et prédéterminé d’opérations.
Remarque 19.1.1 On peut avoir le résultat des méthodes directes après un nombre
connu de multiplications, divisions, additions et soustractions. Ainsi, la déduction
du temps de calcul. En contre partie, les méthodes itératives se divergent ou se
convergent vite ou pas vite et on sait pas le temps de calcul !

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 368 — #378


i i

368 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

19.2 Méthode de Gauss-Jordan


19.2.1 Marche à suivre
Pour simplifier la description de cette méthode, on pose n = 4 :
    
a11 a12 a13 a14 x1 y1
 a21 a22 a23 a24   x2   y2 
 a31 a32 a33 a34   x3  =  y3  .
    

a41 a42 a43 a44 x4 y4


1. On choisit successivement chaque ligne comme ligne pivot (le pivot est le premier
élément non nul de la ligne).
2. On divise la première ligne par le pivot a11 . C’est à dire
1 a012 a013 a014
    0 
x1 y1
 a21 a22 a23 a24   x2   y2 
 a31 a32 a33 a34   x3  =  y3  .
    

a41 a42 a43 a44 x4 y4


3. On annule le premier terme de chacune des autres lignes à la deuxième ligne
(3ème et 4ème lignes, respectivement), on retranche (la première ligne)×a21
(a31 , a41 , respectivement). C’est à dire
1 a012 a013 a014
    0 
x1 y1
 0 a022 a023 a024   x2   y20 
 0 a032 a033 a034   x3  =  y30  .
    

0 a042 a043 a044 x4 y40

4. On fixe la deuxième ligne comme ligne pivot et a022 comme pivot et on recommence
les opérations précédentes
(a) Division de la deuxième ligne par a022
1 a012 a013 a014
    0 
x1 y1
 0 1 a0023 a0024   x2   y200 
= .
 0 a032 a033 a034   x3   y30
 

0 a042 a043 a044 x4 y40

(b) On annule les autres termes de la colonne


0 a0013 a0014 y100
    
1 x1
 0 1 a0023 a0024   x2   y200 
 =  00  .
0 a0033 a0034   x3
 
 0   y3 
0 0 a0043 a0044 x4 y400
5. On refait la même chose avec les lignes 3 et 4. On obtient
    ∗ 
1 0 0 0 x1 y1
 0 1 0 0   x2   y2∗ 
   =  ∗ .
 0 0 1 0   x3   y3 
0 0 0 1 x4 y4∗

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 369 — #379


i i

19.2 Méthode de Gauss-Jordan 369

Le système est alors résolu

x1 = y1∗ , x2 = y2∗ , x3 = y3∗ et x4 = y4∗ .

19.2.2 Généralisation
En appliquant la marche précédente à un système linéaire d’ordre n :

AX = b

on remarque qu’à l’issue de l’étape


1. On obtient une matrice A(1) avec des 0 et 1 sur sa première colonne
2. On obtient une matrice A(2) avec des 0 et 1 sur ses deux premières colonnes.
..
.
k. On obtient une matrice A(k) avec des 0 et 1 sur ses k premières colonnes.
Et on a,
A(k) X = y (k)
avec
(k)
aij = 1 si i = j ≤ k (k premiers éléments diagonaux),
(k)
aij = 0 si i 6= j ≤ k (colonne de 1 à k, éléments non diagonaux).

(k)
L’étape suivante consiste à prendre ak+1,k+1 comme pivot ; on divise la (k + 1)-ème
ligne par cet élément ce qui donne pour j = k + 1 à n
(k) (k)
a0ij = aij et yi0 = yi si i 6= k + 1,
(k) (k)
ak+1,j yk+1
a0k+1,j = (k)
0
et yk+1 = (k)
.
ak+1,k+1 ak+1,k+1

(k)
Puis à chaque ligne i 6= k + 1, on retranche la ligne k + 1, multipliée par ai,k+1 , ce qui
donne
A(k+1) X = y (k+1) ,

(k+1) (k) (k)


aij = aij − ai,k+1 a0k+1,j
(k+1) (k) (k) 0
yi = yi − ai,k+1 yk+1 .

On remarque que les formules sur les y sont les mêmes que sur les a : on obtient donc
(k) (k)
les notations sur les y en posant yi = ai,n+1 . On reconsidère alors que les équations
sur les a en faisant varier j de k + 1 à n + 1. On obtient la procédure suivante :
(0)
1. A(0) = A et ai,n+1 = yi
2. Pour k = 0 à n − 1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 370 — #380


i i

370 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

(k+1) (k) (k)


(a) i = k + 1 et j = k + 1 à n + 1, alors ak+1,j = ak+1,j /ak+1,k+1
(k+1) (k) (k) (k+1)
(b) i = 1 à n, i 6= k + 1 et j = k + 1 à n + 1, alors aij = aij − ai,k+1 × ak+1,j .
(n)
(c) xi = ai,n+1 .
Cette méthode est une méthode de diagonalisation puisqu’à la fin de la procédure,
on obtient une matrice diagonale.
Remarque 19.2.1 Le nombre d’opérations nécessaires pour résoudre le système est
environ n3 , lorsque n est "assez grand".

19.3 Méthode de Gauss


On cherche à triangulariser la matrice A au lieu de la diagonaliser : A chaque étape
au lieu de faire apparaître des zéros dans toute une colonne, on ne les fait apparaître
qu’en dessous de la diagonale. Ce qui supprime tous les calculs relatifs aux termes
situés au-dessus de la diagonale. Il en résulte deux modifications par rapport à la
procédure précédente :
– i varie de k + 2 à n et non de 1 à n
– Comme A(n) n’est pas diagonale, on a besoin d’une étape supplémentaire pour
calculer les xi .

Procédure de Gauss
(0)
1. Triangularisation de la matrice A : A(0) = A et ai,n+1 = yi . Pour k = 0 à n − 1
(a) i = k + 1 et j = k + 1 à n + 1, alors
(k+1) (k) (k)
ak+1,j = ak+1,j /ak+1,k+1

(b) i = k + 2 à n, et j = k + 1 à n + 1, alors
(k+1) (k) (k) (k+1)
aij = aij − ai,k+1 × ak+1,j .

2. Résolution du système triangulaire : A la fin de la 1ère étape, on obtient une


matrice triangulaire. Pour simplifier, on note A(n) = R = (rij ) . On a à résoudre
 
1 r12 · · · r1n x1
 
z1

.
 0 1 ... .. x2   z2 
 
  

 . .
 . =
 .   .  . ,
.. ... r
  
 .. n−1,n
 . . 
0 ··· 0 1 xn zn

(n)
avec zi = ai,n+1 . On obtient de proche en proche xn , xn−1 , . . . , x1 :

 xn = zn

n
X
 j
 x = zj − rjk xk pour j = n − 1 à 1.
k=j+1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 371 — #381


i i

19.3 Méthode de Gauss 371

Remarque 19.3.1 Le nombre d’opérations nécessaires pour résoudre le système est


3
environ 2n3 , lorsque n est "assez grand".
Exemple 19.3.1 Soit à résoudre

 2x + y + 2z = 10
6x + 4y = 26
8x + 5y + z = 35

En appliquant l’algorithme de Gauss (L2 ← L2 − 3L1 , L3 ← L3 − 4L1 ), on


obtient 
 2x + y + 2z = 10
x − 6y = −4
y − 7z = −5

La deuxième itération (L03 ← L03 − L02 ) donne un système triangulaire



 2x + y + 2z = 10
x − 6y = −4
−z = −1

avec solution : x = 3, y = 2 et z = 1. Ainsi, on a construit la matrice triangulaire,


notée  
2 1 2
U =  0 −6 0  .
0 0 −1
Les opérations élémentaires effectuées pour obtenir U sont équivalentes à multi-
plier le système de départ par une suite de matrices inversibles :

U = T3 T2 T1 A

où Ti correspond aux différentes opérations effectuées sur les lignes de la matrice.


      
2 1 2 1 0 0 1 0 0 1 0 0 2 1 2
 0 −6 0  =  0 1 0   0 1 0   −3 1 0   6 4 0  .
0 0 −1 0 −1 1 −4 0 1 0 0 1 8 5 1

Remarque 19.3.2 La méthode d’élimination de Gauss revient à factorier la matrice


A en un produit de deux matrices triangulaires L et U seulement dans le càs où
aucune permutation de lignes n’est effectuée.

19.3.1 Cas du pivot nul


Dans les formules de Gauss, au k-ième passage on divise les coefficients de la k-ième
(k−1)
ligne par le terme ak,k . Ce terme est appelé pivot. La division des termes n’est
possible que si le pivot est non nul.
Puisque dans un système d’équations, l’ordre des équations n’a aucune importance,
il est toujours possible de permuter deux lignes et d’obtenir un pivot non nul.
Si parmi les équations suivantes, il n’en existe aucune équation qui peut être
permuter avec la ligne k, le déterminant de la matrice initiale est nul.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 372 — #382


i i

372 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

Exemple 19.3.2 Le déterminant de ce système est 0.



 2x + 4y + 6z = −22
x + 2y + 5z = 7
2x + 4y + 11z = −1

En effet, la 1ère étape de Gauss donne



 x + 2y + 3z = −11
0 + 0y + 2z = 18
0 + 0y − 5z = 21

Ce système n’a pas de solution.

19.3.2 Cas du pivot petit


Considérons le système linéaire :
10−6 x + y

= 1
x+y = 2
dont la solution exacte est
1 10−6
x= , y = 1 −
1 − 10−6 1 − 10−6
et supposons qu’on fasse les calculs à 10−6 près. On peut prendre le nombre a11 = 10−6
comme pivot puisqu’il n’est pas nul, ce qui conduit après élimination au système linéaire
10−6 x +

y = 1
1 − 10−6 y = 2 − 10−6
Comme les nombres 1 − 10−6 et 2 − 10−6 sont arrondis chacun au même nombre


−10−6 alors la "solution" du système précédent est x = 1 et y = 0, qui constitue une


mauvaise approximation de la solution du système initiale.
Par contre, si l’on commence par permuter les deux équations du système initiale
pour obtenir le plus grand pivot en valeur absolue, on est conduit au système suivant :

x+y = 2
10−6 x + y = 1
qui, après élimination, devient

x + y = 2
1 − 10−6 y = 1 − 2 × 10−6
alors donnée par x = 1 et y = 1, puisque les nombres 1 − 10−6 et

Sa solution est
1 − 2 × 10−6 sont arrondis chacun au même nombre 1. Dans ce cas, le résultat est


satisfaisant.
Cet exemple montre l’effet désastreux des erreurs d’arrondi qui proviennent de
la division par des pivots "trop petits". C’est pourquoi, dans la pratique, on utilise
l’une des deux stratégies suivantes, au début de la k-ème étape de l’élimination
1≤k ≤n−1:

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 373 — #383


i i

19.4 Décomposition LU 373

(k)
– stratégie du pivot partiel : le pivot est l’un des éléments apk , k ≤ p ≤ n, qui
vérifie
(k) (k)
apk = max aik .
k≤i≤n

(k)
– stratégie du pivot total : le pivot est l’un des éléments apq , k ≤ p, q ≤ n, qui
vérifie
(k) (k)
apq = max aij .
k≤i,j≤n

Si le pivot choisi par cette stratégie n’est pas dans la k-ème colonne, il faut donc
également effectuer un échange de colonnes en plus de l’échange de lignes.

19.4 Décomposition LU
19.4.1 Principe de la méthode
On suppose que A = LU. Comment résoudre AX = b ?
On a AX = LU X = b et on pose U X = Y. Alors, la résolution du système linéaire
se fait alors en deux étapes : 
LY = b
UX = y
qui sont deux systèmes triangulaires.

19.4.2 Décomposition de Crout


Pour obtenir cette factorisation, on choisit n = 4. Alors, on choisit L une matrice
triangulaire inférieure et U une matrice triangulaire supérieure avec des 1 aux éléments
diagonaux :
    
a11 a12 a13 a14 l11 1 u12 u13 u14
 a21 a22 a23 a24   l21 l22  1 u23 u24  .
 a31 a32 a33 a34  =  l31 l32 l33
   
 1 u34 
a41 a42 a43 a44 l41 l42 l43 l44 1
←−−−−−−−−−−−−−−−−−−→ ←−−−−−−−−−−−−−−−−→←−−−−−−−−−−−−−−−−→
A L U

Crout passe par une simple identification pour récupérer les n2 = 16 coefficients pour
16 équations.

Procédure de Crout
1. Première colonne de L : li1 = ai1 pour i = 1 à n
2. Première ligne de U : u1i = a1i /l11 pour i = 2 à n
3. Pour i = 2 à n − 1
i−1
X
(a) Calcul du pivot : lii = aii − lik uki
k=1
(b) Pour j = i + 1 à n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 374 — #384


i i

374 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

i−1
X
i. Calcul de la i-ème colonne de L : lji = aji − ljk uki
k=1
i−1
!
X
ii. Calcul de la i-ème ligne de U : uij = aij − lik ukj /lii
k=1

n−1
X
(c) Calcul de lnn : lnn = ann − lnk ukn
k=1

Remarque 19.4.1 Le nombre d’opérations nécessaires pour décomposer la matrice


3
A en LU est environ n3 , lorsque n est "assez grand".
Exemple 19.4.1 Factorier la matrice suivante
 
3 −1 2
 1 2 3 
2 −2 −1

en LU ? En effet, après identification, on trouve les coefficients de L et U comme


suit l11 = 3, l21 = 1, l31 = 2, l22 = 7/3, l32 = −4/3, l33 = −1, u12 = −1/3,
u13 = 2/3 et u23 = 1.
Remarque 19.4.2 La procédure de Crout ne fonctionne uniquement que si les pivots
lii sont tous non nuls. Sinon, il va falloire permuter des lignes pour éviter cette
situation tout comme l’élimination de Gauss.

19.5 Décomposition de Cholesky


19.5.1 Rappel
Définition 19.5.1 Une matrice A ∈ Rn×n est dite symétrique définie positive si
1. AT = A (A symétrique)
2. xT Ax ≥ 0, ∀x ∈ Rn (A positive)
3. xT Ax = 0 si et seulement si x = 0 (A définie).
Proposition 19.5.1 Si A ∈ Rn×n une matrice symétrique définie positive alors
det A > 0 et A admet n valeurs propres réelles strictement positives.
Proposition 19.5.2 Si A ∈ Rn×n une matrice symétrique définie positive. Alors,
toutes ses sous-matrices principales sont symétrique définie positive.

19.5.2 La factorisation de Cholesky


Soit A ∈ Rn×n une matrice symétrique définie positive. Alors, il existe une unique
matrice triangulaire supérieure S dont les termes diagonaux sont strictement positifs
telle que A = S T S. Cette factorisation est appelée factorisation de Cholesky et les
coefficients sij de S T peuvent être calculés comme suit :

s11 = a11 et pour i = 2, . . . , n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 375 — #385


i i

19.6 Exercices 375

j−1
X
aij − sik sjk
k=1
sij = , j = 1, . . . , i − 1
sjj
i−1
! 21
X
sii = aii − s2ik .
k=1

Procédure de Cholesky

1. s11 = a11
ai1
2. Pour i = 2 à n, si1 = s11
i−1
! 21
X
3. Pour i = 2 à n − 1, skk = akk − s2ki
k=1
 
k−1
X
(a) Pour i = k + 1 à n, sik = aik − sij sjk  /skk
j=1

n−1
! 21
X
4. snn = ann − s2ni .
k=1
Remarque 19.5.1 Le nombre d’opérations nécessaires pour décomposer la matrice
3
A via Cholesky est environ n3 , lorsque n est "assez grand".
Exemple 19.5.1 Factorier la matrice suivante
 
4 −6 8 2
 −6 10 −15 −3 
 
 8 −15 26 −1 
2 −3 −1 62
via Cholesky ? En effet, après identification, on trouve les coefficients de la
matrice S comme suit
 
2 −3 4 1
 0 1 −3 0 
S= .
 0 0 1 −5 
0 0 0 6

19.6 Exercices
19.6.1 Enoncés
Exercice 1 :
Soit à résoudre le système avec
   
1 2 4 3
A= 2 2 8  , b =  10  .
3 6 7 4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 376 — #386


i i

376 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

1. Illustrer la méthode d’élimination de Gauss pour le système linéaire précédent.


2. En déduire la factorisation LU de la matrice A, où L est une matrice triangulaire
inférieure à diagonale unité et U est triangulaire supérieure.
3. Résoudre le système découlant de cette factorisation.
4. Calculer le déterminant de la matrice A en utilisant sa factorisation LU .
5. Résoudre le système A2 X = b.
Exercice 2 :
Résoudre par élimination de Gauss, le système linéaire
    
1 2 3 x1 7
 2 4 2   x2  =  10  .
3 2 1 x3 9

1. A chaque étape, identifier la matrice élémentaire qui correspond à l’opération


faite sur les rangées.
2. Notons L1 , L2 , L3 ces matrices et (b1 , b2 , b3 ) la dernière colonne de la matrice
augmentée qui résulte de l’application de ces trois opérations. Vérifier directement
que
T T
b1 b2 b3 = L1 L2 L3 7 10 9 .
Exercice 3 :
1. Montrer que la matrice  
0 3 0
A= 1 2 0 
3 5 2
n’est pas factorisable sous la forme
  
l1 0 0 1 u1 u2
A =  l2 l3 0   0 1 u3  . (E)
l4 l5 l6 0 0 1

2. Trouver P une matrice de permutation et B une matrice que l’on peut factoriser
suivant (E) tel que A = P B.
3. En déduire une factorisation LU de la matrice B.
4. Utiliser la factorisation résultante de A pour résoudre
   
x 1
A y  =  0 .
z 1

Exercice 4 :
Soit la matrice  
2 0 1
A= 0 3 0 .
1 0 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 377 — #387


i i

19.6 Exercices 377

1. Montrer que A admet une factorisation de Cholesky.


2. Calculer la décomposition de Cholesky de la matrice A.
3. Déterminer A−1 .
Exercice 5 :
Soit la matrice  
2 4 −4 −2
 4 7 −6 −5 
A=
 
−4 −6 3 5 
−2 −5 5 3
1. Déterminer la factorisation LU de la matrice A, où L est une matrice triangulaire
inférieure à diagonale unité et U est triangulaire supérieure.
2. Déterminer une décomposition LDLT de A où D est une matrice diagonale.
3. La matrice A admet-elle une factorisation de Cholesky ? Justifier votre réponse.
Exercice 6 :
On considère la matrice
 
1 1/2 1/2
A =  1/2 1 1/2 
1/2 1/2 1
1. Montrer que A est symétrique définie positive.
2. Trouver une matrice triangulaire inférieure T = (ti,j ) ∈ M3 (R) telle que tii > 0
et T T T = A (Factorisation de Cholesky de A).
3. En déduire la solution du système Ax = b pour tout b ∈ R3 .
Exercice 7 :
Soit α ∈ [0, 1], et Aα la matrice symétrique définie positive et tridiagonale
aij = aji = α si |i − j| > 1
définie par :
···
 
2 α 0 0
 .. .. .. 

 α 2 . . . 

Aα = 
 .. .. 
.
 0 . . α 0 
 .. .. 
 . . α 2 α 
0 ··· 0 α 2
Soit Aα = BB T la factorisation de Cholesky de Aα (B est bidiagonale inférieure).
On pose :  
d1
 c1 d2 
 
 .. 
B=  c2 . .

 . .. d

n−1
 
cn−1 dn

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 378 — #388


i i

378 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

1. Déterminer d1 et c1 en fonction de α.
2. Déterminer, pour k ≥ 2, dk en fonction de ck−1 et ck en fonction de α et dk .
3. En déduire la factorisation de Cholesky de la matrice A :
 
2 1 0 0
 1 2 1 0 
A=  0 1 2
.
1 
0 0 1 2

Exercice 8 : (Résolution d’un système tridiagonal par la méthode de Thomas)


On va décrire une méthode de résolution d’un système linéaire : Ax = d où A est
une matrice carrée d’ordre n tridiagonale :

···
 
b1 c1 0 0
 .. .. 
a2 b2
 c2 . . 
A=0
 . .. . .. . .. 
.
 0  
 0 . . . an − 1 bn − 1 cn − 1 
 

0 ··· ··· an bn

La première équation permet d’exprimer x1 en fonction de x2 ; la seconde permet


alors d’exprimer x2 en fonction de x3 . . . la k ème équation permet d’exprimer xk en
fonction de xk+1 , soit :

xk = pk xk+1 + qk , 1 6 k 6 n − 1 (E)
On peut alors calculer xn grâce à la dernière équation, puis on calcule

xn−1 , xn−2 , ..., x1

en remontant grâce aux relations (E).


1. Calculer p1, q1, p2 et q2.
2. Donner les formules de récurrence pour le calcul des pk et des qk .
3. Calculer xn en fonction de pn−1 et qn−1 .
4. Montrer que, grâce à (E), on peut calculer facilement xn−1 , xn−2 , . . . , x1 .
5. En ddéduire l’écriture du nouveau système P x = q équivalent au système initial
et traduisant les relations (E).
6. Application numérique : n = 4 ; bi = 2 pour 1 6 i 6 4; ai+1 = ci = −1 pour
1 6 i 6 3; dT = (−2, −2, −2, 23). Calculer la solution du système tridiagonal
Ax = d par la méthode décrite dans les questions précédentes.

19.6.2 Corrigés
Exercice 1 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 379 — #389


i i

19.6 Exercices 379

1. Notons par L1 , L2 et L3 les lignes de la matrice augmentée du système :


 
1 2 4 3
 2 2 8 10  .
3 6 7 4
En passant par les opréations élémentaires suivantes : L2 ←− L2 − 2L1 et
L3 ←− L3 − 3L1 , on obtient
 
1 2 4 3
 0 −2 0 4  .

0 0 −5 −5
 
1 2 4
2. En calculant l’inverse de U =  0 −2 0  et la multipliant par A, on
0 0 −5
trouve  
1 0 0
L =  2 1 0 .
3 0 1
3. Le système Ax = b est équivalent à résoudre deux systèmes triangulaires :

Ly = b
Ux = y
T T
avec x, y ∈ R3 . Ainsi, y = (3, 4, −5) et x = (3, −2, 1) .
4. det (A) = det (L) × det (U ) = 10.
5. A2 X = b =⇒ A (AX) = b. On pose AX = y donc la résolution se limite à
résoudre 
Ax = y
Ay = b
T
avec y = (3, −2, 1) (d’après 3.). Résoudre Ax = y ⇐⇒ LU x = y ⇐⇒

Lz = y
Ux = z
T 8 T
avec z ∈ R3 . Ainsi, z = (3, −8, −8) et x = − 57

5 , 4, 5 .
Exercice 2 :
1. On fait trois opérations élémentaires dans l’ordre suivant
R2 ← R2 − 2R1
R3 ← R3 − 3R1
R2 ↔ R3 .
Lcxes matrices élémentaires résultantes sont
     
1 0 0 1 0 0 1 0 0
L1 =  −2 1 0  , L2 =  0 1 0  , L2 =  0 0 1 .
0 0 1 −3 0 1 0 1 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 380 — #390


i i

380 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

2. Le membre de droite de la matrice augmentée obtenue aprés les trois opérations


est    
7 7
 −12  = L1 L2 L3  10  .
−4 9
Exercice 3 :
1. Par identification.
2. Pour trouver B, il suffit de permuter la première ligne et la deuxième ligne de la
matrice A. Donc la déduction de P :
   
0 1 0 1 2 0
P =  1 0 0  et B =  0 3 0 .
0 0 1 3 5 2

3. La factorisation LU de
  
1 0 0 1 2 0
B= 0 1 0  0 3 0 .
3 − 13 1 0 0 2

T T
4. (x, y, z) = − 23 , 13 , 13 .
Exercice 4 :
1. det A = 9 > 0 et les valeurs propres de A sont positives (3 et 1). Donc, A admet
une factorisation de Cholesky.
2. Par identification, la décomposition de Cholesky de la matrice A est donnée par :
 √  √ 1
√ 
2 √0 0 2 √0 2 2
A= √ 0 3 √0 √
 0 3 √0 √
.
1 1 1
2 2 0 2 2 3 0 0 2 2 3

3.
2
− 31
 
3 0
A−1 =  0 1
3 0 
− 13 0 2
3

Exercice 5 :
1. La factorisation
  
1 0 0 0 2 4 −4 −2
 2 1 0 0 
 0
 −1 2 −1 
LU = 
 
−2 −2 1 0  0 0 −1 −1 
−1 1 1 1 0 0 0 3

de la matrice A, où L est une matrice triangulaire inférieure à diagonale unité


et U est triangulaire supérieure.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 381 — #391


i i

19.6 Exercices 381

2. Une décomposition
   
1 0 0 0 2 0 0 0 1 2 −2 −1
2 1 0 0   0 −1 0 0   0 1 −2 1 
LDLT = 

  
 −2 −2 1 0  0 0 −1 0  0 0 1 1 
−1 1 1 1 0 0 0 3 0 0 0 1

de A où D est une matrice diagonale.


3. A n’admet pas une factorisation de Cholesky, puisque la matrice D doit avoir
des éléments strictement positives au niveau de la diagonale.
Exercice 6 :
2
1. Puisque det(A − λI) = − 14 (λ − 2) (2λ − 1) , alors λ1 = 2 > 0 et λ2 = 1
2 > 0.
Ainsi, A est symétrique définie positive.
    1 1 
1 1/2 1/2 1 0
√ 0 1 √
2 √
2
2.  1/2 1 1/2  =  12 12 √3 √0 √
 0 1
2 3 1

6 √ 3  , avec
1/2 1/2 1 1 1 1 1
2 6 3 3 2 3 0 0 3 2 3
 
1 0
√ 0
1 1
T = 2 √3 √0 √
.
2
1 1 1
2 6 3 3 2 3
  1 1    
1 0
√ 0 1 √
2 √
2 x1 b1
1 1 1 1
3.  2 2 √3 √0√   0 2 3 √
6 √ 3   x2  =  b2  =⇒
1 1 1 1 x3 b3
2 6 3 3 2 3 0 0 3 2 3

3 1 1
   
x1 2 b1 − 2 b2 − 2 b3
3 1 1
2 b2 − 2 b1 − 2 b3
 x2  =  .
3 1 1
2 b3 − 2 b2 − 2 b1
x3

Exercice 7 :
Aα = BB T la factorisation de Cholesky de Aα

0 ··· 0
 
2 α
. 
 α 2 . . . . . . .. 

 
Aα =  0 . . . . . . α 0 
 
 
 . .
 .. .. α

2 α 
0 ··· 0 α 2
 
d1 d1 c1

 c1 d2
d2 c2
 
 
 ..  .. ..

=  c2 . 
 . . .

..  
dn−1 cn−1

 . dn−1  
cn−1 dn dn

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 382 — #392


i i

382 Chapitre 19. Méthodes directes de résolution des systèmes linéaires

√ α α
1. Par identification, on a d21 = 2 et d1 c1 = α. Donc, d1 = 2 et c1 = d1 = √
2
.
2. On a
dk−1 ck−1 = α
c2k−1 + d2k = 2
ck dk = α.
q
Ainsi, pour k ≥ 2, dk = 2 − c2k−1 et ck = dαk .
3. La factorisation de Cholesky de la matrice A est donnée par :
 √  √ 1
√ 
√2 √0√ 0 0 2 √
2 √ 2 √0 √ 0
 1 2 1 2 3 0 0  0 1
2 3 1
2 3 0
2√ √ √ 3 √ √

A= 2  2 .
 0 1 2 2 1
3 2 3 3√ 3 0

 0 0 3 3 2 √3

1 1 1
0 0 2 3 2 5 0 0 0 2 5

Exercice 8 : (Résolution d’un système tridiagonal par la méthode de Thomas)


1. Soit le système linéaire : Ax = d ⇔
···
 
b1 c1 0 0    
 .. ..  x1 d1
a2 b2
 c2 . .  x2   d2 

0 . .. . .. . ..   
x3  =  d3

.
0 
 
  
x4   d4

 0 ... a
   
n−1 b n−1 cn − 1  x5 d5
0 ··· ··· an bn
La première équation permet d’exprimer x1 en fonction de x2 :
b1 x1 + c1 x2 = d1 .
Donc,
c1 d1
x1 = − x2 + .
b1 b1
D’où,
c1 d1
p1 = −
et q1 = .
b1 b1
De la même manière, on trouve p2 et q2 en fonction de p1 et q1 :
c2 d2 − a2 q1
p2 = − et q2 = .
b2 + a2 p1 b2 + a2 p1
2. Les relations de récurrence sont données par l’écriture de l’équation obtenue à la
k ème ligne :
ak xk−1 + bk xk + ck xk+1 = dk .
Ainsi,
ck dk − ak qk−1
pk = − et qk = .
bk + ak pk−1 bk + ak pk−1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 383 — #393


i i

19.6 Exercices 383

3. On a :
xn = pn−1 xn + qn−1 et an xn−1 + bn xn = dn .
D’où,
dn − an qn−1
xn = .
bn + an pn−1
4. La détermination des termes des suites (pk ) et (qk ) permet de remonter dans le
calcul de xk à partir de xk+1 .
5. Le système finale peut s’écrire sous la forme

P X = q (de taille n − 1)

avec
−p1 ···
 
1 0 0  
 .. ..  q1

 0 1 −p2 . . 


 q2 

P = .. .. .. .. ..
, q = 
   
 . . . . 0   . 

 .. .. ..   qn−1 
 . . . 1 −pn−2 
qn−1 + pn−1 xn
0 ··· ··· 0 1

et
dn − an qn−1
xn = .
bn + an pn−1
6. Application :
1
p1 = , q1 = −1
2
2
p2 = , q2 = −2
3
3
p3 = , q3 = −3
4
x4 = 16, x3 = 9, x2 = 4, x1 = 1.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 384 — #394


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 385 — #395


i i

CHAPITRE 20

Méthodes itératives de résolution des systèmes linéaires

20.1 Introduction
Les méthodes itératives sont conçu principalement pour résoudre de très grands
systèmes linéaires avec des matrices creuses, dont une grande partie des coefficients
sont nuls. Pour les grandes matrices creuses, les méthodes directes s’avèrent parfois
très coûteuses et les méthodes itératives peuvent offrir une alternative intéressante
et conduisent à des résultats mais avec une convergence lente (un nombre infini
d’itérations).

20.2 Définition et convergence


L’idée debase des méthodes itératives est de construire une suite convergente de
vecteurs X (k) telle que X = limk→∞ X (k) , où X est la solution de AX = b. La
condition :
(n)
X − X < 

devrait interrompre le calcul à la première itération n où  est une tolérance fixée et


k.k est une nome vectorielle donnée.
Comme la solution exacte n’est pas facilement pas connue, il va falloir définir un
autre critère d’arrêt.
Définition 20.2.1 Une méthode itérative de la forme :
 (0)
X donné
X (k+1) = BX (k) + f, k ≥ 0

est dite consistante avec AX = b si f et B sont tels que X = BX + f où


B ∈ Cn×n appelée matrice d’itération et f est un vecteur dépendant de b (le
second membre du système à résoudre). D’une manière équivalente, si f et B
satisfont
f = (I − B) A−1 b.

Remarque 20.2.1 La propriété de consistance n’est pas suffisante afin d’assurer la


convergence d’une méthode itérative, comme le montre l’exemple suivant :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 386 — #396


i i

386 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

Exemple 20.2.1 Résoudre 2Ix = b avec la méthode itérative


X (k+1) = −X (k) + b
qui est consistant.Cette suite n’est pas convergente pour une donnée initiale
arbitraire. Si par exemple x(0) = 0, alors x(2k) = 0 et x(2k+1) = b, k = 0, 1, . . . .
Par contre, si x(0) = 12 b, la méthode converge !
Théorème 20.2.1 (Convergence des méthodes itératives) Si la méthode
 (0)
X donné
X (k+1) = BX (k) + f, k ≥ 0

est consistante, la suite de vecteurs X (k) converge vers la solution de AX = b
pour toute donnée initiale X (0) si et seulement si ρ(B) < 1.

20.3 Méthodes itératives linéaires


On définit une méthode itérative linéaire consistante par la technique de décomposition
de la matrice A sous la forme
A=P −N
où P est une matrice inversible, appelée matrice de préconditionnement ou précondi-
tionneur.
Pour X (0) donné, on calcule X (k) , k ≥ 1 en résolvant le système
P X (k+1) = N X (k) + b, k ≥ 0
avec B = P −1 N (matrice d’itération) et f = P −1 b.
Autrement dit,
X (k+1) = X (k) + P −1 R(k) , k ≥ 0
avec R(k) = b − AX (k) appelé le résidu à l’itération k.
Ainsi, cette dernière relation nécessite la résolution d’un système linéaire de matrice
P à chaque itération. De plus, afin de minimiser le coût de clacul, P doit être "facile à
inverser".
Remarque 20.3.1 Si P = A et N = 0, la méthode converge en une itération, mais
avec le même coût qu’une méthode directe.
Dans ce qui suit, nous présentons quelques méthodes itératives linéaires classiques
tels que Jacobi, Gauss-Seidel, ...

20.4 La méthode de Jacobi


20.4.1 Transformation du système
Si les coefficients diagonaux de A sont non nuls, on peut séparer l’inconnue xi dans la
i-ème équation, et obtenir ainsi le système linéaire équivalent :
 
n
1 bi −
X 
Xi = aij Xj 
 , i = 1, . . . , n.
aii  j=1
j6=i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 387 — #397


i i

20.4 La méthode de Jacobi 387

20.4.2 Ecriture matricielle de la trnasformation


On peut décomposer la matrice A sous la forme

A=D−E−F

avec
– D : la matrice diagonale composée de la diagonale de A (dii = aii et dij = 0
∀1 ≤ i, j ≤ n et i 6= j).
– (−E) : la matrice triangulaire inférieure constituée par les éléments de A situées
en dessous de la diagonale

(eij = −aij , ∀1 ≤ i, j ≤ n et i > j).

– (−F ) : la matrice triangulaire supérieure constituée par les éléments de A situées


en dessus de la diagonale

(fij = −aij , ∀1 ≤ i, j ≤ n et i < j).

Le système s’écrit donc

AX = b ⇔ (D − E − F ) X = b.

X = D−1 (E + F ) X + D−1 b.
L’introduction de la matrice D−1 ne complique pas la résolution car l’inversion d’une
matrice diagonale est simple à réaliser.
Ainsi, la matrice d’itération de Jacobi est donnée par :

BJ = D−1 (E + F ) = I − D−1 A.

20.4.3 Itérations
Le passage de l’écriture matricielle à la formule itérative est immédiat, pour une
donnée initiale arbitraire X (0)
 
n
(k+1) 1  X (k) 
Xi = b i − aij Xj
 , i = 1, . . . , n.
aii  j=1

j6=i

20.4.4 Généralisation
Une généralisation de la méthode de Jacobi est la méthode de sur-relaxation (ou JOR,
pour Jacobi over relaxation), dans laquelle on se donne un paramètre de relaxation ω
et pour une donnée initiale arbitraire X (0) , on calcule X (k+1) selon la formule
 
n
(k+1) ω  bi −
X (k)  (k)
Xi =
aii 
aij Xj   + (1 − ω) Xi , i = 1, . . . , n.
j=1
j6=i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 388 — #398


i i

388 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

Ainsi, la matrice d’itération correspondante est donnée par :


BJω = ωBJ + (1 − ω) I.
De plus, la méthode JOR correspond à
X (k+1) = X (k) + ωD−1 R(k) , k ≥ 0
où R(k) = b − AX (k) .
Remarque 20.4.1 – Cette méthode est consistante pour tout ω 6= 0.
– Pour ω = 1, elle coïncide avec la méthode de Jacobi.

20.4.5 Convergence des méthodes de Jacobi et JOR


Définition 20.4.1 Soit A ∈ Cn×n , on dit que A = (aij )1≤i,j≤n est à diagonale
strictement dominante si et seulement si une généralisation de la méthode de
Jacobi est la méthode de sur-relaxation
n
X
∀1 ≤ i ≤ n, |aii | > |aij | .
j=1
j6=i

Lemme 20.4.1 Soit B ∈ Cn×n , alors les quatres propriétés suivantes sont équiva-
lentes :
1. B k tend vers 0, lorsque k tend vers +∞.
2. B k v tend vers 0 pour tout choix de v dans Cn , lorsque k tend vers +∞.
3. ρ(B) < 1.
4. kBk < 1 pour au moins une norme matricielle subordonnée.
Théorème 20.4.1 Soit A une matrice à diagonale strictement dominante, alors la
méthode de Jacobi pour la résolution d’un système linéaire de matrice A est
convergente.
Preuve On sait que A = P − N = D − E − F et aii > 0 pour 1 ≤ i ≤ n. Donc, D
est inversible. De plus, A est une matrice à diagonale strictement dominante si
n
X
et seulement si ∀1 ≤ i ≤ n, |dii | = |aii | > |aij | . Ainsi,
j=1
j6=i

 a
− aij si i 6= j
BJ = D−1 (E + F ) = BJij =

ii
0 sinon
et
n n
X X aij
kBJ k∞ = max BJij = max

aii
1≤i≤n 1≤i≤n
j=1 j=1
n
n
X
aij
= max 1
X
= max aii 1≤i≤n aii |aij | .
1≤i≤n
j=1 j=1

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 389 — #399


i i

20.5 La méthode de Gauss-Seidel 389

Donc, kBJ k∞ < 1. On en déduit d’après le lemme précédent que

ρ(BJ ) < 1.

D’où, la méthode de Jacobi est convergente.


Théorème 20.4.2 Si A et 2D−A sont symétriques définies positives, alors la méthode
de Jacobi est convergente.
Théorème 20.4.3 Si A est symétrique définie positive, alors la méthode de JOR est
convergente si
0 < ω < 2/ρ D−1 A .


Théorème 20.4.4 Si la méthode de Jacobi converge, alors la méthode JOR converge


pour
0 < ω ≤ 1.

20.5 La méthode de Gauss-Seidel


La méthode de Gauss-Seidel diffère de la méthode de Jacobi par le fait qu’à la
(k+1)
(k + 1)-ème étape les valeurs Xi déjà calculées sont utilisées pour mettre à jour la
solution.
Ainsi, pour une donnée initiale arbitraire X (0) ,
 
i−1 n
(k+1) 1 bi −
X (k+1)
X (k)
Xi = aij Xj − aij Xj  , i = 1, . . . , n.
aii j=1 j=i+1

Cette méthode revient à effectuer la décomposition suivante de A :

P = D − E, N = F

et la matrice d’itération associée est


−1
BGS = (D − E) F.

20.5.1 Généralisation
Une généralisation par analogie avec ce qui a été fait pour les itérations de Jacobi, on
introduit la méthode de sur-relaxation successive (ou méthode SOR pour successive
over relaxation)
 
i−1 n
(k+1) ω bi −
X (k+1)
X (k) (k)
Xi = aij Xj − aij Xj  + (1 − ω) Xi , i = 1, . . . , n.
aii j=1 j=i+1

Ainsi, sous forme vectorielle :

I − ωD−1 E X (k+1) = (1 − ω) I + ωD−1 F X (k) + ωD−1 b.


  

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 390 — #400


i i

390 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

D’où, la matrice d’itération


−1 
B(ω) = I − ωD−1 E (1 − ω) I + ωD−1 F

 −1  
1 1−ω
= D−E I +F .
ω ω

Ainsi,
 −1
(k+1) (k) 1
X =X + D−E R(k) , k ≥ 0
ω

où R(k) = b − AX (k) .

Remarque 20.5.1 – La méthode SOR est consistante pour tout ω 6= 0.


– La méthode SOR coïncide avec la méthode de Gauss-Seidel pour ω = 1.
– Si ω ∈ ]0, 1[ , la méthode est appelée méthode de sous-relaxation et méthode
de sur-relaxation si ω > 1.

20.5.2 Convergence des méthodes de Gauss-Seidel et SOR

Théorème 20.5.1 Soit A une matrice à diagonale strictement dominante, alors la


méthode de Gauss-Seidel pour la résolution d’un système linéaire de matrice A
est convergente.
Théorème 20.5.2 On a
ρ(B(ω)) ≥ |ω − 1| ∀ω ∈ R.

La méthode SOR ou de relaxation diverge donc si ω ≤ 0 ou ω ≥ 2.


Preuve Si {λi } désigne l’ensemble des valeurs propres de la matrice d’itération B(ω)
de SOR, alors

Yn h −1 i
det (B(ω)) = λi = det (1 − ω) I + ωD−1 F det I − ωD−1 E
 
.


i=1

−1
Or, on peut vérifier que I − ωD−1 E est triangulaire inférieure à diagonale
unité et (1 − ω) I + ωD−1 F est triangulaire supérieure dont la diagonale est
identique à celle de la matrice (1 − ω) I. D’où,

Yn
n
det (B(ω)) = λi = (1 − ω) .


i=1

Par conséquent, au moins une valeur propre λi est telle que |λi | ≥ |1 − ω|. Pour
avoir convergence, il est donc nécessaire que |1 − ω| < 1, c’est-à-dire 0 < ω < 2.
Théorème 20.5.3 (Ostrowski) Si A est symétrique définie positive, alors la mé-
thode SOR ou de relaxation converge si et seulement si 0 < ω < 2.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 391 — #401


i i

20.6 Exercices 391

20.6 Exercices
20.6.1 Enoncés
Exercice 1 :
Soit a ∈ R et  
1 a a
A= a 1 a .
a a 1
1. Déterminer la matrice d’itération relative à la méthode de Jacobi BJ .
2. Vérifier que λ = a est une valeur propre de BJ .
3. En déduire les autres valeurs propres de BJ .
4. Pour quelles valeurs de a, la méthode de Jacobi converge-t-elle ?
Exercice 2 :
On s’intéresse à la résolution du système linéaire

 4x + y = 5
x + 4y + z = 6
y + 4z = 5

T
Si x(0) = (0, 0, 0) est le vecteur initial choisi, quelles sont les valeurs x(1) après un
pas de Jacobi et de x(2) après deux pas de Jacobi ?
Exercice 3 :
La matrice A d’un système linéaire AX = B peut s’écrire sous la forme A =
D − E − F où
– D est la matrice composée de la diagonale de A.
– −E est une matrice triangulaire inférieure composée des éléments de la matrice
A situés en dessous de la diagonale.
– −F est une matrice triangulaire inférieure composée des éléments de la matrice
A situés au dessus de la diagonale.
1. Montrer que X = C + M X avec C et M sont des matrices qu’on exprimera en
fonction de D−1 , B, E et F.
2. On veut résoudre par la méthode itérative de Jacobi (X (k+1) = C + M X (k) où
X (k+1) signifie la valeur de X à l’itération k + 1) le système suivant

 4x + 2y = 64
x + 4y + 2z = 84
y + 5z = 77

a. Définir les matrices D et B qui interviennent dans la méthode de Jacobi.


b. Calculer X (0) = D−1 B.
c. Prendre X (0) comme valeur de départ pour trouver la solution X (1) après
une itération.
d. Calculer la solution exacte et en déduire l’erreur relative commise si on
utilise la solution approchée X (1) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 392 — #402


i i

392 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

e. La méthode de Jacobi converge t-elle ?


Exercice 4 :
Soient les matrices suivantes :
   
1 2 −2 2 −1 1
A= 1 1 1 , B =  2 2 2 .
2 2 1 −1 −1 2

1. Pour quel système, la méthode de Jacobi converge-t-elle ?


2. Pour quel système, la méthode de Gauss-Seidel converge-t-elle ?
Exercice 5 :
1. Soit A = (aij ) uneP
matrice carrée réelle d’ordre n strictement diagonalement
dominante |aii | > i6=j |aij | pour 1 ≤ i ≤ n. Démontrer que la méthode de
Jacobi converge.
2. Sachant que Lω est la matrice de relaxation et que λi sont les valeurs propres
correspondantes.
Qn
a. Montrer que ρ(Lω ) ≥ |ω − 1| en remarquant que i=1 λi = det(Lω ).
b. En déduire une condition nécessaire de convergence de la méthode de
relaxation.
Exercice 6 :
Soient A ∈ R2×2 et b ∈ R2 . La solution du systéme AX = b s’interprète géometri-
quement comme le point d’intersection de deux droites :

(D1 ) a11 x1 + a12 x2 = b1 ,


(D2 ) a21 x1 + a22 x2 = b2 .

On suppose que a11 6= 0 et a22 6= 0.


1. Calculer les matrices des méthodes de Jacobi et de Gauss-Seidel associées à ce
système.
2. Calculer les rayons spectraux de ces matrices. Que remarque-t-on ?
3. Calculer les rayons spectraux des matrices des méthodes de Jacobi et de Gauss-
Seidel associées au système obtenu en permutant les deux équations ci-dessus.

20.6.2 Corrigés
Exercice 1 :
 
0 −a −a
1. On a D = I, E + F =  −a 0 −a  . Alors,
−a −a 0
 
0 −a −a
BJ =  −a 0 −a  .
−a −a 0

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 393 — #403


i i

20.6 Exercices 393

2. Calculons le polynôme caractéristique de BJ :


PBJ (λ) = det (BJ − λI) = −λ3 + 3a2 λ − 2a3 .


Ainsi, PBJ (a) = 0.


 2
3. PBJ (a) = −λ3 + 3a2 λ − 2a3 = − (2a + λ) (a − λ) . Donc, les valeurs propres
de Bj sont a et −2a.
4. La méthode de Jacobi converge si et seulement si le rayon spectral
ρ (BJ ) < 1.
C’est à dire pour − 12 < a < 21 .
Exercice 2 :
5
 
4
3
On applique les itérations de Jacobi : x(1) =  2
 après un pas de Jacobi et
5
4
7
 
8
7
x(2) =  8
 après deux pas de Jacobi.
7
8
Exercice 3 :
1. X = C + M X avec C = D−1 B et M = D−1 (E + F ).
2. On veut résoudre par la méthode itérative de Jacobi (X (k+1) = C + M X (k) où
X (k+1) signifie la valeur de X à l’itération k + 1) le système suivant

 4x + 2y = 64
x + 4y + 2z = 84
y + 5z = 77

, Solution is : [x = 10, y = 12, z = 13]


   
4 0 0 64
a. D =  0 4 0  et B =  84 .
0 0 5 77
 1    
4 0 0 64 16
b. Calculer X (0) = D−1 B =  0 14 0   84  =  21  .
77
0 0 15 77 5
c.
X (1) = C + M X (0)
= C + M X (0) = D−1 B + D−1 (E + F ) X (0)
 
   −1   
16 4 0 0 0 −2 0 16
=  21  +  0 4 0   −1 0 −2   21 
77 77
5 0 0 5 0 −1 0 5
 11 
2
93 .
= 10
56
5

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 394 — #404


i i

394 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

 
10
d. La solution exacte X =  12  et
13

∆x 10 − 11 ∆y 12 − 93
2 10
= = 45%, = = 22.5%
x 10 y 12

et
∆z 13 − 56
5
= = 14%.
z 13
3
√ 3

e. Les valeurs propres de BJ sont − 20 10 = −0.474 34, 20 10 = 0.474 34 et
0. Puisque, ρ (BJ ) = 0.474 34 < 1 alors la méthode de Jacobi converge.

Exercice 4 :
Soient les matrices suivantes :
   
1 2 −2 2 −1 1
A= 1 1 1 , B =  2 2 2 .
2 2 1 −1 −1 2

1. Pour le système de matrice A, la méthode de Jacobi converge et la méthode de


Gauss-Seidel ne converge pas. En effet,
 
0 −2 2  
(A) (A)
BJ =  −1 0 −1  et ρ BJ = 0 < 1.
−2 −2 0
1
− 12
 
0 2   1√
(B) (A)
BJ =  −1 0 −1  et ρ BJ = 5 = 1. 118 ≮ 1.
1 1 2
2 2 0

2. Pour le système de matrice B, la méthode de Gauss-Seidel converge et la méthode


de Jacobi ne converge pas.
 
0 −2 2  
(A) (A)
BGS = 0 2 −3  et ρ BGS = 2 ≮ 1.
0 0 2
1
− 12
 
0 2   1
(B) (A)
BGS = 0 − 21 − 12  et ρ BJ = < 1.
2
0 0 − 12

Exercice 5 :

1. Soit A = (aij ) une


Pmatrice carrée réelle d’ordre n à diagonale strictement
dominante |aii | > i6=j |aij | pour 1 ≤ i ≤ n. Démontrer que la méthode de

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 395 — #405


i i

20.6 Exercices 395

Jacobi converge. En effet,


1
 
a11
 1 
 a22 
BJ = D−1 (E + F ) avec D = 
 .. 
 et
 . 
 1 
 an−1,n−1 
1
an,n

−a12 ··· ··· −a1n


 
0
 .. 
 −a21
 0 . −a2n 

E+F = .. .. .. .. ..
.
 
 . . . . . 
 .. 
 −an−1,1 . 0 −an−1,n 
−an,1 ··· ··· −an,n−1 0

Ainsi,

− aa12 − aa1n
 
0 11
··· ··· 11
 .. 

 − aa2122
0 . − aa2n22

  aij
 .. .. .. .. ..  − aii si i 6= j
BJ =  . . . . . =
  0 si i = j

an−1,1 .. a

 − an−1,n−1
 . 0 n−1,n
− an−1,n−1


an,1 a
− an,n ··· · · · − n,n−1
an,n 0
P
|aij |
Or, kBJ k∞ = maxi i6|a=ii
j
| < 1. D’où, ρ (BJ ) < 1. Conclusion : La méthode
de Jacobi est convergente.
2. (a. et b.) Voir Cours.

Exercice 6 :
Soient A ∈ R2×2 et b ∈ R2 . La solution du systéme AX = b s’interprète géometri-
quement comme le point d’intersection de deux droites :

(D1 ) a11 x1 + a12 x2 = b1 ,


(D2 ) a21 x1 + a22 x2 = b2 .

On suppose que a11 6= 0 et a22 6= 0.


− aa12 − aa11
   
0 0 12

1. BJ = 11 et BGS = .
− aa21
11
0 0 − aa11
12 a21
a22
r
2
2. ρ (BJ ) = aa12
a21 a12 a21
11 a22
et ρ (B GS ) = a11 a22 .Donc, ρ (BJ ) = ρ (BGS ) . Lorsque les
deux méthodes sont convergentes alors la méthode de Gauss-Seidel converge
plus rapidement que la méthode de Jacobi.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 396 — #406


i i

396 Chapitre 20. Méthodes itératives de résolution des systèmes linéaires

3. Après permutation des lignes et en supposant a12 a21 6= 0, on a


s
a11 a22 a11 a22
ρ (BJ ) = et ρ (BGS ) =
.
a12 a21 a12 a21

Ainsi, les rayons spectraux sont les inverses des précédents.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 397 — #407


i i

CHAPITRE 21

Résolution des équations non linéaires

21.1 Introduction
Supposons que nous désirons connaître les racines réelles de l’équation non linéaire
f (x) = 0 à coefficients réels. La résolution numérique nécessite de connaitre un
encadrement de la racine à déterminer. Nous devons déterminer un intervalle [a, b]
contenant la racine et ne contenant que cette racine. Malheureusement, il n’existe pas
de méthodes systématique et simple pour déterminer cet intervalle. Les deux méthodes
les plus utilisés sont :
– La représentation graphique de y = f (x) .
– L’assimilation de f (x) à la différence de deux fonctions
f (x) = h (x) − g (x) .
Définition 21.1.1 Une racine impaire correspond à la traversée de l’axe de x par la
courbe y = f (x) .

Selon le shéma ci-dessus, une racine impaire correspond à f (a) f (b) < 0.
Remarque 21.1.1 Si la racine est paire, on démentre que cette même racine est une
racine impaire de l’équation dérivée f 0 (x) = 0.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 398 — #408


i i

398 Chapitre 21. Résolution des équations non linéaires

21.2 Méthodes à base géométrique


Nous cherchons la racine comme intersection de la courbe y = f (x) et l’axe des x.

21.2.1 Méthode des intervalles (ou de dichotomie ou de bissection)


Hypothèse de la méthode
Cette méthode nécessite la connaissance de l’intervalle [a, b] contenant une seule racine,
et une racine impaire :

∃! racine de f (x) = 0 dans [a, b]
f (a) f (b) < 0.

Remarque 21.2.1 Dans le cas où la racine cherchée n’est pas impaire, on résoud
l’équation f 0 (x) = 0 en faisant attention à l’intervalle [a, b] car il peut contenir
plusieurs racines comme indique l’exemple suivant :


 ∃! racine de f (x) = 0 dans [a, b]
f (a) f (b) > 0 racine paire
3 racines de f 0 (x) = 0 dans [a, b] .

Principe de la méthode
Nous savons qu’il existe une racine dans l’intervalle [a, b] .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 399 — #409


i i

21.2 Méthodes à base géométrique 399

Nous introduisons un ou plusieurs points c, d, . . . à l’intérieur de l’intervalle [a, b] pour


mieux encadrer la racine.
Si on introduit un seul point c, en général au milieu de l’intervalle, soit

a+b
c= ,
2
la méthode est appelée "méthode de dichotomie". Cette méthode est utilisée dans le
calcul par ordinateur :
– Si f (c) f (a) < 0, on réduit l’intervalle à [a, c] (b ←− c) .
– Si f (c) f (a) > 0, on réduit l’intervalle à [c, b] (a ←− c) .

– On recommence (comme l’exemple ci-dessus) avec le nouveau intervalle jusqu’à


ce que la largeur de l’intervalle soit inférieure à  : |a − b| <  ou |a−b|
|a| < .

Critique de la méthode
– Cette méthode consomme très peu de mémoires.
– Le temps de calcul dépend de l’expression de f (x) , mais en général le temps de
calcul est assez court. Ce temps dépend du tet d’arrêt. Plus  est petit, plus le
temps est long. Il n’y a pas de limitation de la précision.
– On peut déterminer le nombre d’itérations nécessaire : à chaque itération, la
largeur de l’intervalle est divisée par 2. Ainsi, pour a et b fixes, on atteint la
précision imposée après n itérations tel que

|a − b|
< .
2n

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 400 — #410


i i

400 Chapitre 21. Résolution des équations non linéaires

|a−b|
En effet, soit  = 2n ⇔ ln |a−b|
 = n ln 2. Donc,

ln |a−b|

n= .
ln 2

21.2.2 Méthode des parties proportionnelles (ou de la corde ou de Newton)


Hypothèse
On a besoin des mêmes hypothèses que dans la méthode précédente.

Principe de la méthode
Elle consiste à approcher la racine cherchée en remplaçant la fonction y = f (x) par
une droite.

On joint les deux points A (a, f (a)) et B (b, f (b)) par une droite. Le point c obtenu
donne une valeur approchée de la racine. On va s’en servir pour réduire l’intervalle
et on reprond la méthode sur l’intervalle [a, c] . On obtient ainsi une suite de points
c1 , c2 , . . . , cn qui se rapprochent de la racine.

Conduite des calculs


L’équation de la droite (AB) est donnée par

f (a) − f (b)
y − f (x) = (x − a) .
b−a
L’intersection de cette droite avec l’axe des x est donnée par

y=0
y = f (a)−f
b−a
(b)
(x − a) + f (x) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 401 — #411


i i

21.2 Méthodes à base géométrique 401

Soit
b−a af (b) − bf (a)
c = a − f (a) = .
f (b) − f (a) f (b) − f (a)
Dans le shéma utilisé pour imposer le principe de la méthode, on a dessiné
une fonction ne représentant pas des points d’inflexion dans l’intervalle [a, b] . Une
complication appraît dans le cas contraire :

Les points c1 , c2 , . . . , cn ne sont pas tous du même côté de la racine. On doit alors
prévoir ces alternances.
Les encadrements successifs consuisent dans tous les cas après un certain nombre
d’itération à un intervalle ne contenant plus de point d’inflexion. A partir de ce
momemnt les valeurs c1 , c2 , . . . , cn se trouvent toutes du côté concave de la courbe et
tendent vers la racine de ce côté.
Ainsi définie, cette méthode ne permet pas de connaître la précision sur le résultat
obtenu puisqu’on n’a pas un encadrement de plus en plus petit de la racine. Ce
problème est résolu en insérant un test de la forme :
– f c − 2 fc + 2 < 0, 
 
si on s’intéresse à l’incertitude absolu.
– f c 1 + 2 f c 1 − 2 < 0, si on s’intéresse à l’incertitude relative.

Critique de la méthode
– Faible capacité de mémoire.
– Un temps de calcul en général plus petit par rapport à la méthode précédente.
– Pas de limitation sur la précision.

21.2.3 Méthode de la tangente ou de Raphson-Newton


Hypothèse de la méthode
On doit avoir un intervalle [a, b] (pas de condition sur la parité) contenant une seule
racine et ne contenant pas de point d’inflexion (f 00 (x) 6= 0 sur [a, b]) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 402 — #412


i i

402 Chapitre 21. Résolution des équations non linéaires

Hyposthèse de la méthode

Au lieu d’utiliser la corde pour obtenir une valeur approchée de la racine, on prend la
tangente à la courbe à une extrimité de l’intervalle :

Par une extrimité de la courbe, soit par exemple A, on mène la tangente à la courbe.
L’intersection de cette tangente avec l’axe des x, donne une valeur approchée de la
racine soit c. On utilise c pour réduir el’intervalle et on recommence avec [c, b] .

Conduite des calculs

L’équation de la tangente en A est

y − f (a) = f 0 (a) (x − a) .

L’intersection de cette droite avec l’axe des x est y = 0. Ainsi,

f (a)
c=a− .
f 0 (a)

Remarque 21.2.2 Dans certain cas, le point C a une abscisse c en dehors de [a, b] . Il
faut donc tester cette éventualité. Dans ce cas où elle apparaît, la tangente menée
de l’autre extrimité conduit forcément à un point à l’intérieur de l’intervalle [a, b]
car cet intervalle ne contenant pas un point d’inflexion.

Comme dans la méthode de la corde, la méthode donne valeurs c1 , c2 , . . . , cn qui


tendent vers la racine mais toujours du même côté de cette racine. On utilise donc le
même test d’arrêt que dans la méthode de la corde :
   
f c− f c+ < 0.
2 2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 403 — #413


i i

21.3 Méthodes itératives 403

Critique d ela méthode


– Faible capacité de mémoire.
– Temps de calcul plus court que dans la méthode de la corde.
– Pas de limitation de la précision.
– Cette méthode donne un résultat lorsque la racine est paire.

21.3 Méthodes itératives


21.3.1 Hypothèses
– Il existe une seule racine dans [a, b] .
– Racine impaire (f (a) f (b) < 0) .
– f 0 (x) ne s’annule pas dans [a, b] (pas d’extremum).
– Condition de convergence (à déterminé).

21.3.2 Principe de la méthode


– On transforme f (x) = 0 en une équation ayant les mêmes racines, s’écrivent
sous la forme
g (x) = x.

– On choisit une valeur de départ x0 ∈ [a, b] .


– On effectue une suite de calcul de même type - itération - qui consistent à générer
des nombres x1 , x2 , . . . , xn .
x1 = g (x0 )

Si x0 est une racine de f , on trouve g (x0 ) = x0 . Mais en général, ce n’est pas le


cas car x0 est choisi arbitrairement. On effectue alors les itérations :

x1 = g (x0 )
x2 = g (x1 )
x3 = g (x2 )
..
.
xn+1 = g (xn )

– On montre que la suite x1 , x2 , . . . , xn tend vers une limite x∗ qui est solution de
l’équation.

21.3.3 Théorème de convergence


On va traiter la convergence de la suite {xn } définie par

x0
xn+1 = g (xn ) .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 404 — #414


i i

404 Chapitre 21. Résolution des équations non linéaires

Pour ce faire, on construit la suite {un } tel que



u0 = x0
un = xn − xn−1 .

On fabrique aussi la série {vn } tel que


n
X
vn = uj = u0 + u1 + · · · + un = xn .
j=0

Ainsi, l’étude de convergence de {xn } ≡ l’étude de convergence de {vn } .


En appliquant le critère d’Alembert : vn converge si et seulement si

un
un−1 < 1.

C’est à dire
xn − xn−1
xn−1 − xn−2 < 1


g (xn−1 ) − g (xn−2 )
< 1.
xn−1 − xn−2

Donc,
(xn−1 − xn−2 ) g 0 (ξn−1 )

< 1.
xn−1 − xn−2

Ainsi,
|g 0 (ξn−1 )| < 1, pour ξn−1 ∈ [xn−2 , xn−1 ] .

Comme ξn−1 sont inconnus, nous allons imposer que

∀x ∈ [a, b] , |g 0 (x)| < 1.

C’est une condition plus restrictive (suffisante) pour la convergence.


– Si de plus g est continue dans [a, b] , on peut effectuer le passage à la limite

g (xn ) = xn+1 −→ g (x∗ ) = x∗

et par suite, la limite de la suite xn est la solution cherchée.


D’où, le théorème de convergence :
Une condition suffisante de convergence du processus itératif est :
– la fonction g est continue dans [a, b] .
– |g 0 (x)| < 1, ∀x ∈ [a, b] .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 405 — #415


i i

21.4 Exercices 405

21.4 Exercices
21.4.1 Enoncés
Exercice 1 :
On considère la méthode de la bissection pour chercher une racine de

f (x) = 0.

Le principe de cette méthode consiste à sélectionner un intervalle [x1 , x2 ] encadrant


une seule racine impair, de calculer y1 = f (x1 ) et y2 = f (x2 ) et de commencer les
calculs itératives xM = x1 +x
2
2
, yM = f (xM ). Si y1 yM < 0 alors x2 = xM , y2 = yM
sinon x1 = xM , y1 = yM , jusqu’à atteindre la précision  souhaitée.
1. Calculer le nombre d’itérations nécessaire pour obtenir une précision .
2. En utilisant la méthode de la bissection, calculer le nombre d’itération nécessaire
pour chercher la racine carré de 2 en prenant un intervalle x1 = 1 et x2 = 2 et
 = 10−3 .
Exercice 2 :
On considère l’équation

ex − (x − 5) = 0 (E)

1. Déterminer le nombre et la position approximative des racines de (E) situées


dans x ≥ 0.
2. Utiliser l’algorithme de bissection pour déterminer chacune des racines a 10−7
près.
3. Sans faire d’itérations, déterminer combien vous devriez en faire pour calculer la
racine la plus proche de 1 à l’aide de la bissection, avec une précision de 10−8 en
partant de l’intervalle [1; 2].
Exercice 3 :
On considère l’équation
ln (1 + x) = x2 .
1. Montrer que cette équation possède deux racines réelles dont une est évidente.
On appelle α l’autre racine.
1
2. Localiser α dans un intervalle de longueur 16 .
Exercice 4 :

On considère la fonction f (x) = ex + 3 x − 2 sur l’intervalle [0; 1] .
1. Montrer qu’il existe un zéro α pour la fonction f dans [0; 1] et qu’il est unique.
2. On veut calculer le zéro α de la fonction f par une méthode de point fixe
convenable. En particulier on se donne deux méthodes de point x = Φi (x) ,
i = 1, 2, où les fonctions Φ1 et Φ2 sont définies comme :
2
√  (2 − ex )
Φ1 (x) = ln 2 − 3 x et Φ2 (x) = .
9

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 406 — #416


i i

406 Chapitre 21. Résolution des équations non linéaires

Laquelle entre ces deux méthodes utiliseriez-vous pour calculer numériquement


le zéro α de la fonction f ? Justifez votre réponse.
3. En utilisant la méthode de la bissection sur l’intervalle [0; 1], estimer le nombre
d’itérations nécessaires pour calculer le zéro α de la fonction f avec une tolérance
tol = 10−10 .
Exercice 5 :
On veut calculer les racines de
1
f (x) = cos x − .
chx
1. Montrer que f est bornée.
2. Calculer f (0).
3. Localiser les deux racines les plus proches de 0 dans un intervalle de longueur π2 .
4. Appliquer l’algorithme de la méthode de dichotomie en prenant comme intervalle
de départ [π; 2π] et trouver la racine de f (x) dans cet intervalle après 3 itérations.
Exercice 6 :
1. Montrer que la méthode itérative définie par
 
1 1
xk+1 = x2k + , x0 donnée
2 4

admet deux points fixes ζ1 et ζ2 tels que

0 < ζ1 < 1 < ζ2 .

2. Montrer que
1
xk+1 − ζ1 = (xk + ζ1 ) (xk − ζ1 ) , k = 1, 0, ...
2
3. En déduire que si 0 < x0 < ζ2 , alors limk→∞ xk = ζ1 .

21.4.2 Corrigés
Exercice 1 :
1. Soit N le nombre d’itérations nécessaire pour trouver x tel que f (x) = 0 avec la
précision  et comme test d’arrêt : |IN | < .

Itération 0 : I0 = x2 − x1
x2 − x1
Itération 1 : I1 =
2
x2 + x1
Itération 2 : xM =
2
x2 −xM x2 −x1
soit x1 = xM ou x2 = xM . I2 = 2 = 4 .
x2 − x1
I2 = .
4

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 407 — #417


i i

21.4 Exercices 407

x2 − x1
Itération 3 : I3 =
8
..
.
x2 − x1
Itération N : IN = .
2N

Ainsi,
ln x2 −x

x2 − x1 
1

|IN | =
<⇔N > .
2N ln 2

ln( 1−3 )
2. Pour  = 10−3 ⇒ N > 10
ln 2 = 9.9658. Il suffit de choisir alors N = 10
itérations.

Exercice 2 :
On pose f (x) = ex − (x + 5) = 0

1. En utilisant la méthode géométrique : tracer y = ex et y = x + 5.

La racine de f (x) = 0 est le projeté sur l’axe des abscisses où les courbes se
coupent (situées dans x ≥ 0). Aisni, d’après le graphe, il existe une unique racine
de f (x) = 0 dans R+ , plus précisément sur [0, 2] .
2. L’algorithme de la bissection :

(a) xr ∈ [0, 2] ,  = 10−7 , x0 = 0 et x0 = 2.


x0 +x1
(b) Calculer x2 = 2 et f (x2 )
(c) Si f (x2 ) f (x0 ) < 0, xr ∈ [x0 , x2 ] et x1 ←− x2 sinon xr ∈ [x2 , x1 ] et
x0 ←− x2
x0 +x1
(d) Si |x1 − x0 | ≤ 2 xr ←− 2 sinon revenir à b.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 408 — #418


i i

408 Chapitre 21. Résolution des équations non linéaires

En appliquant cet algorithme sur machine, on obtient


Itération x0 x1 x2 f (x2 )
0 0 2 1 −3.2817
1 1 2 1.5 −2.0183
2 1.5 2 1.75 −9.954 × 10−1
.. .. .. .. ..
. . . . .
14 1.936768 1.93689 1.936829 −1.1158 × 10−4
15 1.936829 1.93689 1.936859 6.9602 × 10−5
.. .. .. .. ..
. . . . .
22 1.936847 1.936848 1.936847 2.4418 × 10−7
23 1.936847 1.936847 1.936847 −4.6355 × 10−7

Ainsi, l’approximation de la racine à 10−7 près : 1.936847. L’approximation finale est


donnée par 1.9368473291.
3.  = 10−8 sur [1; 2] . Trouver n tels que
|2 − 1|
<  = 10−8 ?
2n
Ainsi, il suffit d’établir n = 27 itérations.
Exercice 3 :
On pose f (x) = ln (1 + x) − x2 = 0
1. On remarque que x = 0 est la racine évidente. En utilisant la méthode géomé-
trique : tracer y = ln (1 + x) et y = x2 .

La deuxième racine α est située dans 12 , 1 .


 

2. On calcul f 21 = 0.15547, f 12 + 16 1 1 2


  
= 0.12988, f 2 + 16 = 9.4883 ×
−2 1 3 −2 1 4 −3

10 , f 2 + 16  = 5.0592 × 10 , f 2 + 16 = −2.8842 × 10 . On remar-
quant f 12 + 16 3
> 0 et f 12 + 16
4
< 0, α est Localisée dans un intervalle de
1
longueur 16 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 409 — #419


i i

21.4 Exercices 409

Exercice 4 :

On considère la fonction f (x) = ex + 3 x − 2 sur l’intervalle [0; 1] .
1. f est continue, dérivable sur [0; 1] et f 0 (x) = ex + 2√
3
x
> 0. Alors, f est srictement
croissante sur ]0, 1[ . De plus,

f (0) = −1 < 0 et f (1) = e + 1 > 0.

Donc, il existe un unique α ∈ ]0, 1[ tel que f (α) = 0.


2. Il faut vérifier que α est un point fixe pour Φ1 et Φ2 . En effet,
√ 
Φ1 (α) = ln 2 − 3 α = ln (eα ) = α

et √ 2
2
(2 − eα ) (3 α)
Φ2 (α) = = = α (α > 0) .
9 9
√ √
(a) On commence par Φ1 (x) = ln (2 − 3 x) . Pour x ≥ 0, 2 − 3 x ≥ 0 alors
0 ≤ x ≤ 49 . Donc, 4 4
  
 4  Φ1 est définie sur 0, 9 . Φ1 est continue sur 0, 9 ,
dérivable sur 0, 9 ,
 
3 4
|Φ01 (x)| = √ , ∀x ∈ 0, .
4 x − 6x 9

On voit que |Φ01 (x)| tends vers +∞ quand x −→ 0 et |Φ01 (x)| tends vers
+∞ quand x −→ 49 , donc on cherche le minimum de Φ01 dans 0, 49 . On
résout alors √
0 0 6 (1 − 3 x)
|Φ1 (x)| = √ √ 2 = 0.
x (4 x − 6x)

Alors, pour x = 19 , Φ01 91 = 92 > 1 et pour tout x ∈ 0, 49 , |Φ01 (x)| > 1.
  

Donc, la méthode du point fixe pour Φ1 ne converge pas.


x 2
(b) Par contre, pour Φ2 (x) = (2−e9 ) . Φ2 est continue, dérivable sur ]0, 1[ et
2 (2 − ex ) (−ex ) 2e (e − 2)

0
|Φ2 (x)| =

<
< 1.
9 9

Ainsi, il existe K = 2e(e−2)


9 < 1 tel que |Φ02 (x)| ≤ K, ∀x ∈ [0, 1] . Donc, la
méthode du point fixe pour Φ2 est à choisir.
3. tol = 10−10 sur [1; 2] . Trouver n tels que

|1 − 0|
< tol = 10−10 ?
2n
Ainsi, il suffit d’établir n = 34 itérations.
Exercice 5 :
1
Soit f (x) = cos x − chx .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 410 — #420


i i

410 Chapitre 21. Résolution des équations non linéaires

1. On vérifie facilement que f est bornée sur R :


1
−2 ≤ cos x − ≤ 1.
chx
2. f (0) = 0 (0 est une racine de f ).
1
3. En utilisant la méthode géométrique : tracer y = cos x et y = chx .

 x1 3π
Les deux racines et x2 les plus proches de 0 sont Localisées respectivement
sur −2π, − 3π2 et 2 , 2π .

(a) 1ère itération (a = π, b = 2π) : f (π) = −0.94 et f (2π) = 0.996 ⇒ c = 2
et f (c) = −0.18.
(b) 2ème itération (a = 3π 7π
2 , b = 2π) ⇒ c = 4 et f (c) = 0.699.
(c) 3ème itération (a = 2 , b = 4 ) ⇒ c = 13π
3π 7π
8 ' 5.1.
Exercice 6 :
1 1
, x0 donnée. On a x = 12 x2 + 41 =⇒ et
 
1. Soit xk+1 = 2 x2k + 4
√ √
3 3
ζ1 = 1 − ' 0.1339 et ζ2 = 1 + ' 1.866.
2 2
Donc
0 < ζ1 < 1 < ζ2 .
ζ1 est un point fixe donc ζ1 = 21 ζ12 + 14 ⇔ −ζ12 = −2ζ1 + 14 . Ainsi,

2.
 
1 2 1
xk+1 − ζ1 = xk + − ζ1
2 4
 
1 2 1
= xk − 2ζ1 +
2 4
1 2
x − ζ12

=
2 k
1
= (xk + ζ1 ) (xk − ζ1 ) , k = 1, 0, ...
2

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 411 — #421


i i

21.4 Exercices 411

1
3. On a xk+1 − ζ1 = 2 (xk + ζ1 ) (xk − ζ1 ) alors

|xk+1 − ζ1 | 1
= (xk + ζ1 ) .
|xk − ζ1 | 2
 √ 
Si x0 = 0 alors 12 (x0 + ζ1 ) = 12 1 − 23 < 1 et x0 = ζ2 alors 1
2 (ζ2 + ζ1 ) = 1. Donc,
1
si 0 ≤ x0 < ζ2 alors 2 |x0 + ζ1 | < 1 donc

|x1 − ζ1 |
<1
|x0 − ζ1 |

d’où
|x1 − ζ1 | < |x0 − ζ1 |
x1 plus proche de ζ1 0 ≤ x1 < ζ2 . De même,

|xk − ζ1 | < |xk−1 − ζ1 |

0 ≤ xk < ζ2 et |xk − ζ1 | < |xk−1 − ζ1 | donc limk→∞ xk = ζ1 .

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 412 — #422


i i

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 413 — #423


i i

CHAPITRE 22

Méthodes d’intégration numérique

22.1 Introduction

Supposons qu’on a à calculer


Z b
I= f (x) dx
a

où f est une fonction continue sur l’intervalle [a, b] . On doit utiliser une méthode
numérique si :
– On ne connait pas de primitive F (x) de f.
– La quantité F (b) − F (a) sont difficile à évaluer.
– f n’est pas donnée sous forme analytique mais elle est définie en un ensemble
discret de points (résulte de mesures expérimentales).
On sait que l’intégrale I est la mesure de la surface délimitée par l’axe des x, les
droites d’équations x = a et x = b et la courbe de f (x) :

Les méthodes exposées par la suite consiste à remplacer la courbe de f (x) par une
courbe plus "sympatique", c’est à dire pour laquelle l’intégration (calcul de la surface)
soit facile.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 414 — #424


i i

414 Chapitre 22. Méthodes d’intégration numérique

22.2 Méthodes des trapèzes

22.2.1 Principe

Le segment [a, b] est divisé en un grand nombre de petits segments à l’aide des points
x1 , x2 , . . . , xn−1 et la courbe y = f (x) est remplacée sur chaque segment par une
droite.
La surface approchée I ∗ est la somme des surfaces des petits trapèzes ainsi définis.

22.2.2 Formules

Considérons les points x0 = a, x1 , . . . , xn−1 , xn = b.


n  

X f (xi ) + f (xi−1 )
I = (xi − xi−1 ) .
i=1
2

Dans le cas où les points xi sont équidistants

xi − xi−1 = h

la formule se simplifie en
n
X f (xi ) + f (xi−1 )
I∗ = h
i=1
2
" n−1
#
f (a) + f (b) X
=h + f (xi ) .
2 i=1

Les points xi étant générés par l’ordinateur, au fur et à mesure que les calculs avancent,
les erreurs d’arrondi se glissent dans ces calculs et souvent

b − xn−1 6= h.

On calcule alors le dernier pas à part


" n−2
#  
∗ f (a) + f (xn−1 ) X f (xn−1 ) + f (b)
I =h + f (xi ) + (b − xn−1 ) .
2 i=1
2

22.2.3 Erreur de la méthode

La formule décrivant I ∗ permet d’obtenir une expression voisine de I mais certainement


différente car on a remplcé un problème par un autre. L’écart entre la solution exacte
du problème posé et la solution exacte du modèle adopté est l’erreur de méthode ou
l’erreur d’algorithme.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 415 — #425


i i

22.2 Méthodes des trapèzes 415

Erreur de méthode sur un pas


Soient
Z xi  
f (xi ) + f (xi−1 )
Ii = f (x) dx et Ii∗ = h .
xi−1 2
Soit i l’erreur de méthode

i = Ii − Ii∗
Z xi  
f (xi ) + f (xi−1 )
= f (x) dx − h .
xi−1 2

Faisons le changement de varaible x = xi−1 + u, puis faisons un développement limité


autour de xi−1 :
Z h  
f (xi−1 + h) + f (xi−1 )
i = f (xi−1 + u) du − h
0 2
Z h 2
u3 000

0 u 00
= f (xi−1 ) + uf (xi−1 ) + f (xi−1 ) + f (xi−1 ) du
0 2 6
2 3
 
h 0 h 00 h 00
− f (xi−1 ) + hf (xi−1 ) + f (xi−1 ) + f (xi−1 ) + f (xi−1 )
2 2 6
h3 00
= − f (xi−1 ) + o h4 .

12

Majoration de l’erreur de méthode dans tout l’intervalle


L’erreur de la méthode sur tout l’intervalle [a, b] est donnée par

 = I − I∗
Xn
= i
i=1
n
h3 X 00
=− f (xi−1 ) .
12 i=1

Ainsi,
n
h3 X 00
|| ≤ |f (xi−1 )| .
12 i=1
Or,
|f 00 (xi−1 )| ≤ max |f 00 (x)| .
x∈[a,b]

D’où,
3  
(b − a) b−a
|| ≤ max |f 00 (x)| . puisque h =
12n2 x∈[a,b] n
Il est évident que plus le pas h est petit (n est élevé), plus la méthode est précise.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 416 — #426


i i

416 Chapitre 22. Méthodes d’intégration numérique

Existance d’un nombre de trapèzes optimum


Représontons l’erreur de la méthode et l’erreur d’arrondi en fonction de n

Les expériences montrent que nop est de l’ordre de 1000.

22.2.4 Intégration avec pas variable


On peut diminuer le temps de calcul, en considérant des intervalles [xi , xi+1 ] de largeur
variable mais de telle sorte que les erreurs sur les trapèzes soient de même ordre de
grandeur.

22.3 Méthode de Simpson


22.3.1 Principe
Elle consiste à remplacer la fonction entre xi et xi+1 par l’arc de parabole passant par
f (xi−1 ) , f (xi ) et f (xi+1 ) .

22.3.2 Formule utilisée


Utilisons le développement de Taylor pour calculer la formule
Z x
I (x) = f (x0 ) dx0
0
dI (x)
= f (x) .
dx

I (xi+1 ) = I (xi + ∆x)


∆x2 0 ∆x3 00 ∆x4 000
= I (xi ) + ∆xf (xi ) + f (xi ) + f (xi ) + f (xi ) + o(∆x5 ).
2 3! 4!

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 417 — #427


i i

22.3 Méthode de Simpson 417

I (xi−1 ) = I (xi − ∆x)


∆x2 0 ∆x3 00 ∆x4 000
= I (xi ) − ∆xf (xi ) + f (xi ) − f (xi ) + f (xi ) + o(∆x5 ).
2 3! 4!
On en déduit l’aire Ai des deux tranches [xi−1 , xi ] et [xi , xi+1 ] par

Ai = I (xi+1 ) − I (xi−1 )
∆x3 00
= 2∆xf (xi ) + f (xi ) + o(∆x5 ).
3!
Or,

f 0 (xi+1 ) − f 0 (xi )
f 00 (xi ) =
∆x
f (xi+1 ) − f (xi ) − f (xi ) + f (xi−1 )
= + o(∆x2 )
∆x2
f (xi−1 ) − 2f (xi ) µ + f (xi+1 )
= + o(∆x2 ).
∆x2
D’où,

∆x
Ai = 2∆xf (xi ) + (f (xi−1 ) − 2f (xi ) + f (xi+1 )) + o(∆x5 )
3
∆x
= (f (xi−1 ) + 4f (xi ) + f (xi+1 )) + o(∆x5 ).
3
L’aire totale entre a et b est
Z b
I= f (x) dx = A1 + A2 + · · · + An−1 .
a

Ceci nécessite que le nombre d’intervalles soit pair. Il vient alors

∆x ∆x ∆x n
I= (f0 + 4f1 + f2 ) + (f0 + 4f1 + f2 ) + · · · + (f0 + 4f1 + f2 ) + o(∆x5 ).
3 3 3 2
Or,
n b−a
o(∆x5 ) = o(∆x5 ) = o(∆x4 ).
2 2 (∆x)
Ainsi,
n−1 n−2
∆x X X n
I= [f (a) + f (b) + 4 f (xi ) + 2 f (xi )] + o(∆x5 ).
3 i=1 i=2
2
| {z } | {z }
i impair i pair

Commentaire 22.3.1 La méthode de Simpson donne un résultat exact pour l’inté-


gration des polynômes d’ordre inférieur ou égale à 3.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 418 — #428


i i

418 Chapitre 22. Méthodes d’intégration numérique

22.4 Méthode de Romberg


Comme la précision des méthodes de trapèzes et de Simpson sont limités, on utilise
la méthode de Romberg qui est une méthode itérative utilisant la simplicité de la
méthode de trapèzes pour obtenir une première approximation puis une extrapolation
pour améliorer la précision.

22.4.1 Principe
On estime I par extrapolation à partir du résultat obtenu par la méthode des trapèzes,
on obtient
Z b
I= f (x) dx
a
2 4 6
= T (∆x) + c2 (∆x) + c4 (∆x) + c6 (∆x) + · · ·

avec
n−1
∆x X
T (∆x) = [f (a) + f (b) + 2 f (a + j∆x)] :
2 j=1

C’est l’évaluation de I par la méthode de trapèzes.


c2 , c4 , c6 , . . . dépendent de f (x) et de ses dérivées mais indépendant de ∆x.
– On peut améliorer la précision par l’utilisation des pas de plus en plus petits.
Ainsi, en doublant le nombre de pas, ∆x est divisée par 2 et on a {
   2  4  6
∆x ∆x ∆x ∆x
I=T + c2 + c4 + c6 + ···
2 2 2 2
On obtient ainsi une suite
   
∆x ∆x
T (∆x) , T ,T
2 4
qui converge vers I.
∆x

– On peut utiliser T (∆x) et T 2 pour mieux évaluer I. En effet,
2 4
T (∆x) = I − c2 (∆x) − c4 (∆x) − · · ·
  2 4
∆x (∆x) (∆x)
T = I − c2 − c4 − ···
2 4 16
Ainsi,    
1 ∆x 1 4
I= 4T − T (∆x) − c4 (∆x) .
3 2 4
   
1 ∆x
T0 = 4T − T (∆x)
3 2
∆x

est une approximation de I à l’ordre 4 alors que T (∆x) et T 2 sont des
approximations à l’ordre 2.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 419 — #429


i i

22.5 Exercices 419

22.4.2 Procédure
Afin d’expliciter la procédure, les évaluations par la méthode des trapèzes sont notées
T1,q , où 2q−1 désigne le nombre d’intervalles. On aure :
 Pl
 T1,q = ∆x2 [f (a) + f (b) + 2 j=1 f (a + j∆x)]
∆x = 2b−a
q−1

l = 2q−1 − 1

Ainsi,
b−a
q = 1 ⇒ T1,1 = [f (a) + f (b)]
2   
b−a b−a
q = 2 ⇒ T1,1 = f (a) + f (b) + 2f a + .
4 2
On en déduit les valeurs extrapolées Tp,q par :
1
4p−1 Tp−1,q+1 − Tp−1,q .

Tp,q =
4p−1 −1
Z 4
Exemple 22.4.1 Calculer I = ex dx. En effet,
0

4−0 0
q = 1 ⇒ T1,1 = [e + e4 ] = 111.1963
2
4−0 0
e + e4 + 2e2 = 70.376262.

q = 2 ⇒ T1,1 =
2
Ainsi,
1
T2,1 = (4T1,2 − T1,1 ) = 56.769583.
4−1
On s’arrête à 4 tranches (q = 3) : T3,1 = 53.670130 en calculant
T1,3 = 57.991950 et T2,2 = 53.863846.
On voit bien la convergence des valeurs extrapôlées est plus rapide quela méthode
des trapèzes puisqu’avec 4 tranches l’approximations est de 8.2 × 10−2 par les
trapèzes et 1.3 × 10−3 (soit 63 fois mieux) par les valeurs extrapôlées. De plus,
l’approximation est même meuilleure que par la méthode de Simpson.

22.5 Exercices
22.5.1 Enoncés
Exercice 1 :
On considère la fonction connue uniquement par les cinq valeurs représentées dans
le tableau suivant :
x 0.2 0.4 0.6 0.8 1
f (x) 0.19 0.38 0.56 0.71 0.84

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 420 — #430


i i

420 Chapitre 22. Méthodes d’intégration numérique

0
1. Calculer f (x) aux cinq points.
00
2. Calculer f (x) aux cinq points.
R1
3. Calculer 0.2 f (x) dx par la méthode de trapèzes
R4
4. Calculer la valeur approchée de I = 3 2sin x dx par la méthode de trapèzes à 4
intervalles.
Exercice 2 :
Soit f une fonction continue sur l’intervalle [−4; 2]. On désire trouver un encadre-
ment de Z 2
f (x) dx.
−4

Pour cela, on subdivise l’intervalle [−4; 2] comme indiqué et on utilise la méthode des
rectangles. Quelle subdivision parmi celles proposées donnera le meilleur encadrement ?

Dessin 1 Dessin 2 Dessin 3

Exercice 3 :
Soit f une fonction continue et convexe sur l’intervalle [0; 5]. On se donne les valeurs
suivantes de f pour les valeurs de x égales à 0 + i 59 , pour i allant de 0 à 9.

x 0 0.5555 1.1111 1.6666 2.2222 2.7777 3.3333 3.8888 4.4444 5


f (x) 0.2 0.2063 0.226 0.2601 0.3097 0.3757 0.4592 0.5612 0.6828 0.825
R5
Calculer numérique 0 f (x) dx à partir de ces valeurs en utilisant la méthode des
trapèzes.
Exercice 4 :
x
On veut calculer numériquement l’intégrale de la fonction f (x) = e− 5 sur l’inter-
valle [0; 5]. Pour cela, on divise l’intervalle en sous-intervalles égaux

Ik = [xk−1 ; xk ]

de longueur
H = xk − xk−1 , k = 1, . . . , M
avec x0 = 0 et xM = 5, et on considère la formule composite du trapèze.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 421 — #431


i i

22.5 Exercices 421

c
1. On peut montrer que l’erreur commise par la formule du trapèze It,(k) (f ) sur
l’intervalle Ik est
H3
Z 00
t c
max f (ξ) si f ∈ C 2

E(k) = f (x) dx − It,(k) (f ) ≤

Ik 12 ξ∈I k

Calculer, en fonction du nombre M de sous-intervalles, l’erreur globale Etc


introduite par la formule composite du trapèze Etc (f ) sur l’intervalle [0; 5].
2. Trouver le nombre minimal de sous-intervalles afin que l’erreur globale soit plus
petite que 10−4 .
Exercice 5 :
Soit f une fonction
R −6 infiniment dérivable. Nous voulons calculer approximativement
l’intégrale définie −12 f (x) dx par la méthode des trapèzes à intervalles réguliers.
00
Sachant que f (x) < 3.67 pour x ∈ [−12; −6], calculez le nombre minimal de

coupes de l’intervalle [−12; −6] qui est nécessaire pour que l’erreur de l’approximation
ne dépasse pas 0.27.

22.5.2 Corrigés
Exercice 1 :
1. et 2. On donne : " #
n−1
1b−a X
In = f (a) + f (b) + 2 f (xi )
2 n i=1

où xi = a + i b−a
n pour i = 0, 1, . . . , n.

x 0.2 0.4 0.6 0.8 1


f (x) 0.19 0.38 0.56 0.71 0.84
f 0 (x) 0.95 0.925 0.825 0.7 0.65
f 00 (x) −0.125 −0.313 −0.563 −0.438 −0.280
R1 0.19+0.84

1. 0.2
f (x) dx = 0.2 2 + 0.38 + 0.56 + 0.71 = 0.433.
1 4−3
2. In = 2 4 [1.152 + 0.469 + 2 (0.897 + 0.704 + 0.564)] = 0.744.
Exercice 2 :
Le Dessin 3 donne le meilleur encadrement puisque il existe plus de rectangles dans
la région sensible à des pertes (ponte).
Exercice 3 :

 
∗ 5 0.2 + 0.825
I = + 0.2063 + 0.226 + 0.2601 + 0.3027 + 0.3757 + 0.4592 + 0.5612 + 0.6828
9 2
' 2.

Exercice 4 :

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 422 — #432


i i

422 Chapitre 22. Méthodes d’intégration numérique

x
Soirt f (x) = e− 5 sur [0, 5] et Ik = [xk−1 ; xk ] de longueur
xM − x0 5
H = xk − xk−1 = = , k = 1, . . . , M
M M
avec x0 = 0 et xM = 5.
R xk  
c
(f ) = h f (xi )+f2 (xi−1 ) . Or,
R
1. On a Ik f (x) dx = xk−1 f (x) dx et It,(k)
Z xk Z h
f (x) dx = f (xk−1 + u) du
xk−1 0

(Poser x = xk−1 + u). De plus, par un développement limité au voisinage de


xk−1 , on a,
u2 u3
f (xk−1 + u) = f (xk−1 ) + uf 0 (xk−1 ) + f 00 (xk−1 ) + f (3) (xk−1 ) + u3  (u) .
2 3!
R 3

00 H 4 (3)
t
Ainsi, E(k) c
= Ik f (x) dx − It,(k) (f ) = − H f (x ) − f (x ) + H 4
 (H) .

12 k−1 24 k−1
Ce qui revient à écrire au voisinage de xk−1 et à l’ordre 3,
H 3 00

t
f (xk−1 ) + H 3  (H) .

E(k) = −
12
Ainsi,
H3
Z 00
t c
max f (ξ) si f ∈ C 2 .

E(k) = f (x) dx − It,(k) (f ) ≤

Ik 12 ξ∈Ik
De plus, on a
M
X H3 00
Etc = t
E(k) ≤M max f (ξ) .

12 ξ∈Ik
k=1
00
5 1
Or H = et max f (ξ) = 25 ,

M ξ∈[0,5]

M
X 75 1 5
Etc = t
E(k) ≤ = .
12M 2 25 12M 2
k=1

2. On a
5
Etc ≤ ≤ 10−4 ⇔ M ≥ 64.550.
12M 2
Ainsi, Mmin = 65 coupes.
Exercice 5 :
On sait d’après l’exercice précedent que
63 00
Etc ≤ max (ξ)

2
12M ξ∈[−12,−6]
f

< 0.27.
Donc,
M > 15.64.
D’où, Mmin = 16 coupes.

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 423 — #433


i i

Sixième partie

ANNEXE

i i

i i
i i

“belhajBenaissa” — 2013/6/11 — 15:27 — page 424 — #434


i i

i i

i i

S-ar putea să vă placă și