Documente Academic
Documente Profesional
Documente Cultură
Pour modéliser l’évolution au cours du temps (la dynamique) de systèmes biologiques, par
exemple celle d’un organisme, d’une substance, d’un ecosystème, on choisit souvent des modèles
aléatoires. Les plus simples de ces modèles aléatoires sont les chaı̂nes de Markov qui, dans
le cas particulier étudié ici sont faciles à utiliser car il n’y a pratiquement aucun prérequis
mathématique. Elles nous donneront l’occasion d’une première familiarisation avec le calcul
matriciel que nous approfondirons lors des leçons suivantes.
7
8 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV
A noter que cette matrice est appelée matrice stochastique parce que ses coefficients sont
tous compris entre 0 et 1 et la somme des coefficients de chaque ligne vaut 1 (ce qui n’est pas
vrai en général pour les colonnes).
On peut aussi représenter une chaı̂ne de Markov (S, P) par un diagramme en points et flèches
comme indiqué par la figure (1.1) correspondant à l’exemple ci-dessous. Dans ces diagrammes,
chaque état est représenté par un point et chaque coefficient pij non nul de la matrice de
transition par une flèche allant de l’état i à l’état j.
Si l’on connait la distribution initiale des différents états (c’est-à-dire la proportion d’indi-
vidus de la population étudiée se trouvant dans chacun des états xi , que l’on appelle la loi de
probabilité initiale π0 ), l’étude de la chaı̂ne de Markov va permettre de calculer, à partir de cette
répartition
S x1 x2 .... xn
π0 π0 (x1 ) π0 (x2 ) .... π0 (xn )
π0 (xi ) à l’instant t = 0, c’est-à-dire à partir des nombres π0 (xi ) := P (X0 = xi ), quels états la
population va atteindre à l’instant t = 1 et avec quelles probabilités π1 , puis à l’instant t = 2
et ainsi de suite. En d’autres termes, on va ainsi calculer la loi πt pour tous les t > 0 et ainsi
modéliser la dynamique de cette population.
h a f
0, 5 0, 45 0, 05 h
P=
0, 1 0, 5 0, 4 a
0 0, 1 0, 9 f
d’où le diagramme en points et flèches de la figure (1.1).
On peut ainsi calculer la probabilité de n’importe quelle succession d’états, appelée trajectoire
de la chaı̂ne de Markov. Par exemple la probabilité qu’en un point de la parcelle on observe la
succession d’états (h, h, a, f, f ) est égale à
P (X0 = h, X1 = h, X2 = a, X3 = f, X4 = f )
= π0 (h)P (X1 = h/X0 = h)P (X2 = a/X1 = h)P (X3 = f /X2 = a)P (X4 = f /X3 = f )
= π0 (h)phh pha paf pf f = π0 (h)(0, 5)(0, 45)(0, 4)(0, 9) = 0, 081π0 (h).
1.3. PUISSANCES DE P ET LOI STATIONNAIRE 9
P (X1 = h/X0 = h)P (X0 = h) + P (X1 = h/X0 = a)P (X0 = a) + P (X1 = h/X0 = f )P (X0 = f )
ce qui peut s’écrire ici π1 (h) = 0, 5 · π0 (h) + 0, 1 · π0 (a) + 0 · π0 (f ) compte tenu des valeurs des
probabilités de transition données par la matrice P. On remarque que π1 (h) est le produit scalaire
du vecteur π0 avec la première colonne de la matrice P. De même, on vérifie que π1 (a) est le
produit scalaire du vecteur π0 avec la deuxième colonne de la matrice P et que π1 (f ) est le produit
scalaire du vecteur π0 avec la troixième colonne de la matrice P. On résume cela en disant que
le vecteur π1 est le produit du vecteur π0 par la matrice P, ce qui s’écrit simplement π1 = π0 · P
ou simplement π1 = π0 P, comme un produit de deux nombres (mais ici il s’agit d’un vecteur et
d’une matrice). Cette formule très courte signifie que le vecteur π1 = (π1 (h), π1 (a), π1 (f )) est le
produit de la matrice P par le vecteur π0 = (π0 (h), π0 (a), π0 (f )), ce qui s’écrit encore de façon
matricielle :
0, 5 0, 45 0, 05
(π1 (h), π1 (a), π1 (f )) = (π0 (h), π0 (a), π0 (f )) 0, 1 0, 5 0, 4
0 0, 1 0, 9
1.4 Exercices
Exercice 1 : Dans l’exemple décrit ci-dessus,
1. Calculer la probabilité des trajectoires suivantes (h, a, f, h), (h, a, f, a), (a, a, a).
2. Calculer la distribution des états π1 à l’instant t = 1 si l’on suppose π0 = (1, 0, 0).
Interpréter.
3. Montrer qu’une distribution uniforme π0 = (1/3, 1/3, 1/3) n’est pas une distribution
stationnaire pour cette chaı̂ne de Markov. Interprétez ce résultat.
4. Y-a-t-il une distribution stationnaire pour cette chaı̂ne de Markov ?
Réponses 1. P (h a f h) = π0 (h) · 0, 45 · 0, 4 · 0 = 0, P (h a f a) = π0 (h) · 0, 45 · 0, 4 · 0, 1 =
0, 018 · π0 (h) et P (a a a) = π(a) · 0, 5 · 0, 5 = 0, 25 · π0 (a)
10 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV
0, 5 0, 45 0, 05
2. π1 = π0 .P = (1, 0, 0). 0, 1 0, 5 0, 4 = (0, 5 0, 45 0, 05) Il y a donc, après
0 0, 1 0, 9
trois ans, la moitié de la parcelle recouverte de d’herbe, 45% d’arbustes et 5% de
foret, si l’on suppose qu’au debut il n’y avait que de l’herbe.
0, 5 0, 45 0, 05
1 1 1
3. π0 .P = ( 3 3 3 ). 0, 1 0, 5 0, 4 = (0, 2 0, 35 0, 45) 6= π0 Donc la distribution
0 0, 1 0, 9
uniforme (même proportion de chacun des trois type) n’est pas stationnaire, ce qui
signifie que s’il y a au depart le même pourcentage de chacun des trois types, la
distribution, est modifiée après trois ans.
4. On doit résoudre l’équation π ∗ .P = π∗, c’est-à-dire, si on note π∗ = (p q r), on doit
trouver trois nombres compris entre 0 et 1 et de somme égale à 1, tels que :
0, 5 p + 0, 1 q = p
0, 45 p + 0, 5 q + 0, 1 r = q (1.1)
0, 05 p + 0, 4 q + 0, 9 r = r
2 10 41
On trouve la solution π∗ = ( 53 53 53 ).
Exercice 2 : Une souris se déplace dans un labyrinthe représenté ci-dessous qui comporte
5 compartiments numérotés de 1 à 5. On suppose qu’elle change de compartiment à
chaque instant t = 0, 1, 2, 3, . . . et que, lorsqu’elle se trouve dans un compartiment ayant
k portes (k = 1, 2 ou 3), elle choisit l’une des portes avec la probabilité k1 , ses choix étant
indépendants à chaque instant de ceux qu’elle a fait auparavant.
Le cheminement de la souris peut être décrit par une chaı̂ne de Markov (Xt )t=0,1,2,.. dont
les états sont les 5 compartiments et la matrice de transition P la matrice des probabilités
de passage d’un compartiment à un autre. Par exemple p12 = 12 car le compartiment 1
contient 2 portes dont l’une vers le compartiment 2.
1 1 1 1 1
2. On trouve P (1 2 1 3 5) = π0 (1) 2 · 2 · 2 · 3 = 24 · π0 (1) et P (1 2 3 4 5) =
π0 (1) · 12 · 0 · 13 · 0 = 0
3. C’est un calcul de probabilité conditionnelle. On a P (X2 = 5/X0 = 1) = P (1 3 5) =
π0 (1) · 12 · 13 = 16 · π0 (1), P (X3 = 5/X0 = 1) = P (1 3 5) = 0 car il n’existe pas de
chemin allant de la case 1 à la case 5 en deux étapes et enfin P (X4 = 5/X0 = 1) =
P (1 2 4 3 5) + P (1 2 1 3 5) + P (1 3 4 3 5) + P (1 3 1 3 5) + P (1 3 5 3 5) =
1 1 1 1 1 7
24 · π0 (1) + 24 · π0 (1) + 36 · π0 (1) + 36 · π0 (1) + 18 · π0 (1) = 36 · π0 (1).
4. En considérant que la probabilité d’être dans une case est proportionnelle au nombre
de portes de cette case, la distribution initiale est π0 = ( 15 51 10 3 1
5
1
10 . En
effet π0 (1) est proportionnelle à 2, donc de la forme π0 (1) = 2λ, de même on aura
π0 (2) = 2λ, π0 (3) = 3λ, π0 (4) = 2λ et π0 (5) = λ. Comme on doit aussi avoir
1
π0 (1) + π0 (2) + π0 (3) + π0 (4) + π0 (5) = 1, il faut prendre λ = 10 .
5. C’est bien une distribution stationnaire car on peut s’assurer qu’elle verifie π0 · P = π0 .
Exercice 3 : Modélisation d’un brin d’ADN La modélisation la plus simple d’un brin d’ADN,
enchainement “désordonné” de nucleotides de l’un des 4 types adenine (a), cytosine (c),
guanine (g) et thymine (t), est de le considérer comme une trajectoire d’une chaı̂ne de
Markov Xn à quatre états S = {a, c, g, t} dont la matrice de transition P fournit les prob-
abilités que l’un de ces états succède à un autre. Ainsi le brin aagc est la trajectoire
X0 = a, X1 = a, X2 = g, X3 = c.
0 0, 3 0 0, 7
0, 6 0 0, 4 0
1. En supposant que la matrice P est donnée par P = tracer
0 0, 8 0 0, 2
0, 3 0 0, 7 0
le graphe en points et flèches associé à cette chaı̂ne de Markov.
2. Calculer les probabilités des trajectoires suivantes en fonction de la probabilité initiale
de l’état c : cgcata et cgct.
3. La distribution initiale π0 = ( 18 ; 0 ; 78 ; 0) est-elle une distribution stationnaire pour
cette chaı̂ne de Markov ?
4. Reprendre les deux questions précédentes en prenant cette fois pour P la matrice
0, 3 0 0, 7 0
0 0, 8 0 0, 2
P=
0, 1 0 0, 9 0
0 0, 4 0 0, 6
5. Supposons que vous puissiez observer un très long brin d’ADN. Indiquer quelle
méthode vous choisiriez pour estimer les probabilités de transitions figurant dans
la matrice P.
Exercice 4 : Une foret à deux espèces On suppose1 que l’on s’intéresse à une forêt com-
posée de deux espèces d’arbres, E1 et E2. Lorsqu’un arbre meurt, un nouveau grandit à
1
Exemple extrait du livre “Mathematical Models in Biology”, E.S. Allman et J.A. Rhodes, Cambridge Uni-
versity Press, 2004
12 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV
sa place mais il peut être de l’une ou l’autre des deux espèces. Ceux de la première espèce
ayant une longue durée de vie, on suppose que 1% d’entre eux meurt chaque année alors
que ce taux est de 5% pour la deuxième espèce. Mais ces derniers grandissant plus rapi-
dement réussiront plus souvent à occuper une place laissée vacante : on suppose que 75%
des places vacantes sont prises par un arbre de la deuxième espèce contre seulement 25%
pour un arbre de la première espèce.
1. Expliquer comment l’on peut modéliser la dynamique ce cette foret par une chaı̂ne
de Markov (Xt )t≥0 à deux états E1 et E2 et justifier la formule suiante :
Dans cette leçon, nous examinons quelles sont les principales propriétés des chaı̂nes de
Markov et nous étudions quelques exemples suplémentaires.
13
14 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS
alors on a P4 = P ; cette chaı̂ne est dite périodique de période 3 car toute trajectoire revient à
son état initial après 3 étapes.
Une chaı̂ne dont tous les états sont récurrents admet pour loi stationnaire la loi définie
1
par π(xi ) := m(x i)
, où m(xi ) est l’espérance du temps de retour à l’état xi (si l’on est parti
de xi ). Par exemple, la chaı̂ne périodique précédente admet la distribution ( 13 , 13 , 13 ) comme
distribution stationnaire. Dans le cas non périodique, on peut montrer que, moyennant quelques
hypothèses suplémentaires, une chaı̂ne de Markov dont tous les états sont récurrents tend vers
sa loi stationnaire quelque soit sa loi initiale.
0, 8 0, 2 0 0 0
0 0, 7 0, 3 0 0
P= 0 0 0, 4 0, 6 0
0 0 0 0, 2 0, 8
0, 1 0 0, 25 0 0, 65
On se convainc facilement que cette dynamique n’a pas d’état absorbant, qu’elle n’est pas
périodique. A priori, les trajectoires semblent passer indéfiniment d’un état à un autre et il n’est
donc pas evident d’apréhender son évolution. Mais si l’on observe les puissances successives de
1
Exemple tiré du livre Modélisation et simulation d’écosystèmes, P. Coquillard et D. Hill, Masson 1997.
2.5. REMARQUES 15
la matrice de transition P, on peut voir qu’après un grand nombre d’itérations, Pn tend vers une
matrice limite dont toutes les lignes sont égales, ce qui signifie que la distribution (proportion
de chacun des états) évolue vers une distribution unique qui est une distribution stationnaire.
Ainsi on a
0, 17520 0, 11680 0, 20437 0, 15327 0, 35034
0, 17517 0, 11680 0, 20438 0, 15328 0, 35035
P40 = 0, 17551 0, 11678 0, 20438 0, 15328 0, 35037
0, 17517 0, 11678 0, 20438 0, 15328 0, 35037
0, 17518 0, 11678 0, 20437 0, 15328 0, 36036
2.5 Remarques
Pour finir notons que si les chaı̂nes de Markov fournissent des modèles très utiles, elles
présentent aussi des défauts. Parmi eux, l’hypothèse simplificatrice d’un nombre fini d’états
possibles ou celle de l’invariance dans le temps des probabilités de transitions sont relativement
faciles à contourner car il existe des chaı̂nes de Markov ayant un nombre infini d’états ou/et
qui ne sont pas homogènes, c’est-à-dire avec des matrices de transition modifiables au cours
du temps. Bien entendu l’étude de ces modèles généralisés nécessitent le recours à des outils
mathématiques plus élaborés.
Par contre, il en est différemment pour l’invariance spatiale. Pour le calcul des probabilités de
transition, on fait en effet implicitement une hypothèse d’homogénéité spatiale qui est rarement
satisfaite dans la pratique. Par exemple un site végétal n’a certainement pas la même probabilité
d’être occupé la période suivante par une espèce donnée selon que les sites voisins le sont déjà ou
qu’ils ne le sont pas. Et, malheureusement ceci ne peut pas être pris en compte par les modèles
markoviens simples que nous avons présentés ici. On retiendra donc qu’il convient d’utiliser avec
prudence une chaı̂ne de Markov lorsque ce caractère d’isotropicité du milieu n’est pas du tout
satisfait.
2.6 Exercices
Exercice 1 : L’observation du développement d’un organisme (animal ou plante) au cours du
temps fait apparaı̂tre l’ensemble des états suivants : juvenile, maturité sexuelle, sénescence
et décès, que nous noterons respectivement j, m, s et d, avec des probabilités de passage
d’un état vers un autre données par la matrice suivante :
0, 2 0, 2 0 0, 6
0 0, 55 0, 15 0, 3
P=
0 0 0, 1 0, 9
0 0 0 1
La chaı̂ne n’est pas périodique comme on peut le voir facilement sur son diagramme
en points et flèches. Par exemple, on voit qu’une trajectoire qui passe de l’état j à
l’état m ne repassera plus jamais par l’état j et ne peut donc pas être périodique.
3. Les trois états j, m et s sont transitoires car la probabilité de ne pas revenir en j
sachant qu’on y était à l’état initial est supérieure à 0, 8 et de même cette probabilité
est supérieure à 0, 45 pour m et à 0, 9 pour s. L’état d est absorbant donc récurrent.
Exercice 2 : On considère une chaı̂ne de Markov à quatre états S = {1, 2, 3, 4} dont la matrice
de transition est
0 12 12 0
1 0 0 1
2
P= 2
0 0 1 0
0 0 0 1
P ( X0 = 1, X1 = 3, X2 = 3, . . .)
= P (X0 = 1) · P (X1 = 3/X0 = 1) · P (X2 = 3/X1 = 3) · . . .
1 1
= p0 · · 1 · 1 · . . . = p0
2 2
De même,
P ( X0 = 1, X1 = 2, X2 = 4, X3 = 4, . . .)
= P (X0 = 1) · P (X1 = 2/X0 = 1) · P (X2 = 4/X1 = 2) · P (X3 = 4/X2 = 4) · . . .
1 1 1
= p0 · · · 1 · . . . = p0
2 2 4
La dernière trajectoire considérée fournit un exemple de trajectoire de longueur infinie
et de probabilité nulle (il n’existe evidemment pas trajectoire de longueur finie et de
probabilité nulle !). En effet la probabilité de la trajectoire considérée est le produit
de 12 par lui même un nombre infini de fois. A chaque nouveau produit la probabilité
est diminuée de moitié. Comme limn→∞ ( 12 )n = 0, elle est donc nulle.
4. La répartition initiale étant uniforme, π0 = (p0 , q0 , r0 , s0 ) = ( 14 , 14 , 14 , 14 ) et donc π1 =
π0 · P = ( 18 , 18 , 78 , 78 ) et de même π2 = π1 · P = ( 16
1 1 7 7
, 16 , 16 , 16 ). De la même façon,
lorsque π0 = ( 12 , 12 , 0, 0), on calcule π1 = π0 · P et on trouve π1 = ( 14 , 14 , 14 , 14 ) d’où l’on
peut déduire sans nouveau calcul que π2 = ( 18 , 18 , 78 , 78 ).
5. On vérifie que si π0 s’écrit π0 = (0, 0, r0 , s0 ), avec nécessairement r0 + s0 = 1, alors
le produit π0 · P est encore égal à π0 . Toutes les distributions de cette forme sont
donc stationnaires. Inversement, une distribution π = (p, q, r, s) est stationnaire si
elle vérifie π · P = π, c’est-à-dire si les 4 quantités p, q, r et s vérifie le système
d’équations suivant :
1
2q = p
1
2p = q (2.1)
1
21
p + r = r
2q + s = s
1. Quelle est, selon ce modèle, la probabilité que les lions mangent un zèbre après avoir
mangé une antilope ?
18 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS
2. Des deux trajectoires suivantes, (zaag) et (zaga), quelle est la plus probable ? Justifier
votre réponse par un calcul.
3. Tracer le diagramme en points et flèches. La chaı̂ne est-elle irréductible ? Pourquoi ?
4. Compléter les deux valeurs manquantes dans la matrice suivante (en indiquant quels
calculs vous faites) :
0, 35 .... 0, 49
P2 = 0, 26 0, 21 0, 53
0, 26 0, 2 ...
5. Calculer la probabilité pour que la chaı̂ne passe de l’état a à l’état z en deux étapes
(les lions mangent une antilope le premier jour, une autre proie (quelconque) le second
et un zèbre le troisième jour).
6. Les états de cette chaı̂ne de Markov sont-ils récurrents ou transitoires ?
7. La mesure π0 suivante est-elle une mesure invariante pour cette chaı̂ne de Markov ?
Justifier votre réponse.
S a g z
6 4 11
π0 21 21 21
Exercice 4 : Le magicien d’Oz a comblé tous les désirs des habitants du pays d’Oz, sauf peut-
être en ce qui concerne le climat : au pays d’Oz en effet, s’il fait beau un jour, il est certain
qu’il pleuvra ou neigera le lendemain, avec une probabilité égale qu’il pleuve ou qu’il neige.
Et si le temps d’un jour est pluvieux ou neigeux, alors il reste inchangé dans 50% des cas
le lendemain et ne devient beau que dans 25% des cas. Les habitants se sont plaint auprès
du magicien, affirmant que, ce faisant, ils n’ont qu’un beau jour sur cinq, ce à quoi il a
répondu qu’il s’agit d’une impression mais qu’en réalité il y a bien plus d’un beau jour sur
cinq. Qu’en est-il ?
Pour le savoir, on se propose de modéliser l’évolution du climat au pays d’Oz par une
chaı̂ne de Markov à 3 états, {P, B, N } (pour Pluvieux, Beau, et Neigeux) dont la matrice
de transition est, selon la description précédente :
0, 5 0, 25 0, 25
P = 0, 5 0 0, 5
0, 25 0, 25 0, 5
1. L’un coefficient de P est nul. Expliquer pourquoi.
2. Calculer la probabilité d’une trajectoire (succession de jours) du type BN P B en
fonction de π0 (B). Donner un exemple de trajectoire de probabilité nulle.
0, 438 0, 188 0, 375
3. On a calculé le carré de la matrice P et trouvé P2 = 0, 375 ....... 0, 375
0, 375 0, 188 0, 438
Compléter le coefficient manquant, en expliquant comment le calculer.
4. Donner la probabilité que le surlendemain d’un jour neigeux soit neigeux.
5. Le calcul des puissances successives de la matrice P montre qu’à partir de la puissance
sixième elles restent pratiquement inchangées et égales à la matrice
0, 4 0, 2 0, 4
0, 4 0, 2 0, 4
0, 4 0, 2 0, 4
Cela suggère que la distribution π0 = (0, 4 ; 0, 2 ; 0, 4) est une distribution stationnaire
pour cette chaı̂ne de Markov. Vérifier qu’il s’agit bien d’une ditribution stationnaire.
6. En déduire la réponse à la question initiale : qui du magicien ou de la population du
pays d’Oz a la bonne estimation du nombre de jours de beau temps ? Expliquer.
Chapitre 3
Sous cette forme, on voit que l’on peut calculer l’effectif Yt en fonction de Yt−1 et lui même
en fonction de Yt−2 et ainsi de suite et donc calculer l’effectif Yt à tout instant t en fonction de
l’effectif Y0 . Par exemple, Y2 = Y1 (1+r) = (Y0 (1+r))(1+r) = Y0 (1+r)2 , et plus généralement on
a pour tout t la formule Yt = Y0 (1+r)t . Si l’on connait la valeur de Y0 , que l’on appelle la condition
initiale, on peut donc calculer les valeurs suivantes Y1 , Y2 , ...et même directement la valeur de
Yt à tout instant t > 0. La figure (3.1) montre deux exemples de trajectoires d’une dynamique
malthusienne, pour deux conditions initiales différentes. De la formule Yt = Y0 (1 + r)t , on déduit
que la suite des valeurs de Yt est une suite géométrique de raison (1+r) qui est donc supérieure à
1 si r > 0. Puisque l’on a (1+r)t = et ln(1+r) , ce modèle correspond à une croissance exponentielle
de la population lorsque r > 0 d’où son nom de modèle exponentiel parfois utilisé à la place de
modèle malthusien. On a en effet Yt = Y0 et ln(1+r) = Y0 eRt , si l’on pose R = ln(1 + r). Notons
qu’il pourrait aussi modéliser une décroissance exponentielle si r était négatif. On retiendra donc
19
20CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE
Yt
25
20
15
10
0 t
0 1 2 3 4 5 6 7 8 9
Fig. 3.1 – Deux trajectoires particulières d’une dynamique malthusienne correspondant aux
deux conditions initiales Y0 = 1 et Y0 = 2, pour un choix du paramètre r égal à r = 0, 3.
qu’un modèle malthusien prévoit une croissance (ou décroissance) exponentielle de la population
modélisée.
n’est plus le même quelque soit la taille Yt de la population mais qu’au contraire il dépend de la
taille de la population. On supposera que ce taux de reproduction est grand lorsque la taille de la
population est petite car dans ce cas les ressources disponibles permettent cette forte croissance
mais qu’il est plus petit quand la taille devient plus grande et que les individus commencent
à entrer en compétition concernant la nourriture ou l’espace, voir même qu’il devienne négatif
pour de très grandes tailles, ce qui signifierait un declin de la population. La plus simple des
fonction de Yt ayant ces propriétés est une fonction linéaire affine (de la forme aYt + b) de pente
a négative et dont l’ordonnée à l’origine b est positive et correspond au taux de reproduction
d’une population suffisamment petite pour ne pas souffrir des limitations environnementales.
Pour cela, on remplace dans le modèle (3.1) le taux constant r par un taux dépendant de la
taille Yt que l’on écrit r( K−Y Yt
K ), ou encore r(1 − K ). Cela conduit au modèle logistique :
t
Yt
Yt+1 − Yt = r(1 − )Yt . (3.3)
K
On peut, comme dans le cas du modèle malthusien, réécrire cette formule comme une récurence
donnant la valeur de Yt+1 en fonction de la valeur de Yt :
Yt
Yt+1 = Yt + rYt (1 − ) (3.4)
K
ce qui permet de calculer facilement de proche en proche les valeurs successives de Yt dès qu’on
se donne Y0 . La figure (3.2) donne deux exemples de comportement de telles trajectoires. Ces
3.2. MODÈLE LOGISTIQUE 21
Yt
10
1 t
0 2 4 6 8 10 12
Fig. 3.2 – Deux trajectoires particulières de la dynamique logistique ∆Yt = 0.7Yt (1 − Yt /10)
pour les conditions initiales Y0 = 1 et Y0 = 3.
t 0 1 2 3 .... 11 12
Y 3 4, 47 6, 20 7, 85 .... 9, 999 9, 9997
Les deux paramètres r et K du modèle logistique ont des interprétations biologiques faciles
à comprendre. En effet, le facteur r(1 − YKt ) (qui a remplacé le taux de reproduction constant
r du modèle malthusien) vallant pratiquement r lorsque la taille de la population Yt est petite
et tendant par contre vers 0 lorsqu’elle se rapproche de K, la constante r, appelée taux de
croissance intrinsèque, est le taux de reproduction de la population lorsque sa taille est petite
et donc qu’il n’y a pas de limitation. La constante K, appelée capacité biotique, est une taille
limite de la population étudiée vers laquelle elle tend (si r > 0) lorsque t augmente indéfiniment.
C’est une sorte d’effectif d’équilibre dont la valeur dépend des ressources disponibles pour cette
population.
En réalité, l’étude numérique (calcul explicite de diverses trajectoires) et l’étude mathématique
de cette récurrence révèle que ce modèle est plus compliqué qu’il y paraı̂t et que certaines
solutions présentent des comportements bien différents d’une simple croissance logistique (y
compris certains comportements appelés chaotiques que nous n’étudierons pas ici). Par ex-
emple, si la taille de la population initiale est supérieure à sa capacité biotique K, on peut
observer une décroissance brutale en dessous de K suivie d’une croissance plus lente vers K
comme le montre les valeurs indiquées ci dessous correspondant toujours à l’équation logistique
∆Yt = 0.7Yt (1 − Yt /10)de la figure (3.2) mais cette fois pour une condition initiale Y0 = 17 (voir
aussi le premier dessin de la figure (3.3)) :
22CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE
Yt+1
12
10
0
0 2 4 6 8 10 12
Yt
t 0 1 2 3 4 5
Y 17 8, 67 9, 4772 9, 8240 9, 945 9, 9833
où F est une fonction quelconque. Par exemple, F (y) = (1 + r)y dans le cas malthusien et
2
F (y) = (1 + r)y − ry
K dans le cas logistique. Une solution (Yt )t>0 d’une équation aux différences
(3.5) est simplement une suite vérifiant cette récurence et son premier terme Y0 s’appelle sa
3.4. EQUATIONS AUX DIFFÉRENCES (OU RÉCURENCES) 23
18
12
16
14 10
10
12
8
10
6
8
5
6 4
4
2
2
0
0 2 4 6 8 10 12 14 16 18 20
Yt 0
0 5 10 15
Yt 0
0 2 4 6 8 10 12 14
Yt
Fig. 3.4 – Diverses représentations en toile d’araignée (cobweb). On a pour ces trois figures
K = 10, mais on a r = 0.7 et Y0 = 19 pour la première, r = 1.9 et Y0 = 14 pour celle du milieu
et r = 2.3 et Y0 = 10.5 pour la dernière. Dans les deux premières figures, l’équilibre Y ∗ = 10 est
stable alors qu’il est instable dans la dernière.
condition initiale. Une fois choisie l’équation aux différences la mieux adaptée à la dynamique de
la population que l’on étudie, le problème suivant est de décrire le comportement des solutions
de l’équation et plus spécialement celui de la solution ayant pour condition initiale l’effectif
présent Y0 de la population. Même s’il est toujours possible de calculer de proche en proche les
valeurs successives d’une solution, il n’est pas nécessairement facile d’en prédire le comportement
à venir, au dela des termes calculés.
Le principal outils dont on dispose pour décrire les trajectoires d’une équation aux différences
est l’étude des équilibres et de leur stabilité. Un équilibre est une trajectoire qui ne bouge pas,
c’est-à-dire telle que Yt+1 = Yt pour tout t ≥ 0. Donc si Y0 = Y ∗ est un équilibre, on aura
Y0 = Y1 = Y2 = Y3 = . . .. le nombre Y ∗ est donc un point fixe de la fonction F , c’est-à-
dire une solution de l’équation F (y) = y. Géométriquement, c’est un point où le graphe de
F coupe la droite des points ayant une abscisse égale à leur ordonnée comme on peut le voir
sur les représentations de type cobweb. Lorsqu’on a repéré un équilibre d’une dynamique, la
question se pose de savoir si les solutions issues des points voisins vont tendre à se rapprocher
de l’équilibre, on dit alors que l’équilibre est stable, ou si au contraire elles vont s’en éloigner, on
dit alors qu’il est instable. Les équilibres stables sont essentiels en terme de modélisation car ils
correspondent à des comportements type du système dynamique auquel celui-ci aura tendance à
s’identifier, après une période transitoire éventuellement, et ce, quelque soit sa position initiale.
Au contraire les équilibres instables sont des états dont le système s’écarte sans jamais s’en
rapprocher et sont donc de bien moindre importance. Il est utile de savoir discerner un équilibre
stable d’un équilibre instable. Pour cela on peut se convaincre en observant la dynamique sur
les représentations en toile d’araignée (cobweb) qu’un point de la diagonale est un équilibre
stable lorsque le graphe de F coupe cette diagonale en étant croissant et en passant du dessus
au dessous (figure (3.3)) et inversement il sera instable lorsque le graphe de F la coupe en étant
croissant et en passant du dessus au dessous. On vérifie ce fait facilement sur un dessin. On a
des caractérisations analogues, quoiqu’un peu plus complexes lorsqu’au point d’intersection le
graphe de F est décroissant.
Comment peut-on distinguer ces différents comportements au moyen d’un simple calcul ?
Plaçons nous dans le cas où au point d’équilibre la fonction F est croissante, c’est-à-dire F 0 > 0.
Comme la diagonale est une droite de pente 1, si l’intersection avec le graphe de F se fait du
dessous vers le dessus, c’est que la tangente à F en ce point a une pente supérieure à 1 et donc
que F 0 > 1 et de même l’intersection se fera du dessus vers le dessous si cette pente est inérieure
à 1, et donc si F 0 < 1. Plus généralement, que F soit croissante ou non, on a le résultat suivant
qui permet de déterminer facilement la stabilité des équilibres d’une dynamique de la forme
24CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE
Proposition 3.1 Si Y ∗ est un équilibre de l’équation aux différences (3.5), alors cet équilibre
est stable si |F 0 (Y ∗)| < 1 et instable si |F 0 (Y ∗)| > 1. Lorsque F 0 (Y ∗) = 1 ou F 0 (Y ∗) = −1, on
n’est pas en mesure d’en déduire s’il est stable, instable ou ni l’un ni l’autre.
Exemple :
1. L’équation malthusienne (3.2) possède un unique équilibre Y ∗ = 0 et il est instable lorsque
r > 0 car F 0 (0) = 1 + r. Cela signifie que quelque soit l’effectif initial de la population, il
va s’éloigner de 0 lorsque t augmente, donc croı̂tre indéfiniment.
2. L’équation logistique (3.4) possède deux équilibres, Y ∗ = 0 et Y ∗ = K (les deux solutions
de l’équation y + ry(1 − y/K) = y), le premier est instable (comme dans le cas malthusien)
car F 0 (0) = (1 + r) si r > 0. Le second est stable lorsque 0 < r < 1 car F 0 (K) = 1 − r et
instable lorsque r > 1.
3.5 Exercices
Exercice 1 : Des biologistes ont tenté d’acclimater le renne dans des ı̂les de la mer de Béring.
Dans l’une d’elles, 21 individus furent introduits en 1911. En 1938, avant l’effondrement de
la population, 2000 rennes furent dénombrés. A partir de ces données, en supposant que
la croissance de la population est de type malthusien, calculer le coefficient de croissance
r de cette population.
Réponses : Si la population a une dynamique malthusienne, sa taille Yt à l’instant t vérifie
une équation aux différences de la forme Yt+1 = (1 + r)Yt , et donc elle peut s’écrire
Yt = (1 + r)t Y0 , où Y0 est sa taille initiale. Ici on a Y0 = 21, t = 1938 − 1011 = 27 et
Yt = Y27 = 2000. On en déduit donc l’équation suivante pour r : 2000 = (1+r)27 (21). Pour
résoudre cette équation, on prend le logarithme des deux membres. On obtient ln(2000) =
(27) ln(1+r)+ln(21), d’où ln(1+r) = ln(2000)−ln(21)
27 , soit r = exp( ln(2000)−ln(21)
27 )−1 ' 0, 184.
Selon ce modèle, ces observations correspondent donc à une croissance de cette population
à un taux constant de 18, 4% l’an.
Exercice 2 : Des nutriments entrent dans une cellule en quantité constante R par unité de
temps et en sortent proportionnellement à la concentration. Si Nt désigne la concentration
à l’instant t, cette dynamique peut s’écrire Nt+1 − Nt = R − KNt .
1. Cette dynamique est donnée par une équation aux différences de la forme Nt+1 =
F (Nt ). Que vaut F ? Tracer le graphe de F en supposant par exemple que R = 5 et
K = 1.5.
2. Trouver graphiquement le point fixe de F puis calculer ses coordonnées.
3. En supposant à nouveau que R = 5 et K = 1.5, déterminer les 6 premières valeurs
de la trajectoire de cette dynamique issue de N0 = 2 et en faire une représentation
en cobweb. Même question pour la trajectoire issue de N0 = 6, de N0 = 8.
4. Selon ce modèle, la concentration va-t-elle tendre vers un équilibre ? Lequel ? Est-il
stable ?
Réponses : 1. La fonction F (y) = R−(K −1)y a pour graphe une droite de pente −(K −1)
et d’ordonnée à l’origine R.
2. Le point fixe de N ∗ de F , solution de l’équation F (N ∗) = N ∗, soit R − (K − 1)N ∗ =
R
N ∗, est donc égal à N ∗ = K . Dans le plan (Nt , Nt+1 ), cet équilibre a pour coordonnées
R R
( K , K ).
3.5. EXERCICES 25
Modèles dynamiques
discrets/continus
t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5
Afin de quantifier la croissance de cette population bactérienne pour prévoir son évolution au
cours du temps, on recherche un modèle dynamique qui donnerait la densité de la population en
fonction du temps. L’examen de la suite des points (t, Yt ) (voir la figure) montre une croissance
qui pourrait être exponentielle et donc la première idée est d’ajuster un modèle malthusien
discret Yt+1 = (1 + r)Yt . Mais l’irrégularité des pas de temps conduit à rechercher plutôt une
fonction y(t) définie pour tout t ≥ 0 et qui prendrait approximativement les valeurs observées
aux instants d’observation.
Pour trouver une telle fonction y(t), on procède de la façon suivante. A partir des observa-
tions, on étudie non pas la fonction y(t) elle-même mais sa dérivée y(t)0 = dy
dt . En se souvenant
27
28 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS
de ces pentes successives (que l’on peut calculer facilement), on voit qu’elles sont presque égales
à Yt .
t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5
∆Yt /∆t 10, 0 13, 33 17, 27 23, 00 26, 3 38, 0 41, 30 .
dy
D’où l’idée de rechercher une fonction y(t) vérifiant l’équation différentielle dt = y. La
solution de cette équation différentielle sera la fonction cherchée.
5 1
4
y
0.5
–1 0 1 2 3 4
2
x
1 –0.5
–1 0 1 2 3 4 5
–1
x
Fig. 4.1 – Les champs de vecteurs associées aux équations différentielles y 0 = y et y 0 = 18y 2 .
Mais lorsque l’équation n’est pas linéaire, il est très rare que l’on puisse la résoudre ex-
plicitement. Cependant, même si l’on ne peut pas calculer la famille des solutions de l’équation
différentielle, on peut avoir une idée de l’allure des graphes des solution en observant le champs
de vecteurs associé. En effet le graphe (t, y(t)) d’une solution de y 0 = f (y) est par définition tan-
gent au vecteur vitesse (1, y 0 (t)) et donc au vecteur (1, f (y)). La connaissance de f permet donc
de représenter ces vecteurs en un grand nombre de points, répartis dans le plan (t, y). La figure
(4.2) présente deux champs de vecteurs, celui qui est associé à l’équation y 0 = y et celui qui est
associé à l’équation y 0 = 18y 2 . La simple observation de ces champs de vecteurs permet souvent
de deviner les graphes des solutions, puisqu’il s’agit des courbes qui sont tangentes en tous leurs
points aux vecteurs du champs de vecteurs, même lorsqu’on ne sait pas résoudre l’équation. A
noter qu’on peut montrer que les graphes de deux solutions d’une même équation différentielle
ne peuvent jamais se recouper.
∆Yt
= rYt
∆t
rt
où r = ∆t (ou encore r = N rt ). Si ∆t est suffisamment petit, on peut assimiler le quotient ∆Y
∆t
t
dY (t)
à la dérivée Y 0 (t) aussi notée dt et on obtient alors le modèle suivant, qui est simplement la
version continue du modèle malthusien discret :
dy(t)
= ry(t). (4.2)
dt
Dans ce modèle, la taille de la population y(t) est une solution de l’équation différentielle y 0 = ry
et sa valeur y(0) à l’instant t = 0 est la taille initiale de la population (que l’on supposera
positive). On sait que, pour chaque condition initiale y(0), cette équation possède une solution
unique qui est égale à y(t) = y(0)ert . Il y a donc deux comportements possibles pour y(t) selon le
30 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS
16
14
2.5
12
2
10
y y
8
1.5
1
4
0.5
0 2 4 6 8 0 5 10 15 20
x x
Fig. 4.2 – A gauche : le champs de vecteurs et 3 solutions d’un modèle malthusien. A droite :
le champs de vecteurs et 4 solutions d’un modèle logistique
Yt+∆t − Yt Yt
= rt Yt (1 − )
Yt K
y(0)Kert
y(t) = .
K + y(0)(ert − 1)
dy(t)
= f (y(t)) (4.4)
dt
4.5. MÉTHODE D’EULER 31
(t0 , y0 ), (t1 = t0 +h, y1 = y0 +f (y0 )(t1 −t0 )), . . . , (tn = tn−1 +h, yn = yn−1 +f (yn−1 )(tn −tn−1 )), . . .
Il assez est clair que cette solution approchée sera d’autant proche de la solution exacte que
le pas h sera choisi petit et on peut effectivement vérifier que lorsque ce pas tend vers zéro,
la solution approchée tend vers la solution exacte. Mais, pour un pas donné, même petit, on
n’est jamais complètement sûr que le comportement de la solution approchée est le même que
celui de la solution exacte (exercice 4). Comme toujours, il est prudent de contrôler le résultat
fourni par l’ordinateur par des considérations de nature différente, comme par exemple une étude
qualitative.
4.6 Exercices
Exercice 1 : Soient a et b deux constantes et soit le modèle dynamique suivant : dz(t)
dt = az(t)+b.
1. Résoudre cette équation différentielle par le calcul et décrire le comportement des
solutions en fonction de la condition initiale.
2. En supposant (a, b) = (1, −2), tracer dans le plan (t, z) suffisamment de vecteurs
vitesse (1, dz
dt ) pour deviner l’allure des diverses solutions de ce modèle.
b
3. Même question pour (a, b) = (−1, 3). On dit que a est un équilibre de la dynamique.
Expliquer pourquoi.
Réponses : 1. Cette équation différentielle z 0 = az + b est une équation différentielle linéaire
qui a une solution ”triviale” z(t) = − ab et dont l’ensemble des solutions s’écrit {z(t) =
z0 eat − ab , z0 ∈ R}.
2. Avec ces valeurs des paramètres, l’équation différentielle s’écrit z 0 = z − 2. Voici
quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (1, 1), on
représente le vecteur de coordonnées (1, z − 2) = (1, −1), au point (t, z) = (1, 2),
on représente le vecteur de coordonnées (1, z − 2) = (1, 0), au point (t, z) = (2, 3),
on représente le vecteur de coordonnées (1, z − 2) = (1, 1). On note que les vecteurs
situés en des points de même ordonnée sont égaux entre eux (ce qui signifie que le
champs de vecteur est invariant par translation horizontale).
3. Avec ces valeurs des paramètres, l’équation différentielle s’écrit cette fois z 0 = −z + 3.
Voici quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (0, 1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 2), au point (t, z) = (1, −1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 4), au point (t, z) = (0, 3), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 0). La trajectoire issue du point
(0, z(t) = − ab = −3) est une trajectoire constante car les vecteurs situés sur la droite
z = −3 sont horizontaux. C’est pourquoi on appelle la solution z = −3 un équilibre.
Exercice 2 : On modélise la dynamique d’une population de bactéries responsable d’une mal-
adie des conifères par l’équation
dy(t)
= 0, 1y 2 (t)
dt
(t exprimé en mois et y(t) en dizaine de milliers).
1. Sans résoudre l’équation, indiquer le comportement de cette population à l’avenir,
selon ce modèle (à l’aide du champ de vecteurs par exemple).
10
2. Vérifier que y(t) = 1−t est une solution. Quelle est sa valeur initiale ? Tracer son
graphe.
3. Calculer la valeur approchée de cette solution par la méthode d’Euler en prenant le
pas h = 1/10. Comparer avec la solution exacte.
4.6. EXERCICES 33
Réponses : 1. Cette équation différentielle est de la forme y 0 = f (y) avec f (y) ≥ 0 pour tout
y. Comme f (y) est égale à la dérivée de la solution y(t), les solutions seront toutes
des fonctions croissantes. L’examen du champs de vecteurs montre en outre qu’elles
tendent vers l’infini.
celui d’une branche d’hyperbole issue du point (1, 10) ayant une asymptote verticale
en t = 1.
1 1
3. On a (t0 , y0 ) = (0, 10), (t1 = h, y1 = y0 + hf (y0 ) = ( 10 , 10 + ( 10 )10 = 11), (t2 =
2 1 100 2 10
10 2, y = 11 + ( 10 )( 9 ) = ( ,
10 9 ). On trouve pour les trois points suivants (t3 , y3 ) =
3 4 5
( 10 , 13.79), (t4 , y4 ) = ( 10 , 15.356), et (t5 , y5 ) = ( 10 , 17.456).
2. En utilisant la figure du champ de vecteur associé (figure (??)), vérifier qu’une solution
de cette équation de condition initiale positive (resp. négative) reste positive (resp.
négative) pour tout t > 0.
Exercice 5 : L’écureuil est un petit animal ayant un instinct territorial très développé. En
observant la dynamique d’une population d’écureuils, on peut faire les deux observations
suivantes :
– Si la population est trop grande, le taux de croissance décroı̂t ou même devient négatif.
– Si la population est trop petite, les écureuils en age de se reproduire courent le risque
de ne pas trouver de partenaire et donc, là encore, le taux de croissance est négatif.
Il est donc proposé le modèle dynamique suivant pour une population d’écureuils, k, N et
M étant des constantes positives telles que N > M :
y y
y 0 = ky 1 − −1
N M
60
50
40
30
20
10
0 20 40 60 80 100
y
2. Tracer plusieurs trajectoires (t, y(t)) de façon à avoir une idée graphique de la dy-
namique.
3. Préciser, en discutant selon les valeurs de la population initiale y(0), ce qu’il advient
de la population d’écureuils selon ce modèle (explosion, extinction, ...) et expliquer
ce que représentent les trois constantes k, N et M .
Exercice 6 : On considère une population de prédateurs y(t) qui se nourrissent exclusivement
de proies celle-ci formant une population notée x(t). On propose le modèle suivant pour
la dynamique de la population de prédateurs (β et q sont des constantes positives) :
dy(t)
= βx(t)y(t) − qy(t)
dt
1. Décrire la dynamique de la population de prédateurs en l’absence de proies.
2. Expliquer ce que représente le terme βx(t)y(t).
3. Décrire la dynamique de la population de prédateurs lorsque la populations des proies
est supposée constante (x(t) = C ste ).
4. Quelle équation pourriez-vous proposer pour modéliser la dynamique de la population
de proies ?
5. Notons qu’ici l’équation différentielle considérée est de la forme y 0 = f (y, t), avec
f (y, t) = βx(t)y − qy c’est-à-dire que la fonction f qui la définit dépends du temps
à travers la taille x(t) de la population de proies. On dit dans ce cas que l’équation
différentielle est non autonome. L’une des conséquence est que le champs de vecteur
associé n’est plus invariant par translation horizontale. Voyez-vous pourquoi ?
Chapitre 5
Les modèles malthusiens et logistiques ont un défaut qui n’a pas encore été souligné : ils
supposent que le taux de reproduction (différence entre les taux de natalité et de mortalité) est
identique pour tous les individus de la population. En réalité ces taux dépendent évidemment de
l’age des individus (ou de leur stade de développement). Ainsi dans une population de saumons
par exemple, oeufs, larves et poissons adultes n’ont pas le même taux de natalité ni le même
taux de mortalité. Nous allons étudier dans cette leçon le plus simple des modèles dynamiques
qui tient compte de cette hétérogénéité, le modèle linéaire ou modèle structuré en ages. Pour
rester le plus élémentaire possible, on supposera que la population étudiée dispose de ressources
illimitées, c’est-à-dire que l’on généralise ici le cas malthusien, qui ne tient pas compte des
limites environnementales et non le cas logistique. Bien entendu, il est possible de concevoir des
modèles plus élaborés qui prennent en compte à la fois la structure en age et les limitations
environnementales mais nous ne le ferons pas ici. Enfin cette étude sera aussi l’occasion de
développer l’outils mathématique du calcul matriciel, déjà abordé pour l’étude des chaines de
Markov, notamment par l’introduction des notions de valeurs propres et de vecteurs propres
d’une matrice.
35
36 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES
jt pt at
14000
12000
10000
8000
6000
4000
2000
0
0 1 2 3 4 5 6
t
Fig. 5.1 – Evolution des trois classes d’ages de la population de rongeurs décrite par la dynamique
(5.1) correspondant à la condition initiale (30, 50, 50).
Si l’on désigne respectivement par jt , pt et at les effectifs à l’instant t des femelles juvéniles, des
femelles préadultes (rongeurs de 1 an) et des femelles adultes (rongeurs de 2 ans), les informations
précédentes peuvent s’écrire :
jt+1 = 6pt + 10at
pt+1 = 0, 5jt (5.1)
a
t+1 = 0, 4p t
Ces formules (5.1) permettent, à partir des effectifs initiaux des trois classes, (j0 , p0 , a0 ), de
calculer les effectifs (j1 , p1 , a1 ) à l’instant suivant t = 1, puis, (j2 , p2 , a2 ) à l’instant t = 2 et ainsi
de suite. Si (j0 , p0 , a0 ) = (30, 50, 50), on obtient par exemple :
t 0 1 2 3 4 5 6
jt 30 800 290 2460 2470 7960 12330
pt 50 15 400 145 1230 1235 3980
at 50 20 6 160 58 492 494
On peut voir la dynamique des trois classes sur la figure (5.1) qui montre les premiers termes
des trois suites (jt ), (pt ) et (at ) pour 0 ≤ t ≤ 6.
Si l’on désigne par Nt = jt + pt + at l’effectif total de la population à l’instant t (et donc
N0 l’effectif initial), on peut également calculer à partir de (5.1) les termes successifs de la suite
(Nt ), ce qui permet d’apréhender aussi la dynamique de cette population dans son ensemble.
On a ici :
t 0 1 2 3 4 5 6
Nt 130 835 696 2765 3758 8687 16804
Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
jt+1 pt+1
jt , pt et at+1
at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur ces
premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la dynamique
de ces différentes classes d’age. Et si l’on considère la population dans son ensemble, les quotients
Nt+1
Nt ne sont pas plus réguliers.
5.2. LE MODÈLE DE LESLIE 37
t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2
Par contre si on laisse le temps augmenter, on constate que ces taux tendent tous vers la
même valeur λ, ici λ = 2, c’est-à-dire qu’après un certain temps, la dynamique considérée consiste
simplement en une multiplication par un facteur 2 des effectifs de chaque classe d’une période
à la suivante. Ce facteur multiplicatif, qui correspond à un taux de croissance asymptotique
s’appelle la valeur propre dominante et peut être calculé facilement comme nous allons le voir.
Si l’on s’intéresse maintenant non plus à la dynamique des effectifs mais à l’évolution au cours
du temps de la répartition des individus entre les diverses classes, on peut calculer, à partir de la
répartition initiale des individus selon ces trois classes v0 = (j0 /N0 , p0 /N0 , a0 /N0 ) l’évolution de
cette répartition au cours du temps vt = (jt /Nt , pt /Nt , at /Nt ). On constate que, cette répartition
tend vers une répartition asymptotique qui est celle du vecteur v = (100, 25, 5), c’est-à-dire
la répartition ( 100 25 5
130 , 130 , 130 ) ' (0.77, 0.192, 0.038). Cette répartition particulière a en outre la
propriété remarquable que, sur une population initiale répartie de cette façon, la dynamique est
exactement le comportement asymptotique indiqué plus haut, à savoir une multiplication des
effectifs par 2.
Si l’on introduit une notation vectorielle Xt pour le vecteur colonne des effectifs des trois classes
à l’instant t, et un nom L pour cette matrice, la dynamique peut donc se réécrire d’une façon
qui est très semblable aux dynamiques malthusiennes d’une population à une seule classe :
Xt+1 = L · Xt . (5.2)
Elle permet de modéliser par la dynamique (5.2) une population structurée en n classes d’age :
la première ligne contient les coeficients de fertilitéde chaque classe d’age f2 , f3 , ...fn et la sous
diagonale les probabilités de survie p1 , p2 , ...,pn−1 d’une classe d’age à la suivante. Les matrices
de Leslie ont tous leurs coefficients positifs ou nuls (mais elles ne sont pas pour autant des
matrices stochastiques car elles n’ont pas généralement la somme des coefficients de leurs lignes
égale à 1).
38 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES
5.5 Exercices
Exercice 1 : Considérons une population de saumons en limitant nos observations aux seules
femelles. Supposons qu’elles vivent au maximum 3 ans, avec un taux de survie de 0, 05% la
première année et 10% la seconde, et enfin supposons que chaque femelle donne naissance
à 2000 juveniles au cours de sa troisième année.
1. Ecrire le système dynamique modélisant l’évolution de cette population de saumons.
2. Indiquer quelle est la matrice de Leslie L de ce système.
3. Si l’on suppose que la population initiale comporte 1000 femelles dans chaque classes
d’age, combien y en aura-t-il de chaque classe l’année suivante ? Combien l’année
d’après ?
4. Calculer les effectifs l’année 4 et en déduire, sans nouveaux calculs, les effectifs des
années suivantes.
5. Représenter les effectifs des différentes classes d’age en fonction du temps.
Exercice 2 : Même exercice mais en supposant cette fois que la population de saumons femelles
présente 4 classes d’age (d’une année chacune) avec des taux de survie de 0, 5%, 7% et
15% respectivement et une reproduction uniquement durant la 4e année de 5000 juveniles
par femelle.
Exercice 3 : On considère un modèle de Leslie de matrice
!
2, 25 9
L=
0, 25 0
1. A quoi correspondent les trois coefficients non nuls de L par rapport à la population
que l’on modélise ?
2. Vérifier que 3 et −0, 75 sont deux valeurs propres de L de vecteurs propres respectifs
(3 ; 0, 25) et (−3 ; 1).
3. En déduire la valeur propre dominante λ∗ et un vecteur propre dominant X ∗ de
somme 1.
4. Pour une population initiale égale à X0 = (10 ; 10), calculer les premiers termes
de la dynamique X1 , X2 , X3 puis l’évolution de la répartition X X2 X3
N1 , N2 , N3 . Qu’en
1
concluez-vous ?
Exercice 4 : Même exercice pour !
0, 25 2
L=
0, 375 0
avec les valeurs propres 1 et −0, 75 et les vecteurs propres respectifs (1 ; 0, 375) et
(−1 ; 0, 5).
Exercice 5 : Un modèle de Leslie a été proposé pour représenter la dynamique de la population
d’un pays. Ne prenant en compte que les individu de sexe féminin, c’est-à-dire en ignorant
les naissances masculines dans les taux de fécondités des classes, on a choisi dix classes d’age
d’une durée de 5 ans et un pas de temps de 5 an également. On a obtenu les coefficients
suivants sur la première ligne de la matrice
0, 000 0, 0010 0, 878 0, 3487 0, 4761 0, 3377 0, 1833 0, 0761 0, 174 0, 0010
et les coefficients suivants sur la sous diagonale
0, 9966 0, 9983 0, 9979 0, 9968 0, 9961 0, 9947 0, 9923 0, 9987 0, 9831
1. Comment expliquer que les coefficients de la première ligne sont croissants puis
décroissants ?
2. Pourquoi le premier coefficient de la sous diagonale est-il inférieur au suivant ?
3. Pourquoi n’a-t-on pas tenu compte des individus de plus de 50 ans dans ce modèle ?
Chapitre 6
Le modèle proies-prédateurs de
Lotka-Volterra
Le modèle que nous étudions a été proposé par Volterra (et indépendemment par Lotka) en
1926 dans un ouvrage intitulé ”Théorie mathématique de la lutte pour la vie” qui est probable-
ment le premier traité d’écologie mathématique. Volterra avait été consulté par le responsable
de la pêche italienne à Trieste qui avait remarqué que, juste après la première guerre mondiale
(période durant laquelle la pêche avait été nettement réduite) la proportion de requins et autres
prédateurs impropres à la consommation que l’on pêchait parmi les poissons consommables était
nettement supérieure à ce qu’elle était avant guerre et à ce qu’elle redevint ensuite.
6.1 Le modèle :
Le modèle concerne deux populations dont les effectifs au temps t sont respectivement notés
x(t) et y(t), la seconde (les prédateurs) se nourissant de la première (les proies). On fait les
hypothèses suivantes (inévitablement simplificatrices !) :
– Les proies x(t) disposent de nouriture en quantité illimitée, seuls les prédateurs y(t) s’op-
posent à leur croissance et en l’absence de prédateurs la population des proies a une
croissance exponentielle (modèle malthusien).
– Le nombre de prédateurs est limité par la quantité de proies dont ils disposent pour se
nourir et en l’absence de proies, la population des prédateurs a une décroissance exponen-
tielle (modèle malthusien).
– Le nombre de rencontres entre proies et prédateurs et à la fois proportionnel à x(t) et y(t)
donc proportionnel au produit x(t)y(t).
– Le taux de disparition des proies ainsi que le taux de croissance des prédateurs dues à
ces rencontres sont l’un et l’autre proportionnels au nombre de rencontres entres les deux
populations.
Ceci conduit au modèle suivant :
dx(t)
= α1 x(t) − β1 x(t)y(t)
dt (6.1)
dy(t)
= −α2 y(t) + β2 x(t)y(t)
dt
où α1 > 0 est le taux de natalité (naturel) des proies, α2 > 0 le taux de mortalité (naturel) des
prédateurs et β1 > 0 etβ2 > 0 des coefficients d’interaction entre les deux populations. Pour des
raisons évidentes, on ne s’interesse à ce système que pour des valeurs de x er y positives.
41
42 CHAPITRE 6. LE MODÈLE PROIES-PRÉDATEURS DE LOTKA-VOLTERRA
Modele de Lotka-Volterra
6
5 5
4
4
y
3
3
1
0 2 4 6 8 10 –10 –8 –6 –4 –2 0 2 4 6 8 10
x t
6.2 Un exemple :
Supposons par exemple qu’en l’absence de prédateurs la dynamique des proies soit la dy-
namique malthusienne x0 (t) = 0, 6x(t), qu’en l’ansence de proies celle des prédateurs soit la dy-
namique malthisienne y 0 (t) = −0, 25y(t) et qu’enfin les coefficients d’interaction soient β1 = 1, 8
et β2 = 0, 5. On obtient le système suivant :
(
x0 = 0, 8x(1 − 0, 5y)
(6.2)
y 0 = −0, 2y(x − 3)
La figure (6.1) représente d’une part les trajectoires de deux solutions particulières de ce
système (6.2) qui se révèlent être des courbes fermées de forme ovoı̈de parcourues dans le sens
inverse des aiguilles d’une montre et d’autre part les graphes (t → x(t)) et (t → y(t)) qui
représentent les dynamiques de chacune des deux populations, proies et prédateurs, au cours du
temps. On observe que ces dynamiques sont périodiques et présentent un comportement typique
des modèles de Lotka Volterra connu sous le nom d’oscillations autoentretenues. En effet ces
variations périodiques de la taille de ces deux populations ne sont pas dues à des variations de
leur environnement mais elles s’auto entretiennent : une diminution du nombre de proie entraine
une diminution du nombre de prédateurs qui en viennent à manquer de nourriture, diminution
qui, à son tour, rendra possible une nouvelle augmentation du nombre de proies profitant de
l’absence de prédateurs, augmentation qui va permettre un redémarrage de la croissance des
prédateurs et ainsi de suite. On notera en particulier que ces oscillations de x(t) et y(t) n’ont
pas lieu ensemble mais plutot de façon décalée dans le temps.
solution (x(t), y(t)) du système (6.3) issue de cette condition initiale. C’est le cas par exemple
du système différentiel suivant, appelé oscillateur harmonique,
dx(t)
= −y(t)
dt (6.4)
dy(t)
= x(t)
dt
En effet, il est facile de voir que, pour toutes les valeurs de A, les courbes t 7→ (A cos(t), A sin(t))
sont des solutions du système et qu’il suffit de choisir A = x(0)2 + y(0)2 . Mais le plus souvent on
ne trouvera pas d’expression explicite pour x(t) et y(t) et on aura recours à une étude qualitative
(comme nous allons le voir à présent) pour se faire une idée du comportement des solutions.
Pour l’étude qualitative, on se sert du champs de vecteur associé tel que celui qui est
représenté sur la figure (6.1). En effet, si une courbe t → (x(t), y(t)) est une solution du système
différentiel (6.3) alors elle est tangente en chacun de ses points au vecteur (f (x, y), g(x, y)).
Si l’on trace ce vecteur en chaque point (x, y) du plan, les trajectoires solutions du système
sont simplement des courbes tangentes en chacun de leurs points aux vecteurs de ce champs de
vecteurs. Notons que si en un point f (x, y) = 0, le vecteur en ce point sera vertical, et de même
si g(x, y) = 0, il sera horizontal. On en déduit que la courbe d’équation g(x, y) = 0, appelée
isocline horizontale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3)
ont une tangente horizontale. De même la courbe d’équation f (x, y) = 0, appelée isocline verti-
cale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3) ont une tangente
verticale. Les points d’intersections de ces deux isoclines sont les équilibres (x∗, y∗) du système
c’est-à-dire les points tels que la trajectoire issue d’un tel point reste en ce point pour tout t.
Dans chacune des régions du plan délimitées par les deux isoclines horizontales et verticales, les
quantités f (x, y) et g(x, y) sont de signe constant et on peut schématiser la direction du champs
de vecteurs par une flèche de l’un des quatres type suivants : vers la droite et vers le haut (si
f > 0 et g > 0), vers la droite et vers le bas (si f > 0 et g < 0), vers la gauche et vers le haut
(si f < 0 et g > 0), vers la gauche et vers le bas (si f < 0 et g < 0). La position des équilibres,
celle des deux isoclines verticale et horizontale, les flèches du champs de vecteurs et la pro-
priété qu’on les trajectoires de ne jamais se croiser, permettent une étude qualitative du système
(6.3) : le plus souvent, on peut en déduire l’allure des solutions en fonction de leur condition
initiale (x(0), y(0)). Pour le modèle de Lotka-Volterra, une telle étude révèle la présence d’un
équilibre (x∗, y∗) = ( αβ22 , αβ11 ) à l’intersection de l’isocline horizontale −α2 + β2 x = 0 et vertical
α1 − β1 y = 0 et montre également que les trajectoires tournent autour de cet équilibre, comme
on le voit sur la figure (6.1). Dans l’exemple, l’isocline verticale est la droite d’équation x = 3,
l’isocline horizontale la droite d’équation y = 2 et l’équilibre est le point (3 ; 2).
Oscillateur harmonique 3
3
2
2
y
1
1
–4 –3 –2 –1 0 1 2 3 4
–3 –2 –1 0 1 2 3
x t
–1 –1
–2 –2
–3
–3
Proposition 6.1 Pour que H(x, y) soit une loi de conservation pour le système (6.3), il suffit
que
∂H ∂H
(x, y) · f (x, y) + (x, y) · g(x, y) = 0
∂x ∂y
où ∂H
∂x (x, y) est la dérivée partielle de H(x, y) par rapport à x (que l’on obtient en dérivant H
par rapport à x tout en laissant y fixe) et de même pour ∂H ∂y (x, y).
H(x, y) = α1 ln y − β1 y + α2 ln x − β2 x
est une loi de conservation. On en déduit que les courbes de niveau de H, c’est-à-dire les courbes
d’équation H(x, y) = C ste , qui, autour de l’équilibre, sont des courbes fermées concentriques,
sont des trajectoires du système.
6.5 Exercices :
Exercice 1 : On suppose que deux populations d’araignées et de papillons sont modélisées par
un modèle de Lotka-Volterra avec α1 = 0, 1, α2 = 0, 5 et β1 = β2 = 0, 001. Si l’on suppose
que les tailles initiales des deux populations sont respectivement de 200 araignées et 600
papillons, quelle sera, selon ce modèle, la dynamique de ces deux populations à court
terme ? Pour répondre à cette question, on pourra commencer par tracer les deux isoclines
horizontale et verticale, le point d’équilibre et l’allure de la trajectoire ayant la condition
initiale indiquée.
Exercice 2 : On considère la fonction H(x, y) = 12 x2 y.
1. Représenter sur le même graphique ses courbes de niveau 0, 1, −1, 2, −2. Indiquer
l’allure de l’ensemble des courbes de niveau de H.
2. On considère le système différentiel
(
x0 = −x
(6.5)
y 0 = 2y
6.5. EXERCICES : 45
ModŁle de Lotka-Volterra
1.4
1.4
1.3
1.3
1.2
1.2
1.1
1.1
1
1
0.9 0.9
0.8
0.8
0.7
0.7
Montrer que la fonction H(x, y) est une loi de conservation de ce système. En déduire
l’allure des solutions du système (indiquer le sens de parcours des trajectoires).
3. Retrouver ce même dessin en faisant une étude qualitative du système (6.5) (isoclines,
équilibres, flèches dans les différents secteurs).
4. Choisir un point (x0 , y0 ) du premier quadrant (x0 > 0, y0 > 0) et calculer la so-
lution (x(t), y(t)) du système (6.5) issue de ce point en résolvant explicitement le
système. Préciser l’évolution au cours du temps que ce système prévoit s’il représente
la dynamique de deux populations.
Exercice 3 : On considère le système différentiel suivant :
(
x0 = x
(6.6)
y0 = x − y
1. Indiquer sur un dessin la position des isoclines verticales et horizontales, les équilibres,
la direction du champs de vecteurs dans les différentes régions délimitées par les
isoclines.
2. Préciser la direction du champs de vecteurs sur la droite y = 12 x. En déduire que
(x(t), y(t)) = (et , 12 et ) est une solution particulière du système (6.6). Quelle est la
solution de condition initiale (x(0), y(0)) = (−1, − 12 ) ?
3. Tracer sur votre dessin la famille des trajectoires.
Exercice 4 : Sur le premier graphique de la figure (??) ci-dessus, on a représenté deux solutions
du modèle de Lotka-Volterra, comme courbes paramétrées (t → (x(t), y(t))) et, sur le
second, pour l’une de ces deux solutions, on a représenté ses deux composantes (t → x(t))
et (t → y(t)) comme fonctions du temps.
1. A laquelle des deux trajectoires représentées sur le premier graphique correspond les
deux courbes du second graphique ? Justifier.
2. Entre les instants t = 0 et t = t1 , l’une des deux coordonnées est décroissante alors que
l’autre croı̂t puis décroı̂t. Indiquer sur le premier graphique les points correspondant
aux instants t = 0 et t = t1 que vous noterez A0 et A1 respectivement. Expliquer, en
terme de comportement comme proies ou comme prédateurs des populations étudiées,
comment on peut expliquer ce type d’évolution.
Chapitre 7
Une situation courante en sciences biologiques est d’avoir à sa disposition deux ensembles de
données de taille n, {y1 , y2 , . . . , yn } et {x1 , x2 , . . . , xn }, obtenus expérimentalement ou mesurés
sur une population. Le problème de la régression consiste à rechercher une relation pouvant
éventuellement exister entre les x et les y, par exemple de la forme y = f (x). Lorsque la relation
recherchée est affine, c’est-à-dire de la forme y = ax + b, on parle de régression linéaire. Mais
même si une telle relation est effectivement présente, les données mesurées ne vérifient pas en
général cette relation exactement. Pour tenir compte dans le modèle mathématique des erreurs
observées, on considère les données {y1 , y2 , . . . , yn } comme autant de réalisations d’une variable
aléatoire Y et parfois aussi les données {x1 , x2 , . . . , xn } comme autant de réalisations d’une
variable aléatoire X. On dit que la variable Y est la variable dépendante ou variable expliquée
et que la variable X est la variable explicative .
Pn
(x −x)(yi −y)
Un calcul montre que ces valeurs, notées â et b̂, sont égales à â = P
i=1 i
n et b̂ =
(x −x)2
i=1 i
y −âx. On exprime souvent â au moyen de la variance et de la covariance des variables aléatoires
47
48 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES
Fig. 7.1 – Illustration de la formule DT=DA+DR. La droite horizontale passe par le centre de
gravité du nuage ; la première figure représente la dispersion totale DT, la seconde la dispersion
due à la regression DR (nulle si la pente de la droite des moindres carrés est nulle et importante
si cette pente est forte) et la troisième la dispersion autour de la droite, ou dispersion résiduelle.
n n
1X 1X
s2x = (xi − x)2 et covxy = (xi − x)(yi − y).
n i=1 n i=1
covxy
rxy = .
sx sy
C’est un nombre compris entre −1 et +1, qui vaut +1 (resp. −1) si les points du nuage sont
exactement alignés sur une droite de pente a positive (resp. négative). Ce coefficient est une
mesure la dispersion du nuage. On considère que l’approximation d’un nuage par sa droite des
moindres carrés est de bonne qualité lorsque |rxy | est proche de 1 (donc rxy proche de +1 ou
de −1) et de médiocre qualité lorsque√ |rxy | est proche de 0. En pratique on estime souvent la
régression acceptable lorsque |rxy | ≥ 23 .
Parfois on préfère calculer non plus rxy mais son carré noté R2 = rxy rxy car on a la relation
suivante (voir figure 7.2) :
X X X
(yi − y)2 = (yi − ŷi )2 + (ŷi − y)2
qui exprime que la dispersion totale de Y (DT) est égale à la dispersion autour de la régression
(DA) plus la dispersion due à la régression (DR). Or on peut vérifier que l’on a R2 = DR DT ,
c’est-à-dire que le R2 représente la part de la dispersion totale de Y que l’on peut expliquer par
la régression. Ainsi si l’on obtient une valeur de R2 = 0, 86 (et donc r = ∓0, 92), cela signifie
que la modélisation par la droite des moindres carrés explique 86% de la variation totale, ce qui
est un très bon résultat.
Cependant, même avec un R2 excellent (proche de 1), notre modèle linéaire peut encore
être rejeté. En effet, pour être assuré que les formules données â et b̂ fournissent de bonnes
estimations de la pente et de l’ordonnée à l’origine de la droite de régression, il est nécessaire
que les résidus εi soient indépendant et distribués aléatoirement autour de 0. Ces hypothèses
ne sont pas forcément faciles à vérifier. Un tracé des résidus et un examen de leur histogramme
permet de détecter une anomalie grossière mais il faut faire appel à des techniques statistiques
plus élaborées pour tester réellement ces hypothèses (ce que nous ne ferons pas ici).
7.3. PRÉVISIONS 49
7.3 Prévisions
Si y = âx + b̂ est la droite des moindres carrés d’un nuage de points (xi , yi )i=1..n , on appelle
valeurs prédites de y par le modèle les valeurs ŷi := âxi + b̂.
On utilise notamment ces valeurs pour faire des prévisions : si les xi sont des dates successives,
x1 < . . . < xn , la valeur prédite pour y à une date future xn+1 est simplement ŷn+1 = âxn+1 + b̂.
Notons cependant que s’il peut sembler naturel d’utiliser une valeur prédite pour compléter les
données initiales dans l’intervalle des valeurs de X, on se gardera de prédire sans de multiples
précautions supplémentaires des valeurs de Y en dehors de cet intervalle. En effet il se peut que
la relation entre X et Y ne soit pas du tout linéaire mais qu’elle nous soit apparue comme telle
à tort parce que les xi sont proches les uns des autres.
7.4 Remarques
Pour finir voici quelques remarques :
1. Certains ne manqueront pas d’être surpris du fait qu’à coté des définitions de la variance
et de la covariance que nous avons données on trouve dans certains ouvrages (ou dans
les calculettes) une autre définition dans laquelle le facteur n1 a été remplacé par le fac-
1
teur n−1 . Disons que “notre” définition est la définition de la variance (ou la covariance)
1
théorique alors que celle qui comporte un facteur n−1 est la définition de la variance (ou la
covariance) empirique. La première est celle que l’on utilise lorsque n est l’effectif total de
la population alors que la seconde est celle que l’on utilise lorsque l’on estime la variance
(ou la covariance) sur un échantillon de taille n beaucoup plus petite que la taille totale.
De toute façon, dans le cadre de la régression linéaire, on notera que tant pour le calcul
de â que dans celui de rxy , le résultat sera le même que l’on utilise l’une ou l’autre de ces
formules.
2. Dans le calcul de la droite des moindres carrés, les variables X et Y ne jouent pas des
rôles interchangeables. La variable dépendante Y prend, comme son nom l’indique, des
valeurs qui dépendent de celles de X. D’ailleurs si l’on échange les rôles de X et de Y ,
on calcule une approximation linéaire de la forme x = â0 y + b̂0 , le critère des MCO est
P
alors E = ni=1 (xi − (a0 yi + b0 ))2 , et ce n’est plus le même et la droite que l’on obtient en
général. Cette droite, tout comme la précédente, passe par le centre de gravité du nuage
de point, mais c’est leur seul point commun. C’est le problème considéré qui indique s’il
faut considérer Y ou plutôt X comme variable dépendante (et l’autre comme variable
explicative). Mais si l’on s’intéresse aux interactions entre deux variables X et Y dont ni
l’une ni l’autre n’est clairement dépendante de l’autre, alors on pourra choisir de régresser
Y en fonction de X ou bien le contraire. Mais on ne doit pas s’attendre à obtenir les mêmes
résultats.
3. On appelle donnée éloignée (outlier) un point du nuage situé à l’écart. S’il est éloigné dans
la direction de y, il lui correspondra un important résidu. S’il est éloigné dans la direction
des x, il peut présenter un très petit résidu et en même temps avoir une grande influence
sur les valeurs de â et b̂ trouvées.
On appelle donnée influente un point du nuage dont l’oubli conduirait à une droite des
moindres carrés bien différente. C’est souvent le cas des données éloignées dans la direction
des x.
4. Attention à ne pas déduire trop hativement de la présence d’une liaison entre deux variables
une relation de cause à effet ! Si quelqu’un devait suivre le degré de murissement des pêches
et des abricots (par dosage de l’éthylène ou du fructose), il trouverait certainement une
relation linéaire entre les deux. Mais le murissement des abricots n’influe pas sur celui des
pèches ; ni l’inverse d’ailleurs. Par contre, les oscillations du niveau du lac Tchad (Afrique
50 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES
centrale) ont bel et bien leur source dans le cycle de 11 ans de l’activité solaire avec lequel
elles sont parfaitement corrélées. Prudence donc.
7.5 Exercices
Exercice 1 : On possède 6 spécimens fossiles d’un animal disparu et ces spécimens sont de
tailles différentes. On estime que si ces animaux appartiennent à la même espèce il doit
exister une relation linéaire entre la longueur de deux de leurs os, le fémur et l’humérus.
Voici les données de ces longueurs en cm pour les 5 spécimens possédant ces deux os
intacts :
fémur 38 56 59 64 74
humérus 41 63 70 72 84
1. Tracer le nuage de point correspondant à ces données. Pensez-vous que les 5 spécimens
peuvent appartenir à la même espèce et ne différer en taille que parce que certains
sont plus jeunes que d’autres ?
2. Calculer à l’aide de votre calculette mx , my , sx , sy et covxy . En déduire l’équation
de la droite des moindres carrés. Contrôler vos calculs en superposant son graphe au
nuage de points.
3. Calculer le coefficient de corrélation linéaire r. Qu’en concluez-vous ?
4. Reprenez les 2 questions précédentes en effectuant directement la regression linéaire
au moyen de votre calculette. Vérifier que vos résultats sont identiques.
1. Un statisticien pressé a fait calculer par sa machine la droite des moindres carrés pour
ces données et a trouvé la relation poid = 4, 88 + 0, 267age. S’est-il trompé ?
2. A votre avis, quelle est la pertinence de son modèle ?
3. Calculer puis tracer les résidus. Vous constaterez que deux résidus successifs sont
beaucoup plus souvent du même signe que du signe opposé. Ceci n’est pas com-
patible avec le fait qu’ils soient supposés indépendants. On dit que les résidus sont
autocorrélés. C’est une raison de rejeter le modèle.
7.5. EXERCICES 51
Exercice 4 : L’une des rares lois que l’on a pu mettre en évidence en Ecologie est la relation
existant entre le nombre N d’espèces présentes dans un habitat donné (bien délimité) et
la surface S de cet habitat. On considère généralement que cette relation est de la forme
N = AS B (7.1)
où A et B sont deux constantes. Afin de vérifier cette relation pour les plantes présentes
dans une prairie (pissenlit, paquerettes, orties, boutons d’or, ...), on a effectué les mesures
indiquées dans le premier tableau ci-dessous. On a représenté sur la première figure ci-
dessous les valeurs de N en fonction de celles de S et sur la deuxième les valeurs de
Ñ = ln(N ) en fonction de celles de S̃ = ln(S). On voit que la regression linéaire de Ñ sur
S̃ a donné :
Ñ = 0, 2199S̃ + 1, 7432 avec R2 = 0, 9684 (7.2)
1. Pourquoi n’a-t-on pas effectué directement une régression linéaire de N sur S ? Ex-
pliquez l’intéret de cette transformation des données.
2. Que représente R2 et que peut-on déduire de sa valeur ?
3. A partir de la régression linéaire (7.2), calculer les constantes A et B de la relation
(7.1).
4. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(128) ? En comparant avec
la valeur de S̃ observée, calculer le résidu ε en ce point.
5. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(100) ? En déduire le nombre
d’espèces pouvant coexister dans un habitat de surface S = 100, selon ce modèle.
Exercice 5 : On a mesuré sur un peuplement de bouleau blanc (Betula alba) dans le Massif
Central les circonférences des troncs de 21 individus à la hauteur de 1.3 mtres du sol
(indice DBH). Dans le même temps, un carottage des arbres a permis d’estimer leurs ages
respectifs. De cet ensemble de données on a extrait les données des arbres d’ages 1 à 120
par pas de 20 ans. Par ailleurs on a constaté sur le terrain que les arbres se répartissent en
trois catégories : les arbres les plus hauts (dominants), les arbres moyens (codominants)
et les arbres plus petits, sous le couvert des autres : les dominés.
1. Tracez sur un même graphique les trois courbes représentant la circonférence des
troncs en fonction de l’age. Que constate-t-on et comment interprétez-vous les différences
constatées ? Que pensez-vous de l’allure des courbes ? Quel type de fonction peut-on
envisager d’ajuster ?
2. On souhaite vérifier que la croissance en circonférence des troncs peut être modélisé
par une exponentielle saturée de la forme y(t) = ymax (1 − exp(rt)) où y(t) est la cir-
conférence l’instant t, ymax la valeur maximale que la circonférence peut prendre, r un
taux de croissance en circonférence et t le temps. Les valeurs de ymax ont été estimées
empiriquement à 86.4 cm, 65.43 cm et 36.00 cm pour chacune des trois catégories
d’arbres. En remarquant que, d’après l’expression de y(t), la quantité ln(y(t) − ymax )
52 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES
Classification automatique :
introduction
Elle est d’autant plus petite que les deux individus sont semblables (du point de vue des deux
critères retenus) et d’autant plus grande qu’ils sont différents.
On peut associer à chaque nuage d’individus une matrice D = (dij )0≤i≤n,0≤j≤n = (d2 (Mi , Mj )),
dite matrice des distances. C’est une matrice à n lignes et n colonnes, à coefficients positifs,
symétrique (puisque d2 (Mi , Mj ) = d2 (Mj , Mi )) et nulle sur la diagonale (puisque d2 (Mi , Mi ) =
0). Pour un nuage d’effectif n, il y a donc n(n−1)
2 distances à calculer.
A coté de la distance euclidienne, on peut définir d’autres distances (et donc d’autres matrices
des distances). Par exemple
53
54 CHAPITRE 8. CLASSIFICATION AUTOMATIQUE : INTRODUCTION
pk les poids respectifs de chaque classe que l’on définit de la façon suivante : si l’on suppose que
tous les individus ont le même poids égal à n1 , le poids pl de la classe Γl est égal à l’effectif de
Γl divisé par n. De cette façon la somme des poids de toutes les classes vaut 1. Rappelons que
le centre de gravité G d’un nuage de points Γ est le point moyen du nuage, c’est-à-dire le point
P P
G = (x, y, . . .) de coordonnées x = n1 ni=1 xi , y = n1 ni=1 yi , ....
Pour mesurer la proximité ou l’écart entre deux classes Γl et Γm , il existe de nombreuses
façons de procéder. On calcule par exemple la quantité Min {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl }
appelée distance du plus proche voisin ou encore Max {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl } ou sim-
plement la distance des centres de gravité d2 (Gm , Gl ). Mais la mesure que l’on utilise le plus
souvent appelée écart de Ward est définie par :
p m pl
d(Γm , Γl ) := d2 (Gm , Gl )2
pm + p l
où pl et pm sont les poids des deux classes.
1
I(Γ) = d2 (M1 , G)2 + d2 (M2 , G)2 + . . . + d2 (Mn , G)2 . (8.1)
n
L’inertie mesure la dispersion du nuage. Si le nuage Γ est composé de k classes Γ1 , Γ2 , .... ,
Γk , celles-ci seront d’autant plus homogènes que les inerties de chaque classe, I(Γ1 ), I(Γ2 ), ....
, I(Γk ), calculées par rapport à leurs centres de gravité G1 , G2 , .... , Gk respectifs, sont faibles.
La moyenne pondérée de ces inerties est appelée inertie intraclasse :
Théorème 8.1 L’inertie totale d’un nuage de points composé de différentes classes est la somme
de son inertie intraclasse et de son inertie interclasse, c’est-à-dire :
0.8
0.7
0.6
0.5
0.4
0.3
0.2
20 25 24 9 27 2 17 21 4 22 16 7 28 11 8 26 30 1 5 12 3 14 13 23 10 15 6 19 18 29
Etape 2 : Remplacer les deux individus de distance minimale par une classe (à 2 éléments)
numérotée n + 1.
Etape 3 : Calculer la perte d’inertie interclasse dû au regroupement précédent : on peut montrer
qu’il s’agit exactement de l’écart de Ward des deux individus regroupés.
Après ces trois étapes, la population compte alors n − 1 classes (n − 2 classes à un élément
et une à 2 éléments). On peut donc recommencer à l’étape 1 en remplaçant “individus” par
“classes” si nécessaire (et donc “distance entre individus” par “écarts entre classes”). Après
n − 1 itérations, tous les individus sont regroupés en une classe unique.
On construit alors un arbre, appelé dendrogramme (voir dessin ci-dessus) de la façon suivante.
On aligne sur l’axe horizontal des points représentant les différents individus et on les joint
deux à deux, successivement, en suivant cet algorithme de classification hierarchique ascendante
(commençant par les plus proches, etc...). On poursuit ainsi jusqu’à regroupement de tous les
individus en une classe unique. Pour plus de lisibilité, on pourra disposer les individus dans
l’ordre dans lequel les regroupements ont été effectués. Le niveau (hauteur) de chaque noeud
de l’arbre est, le plus souvent, choisi proportionnel à la part restante d’inertie intra sur l’inertie
totale ; dans ce cas, ce niveau est zéro lorsque tous les individus sont séparés (en bas) et vaut
1 lorsqu’il sont tous réunis en une seule classe (en haut). En fait, on trace ce dendrogramme
afin de visualiser le niveau où couper cet arbre pour réaliser la meilleure partition de l’ensemble
initial. On peut comprendre qu’il sera optimal de couper le dendrogramme à un niveau où le
regroupement entre classes conduit à une perte d’inertie inter maximale. On peut vérifier que
l’écart de Ward entre deux classes est en fait égal à la perte d’inertie inter que produirait la
réunion de ces deux classes en une seule. Le niveau des noeuds de l’arbre est donc facile à
calculer à partir des écarts de Ward entre les classes.
8.6 Exercices
Exercice 1 : Soient M1 = (1, 0), M2 = (0, 1) et M3 = (3, 1) trois points du plan.
1. Calculer les matrices des distances du nuage formé de ces trois points en utilisant
successivement la distance euclidienne d2 puis les distances d1 et d∞ .
2. On ajoute au nuage précédent les deux points M4 = (4, 2) et M5 = (4, 3). Décrire
les étapes successives d’une classification hiérarchique ascendante en calculant no-
tamment les coordonnées et poids des classes obtenues par regroupement et la perte
d’inertie intraclasse à chaque regroupement.
3. En déduire le dendrogramme. Quelle coupure suggérez-vous ?
Exercice 2 : (Sujet inspiré d’un article de John Hartshorne, paru dans le journal de la “British
Ecological Society”)
Un laboratoire d’écologie étudie les espèces micro-animales (larves, ..) présentes dans les
rivières et les étangs. Il réalise, dans 6 sites de rivière, notés R1, R2, R3, R4, R5 et R6, et 3
sites d’étangs, notés E1, E2 et E3, des prélèvements répétés qui lui permettent d’avancer
une liste des espèces présentes dans chacun de ces sites et de repérer les espèces présentes
dans plusieurs sites à la fois. La matrice suivante contient, pour chaque paire de sites A et
B, le nombre d’espèces communes aux 2 sites. Ainsi on y lit par exemple que 11 espèces
sont présentes au site R1 et qu’il y a 7 espèces présentes à la fois au site R1 et au site R2.
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 11 7 4 6 6 7 4 4 3
R2 7 15 8 8 9 6 3 3 2
R3 4 8 13 7 7 4 2 3 2
R4 6 8 7 15 7 6 6 8 6
R5 6 9 7 7 12 4 3 5 4
R6 7 6 4 6 4 10 6 5 5
E1 4 3 2 6 3 6 13 10 9
E2 4 3 3 8 5 5 10 15 11
E3 3 2 2 6 4 5 9 11 12
On se propose de regrouper les 9 sites en trois ou quatre classes composées de sites où ce
sont pratiquement les mêmes espèces qui sont présentes. Pour réaliser cette classification,
on propose de mesurer la distance entre deux sites A et B par la formule
nA + nB − 2nAB
d(A, B) =
nA + n B
où nA (resp. nB ) désigne le nombre d’espèces présentes au site A (resp. au site B) et nAB
le nombre d’espèces en commun entre les sites A et B. On obtient la matrice des distances
suivante :
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 0 0, 462 0, 666 0, 538 0, 478 0, 334 0, 666 0, 692 0, 74
R2 0, 462 0 0, 428 ...... 0, 334 0, 52 0, 786 0, 8 0, 852
R3 0, 666 0, 428 ...... ...... 0, 44 0, 652 0, 846 0, 786 0, 84
R4 0, 538 0, 466 ...... 0 0, 482 0, 52 0, 572 0, 466 0, 556
R5 0, 478 0, 334 0, 44 0, 482 0 0, 636 0, 76 0, 63 0, 666
R6 0, 334 0, 52 0, 652 0, 52 0, 636 0 ..... ..... 0, 546
E1 0, 666 0, 786 0, 846 0, 572 0, 76 0, 478 ..... ..... 0, 28
E2 0, 692 0, 8 0, 786 0, 466 0, 63 0, 6 ..... ..... 0, 186
E3 0, 74 0, 852 0, 84 0, 556 0, 666 0, 546 0, 28 0, 186 0
1. Compléter les coefficients manquants de cette matrice.
8.6. EXERCICES 57
2. Préciser quels sont les deux sites les plus proches ainsi que les deux sites les plus
éloignés.
3. La classification conduit au dendrogramme représenté ci-dessous. Décrire la compo-
sition des classes de la partition qui vous semble la plus appropriée.
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8 9 7 1 6 2 5 3 4
4. Un autre choix de distance entre les sites aurait-il pu conduire à une partition
différente ? Pourquoi n’a-t-on pas choisi la distance euclidienne ?
Exercice 3 : 1. En choisissant un nuage de trois points alignés sur l’axe des x regroupés
en deux classes, calculer l’inertie totale, l’inertie intraclasse et l’inertie interclasse.
Vérifier le théorème de Huygens dans cet exemple.
2. En considérant cette fois trois points du plan non nécessairement alignés, montrer
le théorème de Huygens (on pourra utiliser le fait que leurs projections sur les deux
axes de coordonnées vérifient le théorème).
Exercice 4 : Soit Γ := {Mi = (xi , yi ), i = 1, . . . , n} un nuage de points du plan, chacun étant
pondéré d’un poids n1 .
1. Quelle formule donne les coordonnées (x, y) du centre de gravité G du nuage en
fonction de xi , yi et n ?
2. En utilisant votre calculette, vérifier sur quelques exemples de nuages la “transitivité”
du centre de gravité, c’est-à-dire le fait que pour calculer les coordonnées de G on
peut, lorsque le nuage est la réunion de deux classes Γ1 et Γ2 , calculer d’abord les
centres de gravité G1 et G2 des deux classes puis calculer le centre de gravité de G1
et G2 affectés de leurs poids respectifs.
Exercice 5 : On considère les 6 points M1 = (−2, 3), M2 = (−2, 1), M3 = (−2, −1), M4 =
(2, −1), M5 = (2, 1) et M6 = (1, 0).
1. En supposant que les deux premiers points M1 et M2 sont les centres initiaux, décrire
par une succession de dessins, l’algorithme des centres mobiles en représentant les
centres, les classes, les nouveaux centres ... jusqu’à stabilisation de l’algorithme. On
calculera au passage si nécessaire les coordonnées des centres.
2. Recommencer en choisissant différemment les centres initiaux. Obtient-on la même
classification ?
Exercice 6 : Classifier les points du nuage précédent par une classification hiérarchique as-
cendante et représenter le dendrogramme (à noter que lorsqu’on doit regrouper les deux
points les plus proches et qu’il existe deux couples de points satisfaisant cette condition,
on convient de choisir les deux points dont les numéros sont les plus petits).
Université de Nice LSV1-MAB
Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 4 points,
6 points et 6 points (barème indicatif). On soignera les explications.
Exercice 1 : On considère une population Xt modélisée par une chaı̂ne de Markov à trois états S =
{x1 , x2 , x3 } et dont la matrice de transition est :
0, 65 0, 3 0, 05
P= 0 0, 2 0, 8
0 0 1
1. Quelle est, selon ce modèle, la probabilité que la population passe de l’état x2 à l’état x3 ?
P (Xt+1 = x3 /Xt = x2 ) =
1
5. Quelle est, selon ce modèle, la probabilité que la population passe de x1 à x3 en deux étapes ?
P (Xt+2 = x3 /Xt = x1 ) =
Exercice 2 : L’observation du développement d’une population d’animaux au cours du temps fait ap-
paraı̂tre les trois états jeunes, adultes et décès, que nous noterons respectivement j, a et d. Parmi
les jeunes, chaque année 30% deviennent adultes et 5% décèdent et parmi les adultes seuls 20%
restent en vie après un an. Bien entendu l’état de mort subsiste avec probabilité 1 d’une année à la
suivante.
1. On modélise cette dynamique par une chaine de Markov à trois états S = {j, a, d}. Ecrire sa
matrice de transition.
2. Si l’on suppose qu’au départ la population est de taille 1000 et se compose approximativement
de 500 jeunes et de 500 adultes, combien y aura-t-il de jeunes et d’adultes respectivement après
un an, selon ce modèle ?
3. Pour les uns et pour les autres, leur nombre a diminué. Pouvez-vous l’expliquer ? Quel défaut
du modèle cela fait-il apparaı̂tre ?
2
Exercice 3 : La figure ci-dessous montre une représentation en toile d’araignée (cobweb) de la trajectoire
de la dynamique ∆Yt = 0, 8Yt (1 − Yt /15) de condition initiale Y0 = 5.
18
16
14
12
Yt+1
10
0
0 2 4 6 8 10 12 14 16 18
Yt
3. Sans calcul supplémentaire, donner une valeur approchée de Y3 lue sur sa représentation.
Expliquer où l’on peut lire cette valeur.
3
Exercice 4 : On s’intéresse à la solution y(t) de l’équation différentielle y 0 = 50 − y de condition initiale
y(0) = 100.
1. Indiquer les coordonnées d’un vecteur tangent à cette solution en t = 0.
2. On a calculé la valeur approchée de cette solution par la méthode d’Euler en prenant le pas
h = 0, 5 et on a obtenu les valeurs suivantes :
t 0 0, 5 1 1, 5 2 2, 5
Solution approchée 100 ..... 62, 5 ...... 53, 125 51, 5625
Calculer les deux valeurs manquantes (en expliquant vos calculs).
3. Comme cette équation est linéaire à coefficients constants, on peut la résoudre par explicite-
ment. On obtient y(t) = Ce−t + A. Calculer les constantes C et A.
5. Avant même de calculer la valeur manquante dans le tableau précédent, on savait qu’elle était
supérieure à 50. Pourquoi ?
4
Université de Nice Identifiant :....... LSV1-MAB
Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points,
4 points et 5 points (barème indicatif). On soignera les explications. Les réponses doivent être données
sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur la
copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous ferez
figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.
Exercice 1 : Une espèce d’oiseaux a une durée de vie de 3 ans. En moyenne, chaque paire d’oiseaux
produit 2 oisillons au cours de leur première année et un échantillon typique de 8 oiseaux d’un an
produit en moyenne 15 oisillons. Au dela de leur deuxième année, les oiseaux ne se reproduisent
plus. Seul 40% des oiseaux d’un an survivent une deuxième année et seuls 30% des oiseaux de deux
ans survivent une troisième année. On suppose enfin que les oiseaux de sexes male et femelle se
répartissent équitablement au sein des couvées et que le taux de survie ne dépend pas du sexe.
1. Ecrire le système dynamique linéaire modélisant l’évolution de cette population structurée en
trois classes d’une année (notées jt , pt et at ) :
jt+1 = .........
pt+1 = ......... (1)
at+1 = .........
3. Si l’on suppose que la population initiale comporte respectivement 200, 64 et 10 oiseaux d’un,
deux et trois ans, combien y en aura-t-il de chaque classe l’année suivante selon ce modèle ?
Combien l’année d’après ?
4. Le calcul des valeurs propres de la matrice L indique qu’elle possède λ = 3/2 pour valeur propre
dominante. Que pouvez-vous en déduire concernant l’évolution de la population d’oiseaux dans
son ensemble ?
5. Pour une population initiale totale de N (0) = 274, on a obtenu les valeurs suivantes N (1) =
419, 2, N (2) = 622, ... , N (9) = 10656, 513, N (10) = 15984, 742 et N (11) = 23977, 127. Ces
valeurs confirment-elles l’évolution attendue ?
1
Exercice 2 : On modélise la dynamique de deux populations de type proies-prédateurs, disons des lapins
L(t) et des renards R(t), par le système de Lotka-Voterra suivant :
dL(t) = aL(t) − bR(t)L(t)
dt (2)
dR(t) = −cR(t) + eR(t)L(t)
dt
1. Décrire la dynamique de la population de lapins en l’absence de renards (i.e. si R(t) = 0).
5. Si le nombre de lapins à l’instant initial est L(0) = 1000 et le nombre de renards R(0) = 50,
ces effectifs vont-ils respectivement augmenter ou diminuer immédiatement après cet instant ?
On pourra s’aider pour répondre d’une esquisse du champs de vecteurs associé.
Exercice 3 : Une biologiste a remarqué que sous une lumière douce, la quantité d’auxine (hormone
végétale qui favorise la croissance en longueur des plantes) produite par les plantes augmentait
avec l’intensité lumineuse à laquelle elles étaient exposées. Pour le confirmer, elle fait l’expérience
suivante : elle sélectionne des plants identiques qu’elle place dans une pièce sombre plusieurs jours.
Puis elle divise ces plants en 8 groupes de 10 plants, chaque groupe étant placé sous une source
lumineuse d’intensité différente. Après deux semaines elle mesure la quantité d’auxine dans chaque
plant et détermine la moyenne par groupe. Voici ses résultats
2
Intensité lumineuse 5 10 20 40 80 160 400 600
Moyenne d’auxine 2.2 3.1 4.5 6.4 9.2 12 20.5 23.9
1. Le tracé suivant représente le nuage de point correspondant à ces données ainsi que la droite des
moindres carrés correspondante. Pensez-vous que la quantité d’auxine produite par les plantes
augmente linéairement avec l’intensité lumineuse à laquelle elles sont exposées ? Pourquoi ?
2. On a représenté cette fois les données (ln xi , ln yi ) obtenues à partir des précédentes en prenant
le logarithme de l’intensité lumineuse et de la moyenne d’auxine. Ce nuage se prête-il mieux à
une modélisation linéaire ?
3. Quelle relation ces données suggèrent-elles entre ces deux variables initiales ? Quel accroisse-
ment d’intensité lumineuse est requis, selon ces mesures, pour doubler la quantité d’auxine ?
Exercice 4 : La succession des quatres dessins suivants correspond aux étapes successives d’une classi-
fication hierarchique ascendantes des cinq points M1 (2, 0), M2 (0, 1), M3 (0, 2), M4 (3, 4) et M5 (5, 4)
progressivement regroupées en classes de deux ou trois points dont les centres de gravité sont notés
G6 , G7 et G8 . On suppose que les cinq points initiaux sont tous affectés du poids 1. La distance
choisie pour cette classification, qui apparait dans les quatres matrices de distance, est l’écart de
Ward.
1. Compléter le troisième dessin en y plaçant les trois points devant y figurer et indiquer sur les
quatres dessins le nom des points.
2. Compléter les six distances manquantes dans les matrices de distances.
3
3. Préciser les coordonnées des points G6 , G7 et G8
4
Université de Nice Identifiant :....... LSV1-MAB
Les cinq exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points, 5
points, 2 points et 2 points(barème indicatif). On soignera les explications. Les réponses doivent être
données sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur
la copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous
ferez figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.
Exercice 1 : On étudie l’évolution au cours du temps des formations végétales sur un vaste territoire
en les décomposant pour simplifier en trois catégories, lande, maquis et forêt. On modélise cette
dynamique par une chaine de Markov Xt d’espace d’états S = {l, m, f } et de matrice de transition :
0, 4 0, 6 0
P= 0 0, 2 0, 8
0, 35 0 0, 65
1. Tracer le diagramme en points et flèches associé.
2. Quelle est, selon ce modèle, la probabilité que la population passe de l’état maquis à l’état
forêt ?
P (Xt+1 = f /Xt = m) =
5. Quelle est, selon ce modèle, la probabilité que la population passe de l à m en deux étapes ?
P (Xt+2 = m/Xt = l) =
1
6. Connaissant la répartition initiale π0 = (0, 3 0, 4 0, 3), calculer la répartition à l’étape suivante
π1 . Des trois formations végétales, lesquelles progressent, lesquelles regressent ?
Exercice 2 : On étudie l’effectif Pt d’une population d’insectes en fonction du temps t mesuré en jours.
1. On suppose tout d’abord que les variations de cette population sont proportionnelles à son
effectif. Comment appelle-t-on cette dynamique ?
2. S’il y a 15 insectes le deuxième jour et 60 le quatrième, quel était l’effectif à l’instant initial ?
3. On suppose à présent que cette population suit un modèle logistique ∆Pt = rPt − sPt2 avec
P0 = 10, r = 0, 5 et s = 10−2 . Calculer les premiers points de sa trajectoire et décrire sa
dynamique dans ce cas.
2
5. Comment varierait, selon ce modèle, la population d’oiseaux dans le cas P0 = 50 ? Même
question pour le cas P0 = 100.
Exercice 3 : On considère une population d’oiseaux dont le cycle de reproduction comporte 3 étapes,
oeufs, oisillons (juveniles) et oiseau (adultes). Si l’on désigne respectivement par ot , jt et at les
effectifs à l’instant t de ces trois classes,
ot+1 = 6jt + 10at
jt+1 = 0, 5ot (1)
at+1 = 0, 4jt
1. Ecrire ce système sous forme matricielle et indiquer le sens des 4 coefficients 6, 10, 0, 5 et 0, 4.
2. Les formules (1) permettent, à partir des effectifs initiaux des trois classes, (o0 , j0 , a0 ), de
calculer les effectifs (o1 , j1 , a1 ) à l’instant suivant t = 1, puis, (o2 , j2 , a2 ) à l’instant t = 2 et
ainsi de suite. Si (o0 , j0 , a0 ) = (30, 50, 50), on obtient :
t 0 1 2 3 4 5 6
ot 30 ... 290 2460 2470 7960 12330
jt 50 15 400 ... 1230 1235 3980
at 50 20 ... 160 58 492 494
Compléter les valeurs manquantes du tableau puis expliquer vos calculs.
3
4. Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
ot+1 jt+1 at+1
ot , jt et at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur
ces premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la
dynamique de ces différentes classes d’age. Et si l’on considère la population dans son ensemble,
les quotients NNt+1
t
ne sont pas plus réguliers.
t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2
On constate que ces taux tendent tous vers la même valeur λ, ici λ = 2. On appelle ce coefficient
λ le taux de croissance asymptotique. Expliquer pourquoi.
Exercice 4 : Lorsque l’on calcule la droite de régression par la méthode des moindres carrés ordinaire,
on calcule aussi le coefficients de corrélation linéaire. De quoi s’agit-il et pourquoi le calcule-t-on ?
Exercice 5 : Qu’est-ce qu’une classification hierachique ascendante ? A quoi cela sert-il et comment
peut-on l’obtenir ?