Sunteți pe pagina 1din 61

MAB 2004-2005

Mathématiques Appliquées à la Biologie


LSV1, 2006-2007, 1er semestre

Notes de cours et énoncés d'exercices 1 :  Dynamiques aléatoires :


chaines de Markov
Notes de cours et énoncés d'exercices 2 :  Chaines de Markov :
compléments
Notes de cours et énoncés d'exercices 3 :  Dynamiques déterministes :
les modèles malthusien et logistique
Notes de cours et énoncés d'exercices 4 :  Modèles dynamiques :
discrets/continus
Notes de cours et énoncés d'exercices 5:   Dynamique d'une population
structurées en ages
Notes de cours et énoncés d'exercices 6 :  Le modèle proie-prédateurs
de Lotka-Volterra
Notes de cours et énoncés d'exercices 7 :  Méthode des moindres carrés
Notes de cours et énoncés d'exercices 8 : Classification automatique

Partiel (novembre 2006)


Examen : première session (Janvier 2007)
Examen : deuxième session (Juin 2007)

MAB 2004-2005.htm[22/09/2018 01:57:20]


Chapitre 1

Dynamiques aléatoires : chaines de


Markov

Pour modéliser l’évolution au cours du temps (la dynamique) de systèmes biologiques, par
exemple celle d’un organisme, d’une substance, d’un ecosystème, on choisit souvent des modèles
aléatoires. Les plus simples de ces modèles aléatoires sont les chaı̂nes de Markov qui, dans
le cas particulier étudié ici sont faciles à utiliser car il n’y a pratiquement aucun prérequis
mathématique. Elles nous donneront l’occasion d’une première familiarisation avec le calcul
matriciel que nous approfondirons lors des leçons suivantes.

1.1 La plus simple des dynamiques aléatoires


On modélise avec des chaı̂nes de Markov l’évolution au cours du temps de quantités X qui
peuvent prendre un nombre fini d’états X = x1 , X = x2 , . . ., X = xn et qui passent de l’état
xi à l’instant t à l’état xj à l’instant suivant t + 1 avec une probabilité pij donnée. Les nombres
P
pij = P (Xt+1 = xj /Xt = xi ) vérifient donc 0 ≤ pij ≤ 1 et nj=0 pij = 1 (puisque si la chaı̂ne
est dans l’état xi à un instant, elle sera nécessairement dans l’un des états possibles x1 , . . . , xn
l’instant suivant et donc pi1 + pi2 + . . . + pin = 1). ; L’expression P (Xt+1 = xj /Xt = xi ) s’appelle
une probabilité conditionnelle et représente la “probabilité que la quantité X vaille xj à l’instant
t + 1 sachant qu’elle valait xi à l’instant t”.
Pour définir une chaı̂ne de Markov il faut donc deux ingrédients de base :
1. L’espace des états S := {x1 , . . . , xn } connu que l’on supposera fini
2. La matrice de transition (ou de passage)
x 1 x2 . . . x n
 
p11 p12 · · · p1n x1
P = (pij )1≤i≤n,1≤j≤n =  .. ..  ..
 . .  .
pn1 pn2 · · · pnn xn

Fig. 1.1 – Diagramme en points et flèches correspondant à l’exemple de la dynamique de la


forêt naturelle à trois états, herbe, arbustes et forêt, étudiée ci dessous.

7
8 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV

A noter que cette matrice est appelée matrice stochastique parce que ses coefficients sont
tous compris entre 0 et 1 et la somme des coefficients de chaque ligne vaut 1 (ce qui n’est pas
vrai en général pour les colonnes).
On peut aussi représenter une chaı̂ne de Markov (S, P) par un diagramme en points et flèches
comme indiqué par la figure (1.1) correspondant à l’exemple ci-dessous. Dans ces diagrammes,
chaque état est représenté par un point et chaque coefficient pij non nul de la matrice de
transition par une flèche allant de l’état i à l’état j.
Si l’on connait la distribution initiale des différents états (c’est-à-dire la proportion d’indi-
vidus de la population étudiée se trouvant dans chacun des états xi , que l’on appelle la loi de
probabilité initiale π0 ), l’étude de la chaı̂ne de Markov va permettre de calculer, à partir de cette
répartition
S x1 x2 .... xn
π0 π0 (x1 ) π0 (x2 ) .... π0 (xn )
π0 (xi ) à l’instant t = 0, c’est-à-dire à partir des nombres π0 (xi ) := P (X0 = xi ), quels états la
population va atteindre à l’instant t = 1 et avec quelles probabilités π1 , puis à l’instant t = 2
et ainsi de suite. En d’autres termes, on va ainsi calculer la loi πt pour tous les t > 0 et ainsi
modéliser la dynamique de cette population.

1.2 Un exemple en écologie


On s’interesse au développement d’une forêt naturelle en région tempérée sur une parcelle
en friche (par exemple par abandon d’une zône cultivée ou suite à un incendie). Notre modèle
simplifié comporte 3 états. L’état 1 est celui d’une végétation constituée d’herbes ou d’autres
espèces pionnières ; l’état 2 correspond à la présence d’arbustes dont le développement rapide
nécessite un ensoleillement maximal et l’état 3 celui d’arbres plus gros qui peuvent se développer
dans un environnement semi ensoleillé. Si l’on note h, a, f ces trois états (pour herbe, arbustes,
forêt), on a donc ici S = {h, a, f }. Sur la parcelle on repère au sol un grand nombre de points
(un millier) répartis sur un maillage régulier et on enregistre à intervalle de temps fixé (tous les
3 ans) l’état de la végétation en chacun de ces points.
L’observation de l’ensemble de ces points à l’instant initial t0 permet de déterminer les
proportions initiales de chacun des 3 états π0 = (π0 (h), π0 (a), π0 (f )). Pour cela, on relève pour
chacun d’eux l’état dans lequel il se trouve et on calcule la proportion de points dans chacun des
états possible. On peut voir ces proportions comme les probabilités pour un point quelconque
de la parcelle d’être dans l’un de ces états à l’instant initial.
Dans ce modèle, on suppose connues les 9 probabilités
pij = P (X1 = j/X0 = i)
pour chaque valeur i ∈ {h, a, f } et j ∈ {h, a, f }, probabilités pour un point quelconque de passer
de l’état i à l’état j. On a (par exemple) :

 h a f 
0, 5 0, 45 0, 05 h
P=  
 0, 1 0, 5 0, 4  a
0 0, 1 0, 9 f
d’où le diagramme en points et flèches de la figure (1.1).
On peut ainsi calculer la probabilité de n’importe quelle succession d’états, appelée trajectoire
de la chaı̂ne de Markov. Par exemple la probabilité qu’en un point de la parcelle on observe la
succession d’états (h, h, a, f, f ) est égale à
P (X0 = h, X1 = h, X2 = a, X3 = f, X4 = f )
= π0 (h)P (X1 = h/X0 = h)P (X2 = a/X1 = h)P (X3 = f /X2 = a)P (X4 = f /X3 = f )
= π0 (h)phh pha paf pf f = π0 (h)(0, 5)(0, 45)(0, 4)(0, 9) = 0, 081π0 (h).
1.3. PUISSANCES DE P ET LOI STATIONNAIRE 9

Mais on ne cherche pas seulement à calculer la probabilité particulière de chaque trajectoire


de notre chaı̂ne de Markov, on voudrait plus généralement déterminer l’évolution des proportions
des trois états entre le premier et le deuxième instant, entre le deuxième et le troisième, et plus
généralement savoir comment vont évoluer ces proportions à l’avenir. Voici comment on procède.
Pour calculer les probabilités π1 des trois états à l’instant t = 1, c’est-à-dire pour calculer

π1 := (P (X1 = h), P (X1 = a), P (X1 = f )) = (π1 (h), π1 (a), π1 (f )),

on remarque que π1 (h) est égal à

P (X1 = h/X0 = h)P (X0 = h) + P (X1 = h/X0 = a)P (X0 = a) + P (X1 = h/X0 = f )P (X0 = f )

ce qui peut s’écrire ici π1 (h) = 0, 5 · π0 (h) + 0, 1 · π0 (a) + 0 · π0 (f ) compte tenu des valeurs des
probabilités de transition données par la matrice P. On remarque que π1 (h) est le produit scalaire
du vecteur π0 avec la première colonne de la matrice P. De même, on vérifie que π1 (a) est le
produit scalaire du vecteur π0 avec la deuxième colonne de la matrice P et que π1 (f ) est le produit
scalaire du vecteur π0 avec la troixième colonne de la matrice P. On résume cela en disant que
le vecteur π1 est le produit du vecteur π0 par la matrice P, ce qui s’écrit simplement π1 = π0 · P
ou simplement π1 = π0 P, comme un produit de deux nombres (mais ici il s’agit d’un vecteur et
d’une matrice). Cette formule très courte signifie que le vecteur π1 = (π1 (h), π1 (a), π1 (f )) est le
produit de la matrice P par le vecteur π0 = (π0 (h), π0 (a), π0 (f )), ce qui s’écrit encore de façon
matricielle :
 
0, 5 0, 45 0, 05
 
(π1 (h), π1 (a), π1 (f )) = (π0 (h), π0 (a), π0 (f ))  0, 1 0, 5 0, 4 
0 0, 1 0, 9

1.3 Puissances de P et loi stationnaire


Pour une chaı̂ne de Markov d’espace d’états S et de matrice de transition P, l’évolution au
cours du temps de la loi de probabilité initiale π0 est donnée par π1 = π0 P, π2 = π1 P = (π0 P)P =
π0 P2 ,... et plus généralement πt = πt−1 P = . . . = π0 Pn . En particulier, la matrice de transition
pour passer de l’état t à l’état t + 2 est égale à P × P = P2 , et plus généralement, celle pour
passer de l’état t à l’état t + k est égale à Pk . C’est une caractéristique importante des chaı̂nes
de Markov que la matrice de transition P élevée à la puissance k contient les probabilités de
transitions de chacun des états vers les autres en exactement k intervalles de temps.
Une loi de probabilité π sur l’espace des états S est appelée stationnaire pour la chaı̂ne de
Markov (S, P) si la chaı̂ne laisse la loi inchangée, c’est-à-dire si l’on a π P = π. Trouver les lois
stationnaires d’une chaı̂ne de Markov, s’il en existe, permet souvent de décrire plus facilement
sa dynamique, comme nous le verrons à la leçon suivante.

1.4 Exercices
Exercice 1 : Dans l’exemple décrit ci-dessus,
1. Calculer la probabilité des trajectoires suivantes (h, a, f, h), (h, a, f, a), (a, a, a).
2. Calculer la distribution des états π1 à l’instant t = 1 si l’on suppose π0 = (1, 0, 0).
Interpréter.
3. Montrer qu’une distribution uniforme π0 = (1/3, 1/3, 1/3) n’est pas une distribution
stationnaire pour cette chaı̂ne de Markov. Interprétez ce résultat.
4. Y-a-t-il une distribution stationnaire pour cette chaı̂ne de Markov ?
Réponses 1. P (h a f h) = π0 (h) · 0, 45 · 0, 4 · 0 = 0, P (h a f a) = π0 (h) · 0, 45 · 0, 4 · 0, 1 =
0, 018 · π0 (h) et P (a a a) = π(a) · 0, 5 · 0, 5 = 0, 25 · π0 (a)
10 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV
 
0, 5 0, 45 0, 05
 
2. π1 = π0 .P = (1, 0, 0).  0, 1 0, 5 0, 4  = (0, 5 0, 45 0, 05) Il y a donc, après
0 0, 1 0, 9
trois ans, la moitié de la parcelle recouverte de d’herbe, 45% d’arbustes et 5% de
foret, si l’on suppose qu’au debut il n’y avait que de l’herbe.
 
0, 5 0, 45 0, 05
1 1 1  
3. π0 .P = ( 3 3 3 ).  0, 1 0, 5 0, 4  = (0, 2 0, 35 0, 45) 6= π0 Donc la distribution
0 0, 1 0, 9
uniforme (même proportion de chacun des trois type) n’est pas stationnaire, ce qui
signifie que s’il y a au depart le même pourcentage de chacun des trois types, la
distribution, est modifiée après trois ans.
4. On doit résoudre l’équation π ∗ .P = π∗, c’est-à-dire, si on note π∗ = (p q r), on doit
trouver trois nombres compris entre 0 et 1 et de somme égale à 1, tels que :


 0, 5 p + 0, 1 q = p
0, 45 p + 0, 5 q + 0, 1 r = q (1.1)

 0, 05 p + 0, 4 q + 0, 9 r = r

2 10 41
On trouve la solution π∗ = ( 53 53 53 ).

Exercice 2 : Une souris se déplace dans un labyrinthe représenté ci-dessous qui comporte
5 compartiments numérotés de 1 à 5. On suppose qu’elle change de compartiment à
chaque instant t = 0, 1, 2, 3, . . . et que, lorsqu’elle se trouve dans un compartiment ayant
k portes (k = 1, 2 ou 3), elle choisit l’une des portes avec la probabilité k1 , ses choix étant
indépendants à chaque instant de ceux qu’elle a fait auparavant.
Le cheminement de la souris peut être décrit par une chaı̂ne de Markov (Xt )t=0,1,2,.. dont
les états sont les 5 compartiments et la matrice de transition P la matrice des probabilités
de passage d’un compartiment à un autre. Par exemple p12 = 12 car le compartiment 1
contient 2 portes dont l’une vers le compartiment 2.

1. Ecrire la matrice de transition.


2. Calculer les probabilités des cheminements suivants : (X0 = 1, X1 = 2, X2 = 1, X3 =
3, X4 = 5) et (X0 = 1, X1 = 2, X2 = 3, X3 = 4, X4 = 5)
3. Calculer la probabilité que la souris, partant à l’instant initial du compartiment 1,
atteigne le compartiment 5, en 2 étapes, en 3 étapes, en 4 étapes.
4. On ne considère plus désormais que la souris part nécessairement du compartiment
1. On étudie une autre distribution initiale sur l’ensemble des états de cette chaı̂ne
de Markov définie de la façon suivante : la probabilité de chaque compartiment est
proportionnelle au nombre de portes du compartiment. Préciser qu’elle est cette dis-
tribution initiale.
5. Cette loi de probabilité est-elle une loi stationnaire pour la chaı̂ne de Markov con-
sidérée ? Pourquoi ?
1.4. EXERCICES 11

Réponses 1. La matrice de transition est la suivante :


 
0 0, 5 0, 5 0 0
 0, 5 0 0 0, 5 0 
 
 1 1 1 
P= 3 0 0 3 3 
 
 0 0, 5 0, 5 0 0 
0 0 1 0 0

1 1 1 1 1
2. On trouve P (1 2 1 3 5) = π0 (1) 2 · 2 · 2 · 3 = 24 · π0 (1) et P (1 2 3 4 5) =
π0 (1) · 12 · 0 · 13 · 0 = 0
3. C’est un calcul de probabilité conditionnelle. On a P (X2 = 5/X0 = 1) = P (1 3 5) =
π0 (1) · 12 · 13 = 16 · π0 (1), P (X3 = 5/X0 = 1) = P (1 3 5) = 0 car il n’existe pas de
chemin allant de la case 1 à la case 5 en deux étapes et enfin P (X4 = 5/X0 = 1) =
P (1 2 4 3 5) + P (1 2 1 3 5) + P (1 3 4 3 5) + P (1 3 1 3 5) + P (1 3 5 3 5) =
1 1 1 1 1 7
24 · π0 (1) + 24 · π0 (1) + 36 · π0 (1) + 36 · π0 (1) + 18 · π0 (1) = 36 · π0 (1).
4. En considérant que la probabilité d’être dans une case est proportionnelle au nombre
de portes de cette case, la distribution initiale est π0 = ( 15 51 10 3 1
5
1
10 . En
effet π0 (1) est proportionnelle à 2, donc de la forme π0 (1) = 2λ, de même on aura
π0 (2) = 2λ, π0 (3) = 3λ, π0 (4) = 2λ et π0 (5) = λ. Comme on doit aussi avoir
1
π0 (1) + π0 (2) + π0 (3) + π0 (4) + π0 (5) = 1, il faut prendre λ = 10 .
5. C’est bien une distribution stationnaire car on peut s’assurer qu’elle verifie π0 · P = π0 .
Exercice 3 : Modélisation d’un brin d’ADN La modélisation la plus simple d’un brin d’ADN,
enchainement “désordonné” de nucleotides de l’un des 4 types adenine (a), cytosine (c),
guanine (g) et thymine (t), est de le considérer comme une trajectoire d’une chaı̂ne de
Markov Xn à quatre états S = {a, c, g, t} dont la matrice de transition P fournit les prob-
abilités que l’un de ces états succède à un autre. Ainsi le brin aagc est la trajectoire
X0 = a, X1 = a, X2 = g, X3 = c.
 
0 0, 3 0 0, 7
 0, 6 0 0, 4 0 
 
1. En supposant que la matrice P est donnée par P =   tracer
 0 0, 8 0 0, 2 
0, 3 0 0, 7 0
le graphe en points et flèches associé à cette chaı̂ne de Markov.
2. Calculer les probabilités des trajectoires suivantes en fonction de la probabilité initiale
de l’état c : cgcata et cgct.
3. La distribution initiale π0 = ( 18 ; 0 ; 78 ; 0) est-elle une distribution stationnaire pour
cette chaı̂ne de Markov ?
4. Reprendre les deux questions précédentes en prenant cette fois pour P la matrice
 
0, 3 0 0, 7 0
 0 0, 8 0 0, 2 
 
P= 
 0, 1 0 0, 9 0 
0 0, 4 0 0, 6

5. Supposons que vous puissiez observer un très long brin d’ADN. Indiquer quelle
méthode vous choisiriez pour estimer les probabilités de transitions figurant dans
la matrice P.
Exercice 4 : Une foret à deux espèces On suppose1 que l’on s’intéresse à une forêt com-
posée de deux espèces d’arbres, E1 et E2. Lorsqu’un arbre meurt, un nouveau grandit à
1
Exemple extrait du livre “Mathematical Models in Biology”, E.S. Allman et J.A. Rhodes, Cambridge Uni-
versity Press, 2004
12 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV

sa place mais il peut être de l’une ou l’autre des deux espèces. Ceux de la première espèce
ayant une longue durée de vie, on suppose que 1% d’entre eux meurt chaque année alors
que ce taux est de 5% pour la deuxième espèce. Mais ces derniers grandissant plus rapi-
dement réussiront plus souvent à occuper une place laissée vacante : on suppose que 75%
des places vacantes sont prises par un arbre de la deuxième espèce contre seulement 25%
pour un arbre de la première espèce.
1. Expliquer comment l’on peut modéliser la dynamique ce cette foret par une chaı̂ne
de Markov (Xt )t≥0 à deux états E1 et E2 et justifier la formule suiante :

P (Xt+1 = E1 /Xt = E1 ) = 0, 99 + 0, 01 · 0, 25 = 0, 9925.

2. En déduire la matrice de transition P de la chaı̂ne de Markov .


3. Tracer un diagramme en points et flèches.
4. Si l’on commence avec une population de 10 arbres de l’espèce E1 et 990 de l’espèce
E2, combien aura-t-on d’arbres de l’espèce E1 après une étape, deux étapes ?
5. π0 = (0, 01 0, 99) est-elle une distribution stationnaire pour cette chaı̂ne de Markov ?
6. Reprendre les deux questions précédentes si l’on suppose qu’il y a au depart une
proportion de cinq arbres de la première espèce contre trois de la seconde.
Chapitre 2

Chaines de Markov : compléments

Dans cette leçon, nous examinons quelles sont les principales propriétés des chaı̂nes de
Markov et nous étudions quelques exemples suplémentaires.

2.1 Propriétés de Markov


Lorsqu’un système est modélisé par une équation différentielle son avenir est uniquement
déterminé par sa situation présente, d’où son nom de dynamique déterministe. Pour une chaı̂ne
de Markov au contraire, on fait l’hypothèse qu’il y a plusieures évolutions possibles à partir de
la situation présente, chacune d’elles ayant une certaine probabilité de se réaliser. C’est cette
incertitude sur l’avenir qui est prise en compte par les modèles markoviens que l’on appelle
pour cette raison dynamiques aléatoires ou stochastiques. Il existe bien d’autres dynamiques
aléatoires que les chaı̂nes de Markov mais celles-ci ont une propriété bien spéciale, que l’on
appelle absence de mémoire (ou simplement propriété de Markov) que nous allons indiquer à
présent. Losqu’un système a plusieurs avenirs possibles à partir de son état présent, il se pourrait
que la probabilité que l’un ou l’autre de ces avenirs se réalise dépende non seulement de son
état présent mais aussi de son histoire récente : dans ce cas, il faudrait par exemple prendre en
compte le fait que la probabilité pij = P (Xt+1 = xj /Xt = xi ) pourrait être différente selon que
Xt−1 = xk ou que Xt−1 = xl . Il n’y aurait plus moyen alors de définir de matrice de transition.
En réalité, lorsqu’on adopte une modélisation par une chaı̂ne de Markov, on suppose de fait que
la dynamique aléatoire considérée possède la propriété suivante, appelée propriété de Markov :

P (Xt+1 = xj /Xt = xi , Xt−1 = xk , Xt−2 = xl , . . .) = P (Xt+1 = xj /Xt = xi ).

2.2 Chaines de Markov irréductibles


Une chaı̂ne de Markov est dite irréductible lorsque tous ses états communiquent, c’est-à-dire
lorsque, pour toute paire d’états (xi , xj ) la probabilité d’aller de l’un à l’autre est strictement
positive. Cette propriété peut se lire généralement sur le diagramme en points et flèches. En effet,
on s’assure que la chaı̂ne est irréductible en vérifiant que chaque paire de points est reliée soit
par une flèche unique soit par une succession de flèches. Ainsi, l’exemple de la chaı̂ne {h, a, f }
de la leçon précédente est une chaı̂ne de Markov irréductible de même que celui des souris dans
le labyrinthe {1, 2, 3, 4, 5}. Mais, si l’on modifie cet exemple en considérant que lorsque la souris
a atteint le compartiment 5 (qui contient le fromage) elle y reste avec probabilité 1, alors cette
chaı̂ne n’est plus une chaı̂ne irréductible car il n’y a pas de flèche allant de l’état 5 vers l’un
quelconque des autres états. Un état de ce type, dans lequel on reste à coup sur lorsqu’on y
parvient s’appelle un état absorbant. Une chaı̂ne présentant un état absorbant ne peut pas être
irréductible.

13
14 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS

2.3 Etats récurrents/transitoires


Un état xi ∈ S tel que, lorsque la chaı̂ne est issue de ce point, elle y retourne en un temps
fini avec une probabilité strictement positive, s’appelle un état récurrent (sinon l’état est dit
transitoire). Lorsqu’un état est récurrent, chaque trajectoire issue de ce point y revient presque
certainement une infinité de fois. Par contre, lorsqu’il est transitoire, chaque trajectoire issue de
ce point n’y revient presque surement qu’un nombre fini de fois.
Cette distinction entre états récurrents et transitoires est nettement plus délicate à déduire
du diagramme en points et flèches. Notons simplement que lorsque la chaı̂ne de Markov est
irréductible (et qu’elle a un nombre fini d’états), ses états sont tous récurrents. On parle alors
de chaı̂ne récurrente. Un cas particulier intéressant de chaı̂ne récurrente est celui d’une chaı̂ne
périodique. C’est le cas d’une chaı̂ne ayant une matrice de transition dont l’une des puissances
Pk , k = 2, 3, . . ., vérifie Pk = P. Par exemple on pourra vérifier que si
 
0 1 0
 
P= 0 0 1 
1 0 0

alors on a P4 = P ; cette chaı̂ne est dite périodique de période 3 car toute trajectoire revient à
son état initial après 3 étapes.
Une chaı̂ne dont tous les états sont récurrents admet pour loi stationnaire la loi définie
1
par π(xi ) := m(x i)
, où m(xi ) est l’espérance du temps de retour à l’état xi (si l’on est parti
de xi ). Par exemple, la chaı̂ne périodique précédente admet la distribution ( 13 , 13 , 13 ) comme
distribution stationnaire. Dans le cas non périodique, on peut montrer que, moyennant quelques
hypothèses suplémentaires, une chaı̂ne de Markov dont tous les états sont récurrents tend vers
sa loi stationnaire quelque soit sa loi initiale.

2.4 Exemple de dynamique évoluant vers une loi stationnaire


A titre d’exemple1 examinons la dynamique suivante qui modélise l’évolution des écosystèmes
mediterranéens. A l’origine la forêt méditerranéenne, sur roche calcaire à faible altitude, était très
certainement dominée par des chênes (chênes pubescents). Mais l’action de l’homme a éradiqué
ces forêts primitives pour leur substituer parcours pastoraux, vergers, ... Puis l’abandon de
toute activité agricole au lieu de conduire à restauration naturelle de ces chênaies a bien souvent
favorisé l’implantation d’une autre espèce, le pin d’Alep, après passage par un état de guarrigue.
Or ces forets de substitution, hautement inflammables, subissent de manière récurrente le passage
du feu (incendies volontaires ou non) et sont donc condamnées à une perpétuelle reconstitution.
Voici le diagramme en points et flèches correspondant et la matrice de passage de cette chaı̂ne
de Markov à 5 états S = {C, V, P e, Ga, P i}

 
0, 8 0, 2 0 0 0
 0 0, 7 0, 3 0 0 
 
 
P= 0 0 0, 4 0, 6 0 
 
 0 0 0 0, 2 0, 8 
0, 1 0 0, 25 0 0, 65
On se convainc facilement que cette dynamique n’a pas d’état absorbant, qu’elle n’est pas
périodique. A priori, les trajectoires semblent passer indéfiniment d’un état à un autre et il n’est
donc pas evident d’apréhender son évolution. Mais si l’on observe les puissances successives de
1
Exemple tiré du livre Modélisation et simulation d’écosystèmes, P. Coquillard et D. Hill, Masson 1997.
2.5. REMARQUES 15

la matrice de transition P, on peut voir qu’après un grand nombre d’itérations, Pn tend vers une
matrice limite dont toutes les lignes sont égales, ce qui signifie que la distribution (proportion
de chacun des états) évolue vers une distribution unique qui est une distribution stationnaire.
Ainsi on a  
0, 17520 0, 11680 0, 20437 0, 15327 0, 35034
 0, 17517 0, 11680 0, 20438 0, 15328 0, 35035 
 
 
P40 =  0, 17551 0, 11678 0, 20438 0, 15328 0, 35037 
 
 0, 17517 0, 11678 0, 20438 0, 15328 0, 35037 
0, 17518 0, 11678 0, 20437 0, 15328 0, 36036

2.5 Remarques
Pour finir notons que si les chaı̂nes de Markov fournissent des modèles très utiles, elles
présentent aussi des défauts. Parmi eux, l’hypothèse simplificatrice d’un nombre fini d’états
possibles ou celle de l’invariance dans le temps des probabilités de transitions sont relativement
faciles à contourner car il existe des chaı̂nes de Markov ayant un nombre infini d’états ou/et
qui ne sont pas homogènes, c’est-à-dire avec des matrices de transition modifiables au cours
du temps. Bien entendu l’étude de ces modèles généralisés nécessitent le recours à des outils
mathématiques plus élaborés.
Par contre, il en est différemment pour l’invariance spatiale. Pour le calcul des probabilités de
transition, on fait en effet implicitement une hypothèse d’homogénéité spatiale qui est rarement
satisfaite dans la pratique. Par exemple un site végétal n’a certainement pas la même probabilité
d’être occupé la période suivante par une espèce donnée selon que les sites voisins le sont déjà ou
qu’ils ne le sont pas. Et, malheureusement ceci ne peut pas être pris en compte par les modèles
markoviens simples que nous avons présentés ici. On retiendra donc qu’il convient d’utiliser avec
prudence une chaı̂ne de Markov lorsque ce caractère d’isotropicité du milieu n’est pas du tout
satisfait.

2.6 Exercices
Exercice 1 : L’observation du développement d’un organisme (animal ou plante) au cours du
temps fait apparaı̂tre l’ensemble des états suivants : juvenile, maturité sexuelle, sénescence
et décès, que nous noterons respectivement j, m, s et d, avec des probabilités de passage
d’un état vers un autre données par la matrice suivante :
 
0, 2 0, 2 0 0, 6
 0 0, 55 0, 15 0, 3 
 
P= 
 0 0 0, 1 0, 9 
0 0 0 1

1. Tracer le diagramme en points et flèche. La chaı̂ne est-elle irréductible ?


2. Calculer la probabilité de passer en deux étapes de l’état de maturité sexuelle à l’état
de sénescence. Calculer la matrice P2 et vérifier la probabilité calculée précédemment.
La chaı̂ne est-elle périodique ?
3. Pour chaque état, indiquer s’il est absorbant, transitoire, récurrent.
Réponses : 1. Un examen du schéma en points et flèches montre que la chaı̂ne n’est pas
irréductible : en effet, on ne peux pas passer de l’état de maturité sexuelle à l’état
juvenile. De plus l’état décès est absorbant.
2. Sur le schéma en points et flèches, on voit facilement que, partant de l’état m, on
atteint l’état s en deux étapes de deux façons exactement : soit on reste en m pendant
la première étape puis on va en s durant la seconde, soit on y va durant la première
16 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS

et on reste en s durant la seconde. Il n’y a pas d’autres possibilités. Cela conduit au


calcul suivant :

P (X2 = s/X0 = m) = P (X2 = s/X1 = m) · P (X1 = m/X0 = m)


+ P (X2 = s/X1 = s) · P (X1 = s/X0 = m)
= 0, 15 · 0, 0, 55 + 0, 15 · 0, 1 = 0, 0975.

La probabilité cherchée se lit aussi sur la matrice P2 , c’est le coefficient de la deuxième


ligne et de la troisième colonne, ce qui confirme le résultat trouvé :
 
0, 04 0, 15 0, 03 0, 78
 0 0, 3025 0, 0975 0, 6 
 
P2 =  
 0 0 0, 01 0, 99 
0 0 0 1

La chaı̂ne n’est pas périodique comme on peut le voir facilement sur son diagramme
en points et flèches. Par exemple, on voit qu’une trajectoire qui passe de l’état j à
l’état m ne repassera plus jamais par l’état j et ne peut donc pas être périodique.
3. Les trois états j, m et s sont transitoires car la probabilité de ne pas revenir en j
sachant qu’on y était à l’état initial est supérieure à 0, 8 et de même cette probabilité
est supérieure à 0, 45 pour m et à 0, 9 pour s. L’état d est absorbant donc récurrent.
Exercice 2 : On considère une chaı̂ne de Markov à quatre états S = {1, 2, 3, 4} dont la matrice
de transition est  
0 12 12 0
 1 0 0 1 
 2 
P= 2 
 0 0 1 0 
0 0 0 1

1. Tracer le graphe en points et flèches associé à cette chaı̂ne de Markov.


2. Montrer que les états 3 et 4 sont absorbants. Les autres sont-ils transitoires ou
récurents ?
3. Calculer les probabilités des trajectoires suivantes en fonction des probabilités initiales
de chaque état (p0 , q0 , r0 , s0 ) :
(X0 = 1 , ∀n ≥ 1 Xn = 3), (X0 = 1 , X1 = 2 , ∀n ≥ 2 Xn = 4),
(Xn = 1 si n est pair et Xn = 2 si n est impair).
4. Montrer que la trajectoire (Xn = 1 si n est pair et Xn = 2 si n est impair) est de
probabilité nulle.
5. On suppose que la répartition entre les quatre états est uniforme à l’instant initial
t = 0. Calculer la répartition à l’instant t = 1 puis à l’instant t = 2. Même question
si l’on part d’une distribution initiale π0 = ( 12 , 12 , 0, 0).
6. Montrer que toute distribution initiale de la forme π0 = (0, 0, r0 , s0 ) avec r0 + s0 = 1
est une distribution stationnaire. En existe-t-il d’autres ?

Réponses : 1. Question laissée au lecteur


2. Les états 3 et 4 sont absorbants puisque p33 = p44 = 1 donc ils sont récurrents. Les
deux autres sont transitoires car la probabilité de ne pas revenir en 1 (resp. en 2) si
l’on est parti de là peut se calculer facilement (voir le schéma) et elle est strictement
positive (égale à 13 pour 1 par exemple).
3. Pour le calcul de ces probabilités, on étudie d’abord la trajectoire considérée sur le
schéma en points et flèches. Cette trajectoire est une trajectoire infinie mais on se
2.6. EXERCICES 17

convaint facilement que :

P ( X0 = 1, X1 = 3, X2 = 3, . . .)
= P (X0 = 1) · P (X1 = 3/X0 = 1) · P (X2 = 3/X1 = 3) · . . .
1 1
= p0 · · 1 · 1 · . . . = p0
2 2
De même,

P ( X0 = 1, X1 = 2, X2 = 4, X3 = 4, . . .)
= P (X0 = 1) · P (X1 = 2/X0 = 1) · P (X2 = 4/X1 = 2) · P (X3 = 4/X2 = 4) · . . .
1 1 1
= p0 · · · 1 · . . . = p0
2 2 4
La dernière trajectoire considérée fournit un exemple de trajectoire de longueur infinie
et de probabilité nulle (il n’existe evidemment pas trajectoire de longueur finie et de
probabilité nulle !). En effet la probabilité de la trajectoire considérée est le produit
de 12 par lui même un nombre infini de fois. A chaque nouveau produit la probabilité
est diminuée de moitié. Comme limn→∞ ( 12 )n = 0, elle est donc nulle.
4. La répartition initiale étant uniforme, π0 = (p0 , q0 , r0 , s0 ) = ( 14 , 14 , 14 , 14 ) et donc π1 =
π0 · P = ( 18 , 18 , 78 , 78 ) et de même π2 = π1 · P = ( 16
1 1 7 7
, 16 , 16 , 16 ). De la même façon,
lorsque π0 = ( 12 , 12 , 0, 0), on calcule π1 = π0 · P et on trouve π1 = ( 14 , 14 , 14 , 14 ) d’où l’on
peut déduire sans nouveau calcul que π2 = ( 18 , 18 , 78 , 78 ).
5. On vérifie que si π0 s’écrit π0 = (0, 0, r0 , s0 ), avec nécessairement r0 + s0 = 1, alors
le produit π0 · P est encore égal à π0 . Toutes les distributions de cette forme sont
donc stationnaires. Inversement, une distribution π = (p, q, r, s) est stationnaire si
elle vérifie π · P = π, c’est-à-dire si les 4 quantités p, q, r et s vérifie le système
d’équations suivant : 
 1

 2q = p
 1
2p = q (2.1)
 1

 21
p + r = r

2q + s = s

Ce système implique que p = 14 p, ce qui n’est possible que si p = 0, de même pour


q. Les deux autres inconnues, r et s, peuvent alors être choisies comme l’on veut, à
condition, biensur que r + s = 1. Donc toute distribution stationnaire est de la forme
π = (0, 0, r, s).
Exercice 3 : On veut étudier l’effet de la présence d’un couple de lions dans une portion de
savane dans laquelle cohabitent trois populations d’animaux dont les lions se nourrissent.
On modélise les proies, antilopes (a), gnous (g) et zèbres (z) comme les états d’une chaı̂ne
de Markov dont les trajectoires sont des successions de proies mangées par les lions, comme
par exemple (gzzaggaa). On fait l’hypothèse que la probabilité qu’un lion mange une proie
a (ou g ou z) après avoir mangé une proie g (ou a ou z) ne dépend que de a (ou g ou z)
et non de ce qu’il avait mangé avant a (et que cette probabilité est invariante au cours du
temps). D’où la modélisation par une chaı̂ne de Markov d’espace d’états S = {a, g, z} et
dont on propose la matrice de transition suivante :
 
0, 5 0, 1 0, 4
 
P =  0, 2 0, 3 0, 5 
0, 2 0, 2 0, 6

1. Quelle est, selon ce modèle, la probabilité que les lions mangent un zèbre après avoir
mangé une antilope ?
18 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS

2. Des deux trajectoires suivantes, (zaag) et (zaga), quelle est la plus probable ? Justifier
votre réponse par un calcul.
3. Tracer le diagramme en points et flèches. La chaı̂ne est-elle irréductible ? Pourquoi ?
4. Compléter les deux valeurs manquantes dans la matrice suivante (en indiquant quels
calculs vous faites) :  
0, 35 .... 0, 49
 
P2 =  0, 26 0, 21 0, 53 
0, 26 0, 2 ...
5. Calculer la probabilité pour que la chaı̂ne passe de l’état a à l’état z en deux étapes
(les lions mangent une antilope le premier jour, une autre proie (quelconque) le second
et un zèbre le troisième jour).
6. Les états de cette chaı̂ne de Markov sont-ils récurrents ou transitoires ?
7. La mesure π0 suivante est-elle une mesure invariante pour cette chaı̂ne de Markov ?
Justifier votre réponse.
S a g z
6 4 11
π0 21 21 21
Exercice 4 : Le magicien d’Oz a comblé tous les désirs des habitants du pays d’Oz, sauf peut-
être en ce qui concerne le climat : au pays d’Oz en effet, s’il fait beau un jour, il est certain
qu’il pleuvra ou neigera le lendemain, avec une probabilité égale qu’il pleuve ou qu’il neige.
Et si le temps d’un jour est pluvieux ou neigeux, alors il reste inchangé dans 50% des cas
le lendemain et ne devient beau que dans 25% des cas. Les habitants se sont plaint auprès
du magicien, affirmant que, ce faisant, ils n’ont qu’un beau jour sur cinq, ce à quoi il a
répondu qu’il s’agit d’une impression mais qu’en réalité il y a bien plus d’un beau jour sur
cinq. Qu’en est-il ?
Pour le savoir, on se propose de modéliser l’évolution du climat au pays d’Oz par une
chaı̂ne de Markov à 3 états, {P, B, N } (pour Pluvieux, Beau, et Neigeux) dont la matrice
de transition est, selon la description précédente :
 
0, 5 0, 25 0, 25
 
P =  0, 5 0 0, 5 
0, 25 0, 25 0, 5
1. L’un coefficient de P est nul. Expliquer pourquoi.
2. Calculer la probabilité d’une trajectoire (succession de jours) du type BN P B en
fonction de π0 (B). Donner un exemple de trajectoire de probabilité nulle.
 
0, 438 0, 188 0, 375
 
3. On a calculé le carré de la matrice P et trouvé P2 =  0, 375 ....... 0, 375 
0, 375 0, 188 0, 438
Compléter le coefficient manquant, en expliquant comment le calculer.
4. Donner la probabilité que le surlendemain d’un jour neigeux soit neigeux.
5. Le calcul des puissances successives de la matrice P montre qu’à partir de la puissance
sixième elles restent pratiquement inchangées et égales à la matrice
 
0, 4 0, 2 0, 4
 
 0, 4 0, 2 0, 4 
0, 4 0, 2 0, 4
Cela suggère que la distribution π0 = (0, 4 ; 0, 2 ; 0, 4) est une distribution stationnaire
pour cette chaı̂ne de Markov. Vérifier qu’il s’agit bien d’une ditribution stationnaire.
6. En déduire la réponse à la question initiale : qui du magicien ou de la population du
pays d’Oz a la bonne estimation du nombre de jours de beau temps ? Expliquer.
Chapitre 3

Dynamiques déterministes : les


modèles malthusien et logistique

Dans cette leçon, on s’intéresse à modéliser l’évolution au cours du temps de la taille


d’une population (insectes, bactéries, algues, poissons, ...), afin de prévoir ou d’expliquer cette
évolution (extinction, explosion, stabilisation autour d’un effectif idéal ...). Au contraire des
chaı̂nes de Markov qui sont des modèles aléatoires, les deux modèles étudiés ici sont des modèles
déterministes en ce sens que leur évolution future est entièrement déterminée par leur état
présent (alors que pour une chaine de Markov, il y a plusieurs états possibles que l’on peut
atteindre à partir d’un état présent).

3.1 Modèle malthusien


Ce modèle, très rudimentaire, a été proposé par Thomas Malthus en 1798. Il suppose que la
population possède un taux de reproduction r constant, simple différence du taux de natalité et
du taux de mortalité car la population est supposée isolée c’est-à-dire qu’aucune migration n’est
envisagée. Si Yt désigne la taille de la population étudiée à l’instant t et Yt+1 sa taille après une
génération, on a donc pour l’accroissement ∆Yt = Yt+1 − Yt de la population entre les instants
t et t + 1 la formule
∆Yt = Yt+1 − Yt = rYt (3.1)
ce qui signifie que la population croı̂t entre les instants t et t + 1 d’une proportion r de Yt égale à
rYt . On peut réécrire cette formule en exprimant l’effectif à l’instant t + 1 en fonction de l’effectif
à l’instant t sous la forme d’une relation de récurrence Yt+1 = Yt + rYt ou bien encore :

Yt+1 = (1 + r)Yt . (3.2)

Sous cette forme, on voit que l’on peut calculer l’effectif Yt en fonction de Yt−1 et lui même
en fonction de Yt−2 et ainsi de suite et donc calculer l’effectif Yt à tout instant t en fonction de
l’effectif Y0 . Par exemple, Y2 = Y1 (1+r) = (Y0 (1+r))(1+r) = Y0 (1+r)2 , et plus généralement on
a pour tout t la formule Yt = Y0 (1+r)t . Si l’on connait la valeur de Y0 , que l’on appelle la condition
initiale, on peut donc calculer les valeurs suivantes Y1 , Y2 , ...et même directement la valeur de
Yt à tout instant t > 0. La figure (3.1) montre deux exemples de trajectoires d’une dynamique
malthusienne, pour deux conditions initiales différentes. De la formule Yt = Y0 (1 + r)t , on déduit
que la suite des valeurs de Yt est une suite géométrique de raison (1+r) qui est donc supérieure à
1 si r > 0. Puisque l’on a (1+r)t = et ln(1+r) , ce modèle correspond à une croissance exponentielle
de la population lorsque r > 0 d’où son nom de modèle exponentiel parfois utilisé à la place de
modèle malthusien. On a en effet Yt = Y0 et ln(1+r) = Y0 eRt , si l’on pose R = ln(1 + r). Notons
qu’il pourrait aussi modéliser une décroissance exponentielle si r était négatif. On retiendra donc

19
20CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE

Yt

25

20

15

10

0 t
0 1 2 3 4 5 6 7 8 9

Fig. 3.1 – Deux trajectoires particulières d’une dynamique malthusienne correspondant aux
deux conditions initiales Y0 = 1 et Y0 = 2, pour un choix du paramètre r égal à r = 0, 3.

qu’un modèle malthusien prévoit une croissance (ou décroissance) exponentielle de la population
modélisée.

3.2 Modèle logistique


L’un des points les plus discutables du modèle malthusien est qu’il prévoit que la population
modélisée croı̂sse indéfiniment. Il est certainement plus raisonnable de prendre en compte, comme
le suggéra Verhulst en 1836, qu’au dela d’une certaine taille, des facteurs environnementaux
(limitation des ressources, limitation de l’espace disponible, ...) viennent freiner cette croissance.
Pour cela on suppose que le taux de reproduction de la population r, c’est-à-dire la quantité ∆Y Yt ,
t

n’est plus le même quelque soit la taille Yt de la population mais qu’au contraire il dépend de la
taille de la population. On supposera que ce taux de reproduction est grand lorsque la taille de la
population est petite car dans ce cas les ressources disponibles permettent cette forte croissance
mais qu’il est plus petit quand la taille devient plus grande et que les individus commencent
à entrer en compétition concernant la nourriture ou l’espace, voir même qu’il devienne négatif
pour de très grandes tailles, ce qui signifierait un declin de la population. La plus simple des
fonction de Yt ayant ces propriétés est une fonction linéaire affine (de la forme aYt + b) de pente
a négative et dont l’ordonnée à l’origine b est positive et correspond au taux de reproduction
d’une population suffisamment petite pour ne pas souffrir des limitations environnementales.
Pour cela, on remplace dans le modèle (3.1) le taux constant r par un taux dépendant de la
taille Yt que l’on écrit r( K−Y Yt
K ), ou encore r(1 − K ). Cela conduit au modèle logistique :
t

Yt
Yt+1 − Yt = r(1 − )Yt . (3.3)
K
On peut, comme dans le cas du modèle malthusien, réécrire cette formule comme une récurence
donnant la valeur de Yt+1 en fonction de la valeur de Yt :

Yt
Yt+1 = Yt + rYt (1 − ) (3.4)
K
ce qui permet de calculer facilement de proche en proche les valeurs successives de Yt dès qu’on
se donne Y0 . La figure (3.2) donne deux exemples de comportement de telles trajectoires. Ces
3.2. MODÈLE LOGISTIQUE 21

Yt

10

1 t
0 2 4 6 8 10 12

Fig. 3.2 – Deux trajectoires particulières de la dynamique logistique ∆Yt = 0.7Yt (1 − Yt /10)
pour les conditions initiales Y0 = 1 et Y0 = 3.

comportements, appelés croissance logistique ou croissance amortie présentent une phase de


croissance exponentielle suivie, après un changement de courbure éventuel, d’une phase de crois-
sance de plus en plus lente vers une limite (ici K = 10).
Notons cependant que malgré la simplicité de la formule (3.4), on ne peut pas calculer
explicitement pour ce modèle la valeur de Yt comme fonction de t et de Y0 . Pour pouvoir
calculer Yt , il faut donc calculer toutes les valeurs Y1 , Y2 , Y3 , . . . , Yt−1 , ce qui est facile pour les
petites valeurs de t mais peut devenir fastidieux si t est grand. Voici à titre d’exemple les valeurs
prises par la trajectoire issue de Y0 = 3 que l’on a représenté sur la figure (3.2) :

t 0 1 2 3 .... 11 12
Y 3 4, 47 6, 20 7, 85 .... 9, 999 9, 9997

Les deux paramètres r et K du modèle logistique ont des interprétations biologiques faciles
à comprendre. En effet, le facteur r(1 − YKt ) (qui a remplacé le taux de reproduction constant
r du modèle malthusien) vallant pratiquement r lorsque la taille de la population Yt est petite
et tendant par contre vers 0 lorsqu’elle se rapproche de K, la constante r, appelée taux de
croissance intrinsèque, est le taux de reproduction de la population lorsque sa taille est petite
et donc qu’il n’y a pas de limitation. La constante K, appelée capacité biotique, est une taille
limite de la population étudiée vers laquelle elle tend (si r > 0) lorsque t augmente indéfiniment.
C’est une sorte d’effectif d’équilibre dont la valeur dépend des ressources disponibles pour cette
population.
En réalité, l’étude numérique (calcul explicite de diverses trajectoires) et l’étude mathématique
de cette récurrence révèle que ce modèle est plus compliqué qu’il y paraı̂t et que certaines
solutions présentent des comportements bien différents d’une simple croissance logistique (y
compris certains comportements appelés chaotiques que nous n’étudierons pas ici). Par ex-
emple, si la taille de la population initiale est supérieure à sa capacité biotique K, on peut
observer une décroissance brutale en dessous de K suivie d’une croissance plus lente vers K
comme le montre les valeurs indiquées ci dessous correspondant toujours à l’équation logistique
∆Yt = 0.7Yt (1 − Yt /10)de la figure (3.2) mais cette fois pour une condition initiale Y0 = 17 (voir
aussi le premier dessin de la figure (3.3)) :
22CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE

Yt+1
12

10

0
0 2 4 6 8 10 12
Yt

Fig. 3.3 – Représentation en toile d’araignée (cobweb) de la trajectoire de la dynamique logis-


tique ∆Yt = 0.7Yt (1 − Yt /10) de condition initiale Y0 = 3.

t 0 1 2 3 4 5
Y 17 8, 67 9, 4772 9, 8240 9, 945 9, 9833

3.3 Etude graphique (cobweb)


Pour étudier plus facilement les divers comportements de trajectoires de ce type de dy-
namique, on utilise souvent une représentation en toile d’araignée ou cobweb. Pour cela on
représente tout d’abord sur un même graphique la parabole d’équation Yt+1 = F (Yt ) où F (y) =
y + ry(1 − y/K) ainsi que la droite bissectrice d’équation Yt+1 = Yt . Puis on représente la dy-
namique étudiée par la succession de points (Y0 , Y0 ), (Y0 , Y1 ),(Y1 , Y1 ),(Y1 , Y2 ),(Y2 , Y2 ),... reliés
les uns aux autres par des segments alternativement verticaux et horizontaux. La figure (3.3)
donne par exemple la représentation de la trajectoire issue de Y0 = 3 étudiée ci dessus (figure
(3.2) et tableau associé).
Mais on obtient ainsi d’autres types de comportements dont la figure (3.4) donne quelques
exemples.

3.4 Equations aux différences (ou récurences)


Les deux modèles malthusiens et logistiques sont deux exemples particuliers d’équations aux
différences du premier ordre c’est-à-dire d’équations de la forme

Yt+1 = F (Yt ) (3.5)

où F est une fonction quelconque. Par exemple, F (y) = (1 + r)y dans le cas malthusien et
2
F (y) = (1 + r)y − ry
K dans le cas logistique. Une solution (Yt )t>0 d’une équation aux différences
(3.5) est simplement une suite vérifiant cette récurence et son premier terme Y0 s’appelle sa
3.4. EQUATIONS AUX DIFFÉRENCES (OU RÉCURENCES) 23

Yt+1 Yt+1 Yt+1


20 15 14

18
12
16

14 10
10

12
8

10

6
8

5
6 4

4
2
2

0
0 2 4 6 8 10 12 14 16 18 20
Yt 0
0 5 10 15
Yt 0
0 2 4 6 8 10 12 14
Yt

Fig. 3.4 – Diverses représentations en toile d’araignée (cobweb). On a pour ces trois figures
K = 10, mais on a r = 0.7 et Y0 = 19 pour la première, r = 1.9 et Y0 = 14 pour celle du milieu
et r = 2.3 et Y0 = 10.5 pour la dernière. Dans les deux premières figures, l’équilibre Y ∗ = 10 est
stable alors qu’il est instable dans la dernière.

condition initiale. Une fois choisie l’équation aux différences la mieux adaptée à la dynamique de
la population que l’on étudie, le problème suivant est de décrire le comportement des solutions
de l’équation et plus spécialement celui de la solution ayant pour condition initiale l’effectif
présent Y0 de la population. Même s’il est toujours possible de calculer de proche en proche les
valeurs successives d’une solution, il n’est pas nécessairement facile d’en prédire le comportement
à venir, au dela des termes calculés.
Le principal outils dont on dispose pour décrire les trajectoires d’une équation aux différences
est l’étude des équilibres et de leur stabilité. Un équilibre est une trajectoire qui ne bouge pas,
c’est-à-dire telle que Yt+1 = Yt pour tout t ≥ 0. Donc si Y0 = Y ∗ est un équilibre, on aura
Y0 = Y1 = Y2 = Y3 = . . .. le nombre Y ∗ est donc un point fixe de la fonction F , c’est-à-
dire une solution de l’équation F (y) = y. Géométriquement, c’est un point où le graphe de
F coupe la droite des points ayant une abscisse égale à leur ordonnée comme on peut le voir
sur les représentations de type cobweb. Lorsqu’on a repéré un équilibre d’une dynamique, la
question se pose de savoir si les solutions issues des points voisins vont tendre à se rapprocher
de l’équilibre, on dit alors que l’équilibre est stable, ou si au contraire elles vont s’en éloigner, on
dit alors qu’il est instable. Les équilibres stables sont essentiels en terme de modélisation car ils
correspondent à des comportements type du système dynamique auquel celui-ci aura tendance à
s’identifier, après une période transitoire éventuellement, et ce, quelque soit sa position initiale.
Au contraire les équilibres instables sont des états dont le système s’écarte sans jamais s’en
rapprocher et sont donc de bien moindre importance. Il est utile de savoir discerner un équilibre
stable d’un équilibre instable. Pour cela on peut se convaincre en observant la dynamique sur
les représentations en toile d’araignée (cobweb) qu’un point de la diagonale est un équilibre
stable lorsque le graphe de F coupe cette diagonale en étant croissant et en passant du dessus
au dessous (figure (3.3)) et inversement il sera instable lorsque le graphe de F la coupe en étant
croissant et en passant du dessus au dessous. On vérifie ce fait facilement sur un dessin. On a
des caractérisations analogues, quoiqu’un peu plus complexes lorsqu’au point d’intersection le
graphe de F est décroissant.
Comment peut-on distinguer ces différents comportements au moyen d’un simple calcul ?
Plaçons nous dans le cas où au point d’équilibre la fonction F est croissante, c’est-à-dire F 0 > 0.
Comme la diagonale est une droite de pente 1, si l’intersection avec le graphe de F se fait du
dessous vers le dessus, c’est que la tangente à F en ce point a une pente supérieure à 1 et donc
que F 0 > 1 et de même l’intersection se fera du dessus vers le dessous si cette pente est inérieure
à 1, et donc si F 0 < 1. Plus généralement, que F soit croissante ou non, on a le résultat suivant
qui permet de déterminer facilement la stabilité des équilibres d’une dynamique de la forme
24CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE

Yt+1 = F (Yt ) étudiée ici :

Proposition 3.1 Si Y ∗ est un équilibre de l’équation aux différences (3.5), alors cet équilibre
est stable si |F 0 (Y ∗)| < 1 et instable si |F 0 (Y ∗)| > 1. Lorsque F 0 (Y ∗) = 1 ou F 0 (Y ∗) = −1, on
n’est pas en mesure d’en déduire s’il est stable, instable ou ni l’un ni l’autre.

Exemple :
1. L’équation malthusienne (3.2) possède un unique équilibre Y ∗ = 0 et il est instable lorsque
r > 0 car F 0 (0) = 1 + r. Cela signifie que quelque soit l’effectif initial de la population, il
va s’éloigner de 0 lorsque t augmente, donc croı̂tre indéfiniment.
2. L’équation logistique (3.4) possède deux équilibres, Y ∗ = 0 et Y ∗ = K (les deux solutions
de l’équation y + ry(1 − y/K) = y), le premier est instable (comme dans le cas malthusien)
car F 0 (0) = (1 + r) si r > 0. Le second est stable lorsque 0 < r < 1 car F 0 (K) = 1 − r et
instable lorsque r > 1.

3.5 Exercices
Exercice 1 : Des biologistes ont tenté d’acclimater le renne dans des ı̂les de la mer de Béring.
Dans l’une d’elles, 21 individus furent introduits en 1911. En 1938, avant l’effondrement de
la population, 2000 rennes furent dénombrés. A partir de ces données, en supposant que
la croissance de la population est de type malthusien, calculer le coefficient de croissance
r de cette population.
Réponses : Si la population a une dynamique malthusienne, sa taille Yt à l’instant t vérifie
une équation aux différences de la forme Yt+1 = (1 + r)Yt , et donc elle peut s’écrire
Yt = (1 + r)t Y0 , où Y0 est sa taille initiale. Ici on a Y0 = 21, t = 1938 − 1011 = 27 et
Yt = Y27 = 2000. On en déduit donc l’équation suivante pour r : 2000 = (1+r)27 (21). Pour
résoudre cette équation, on prend le logarithme des deux membres. On obtient ln(2000) =
(27) ln(1+r)+ln(21), d’où ln(1+r) = ln(2000)−ln(21)
27 , soit r = exp( ln(2000)−ln(21)
27 )−1 ' 0, 184.
Selon ce modèle, ces observations correspondent donc à une croissance de cette population
à un taux constant de 18, 4% l’an.
Exercice 2 : Des nutriments entrent dans une cellule en quantité constante R par unité de
temps et en sortent proportionnellement à la concentration. Si Nt désigne la concentration
à l’instant t, cette dynamique peut s’écrire Nt+1 − Nt = R − KNt .
1. Cette dynamique est donnée par une équation aux différences de la forme Nt+1 =
F (Nt ). Que vaut F ? Tracer le graphe de F en supposant par exemple que R = 5 et
K = 1.5.
2. Trouver graphiquement le point fixe de F puis calculer ses coordonnées.
3. En supposant à nouveau que R = 5 et K = 1.5, déterminer les 6 premières valeurs
de la trajectoire de cette dynamique issue de N0 = 2 et en faire une représentation
en cobweb. Même question pour la trajectoire issue de N0 = 6, de N0 = 8.
4. Selon ce modèle, la concentration va-t-elle tendre vers un équilibre ? Lequel ? Est-il
stable ?
Réponses : 1. La fonction F (y) = R−(K −1)y a pour graphe une droite de pente −(K −1)
et d’ordonnée à l’origine R.
2. Le point fixe de N ∗ de F , solution de l’équation F (N ∗) = N ∗, soit R − (K − 1)N ∗ =
R
N ∗, est donc égal à N ∗ = K . Dans le plan (Nt , Nt+1 ), cet équilibre a pour coordonnées
R R
( K , K ).
3.5. EXERCICES 25

3. Les 6 premières valeurs de la trajectoire issue de N0 = 2 sont 2 ; 4 ; 3 ; 3.5 ; 3.25 ; 3.375.


La trajectoire issue de N0 = 6 vérifie N1 = 2 et donc elle coı̈ncidera ensuite avec la
trajectoire précédente issue de N0 = 2. Les 6 premières valeurs de la trajectoire issue
de N0 = 8 sont 8 ; 1 ; 4.5 ; 2.75 ; 3.625 ; 3.1875.
R
4. Cette dynamique a un unique équilibre N ∗ = K = 5/(3/2) = 103 . Pour déterminer sa
0 1
stabilité, on calcule F (N ∗) = 1 − K = − 2 . Il est donc stable, selon la proposition
ci-dessus. De fait, on constate qu’effectivement les trajectoires dont on a calculé les
premiers termes tendent, en oscillant, vers cet équilibre. Cela signifie que selon ce
modèle, la concentration de nutriments dans la cellule tend vers la valeur 103 , quelque
soit sa valeur initiale.
Exercice 3 : On étudie l’effectif Pt d’une population d’oiseaux granivores en fonction du temps
t mesuré en jours.
1. Quelle est cette dynamique si l’on suppose les variations de cette population propor-
tionnelles à son effectif ?
2. S’il y a 160 oiseaux le deuxième jour et 640 le quatrième, quel était l’effectif initial ?
3. On suppose à présent que cette population suit un modèle logistique ∆Pt = rPt −sPt2
avec P0 = 40, r = 0, 6 et s = 10−3 . Calculer les premiers points de sa trajectoire et
décrire sa dynamique dans ce cas.
4. Tracer une représentation en cobweb de la trajectoire correspondant à P0 = 40.
5. Comment varierait, selon ce modèle, la population d’oiseaux dans le cas P0 = 700 ?
Même question pour le cas P0 = 1000.
Exercice 4 : En 1927, Pearl a étudié la dynamique d’une culture de cellules de levure et il a
obtenu les mesures suivantes (la taille de la levure est exprimée en biomasse (mg 100ml−1 ) :
Heures 0 1 2 3 4 5 6 7 8 9 10 12 14 18
Levure 4 7 12 19 28 48 70 103 140 176 205 238 256 265
Yt+1 −Yt
1. Calculer les taux de variation Yt et tracer les points de coordonnés (Yt , Yt+1Yt−Yt )
dans le plan.
2. Si la dynamique de cette culture Yt suivait exactement un modèle logistique (3.3) ou
(3.4), ces points seraient situés exactement sur une courbe. Laquelle ?
3. Pour ajuster un modèle logistique à ces données (on dit calibrer le modèle), il con-
viendrait de choisir les valeurs des paramètres r et K de façon aussi pertinente que
possible. Quelles valeurs pourriez-vous proposer dans ce cas ?
Chapitre 4

Modèles dynamiques
discrets/continus

Lorsqu’on observe l’évolution (déterministe) d’une quantité variant au cours du temps, on


dispose généralement de données discrètes, c’est-à-dire de valeurs relevées à intervalles de temps
réguliers (ou parfois irréguliers), mais rarement de données relevées en continu. C’est ce qui
conduit naturellement à choisir pour modèles des équations aux différences (ou des récurrences)
(Yt )t=0,1,2,... , comme nous l’avons fait au chapitre précédent. Mais ces suites discrètes sont parfois
plus facile à comprendre et à étudier si on les voit comme les valeurs échantillonnées d’une
fonction continue (et même dérivable) du temps t → y(t), qui existerait pour tout t ≥ 0 mais
dont on n’aurait considéré les valeurs qu’en certains instants t = 0, t = 1, t = 2, . . . seulement.
Les modèles continus sont souvent préférés aux modèles discrets par les mathématiciens car
l’arsenal des outils qu’ils ont développés pour les étudier les rendent généralement plus facile
à manipuler. Pour le biologiste, il y a des cas où les uns seront plus pertinents que les autres
mais le plus souvent il y a le choix. Par contre il est toujours utile de savoir comment l’on passe
de l’un à l’autre, en ”lissant” des données pour les modéliser plus simplement en continu d’une
part ou, à l’inverse, en discrétisant un modèle continu pour pouvoir l’étudier avec un ordinateur
d’autre part.

4.1 Exemple introductif


Cet exemple est inspiré du livre Mathématiques Terminale S, Breal, 2002. On a observé la
croissance d’une population de bactéries (Escherichia coli) durant deux heures dans un milieu
liquide minimum glucosé et obtenu le tableau de données suivant, où t est la durée exprimée en
heures et Yt la densité de cellules en fonction de la durée (mesurée par des moyens optiques) :

t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5

Afin de quantifier la croissance de cette population bactérienne pour prévoir son évolution au
cours du temps, on recherche un modèle dynamique qui donnerait la densité de la population en
fonction du temps. L’examen de la suite des points (t, Yt ) (voir la figure) montre une croissance
qui pourrait être exponentielle et donc la première idée est d’ajuster un modèle malthusien
discret Yt+1 = (1 + r)Yt . Mais l’irrégularité des pas de temps conduit à rechercher plutôt une
fonction y(t) définie pour tout t ≥ 0 et qui prendrait approximativement les valeurs observées
aux instants d’observation.
Pour trouver une telle fonction y(t), on procède de la façon suivante. A partir des observa-
tions, on étudie non pas la fonction y(t) elle-même mais sa dérivée y(t)0 = dy
dt . En se souvenant

27
28 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS

que cette dérivée, en un point t0 , est par définition égale à


y(t0 + ∆t) − y(t0 )
lim ,
∆t→0 (t0 + ∆t) − t0
la moins mauvaise approximation dont on dispose pour la valeur de cette dérivée en t0 est
∆Yt Y t − Yt 0
= 1 (4.1)
∆t t1 − t 0
où (t1 , Yt1 ) est le point suivant (t0 , Yt0 ) sur la figure ci dessus. On peut construire ainsi une
fonction linéaire par morceaux dont le graphe est simplement la succession des segments joignant
deux points (t, Yt ) consécutifs. L’équation du segment joignant les deux points (t0 , Yt0 ) et (t1 , Yt1 )
est, pour t0 ≤ t ≤ t1 ,
∆Yt
y(t) = (t − t0 ) + Yt0 ,
∆t
où la pente ∆Y ∆t est simplement le taux d’accroissement donné par (4.1). En observant les valeurs
t

de ces pentes successives (que l’on peut calculer facilement), on voit qu’elles sont presque égales
à Yt .
t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5
∆Yt /∆t 10, 0 13, 33 17, 27 23, 00 26, 3 38, 0 41, 30 .
dy
D’où l’idée de rechercher une fonction y(t) vérifiant l’équation différentielle dt = y. La
solution de cette équation différentielle sera la fonction cherchée.

4.2 Equations différentielles et champs de vecteurs


Rappelons qu’une équation différentielle (du premier ordre)
y 0 = f (y)
est une équation ayant pour solution une fonction dérivable y(t) qui vérifie pour tout t la relation
y 0 (t) = f (y(t)) où f est une fonction donnée (par exemple f (y) = y) et y est la fonction inconnue.
En général une équation différentielle a une infinité de solutions. Par exemple pour l’équation
y 0 = ay, toutes les fonctions de la forme y(t) = Ceat , où C est un réel quelconque, sont des
solutions. Comme la valeur y(0) en t = 0 est C, la constante C s’appelle la condition initiale de
la solution.
On dit qu’une équation différentielle est linéaire lorsque la fonction f est une fonction affine
f (y) = ay + b. Dans ce cas, on connait l’ensemble des solutions
 
b
y(t) = Ceat − , C ∈ R .
a
4.3. MODÈLES MALTHUSIENS ET LOGISTIQUES : LE CAS CONTINU 29

Champ de vecteurs de y’=y Champ de vecteurs de y’=18y^2

5 1

4
y
0.5

–1 0 1 2 3 4
2
x

1 –0.5

–1 0 1 2 3 4 5
–1
x

Fig. 4.1 – Les champs de vecteurs associées aux équations différentielles y 0 = y et y 0 = 18y 2 .

Mais lorsque l’équation n’est pas linéaire, il est très rare que l’on puisse la résoudre ex-
plicitement. Cependant, même si l’on ne peut pas calculer la famille des solutions de l’équation
différentielle, on peut avoir une idée de l’allure des graphes des solution en observant le champs
de vecteurs associé. En effet le graphe (t, y(t)) d’une solution de y 0 = f (y) est par définition tan-
gent au vecteur vitesse (1, y 0 (t)) et donc au vecteur (1, f (y)). La connaissance de f permet donc
de représenter ces vecteurs en un grand nombre de points, répartis dans le plan (t, y). La figure
(4.2) présente deux champs de vecteurs, celui qui est associé à l’équation y 0 = y et celui qui est
associé à l’équation y 0 = 18y 2 . La simple observation de ces champs de vecteurs permet souvent
de deviner les graphes des solutions, puisqu’il s’agit des courbes qui sont tangentes en tous leurs
points aux vecteurs du champs de vecteurs, même lorsqu’on ne sait pas résoudre l’équation. A
noter qu’on peut montrer que les graphes de deux solutions d’une même équation différentielle
ne peuvent jamais se recouper.

4.3 Modèles malthusiens et logistiques : le cas continu


Si l’on considère non plus le taux de reproduction r sur une génération mais le taux de
reproduction rt sur un intervalle de temps [t, t + ∆t] (1 jour, 1 mois, ...), avec par exemple
∆t = N1 s’il y a N intervalles de temps ∆t dans une génération, le modèle malthusien discret
peut se réécrire :
Yt+∆t − Yt
= rt .
Yt
En notant ∆Yt = Yt+∆t − Yt la variation de la taille de la population durant l’intervalle de temps
[t, t + ∆t] et en divisant l’égalité par ∆t, on obtient

∆Yt
= rYt
∆t
rt
où r = ∆t (ou encore r = N rt ). Si ∆t est suffisamment petit, on peut assimiler le quotient ∆Y
∆t
t

dY (t)
à la dérivée Y 0 (t) aussi notée dt et on obtient alors le modèle suivant, qui est simplement la
version continue du modèle malthusien discret :
dy(t)
= ry(t). (4.2)
dt
Dans ce modèle, la taille de la population y(t) est une solution de l’équation différentielle y 0 = ry
et sa valeur y(0) à l’instant t = 0 est la taille initiale de la population (que l’on supposera
positive). On sait que, pour chaque condition initiale y(0), cette équation possède une solution
unique qui est égale à y(t) = y(0)ert . Il y a donc deux comportements possibles pour y(t) selon le
30 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS

ModŁle malthusien ModŁle de logistique

16

14
2.5

12

2
10

y y

8
1.5

1
4

0.5

0 2 4 6 8 0 5 10 15 20
x x

Fig. 4.2 – A gauche : le champs de vecteurs et 3 solutions d’un modèle malthusien. A droite :
le champs de vecteurs et 4 solutions d’un modèle logistique

signe de r : si r > 0, la population croit exponentiellement (explosion) et si r < 0, elle disparaı̂t


rapidement (extinction).
Si l’on suppose à présent que le taux de reproduction n’est plus le même quelque soit la taille
de la population mais qu’au contraire il dépend de cette taille, on a le modèle discret logistique
pour un petit intervalle de temps [t, t + ∆t]

Yt+∆t − Yt Yt
= rt Yt (1 − )
Yt K

qui se réécrit comme précédemment ∆Y Yt rt


∆t = rYt (1 − K ) avec r = ∆t . On est ainsi conduit au
t

modèle logistique continu :


dy(t) y(t)
= ry(t)(1 − ) (4.3)
dt K
Les modèles malthusiens et logistiques sont des équations différentielles de la forme y 0 = f (y)
y
(avec f (y) = ry pour (4.2) et f (y) = ry(1 − K ) pour (4.3)). Le premier est un modèle linéaire et
le second un modèle non linéaire. Dans les deux cas, on peut calculer explicitement les solutions.
C’est évident dans le cas malthusien et dans le cas logistique un calcul montre que, pour chaque
condition initiale y(0), l’équation différentielle (4.3) possède une solution unique y(t) égale à

y(0)Kert
y(t) = .
K + y(0)(ert − 1)

En réalité, si l’on s’intéresse au comportement du système ainsi modélisé, l’expression de la


solution exacte n’est guère utile. Les propriétés des solutions (croissance, comportement limite,
...) se déduisent en effet plus facilement d’une étude qualitative. Elle consiste à décrire, sans qu’il
soit nécessaire de résoudre l’équation explicitement, l’évolution de la population y(t) en fonction
de sa taille initiale y(0) en examinant simplement le champs de vecteurs et en étudiant ses
équilibres comme nous l’indiquons au paragraphe suivant.Dans le cas de l’équation logistique, on
voit qu’elle a une solution constante y(t) = K appelé équilibre biotique, qui est un comportement
limite vers lequel tendent toutes les solutions du modèle, quelque soit leur condition initiale (sauf
si y(0) = 0 bien entendu).

4.4 Equilibres et stabilité des équilibres


On définit de façon générale cette notion d’équilibre pour toute dynamique de la forme

dy(t)
= f (y(t)) (4.4)
dt
4.5. MÉTHODE D’EULER 31

de la façon suivante. On appelle population d’équilibre ou état stationnaire un niveau constant


y ∗ de population tel que si y(0) = y ∗ alors y(t) = y ∗ pour tout t. Une population d’équilibre est
donc une solution constante de l’équation différentielle. Une telle solution a donc nécessairement
une dérivée nulle, c’est-à-dire que l’on a f (y ∗ ) = 0, ce qui implique y ∗ est un zéro de la fonction
f . Ainsi dans le modèle malthusien, il y a un seul équilibre y ∗ = 0 et dans le modèle logistique
il y en a deux, y ∗ = 0 et y ∗ = K.
Il y a autant d’équilibres différents dans un modèle de type (4.4) qu’il y a de zéros différents
de la fonction f . On peut donc visualiser les différents équilibres de la dynamique en traçant le
graphe de cette fonction f . Les équilibres sont les abscisses des points d’intersection du graphe
avec l’axe horizontal (qui est ici l’axe des y). Mais ce graphe permet aussi de visualiser, sur cet
axe, un schéma de la dynamique : il suffit de mettre une flèche dans le sens des y croissants sur
les segments de l’axe où f > 0 (c’est-à-dire où le graphe de f est au dessus de l’axe) et une
flèche dans le sens des y décroissants sur les segments de l’axe où f < 0. Parfois ce schéma de la
dynamique est suffisant et peut remplacer à lui seul une résolution de l’équation (qui, de toute
façon, est bien souvent impossible).
On dit qu’une population d’équilibre y ∗ pour laquelle on a f 0 (y ∗ ) < 0 est une population
d’équilibre stable car dans ce cas l’évolution de toute population dont la taille initiale est proche
de l’équilibre y ∗ est de s’en rapprocher. De façon analogue, on dit qu’une population d’équilibre
y ∗ pour laquelle on a f 0 (y ∗ ) > 0 est une population d’équilibre instable car dans ce cas l’évolution
de toute population dont la taille initiale est proche de l’équilibre y ∗ est de s’en éloigner. On peut
vérifier en appliquant ce critère que l’unique équilibre du modèle malthusien est stable lorsque
r < 0 (extinction) et instable lorque r > 0 (explosion) et de même, si l’on suppose r > 0, on peut
vérifier que l’équilibre y ∗ = K du modèle logistique est un équilibre stable (capacité biotique)
alors que y ∗ = 0 est un équilibre instable. Lorsque f 0 (y ∗ ) = 0, on ne peut pas conclure.
La condition f 0 (y ∗ ) < 0 (resp. f 0 (y ∗ ) > 0) est donc un critère de stabilité (resp. d’instabilité)
qui se révèle très opérationnel puisqu’il se calcule facilement. Pour rendre ces critères intuitifs,
on se reportera à nouveau au schéma de la dynamique obtenu à partir du graphe de f . On y
voit facilement que lorsque f 0 (y ∗ ) < 0 le graphe de f passe au point y ∗ de valeurs positives à
des valeurs négatives et donc que la population croı̂t tant qu’elle est plus petite que y ∗ (puisque
f 0 (y) > 0) et décroit tant qu’elle est plus grande. Elle tend donc dans tous les cas à se rapprocher
de l’équilibre. On fait le même raisonnement, inversé cette fois, dans le cas où f 0 (y ∗ ) > 0.

4.5 Méthode d’Euler

La méthode d’Euler est connue (programmes de 1e S et de terminale S) comme une méthode


permettant de calculer approximativement des primitives de fonctions ou d’explorer les liens en-
tre la fonction exponentielle et les séries géométriques. Nous allons voir qu’elle permet beaucoup
plus généralement de calculer des solutions approchées d’équations différentielles.
Comme il est généralement impossible de calculer explicitement les solutions d’une équation
différentielle (de la même façon qu’il est bien souvent impossible de calculer la primitive exacte
d’une fonction), on est donc réduit à calculer le plus souvent non pas les solutions exactes mais
des solutions approchées. La méthode d’Euler est la méthode la plus simple pour cela. En réalité
les programmes d’ordinateurs utilisent des méthodes plus élaborées (par exemple la méthode
de Runge-Kutta dite du 4e ordre) mais ces méthodes reposent en général aussi sur l’idée très
simple d’Euler. Cette idée est la suivante :
Elle utilise le fait que l’équation différentielle donne, en chaque point (t, y), un vecteur
(1, f (y)) tangent au graphe de la solution. On part d’un point M0 = (t0 , y0 ), on choisit un
pas h > 0, et on trace un premier segment d’origine M0 , de pente f (y0 ) et d’extrémité le point
M1 d’abscisse t1 = t0 + h. Puis on recommence de M1 à M2 mais en remplaçant la pente du
segment f (y0 ) par f (y1 ) et ainsi de suite. On obtient les formules suivantes pour la suite des
32 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS

points M0 , M1 , M2 , ... Mn .... :

(t0 , y0 ), (t1 = t0 +h, y1 = y0 +f (y0 )(t1 −t0 )), . . . , (tn = tn−1 +h, yn = yn−1 +f (yn−1 )(tn −tn−1 )), . . .

Il assez est clair que cette solution approchée sera d’autant proche de la solution exacte que
le pas h sera choisi petit et on peut effectivement vérifier que lorsque ce pas tend vers zéro,
la solution approchée tend vers la solution exacte. Mais, pour un pas donné, même petit, on
n’est jamais complètement sûr que le comportement de la solution approchée est le même que
celui de la solution exacte (exercice 4). Comme toujours, il est prudent de contrôler le résultat
fourni par l’ordinateur par des considérations de nature différente, comme par exemple une étude
qualitative.

4.6 Exercices
Exercice 1 : Soient a et b deux constantes et soit le modèle dynamique suivant : dz(t)
dt = az(t)+b.
1. Résoudre cette équation différentielle par le calcul et décrire le comportement des
solutions en fonction de la condition initiale.
2. En supposant (a, b) = (1, −2), tracer dans le plan (t, z) suffisamment de vecteurs
vitesse (1, dz
dt ) pour deviner l’allure des diverses solutions de ce modèle.
b
3. Même question pour (a, b) = (−1, 3). On dit que a est un équilibre de la dynamique.
Expliquer pourquoi.
Réponses : 1. Cette équation différentielle z 0 = az + b est une équation différentielle linéaire
qui a une solution ”triviale” z(t) = − ab et dont l’ensemble des solutions s’écrit {z(t) =
z0 eat − ab , z0 ∈ R}.
2. Avec ces valeurs des paramètres, l’équation différentielle s’écrit z 0 = z − 2. Voici
quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (1, 1), on
représente le vecteur de coordonnées (1, z − 2) = (1, −1), au point (t, z) = (1, 2),
on représente le vecteur de coordonnées (1, z − 2) = (1, 0), au point (t, z) = (2, 3),
on représente le vecteur de coordonnées (1, z − 2) = (1, 1). On note que les vecteurs
situés en des points de même ordonnée sont égaux entre eux (ce qui signifie que le
champs de vecteur est invariant par translation horizontale).
3. Avec ces valeurs des paramètres, l’équation différentielle s’écrit cette fois z 0 = −z + 3.
Voici quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (0, 1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 2), au point (t, z) = (1, −1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 4), au point (t, z) = (0, 3), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 0). La trajectoire issue du point
(0, z(t) = − ab = −3) est une trajectoire constante car les vecteurs situés sur la droite
z = −3 sont horizontaux. C’est pourquoi on appelle la solution z = −3 un équilibre.
Exercice 2 : On modélise la dynamique d’une population de bactéries responsable d’une mal-
adie des conifères par l’équation
dy(t)
= 0, 1y 2 (t)
dt
(t exprimé en mois et y(t) en dizaine de milliers).
1. Sans résoudre l’équation, indiquer le comportement de cette population à l’avenir,
selon ce modèle (à l’aide du champ de vecteurs par exemple).
10
2. Vérifier que y(t) = 1−t est une solution. Quelle est sa valeur initiale ? Tracer son
graphe.
3. Calculer la valeur approchée de cette solution par la méthode d’Euler en prenant le
pas h = 1/10. Comparer avec la solution exacte.
4.6. EXERCICES 33

Réponses : 1. Cette équation différentielle est de la forme y 0 = f (y) avec f (y) ≥ 0 pour tout
y. Comme f (y) est égale à la dérivée de la solution y(t), les solutions seront toutes
des fonctions croissantes. L’examen du champs de vecteurs montre en outre qu’elles
tendent vers l’infini.

2. On calcule d’une part dy d 10 10


dt = dt ( 1−t) ) et d’autre part (0, 1)y(t) = (0, 1)( 1−t) et on
10
constate que ces deux quantités sont égales à (1−t)2 . Le graphe de cette fonction est

celui d’une branche d’hyperbole issue du point (1, 10) ayant une asymptote verticale
en t = 1.

1 1
3. On a (t0 , y0 ) = (0, 10), (t1 = h, y1 = y0 + hf (y0 ) = ( 10 , 10 + ( 10 )10 = 11), (t2 =
2 1 100 2 10
10 2, y = 11 + ( 10 )( 9 ) = ( ,
10 9 ). On trouve pour les trois points suivants (t3 , y3 ) =
3 4 5
( 10 , 13.79), (t4 , y4 ) = ( 10 , 15.356), et (t5 , y5 ) = ( 10 , 17.456).

Exercice 3 : Pour l’équation différentielle dy(t)


dt = −0, 1y(t), calculer les 5 premiers points de
la suite (tn , yn ) de l’approximation d’Euler de la trajectoire issue de (O, 10) (on choisira
le pas h = 0, 25) et tracer sur le même dessin le graphe de la solution approchée et celui
de la solution exacte.

Exercice 4 : On s’intéresse à la solution de l’équation différentielle dy(t) 2


dt = 18y (t) de condition
initiale y(0)=-0,1. Nous dégageons d’abord quelques propriétés générales de l’ensemble des
solutions.

1. Vérifier que y(t) = y ∗ = 0 est une solution (équilibre).

2. En utilisant la figure du champ de vecteur associé (figure (??)), vérifier qu’une solution
de cette équation de condition initiale positive (resp. négative) reste positive (resp.
négative) pour tout t > 0.

3. Calculer les 4 premiers termes de l’approximation d’Euler de la solution de condition


initiale y(0) = −0, 1 en prenant h=1.

4. Comparer les résultats des deux questions précédentes. Qu’en pensez-vous ?

Exercice 5 : L’écureuil est un petit animal ayant un instinct territorial très développé. En
observant la dynamique d’une population d’écureuils, on peut faire les deux observations
suivantes :
– Si la population est trop grande, le taux de croissance décroı̂t ou même devient négatif.
– Si la population est trop petite, les écureuils en age de se reproduire courent le risque
de ne pas trouver de partenaire et donc, là encore, le taux de croissance est négatif.
Il est donc proposé le modèle dynamique suivant pour une population d’écureuils, k, N et
M étant des constantes positives telles que N > M :

  
y y
y 0 = ky 1 − −1
N M

1. Voici le graphe de la fonction f (y) = ky(1 − Ny )( M


y
− 1), dans le cas où k = 0, 5,
M = 10 et N = 100. Calculer les équilibres de ce modèle et déterminer leur stabilité
à l’aide du graphique.
34 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS

60

50

40

30

20

10

0 20 40 60 80 100
y

2. Tracer plusieurs trajectoires (t, y(t)) de façon à avoir une idée graphique de la dy-
namique.
3. Préciser, en discutant selon les valeurs de la population initiale y(0), ce qu’il advient
de la population d’écureuils selon ce modèle (explosion, extinction, ...) et expliquer
ce que représentent les trois constantes k, N et M .
Exercice 6 : On considère une population de prédateurs y(t) qui se nourrissent exclusivement
de proies celle-ci formant une population notée x(t). On propose le modèle suivant pour
la dynamique de la population de prédateurs (β et q sont des constantes positives) :

dy(t)
= βx(t)y(t) − qy(t)
dt
1. Décrire la dynamique de la population de prédateurs en l’absence de proies.
2. Expliquer ce que représente le terme βx(t)y(t).
3. Décrire la dynamique de la population de prédateurs lorsque la populations des proies
est supposée constante (x(t) = C ste ).
4. Quelle équation pourriez-vous proposer pour modéliser la dynamique de la population
de proies ?
5. Notons qu’ici l’équation différentielle considérée est de la forme y 0 = f (y, t), avec
f (y, t) = βx(t)y − qy c’est-à-dire que la fonction f qui la définit dépends du temps
à travers la taille x(t) de la population de proies. On dit dans ce cas que l’équation
différentielle est non autonome. L’une des conséquence est que le champs de vecteur
associé n’est plus invariant par translation horizontale. Voyez-vous pourquoi ?
Chapitre 5

Dynamiques d’une population


structurée en ages

Les modèles malthusiens et logistiques ont un défaut qui n’a pas encore été souligné : ils
supposent que le taux de reproduction (différence entre les taux de natalité et de mortalité) est
identique pour tous les individus de la population. En réalité ces taux dépendent évidemment de
l’age des individus (ou de leur stade de développement). Ainsi dans une population de saumons
par exemple, oeufs, larves et poissons adultes n’ont pas le même taux de natalité ni le même
taux de mortalité. Nous allons étudier dans cette leçon le plus simple des modèles dynamiques
qui tient compte de cette hétérogénéité, le modèle linéaire ou modèle structuré en ages. Pour
rester le plus élémentaire possible, on supposera que la population étudiée dispose de ressources
illimitées, c’est-à-dire que l’on généralise ici le cas malthusien, qui ne tient pas compte des
limites environnementales et non le cas logistique. Bien entendu, il est possible de concevoir des
modèles plus élaborés qui prennent en compte à la fois la structure en age et les limitations
environnementales mais nous ne le ferons pas ici. Enfin cette étude sera aussi l’occasion de
développer l’outils mathématique du calcul matriciel, déjà abordé pour l’étude des chaines de
Markov, notamment par l’introduction des notions de valeurs propres et de vecteurs propres
d’une matrice.

5.1 Exemple introductif


Le modèle présenté ici est dû à Sir Paul Leslie (1945) et il est l’un des plus utilisé en dy-
namique des populations et en démographie. Il suppose que la population étudiée est constituée
de plusieurs groupes d’individus à des stades différents ou classes d’ages différentes (oeufs, oisil-
lons, oiseaux, par exemple ou bien graines, rosettes, plantes en fleurs, etc...). Les effectifs de
chacune des classes évoluent de façons différentes mais pas indépendemment les unes des autres.
On va étudier la dynamique de ce type de modèle et notamment chercher à répondre aux deux
questions suivantes :
1. l’effectif total, somme des effectifs des différentes classes, a-t-il, comme dans le cas malthusien
d’une classe unique, une croissance exponentielle avec un taux de croissance constant, et
dans ce cas, comment calculer ce taux ?
2. La répartition des individus dans les différentes classes, la distribution initiale, se maintient-
elle au cours du temps ou bien se modifie-t-elle et de quelle façon ?
Exemple : Pour commencer examinons un exemple. Il s’agit d’une population de rongeurs
ayant un cycle de reproduction de 3 ans. On ne considère ici que la sous population formée
des individus femelles. On suppose que chaque femelle donne en moyenne naissance à 6 femelles
durant sa deuxième année et à 10 femelles durant sa troisième année. Cependant, seul un rongeur
sur deux survit au dela de sa première année et seul 40% de ceux qui survivent la deuxième
année survivront jusqu’à la troisième année.

35
36 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES

jt pt at
14000

12000

10000

8000

6000

4000

2000

0
0 1 2 3 4 5 6
t

Fig. 5.1 – Evolution des trois classes d’ages de la population de rongeurs décrite par la dynamique
(5.1) correspondant à la condition initiale (30, 50, 50).

Si l’on désigne respectivement par jt , pt et at les effectifs à l’instant t des femelles juvéniles, des
femelles préadultes (rongeurs de 1 an) et des femelles adultes (rongeurs de 2 ans), les informations
précédentes peuvent s’écrire : 

 jt+1 = 6pt + 10at
pt+1 = 0, 5jt (5.1)

 a
t+1 = 0, 4p t

Ces formules (5.1) permettent, à partir des effectifs initiaux des trois classes, (j0 , p0 , a0 ), de
calculer les effectifs (j1 , p1 , a1 ) à l’instant suivant t = 1, puis, (j2 , p2 , a2 ) à l’instant t = 2 et ainsi
de suite. Si (j0 , p0 , a0 ) = (30, 50, 50), on obtient par exemple :

t 0 1 2 3 4 5 6
jt 30 800 290 2460 2470 7960 12330
pt 50 15 400 145 1230 1235 3980
at 50 20 6 160 58 492 494

On peut voir la dynamique des trois classes sur la figure (5.1) qui montre les premiers termes
des trois suites (jt ), (pt ) et (at ) pour 0 ≤ t ≤ 6.
Si l’on désigne par Nt = jt + pt + at l’effectif total de la population à l’instant t (et donc
N0 l’effectif initial), on peut également calculer à partir de (5.1) les termes successifs de la suite
(Nt ), ce qui permet d’apréhender aussi la dynamique de cette population dans son ensemble.
On a ici :

t 0 1 2 3 4 5 6
Nt 130 835 696 2765 3758 8687 16804

Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
jt+1 pt+1
jt , pt et at+1
at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur ces
premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la dynamique
de ces différentes classes d’age. Et si l’on considère la population dans son ensemble, les quotients
Nt+1
Nt ne sont pas plus réguliers.
5.2. LE MODÈLE DE LESLIE 37

t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2

Par contre si on laisse le temps augmenter, on constate que ces taux tendent tous vers la
même valeur λ, ici λ = 2, c’est-à-dire qu’après un certain temps, la dynamique considérée consiste
simplement en une multiplication par un facteur 2 des effectifs de chaque classe d’une période
à la suivante. Ce facteur multiplicatif, qui correspond à un taux de croissance asymptotique
s’appelle la valeur propre dominante et peut être calculé facilement comme nous allons le voir.
Si l’on s’intéresse maintenant non plus à la dynamique des effectifs mais à l’évolution au cours
du temps de la répartition des individus entre les diverses classes, on peut calculer, à partir de la
répartition initiale des individus selon ces trois classes v0 = (j0 /N0 , p0 /N0 , a0 /N0 ) l’évolution de
cette répartition au cours du temps vt = (jt /Nt , pt /Nt , at /Nt ). On constate que, cette répartition
tend vers une répartition asymptotique qui est celle du vecteur v = (100, 25, 5), c’est-à-dire
la répartition ( 100 25 5
130 , 130 , 130 ) ' (0.77, 0.192, 0.038). Cette répartition particulière a en outre la
propriété remarquable que, sur une population initiale répartie de cette façon, la dynamique est
exactement le comportement asymptotique indiqué plus haut, à savoir une multiplication des
effectifs par 2.

5.2 Le modèle de Leslie


On peut écrire le modèle précédent en utilisant une notation matricielle de la façon suivante :
     
jt+1 0 6 10 jt
     
p =
 t+1   0, 5 0 0 · p
  t 
at+1 0 0, 4 0 at

Si l’on introduit une notation vectorielle Xt pour le vecteur colonne des effectifs des trois classes
à l’instant t, et un nom L pour cette matrice, la dynamique peut donc se réécrire d’une façon
qui est très semblable aux dynamiques malthusiennes d’une population à une seule classe :

Xt+1 = L · Xt . (5.2)

Ainsi le vecteur des effectifs initiaux X0 se transforme à l’instant t = 1 en X1 = L · X0 , qui lui


même se transforme en X2 = L · X1 et ainsi de suite. La matrice L est un exemple de matrice
de Leslie.
On appelle matrice de Leslie une matrice de la forme
 
f1 f2 f3 . . . fn
 p1 0 0 ... 0 
 
 
 0 p2 0 ... 0 
 
 ... ... ... ... ... 
0 . . . . . . pn−1 0

Elle permet de modéliser par la dynamique (5.2) une population structurée en n classes d’age :
la première ligne contient les coeficients de fertilitéde chaque classe d’age f2 , f3 , ...fn et la sous
diagonale les probabilités de survie p1 , p2 , ...,pn−1 d’une classe d’age à la suivante. Les matrices
de Leslie ont tous leurs coefficients positifs ou nuls (mais elles ne sont pas pour autant des
matrices stochastiques car elles n’ont pas généralement la somme des coefficients de leurs lignes
égale à 1).
38 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES

5.3 Valeurs propres, vecteurs propres


Soit L une matrice n × n et X un vecteur n × 1. Un nombre λ qui vérifie
L · X = λX
s’appelle une valeur propre de la matrice L. Une matrice n × n possède soit n valeurs propres,
soit moins de n lorsque certaines sont confondues ou parfois égales à des nombres complexes.
A chaque valeurs propres est associé au moins un vecteur X dont l’image par L est égal à
λ fois lui-même. On l’appelle le vecteur propre associé à λ. La plupart des logiciels de calcul
mathématique permettent de calculer les valeurs propres et les vecteurs propres d’une matrice
L donnée. Ainsi par exemple la matrice L de l’exemple précédent possède deux valeurs propres
λ = 2 et λ = 1 et X ∗ = (100 25 5) est un vecteur propre associé à λ = 2 puisque l’on a :
     
0 6 10 100 100
     
 0, 5 0 0  ·  25  = 2  25 
0 0, 4 0 5 5
Notons que tout multiple d’un vecteur propre est un vecteur propre (le vérifier !) ce qui
explique que l’on choisisse souvent pour vecteur propre un vecteur dont la somme des coefficients
vaut 1.
Si l’effectif initial de la population X0 est égal à un vecteur propre de la matrice L associé à
la valeur propre λ, alors on aura pour tout t ≥ 0 la dynamique suivante : Xt = λt X0 . Il est facile
d’en déduire qu’on aura alors également cette dynamique pour l’effectif total Nt . En d’autres
termes, lorsque la répartition de la population entre les diverses classes d’age forme un vecteur
propre de L associé à la valeur propre λ, alors la dynamique de la population dans son ensemble
et de chaque classe d’age en particulier est tout simplement une dynamique malthusienne de
taux de croissance ln(λ) (puisque l’on a λt = et ln(λ) ). Ce résultat est déjà très intéressant mais
il ne permet pas de décrire la dynamique dans le cas où la répartition initiale est différente de
cette répartition idéale.

5.4 Le théorème de Perron Frobenius


C’est le théorème de Perron Frobenius qui va nous permettre dans la plupart des cas de
décrire la dynamique lorsqu’on ne part pas de cette répartition particulière. On dit qu’une
matrice de Leslie est régulière lorsque l’une de ses puissances L, L2 , L3 , L4 , etc...a tous ses
coefficients strictement positifs. C’est le cas de la matrice de l’exemple puisque sa puissance L5
est à coefficients strictement positifs comme on peut le vérifier facilement.
Le Théorème de Perron Frobenius affirme qu’une matrice régulière possède une valeur propre
positive strictement plus grande que toutes les autres valeurs propres que l’on appelle valeur
propre dominante λ à laquelle est associé un vecteur propre X ∗ dit vecteur propre dominant
dont tous les coefficients sont positifs. De plus si X(0) est un vecteur initial dont tous les
coefficients sont strictement positifs, si X(t) = (x1 (t), x2 (t), . . . , xn (t) est sa dynamique et N (t) =
x1 (t) + x2 (t) + . . . + xn (t)) la somme de ses coefficients, on a les propriétés suivantes :
xi (t+1)
1. pour tout i = 1..n, xi (t) →t→∞ λ∗
2. X(t) ∗ ∗
N (t) →t→∞ X si l’on a choisi le vecteur X tel que la somme de ses coefficients fasse 1.
Ce résultat important permet d’affirmer que si la matrice de Leslie d’un modèle dynamique
(5.2) est régulière, alors cette dynamique présentera lorsque t augmente, un comportement as-
ymptotique de croissance exponentielle (de type malthusienne comme dans l’exemple) et la
population se répartira selon une répartition particulière qui ensuite sera invariante au cours du
temps. De plus le calcul de ce taux de croissance malthusien et de cette répartition asymptotique
se fait simplement en recherchant la valeur propre dominante λ∗ de la matrice de Leslie et un
vecteur propre X ∗ associé de somme 1.
5.5. EXERCICES 39

5.5 Exercices
Exercice 1 : Considérons une population de saumons en limitant nos observations aux seules
femelles. Supposons qu’elles vivent au maximum 3 ans, avec un taux de survie de 0, 05% la
première année et 10% la seconde, et enfin supposons que chaque femelle donne naissance
à 2000 juveniles au cours de sa troisième année.
1. Ecrire le système dynamique modélisant l’évolution de cette population de saumons.
2. Indiquer quelle est la matrice de Leslie L de ce système.
3. Si l’on suppose que la population initiale comporte 1000 femelles dans chaque classes
d’age, combien y en aura-t-il de chaque classe l’année suivante ? Combien l’année
d’après ?
4. Calculer les effectifs l’année 4 et en déduire, sans nouveaux calculs, les effectifs des
années suivantes.
5. Représenter les effectifs des différentes classes d’age en fonction du temps.
Exercice 2 : Même exercice mais en supposant cette fois que la population de saumons femelles
présente 4 classes d’age (d’une année chacune) avec des taux de survie de 0, 5%, 7% et
15% respectivement et une reproduction uniquement durant la 4e année de 5000 juveniles
par femelle.
Exercice 3 : On considère un modèle de Leslie de matrice
!
2, 25 9
L=
0, 25 0
1. A quoi correspondent les trois coefficients non nuls de L par rapport à la population
que l’on modélise ?
2. Vérifier que 3 et −0, 75 sont deux valeurs propres de L de vecteurs propres respectifs
(3 ; 0, 25) et (−3 ; 1).
3. En déduire la valeur propre dominante λ∗ et un vecteur propre dominant X ∗ de
somme 1.
4. Pour une population initiale égale à X0 = (10 ; 10), calculer les premiers termes
de la dynamique X1 , X2 , X3 puis l’évolution de la répartition X X2 X3
N1 , N2 , N3 . Qu’en
1

concluez-vous ?
Exercice 4 : Même exercice pour !
0, 25 2
L=
0, 375 0
avec les valeurs propres 1 et −0, 75 et les vecteurs propres respectifs (1 ; 0, 375) et
(−1 ; 0, 5).
Exercice 5 : Un modèle de Leslie a été proposé pour représenter la dynamique de la population
d’un pays. Ne prenant en compte que les individu de sexe féminin, c’est-à-dire en ignorant
les naissances masculines dans les taux de fécondités des classes, on a choisi dix classes d’age
d’une durée de 5 ans et un pas de temps de 5 an également. On a obtenu les coefficients
suivants sur la première ligne de la matrice
 
0, 000 0, 0010 0, 878 0, 3487 0, 4761 0, 3377 0, 1833 0, 0761 0, 174 0, 0010
et les coefficients suivants sur la sous diagonale
 
0, 9966 0, 9983 0, 9979 0, 9968 0, 9961 0, 9947 0, 9923 0, 9987 0, 9831
1. Comment expliquer que les coefficients de la première ligne sont croissants puis
décroissants ?
2. Pourquoi le premier coefficient de la sous diagonale est-il inférieur au suivant ?
3. Pourquoi n’a-t-on pas tenu compte des individus de plus de 50 ans dans ce modèle ?
Chapitre 6

Le modèle proies-prédateurs de
Lotka-Volterra

Le modèle que nous étudions a été proposé par Volterra (et indépendemment par Lotka) en
1926 dans un ouvrage intitulé ”Théorie mathématique de la lutte pour la vie” qui est probable-
ment le premier traité d’écologie mathématique. Volterra avait été consulté par le responsable
de la pêche italienne à Trieste qui avait remarqué que, juste après la première guerre mondiale
(période durant laquelle la pêche avait été nettement réduite) la proportion de requins et autres
prédateurs impropres à la consommation que l’on pêchait parmi les poissons consommables était
nettement supérieure à ce qu’elle était avant guerre et à ce qu’elle redevint ensuite.

6.1 Le modèle :

Le modèle concerne deux populations dont les effectifs au temps t sont respectivement notés
x(t) et y(t), la seconde (les prédateurs) se nourissant de la première (les proies). On fait les
hypothèses suivantes (inévitablement simplificatrices !) :
– Les proies x(t) disposent de nouriture en quantité illimitée, seuls les prédateurs y(t) s’op-
posent à leur croissance et en l’absence de prédateurs la population des proies a une
croissance exponentielle (modèle malthusien).
– Le nombre de prédateurs est limité par la quantité de proies dont ils disposent pour se
nourir et en l’absence de proies, la population des prédateurs a une décroissance exponen-
tielle (modèle malthusien).
– Le nombre de rencontres entre proies et prédateurs et à la fois proportionnel à x(t) et y(t)
donc proportionnel au produit x(t)y(t).
– Le taux de disparition des proies ainsi que le taux de croissance des prédateurs dues à
ces rencontres sont l’un et l’autre proportionnels au nombre de rencontres entres les deux
populations.
Ceci conduit au modèle suivant :


 dx(t)
 = α1 x(t) − β1 x(t)y(t)
dt (6.1)
 dy(t)

= −α2 y(t) + β2 x(t)y(t)
dt

où α1 > 0 est le taux de natalité (naturel) des proies, α2 > 0 le taux de mortalité (naturel) des
prédateurs et β1 > 0 etβ2 > 0 des coefficients d’interaction entre les deux populations. Pour des
raisons évidentes, on ne s’interesse à ce système que pour des valeurs de x er y positives.

41
42 CHAPITRE 6. LE MODÈLE PROIES-PRÉDATEURS DE LOTKA-VOLTERRA

Modele de Lotka-Volterra
6

5 5

4
4

y
3
3

1
0 2 4 6 8 10 –10 –8 –6 –4 –2 0 2 4 6 8 10

x t

Fig. 6.1 – Le champs de vecteurs du modèle de Lotka-Volterra et deux trajectoires particulières


à gauche ; les graphes des deux composantes de la trajectoire la plus petite :x(t) en pointillés et
y(t) en trait plein.

6.2 Un exemple :
Supposons par exemple qu’en l’absence de prédateurs la dynamique des proies soit la dy-
namique malthusienne x0 (t) = 0, 6x(t), qu’en l’ansence de proies celle des prédateurs soit la dy-
namique malthisienne y 0 (t) = −0, 25y(t) et qu’enfin les coefficients d’interaction soient β1 = 1, 8
et β2 = 0, 5. On obtient le système suivant :
(
x0 = 0, 8x(1 − 0, 5y)
(6.2)
y 0 = −0, 2y(x − 3)

La figure (6.1) représente d’une part les trajectoires de deux solutions particulières de ce
système (6.2) qui se révèlent être des courbes fermées de forme ovoı̈de parcourues dans le sens
inverse des aiguilles d’une montre et d’autre part les graphes (t → x(t)) et (t → y(t)) qui
représentent les dynamiques de chacune des deux populations, proies et prédateurs, au cours du
temps. On observe que ces dynamiques sont périodiques et présentent un comportement typique
des modèles de Lotka Volterra connu sous le nom d’oscillations autoentretenues. En effet ces
variations périodiques de la taille de ces deux populations ne sont pas dues à des variations de
leur environnement mais elles s’auto entretiennent : une diminution du nombre de proie entraine
une diminution du nombre de prédateurs qui en viennent à manquer de nourriture, diminution
qui, à son tour, rendra possible une nouvelle augmentation du nombre de proies profitant de
l’absence de prédateurs, augmentation qui va permettre un redémarrage de la croissance des
prédateurs et ainsi de suite. On notera en particulier que ces oscillations de x(t) et y(t) n’ont
pas lieu ensemble mais plutot de façon décalée dans le temps.

6.3 Etude qualitative :


Dans l’exemple précédent, nous n’avons pas expliqué comment a été mise en évidence la
dynamique du système. Plus généralement si l’on considère un système différentiel de la forme

 dx(t)
 = f (x(t), y(t))
dt (6.3)
 dy(t)

= g(x(t), y(t))
dt
comment obtient-on sa dynamique ? Parfois, mais c’est rare tout comme dans le cas des équations
différentielles uniques, on peut trouver, si l’on se donne une condition initiale (x(0), y(0)), la
6.4. LOI DE CONSERVATION : 43

solution (x(t), y(t)) du système (6.3) issue de cette condition initiale. C’est le cas par exemple
du système différentiel suivant, appelé oscillateur harmonique,

 dx(t)
 = −y(t)
dt (6.4)
 dy(t)

= x(t)
dt

En effet, il est facile de voir que, pour toutes les valeurs de A, les courbes t 7→ (A cos(t), A sin(t))
sont des solutions du système et qu’il suffit de choisir A = x(0)2 + y(0)2 . Mais le plus souvent on
ne trouvera pas d’expression explicite pour x(t) et y(t) et on aura recours à une étude qualitative
(comme nous allons le voir à présent) pour se faire une idée du comportement des solutions.
Pour l’étude qualitative, on se sert du champs de vecteur associé tel que celui qui est
représenté sur la figure (6.1). En effet, si une courbe t → (x(t), y(t)) est une solution du système
différentiel (6.3) alors elle est tangente en chacun de ses points au vecteur (f (x, y), g(x, y)).
Si l’on trace ce vecteur en chaque point (x, y) du plan, les trajectoires solutions du système
sont simplement des courbes tangentes en chacun de leurs points aux vecteurs de ce champs de
vecteurs. Notons que si en un point f (x, y) = 0, le vecteur en ce point sera vertical, et de même
si g(x, y) = 0, il sera horizontal. On en déduit que la courbe d’équation g(x, y) = 0, appelée
isocline horizontale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3)
ont une tangente horizontale. De même la courbe d’équation f (x, y) = 0, appelée isocline verti-
cale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3) ont une tangente
verticale. Les points d’intersections de ces deux isoclines sont les équilibres (x∗, y∗) du système
c’est-à-dire les points tels que la trajectoire issue d’un tel point reste en ce point pour tout t.
Dans chacune des régions du plan délimitées par les deux isoclines horizontales et verticales, les
quantités f (x, y) et g(x, y) sont de signe constant et on peut schématiser la direction du champs
de vecteurs par une flèche de l’un des quatres type suivants : vers la droite et vers le haut (si
f > 0 et g > 0), vers la droite et vers le bas (si f > 0 et g < 0), vers la gauche et vers le haut
(si f < 0 et g > 0), vers la gauche et vers le bas (si f < 0 et g < 0). La position des équilibres,
celle des deux isoclines verticale et horizontale, les flèches du champs de vecteurs et la pro-
priété qu’on les trajectoires de ne jamais se croiser, permettent une étude qualitative du système
(6.3) : le plus souvent, on peut en déduire l’allure des solutions en fonction de leur condition
initiale (x(0), y(0)). Pour le modèle de Lotka-Volterra, une telle étude révèle la présence d’un
équilibre (x∗, y∗) = ( αβ22 , αβ11 ) à l’intersection de l’isocline horizontale −α2 + β2 x = 0 et vertical
α1 − β1 y = 0 et montre également que les trajectoires tournent autour de cet équilibre, comme
on le voit sur la figure (6.1). Dans l’exemple, l’isocline verticale est la droite d’équation x = 3,
l’isocline horizontale la droite d’équation y = 2 et l’équilibre est le point (3 ; 2).

6.4 Loi de conservation :


L’étude qualitative précédente permet de prédire des oscillations à la fois pour x(t) et pour
y(t) mais il n’est pas possible de répondre, sans une étude complémentaire, à la question de
savoir si les trajectoires se referment ou si elles spiralent vers l’intérieur ou vers l’extérieur.
Pour répondre à cette question, nous allons utiliser le fait que ce système possède une loi de
conservation. Prenons tout d’abord le cas plus simple de l’oscillateur harmonique. Son étude
qualitative (voir figure (6.3)) montre, un peu comme dans le cas du modèle de Lotka-Volterra,
des trajectoires tournant autour de l’équilibre qui est ici (x∗, y∗) = (0, 0). En outre, il est
facile de voir ici que la fonction H(x, y) = x2 + y 2 reste constante sur les solutions puisque
H(A cos(t), A sin y(t)) = A2 (cos2 (t) + sin2 (t)) = A2 . On dit que la quantité H(x, y) reste con-
servée sur les solutions du système (6.4) ou encore que la fonction H(x, y) est une loi de con-
servation du système (6.4).
Plus généralement, pour un système (6.3) quelconque, on a la règle suivante :
44 CHAPITRE 6. LE MODÈLE PROIES-PRÉDATEURS DE LOTKA-VOLTERRA

Oscillateur harmonique 3
3

2
2
y

1
1

–4 –3 –2 –1 0 1 2 3 4
–3 –2 –1 0 1 2 3

x t

–1 –1

–2 –2

–3
–3

Fig. 6.2 – Le champs de vecteurs de l’oscillateur hamonique et deux trajectoires particulières à


gauche ; les graphes des deux composantes de la trajectoire la plus petite : :x(t) en pointillés et
y(t) en trait plein.

Proposition 6.1 Pour que H(x, y) soit une loi de conservation pour le système (6.3), il suffit
que
∂H ∂H
(x, y) · f (x, y) + (x, y) · g(x, y) = 0
∂x ∂y
où ∂H
∂x (x, y) est la dérivée partielle de H(x, y) par rapport à x (que l’on obtient en dérivant H
par rapport à x tout en laissant y fixe) et de même pour ∂H ∂y (x, y).

Ainsi, pour H(x, y) = x2 +y 2 , ∂H ∂H


∂x (x, y) = 2x+0, ∂y (x, y) = 0+2y et l’on a bien 2x(−y)+2y(x) =
0.
Dans la cas du modèle de Lotka-Voterra, on peut s’assurer grace à cette règle que la fonction

H(x, y) = α1 ln y − β1 y + α2 ln x − β2 x

est une loi de conservation. On en déduit que les courbes de niveau de H, c’est-à-dire les courbes
d’équation H(x, y) = C ste , qui, autour de l’équilibre, sont des courbes fermées concentriques,
sont des trajectoires du système.

6.5 Exercices :
Exercice 1 : On suppose que deux populations d’araignées et de papillons sont modélisées par
un modèle de Lotka-Volterra avec α1 = 0, 1, α2 = 0, 5 et β1 = β2 = 0, 001. Si l’on suppose
que les tailles initiales des deux populations sont respectivement de 200 araignées et 600
papillons, quelle sera, selon ce modèle, la dynamique de ces deux populations à court
terme ? Pour répondre à cette question, on pourra commencer par tracer les deux isoclines
horizontale et verticale, le point d’équilibre et l’allure de la trajectoire ayant la condition
initiale indiquée.
Exercice 2 : On considère la fonction H(x, y) = 12 x2 y.
1. Représenter sur le même graphique ses courbes de niveau 0, 1, −1, 2, −2. Indiquer
l’allure de l’ensemble des courbes de niveau de H.
2. On considère le système différentiel
(
x0 = −x
(6.5)
y 0 = 2y
6.5. EXERCICES : 45

ModŁle de Lotka-Volterra

1.4

1.4

1.3

1.3

1.2
1.2

1.1
1.1

1
1

0.9 0.9

0.8
0.8

0.7
0.7

0.6 0.8 1 1.2 1.4 1.6 1.8 -20 -10 0 10 20


x

Fig. 6.3 – Figure de l’exercice 4

Montrer que la fonction H(x, y) est une loi de conservation de ce système. En déduire
l’allure des solutions du système (indiquer le sens de parcours des trajectoires).
3. Retrouver ce même dessin en faisant une étude qualitative du système (6.5) (isoclines,
équilibres, flèches dans les différents secteurs).
4. Choisir un point (x0 , y0 ) du premier quadrant (x0 > 0, y0 > 0) et calculer la so-
lution (x(t), y(t)) du système (6.5) issue de ce point en résolvant explicitement le
système. Préciser l’évolution au cours du temps que ce système prévoit s’il représente
la dynamique de deux populations.
Exercice 3 : On considère le système différentiel suivant :
(
x0 = x
(6.6)
y0 = x − y

1. Indiquer sur un dessin la position des isoclines verticales et horizontales, les équilibres,
la direction du champs de vecteurs dans les différentes régions délimitées par les
isoclines.
2. Préciser la direction du champs de vecteurs sur la droite y = 12 x. En déduire que
(x(t), y(t)) = (et , 12 et ) est une solution particulière du système (6.6). Quelle est la
solution de condition initiale (x(0), y(0)) = (−1, − 12 ) ?
3. Tracer sur votre dessin la famille des trajectoires.
Exercice 4 : Sur le premier graphique de la figure (??) ci-dessus, on a représenté deux solutions
du modèle de Lotka-Volterra, comme courbes paramétrées (t → (x(t), y(t))) et, sur le
second, pour l’une de ces deux solutions, on a représenté ses deux composantes (t → x(t))
et (t → y(t)) comme fonctions du temps.
1. A laquelle des deux trajectoires représentées sur le premier graphique correspond les
deux courbes du second graphique ? Justifier.
2. Entre les instants t = 0 et t = t1 , l’une des deux coordonnées est décroissante alors que
l’autre croı̂t puis décroı̂t. Indiquer sur le premier graphique les points correspondant
aux instants t = 0 et t = t1 que vous noterez A0 et A1 respectivement. Expliquer, en
terme de comportement comme proies ou comme prédateurs des populations étudiées,
comment on peut expliquer ce type d’évolution.
Chapitre 7

Méthode des moindres carrées

Une situation courante en sciences biologiques est d’avoir à sa disposition deux ensembles de
données de taille n, {y1 , y2 , . . . , yn } et {x1 , x2 , . . . , xn }, obtenus expérimentalement ou mesurés
sur une population. Le problème de la régression consiste à rechercher une relation pouvant
éventuellement exister entre les x et les y, par exemple de la forme y = f (x). Lorsque la relation
recherchée est affine, c’est-à-dire de la forme y = ax + b, on parle de régression linéaire. Mais
même si une telle relation est effectivement présente, les données mesurées ne vérifient pas en
général cette relation exactement. Pour tenir compte dans le modèle mathématique des erreurs
observées, on considère les données {y1 , y2 , . . . , yn } comme autant de réalisations d’une variable
aléatoire Y et parfois aussi les données {x1 , x2 , . . . , xn } comme autant de réalisations d’une
variable aléatoire X. On dit que la variable Y est la variable dépendante ou variable expliquée
et que la variable X est la variable explicative .

7.1 La droite des moindres carrés


Les données {(xi , yi ), i = 1, . . . , n} peuvent être représentées par un nuage de n points dans
le plan (x, y), le diagramme de dispersion. Le centre de gravité de ce nuage peut se calculer facile-
ment : il s’agit du point de coordonnées (x, y) = ( n1 Σni=1 xi , n1 Σni=1 yi ). Rechercher une relation
affine entre les variables X et Y revient à rechercher une droite qui s’ajuste le mieux possible à
ce nuage de points. Parmi toutes les droites possibles, on retient celle qui jouit d’une propriété
remarquable : c’est celle qui rend minimale la somme des carrés des écarts des valeurs observées
yi à la droite ŷi = axi + b. Si εi représente cet écart, appelé aussi résidu, le principe des moindres
carrés ordinaire (MCO) consiste à choisir les valeurs de a et de b qui minimisent
n
X n
X
E= ε2i = (yi − (axi + b))2 .
i=0 i=0

Pn
(x −x)(yi −y)
Un calcul montre que ces valeurs, notées â et b̂, sont égales à â = P
i=1 i
n et b̂ =
(x −x)2
i=1 i
y −âx. On exprime souvent â au moyen de la variance et de la covariance des variables aléatoires

47
48 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES

Fig. 7.1 – Illustration de la formule DT=DA+DR. La droite horizontale passe par le centre de
gravité du nuage ; la première figure représente la dispersion totale DT, la seconde la dispersion
due à la regression DR (nulle si la pente de la droite des moindres carrés est nulle et importante
si cette pente est forte) et la troisième la dispersion autour de la droite, ou dispersion résiduelle.

X et Y par â = covxy /s2x . En effet, on a :

n n
1X 1X
s2x = (xi − x)2 et covxy = (xi − x)(yi − y).
n i=1 n i=1

7.2 Evaluation de la qualité de la régression


Pour mesurer la qualité de l’approximation d’un nuage (xi , yi )i=1..n par sa droite des moindres
carrés (après tout on peut toujours faire passer une droite par n’importe quel nuage !), on calcule
son coefficient de corrélation linéaire défini par

covxy
rxy = .
sx sy

C’est un nombre compris entre −1 et +1, qui vaut +1 (resp. −1) si les points du nuage sont
exactement alignés sur une droite de pente a positive (resp. négative). Ce coefficient est une
mesure la dispersion du nuage. On considère que l’approximation d’un nuage par sa droite des
moindres carrés est de bonne qualité lorsque |rxy | est proche de 1 (donc rxy proche de +1 ou
de −1) et de médiocre qualité lorsque√ |rxy | est proche de 0. En pratique on estime souvent la
régression acceptable lorsque |rxy | ≥ 23 .
Parfois on préfère calculer non plus rxy mais son carré noté R2 = rxy rxy car on a la relation
suivante (voir figure 7.2) :
X X X
(yi − y)2 = (yi − ŷi )2 + (ŷi − y)2

qui exprime que la dispersion totale de Y (DT) est égale à la dispersion autour de la régression
(DA) plus la dispersion due à la régression (DR). Or on peut vérifier que l’on a R2 = DR DT ,
c’est-à-dire que le R2 représente la part de la dispersion totale de Y que l’on peut expliquer par
la régression. Ainsi si l’on obtient une valeur de R2 = 0, 86 (et donc r = ∓0, 92), cela signifie
que la modélisation par la droite des moindres carrés explique 86% de la variation totale, ce qui
est un très bon résultat.
Cependant, même avec un R2 excellent (proche de 1), notre modèle linéaire peut encore
être rejeté. En effet, pour être assuré que les formules données â et b̂ fournissent de bonnes
estimations de la pente et de l’ordonnée à l’origine de la droite de régression, il est nécessaire
que les résidus εi soient indépendant et distribués aléatoirement autour de 0. Ces hypothèses
ne sont pas forcément faciles à vérifier. Un tracé des résidus et un examen de leur histogramme
permet de détecter une anomalie grossière mais il faut faire appel à des techniques statistiques
plus élaborées pour tester réellement ces hypothèses (ce que nous ne ferons pas ici).
7.3. PRÉVISIONS 49

7.3 Prévisions
Si y = âx + b̂ est la droite des moindres carrés d’un nuage de points (xi , yi )i=1..n , on appelle
valeurs prédites de y par le modèle les valeurs ŷi := âxi + b̂.
On utilise notamment ces valeurs pour faire des prévisions : si les xi sont des dates successives,
x1 < . . . < xn , la valeur prédite pour y à une date future xn+1 est simplement ŷn+1 = âxn+1 + b̂.
Notons cependant que s’il peut sembler naturel d’utiliser une valeur prédite pour compléter les
données initiales dans l’intervalle des valeurs de X, on se gardera de prédire sans de multiples
précautions supplémentaires des valeurs de Y en dehors de cet intervalle. En effet il se peut que
la relation entre X et Y ne soit pas du tout linéaire mais qu’elle nous soit apparue comme telle
à tort parce que les xi sont proches les uns des autres.

7.4 Remarques
Pour finir voici quelques remarques :
1. Certains ne manqueront pas d’être surpris du fait qu’à coté des définitions de la variance
et de la covariance que nous avons données on trouve dans certains ouvrages (ou dans
les calculettes) une autre définition dans laquelle le facteur n1 a été remplacé par le fac-
1
teur n−1 . Disons que “notre” définition est la définition de la variance (ou la covariance)
1
théorique alors que celle qui comporte un facteur n−1 est la définition de la variance (ou la
covariance) empirique. La première est celle que l’on utilise lorsque n est l’effectif total de
la population alors que la seconde est celle que l’on utilise lorsque l’on estime la variance
(ou la covariance) sur un échantillon de taille n beaucoup plus petite que la taille totale.
De toute façon, dans le cadre de la régression linéaire, on notera que tant pour le calcul
de â que dans celui de rxy , le résultat sera le même que l’on utilise l’une ou l’autre de ces
formules.
2. Dans le calcul de la droite des moindres carrés, les variables X et Y ne jouent pas des
rôles interchangeables. La variable dépendante Y prend, comme son nom l’indique, des
valeurs qui dépendent de celles de X. D’ailleurs si l’on échange les rôles de X et de Y ,
on calcule une approximation linéaire de la forme x = â0 y + b̂0 , le critère des MCO est
P
alors E = ni=1 (xi − (a0 yi + b0 ))2 , et ce n’est plus le même et la droite que l’on obtient en
général. Cette droite, tout comme la précédente, passe par le centre de gravité du nuage
de point, mais c’est leur seul point commun. C’est le problème considéré qui indique s’il
faut considérer Y ou plutôt X comme variable dépendante (et l’autre comme variable
explicative). Mais si l’on s’intéresse aux interactions entre deux variables X et Y dont ni
l’une ni l’autre n’est clairement dépendante de l’autre, alors on pourra choisir de régresser
Y en fonction de X ou bien le contraire. Mais on ne doit pas s’attendre à obtenir les mêmes
résultats.
3. On appelle donnée éloignée (outlier) un point du nuage situé à l’écart. S’il est éloigné dans
la direction de y, il lui correspondra un important résidu. S’il est éloigné dans la direction
des x, il peut présenter un très petit résidu et en même temps avoir une grande influence
sur les valeurs de â et b̂ trouvées.
On appelle donnée influente un point du nuage dont l’oubli conduirait à une droite des
moindres carrés bien différente. C’est souvent le cas des données éloignées dans la direction
des x.
4. Attention à ne pas déduire trop hativement de la présence d’une liaison entre deux variables
une relation de cause à effet ! Si quelqu’un devait suivre le degré de murissement des pêches
et des abricots (par dosage de l’éthylène ou du fructose), il trouverait certainement une
relation linéaire entre les deux. Mais le murissement des abricots n’influe pas sur celui des
pèches ; ni l’inverse d’ailleurs. Par contre, les oscillations du niveau du lac Tchad (Afrique
50 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES

centrale) ont bel et bien leur source dans le cycle de 11 ans de l’activité solaire avec lequel
elles sont parfaitement corrélées. Prudence donc.

7.5 Exercices
Exercice 1 : On possède 6 spécimens fossiles d’un animal disparu et ces spécimens sont de
tailles différentes. On estime que si ces animaux appartiennent à la même espèce il doit
exister une relation linéaire entre la longueur de deux de leurs os, le fémur et l’humérus.
Voici les données de ces longueurs en cm pour les 5 spécimens possédant ces deux os
intacts :
fémur 38 56 59 64 74
humérus 41 63 70 72 84

1. Tracer le nuage de point correspondant à ces données. Pensez-vous que les 5 spécimens
peuvent appartenir à la même espèce et ne différer en taille que parce que certains
sont plus jeunes que d’autres ?
2. Calculer à l’aide de votre calculette mx , my , sx , sy et covxy . En déduire l’équation
de la droite des moindres carrés. Contrôler vos calculs en superposant son graphe au
nuage de points.
3. Calculer le coefficient de corrélation linéaire r. Qu’en concluez-vous ?
4. Reprenez les 2 questions précédentes en effectuant directement la regression linéaire
au moyen de votre calculette. Vérifier que vos résultats sont identiques.

Exercice 2 : 1. Simuler au moyen de la fonction Random de votre calculette une suite de


n = 15 nombres aléatoires (ηi )i=1,..n compris entre 0 et 1. Puis calculer les nombres
εi := 2ηi − 1.
2. Calculer la moyenne mε des εi et les remplacer par εi − mε si nécéssaire pour avoir
une suite centrée, puis calculer l’écart type de cette suite. Pouviez-vous deviner sa
valeur approximative ?
3. On choisit pour (xi ) la suite 0 ; 0, 25 ; 0, 5 ; 0, 75 ; 1 ; 1, 25 ; 1, 5 ; 1, 75 ; 2 ; 2, 25 ; 2, 5 ; 2, 75 ; 3 ; 3, 25 ; 3, 5
et pour (yi ) la suite yi = −2xi + 3 + εi . Calculer la droite de regression du nuage
(xi , yi ). Commentez.
4. Représenter les résidus et calculer la moyenne des carrés des résidus.
5. Représenter l’histogramme des résidus.
Exercice 3 : Pour étudier les problèmes de malnutrition dans un pays pauvre, on a calculé le
poids moyen par age d’un échantillon de 2400 enfants répartis uniformément en 12 classes
d’age. On a obtenu les données suivantes :
age 1 2 3 4 5 6 7 8 9 10 11 12
poids 4,3 5,1 5,7 6,3 6,8 7,1 7,2 7,2 7,2 7,2 7,5 7,8

1. Un statisticien pressé a fait calculer par sa machine la droite des moindres carrés pour
ces données et a trouvé la relation poid = 4, 88 + 0, 267age. S’est-il trompé ?
2. A votre avis, quelle est la pertinence de son modèle ?
3. Calculer puis tracer les résidus. Vous constaterez que deux résidus successifs sont
beaucoup plus souvent du même signe que du signe opposé. Ceci n’est pas com-
patible avec le fait qu’ils soient supposés indépendants. On dit que les résidus sont
autocorrélés. C’est une raison de rejeter le modèle.
7.5. EXERCICES 51

Exercice 4 : L’une des rares lois que l’on a pu mettre en évidence en Ecologie est la relation
existant entre le nombre N d’espèces présentes dans un habitat donné (bien délimité) et
la surface S de cet habitat. On considère généralement que cette relation est de la forme

N = AS B (7.1)

où A et B sont deux constantes. Afin de vérifier cette relation pour les plantes présentes
dans une prairie (pissenlit, paquerettes, orties, boutons d’or, ...), on a effectué les mesures
indiquées dans le premier tableau ci-dessous. On a représenté sur la première figure ci-
dessous les valeurs de N en fonction de celles de S et sur la deuxième les valeurs de
Ñ = ln(N ) en fonction de celles de S̃ = ln(S). On voit que la regression linéaire de Ñ sur
S̃ a donné :
Ñ = 0, 2199S̃ + 1, 7432 avec R2 = 0, 9684 (7.2)

1. Pourquoi n’a-t-on pas effectué directement une régression linéaire de N sur S ? Ex-
pliquez l’intéret de cette transformation des données.
2. Que représente R2 et que peut-on déduire de sa valeur ?
3. A partir de la régression linéaire (7.2), calculer les constantes A et B de la relation
(7.1).
4. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(128) ? En comparant avec
la valeur de S̃ observée, calculer le résidu ε en ce point.
5. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(100) ? En déduire le nombre
d’espèces pouvant coexister dans un habitat de surface S = 100, selon ce modèle.
Exercice 5 : On a mesuré sur un peuplement de bouleau blanc (Betula alba) dans le Massif
Central les circonférences des troncs de 21 individus à la hauteur de 1.3 mtres du sol
(indice DBH). Dans le même temps, un carottage des arbres a permis d’estimer leurs ages
respectifs. De cet ensemble de données on a extrait les données des arbres d’ages 1 à 120
par pas de 20 ans. Par ailleurs on a constaté sur le terrain que les arbres se répartissent en
trois catégories : les arbres les plus hauts (dominants), les arbres moyens (codominants)
et les arbres plus petits, sous le couvert des autres : les dominés.
1. Tracez sur un même graphique les trois courbes représentant la circonférence des
troncs en fonction de l’age. Que constate-t-on et comment interprétez-vous les différences
constatées ? Que pensez-vous de l’allure des courbes ? Quel type de fonction peut-on
envisager d’ajuster ?
2. On souhaite vérifier que la croissance en circonférence des troncs peut être modélisé
par une exponentielle saturée de la forme y(t) = ymax (1 − exp(rt)) où y(t) est la cir-
conférence l’instant t, ymax la valeur maximale que la circonférence peut prendre, r un
taux de croissance en circonférence et t le temps. Les valeurs de ymax ont été estimées
empiriquement à 86.4 cm, 65.43 cm et 36.00 cm pour chacune des trois catégories
d’arbres. En remarquant que, d’après l’expression de y(t), la quantité ln(y(t) − ymax )
52 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES

dépend de façon linéaire de t, estimez au moyen d’une regression linéaire le paramètre


r pour chacun des trois modèles. Vérifiez sur l’un des trois résultats la bonne qualité
de l’ajustement des données.
Ages 1 20 40 60 80 100 120
Dominants 1, 26 22, 29 40, 09 56, 15 63, 49 71, 69 81, 08
Dominés 1, 27 16, 02 29, 42 31, 61 35, 61 35, 69 35, 93
Codominants 1, 29 22, 14 35, 69 49, 23 56, 88 60, 43 63, 74
Chapitre 8

Classification automatique :
introduction

La classification (clustering) est une méthode mathématique d’analyse de données : pour


faciliter l’étude d’une population d’effectif important (animaux, plantes, malades, gènes, etc...),
on les regroupe en plusieurs classes de telle sorte que les individus d’une même classe soient le
plus semblables possible et que les classes soient le plus distinctes possibles. Pour cela il y a
diverses façons de procéder (qui peuvent conduire à des résultats différents...). Dans ce cours
nous présentons deux algorithmes, un premier appelé classification hierarchique ascendante et
un second appelé méthode des centres mobiles.

8.1 Distances entre individus d’une même population


Pour regrouper les individus qui se ressemblent (et séparer ceux qui ne se ressemblent pas),
il faut un “critère de ressemblance”. Pour cela on examine l’ensemble des informations dont on
dispose concernant les individus (pression artérielle, température, taux de métabolisme, ... par
exemple s’il s’agit de malades) notées (xi , yi , . . .) pour le ième individu, et on imagine que chaque
individu est un point Mi = (xi , yi , zi , . . .) de l’espace. S’il n’y a que deux variables relevées (xi , yi )
on obtient ainsi un nuage de points dans le plan Γ = {Mi , i = 1, . . . , n} où n est l’effectif total
de la population. La distance euclidienne de deux individus Mi et Mj est par définition
q
d2 (Mi , Mj ) = (xi − xj )2 + (yi − yj )2

Elle est d’autant plus petite que les deux individus sont semblables (du point de vue des deux
critères retenus) et d’autant plus grande qu’ils sont différents.
On peut associer à chaque nuage d’individus une matrice D = (dij )0≤i≤n,0≤j≤n = (d2 (Mi , Mj )),
dite matrice des distances. C’est une matrice à n lignes et n colonnes, à coefficients positifs,
symétrique (puisque d2 (Mi , Mj ) = d2 (Mj , Mi )) et nulle sur la diagonale (puisque d2 (Mi , Mi ) =
0). Pour un nuage d’effectif n, il y a donc n(n−1)
2 distances à calculer.
A coté de la distance euclidienne, on peut définir d’autres distances (et donc d’autres matrices
des distances). Par exemple

d1 (Mi , Mj ) = |xi − xj | + |yi − yj |

d∞ (Mi , Mj ) = Max {|xi − xj |, |yi − yj |}

8.2 Ecarts entre classes


Supposons le nuage Γ = {Mi , i = 1, . . . , n} décomposé en plusieurs classes Γ1 , Γ2 , .... , Γk et
notons G1 , G2 , .... , Gk les centres de gravité respectifs de chaque classes et notons p1 , p2 , ... ,

53
54 CHAPITRE 8. CLASSIFICATION AUTOMATIQUE : INTRODUCTION

pk les poids respectifs de chaque classe que l’on définit de la façon suivante : si l’on suppose que
tous les individus ont le même poids égal à n1 , le poids pl de la classe Γl est égal à l’effectif de
Γl divisé par n. De cette façon la somme des poids de toutes les classes vaut 1. Rappelons que
le centre de gravité G d’un nuage de points Γ est le point moyen du nuage, c’est-à-dire le point
P P
G = (x, y, . . .) de coordonnées x = n1 ni=1 xi , y = n1 ni=1 yi , ....
Pour mesurer la proximité ou l’écart entre deux classes Γl et Γm , il existe de nombreuses
façons de procéder. On calcule par exemple la quantité Min {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl }
appelée distance du plus proche voisin ou encore Max {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl } ou sim-
plement la distance des centres de gravité d2 (Gm , Gl ). Mais la mesure que l’on utilise le plus
souvent appelée écart de Ward est définie par :
p m pl
d(Γm , Γl ) := d2 (Gm , Gl )2
pm + p l
où pl et pm sont les poids des deux classes.

8.3 Inertie interclasse et inertie intraclasse


On appelle inertie totale d’un nuage Γ = {Mi , i = 1, . . . , n} la moyenne des carrés des
distances de ses points au centre de gravité du nuage. Donc, si G désigne le centre de gravité de
Γ, l’inertie totale de Γ est, si tous les points du nuage sont de même poids égal à n1 ,

1 
I(Γ) = d2 (M1 , G)2 + d2 (M2 , G)2 + . . . + d2 (Mn , G)2 . (8.1)
n
L’inertie mesure la dispersion du nuage. Si le nuage Γ est composé de k classes Γ1 , Γ2 , .... ,
Γk , celles-ci seront d’autant plus homogènes que les inerties de chaque classe, I(Γ1 ), I(Γ2 ), ....
, I(Γk ), calculées par rapport à leurs centres de gravité G1 , G2 , .... , Gk respectifs, sont faibles.
La moyenne pondérée de ces inerties est appelée inertie intraclasse :

Iintra = p1 I(Γ1 ) + p2 I(Γ2 ) + . . . + pk I(Γk ).


Les inerties des classes I(Γ1 ), I(Γ2 ), ... sont simplement calculées avec la formule (8.1) ci-dessus
où l’on remplace le centre de gravité G par celui de la classe G1 , G2 , ... et l’effectif n par celui
de la classe.
L’inertie totale d’un nuage n’est généralement pas égale à la somme pondérée des inerties
des classes qui le composent, c’est-à-dire à l’inertie intraclasse (sauf dans le cas où les centres de
gravité de toutes les classes sont confondus) car il faut prendre en compte également la dispersion
des classes par rapport au centre de gravité du nuage. Il s’agit de l’inertie interclasse définie par

Iinter = p1 d2 (G1 , G)2 + p2 d2 (G2 , G)2 + . . . + pk d2 (Gk , G)2 .

On montre le résultat suivant appelé décomposition de Huygens :

Théorème 8.1 L’inertie totale d’un nuage de points composé de différentes classes est la somme
de son inertie intraclasse et de son inertie interclasse, c’est-à-dire :

I(Γ) = I(Γ1 ∪ Γ2 ∪ . . . ∪ Γk ) = Iintra + Iinter .

8.4 Classification hiérarchique ascendante


Pour classifier une population d’effectif n dont les individus sont numérotés 1, 2, ..., on
considère cette population comme la réunion de n classes à un seul élément et on regroupe
progressivement les classes deux à deux selon l’algorithme suivant :
Etape 1 : Calculer la matrice des distances D = (dij )0≤i≤n,0≤j≤n
8.5. MÉTHODE DES CENTRES MOBILES 55

0.8

0.7

0.6

0.5

0.4

0.3

0.2

20 25 24 9 27 2 17 21 4 22 16 7 28 11 8 26 30 1 5 12 3 14 13 23 10 15 6 19 18 29

Etape 2 : Remplacer les deux individus de distance minimale par une classe (à 2 éléments)
numérotée n + 1.
Etape 3 : Calculer la perte d’inertie interclasse dû au regroupement précédent : on peut montrer
qu’il s’agit exactement de l’écart de Ward des deux individus regroupés.
Après ces trois étapes, la population compte alors n − 1 classes (n − 2 classes à un élément
et une à 2 éléments). On peut donc recommencer à l’étape 1 en remplaçant “individus” par
“classes” si nécessaire (et donc “distance entre individus” par “écarts entre classes”). Après
n − 1 itérations, tous les individus sont regroupés en une classe unique.
On construit alors un arbre, appelé dendrogramme (voir dessin ci-dessus) de la façon suivante.
On aligne sur l’axe horizontal des points représentant les différents individus et on les joint
deux à deux, successivement, en suivant cet algorithme de classification hierarchique ascendante
(commençant par les plus proches, etc...). On poursuit ainsi jusqu’à regroupement de tous les
individus en une classe unique. Pour plus de lisibilité, on pourra disposer les individus dans
l’ordre dans lequel les regroupements ont été effectués. Le niveau (hauteur) de chaque noeud
de l’arbre est, le plus souvent, choisi proportionnel à la part restante d’inertie intra sur l’inertie
totale ; dans ce cas, ce niveau est zéro lorsque tous les individus sont séparés (en bas) et vaut
1 lorsqu’il sont tous réunis en une seule classe (en haut). En fait, on trace ce dendrogramme
afin de visualiser le niveau où couper cet arbre pour réaliser la meilleure partition de l’ensemble
initial. On peut comprendre qu’il sera optimal de couper le dendrogramme à un niveau où le
regroupement entre classes conduit à une perte d’inertie inter maximale. On peut vérifier que
l’écart de Ward entre deux classes est en fait égal à la perte d’inertie inter que produirait la
réunion de ces deux classes en une seule. Le niveau des noeuds de l’arbre est donc facile à
calculer à partir des écarts de Ward entre les classes.

8.5 Méthode des centres mobiles


Cette méthode s’applique lorsque l’on sait à l’avance combien de classes on veut obtenir.
Appelons k ce nombre. L’algorithme est le suivant :
Etape 0 : Pour initialiser l’algorithme, on tire au hasard k individus appartenant à la population,
C1 (0), C2 (0), ..., Ck (0) : ce sont les k centres initiaux.
Etape 1 : On regroupe les individus autours de ces k centres de sorte à former k classes Γ1 (0),
Γ2 (0), ..., Γk (0) de la manière suivante : chaque classe Γl (0) est constituée des points plus proches
du centre Cl (0) que des autres centres Γm (0) pour m 6= l.
Etape 2 : On calcule alors les centres de gravité G1 , G2 , .... , Gk des k classes obtenues et on
désigne ces points comme nouveaux centres C1 (I) = G1 , C2 (I) = G2 , .... , Ck (I) = Gk
On répète les étapes 1 et 2 jusqu’à ce que le découpage en classes obtenu ne soit presque
plus modifié par une itération suplémentaire. On peut montrer que la variance intra classe ne
peut que décroı̂tre lorsque l’on passe d’un découpage en classes au suivant.
56 CHAPITRE 8. CLASSIFICATION AUTOMATIQUE : INTRODUCTION

8.6 Exercices
Exercice 1 : Soient M1 = (1, 0), M2 = (0, 1) et M3 = (3, 1) trois points du plan.
1. Calculer les matrices des distances du nuage formé de ces trois points en utilisant
successivement la distance euclidienne d2 puis les distances d1 et d∞ .
2. On ajoute au nuage précédent les deux points M4 = (4, 2) et M5 = (4, 3). Décrire
les étapes successives d’une classification hiérarchique ascendante en calculant no-
tamment les coordonnées et poids des classes obtenues par regroupement et la perte
d’inertie intraclasse à chaque regroupement.
3. En déduire le dendrogramme. Quelle coupure suggérez-vous ?
Exercice 2 : (Sujet inspiré d’un article de John Hartshorne, paru dans le journal de la “British
Ecological Society”)
Un laboratoire d’écologie étudie les espèces micro-animales (larves, ..) présentes dans les
rivières et les étangs. Il réalise, dans 6 sites de rivière, notés R1, R2, R3, R4, R5 et R6, et 3
sites d’étangs, notés E1, E2 et E3, des prélèvements répétés qui lui permettent d’avancer
une liste des espèces présentes dans chacun de ces sites et de repérer les espèces présentes
dans plusieurs sites à la fois. La matrice suivante contient, pour chaque paire de sites A et
B, le nombre d’espèces communes aux 2 sites. Ainsi on y lit par exemple que 11 espèces
sont présentes au site R1 et qu’il y a 7 espèces présentes à la fois au site R1 et au site R2.
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 11 7 4 6 6 7 4 4 3
R2 7 15 8 8 9 6 3 3 2
R3 4 8 13 7 7 4 2 3 2
R4 6 8 7 15 7 6 6 8 6
R5 6 9 7 7 12 4 3 5 4
R6 7 6 4 6 4 10 6 5 5
E1 4 3 2 6 3 6 13 10 9
E2 4 3 3 8 5 5 10 15 11
E3 3 2 2 6 4 5 9 11 12
On se propose de regrouper les 9 sites en trois ou quatre classes composées de sites où ce
sont pratiquement les mêmes espèces qui sont présentes. Pour réaliser cette classification,
on propose de mesurer la distance entre deux sites A et B par la formule
nA + nB − 2nAB
d(A, B) =
nA + n B
où nA (resp. nB ) désigne le nombre d’espèces présentes au site A (resp. au site B) et nAB
le nombre d’espèces en commun entre les sites A et B. On obtient la matrice des distances
suivante :
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 0 0, 462 0, 666 0, 538 0, 478 0, 334 0, 666 0, 692 0, 74
R2 0, 462 0 0, 428 ...... 0, 334 0, 52 0, 786 0, 8 0, 852
R3 0, 666 0, 428 ...... ...... 0, 44 0, 652 0, 846 0, 786 0, 84
R4 0, 538 0, 466 ...... 0 0, 482 0, 52 0, 572 0, 466 0, 556
R5 0, 478 0, 334 0, 44 0, 482 0 0, 636 0, 76 0, 63 0, 666
R6 0, 334 0, 52 0, 652 0, 52 0, 636 0 ..... ..... 0, 546
E1 0, 666 0, 786 0, 846 0, 572 0, 76 0, 478 ..... ..... 0, 28
E2 0, 692 0, 8 0, 786 0, 466 0, 63 0, 6 ..... ..... 0, 186
E3 0, 74 0, 852 0, 84 0, 556 0, 666 0, 546 0, 28 0, 186 0
1. Compléter les coefficients manquants de cette matrice.
8.6. EXERCICES 57

2. Préciser quels sont les deux sites les plus proches ainsi que les deux sites les plus
éloignés.
3. La classification conduit au dendrogramme représenté ci-dessous. Décrire la compo-
sition des classes de la partition qui vous semble la plus appropriée.

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
8 9 7 1 6 2 5 3 4

4. Un autre choix de distance entre les sites aurait-il pu conduire à une partition
différente ? Pourquoi n’a-t-on pas choisi la distance euclidienne ?
Exercice 3 : 1. En choisissant un nuage de trois points alignés sur l’axe des x regroupés
en deux classes, calculer l’inertie totale, l’inertie intraclasse et l’inertie interclasse.
Vérifier le théorème de Huygens dans cet exemple.
2. En considérant cette fois trois points du plan non nécessairement alignés, montrer
le théorème de Huygens (on pourra utiliser le fait que leurs projections sur les deux
axes de coordonnées vérifient le théorème).
Exercice 4 : Soit Γ := {Mi = (xi , yi ), i = 1, . . . , n} un nuage de points du plan, chacun étant
pondéré d’un poids n1 .
1. Quelle formule donne les coordonnées (x, y) du centre de gravité G du nuage en
fonction de xi , yi et n ?
2. En utilisant votre calculette, vérifier sur quelques exemples de nuages la “transitivité”
du centre de gravité, c’est-à-dire le fait que pour calculer les coordonnées de G on
peut, lorsque le nuage est la réunion de deux classes Γ1 et Γ2 , calculer d’abord les
centres de gravité G1 et G2 des deux classes puis calculer le centre de gravité de G1
et G2 affectés de leurs poids respectifs.
Exercice 5 : On considère les 6 points M1 = (−2, 3), M2 = (−2, 1), M3 = (−2, −1), M4 =
(2, −1), M5 = (2, 1) et M6 = (1, 0).
1. En supposant que les deux premiers points M1 et M2 sont les centres initiaux, décrire
par une succession de dessins, l’algorithme des centres mobiles en représentant les
centres, les classes, les nouveaux centres ... jusqu’à stabilisation de l’algorithme. On
calculera au passage si nécessaire les coordonnées des centres.
2. Recommencer en choisissant différemment les centres initiaux. Obtient-on la même
classification ?
Exercice 6 : Classifier les points du nuage précédent par une classification hiérarchique as-
cendante et représenter le dendrogramme (à noter que lorsqu’on doit regrouper les deux
points les plus proches et qu’il existe deux couples de points satisfaisant cette condition,
on convient de choisir les deux points dont les numéros sont les plus petits).
Université de Nice LSV1-MAB

NOM : Prénom : Groupe :

Epreuve partielle : 10 Novembre 2006 (durée 1h30)


LSV1 : Mathématiques Appliquées à la Biologie

Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 4 points,
6 points et 6 points (barème indicatif). On soignera les explications.
Exercice 1 : On considère une population Xt modélisée par une chaı̂ne de Markov à trois états S =
{x1 , x2 , x3 } et dont la matrice de transition est :
 
0, 65 0, 3 0, 05
P= 0 0, 2 0, 8 
0 0 1
1. Quelle est, selon ce modèle, la probabilité que la population passe de l’état x2 à l’état x3 ?

P (Xt+1 = x3 /Xt = x2 ) =

2. Calculer la probabilité d’une trajectoire du type X0 = x1 , X1 = x2 , X2 = x2 , X3 = x3 en


fonction de π0 (x1 ).

3. Donner un exemple de trajectoire de probabilité nulle.

4. On a calculé le carré de la matrice P et trouvé


 
0, 4225 ......... 0, 3225
P2 =  ...... 0, 04 ...... 
0 0 1
Compléter les coefficients manquants, en expliquant comment les calculer.

1
5. Quelle est, selon ce modèle, la probabilité que la population passe de x1 à x3 en deux étapes ?

P (Xt+2 = x3 /Xt = x1 ) =

6. Pour π0 = (0, 5 0, 5 0), calculer le produit π1 = π0 · P.

Exercice 2 : L’observation du développement d’une population d’animaux au cours du temps fait ap-
paraı̂tre les trois états jeunes, adultes et décès, que nous noterons respectivement j, a et d. Parmi
les jeunes, chaque année 30% deviennent adultes et 5% décèdent et parmi les adultes seuls 20%
restent en vie après un an. Bien entendu l’état de mort subsiste avec probabilité 1 d’une année à la
suivante.
1. On modélise cette dynamique par une chaine de Markov à trois états S = {j, a, d}. Ecrire sa
matrice de transition.

2. Si l’on suppose qu’au départ la population est de taille 1000 et se compose approximativement
de 500 jeunes et de 500 adultes, combien y aura-t-il de jeunes et d’adultes respectivement après
un an, selon ce modèle ?

3. Pour les uns et pour les autres, leur nombre a diminué. Pouvez-vous l’expliquer ? Quel défaut
du modèle cela fait-il apparaı̂tre ?

2
Exercice 3 : La figure ci-dessous montre une représentation en toile d’araignée (cobweb) de la trajectoire
de la dynamique ∆Yt = 0, 8Yt (1 − Yt /15) de condition initiale Y0 = 5.

18

16

14

12
Yt+1

10

0
0 2 4 6 8 10 12 14 16 18

Yt

1. Comment appelle-t-on ce type de dynamique ? A quoi correspond la constante 0.8 ?

2. Calculer la valeur de Y1 (indiquer vos calculs)

3. Sans calcul supplémentaire, donner une valeur approchée de Y3 lue sur sa représentation.
Expliquer où l’on peut lire cette valeur.

4. Pouvez-vous deviner une valeur approchée de Y10 ? Justifier votre réponse.

3
Exercice 4 : On s’intéresse à la solution y(t) de l’équation différentielle y 0 = 50 − y de condition initiale
y(0) = 100.
1. Indiquer les coordonnées d’un vecteur tangent à cette solution en t = 0.

2. On a calculé la valeur approchée de cette solution par la méthode d’Euler en prenant le pas
h = 0, 5 et on a obtenu les valeurs suivantes :
t 0 0, 5 1 1, 5 2 2, 5
Solution approchée 100 ..... 62, 5 ...... 53, 125 51, 5625
Calculer les deux valeurs manquantes (en expliquant vos calculs).

3. Comme cette équation est linéaire à coefficients constants, on peut la résoudre par explicite-
ment. On obtient y(t) = Ce−t + A. Calculer les constantes C et A.

4. Compléter le tableau suivant (en explicitant vos calculs) :


t 0 0, 5 1 1, 5 2 2, 5
Solution exacte 100 80, 326 68, 303 61, 156 56, 767 .....

5. Avant même de calculer la valeur manquante dans le tableau précédent, on savait qu’elle était
supérieure à 50. Pourquoi ?

4
Université de Nice Identifiant :....... LSV1-MAB

Epreuve d’examen : 9 Janvier 2007 (durée 2h00)


LSV1 : Mathématiques Appliquées à la Biologie

Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points,
4 points et 5 points (barème indicatif). On soignera les explications. Les réponses doivent être données
sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur la
copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous ferez
figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.

Exercice 1 : Une espèce d’oiseaux a une durée de vie de 3 ans. En moyenne, chaque paire d’oiseaux
produit 2 oisillons au cours de leur première année et un échantillon typique de 8 oiseaux d’un an
produit en moyenne 15 oisillons. Au dela de leur deuxième année, les oiseaux ne se reproduisent
plus. Seul 40% des oiseaux d’un an survivent une deuxième année et seuls 30% des oiseaux de deux
ans survivent une troisième année. On suppose enfin que les oiseaux de sexes male et femelle se
répartissent équitablement au sein des couvées et que le taux de survie ne dépend pas du sexe.
1. Ecrire le système dynamique linéaire modélisant l’évolution de cette population structurée en
trois classes d’une année (notées jt , pt et at ) :

 jt+1 = .........
pt+1 = ......... (1)

at+1 = .........

2. Indiquer quelle est la matrice (de Leslie) L de ce système.

3. Si l’on suppose que la population initiale comporte respectivement 200, 64 et 10 oiseaux d’un,
deux et trois ans, combien y en aura-t-il de chaque classe l’année suivante selon ce modèle ?
Combien l’année d’après ?

4. Le calcul des valeurs propres de la matrice L indique qu’elle possède λ = 3/2 pour valeur propre
dominante. Que pouvez-vous en déduire concernant l’évolution de la population d’oiseaux dans
son ensemble ?

5. Pour une population initiale totale de N (0) = 274, on a obtenu les valeurs suivantes N (1) =
419, 2, N (2) = 622, ... , N (9) = 10656, 513, N (10) = 15984, 742 et N (11) = 23977, 127. Ces
valeurs confirment-elles l’évolution attendue ?

1
Exercice 2 : On modélise la dynamique de deux populations de type proies-prédateurs, disons des lapins
L(t) et des renards R(t), par le système de Lotka-Voterra suivant :

 dL(t) = aL(t) − bR(t)L(t)

dt (2)
 dR(t) = −cR(t) + eR(t)L(t)

dt
1. Décrire la dynamique de la population de lapins en l’absence de renards (i.e. si R(t) = 0).

2. Décrire la dynamique de la population de renards en l’absence de lapins (i.e. si L(t) = 0).

3. On suppose que a = 0, 04, b = 0, 0005, c = 0, 2 et e = b ∗ 0, 1. Donner les équations des deux


isoclines horizontales et verticales.

4. Donner les coordonnées du point d’équilibre (non nul).

5. Si le nombre de lapins à l’instant initial est L(0) = 1000 et le nombre de renards R(0) = 50,
ces effectifs vont-ils respectivement augmenter ou diminuer immédiatement après cet instant ?
On pourra s’aider pour répondre d’une esquisse du champs de vecteurs associé.

Exercice 3 : Une biologiste a remarqué que sous une lumière douce, la quantité d’auxine (hormone
végétale qui favorise la croissance en longueur des plantes) produite par les plantes augmentait
avec l’intensité lumineuse à laquelle elles étaient exposées. Pour le confirmer, elle fait l’expérience
suivante : elle sélectionne des plants identiques qu’elle place dans une pièce sombre plusieurs jours.
Puis elle divise ces plants en 8 groupes de 10 plants, chaque groupe étant placé sous une source
lumineuse d’intensité différente. Après deux semaines elle mesure la quantité d’auxine dans chaque
plant et détermine la moyenne par groupe. Voici ses résultats

2
Intensité lumineuse 5 10 20 40 80 160 400 600
Moyenne d’auxine 2.2 3.1 4.5 6.4 9.2 12 20.5 23.9
1. Le tracé suivant représente le nuage de point correspondant à ces données ainsi que la droite des
moindres carrés correspondante. Pensez-vous que la quantité d’auxine produite par les plantes
augmente linéairement avec l’intensité lumineuse à laquelle elles sont exposées ? Pourquoi ?

2. On a représenté cette fois les données (ln xi , ln yi ) obtenues à partir des précédentes en prenant
le logarithme de l’intensité lumineuse et de la moyenne d’auxine. Ce nuage se prête-il mieux à
une modélisation linéaire ?

3. Quelle relation ces données suggèrent-elles entre ces deux variables initiales ? Quel accroisse-
ment d’intensité lumineuse est requis, selon ces mesures, pour doubler la quantité d’auxine ?

Exercice 4 : La succession des quatres dessins suivants correspond aux étapes successives d’une classi-
fication hierarchique ascendantes des cinq points M1 (2, 0), M2 (0, 1), M3 (0, 2), M4 (3, 4) et M5 (5, 4)
progressivement regroupées en classes de deux ou trois points dont les centres de gravité sont notés
G6 , G7 et G8 . On suppose que les cinq points initiaux sont tous affectés du poids 1. La distance
choisie pour cette classification, qui apparait dans les quatres matrices de distance, est l’écart de
Ward.
1. Compléter le troisième dessin en y plaçant les trois points devant y figurer et indiquer sur les
quatres dessins le nom des points.
2. Compléter les six distances manquantes dans les matrices de distances.

3
3. Préciser les coordonnées des points G6 , G7 et G8

4. Calculer les coordonnées du centre de gravité G9 des cinq points.

5. Tracer un dendrogramme résumant cette classification.

4
Université de Nice Identifiant :....... LSV1-MAB

Epreuve d’examen, deuxième session (durée 2h00)


LSV1 : Mathématiques Appliquées à la Biologie

Les cinq exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points, 5
points, 2 points et 2 points(barème indicatif). On soignera les explications. Les réponses doivent être
données sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur
la copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous
ferez figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.

Exercice 1 : On étudie l’évolution au cours du temps des formations végétales sur un vaste territoire
en les décomposant pour simplifier en trois catégories, lande, maquis et forêt. On modélise cette
dynamique par une chaine de Markov Xt d’espace d’états S = {l, m, f } et de matrice de transition :
 
0, 4 0, 6 0
P= 0 0, 2 0, 8 
0, 35 0 0, 65
1. Tracer le diagramme en points et flèches associé.

2. Quelle est, selon ce modèle, la probabilité que la population passe de l’état maquis à l’état
forêt ?

P (Xt+1 = f /Xt = m) =

3. Calculer la probabilité d’une trajectoire du type X0 = f, X1 = f, X2 = l, X3 = m en fonction


de π0 (f ).

4. Donner un exemple de trajectoire de probabilité nulle.

5. Quelle est, selon ce modèle, la probabilité que la population passe de l à m en deux étapes ?

P (Xt+2 = m/Xt = l) =

1
6. Connaissant la répartition initiale π0 = (0, 3 0, 4 0, 3), calculer la répartition à l’étape suivante
π1 . Des trois formations végétales, lesquelles progressent, lesquelles regressent ?

Exercice 2 : On étudie l’effectif Pt d’une population d’insectes en fonction du temps t mesuré en jours.
1. On suppose tout d’abord que les variations de cette population sont proportionnelles à son
effectif. Comment appelle-t-on cette dynamique ?

2. S’il y a 15 insectes le deuxième jour et 60 le quatrième, quel était l’effectif à l’instant initial ?

3. On suppose à présent que cette population suit un modèle logistique ∆Pt = rPt − sPt2 avec
P0 = 10, r = 0, 5 et s = 10−2 . Calculer les premiers points de sa trajectoire et décrire sa
dynamique dans ce cas.

4. Tracer une représentation en cobweb de la trajectoire correspondant à P0 = 10.

2
5. Comment varierait, selon ce modèle, la population d’oiseaux dans le cas P0 = 50 ? Même
question pour le cas P0 = 100.

Exercice 3 : On considère une population d’oiseaux dont le cycle de reproduction comporte 3 étapes,
oeufs, oisillons (juveniles) et oiseau (adultes). Si l’on désigne respectivement par ot , jt et at les
effectifs à l’instant t de ces trois classes,

 ot+1 = 6jt + 10at
jt+1 = 0, 5ot (1)

at+1 = 0, 4jt
1. Ecrire ce système sous forme matricielle et indiquer le sens des 4 coefficients 6, 10, 0, 5 et 0, 4.

2. Les formules (1) permettent, à partir des effectifs initiaux des trois classes, (o0 , j0 , a0 ), de
calculer les effectifs (o1 , j1 , a1 ) à l’instant suivant t = 1, puis, (o2 , j2 , a2 ) à l’instant t = 2 et
ainsi de suite. Si (o0 , j0 , a0 ) = (30, 50, 50), on obtient :
t 0 1 2 3 4 5 6
ot 30 ... 290 2460 2470 7960 12330
jt 50 15 400 ... 1230 1235 3980
at 50 20 ... 160 58 492 494
Compléter les valeurs manquantes du tableau puis expliquer vos calculs.

3. Si l’on désigne par Nt = ot + jt + at l’effectif total de la population à l’instant t (et donc N0


l’effectif initial), on peut également calculer à partir de (??) les termes successifs de la suite
(Nt ), ce qui permet d’apréhender aussi la dynamique de cette population dans son ensemble.
On a ici :
t 0 1 2 3 4 5 6
Nt 130 ... 696 2765 3758 .... 16804
Calculer les coefficients manquant de ce tableau puis expliquer expliquer vos calculs.

3
4. Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
ot+1 jt+1 at+1
ot , jt et at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur
ces premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la
dynamique de ces différentes classes d’age. Et si l’on considère la population dans son ensemble,
les quotients NNt+1
t
ne sont pas plus réguliers.

t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2
On constate que ces taux tendent tous vers la même valeur λ, ici λ = 2. On appelle ce coefficient
λ le taux de croissance asymptotique. Expliquer pourquoi.

5. Expliquer comment l’on peut calculer cette valeur λ.

Exercice 4 : Lorsque l’on calcule la droite de régression par la méthode des moindres carrés ordinaire,
on calcule aussi le coefficients de corrélation linéaire. De quoi s’agit-il et pourquoi le calcule-t-on ?

Exercice 5 : Qu’est-ce qu’une classification hierachique ascendante ? A quoi cela sert-il et comment
peut-on l’obtenir ?

S-ar putea să vă placă și