Mathematiques Appliquées Biologie LSV1 2006-2007 S1

MAB 2004-2005
Mathématiques Appliquées à la Biologie

LSV1, 2006-2007, 1er semestre
Notes de cours et énoncés d'exercices 1 : Dynamiques aléatoires :

chaines de Markov
Notes de cours et énoncés d'exercices 2 : Chaines de Markov :
compléments
Notes de cours et énoncés d'exercices 3 : Dynamiques déterministes :
les modèles malthusien et logistique
Notes de cours et énoncés d'exercices 4 : Modèles dynamiques :
discrets/continus
Notes de cours et énoncés d'exercices 5: Dynamique d'une population
structurées en ages
Notes de cours et énoncés d'exercices 6 : Le modèle proie-prédateurs
de Lotka-Volterra
Notes de cours et énoncés d'exercices 7 : Méthode des moindres carrés
Notes de cours et énoncés d'exercices 8 : Classification automatique
Partiel (novembre 2006)

Examen : première session (Janvier 2007)
Examen : deuxième session (Juin 2007)
MAB 2004-2005.htm[22/09/2018 01:57:20]

Chapitre 1
Dynamiques aléatoires : chaines de

Markov
Pour modéliser l’évolution au cours du temps (la dynamique) de systèmes biologiques, par
exemple celle d’un organisme, d’une substance, d’un ecosystème, on choisit souvent des modèles
aléatoires. Les plus simples de ces modèles aléatoires sont les chaı̂nes de Markov qui, dans
le cas particulier étudié ici sont faciles à utiliser car il n’y a pratiquement aucun prérequis
mathématique. Elles nous donneront l’occasion d’une première familiarisation avec le calcul
matriciel que nous approfondirons lors des leçons suivantes.
1.1 La plus simple des dynamiques aléatoires

On modélise avec des chaı̂nes de Markov l’évolution au cours du temps de quantités X qui
peuvent prendre un nombre fini d’états X = x1 , X = x2 , . . ., X = xn et qui passent de l’état
xi à l’instant t à l’état xj à l’instant suivant t + 1 avec une probabilité pij donnée. Les nombres
P
pij = P (Xt+1 = xj /Xt = xi ) vérifient donc 0 ≤ pij ≤ 1 et nj=0 pij = 1 (puisque si la chaı̂ne
est dans l’état xi à un instant, elle sera nécessairement dans l’un des états possibles x1 , . . . , xn
l’instant suivant et donc pi1 + pi2 + . . . + pin = 1). ; L’expression P (Xt+1 = xj /Xt = xi ) s’appelle
une probabilité conditionnelle et représente la “probabilité que la quantité X vaille xj à l’instant
t + 1 sachant qu’elle valait xi à l’instant t”.
Pour définir une chaı̂ne de Markov il faut donc deux ingrédients de base :
1. L’espace des états S := {x1 , . . . , xn } connu que l’on supposera fini
2. La matrice de transition (ou de passage)
x 1 x2 . . . x n
 
p11 p12 · · · p1n x1
P = (pij )1≤i≤n,1≤j≤n =  .. ..  ..
 . .  .
pn1 pn2 · · · pnn xn
Fig. 1.1 – Diagramme en points et flèches correspondant à l’exemple de la dynamique de la

forêt naturelle à trois états, herbe, arbustes et forêt, étudiée ci dessous.
7
8 CHAPITRE 1. DYNAMIQUES ALÉATOIRES : CHAINES DE MARKOV
A noter que cette matrice est appelée matrice stochastique parce que ses coefficients sont
tous compris entre 0 et 1 et la somme des coefficients de chaque ligne vaut 1 (ce qui n’est pas
vrai en général pour les colonnes).
On peut aussi représenter une chaı̂ne de Markov (S, P) par un diagramme en points et flèches
comme indiqué par la figure (1.1) correspondant à l’exemple ci-dessous. Dans ces diagrammes,
chaque état est représenté par un point et chaque coefficient pij non nul de la matrice de
transition par une flèche allant de l’état i à l’état j.
Si l’on connait la distribution initiale des différents états (c’est-à-dire la proportion d’indi-
vidus de la population étudiée se trouvant dans chacun des états xi , que l’on appelle la loi de
probabilité initiale π0 ), l’étude de la chaı̂ne de Markov va permettre de calculer, à partir de cette
répartition
S x1 x2 .... xn
π0 π0 (x1 ) π0 (x2 ) .... π0 (xn )
π0 (xi ) à l’instant t = 0, c’est-à-dire à partir des nombres π0 (xi ) := P (X0 = xi ), quels états la
population va atteindre à l’instant t = 1 et avec quelles probabilités π1 , puis à l’instant t = 2
et ainsi de suite. En d’autres termes, on va ainsi calculer la loi πt pour tous les t > 0 et ainsi
modéliser la dynamique de cette population.
1.2 Un exemple en écologie

On s’interesse au développement d’une forêt naturelle en région tempérée sur une parcelle
en friche (par exemple par abandon d’une zône cultivée ou suite à un incendie). Notre modèle
simplifié comporte 3 états. L’état 1 est celui d’une végétation constituée d’herbes ou d’autres
espèces pionnières ; l’état 2 correspond à la présence d’arbustes dont le développement rapide
nécessite un ensoleillement maximal et l’état 3 celui d’arbres plus gros qui peuvent se développer
dans un environnement semi ensoleillé. Si l’on note h, a, f ces trois états (pour herbe, arbustes,
forêt), on a donc ici S = {h, a, f }. Sur la parcelle on repère au sol un grand nombre de points
(un millier) répartis sur un maillage régulier et on enregistre à intervalle de temps fixé (tous les
3 ans) l’état de la végétation en chacun de ces points.
L’observation de l’ensemble de ces points à l’instant initial t0 permet de déterminer les
proportions initiales de chacun des 3 états π0 = (π0 (h), π0 (a), π0 (f )). Pour cela, on relève pour
chacun d’eux l’état dans lequel il se trouve et on calcule la proportion de points dans chacun des
états possible. On peut voir ces proportions comme les probabilités pour un point quelconque
de la parcelle d’être dans l’un de ces états à l’instant initial.
Dans ce modèle, on suppose connues les 9 probabilités
pij = P (X1 = j/X0 = i)
pour chaque valeur i ∈ {h, a, f } et j ∈ {h, a, f }, probabilités pour un point quelconque de passer
de l’état i à l’état j. On a (par exemple) :
 h a f 
0, 5 0, 45 0, 05 h
P=  
 0, 1 0, 5 0, 4  a
0 0, 1 0, 9 f
d’où le diagramme en points et flèches de la figure (1.1).
On peut ainsi calculer la probabilité de n’importe quelle succession d’états, appelée trajectoire
de la chaı̂ne de Markov. Par exemple la probabilité qu’en un point de la parcelle on observe la
succession d’états (h, h, a, f, f ) est égale à
P (X0 = h, X1 = h, X2 = a, X3 = f, X4 = f )
= π0 (h)P (X1 = h/X0 = h)P (X2 = a/X1 = h)P (X3 = f /X2 = a)P (X4 = f /X3 = f )
= π0 (h)phh pha paf pf f = π0 (h)(0, 5)(0, 45)(0, 4)(0, 9) = 0, 081π0 (h).
1.3. PUISSANCES DE P ET LOI STATIONNAIRE 9
Mais on ne cherche pas seulement à calculer la probabilité particulière de chaque trajectoire

de notre chaı̂ne de Markov, on voudrait plus généralement déterminer l’évolution des proportions
des trois états entre le premier et le deuxième instant, entre le deuxième et le troisième, et plus
généralement savoir comment vont évoluer ces proportions à l’avenir. Voici comment on procède.
Pour calculer les probabilités π1 des trois états à l’instant t = 1, c’est-à-dire pour calculer
π1 := (P (X1 = h), P (X1 = a), P (X1 = f )) = (π1 (h), π1 (a), π1 (f )),
on remarque que π1 (h) est égal à
P (X1 = h/X0 = h)P (X0 = h) + P (X1 = h/X0 = a)P (X0 = a) + P (X1 = h/X0 = f )P (X0 = f )
ce qui peut s’écrire ici π1 (h) = 0, 5 · π0 (h) + 0, 1 · π0 (a) + 0 · π0 (f ) compte tenu des valeurs des
probabilités de transition données par la matrice P. On remarque que π1 (h) est le produit scalaire
du vecteur π0 avec la première colonne de la matrice P. De même, on vérifie que π1 (a) est le
produit scalaire du vecteur π0 avec la deuxième colonne de la matrice P et que π1 (f ) est le produit
scalaire du vecteur π0 avec la troixième colonne de la matrice P. On résume cela en disant que
le vecteur π1 est le produit du vecteur π0 par la matrice P, ce qui s’écrit simplement π1 = π0 · P
ou simplement π1 = π0 P, comme un produit de deux nombres (mais ici il s’agit d’un vecteur et
d’une matrice). Cette formule très courte signifie que le vecteur π1 = (π1 (h), π1 (a), π1 (f )) est le
produit de la matrice P par le vecteur π0 = (π0 (h), π0 (a), π0 (f )), ce qui s’écrit encore de façon
matricielle :
 
0, 5 0, 45 0, 05
 
(π1 (h), π1 (a), π1 (f )) = (π0 (h), π0 (a), π0 (f ))  0, 1 0, 5 0, 4 
0 0, 1 0, 9
1.3 Puissances de P et loi stationnaire

Pour une chaı̂ne de Markov d’espace d’états S et de matrice de transition P, l’évolution au
cours du temps de la loi de probabilité initiale π0 est donnée par π1 = π0 P, π2 = π1 P = (π0 P)P =
π0 P2 ,... et plus généralement πt = πt−1 P = . . . = π0 Pn . En particulier, la matrice de transition
pour passer de l’état t à l’état t + 2 est égale à P × P = P2 , et plus généralement, celle pour
passer de l’état t à l’état t + k est égale à Pk . C’est une caractéristique importante des chaı̂nes
de Markov que la matrice de transition P élevée à la puissance k contient les probabilités de
transitions de chacun des états vers les autres en exactement k intervalles de temps.
Une loi de probabilité π sur l’espace des états S est appelée stationnaire pour la chaı̂ne de
Markov (S, P) si la chaı̂ne laisse la loi inchangée, c’est-à-dire si l’on a π P = π. Trouver les lois
stationnaires d’une chaı̂ne de Markov, s’il en existe, permet souvent de décrire plus facilement
sa dynamique, comme nous le verrons à la leçon suivante.
1.4 Exercices
Exercice 1 : Dans l’exemple décrit ci-dessus,
1. Calculer la probabilité des trajectoires suivantes (h, a, f, h), (h, a, f, a), (a, a, a).
2. Calculer la distribution des états π1 à l’instant t = 1 si l’on suppose π0 = (1, 0, 0).
Interpréter.
3. Montrer qu’une distribution uniforme π0 = (1/3, 1/3, 1/3) n’est pas une distribution
stationnaire pour cette chaı̂ne de Markov. Interprétez ce résultat.
4. Y-a-t-il une distribution stationnaire pour cette chaı̂ne de Markov ?
Réponses 1. P (h a f h) = π0 (h) · 0, 45 · 0, 4 · 0 = 0, P (h a f a) = π0 (h) · 0, 45 · 0, 4 · 0, 1 =
0, 018 · π0 (h) et P (a a a) = π(a) · 0, 5 · 0, 5 = 0, 25 · π0 (a)
 
0, 5 0, 45 0, 05
 
2. π1 = π0 .P = (1, 0, 0).  0, 1 0, 5 0, 4  = (0, 5 0, 45 0, 05) Il y a donc, après
0 0, 1 0, 9
trois ans, la moitié de la parcelle recouverte de d’herbe, 45% d’arbustes et 5% de
foret, si l’on suppose qu’au debut il n’y avait que de l’herbe.
 
0, 5 0, 45 0, 05
1 1 1  
3. π0 .P = ( 3 3 3 ).  0, 1 0, 5 0, 4  = (0, 2 0, 35 0, 45) 6= π0 Donc la distribution
0 0, 1 0, 9
uniforme (même proportion de chacun des trois type) n’est pas stationnaire, ce qui
signifie que s’il y a au depart le même pourcentage de chacun des trois types, la
distribution, est modifiée après trois ans.
4. On doit résoudre l’équation π ∗ .P = π∗, c’est-à-dire, si on note π∗ = (p q r), on doit
trouver trois nombres compris entre 0 et 1 et de somme égale à 1, tels que :


 0, 5 p + 0, 1 q = p
0, 45 p + 0, 5 q + 0, 1 r = q (1.1)

 0, 05 p + 0, 4 q + 0, 9 r = r
2 10 41
On trouve la solution π∗ = ( 53 53 53 ).
Exercice 2 : Une souris se déplace dans un labyrinthe représenté ci-dessous qui comporte
5 compartiments numérotés de 1 à 5. On suppose qu’elle change de compartiment à
chaque instant t = 0, 1, 2, 3, . . . et que, lorsqu’elle se trouve dans un compartiment ayant
k portes (k = 1, 2 ou 3), elle choisit l’une des portes avec la probabilité k1 , ses choix étant
indépendants à chaque instant de ceux qu’elle a fait auparavant.
Le cheminement de la souris peut être décrit par une chaı̂ne de Markov (Xt )t=0,1,2,.. dont
les états sont les 5 compartiments et la matrice de transition P la matrice des probabilités
de passage d’un compartiment à un autre. Par exemple p12 = 12 car le compartiment 1
contient 2 portes dont l’une vers le compartiment 2.
1. Ecrire la matrice de transition.

2. Calculer les probabilités des cheminements suivants : (X0 = 1, X1 = 2, X2 = 1, X3 =
3, X4 = 5) et (X0 = 1, X1 = 2, X2 = 3, X3 = 4, X4 = 5)
3. Calculer la probabilité que la souris, partant à l’instant initial du compartiment 1,
atteigne le compartiment 5, en 2 étapes, en 3 étapes, en 4 étapes.
4. On ne considère plus désormais que la souris part nécessairement du compartiment
1. On étudie une autre distribution initiale sur l’ensemble des états de cette chaı̂ne
de Markov définie de la façon suivante : la probabilité de chaque compartiment est
proportionnelle au nombre de portes du compartiment. Préciser qu’elle est cette dis-
tribution initiale.
5. Cette loi de probabilité est-elle une loi stationnaire pour la chaı̂ne de Markov con-
sidérée ? Pourquoi ?
1.4. EXERCICES 11
Réponses 1. La matrice de transition est la suivante :

 
0 0, 5 0, 5 0 0
 0, 5 0 0 0, 5 0 
 
 1 1 1 
P= 3 0 0 3 3 
 
 0 0, 5 0, 5 0 0 
0 0 1 0 0
1 1 1 1 1
2. On trouve P (1 2 1 3 5) = π0 (1) 2 · 2 · 2 · 3 = 24 · π0 (1) et P (1 2 3 4 5) =
π0 (1) · 12 · 0 · 13 · 0 = 0
3. C’est un calcul de probabilité conditionnelle. On a P (X2 = 5/X0 = 1) = P (1 3 5) =
π0 (1) · 12 · 13 = 16 · π0 (1), P (X3 = 5/X0 = 1) = P (1 3 5) = 0 car il n’existe pas de
chemin allant de la case 1 à la case 5 en deux étapes et enfin P (X4 = 5/X0 = 1) =
P (1 2 4 3 5) + P (1 2 1 3 5) + P (1 3 4 3 5) + P (1 3 1 3 5) + P (1 3 5 3 5) =
1 1 1 1 1 7
24 · π0 (1) + 24 · π0 (1) + 36 · π0 (1) + 36 · π0 (1) + 18 · π0 (1) = 36 · π0 (1).
4. En considérant que la probabilité d’être dans une case est proportionnelle au nombre
de portes de cette case, la distribution initiale est π0 = ( 15 51 10 3 1
5
1
10 . En
effet π0 (1) est proportionnelle à 2, donc de la forme π0 (1) = 2λ, de même on aura
π0 (2) = 2λ, π0 (3) = 3λ, π0 (4) = 2λ et π0 (5) = λ. Comme on doit aussi avoir
1
π0 (1) + π0 (2) + π0 (3) + π0 (4) + π0 (5) = 1, il faut prendre λ = 10 .
5. C’est bien une distribution stationnaire car on peut s’assurer qu’elle verifie π0 · P = π0 .
Exercice 3 : Modélisation d’un brin d’ADN La modélisation la plus simple d’un brin d’ADN,
enchainement “désordonné” de nucleotides de l’un des 4 types adenine (a), cytosine (c),
guanine (g) et thymine (t), est de le considérer comme une trajectoire d’une chaı̂ne de
Markov Xn à quatre états S = {a, c, g, t} dont la matrice de transition P fournit les prob-
abilités que l’un de ces états succède à un autre. Ainsi le brin aagc est la trajectoire
X0 = a, X1 = a, X2 = g, X3 = c.
 
0 0, 3 0 0, 7
 0, 6 0 0, 4 0 
 
1. En supposant que la matrice P est donnée par P =   tracer
 0 0, 8 0 0, 2 
0, 3 0 0, 7 0
le graphe en points et flèches associé à cette chaı̂ne de Markov.
2. Calculer les probabilités des trajectoires suivantes en fonction de la probabilité initiale
de l’état c : cgcata et cgct.
3. La distribution initiale π0 = ( 18 ; 0 ; 78 ; 0) est-elle une distribution stationnaire pour
cette chaı̂ne de Markov ?
4. Reprendre les deux questions précédentes en prenant cette fois pour P la matrice
 
0, 3 0 0, 7 0
 0 0, 8 0 0, 2 
 
P= 
 0, 1 0 0, 9 0 
0 0, 4 0 0, 6
5. Supposons que vous puissiez observer un très long brin d’ADN. Indiquer quelle
méthode vous choisiriez pour estimer les probabilités de transitions figurant dans
la matrice P.
Exercice 4 : Une foret à deux espèces On suppose1 que l’on s’intéresse à une forêt com-
posée de deux espèces d’arbres, E1 et E2. Lorsqu’un arbre meurt, un nouveau grandit à
1
Exemple extrait du livre “Mathematical Models in Biology”, E.S. Allman et J.A. Rhodes, Cambridge Uni-
versity Press, 2004
sa place mais il peut être de l’une ou l’autre des deux espèces. Ceux de la première espèce
ayant une longue durée de vie, on suppose que 1% d’entre eux meurt chaque année alors
que ce taux est de 5% pour la deuxième espèce. Mais ces derniers grandissant plus rapi-
dement réussiront plus souvent à occuper une place laissée vacante : on suppose que 75%
des places vacantes sont prises par un arbre de la deuxième espèce contre seulement 25%
pour un arbre de la première espèce.
1. Expliquer comment l’on peut modéliser la dynamique ce cette foret par une chaı̂ne
de Markov (Xt )t≥0 à deux états E1 et E2 et justifier la formule suiante :
P (Xt+1 = E1 /Xt = E1 ) = 0, 99 + 0, 01 · 0, 25 = 0, 9925.
2. En déduire la matrice de transition P de la chaı̂ne de Markov .

3. Tracer un diagramme en points et flèches.
4. Si l’on commence avec une population de 10 arbres de l’espèce E1 et 990 de l’espèce
E2, combien aura-t-on d’arbres de l’espèce E1 après une étape, deux étapes ?
5. π0 = (0, 01 0, 99) est-elle une distribution stationnaire pour cette chaı̂ne de Markov ?
6. Reprendre les deux questions précédentes si l’on suppose qu’il y a au depart une
proportion de cinq arbres de la première espèce contre trois de la seconde.
Chapitre 2
Chaines de Markov : compléments
Dans cette leçon, nous examinons quelles sont les principales propriétés des chaı̂nes de
Markov et nous étudions quelques exemples suplémentaires.
2.1 Propriétés de Markov

Lorsqu’un système est modélisé par une équation différentielle son avenir est uniquement
déterminé par sa situation présente, d’où son nom de dynamique déterministe. Pour une chaı̂ne
de Markov au contraire, on fait l’hypothèse qu’il y a plusieures évolutions possibles à partir de
la situation présente, chacune d’elles ayant une certaine probabilité de se réaliser. C’est cette
incertitude sur l’avenir qui est prise en compte par les modèles markoviens que l’on appelle
pour cette raison dynamiques aléatoires ou stochastiques. Il existe bien d’autres dynamiques
aléatoires que les chaı̂nes de Markov mais celles-ci ont une propriété bien spéciale, que l’on
appelle absence de mémoire (ou simplement propriété de Markov) que nous allons indiquer à
présent. Losqu’un système a plusieurs avenirs possibles à partir de son état présent, il se pourrait
que la probabilité que l’un ou l’autre de ces avenirs se réalise dépende non seulement de son
état présent mais aussi de son histoire récente : dans ce cas, il faudrait par exemple prendre en
compte le fait que la probabilité pij = P (Xt+1 = xj /Xt = xi ) pourrait être différente selon que
Xt−1 = xk ou que Xt−1 = xl . Il n’y aurait plus moyen alors de définir de matrice de transition.
En réalité, lorsqu’on adopte une modélisation par une chaı̂ne de Markov, on suppose de fait que
la dynamique aléatoire considérée possède la propriété suivante, appelée propriété de Markov :
P (Xt+1 = xj /Xt = xi , Xt−1 = xk , Xt−2 = xl , . . .) = P (Xt+1 = xj /Xt = xi ).
2.2 Chaines de Markov irréductibles

Une chaı̂ne de Markov est dite irréductible lorsque tous ses états communiquent, c’est-à-dire
lorsque, pour toute paire d’états (xi , xj ) la probabilité d’aller de l’un à l’autre est strictement
positive. Cette propriété peut se lire généralement sur le diagramme en points et flèches. En effet,
on s’assure que la chaı̂ne est irréductible en vérifiant que chaque paire de points est reliée soit
par une flèche unique soit par une succession de flèches. Ainsi, l’exemple de la chaı̂ne {h, a, f }
de la leçon précédente est une chaı̂ne de Markov irréductible de même que celui des souris dans
le labyrinthe {1, 2, 3, 4, 5}. Mais, si l’on modifie cet exemple en considérant que lorsque la souris
a atteint le compartiment 5 (qui contient le fromage) elle y reste avec probabilité 1, alors cette
chaı̂ne n’est plus une chaı̂ne irréductible car il n’y a pas de flèche allant de l’état 5 vers l’un
quelconque des autres états. Un état de ce type, dans lequel on reste à coup sur lorsqu’on y
parvient s’appelle un état absorbant. Une chaı̂ne présentant un état absorbant ne peut pas être
irréductible.
13
14 CHAPITRE 2. CHAINES DE MARKOV : COMPLÉMENTS
2.3 Etats récurrents/transitoires

Un état xi ∈ S tel que, lorsque la chaı̂ne est issue de ce point, elle y retourne en un temps
fini avec une probabilité strictement positive, s’appelle un état récurrent (sinon l’état est dit
transitoire). Lorsqu’un état est récurrent, chaque trajectoire issue de ce point y revient presque
certainement une infinité de fois. Par contre, lorsqu’il est transitoire, chaque trajectoire issue de
ce point n’y revient presque surement qu’un nombre fini de fois.
Cette distinction entre états récurrents et transitoires est nettement plus délicate à déduire
du diagramme en points et flèches. Notons simplement que lorsque la chaı̂ne de Markov est
irréductible (et qu’elle a un nombre fini d’états), ses états sont tous récurrents. On parle alors
de chaı̂ne récurrente. Un cas particulier intéressant de chaı̂ne récurrente est celui d’une chaı̂ne
périodique. C’est le cas d’une chaı̂ne ayant une matrice de transition dont l’une des puissances
Pk , k = 2, 3, . . ., vérifie Pk = P. Par exemple on pourra vérifier que si
 
0 1 0
 
P= 0 0 1 
1 0 0
alors on a P4 = P ; cette chaı̂ne est dite périodique de période 3 car toute trajectoire revient à
son état initial après 3 étapes.
Une chaı̂ne dont tous les états sont récurrents admet pour loi stationnaire la loi définie
1
par π(xi ) := m(x i)
, où m(xi ) est l’espérance du temps de retour à l’état xi (si l’on est parti
de xi ). Par exemple, la chaı̂ne périodique précédente admet la distribution ( 13 , 13 , 13 ) comme
distribution stationnaire. Dans le cas non périodique, on peut montrer que, moyennant quelques
hypothèses suplémentaires, une chaı̂ne de Markov dont tous les états sont récurrents tend vers
sa loi stationnaire quelque soit sa loi initiale.
2.4 Exemple de dynamique évoluant vers une loi stationnaire

A titre d’exemple1 examinons la dynamique suivante qui modélise l’évolution des écosystèmes
mediterranéens. A l’origine la forêt méditerranéenne, sur roche calcaire à faible altitude, était très
certainement dominée par des chênes (chênes pubescents). Mais l’action de l’homme a éradiqué
ces forêts primitives pour leur substituer parcours pastoraux, vergers, ... Puis l’abandon de
toute activité agricole au lieu de conduire à restauration naturelle de ces chênaies a bien souvent
favorisé l’implantation d’une autre espèce, le pin d’Alep, après passage par un état de guarrigue.
Or ces forets de substitution, hautement inflammables, subissent de manière récurrente le passage
du feu (incendies volontaires ou non) et sont donc condamnées à une perpétuelle reconstitution.
Voici le diagramme en points et flèches correspondant et la matrice de passage de cette chaı̂ne
de Markov à 5 états S = {C, V, P e, Ga, P i}
 
0, 8 0, 2 0 0 0
 0 0, 7 0, 3 0 0 
 
 
P= 0 0 0, 4 0, 6 0 
 
 0 0 0 0, 2 0, 8 
0, 1 0 0, 25 0 0, 65
On se convainc facilement que cette dynamique n’a pas d’état absorbant, qu’elle n’est pas
périodique. A priori, les trajectoires semblent passer indéfiniment d’un état à un autre et il n’est
donc pas evident d’apréhender son évolution. Mais si l’on observe les puissances successives de
1
Exemple tiré du livre Modélisation et simulation d’écosystèmes, P. Coquillard et D. Hill, Masson 1997.
2.5. REMARQUES 15
la matrice de transition P, on peut voir qu’après un grand nombre d’itérations, Pn tend vers une
matrice limite dont toutes les lignes sont égales, ce qui signifie que la distribution (proportion
de chacun des états) évolue vers une distribution unique qui est une distribution stationnaire.
Ainsi on a  
0, 17520 0, 11680 0, 20437 0, 15327 0, 35034
 0, 17517 0, 11680 0, 20438 0, 15328 0, 35035 
 
 
P40 =  0, 17551 0, 11678 0, 20438 0, 15328 0, 35037 
 
 0, 17517 0, 11678 0, 20438 0, 15328 0, 35037 
0, 17518 0, 11678 0, 20437 0, 15328 0, 36036
2.5 Remarques
Pour finir notons que si les chaı̂nes de Markov fournissent des modèles très utiles, elles
présentent aussi des défauts. Parmi eux, l’hypothèse simplificatrice d’un nombre fini d’états
possibles ou celle de l’invariance dans le temps des probabilités de transitions sont relativement
faciles à contourner car il existe des chaı̂nes de Markov ayant un nombre infini d’états ou/et
qui ne sont pas homogènes, c’est-à-dire avec des matrices de transition modifiables au cours
du temps. Bien entendu l’étude de ces modèles généralisés nécessitent le recours à des outils
mathématiques plus élaborés.
Par contre, il en est différemment pour l’invariance spatiale. Pour le calcul des probabilités de
transition, on fait en effet implicitement une hypothèse d’homogénéité spatiale qui est rarement
satisfaite dans la pratique. Par exemple un site végétal n’a certainement pas la même probabilité
d’être occupé la période suivante par une espèce donnée selon que les sites voisins le sont déjà ou
qu’ils ne le sont pas. Et, malheureusement ceci ne peut pas être pris en compte par les modèles
markoviens simples que nous avons présentés ici. On retiendra donc qu’il convient d’utiliser avec
prudence une chaı̂ne de Markov lorsque ce caractère d’isotropicité du milieu n’est pas du tout
satisfait.
2.6 Exercices
Exercice 1 : L’observation du développement d’un organisme (animal ou plante) au cours du
temps fait apparaı̂tre l’ensemble des états suivants : juvenile, maturité sexuelle, sénescence
et décès, que nous noterons respectivement j, m, s et d, avec des probabilités de passage
d’un état vers un autre données par la matrice suivante :
 
0, 2 0, 2 0 0, 6
 0 0, 55 0, 15 0, 3 
 
P= 
 0 0 0, 1 0, 9 
0 0 0 1
1. Tracer le diagramme en points et flèche. La chaı̂ne est-elle irréductible ?

2. Calculer la probabilité de passer en deux étapes de l’état de maturité sexuelle à l’état
de sénescence. Calculer la matrice P2 et vérifier la probabilité calculée précédemment.
La chaı̂ne est-elle périodique ?
3. Pour chaque état, indiquer s’il est absorbant, transitoire, récurrent.
Réponses : 1. Un examen du schéma en points et flèches montre que la chaı̂ne n’est pas
irréductible : en effet, on ne peux pas passer de l’état de maturité sexuelle à l’état
juvenile. De plus l’état décès est absorbant.
2. Sur le schéma en points et flèches, on voit facilement que, partant de l’état m, on
atteint l’état s en deux étapes de deux façons exactement : soit on reste en m pendant
la première étape puis on va en s durant la seconde, soit on y va durant la première
et on reste en s durant la seconde. Il n’y a pas d’autres possibilités. Cela conduit au

calcul suivant :
P (X2 = s/X0 = m) = P (X2 = s/X1 = m) · P (X1 = m/X0 = m)

+ P (X2 = s/X1 = s) · P (X1 = s/X0 = m)
= 0, 15 · 0, 0, 55 + 0, 15 · 0, 1 = 0, 0975.
La probabilité cherchée se lit aussi sur la matrice P2 , c’est le coefficient de la deuxième

ligne et de la troisième colonne, ce qui confirme le résultat trouvé :
 
0, 04 0, 15 0, 03 0, 78
 0 0, 3025 0, 0975 0, 6 
 
P2 =  
 0 0 0, 01 0, 99 
0 0 0 1
La chaı̂ne n’est pas périodique comme on peut le voir facilement sur son diagramme
en points et flèches. Par exemple, on voit qu’une trajectoire qui passe de l’état j à
l’état m ne repassera plus jamais par l’état j et ne peut donc pas être périodique.
3. Les trois états j, m et s sont transitoires car la probabilité de ne pas revenir en j
sachant qu’on y était à l’état initial est supérieure à 0, 8 et de même cette probabilité
est supérieure à 0, 45 pour m et à 0, 9 pour s. L’état d est absorbant donc récurrent.
Exercice 2 : On considère une chaı̂ne de Markov à quatre états S = {1, 2, 3, 4} dont la matrice
de transition est  
0 12 12 0
 1 0 0 1 
 2 
P= 2 
 0 0 1 0 
0 0 0 1
1. Tracer le graphe en points et flèches associé à cette chaı̂ne de Markov.

2. Montrer que les états 3 et 4 sont absorbants. Les autres sont-ils transitoires ou
récurents ?
3. Calculer les probabilités des trajectoires suivantes en fonction des probabilités initiales
de chaque état (p0 , q0 , r0 , s0 ) :
(X0 = 1 , ∀n ≥ 1 Xn = 3), (X0 = 1 , X1 = 2 , ∀n ≥ 2 Xn = 4),
(Xn = 1 si n est pair et Xn = 2 si n est impair).
4. Montrer que la trajectoire (Xn = 1 si n est pair et Xn = 2 si n est impair) est de
probabilité nulle.
5. On suppose que la répartition entre les quatre états est uniforme à l’instant initial
t = 0. Calculer la répartition à l’instant t = 1 puis à l’instant t = 2. Même question
si l’on part d’une distribution initiale π0 = ( 12 , 12 , 0, 0).
6. Montrer que toute distribution initiale de la forme π0 = (0, 0, r0 , s0 ) avec r0 + s0 = 1
est une distribution stationnaire. En existe-t-il d’autres ?
Réponses : 1. Question laissée au lecteur

2. Les états 3 et 4 sont absorbants puisque p33 = p44 = 1 donc ils sont récurrents. Les
deux autres sont transitoires car la probabilité de ne pas revenir en 1 (resp. en 2) si
l’on est parti de là peut se calculer facilement (voir le schéma) et elle est strictement
positive (égale à 13 pour 1 par exemple).
3. Pour le calcul de ces probabilités, on étudie d’abord la trajectoire considérée sur le
schéma en points et flèches. Cette trajectoire est une trajectoire infinie mais on se
2.6. EXERCICES 17
convaint facilement que :
P ( X0 = 1, X1 = 3, X2 = 3, . . .)
= P (X0 = 1) · P (X1 = 3/X0 = 1) · P (X2 = 3/X1 = 3) · . . .
1 1
= p0 · · 1 · 1 · . . . = p0
2 2
De même,
P ( X0 = 1, X1 = 2, X2 = 4, X3 = 4, . . .)
= P (X0 = 1) · P (X1 = 2/X0 = 1) · P (X2 = 4/X1 = 2) · P (X3 = 4/X2 = 4) · . . .
1 1 1
= p0 · · · 1 · . . . = p0
2 2 4
La dernière trajectoire considérée fournit un exemple de trajectoire de longueur infinie
et de probabilité nulle (il n’existe evidemment pas trajectoire de longueur finie et de
probabilité nulle !). En effet la probabilité de la trajectoire considérée est le produit
de 12 par lui même un nombre infini de fois. A chaque nouveau produit la probabilité
est diminuée de moitié. Comme limn→∞ ( 12 )n = 0, elle est donc nulle.
4. La répartition initiale étant uniforme, π0 = (p0 , q0 , r0 , s0 ) = ( 14 , 14 , 14 , 14 ) et donc π1 =
π0 · P = ( 18 , 18 , 78 , 78 ) et de même π2 = π1 · P = ( 16
1 1 7 7
, 16 , 16 , 16 ). De la même façon,
lorsque π0 = ( 12 , 12 , 0, 0), on calcule π1 = π0 · P et on trouve π1 = ( 14 , 14 , 14 , 14 ) d’où l’on
peut déduire sans nouveau calcul que π2 = ( 18 , 18 , 78 , 78 ).
5. On vérifie que si π0 s’écrit π0 = (0, 0, r0 , s0 ), avec nécessairement r0 + s0 = 1, alors
le produit π0 · P est encore égal à π0 . Toutes les distributions de cette forme sont
donc stationnaires. Inversement, une distribution π = (p, q, r, s) est stationnaire si
elle vérifie π · P = π, c’est-à-dire si les 4 quantités p, q, r et s vérifie le système
d’équations suivant : 
 1

 2q = p
 1
2p = q (2.1)
 1

 21
p + r = r

2q + s = s
Ce système implique que p = 14 p, ce qui n’est possible que si p = 0, de même pour

q. Les deux autres inconnues, r et s, peuvent alors être choisies comme l’on veut, à
condition, biensur que r + s = 1. Donc toute distribution stationnaire est de la forme
π = (0, 0, r, s).
Exercice 3 : On veut étudier l’effet de la présence d’un couple de lions dans une portion de
savane dans laquelle cohabitent trois populations d’animaux dont les lions se nourrissent.
On modélise les proies, antilopes (a), gnous (g) et zèbres (z) comme les états d’une chaı̂ne
de Markov dont les trajectoires sont des successions de proies mangées par les lions, comme
par exemple (gzzaggaa). On fait l’hypothèse que la probabilité qu’un lion mange une proie
a (ou g ou z) après avoir mangé une proie g (ou a ou z) ne dépend que de a (ou g ou z)
et non de ce qu’il avait mangé avant a (et que cette probabilité est invariante au cours du
temps). D’où la modélisation par une chaı̂ne de Markov d’espace d’états S = {a, g, z} et
dont on propose la matrice de transition suivante :
 
0, 5 0, 1 0, 4
 
P =  0, 2 0, 3 0, 5 
0, 2 0, 2 0, 6
1. Quelle est, selon ce modèle, la probabilité que les lions mangent un zèbre après avoir
mangé une antilope ?
2. Des deux trajectoires suivantes, (zaag) et (zaga), quelle est la plus probable ? Justifier
votre réponse par un calcul.
3. Tracer le diagramme en points et flèches. La chaı̂ne est-elle irréductible ? Pourquoi ?
4. Compléter les deux valeurs manquantes dans la matrice suivante (en indiquant quels
calculs vous faites) :  
0, 35 .... 0, 49
 
P2 =  0, 26 0, 21 0, 53 
0, 26 0, 2 ...
5. Calculer la probabilité pour que la chaı̂ne passe de l’état a à l’état z en deux étapes
(les lions mangent une antilope le premier jour, une autre proie (quelconque) le second
et un zèbre le troisième jour).
6. Les états de cette chaı̂ne de Markov sont-ils récurrents ou transitoires ?
7. La mesure π0 suivante est-elle une mesure invariante pour cette chaı̂ne de Markov ?
Justifier votre réponse.
S a g z
6 4 11
π0 21 21 21
Exercice 4 : Le magicien d’Oz a comblé tous les désirs des habitants du pays d’Oz, sauf peut-
être en ce qui concerne le climat : au pays d’Oz en effet, s’il fait beau un jour, il est certain
qu’il pleuvra ou neigera le lendemain, avec une probabilité égale qu’il pleuve ou qu’il neige.
Et si le temps d’un jour est pluvieux ou neigeux, alors il reste inchangé dans 50% des cas
le lendemain et ne devient beau que dans 25% des cas. Les habitants se sont plaint auprès
du magicien, affirmant que, ce faisant, ils n’ont qu’un beau jour sur cinq, ce à quoi il a
répondu qu’il s’agit d’une impression mais qu’en réalité il y a bien plus d’un beau jour sur
cinq. Qu’en est-il ?
Pour le savoir, on se propose de modéliser l’évolution du climat au pays d’Oz par une
chaı̂ne de Markov à 3 états, {P, B, N } (pour Pluvieux, Beau, et Neigeux) dont la matrice
de transition est, selon la description précédente :
 
0, 5 0, 25 0, 25
 
P =  0, 5 0 0, 5 
0, 25 0, 25 0, 5
1. L’un coefficient de P est nul. Expliquer pourquoi.
2. Calculer la probabilité d’une trajectoire (succession de jours) du type BN P B en
fonction de π0 (B). Donner un exemple de trajectoire de probabilité nulle.
 
0, 438 0, 188 0, 375
 
3. On a calculé le carré de la matrice P et trouvé P2 =  0, 375 ....... 0, 375 
0, 375 0, 188 0, 438
Compléter le coefficient manquant, en expliquant comment le calculer.
4. Donner la probabilité que le surlendemain d’un jour neigeux soit neigeux.
5. Le calcul des puissances successives de la matrice P montre qu’à partir de la puissance
sixième elles restent pratiquement inchangées et égales à la matrice
 
0, 4 0, 2 0, 4
 
 0, 4 0, 2 0, 4 
0, 4 0, 2 0, 4
Cela suggère que la distribution π0 = (0, 4 ; 0, 2 ; 0, 4) est une distribution stationnaire
pour cette chaı̂ne de Markov. Vérifier qu’il s’agit bien d’une ditribution stationnaire.
6. En déduire la réponse à la question initiale : qui du magicien ou de la population du
pays d’Oz a la bonne estimation du nombre de jours de beau temps ? Expliquer.
Chapitre 3
Dynamiques déterministes : les

modèles malthusien et logistique
Dans cette leçon, on s’intéresse à modéliser l’évolution au cours du temps de la taille

d’une population (insectes, bactéries, algues, poissons, ...), afin de prévoir ou d’expliquer cette
évolution (extinction, explosion, stabilisation autour d’un effectif idéal ...). Au contraire des
chaı̂nes de Markov qui sont des modèles aléatoires, les deux modèles étudiés ici sont des modèles
déterministes en ce sens que leur évolution future est entièrement déterminée par leur état
présent (alors que pour une chaine de Markov, il y a plusieurs états possibles que l’on peut
atteindre à partir d’un état présent).
3.1 Modèle malthusien

Ce modèle, très rudimentaire, a été proposé par Thomas Malthus en 1798. Il suppose que la
population possède un taux de reproduction r constant, simple différence du taux de natalité et
du taux de mortalité car la population est supposée isolée c’est-à-dire qu’aucune migration n’est
envisagée. Si Yt désigne la taille de la population étudiée à l’instant t et Yt+1 sa taille après une
génération, on a donc pour l’accroissement ∆Yt = Yt+1 − Yt de la population entre les instants
t et t + 1 la formule
∆Yt = Yt+1 − Yt = rYt (3.1)
ce qui signifie que la population croı̂t entre les instants t et t + 1 d’une proportion r de Yt égale à
rYt . On peut réécrire cette formule en exprimant l’effectif à l’instant t + 1 en fonction de l’effectif
à l’instant t sous la forme d’une relation de récurrence Yt+1 = Yt + rYt ou bien encore :
Yt+1 = (1 + r)Yt . (3.2)
Sous cette forme, on voit que l’on peut calculer l’effectif Yt en fonction de Yt−1 et lui même
en fonction de Yt−2 et ainsi de suite et donc calculer l’effectif Yt à tout instant t en fonction de
l’effectif Y0 . Par exemple, Y2 = Y1 (1+r) = (Y0 (1+r))(1+r) = Y0 (1+r)2 , et plus généralement on
a pour tout t la formule Yt = Y0 (1+r)t . Si l’on connait la valeur de Y0 , que l’on appelle la condition
initiale, on peut donc calculer les valeurs suivantes Y1 , Y2 , ...et même directement la valeur de
Yt à tout instant t > 0. La figure (3.1) montre deux exemples de trajectoires d’une dynamique
malthusienne, pour deux conditions initiales différentes. De la formule Yt = Y0 (1 + r)t , on déduit
que la suite des valeurs de Yt est une suite géométrique de raison (1+r) qui est donc supérieure à
1 si r > 0. Puisque l’on a (1+r)t = et ln(1+r) , ce modèle correspond à une croissance exponentielle
de la population lorsque r > 0 d’où son nom de modèle exponentiel parfois utilisé à la place de
modèle malthusien. On a en effet Yt = Y0 et ln(1+r) = Y0 eRt , si l’on pose R = ln(1 + r). Notons
qu’il pourrait aussi modéliser une décroissance exponentielle si r était négatif. On retiendra donc
19
20CHAPITRE 3. DYNAMIQUES DÉTERMINISTES : LES MODÈLES MALTHUSIEN ET LOGISTIQUE
Yt
25
20
15
10
0 t
0 1 2 3 4 5 6 7 8 9
Fig. 3.1 – Deux trajectoires particulières d’une dynamique malthusienne correspondant aux
deux conditions initiales Y0 = 1 et Y0 = 2, pour un choix du paramètre r égal à r = 0, 3.
qu’un modèle malthusien prévoit une croissance (ou décroissance) exponentielle de la population
modélisée.
3.2 Modèle logistique

L’un des points les plus discutables du modèle malthusien est qu’il prévoit que la population
modélisée croı̂sse indéfiniment. Il est certainement plus raisonnable de prendre en compte, comme
le suggéra Verhulst en 1836, qu’au dela d’une certaine taille, des facteurs environnementaux
(limitation des ressources, limitation de l’espace disponible, ...) viennent freiner cette croissance.
Pour cela on suppose que le taux de reproduction de la population r, c’est-à-dire la quantité ∆Y Yt ,
t
n’est plus le même quelque soit la taille Yt de la population mais qu’au contraire il dépend de la
taille de la population. On supposera que ce taux de reproduction est grand lorsque la taille de la
population est petite car dans ce cas les ressources disponibles permettent cette forte croissance
mais qu’il est plus petit quand la taille devient plus grande et que les individus commencent
à entrer en compétition concernant la nourriture ou l’espace, voir même qu’il devienne négatif
pour de très grandes tailles, ce qui signifierait un declin de la population. La plus simple des
fonction de Yt ayant ces propriétés est une fonction linéaire affine (de la forme aYt + b) de pente
a négative et dont l’ordonnée à l’origine b est positive et correspond au taux de reproduction
d’une population suffisamment petite pour ne pas souffrir des limitations environnementales.
Pour cela, on remplace dans le modèle (3.1) le taux constant r par un taux dépendant de la
taille Yt que l’on écrit r( K−Y Yt
K ), ou encore r(1 − K ). Cela conduit au modèle logistique :
t
Yt
Yt+1 − Yt = r(1 − )Yt . (3.3)
K
On peut, comme dans le cas du modèle malthusien, réécrire cette formule comme une récurence
donnant la valeur de Yt+1 en fonction de la valeur de Yt :
Yt
Yt+1 = Yt + rYt (1 − ) (3.4)
K
ce qui permet de calculer facilement de proche en proche les valeurs successives de Yt dès qu’on
se donne Y0 . La figure (3.2) donne deux exemples de comportement de telles trajectoires. Ces
3.2. MODÈLE LOGISTIQUE 21
Yt
10
1 t
0 2 4 6 8 10 12
Fig. 3.2 – Deux trajectoires particulières de la dynamique logistique ∆Yt = 0.7Yt (1 − Yt /10)
pour les conditions initiales Y0 = 1 et Y0 = 3.
comportements, appelés croissance logistique ou croissance amortie présentent une phase de

croissance exponentielle suivie, après un changement de courbure éventuel, d’une phase de crois-
sance de plus en plus lente vers une limite (ici K = 10).
Notons cependant que malgré la simplicité de la formule (3.4), on ne peut pas calculer
explicitement pour ce modèle la valeur de Yt comme fonction de t et de Y0 . Pour pouvoir
calculer Yt , il faut donc calculer toutes les valeurs Y1 , Y2 , Y3 , . . . , Yt−1 , ce qui est facile pour les
petites valeurs de t mais peut devenir fastidieux si t est grand. Voici à titre d’exemple les valeurs
prises par la trajectoire issue de Y0 = 3 que l’on a représenté sur la figure (3.2) :
t 0 1 2 3 .... 11 12
Y 3 4, 47 6, 20 7, 85 .... 9, 999 9, 9997
Les deux paramètres r et K du modèle logistique ont des interprétations biologiques faciles
à comprendre. En effet, le facteur r(1 − YKt ) (qui a remplacé le taux de reproduction constant
r du modèle malthusien) vallant pratiquement r lorsque la taille de la population Yt est petite
et tendant par contre vers 0 lorsqu’elle se rapproche de K, la constante r, appelée taux de
croissance intrinsèque, est le taux de reproduction de la population lorsque sa taille est petite
et donc qu’il n’y a pas de limitation. La constante K, appelée capacité biotique, est une taille
limite de la population étudiée vers laquelle elle tend (si r > 0) lorsque t augmente indéfiniment.
C’est une sorte d’effectif d’équilibre dont la valeur dépend des ressources disponibles pour cette
population.
En réalité, l’étude numérique (calcul explicite de diverses trajectoires) et l’étude mathématique
de cette récurrence révèle que ce modèle est plus compliqué qu’il y paraı̂t et que certaines
solutions présentent des comportements bien différents d’une simple croissance logistique (y
compris certains comportements appelés chaotiques que nous n’étudierons pas ici). Par ex-
emple, si la taille de la population initiale est supérieure à sa capacité biotique K, on peut
observer une décroissance brutale en dessous de K suivie d’une croissance plus lente vers K
comme le montre les valeurs indiquées ci dessous correspondant toujours à l’équation logistique
∆Yt = 0.7Yt (1 − Yt /10)de la figure (3.2) mais cette fois pour une condition initiale Y0 = 17 (voir
aussi le premier dessin de la figure (3.3)) :
Yt+1
12
10
0
0 2 4 6 8 10 12
Yt
Fig. 3.3 – Représentation en toile d’araignée (cobweb) de la trajectoire de la dynamique logis-

tique ∆Yt = 0.7Yt (1 − Yt /10) de condition initiale Y0 = 3.
t 0 1 2 3 4 5
Y 17 8, 67 9, 4772 9, 8240 9, 945 9, 9833
3.3 Etude graphique (cobweb)

Pour étudier plus facilement les divers comportements de trajectoires de ce type de dy-
namique, on utilise souvent une représentation en toile d’araignée ou cobweb. Pour cela on
représente tout d’abord sur un même graphique la parabole d’équation Yt+1 = F (Yt ) où F (y) =
y + ry(1 − y/K) ainsi que la droite bissectrice d’équation Yt+1 = Yt . Puis on représente la dy-
namique étudiée par la succession de points (Y0 , Y0 ), (Y0 , Y1 ),(Y1 , Y1 ),(Y1 , Y2 ),(Y2 , Y2 ),... reliés
les uns aux autres par des segments alternativement verticaux et horizontaux. La figure (3.3)
donne par exemple la représentation de la trajectoire issue de Y0 = 3 étudiée ci dessus (figure
(3.2) et tableau associé).
Mais on obtient ainsi d’autres types de comportements dont la figure (3.4) donne quelques
exemples.
3.4 Equations aux différences (ou récurences)

Les deux modèles malthusiens et logistiques sont deux exemples particuliers d’équations aux
différences du premier ordre c’est-à-dire d’équations de la forme
Yt+1 = F (Yt ) (3.5)
où F est une fonction quelconque. Par exemple, F (y) = (1 + r)y dans le cas malthusien et
2
F (y) = (1 + r)y − ry
K dans le cas logistique. Une solution (Yt )t>0 d’une équation aux différences
(3.5) est simplement une suite vérifiant cette récurence et son premier terme Y0 s’appelle sa
3.4. EQUATIONS AUX DIFFÉRENCES (OU RÉCURENCES) 23
Yt+1 Yt+1 Yt+1

20 15 14
18
12
16
14 10
10
12
8
10
6
8
5
6 4
4
2
2
0
0 2 4 6 8 10 12 14 16 18 20
Yt 0
0 5 10 15
Yt 0
0 2 4 6 8 10 12 14
Yt
Fig. 3.4 – Diverses représentations en toile d’araignée (cobweb). On a pour ces trois figures
K = 10, mais on a r = 0.7 et Y0 = 19 pour la première, r = 1.9 et Y0 = 14 pour celle du milieu
et r = 2.3 et Y0 = 10.5 pour la dernière. Dans les deux premières figures, l’équilibre Y ∗ = 10 est
stable alors qu’il est instable dans la dernière.
condition initiale. Une fois choisie l’équation aux différences la mieux adaptée à la dynamique de
la population que l’on étudie, le problème suivant est de décrire le comportement des solutions
de l’équation et plus spécialement celui de la solution ayant pour condition initiale l’effectif
présent Y0 de la population. Même s’il est toujours possible de calculer de proche en proche les
valeurs successives d’une solution, il n’est pas nécessairement facile d’en prédire le comportement
à venir, au dela des termes calculés.
Le principal outils dont on dispose pour décrire les trajectoires d’une équation aux différences
est l’étude des équilibres et de leur stabilité. Un équilibre est une trajectoire qui ne bouge pas,
c’est-à-dire telle que Yt+1 = Yt pour tout t ≥ 0. Donc si Y0 = Y ∗ est un équilibre, on aura
Y0 = Y1 = Y2 = Y3 = . . .. le nombre Y ∗ est donc un point fixe de la fonction F , c’est-à-
dire une solution de l’équation F (y) = y. Géométriquement, c’est un point où le graphe de
F coupe la droite des points ayant une abscisse égale à leur ordonnée comme on peut le voir
sur les représentations de type cobweb. Lorsqu’on a repéré un équilibre d’une dynamique, la
question se pose de savoir si les solutions issues des points voisins vont tendre à se rapprocher
de l’équilibre, on dit alors que l’équilibre est stable, ou si au contraire elles vont s’en éloigner, on
dit alors qu’il est instable. Les équilibres stables sont essentiels en terme de modélisation car ils
correspondent à des comportements type du système dynamique auquel celui-ci aura tendance à
s’identifier, après une période transitoire éventuellement, et ce, quelque soit sa position initiale.
Au contraire les équilibres instables sont des états dont le système s’écarte sans jamais s’en
rapprocher et sont donc de bien moindre importance. Il est utile de savoir discerner un équilibre
stable d’un équilibre instable. Pour cela on peut se convaincre en observant la dynamique sur
les représentations en toile d’araignée (cobweb) qu’un point de la diagonale est un équilibre
stable lorsque le graphe de F coupe cette diagonale en étant croissant et en passant du dessus
au dessous (figure (3.3)) et inversement il sera instable lorsque le graphe de F la coupe en étant
croissant et en passant du dessus au dessous. On vérifie ce fait facilement sur un dessin. On a
des caractérisations analogues, quoiqu’un peu plus complexes lorsqu’au point d’intersection le
graphe de F est décroissant.
Comment peut-on distinguer ces différents comportements au moyen d’un simple calcul ?
Plaçons nous dans le cas où au point d’équilibre la fonction F est croissante, c’est-à-dire F 0 > 0.
Comme la diagonale est une droite de pente 1, si l’intersection avec le graphe de F se fait du
dessous vers le dessus, c’est que la tangente à F en ce point a une pente supérieure à 1 et donc
que F 0 > 1 et de même l’intersection se fera du dessus vers le dessous si cette pente est inérieure
à 1, et donc si F 0 < 1. Plus généralement, que F soit croissante ou non, on a le résultat suivant
qui permet de déterminer facilement la stabilité des équilibres d’une dynamique de la forme
Yt+1 = F (Yt ) étudiée ici :
Proposition 3.1 Si Y ∗ est un équilibre de l’équation aux différences (3.5), alors cet équilibre
est stable si |F 0 (Y ∗)| < 1 et instable si |F 0 (Y ∗)| > 1. Lorsque F 0 (Y ∗) = 1 ou F 0 (Y ∗) = −1, on
n’est pas en mesure d’en déduire s’il est stable, instable ou ni l’un ni l’autre.
Exemple :
1. L’équation malthusienne (3.2) possède un unique équilibre Y ∗ = 0 et il est instable lorsque
r > 0 car F 0 (0) = 1 + r. Cela signifie que quelque soit l’effectif initial de la population, il
va s’éloigner de 0 lorsque t augmente, donc croı̂tre indéfiniment.
2. L’équation logistique (3.4) possède deux équilibres, Y ∗ = 0 et Y ∗ = K (les deux solutions
de l’équation y + ry(1 − y/K) = y), le premier est instable (comme dans le cas malthusien)
car F 0 (0) = (1 + r) si r > 0. Le second est stable lorsque 0 < r < 1 car F 0 (K) = 1 − r et
instable lorsque r > 1.
3.5 Exercices
Exercice 1 : Des biologistes ont tenté d’acclimater le renne dans des ı̂les de la mer de Béring.
Dans l’une d’elles, 21 individus furent introduits en 1911. En 1938, avant l’effondrement de
la population, 2000 rennes furent dénombrés. A partir de ces données, en supposant que
la croissance de la population est de type malthusien, calculer le coefficient de croissance
r de cette population.
Réponses : Si la population a une dynamique malthusienne, sa taille Yt à l’instant t vérifie
une équation aux différences de la forme Yt+1 = (1 + r)Yt , et donc elle peut s’écrire
Yt = (1 + r)t Y0 , où Y0 est sa taille initiale. Ici on a Y0 = 21, t = 1938 − 1011 = 27 et
Yt = Y27 = 2000. On en déduit donc l’équation suivante pour r : 2000 = (1+r)27 (21). Pour
résoudre cette équation, on prend le logarithme des deux membres. On obtient ln(2000) =
(27) ln(1+r)+ln(21), d’où ln(1+r) = ln(2000)−ln(21)
27 , soit r = exp( ln(2000)−ln(21)
27 )−1 ' 0, 184.
Selon ce modèle, ces observations correspondent donc à une croissance de cette population
à un taux constant de 18, 4% l’an.
Exercice 2 : Des nutriments entrent dans une cellule en quantité constante R par unité de
temps et en sortent proportionnellement à la concentration. Si Nt désigne la concentration
à l’instant t, cette dynamique peut s’écrire Nt+1 − Nt = R − KNt .
1. Cette dynamique est donnée par une équation aux différences de la forme Nt+1 =
F (Nt ). Que vaut F ? Tracer le graphe de F en supposant par exemple que R = 5 et
K = 1.5.
2. Trouver graphiquement le point fixe de F puis calculer ses coordonnées.
3. En supposant à nouveau que R = 5 et K = 1.5, déterminer les 6 premières valeurs
de la trajectoire de cette dynamique issue de N0 = 2 et en faire une représentation
en cobweb. Même question pour la trajectoire issue de N0 = 6, de N0 = 8.
4. Selon ce modèle, la concentration va-t-elle tendre vers un équilibre ? Lequel ? Est-il
stable ?
Réponses : 1. La fonction F (y) = R−(K −1)y a pour graphe une droite de pente −(K −1)
et d’ordonnée à l’origine R.
2. Le point fixe de N ∗ de F , solution de l’équation F (N ∗) = N ∗, soit R − (K − 1)N ∗ =
R
N ∗, est donc égal à N ∗ = K . Dans le plan (Nt , Nt+1 ), cet équilibre a pour coordonnées
R R
( K , K ).
3.5. EXERCICES 25
3. Les 6 premières valeurs de la trajectoire issue de N0 = 2 sont 2 ; 4 ; 3 ; 3.5 ; 3.25 ; 3.375.

La trajectoire issue de N0 = 6 vérifie N1 = 2 et donc elle coı̈ncidera ensuite avec la
trajectoire précédente issue de N0 = 2. Les 6 premières valeurs de la trajectoire issue
de N0 = 8 sont 8 ; 1 ; 4.5 ; 2.75 ; 3.625 ; 3.1875.
R
4. Cette dynamique a un unique équilibre N ∗ = K = 5/(3/2) = 103 . Pour déterminer sa
0 1
stabilité, on calcule F (N ∗) = 1 − K = − 2 . Il est donc stable, selon la proposition
ci-dessus. De fait, on constate qu’effectivement les trajectoires dont on a calculé les
premiers termes tendent, en oscillant, vers cet équilibre. Cela signifie que selon ce
modèle, la concentration de nutriments dans la cellule tend vers la valeur 103 , quelque
soit sa valeur initiale.
Exercice 3 : On étudie l’effectif Pt d’une population d’oiseaux granivores en fonction du temps
t mesuré en jours.
1. Quelle est cette dynamique si l’on suppose les variations de cette population propor-
tionnelles à son effectif ?
2. S’il y a 160 oiseaux le deuxième jour et 640 le quatrième, quel était l’effectif initial ?
3. On suppose à présent que cette population suit un modèle logistique ∆Pt = rPt −sPt2
avec P0 = 40, r = 0, 6 et s = 10−3 . Calculer les premiers points de sa trajectoire et
décrire sa dynamique dans ce cas.
4. Tracer une représentation en cobweb de la trajectoire correspondant à P0 = 40.
5. Comment varierait, selon ce modèle, la population d’oiseaux dans le cas P0 = 700 ?
Même question pour le cas P0 = 1000.
Exercice 4 : En 1927, Pearl a étudié la dynamique d’une culture de cellules de levure et il a
obtenu les mesures suivantes (la taille de la levure est exprimée en biomasse (mg 100ml−1 ) :
Heures 0 1 2 3 4 5 6 7 8 9 10 12 14 18
Levure 4 7 12 19 28 48 70 103 140 176 205 238 256 265
Yt+1 −Yt
1. Calculer les taux de variation Yt et tracer les points de coordonnés (Yt , Yt+1Yt−Yt )
dans le plan.
2. Si la dynamique de cette culture Yt suivait exactement un modèle logistique (3.3) ou
(3.4), ces points seraient situés exactement sur une courbe. Laquelle ?
3. Pour ajuster un modèle logistique à ces données (on dit calibrer le modèle), il con-
viendrait de choisir les valeurs des paramètres r et K de façon aussi pertinente que
possible. Quelles valeurs pourriez-vous proposer dans ce cas ?
Chapitre 4
Modèles dynamiques
discrets/continus
Lorsqu’on observe l’évolution (déterministe) d’une quantité variant au cours du temps, on

dispose généralement de données discrètes, c’est-à-dire de valeurs relevées à intervalles de temps
réguliers (ou parfois irréguliers), mais rarement de données relevées en continu. C’est ce qui
conduit naturellement à choisir pour modèles des équations aux différences (ou des récurrences)
(Yt )t=0,1,2,... , comme nous l’avons fait au chapitre précédent. Mais ces suites discrètes sont parfois
plus facile à comprendre et à étudier si on les voit comme les valeurs échantillonnées d’une
fonction continue (et même dérivable) du temps t → y(t), qui existerait pour tout t ≥ 0 mais
dont on n’aurait considéré les valeurs qu’en certains instants t = 0, t = 1, t = 2, . . . seulement.
Les modèles continus sont souvent préférés aux modèles discrets par les mathématiciens car
l’arsenal des outils qu’ils ont développés pour les étudier les rendent généralement plus facile
à manipuler. Pour le biologiste, il y a des cas où les uns seront plus pertinents que les autres
mais le plus souvent il y a le choix. Par contre il est toujours utile de savoir comment l’on passe
de l’un à l’autre, en ”lissant” des données pour les modéliser plus simplement en continu d’une
part ou, à l’inverse, en discrétisant un modèle continu pour pouvoir l’étudier avec un ordinateur
d’autre part.
4.1 Exemple introductif

Cet exemple est inspiré du livre Mathématiques Terminale S, Breal, 2002. On a observé la
croissance d’une population de bactéries (Escherichia coli) durant deux heures dans un milieu
liquide minimum glucosé et obtenu le tableau de données suivant, où t est la durée exprimée en
heures et Yt la densité de cellules en fonction de la durée (mesurée par des moyens optiques) :
t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5
Afin de quantifier la croissance de cette population bactérienne pour prévoir son évolution au
cours du temps, on recherche un modèle dynamique qui donnerait la densité de la population en
fonction du temps. L’examen de la suite des points (t, Yt ) (voir la figure) montre une croissance
qui pourrait être exponentielle et donc la première idée est d’ajuster un modèle malthusien
discret Yt+1 = (1 + r)Yt . Mais l’irrégularité des pas de temps conduit à rechercher plutôt une
fonction y(t) définie pour tout t ≥ 0 et qui prendrait approximativement les valeurs observées
aux instants d’observation.
Pour trouver une telle fonction y(t), on procède de la façon suivante. A partir des observa-
tions, on étudie non pas la fonction y(t) elle-même mais sa dérivée y(t)0 = dy
dt . En se souvenant
27
28 CHAPITRE 4. MODÈLES DYNAMIQUES DISCRETS/CONTINUS
que cette dérivée, en un point t0 , est par définition égale à

y(t0 + ∆t) − y(t0 )
lim ,
∆t→0 (t0 + ∆t) − t0
la moins mauvaise approximation dont on dispose pour la valeur de cette dérivée en t0 est
∆Yt Y t − Yt 0
= 1 (4.1)
∆t t1 − t 0
où (t1 , Yt1 ) est le point suivant (t0 , Yt0 ) sur la figure ci dessus. On peut construire ainsi une
fonction linéaire par morceaux dont le graphe est simplement la succession des segments joignant
deux points (t, Yt ) consécutifs. L’équation du segment joignant les deux points (t0 , Yt0 ) et (t1 , Yt1 )
est, pour t0 ≤ t ≤ t1 ,
∆Yt
y(t) = (t − t0 ) + Yt0 ,
∆t
où la pente ∆Y ∆t est simplement le taux d’accroissement donné par (4.1). En observant les valeurs
t
de ces pentes successives (que l’on peut calculer facilement), on voit qu’elles sont presque égales
à Yt .
t 0 0, 3 0, 57 0, 9 1, 2 1, 47 1, 72 1, 95
Yt 10, 2 13, 2 16, 8 22, 5 29, 4 36, 5 46 55, 5
∆Yt /∆t 10, 0 13, 33 17, 27 23, 00 26, 3 38, 0 41, 30 .
dy
D’où l’idée de rechercher une fonction y(t) vérifiant l’équation différentielle dt = y. La
solution de cette équation différentielle sera la fonction cherchée.
4.2 Equations différentielles et champs de vecteurs

Rappelons qu’une équation différentielle (du premier ordre)
y 0 = f (y)
est une équation ayant pour solution une fonction dérivable y(t) qui vérifie pour tout t la relation
y 0 (t) = f (y(t)) où f est une fonction donnée (par exemple f (y) = y) et y est la fonction inconnue.
En général une équation différentielle a une infinité de solutions. Par exemple pour l’équation
y 0 = ay, toutes les fonctions de la forme y(t) = Ceat , où C est un réel quelconque, sont des
solutions. Comme la valeur y(0) en t = 0 est C, la constante C s’appelle la condition initiale de
la solution.
On dit qu’une équation différentielle est linéaire lorsque la fonction f est une fonction affine
f (y) = ay + b. Dans ce cas, on connait l’ensemble des solutions

b
y(t) = Ceat − , C ∈ R .
a
4.3. MODÈLES MALTHUSIENS ET LOGISTIQUES : LE CAS CONTINU 29
Champ de vecteurs de y’=y Champ de vecteurs de y’=18y^2
5 1
4
y
0.5
–1 0 1 2 3 4
2
x
1 –0.5
–1 0 1 2 3 4 5
–1
x
Fig. 4.1 – Les champs de vecteurs associées aux équations différentielles y 0 = y et y 0 = 18y 2 .
Mais lorsque l’équation n’est pas linéaire, il est très rare que l’on puisse la résoudre ex-
plicitement. Cependant, même si l’on ne peut pas calculer la famille des solutions de l’équation
différentielle, on peut avoir une idée de l’allure des graphes des solution en observant le champs
de vecteurs associé. En effet le graphe (t, y(t)) d’une solution de y 0 = f (y) est par définition tan-
gent au vecteur vitesse (1, y 0 (t)) et donc au vecteur (1, f (y)). La connaissance de f permet donc
de représenter ces vecteurs en un grand nombre de points, répartis dans le plan (t, y). La figure
(4.2) présente deux champs de vecteurs, celui qui est associé à l’équation y 0 = y et celui qui est
associé à l’équation y 0 = 18y 2 . La simple observation de ces champs de vecteurs permet souvent
de deviner les graphes des solutions, puisqu’il s’agit des courbes qui sont tangentes en tous leurs
points aux vecteurs du champs de vecteurs, même lorsqu’on ne sait pas résoudre l’équation. A
noter qu’on peut montrer que les graphes de deux solutions d’une même équation différentielle
ne peuvent jamais se recouper.
4.3 Modèles malthusiens et logistiques : le cas continu

Si l’on considère non plus le taux de reproduction r sur une génération mais le taux de
reproduction rt sur un intervalle de temps [t, t + ∆t] (1 jour, 1 mois, ...), avec par exemple
∆t = N1 s’il y a N intervalles de temps ∆t dans une génération, le modèle malthusien discret
peut se réécrire :
Yt+∆t − Yt
= rt .
Yt
En notant ∆Yt = Yt+∆t − Yt la variation de la taille de la population durant l’intervalle de temps
[t, t + ∆t] et en divisant l’égalité par ∆t, on obtient
∆Yt
= rYt
∆t
rt
où r = ∆t (ou encore r = N rt ). Si ∆t est suffisamment petit, on peut assimiler le quotient ∆Y
∆t
t
dY (t)
à la dérivée Y 0 (t) aussi notée dt et on obtient alors le modèle suivant, qui est simplement la
version continue du modèle malthusien discret :
dy(t)
= ry(t). (4.2)
dt
Dans ce modèle, la taille de la population y(t) est une solution de l’équation différentielle y 0 = ry
et sa valeur y(0) à l’instant t = 0 est la taille initiale de la population (que l’on supposera
positive). On sait que, pour chaque condition initiale y(0), cette équation possède une solution
unique qui est égale à y(t) = y(0)ert . Il y a donc deux comportements possibles pour y(t) selon le
ModŁle malthusien ModŁle de logistique
16
14
2.5
12
2
10
y y
8
1.5
1
4
0.5
0 2 4 6 8 0 5 10 15 20
x x
Fig. 4.2 – A gauche : le champs de vecteurs et 3 solutions d’un modèle malthusien. A droite :
le champs de vecteurs et 4 solutions d’un modèle logistique
signe de r : si r > 0, la population croit exponentiellement (explosion) et si r < 0, elle disparaı̂t

rapidement (extinction).
Si l’on suppose à présent que le taux de reproduction n’est plus le même quelque soit la taille
de la population mais qu’au contraire il dépend de cette taille, on a le modèle discret logistique
pour un petit intervalle de temps [t, t + ∆t]
Yt+∆t − Yt Yt
= rt Yt (1 − )
Yt K
qui se réécrit comme précédemment ∆Y Yt rt

∆t = rYt (1 − K ) avec r = ∆t . On est ainsi conduit au
t
modèle logistique continu :

dy(t) y(t)
= ry(t)(1 − ) (4.3)
dt K
Les modèles malthusiens et logistiques sont des équations différentielles de la forme y 0 = f (y)
y
(avec f (y) = ry pour (4.2) et f (y) = ry(1 − K ) pour (4.3)). Le premier est un modèle linéaire et
le second un modèle non linéaire. Dans les deux cas, on peut calculer explicitement les solutions.
C’est évident dans le cas malthusien et dans le cas logistique un calcul montre que, pour chaque
condition initiale y(0), l’équation différentielle (4.3) possède une solution unique y(t) égale à
y(0)Kert
y(t) = .
K + y(0)(ert − 1)
En réalité, si l’on s’intéresse au comportement du système ainsi modélisé, l’expression de la

solution exacte n’est guère utile. Les propriétés des solutions (croissance, comportement limite,
...) se déduisent en effet plus facilement d’une étude qualitative. Elle consiste à décrire, sans qu’il
soit nécessaire de résoudre l’équation explicitement, l’évolution de la population y(t) en fonction
de sa taille initiale y(0) en examinant simplement le champs de vecteurs et en étudiant ses
équilibres comme nous l’indiquons au paragraphe suivant.Dans le cas de l’équation logistique, on
voit qu’elle a une solution constante y(t) = K appelé équilibre biotique, qui est un comportement
limite vers lequel tendent toutes les solutions du modèle, quelque soit leur condition initiale (sauf
si y(0) = 0 bien entendu).
4.4 Equilibres et stabilité des équilibres

On définit de façon générale cette notion d’équilibre pour toute dynamique de la forme
dy(t)
= f (y(t)) (4.4)
dt
4.5. MÉTHODE D’EULER 31
de la façon suivante. On appelle population d’équilibre ou état stationnaire un niveau constant

y ∗ de population tel que si y(0) = y ∗ alors y(t) = y ∗ pour tout t. Une population d’équilibre est
donc une solution constante de l’équation différentielle. Une telle solution a donc nécessairement
une dérivée nulle, c’est-à-dire que l’on a f (y ∗ ) = 0, ce qui implique y ∗ est un zéro de la fonction
f . Ainsi dans le modèle malthusien, il y a un seul équilibre y ∗ = 0 et dans le modèle logistique
il y en a deux, y ∗ = 0 et y ∗ = K.
Il y a autant d’équilibres différents dans un modèle de type (4.4) qu’il y a de zéros différents
de la fonction f . On peut donc visualiser les différents équilibres de la dynamique en traçant le
graphe de cette fonction f . Les équilibres sont les abscisses des points d’intersection du graphe
avec l’axe horizontal (qui est ici l’axe des y). Mais ce graphe permet aussi de visualiser, sur cet
axe, un schéma de la dynamique : il suffit de mettre une flèche dans le sens des y croissants sur
les segments de l’axe où f > 0 (c’est-à-dire où le graphe de f est au dessus de l’axe) et une
flèche dans le sens des y décroissants sur les segments de l’axe où f < 0. Parfois ce schéma de la
dynamique est suffisant et peut remplacer à lui seul une résolution de l’équation (qui, de toute
façon, est bien souvent impossible).
On dit qu’une population d’équilibre y ∗ pour laquelle on a f 0 (y ∗ ) < 0 est une population
d’équilibre stable car dans ce cas l’évolution de toute population dont la taille initiale est proche
de l’équilibre y ∗ est de s’en rapprocher. De façon analogue, on dit qu’une population d’équilibre
y ∗ pour laquelle on a f 0 (y ∗ ) > 0 est une population d’équilibre instable car dans ce cas l’évolution
de toute population dont la taille initiale est proche de l’équilibre y ∗ est de s’en éloigner. On peut
vérifier en appliquant ce critère que l’unique équilibre du modèle malthusien est stable lorsque
r < 0 (extinction) et instable lorque r > 0 (explosion) et de même, si l’on suppose r > 0, on peut
vérifier que l’équilibre y ∗ = K du modèle logistique est un équilibre stable (capacité biotique)
alors que y ∗ = 0 est un équilibre instable. Lorsque f 0 (y ∗ ) = 0, on ne peut pas conclure.
La condition f 0 (y ∗ ) < 0 (resp. f 0 (y ∗ ) > 0) est donc un critère de stabilité (resp. d’instabilité)
qui se révèle très opérationnel puisqu’il se calcule facilement. Pour rendre ces critères intuitifs,
on se reportera à nouveau au schéma de la dynamique obtenu à partir du graphe de f . On y
voit facilement que lorsque f 0 (y ∗ ) < 0 le graphe de f passe au point y ∗ de valeurs positives à
des valeurs négatives et donc que la population croı̂t tant qu’elle est plus petite que y ∗ (puisque
f 0 (y) > 0) et décroit tant qu’elle est plus grande. Elle tend donc dans tous les cas à se rapprocher
de l’équilibre. On fait le même raisonnement, inversé cette fois, dans le cas où f 0 (y ∗ ) > 0.
4.5 Méthode d’Euler
La méthode d’Euler est connue (programmes de 1e S et de terminale S) comme une méthode

permettant de calculer approximativement des primitives de fonctions ou d’explorer les liens en-
tre la fonction exponentielle et les séries géométriques. Nous allons voir qu’elle permet beaucoup
plus généralement de calculer des solutions approchées d’équations différentielles.
Comme il est généralement impossible de calculer explicitement les solutions d’une équation
différentielle (de la même façon qu’il est bien souvent impossible de calculer la primitive exacte
d’une fonction), on est donc réduit à calculer le plus souvent non pas les solutions exactes mais
des solutions approchées. La méthode d’Euler est la méthode la plus simple pour cela. En réalité
les programmes d’ordinateurs utilisent des méthodes plus élaborées (par exemple la méthode
de Runge-Kutta dite du 4e ordre) mais ces méthodes reposent en général aussi sur l’idée très
simple d’Euler. Cette idée est la suivante :
Elle utilise le fait que l’équation différentielle donne, en chaque point (t, y), un vecteur
(1, f (y)) tangent au graphe de la solution. On part d’un point M0 = (t0 , y0 ), on choisit un
pas h > 0, et on trace un premier segment d’origine M0 , de pente f (y0 ) et d’extrémité le point
M1 d’abscisse t1 = t0 + h. Puis on recommence de M1 à M2 mais en remplaçant la pente du
segment f (y0 ) par f (y1 ) et ainsi de suite. On obtient les formules suivantes pour la suite des
points M0 , M1 , M2 , ... Mn .... :
(t0 , y0 ), (t1 = t0 +h, y1 = y0 +f (y0 )(t1 −t0 )), . . . , (tn = tn−1 +h, yn = yn−1 +f (yn−1 )(tn −tn−1 )), . . .
Il assez est clair que cette solution approchée sera d’autant proche de la solution exacte que
le pas h sera choisi petit et on peut effectivement vérifier que lorsque ce pas tend vers zéro,
la solution approchée tend vers la solution exacte. Mais, pour un pas donné, même petit, on
n’est jamais complètement sûr que le comportement de la solution approchée est le même que
celui de la solution exacte (exercice 4). Comme toujours, il est prudent de contrôler le résultat
fourni par l’ordinateur par des considérations de nature différente, comme par exemple une étude
qualitative.
4.6 Exercices
Exercice 1 : Soient a et b deux constantes et soit le modèle dynamique suivant : dz(t)
dt = az(t)+b.
1. Résoudre cette équation différentielle par le calcul et décrire le comportement des
solutions en fonction de la condition initiale.
2. En supposant (a, b) = (1, −2), tracer dans le plan (t, z) suffisamment de vecteurs
vitesse (1, dz
dt ) pour deviner l’allure des diverses solutions de ce modèle.
b
3. Même question pour (a, b) = (−1, 3). On dit que a est un équilibre de la dynamique.
Expliquer pourquoi.
Réponses : 1. Cette équation différentielle z 0 = az + b est une équation différentielle linéaire
qui a une solution ”triviale” z(t) = − ab et dont l’ensemble des solutions s’écrit {z(t) =
z0 eat − ab , z0 ∈ R}.
2. Avec ces valeurs des paramètres, l’équation différentielle s’écrit z 0 = z − 2. Voici
quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (1, 1), on
représente le vecteur de coordonnées (1, z − 2) = (1, −1), au point (t, z) = (1, 2),
on représente le vecteur de coordonnées (1, z − 2) = (1, 0), au point (t, z) = (2, 3),
on représente le vecteur de coordonnées (1, z − 2) = (1, 1). On note que les vecteurs
situés en des points de même ordonnée sont égaux entre eux (ce qui signifie que le
champs de vecteur est invariant par translation horizontale).
3. Avec ces valeurs des paramètres, l’équation différentielle s’écrit cette fois z 0 = −z + 3.
Voici quelques exemple de vecteurs que l’on peut tracer : au point (t, z) = (0, 1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 2), au point (t, z) = (1, −1), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 4), au point (t, z) = (0, 3), on
représente le vecteur de coordonnées (1, −z + 3) = (1, 0). La trajectoire issue du point
(0, z(t) = − ab = −3) est une trajectoire constante car les vecteurs situés sur la droite
z = −3 sont horizontaux. C’est pourquoi on appelle la solution z = −3 un équilibre.
Exercice 2 : On modélise la dynamique d’une population de bactéries responsable d’une mal-
adie des conifères par l’équation
dy(t)
= 0, 1y 2 (t)
dt
(t exprimé en mois et y(t) en dizaine de milliers).
1. Sans résoudre l’équation, indiquer le comportement de cette population à l’avenir,
selon ce modèle (à l’aide du champ de vecteurs par exemple).
10
2. Vérifier que y(t) = 1−t est une solution. Quelle est sa valeur initiale ? Tracer son
graphe.
3. Calculer la valeur approchée de cette solution par la méthode d’Euler en prenant le
pas h = 1/10. Comparer avec la solution exacte.
4.6. EXERCICES 33
Réponses : 1. Cette équation différentielle est de la forme y 0 = f (y) avec f (y) ≥ 0 pour tout
y. Comme f (y) est égale à la dérivée de la solution y(t), les solutions seront toutes
des fonctions croissantes. L’examen du champs de vecteurs montre en outre qu’elles
tendent vers l’infini.
2. On calcule d’une part dy d 10 10

dt = dt ( 1−t) ) et d’autre part (0, 1)y(t) = (0, 1)( 1−t) et on
10
constate que ces deux quantités sont égales à (1−t)2 . Le graphe de cette fonction est
celui d’une branche d’hyperbole issue du point (1, 10) ayant une asymptote verticale
en t = 1.
1 1
3. On a (t0 , y0 ) = (0, 10), (t1 = h, y1 = y0 + hf (y0 ) = ( 10 , 10 + ( 10 )10 = 11), (t2 =
2 1 100 2 10
10 2, y = 11 + ( 10 )( 9 ) = ( ,
10 9 ). On trouve pour les trois points suivants (t3 , y3 ) =
3 4 5
( 10 , 13.79), (t4 , y4 ) = ( 10 , 15.356), et (t5 , y5 ) = ( 10 , 17.456).
Exercice 3 : Pour l’équation différentielle dy(t)

dt = −0, 1y(t), calculer les 5 premiers points de
la suite (tn , yn ) de l’approximation d’Euler de la trajectoire issue de (O, 10) (on choisira
le pas h = 0, 25) et tracer sur le même dessin le graphe de la solution approchée et celui
de la solution exacte.
Exercice 4 : On s’intéresse à la solution de l’équation différentielle dy(t) 2

dt = 18y (t) de condition
initiale y(0)=-0,1. Nous dégageons d’abord quelques propriétés générales de l’ensemble des
solutions.
1. Vérifier que y(t) = y ∗ = 0 est une solution (équilibre).
2. En utilisant la figure du champ de vecteur associé (figure (??)), vérifier qu’une solution
de cette équation de condition initiale positive (resp. négative) reste positive (resp.
négative) pour tout t > 0.
3. Calculer les 4 premiers termes de l’approximation d’Euler de la solution de condition

initiale y(0) = −0, 1 en prenant h=1.
4. Comparer les résultats des deux questions précédentes. Qu’en pensez-vous ?
Exercice 5 : L’écureuil est un petit animal ayant un instinct territorial très développé. En
observant la dynamique d’une population d’écureuils, on peut faire les deux observations
suivantes :
– Si la population est trop grande, le taux de croissance décroı̂t ou même devient négatif.
– Si la population est trop petite, les écureuils en age de se reproduire courent le risque
de ne pas trouver de partenaire et donc, là encore, le taux de croissance est négatif.
Il est donc proposé le modèle dynamique suivant pour une population d’écureuils, k, N et
M étant des constantes positives telles que N > M :

y y
y 0 = ky 1 − −1
N M
1. Voici le graphe de la fonction f (y) = ky(1 − Ny )( M

y
− 1), dans le cas où k = 0, 5,
M = 10 et N = 100. Calculer les équilibres de ce modèle et déterminer leur stabilité
à l’aide du graphique.
60
50
40
30
20
10
0 20 40 60 80 100
y
2. Tracer plusieurs trajectoires (t, y(t)) de façon à avoir une idée graphique de la dy-
namique.
3. Préciser, en discutant selon les valeurs de la population initiale y(0), ce qu’il advient
de la population d’écureuils selon ce modèle (explosion, extinction, ...) et expliquer
ce que représentent les trois constantes k, N et M .
Exercice 6 : On considère une population de prédateurs y(t) qui se nourrissent exclusivement
de proies celle-ci formant une population notée x(t). On propose le modèle suivant pour
la dynamique de la population de prédateurs (β et q sont des constantes positives) :
dy(t)
= βx(t)y(t) − qy(t)
dt
1. Décrire la dynamique de la population de prédateurs en l’absence de proies.
2. Expliquer ce que représente le terme βx(t)y(t).
3. Décrire la dynamique de la population de prédateurs lorsque la populations des proies
est supposée constante (x(t) = C ste ).
4. Quelle équation pourriez-vous proposer pour modéliser la dynamique de la population
de proies ?
5. Notons qu’ici l’équation différentielle considérée est de la forme y 0 = f (y, t), avec
f (y, t) = βx(t)y − qy c’est-à-dire que la fonction f qui la définit dépends du temps
à travers la taille x(t) de la population de proies. On dit dans ce cas que l’équation
différentielle est non autonome. L’une des conséquence est que le champs de vecteur
associé n’est plus invariant par translation horizontale. Voyez-vous pourquoi ?
Chapitre 5
Dynamiques d’une population

structurée en ages
Les modèles malthusiens et logistiques ont un défaut qui n’a pas encore été souligné : ils
supposent que le taux de reproduction (différence entre les taux de natalité et de mortalité) est
identique pour tous les individus de la population. En réalité ces taux dépendent évidemment de
l’age des individus (ou de leur stade de développement). Ainsi dans une population de saumons
par exemple, oeufs, larves et poissons adultes n’ont pas le même taux de natalité ni le même
taux de mortalité. Nous allons étudier dans cette leçon le plus simple des modèles dynamiques
qui tient compte de cette hétérogénéité, le modèle linéaire ou modèle structuré en ages. Pour
rester le plus élémentaire possible, on supposera que la population étudiée dispose de ressources
illimitées, c’est-à-dire que l’on généralise ici le cas malthusien, qui ne tient pas compte des
limites environnementales et non le cas logistique. Bien entendu, il est possible de concevoir des
modèles plus élaborés qui prennent en compte à la fois la structure en age et les limitations
environnementales mais nous ne le ferons pas ici. Enfin cette étude sera aussi l’occasion de
développer l’outils mathématique du calcul matriciel, déjà abordé pour l’étude des chaines de
Markov, notamment par l’introduction des notions de valeurs propres et de vecteurs propres
d’une matrice.
5.1 Exemple introductif

Le modèle présenté ici est dû à Sir Paul Leslie (1945) et il est l’un des plus utilisé en dy-
namique des populations et en démographie. Il suppose que la population étudiée est constituée
de plusieurs groupes d’individus à des stades différents ou classes d’ages différentes (oeufs, oisil-
lons, oiseaux, par exemple ou bien graines, rosettes, plantes en fleurs, etc...). Les effectifs de
chacune des classes évoluent de façons différentes mais pas indépendemment les unes des autres.
On va étudier la dynamique de ce type de modèle et notamment chercher à répondre aux deux
questions suivantes :
1. l’effectif total, somme des effectifs des différentes classes, a-t-il, comme dans le cas malthusien
d’une classe unique, une croissance exponentielle avec un taux de croissance constant, et
dans ce cas, comment calculer ce taux ?
2. La répartition des individus dans les différentes classes, la distribution initiale, se maintient-
elle au cours du temps ou bien se modifie-t-elle et de quelle façon ?
Exemple : Pour commencer examinons un exemple. Il s’agit d’une population de rongeurs
ayant un cycle de reproduction de 3 ans. On ne considère ici que la sous population formée
des individus femelles. On suppose que chaque femelle donne en moyenne naissance à 6 femelles
durant sa deuxième année et à 10 femelles durant sa troisième année. Cependant, seul un rongeur
sur deux survit au dela de sa première année et seul 40% de ceux qui survivent la deuxième
année survivront jusqu’à la troisième année.
35
36 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES
jt pt at
14000
12000
10000
8000
6000
4000
2000
0
0 1 2 3 4 5 6
t
Fig. 5.1 – Evolution des trois classes d’ages de la population de rongeurs décrite par la dynamique
(5.1) correspondant à la condition initiale (30, 50, 50).
Si l’on désigne respectivement par jt , pt et at les effectifs à l’instant t des femelles juvéniles, des
femelles préadultes (rongeurs de 1 an) et des femelles adultes (rongeurs de 2 ans), les informations
précédentes peuvent s’écrire : 

 jt+1 = 6pt + 10at
pt+1 = 0, 5jt (5.1)

 a
t+1 = 0, 4p t
Ces formules (5.1) permettent, à partir des effectifs initiaux des trois classes, (j0 , p0 , a0 ), de
calculer les effectifs (j1 , p1 , a1 ) à l’instant suivant t = 1, puis, (j2 , p2 , a2 ) à l’instant t = 2 et ainsi
de suite. Si (j0 , p0 , a0 ) = (30, 50, 50), on obtient par exemple :
t 0 1 2 3 4 5 6
jt 30 800 290 2460 2470 7960 12330
pt 50 15 400 145 1230 1235 3980
at 50 20 6 160 58 492 494
On peut voir la dynamique des trois classes sur la figure (5.1) qui montre les premiers termes
des trois suites (jt ), (pt ) et (at ) pour 0 ≤ t ≤ 6.
Si l’on désigne par Nt = jt + pt + at l’effectif total de la population à l’instant t (et donc
N0 l’effectif initial), on peut également calculer à partir de (5.1) les termes successifs de la suite
(Nt ), ce qui permet d’apréhender aussi la dynamique de cette population dans son ensemble.
On a ici :
t 0 1 2 3 4 5 6
Nt 130 835 696 2765 3758 8687 16804
Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
jt+1 pt+1
jt , pt et at+1
at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur ces
premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la dynamique
de ces différentes classes d’age. Et si l’on considère la population dans son ensemble, les quotients
Nt+1
Nt ne sont pas plus réguliers.
5.2. LE MODÈLE DE LESLIE 37
t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2
Par contre si on laisse le temps augmenter, on constate que ces taux tendent tous vers la
même valeur λ, ici λ = 2, c’est-à-dire qu’après un certain temps, la dynamique considérée consiste
simplement en une multiplication par un facteur 2 des effectifs de chaque classe d’une période
à la suivante. Ce facteur multiplicatif, qui correspond à un taux de croissance asymptotique
s’appelle la valeur propre dominante et peut être calculé facilement comme nous allons le voir.
Si l’on s’intéresse maintenant non plus à la dynamique des effectifs mais à l’évolution au cours
du temps de la répartition des individus entre les diverses classes, on peut calculer, à partir de la
répartition initiale des individus selon ces trois classes v0 = (j0 /N0 , p0 /N0 , a0 /N0 ) l’évolution de
cette répartition au cours du temps vt = (jt /Nt , pt /Nt , at /Nt ). On constate que, cette répartition
tend vers une répartition asymptotique qui est celle du vecteur v = (100, 25, 5), c’est-à-dire
la répartition ( 100 25 5
130 , 130 , 130 ) ' (0.77, 0.192, 0.038). Cette répartition particulière a en outre la
propriété remarquable que, sur une population initiale répartie de cette façon, la dynamique est
exactement le comportement asymptotique indiqué plus haut, à savoir une multiplication des
effectifs par 2.
5.2 Le modèle de Leslie

On peut écrire le modèle précédent en utilisant une notation matricielle de la façon suivante :
     
jt+1 0 6 10 jt
     
p =
 t+1   0, 5 0 0 · p
  t 
at+1 0 0, 4 0 at
Si l’on introduit une notation vectorielle Xt pour le vecteur colonne des effectifs des trois classes
à l’instant t, et un nom L pour cette matrice, la dynamique peut donc se réécrire d’une façon
qui est très semblable aux dynamiques malthusiennes d’une population à une seule classe :
Xt+1 = L · Xt . (5.2)
Ainsi le vecteur des effectifs initiaux X0 se transforme à l’instant t = 1 en X1 = L · X0 , qui lui

même se transforme en X2 = L · X1 et ainsi de suite. La matrice L est un exemple de matrice
de Leslie.
On appelle matrice de Leslie une matrice de la forme
 
f1 f2 f3 . . . fn
 p1 0 0 ... 0 
 
 
 0 p2 0 ... 0 
 
 ... ... ... ... ... 
0 . . . . . . pn−1 0
Elle permet de modéliser par la dynamique (5.2) une population structurée en n classes d’age :
la première ligne contient les coeficients de fertilitéde chaque classe d’age f2 , f3 , ...fn et la sous
diagonale les probabilités de survie p1 , p2 , ...,pn−1 d’une classe d’age à la suivante. Les matrices
de Leslie ont tous leurs coefficients positifs ou nuls (mais elles ne sont pas pour autant des
matrices stochastiques car elles n’ont pas généralement la somme des coefficients de leurs lignes
égale à 1).
38 CHAPITRE 5. DYNAMIQUES D’UNE POPULATION STRUCTURÉE EN AGES
5.3 Valeurs propres, vecteurs propres

Soit L une matrice n × n et X un vecteur n × 1. Un nombre λ qui vérifie
L · X = λX
s’appelle une valeur propre de la matrice L. Une matrice n × n possède soit n valeurs propres,
soit moins de n lorsque certaines sont confondues ou parfois égales à des nombres complexes.
A chaque valeurs propres est associé au moins un vecteur X dont l’image par L est égal à
λ fois lui-même. On l’appelle le vecteur propre associé à λ. La plupart des logiciels de calcul
mathématique permettent de calculer les valeurs propres et les vecteurs propres d’une matrice
L donnée. Ainsi par exemple la matrice L de l’exemple précédent possède deux valeurs propres
λ = 2 et λ = 1 et X ∗ = (100 25 5) est un vecteur propre associé à λ = 2 puisque l’on a :
     
0 6 10 100 100
     
 0, 5 0 0  ·  25  = 2  25 
0 0, 4 0 5 5
Notons que tout multiple d’un vecteur propre est un vecteur propre (le vérifier !) ce qui
explique que l’on choisisse souvent pour vecteur propre un vecteur dont la somme des coefficients
vaut 1.
Si l’effectif initial de la population X0 est égal à un vecteur propre de la matrice L associé à
la valeur propre λ, alors on aura pour tout t ≥ 0 la dynamique suivante : Xt = λt X0 . Il est facile
d’en déduire qu’on aura alors également cette dynamique pour l’effectif total Nt . En d’autres
termes, lorsque la répartition de la population entre les diverses classes d’age forme un vecteur
propre de L associé à la valeur propre λ, alors la dynamique de la population dans son ensemble
et de chaque classe d’age en particulier est tout simplement une dynamique malthusienne de
taux de croissance ln(λ) (puisque l’on a λt = et ln(λ) ). Ce résultat est déjà très intéressant mais
il ne permet pas de décrire la dynamique dans le cas où la répartition initiale est différente de
cette répartition idéale.
5.4 Le théorème de Perron Frobenius

C’est le théorème de Perron Frobenius qui va nous permettre dans la plupart des cas de
décrire la dynamique lorsqu’on ne part pas de cette répartition particulière. On dit qu’une
matrice de Leslie est régulière lorsque l’une de ses puissances L, L2 , L3 , L4 , etc...a tous ses
coefficients strictement positifs. C’est le cas de la matrice de l’exemple puisque sa puissance L5
est à coefficients strictement positifs comme on peut le vérifier facilement.
Le Théorème de Perron Frobenius affirme qu’une matrice régulière possède une valeur propre
positive strictement plus grande que toutes les autres valeurs propres que l’on appelle valeur
propre dominante λ à laquelle est associé un vecteur propre X ∗ dit vecteur propre dominant
dont tous les coefficients sont positifs. De plus si X(0) est un vecteur initial dont tous les
coefficients sont strictement positifs, si X(t) = (x1 (t), x2 (t), . . . , xn (t) est sa dynamique et N (t) =
x1 (t) + x2 (t) + . . . + xn (t)) la somme de ses coefficients, on a les propriétés suivantes :
xi (t+1)
1. pour tout i = 1..n, xi (t) →t→∞ λ∗
2. X(t) ∗ ∗
N (t) →t→∞ X si l’on a choisi le vecteur X tel que la somme de ses coefficients fasse 1.
Ce résultat important permet d’affirmer que si la matrice de Leslie d’un modèle dynamique
(5.2) est régulière, alors cette dynamique présentera lorsque t augmente, un comportement as-
ymptotique de croissance exponentielle (de type malthusienne comme dans l’exemple) et la
population se répartira selon une répartition particulière qui ensuite sera invariante au cours du
temps. De plus le calcul de ce taux de croissance malthusien et de cette répartition asymptotique
se fait simplement en recherchant la valeur propre dominante λ∗ de la matrice de Leslie et un
vecteur propre X ∗ associé de somme 1.
5.5. EXERCICES 39
5.5 Exercices
Exercice 1 : Considérons une population de saumons en limitant nos observations aux seules
femelles. Supposons qu’elles vivent au maximum 3 ans, avec un taux de survie de 0, 05% la
première année et 10% la seconde, et enfin supposons que chaque femelle donne naissance
à 2000 juveniles au cours de sa troisième année.
1. Ecrire le système dynamique modélisant l’évolution de cette population de saumons.
2. Indiquer quelle est la matrice de Leslie L de ce système.
3. Si l’on suppose que la population initiale comporte 1000 femelles dans chaque classes
d’age, combien y en aura-t-il de chaque classe l’année suivante ? Combien l’année
d’après ?
4. Calculer les effectifs l’année 4 et en déduire, sans nouveaux calculs, les effectifs des
années suivantes.
5. Représenter les effectifs des différentes classes d’age en fonction du temps.
Exercice 2 : Même exercice mais en supposant cette fois que la population de saumons femelles
présente 4 classes d’age (d’une année chacune) avec des taux de survie de 0, 5%, 7% et
15% respectivement et une reproduction uniquement durant la 4e année de 5000 juveniles
par femelle.
Exercice 3 : On considère un modèle de Leslie de matrice
!
2, 25 9
L=
0, 25 0
1. A quoi correspondent les trois coefficients non nuls de L par rapport à la population
que l’on modélise ?
2. Vérifier que 3 et −0, 75 sont deux valeurs propres de L de vecteurs propres respectifs
(3 ; 0, 25) et (−3 ; 1).
3. En déduire la valeur propre dominante λ∗ et un vecteur propre dominant X ∗ de
somme 1.
4. Pour une population initiale égale à X0 = (10 ; 10), calculer les premiers termes
de la dynamique X1 , X2 , X3 puis l’évolution de la répartition X X2 X3
N1 , N2 , N3 . Qu’en
1
concluez-vous ?
Exercice 4 : Même exercice pour !
0, 25 2
L=
0, 375 0
avec les valeurs propres 1 et −0, 75 et les vecteurs propres respectifs (1 ; 0, 375) et
(−1 ; 0, 5).
Exercice 5 : Un modèle de Leslie a été proposé pour représenter la dynamique de la population
d’un pays. Ne prenant en compte que les individu de sexe féminin, c’est-à-dire en ignorant
les naissances masculines dans les taux de fécondités des classes, on a choisi dix classes d’age
d’une durée de 5 ans et un pas de temps de 5 an également. On a obtenu les coefficients
suivants sur la première ligne de la matrice

0, 000 0, 0010 0, 878 0, 3487 0, 4761 0, 3377 0, 1833 0, 0761 0, 174 0, 0010
et les coefficients suivants sur la sous diagonale

0, 9966 0, 9983 0, 9979 0, 9968 0, 9961 0, 9947 0, 9923 0, 9987 0, 9831
1. Comment expliquer que les coefficients de la première ligne sont croissants puis
décroissants ?
2. Pourquoi le premier coefficient de la sous diagonale est-il inférieur au suivant ?
3. Pourquoi n’a-t-on pas tenu compte des individus de plus de 50 ans dans ce modèle ?
Chapitre 6
Le modèle proies-prédateurs de
Lotka-Volterra
Le modèle que nous étudions a été proposé par Volterra (et indépendemment par Lotka) en
1926 dans un ouvrage intitulé ”Théorie mathématique de la lutte pour la vie” qui est probable-
ment le premier traité d’écologie mathématique. Volterra avait été consulté par le responsable
de la pêche italienne à Trieste qui avait remarqué que, juste après la première guerre mondiale
(période durant laquelle la pêche avait été nettement réduite) la proportion de requins et autres
prédateurs impropres à la consommation que l’on pêchait parmi les poissons consommables était
nettement supérieure à ce qu’elle était avant guerre et à ce qu’elle redevint ensuite.
6.1 Le modèle :
Le modèle concerne deux populations dont les effectifs au temps t sont respectivement notés
x(t) et y(t), la seconde (les prédateurs) se nourissant de la première (les proies). On fait les
hypothèses suivantes (inévitablement simplificatrices !) :
– Les proies x(t) disposent de nouriture en quantité illimitée, seuls les prédateurs y(t) s’op-
posent à leur croissance et en l’absence de prédateurs la population des proies a une
croissance exponentielle (modèle malthusien).
– Le nombre de prédateurs est limité par la quantité de proies dont ils disposent pour se
nourir et en l’absence de proies, la population des prédateurs a une décroissance exponen-
tielle (modèle malthusien).
– Le nombre de rencontres entre proies et prédateurs et à la fois proportionnel à x(t) et y(t)
donc proportionnel au produit x(t)y(t).
– Le taux de disparition des proies ainsi que le taux de croissance des prédateurs dues à
ces rencontres sont l’un et l’autre proportionnels au nombre de rencontres entres les deux
populations.
Ceci conduit au modèle suivant :

 dx(t)
 = α1 x(t) − β1 x(t)y(t)
dt (6.1)
 dy(t)

= −α2 y(t) + β2 x(t)y(t)
dt
où α1 > 0 est le taux de natalité (naturel) des proies, α2 > 0 le taux de mortalité (naturel) des
prédateurs et β1 > 0 etβ2 > 0 des coefficients d’interaction entre les deux populations. Pour des
raisons évidentes, on ne s’interesse à ce système que pour des valeurs de x er y positives.
41
42 CHAPITRE 6. LE MODÈLE PROIES-PRÉDATEURS DE LOTKA-VOLTERRA
Modele de Lotka-Volterra
6
5 5
4
4
y
3
3
1
0 2 4 6 8 10 –10 –8 –6 –4 –2 0 2 4 6 8 10
x t
Fig. 6.1 – Le champs de vecteurs du modèle de Lotka-Volterra et deux trajectoires particulières

à gauche ; les graphes des deux composantes de la trajectoire la plus petite :x(t) en pointillés et
y(t) en trait plein.
6.2 Un exemple :
Supposons par exemple qu’en l’absence de prédateurs la dynamique des proies soit la dy-
namique malthusienne x0 (t) = 0, 6x(t), qu’en l’ansence de proies celle des prédateurs soit la dy-
namique malthisienne y 0 (t) = −0, 25y(t) et qu’enfin les coefficients d’interaction soient β1 = 1, 8
et β2 = 0, 5. On obtient le système suivant :
(
x0 = 0, 8x(1 − 0, 5y)
(6.2)
y 0 = −0, 2y(x − 3)
La figure (6.1) représente d’une part les trajectoires de deux solutions particulières de ce
système (6.2) qui se révèlent être des courbes fermées de forme ovoı̈de parcourues dans le sens
inverse des aiguilles d’une montre et d’autre part les graphes (t → x(t)) et (t → y(t)) qui
représentent les dynamiques de chacune des deux populations, proies et prédateurs, au cours du
temps. On observe que ces dynamiques sont périodiques et présentent un comportement typique
des modèles de Lotka Volterra connu sous le nom d’oscillations autoentretenues. En effet ces
variations périodiques de la taille de ces deux populations ne sont pas dues à des variations de
leur environnement mais elles s’auto entretiennent : une diminution du nombre de proie entraine
une diminution du nombre de prédateurs qui en viennent à manquer de nourriture, diminution
qui, à son tour, rendra possible une nouvelle augmentation du nombre de proies profitant de
l’absence de prédateurs, augmentation qui va permettre un redémarrage de la croissance des
prédateurs et ainsi de suite. On notera en particulier que ces oscillations de x(t) et y(t) n’ont
pas lieu ensemble mais plutot de façon décalée dans le temps.
6.3 Etude qualitative :

Dans l’exemple précédent, nous n’avons pas expliqué comment a été mise en évidence la
dynamique du système. Plus généralement si l’on considère un système différentiel de la forme

 dx(t)
 = f (x(t), y(t))
dt (6.3)
 dy(t)

= g(x(t), y(t))
dt
comment obtient-on sa dynamique ? Parfois, mais c’est rare tout comme dans le cas des équations
différentielles uniques, on peut trouver, si l’on se donne une condition initiale (x(0), y(0)), la
6.4. LOI DE CONSERVATION : 43
solution (x(t), y(t)) du système (6.3) issue de cette condition initiale. C’est le cas par exemple
du système différentiel suivant, appelé oscillateur harmonique,

 dx(t)
 = −y(t)
dt (6.4)
 dy(t)

= x(t)
dt
En effet, il est facile de voir que, pour toutes les valeurs de A, les courbes t 7→ (A cos(t), A sin(t))
sont des solutions du système et qu’il suffit de choisir A = x(0)2 + y(0)2 . Mais le plus souvent on
ne trouvera pas d’expression explicite pour x(t) et y(t) et on aura recours à une étude qualitative
(comme nous allons le voir à présent) pour se faire une idée du comportement des solutions.
Pour l’étude qualitative, on se sert du champs de vecteur associé tel que celui qui est
représenté sur la figure (6.1). En effet, si une courbe t → (x(t), y(t)) est une solution du système
différentiel (6.3) alors elle est tangente en chacun de ses points au vecteur (f (x, y), g(x, y)).
Si l’on trace ce vecteur en chaque point (x, y) du plan, les trajectoires solutions du système
sont simplement des courbes tangentes en chacun de leurs points aux vecteurs de ce champs de
vecteurs. Notons que si en un point f (x, y) = 0, le vecteur en ce point sera vertical, et de même
si g(x, y) = 0, il sera horizontal. On en déduit que la courbe d’équation g(x, y) = 0, appelée
isocline horizontale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3)
ont une tangente horizontale. De même la courbe d’équation f (x, y) = 0, appelée isocline verti-
cale, est une courbe sur laquelle les solutions t 7→ (x(t), y(t)) du système (6.3) ont une tangente
verticale. Les points d’intersections de ces deux isoclines sont les équilibres (x∗, y∗) du système
c’est-à-dire les points tels que la trajectoire issue d’un tel point reste en ce point pour tout t.
Dans chacune des régions du plan délimitées par les deux isoclines horizontales et verticales, les
quantités f (x, y) et g(x, y) sont de signe constant et on peut schématiser la direction du champs
de vecteurs par une flèche de l’un des quatres type suivants : vers la droite et vers le haut (si
f > 0 et g > 0), vers la droite et vers le bas (si f > 0 et g < 0), vers la gauche et vers le haut
(si f < 0 et g > 0), vers la gauche et vers le bas (si f < 0 et g < 0). La position des équilibres,
celle des deux isoclines verticale et horizontale, les flèches du champs de vecteurs et la pro-
priété qu’on les trajectoires de ne jamais se croiser, permettent une étude qualitative du système
(6.3) : le plus souvent, on peut en déduire l’allure des solutions en fonction de leur condition
initiale (x(0), y(0)). Pour le modèle de Lotka-Volterra, une telle étude révèle la présence d’un
équilibre (x∗, y∗) = ( αβ22 , αβ11 ) à l’intersection de l’isocline horizontale −α2 + β2 x = 0 et vertical
α1 − β1 y = 0 et montre également que les trajectoires tournent autour de cet équilibre, comme
on le voit sur la figure (6.1). Dans l’exemple, l’isocline verticale est la droite d’équation x = 3,
l’isocline horizontale la droite d’équation y = 2 et l’équilibre est le point (3 ; 2).
6.4 Loi de conservation :

L’étude qualitative précédente permet de prédire des oscillations à la fois pour x(t) et pour
y(t) mais il n’est pas possible de répondre, sans une étude complémentaire, à la question de
savoir si les trajectoires se referment ou si elles spiralent vers l’intérieur ou vers l’extérieur.
Pour répondre à cette question, nous allons utiliser le fait que ce système possède une loi de
conservation. Prenons tout d’abord le cas plus simple de l’oscillateur harmonique. Son étude
qualitative (voir figure (6.3)) montre, un peu comme dans le cas du modèle de Lotka-Volterra,
des trajectoires tournant autour de l’équilibre qui est ici (x∗, y∗) = (0, 0). En outre, il est
facile de voir ici que la fonction H(x, y) = x2 + y 2 reste constante sur les solutions puisque
H(A cos(t), A sin y(t)) = A2 (cos2 (t) + sin2 (t)) = A2 . On dit que la quantité H(x, y) reste con-
servée sur les solutions du système (6.4) ou encore que la fonction H(x, y) est une loi de con-
servation du système (6.4).
Plus généralement, pour un système (6.3) quelconque, on a la règle suivante :
44 CHAPITRE 6. LE MODÈLE PROIES-PRÉDATEURS DE LOTKA-VOLTERRA
Oscillateur harmonique 3
3
2
2
y
1
1
–4 –3 –2 –1 0 1 2 3 4
–3 –2 –1 0 1 2 3
x t
–1 –1
–2 –2
–3
–3
Fig. 6.2 – Le champs de vecteurs de l’oscillateur hamonique et deux trajectoires particulières à

gauche ; les graphes des deux composantes de la trajectoire la plus petite : :x(t) en pointillés et
y(t) en trait plein.
Proposition 6.1 Pour que H(x, y) soit une loi de conservation pour le système (6.3), il suffit
que
∂H ∂H
(x, y) · f (x, y) + (x, y) · g(x, y) = 0
∂x ∂y
où ∂H
∂x (x, y) est la dérivée partielle de H(x, y) par rapport à x (que l’on obtient en dérivant H
par rapport à x tout en laissant y fixe) et de même pour ∂H ∂y (x, y).
Ainsi, pour H(x, y) = x2 +y 2 , ∂H ∂H

∂x (x, y) = 2x+0, ∂y (x, y) = 0+2y et l’on a bien 2x(−y)+2y(x) =
0.
Dans la cas du modèle de Lotka-Voterra, on peut s’assurer grace à cette règle que la fonction
H(x, y) = α1 ln y − β1 y + α2 ln x − β2 x
est une loi de conservation. On en déduit que les courbes de niveau de H, c’est-à-dire les courbes
d’équation H(x, y) = C ste , qui, autour de l’équilibre, sont des courbes fermées concentriques,
sont des trajectoires du système.
6.5 Exercices :
Exercice 1 : On suppose que deux populations d’araignées et de papillons sont modélisées par
un modèle de Lotka-Volterra avec α1 = 0, 1, α2 = 0, 5 et β1 = β2 = 0, 001. Si l’on suppose
que les tailles initiales des deux populations sont respectivement de 200 araignées et 600
papillons, quelle sera, selon ce modèle, la dynamique de ces deux populations à court
terme ? Pour répondre à cette question, on pourra commencer par tracer les deux isoclines
horizontale et verticale, le point d’équilibre et l’allure de la trajectoire ayant la condition
initiale indiquée.
Exercice 2 : On considère la fonction H(x, y) = 12 x2 y.
1. Représenter sur le même graphique ses courbes de niveau 0, 1, −1, 2, −2. Indiquer
l’allure de l’ensemble des courbes de niveau de H.
2. On considère le système différentiel
(
x0 = −x
(6.5)
y 0 = 2y
6.5. EXERCICES : 45
ModŁle de Lotka-Volterra
1.4
1.4
1.3
1.3
1.2
1.2
1.1
1.1
1
1
0.9 0.9
0.8
0.8
0.7
0.7
0.6 0.8 1 1.2 1.4 1.6 1.8 -20 -10 0 10 20

x
Fig. 6.3 – Figure de l’exercice 4
Montrer que la fonction H(x, y) est une loi de conservation de ce système. En déduire
l’allure des solutions du système (indiquer le sens de parcours des trajectoires).
3. Retrouver ce même dessin en faisant une étude qualitative du système (6.5) (isoclines,
équilibres, flèches dans les différents secteurs).
4. Choisir un point (x0 , y0 ) du premier quadrant (x0 > 0, y0 > 0) et calculer la so-
lution (x(t), y(t)) du système (6.5) issue de ce point en résolvant explicitement le
système. Préciser l’évolution au cours du temps que ce système prévoit s’il représente
la dynamique de deux populations.
Exercice 3 : On considère le système différentiel suivant :
(
x0 = x
(6.6)
y0 = x − y
1. Indiquer sur un dessin la position des isoclines verticales et horizontales, les équilibres,
la direction du champs de vecteurs dans les différentes régions délimitées par les
isoclines.
2. Préciser la direction du champs de vecteurs sur la droite y = 12 x. En déduire que
(x(t), y(t)) = (et , 12 et ) est une solution particulière du système (6.6). Quelle est la
solution de condition initiale (x(0), y(0)) = (−1, − 12 ) ?
3. Tracer sur votre dessin la famille des trajectoires.
Exercice 4 : Sur le premier graphique de la figure (??) ci-dessus, on a représenté deux solutions
du modèle de Lotka-Volterra, comme courbes paramétrées (t → (x(t), y(t))) et, sur le
second, pour l’une de ces deux solutions, on a représenté ses deux composantes (t → x(t))
et (t → y(t)) comme fonctions du temps.
1. A laquelle des deux trajectoires représentées sur le premier graphique correspond les
deux courbes du second graphique ? Justifier.
2. Entre les instants t = 0 et t = t1 , l’une des deux coordonnées est décroissante alors que
l’autre croı̂t puis décroı̂t. Indiquer sur le premier graphique les points correspondant
aux instants t = 0 et t = t1 que vous noterez A0 et A1 respectivement. Expliquer, en
terme de comportement comme proies ou comme prédateurs des populations étudiées,
comment on peut expliquer ce type d’évolution.
Chapitre 7
Méthode des moindres carrées
Une situation courante en sciences biologiques est d’avoir à sa disposition deux ensembles de
données de taille n, {y1 , y2 , . . . , yn } et {x1 , x2 , . . . , xn }, obtenus expérimentalement ou mesurés
sur une population. Le problème de la régression consiste à rechercher une relation pouvant
éventuellement exister entre les x et les y, par exemple de la forme y = f (x). Lorsque la relation
recherchée est affine, c’est-à-dire de la forme y = ax + b, on parle de régression linéaire. Mais
même si une telle relation est effectivement présente, les données mesurées ne vérifient pas en
général cette relation exactement. Pour tenir compte dans le modèle mathématique des erreurs
observées, on considère les données {y1 , y2 , . . . , yn } comme autant de réalisations d’une variable
aléatoire Y et parfois aussi les données {x1 , x2 , . . . , xn } comme autant de réalisations d’une
variable aléatoire X. On dit que la variable Y est la variable dépendante ou variable expliquée
et que la variable X est la variable explicative .
7.1 La droite des moindres carrés

Les données {(xi , yi ), i = 1, . . . , n} peuvent être représentées par un nuage de n points dans
le plan (x, y), le diagramme de dispersion. Le centre de gravité de ce nuage peut se calculer facile-
ment : il s’agit du point de coordonnées (x, y) = ( n1 Σni=1 xi , n1 Σni=1 yi ). Rechercher une relation
affine entre les variables X et Y revient à rechercher une droite qui s’ajuste le mieux possible à
ce nuage de points. Parmi toutes les droites possibles, on retient celle qui jouit d’une propriété
remarquable : c’est celle qui rend minimale la somme des carrés des écarts des valeurs observées
yi à la droite ŷi = axi + b. Si εi représente cet écart, appelé aussi résidu, le principe des moindres
carrés ordinaire (MCO) consiste à choisir les valeurs de a et de b qui minimisent
n
X n
X
E= ε2i = (yi − (axi + b))2 .
i=0 i=0
Pn
(x −x)(yi −y)
Un calcul montre que ces valeurs, notées â et b̂, sont égales à â = P
i=1 i
n et b̂ =
(x −x)2
i=1 i
y −âx. On exprime souvent â au moyen de la variance et de la covariance des variables aléatoires
47
48 CHAPITRE 7. MÉTHODE DES MOINDRES CARRÉES
Fig. 7.1 – Illustration de la formule DT=DA+DR. La droite horizontale passe par le centre de
gravité du nuage ; la première figure représente la dispersion totale DT, la seconde la dispersion
due à la regression DR (nulle si la pente de la droite des moindres carrés est nulle et importante
si cette pente est forte) et la troisième la dispersion autour de la droite, ou dispersion résiduelle.
X et Y par â = covxy /s2x . En effet, on a :
n n
1X 1X
s2x = (xi − x)2 et covxy = (xi − x)(yi − y).
n i=1 n i=1
7.2 Evaluation de la qualité de la régression

Pour mesurer la qualité de l’approximation d’un nuage (xi , yi )i=1..n par sa droite des moindres
carrés (après tout on peut toujours faire passer une droite par n’importe quel nuage !), on calcule
son coefficient de corrélation linéaire défini par
covxy
rxy = .
sx sy
C’est un nombre compris entre −1 et +1, qui vaut +1 (resp. −1) si les points du nuage sont
exactement alignés sur une droite de pente a positive (resp. négative). Ce coefficient est une
mesure la dispersion du nuage. On considère que l’approximation d’un nuage par sa droite des
moindres carrés est de bonne qualité lorsque |rxy | est proche de 1 (donc rxy proche de +1 ou
de −1) et de médiocre qualité lorsque√ |rxy | est proche de 0. En pratique on estime souvent la
régression acceptable lorsque |rxy | ≥ 23 .
Parfois on préfère calculer non plus rxy mais son carré noté R2 = rxy rxy car on a la relation
suivante (voir figure 7.2) :
X X X
(yi − y)2 = (yi − ŷi )2 + (ŷi − y)2
qui exprime que la dispersion totale de Y (DT) est égale à la dispersion autour de la régression
(DA) plus la dispersion due à la régression (DR). Or on peut vérifier que l’on a R2 = DR DT ,
c’est-à-dire que le R2 représente la part de la dispersion totale de Y que l’on peut expliquer par
la régression. Ainsi si l’on obtient une valeur de R2 = 0, 86 (et donc r = ∓0, 92), cela signifie
que la modélisation par la droite des moindres carrés explique 86% de la variation totale, ce qui
est un très bon résultat.
Cependant, même avec un R2 excellent (proche de 1), notre modèle linéaire peut encore
être rejeté. En effet, pour être assuré que les formules données â et b̂ fournissent de bonnes
estimations de la pente et de l’ordonnée à l’origine de la droite de régression, il est nécessaire
que les résidus εi soient indépendant et distribués aléatoirement autour de 0. Ces hypothèses
ne sont pas forcément faciles à vérifier. Un tracé des résidus et un examen de leur histogramme
permet de détecter une anomalie grossière mais il faut faire appel à des techniques statistiques
plus élaborées pour tester réellement ces hypothèses (ce que nous ne ferons pas ici).
7.3. PRÉVISIONS 49
7.3 Prévisions
Si y = âx + b̂ est la droite des moindres carrés d’un nuage de points (xi , yi )i=1..n , on appelle
valeurs prédites de y par le modèle les valeurs ŷi := âxi + b̂.
On utilise notamment ces valeurs pour faire des prévisions : si les xi sont des dates successives,
x1 < . . . < xn , la valeur prédite pour y à une date future xn+1 est simplement ŷn+1 = âxn+1 + b̂.
Notons cependant que s’il peut sembler naturel d’utiliser une valeur prédite pour compléter les
données initiales dans l’intervalle des valeurs de X, on se gardera de prédire sans de multiples
précautions supplémentaires des valeurs de Y en dehors de cet intervalle. En effet il se peut que
la relation entre X et Y ne soit pas du tout linéaire mais qu’elle nous soit apparue comme telle
à tort parce que les xi sont proches les uns des autres.
7.4 Remarques
Pour finir voici quelques remarques :
1. Certains ne manqueront pas d’être surpris du fait qu’à coté des définitions de la variance
et de la covariance que nous avons données on trouve dans certains ouvrages (ou dans
les calculettes) une autre définition dans laquelle le facteur n1 a été remplacé par le fac-
1
teur n−1 . Disons que “notre” définition est la définition de la variance (ou la covariance)
1
théorique alors que celle qui comporte un facteur n−1 est la définition de la variance (ou la
covariance) empirique. La première est celle que l’on utilise lorsque n est l’effectif total de
la population alors que la seconde est celle que l’on utilise lorsque l’on estime la variance
(ou la covariance) sur un échantillon de taille n beaucoup plus petite que la taille totale.
De toute façon, dans le cadre de la régression linéaire, on notera que tant pour le calcul
de â que dans celui de rxy , le résultat sera le même que l’on utilise l’une ou l’autre de ces
formules.
2. Dans le calcul de la droite des moindres carrés, les variables X et Y ne jouent pas des
rôles interchangeables. La variable dépendante Y prend, comme son nom l’indique, des
valeurs qui dépendent de celles de X. D’ailleurs si l’on échange les rôles de X et de Y ,
on calcule une approximation linéaire de la forme x = â0 y + b̂0 , le critère des MCO est
P
alors E = ni=1 (xi − (a0 yi + b0 ))2 , et ce n’est plus le même et la droite que l’on obtient en
général. Cette droite, tout comme la précédente, passe par le centre de gravité du nuage
de point, mais c’est leur seul point commun. C’est le problème considéré qui indique s’il
faut considérer Y ou plutôt X comme variable dépendante (et l’autre comme variable
explicative). Mais si l’on s’intéresse aux interactions entre deux variables X et Y dont ni
l’une ni l’autre n’est clairement dépendante de l’autre, alors on pourra choisir de régresser
Y en fonction de X ou bien le contraire. Mais on ne doit pas s’attendre à obtenir les mêmes
résultats.
3. On appelle donnée éloignée (outlier) un point du nuage situé à l’écart. S’il est éloigné dans
la direction de y, il lui correspondra un important résidu. S’il est éloigné dans la direction
des x, il peut présenter un très petit résidu et en même temps avoir une grande influence
sur les valeurs de â et b̂ trouvées.
On appelle donnée influente un point du nuage dont l’oubli conduirait à une droite des
moindres carrés bien différente. C’est souvent le cas des données éloignées dans la direction
des x.
4. Attention à ne pas déduire trop hativement de la présence d’une liaison entre deux variables
une relation de cause à effet ! Si quelqu’un devait suivre le degré de murissement des pêches
et des abricots (par dosage de l’éthylène ou du fructose), il trouverait certainement une
relation linéaire entre les deux. Mais le murissement des abricots n’influe pas sur celui des
pèches ; ni l’inverse d’ailleurs. Par contre, les oscillations du niveau du lac Tchad (Afrique
centrale) ont bel et bien leur source dans le cycle de 11 ans de l’activité solaire avec lequel
elles sont parfaitement corrélées. Prudence donc.
7.5 Exercices
Exercice 1 : On possède 6 spécimens fossiles d’un animal disparu et ces spécimens sont de
tailles différentes. On estime que si ces animaux appartiennent à la même espèce il doit
exister une relation linéaire entre la longueur de deux de leurs os, le fémur et l’humérus.
Voici les données de ces longueurs en cm pour les 5 spécimens possédant ces deux os
intacts :
fémur 38 56 59 64 74
humérus 41 63 70 72 84
1. Tracer le nuage de point correspondant à ces données. Pensez-vous que les 5 spécimens
peuvent appartenir à la même espèce et ne différer en taille que parce que certains
sont plus jeunes que d’autres ?
2. Calculer à l’aide de votre calculette mx , my , sx , sy et covxy . En déduire l’équation
de la droite des moindres carrés. Contrôler vos calculs en superposant son graphe au
nuage de points.
3. Calculer le coefficient de corrélation linéaire r. Qu’en concluez-vous ?
4. Reprenez les 2 questions précédentes en effectuant directement la regression linéaire
au moyen de votre calculette. Vérifier que vos résultats sont identiques.
Exercice 2 : 1. Simuler au moyen de la fonction Random de votre calculette une suite de

n = 15 nombres aléatoires (ηi )i=1,..n compris entre 0 et 1. Puis calculer les nombres
εi := 2ηi − 1.
2. Calculer la moyenne mε des εi et les remplacer par εi − mε si nécéssaire pour avoir
une suite centrée, puis calculer l’écart type de cette suite. Pouviez-vous deviner sa
valeur approximative ?
3. On choisit pour (xi ) la suite 0 ; 0, 25 ; 0, 5 ; 0, 75 ; 1 ; 1, 25 ; 1, 5 ; 1, 75 ; 2 ; 2, 25 ; 2, 5 ; 2, 75 ; 3 ; 3, 25 ; 3, 5
et pour (yi ) la suite yi = −2xi + 3 + εi . Calculer la droite de regression du nuage
(xi , yi ). Commentez.
4. Représenter les résidus et calculer la moyenne des carrés des résidus.
5. Représenter l’histogramme des résidus.
Exercice 3 : Pour étudier les problèmes de malnutrition dans un pays pauvre, on a calculé le
poids moyen par age d’un échantillon de 2400 enfants répartis uniformément en 12 classes
d’age. On a obtenu les données suivantes :
age 1 2 3 4 5 6 7 8 9 10 11 12
poids 4,3 5,1 5,7 6,3 6,8 7,1 7,2 7,2 7,2 7,2 7,5 7,8
1. Un statisticien pressé a fait calculer par sa machine la droite des moindres carrés pour
ces données et a trouvé la relation poid = 4, 88 + 0, 267age. S’est-il trompé ?
2. A votre avis, quelle est la pertinence de son modèle ?
3. Calculer puis tracer les résidus. Vous constaterez que deux résidus successifs sont
beaucoup plus souvent du même signe que du signe opposé. Ceci n’est pas com-
patible avec le fait qu’ils soient supposés indépendants. On dit que les résidus sont
autocorrélés. C’est une raison de rejeter le modèle.
7.5. EXERCICES 51
Exercice 4 : L’une des rares lois que l’on a pu mettre en évidence en Ecologie est la relation
existant entre le nombre N d’espèces présentes dans un habitat donné (bien délimité) et
la surface S de cet habitat. On considère généralement que cette relation est de la forme
N = AS B (7.1)
où A et B sont deux constantes. Afin de vérifier cette relation pour les plantes présentes
dans une prairie (pissenlit, paquerettes, orties, boutons d’or, ...), on a effectué les mesures
indiquées dans le premier tableau ci-dessous. On a représenté sur la première figure ci-
dessous les valeurs de N en fonction de celles de S et sur la deuxième les valeurs de
Ñ = ln(N ) en fonction de celles de S̃ = ln(S). On voit que la regression linéaire de Ñ sur
S̃ a donné :
Ñ = 0, 2199S̃ + 1, 7432 avec R2 = 0, 9684 (7.2)
1. Pourquoi n’a-t-on pas effectué directement une régression linéaire de N sur S ? Ex-
pliquez l’intéret de cette transformation des données.
2. Que représente R2 et que peut-on déduire de sa valeur ?
3. A partir de la régression linéaire (7.2), calculer les constantes A et B de la relation
(7.1).
4. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(128) ? En comparant avec
la valeur de S̃ observée, calculer le résidu ε en ce point.
5. Quelle valeur Ñ ce modèle linéaire prédit-il pour S̃ = ln(100) ? En déduire le nombre
d’espèces pouvant coexister dans un habitat de surface S = 100, selon ce modèle.
Exercice 5 : On a mesuré sur un peuplement de bouleau blanc (Betula alba) dans le Massif
Central les circonférences des troncs de 21 individus à la hauteur de 1.3 mtres du sol
(indice DBH). Dans le même temps, un carottage des arbres a permis d’estimer leurs ages
respectifs. De cet ensemble de données on a extrait les données des arbres d’ages 1 à 120
par pas de 20 ans. Par ailleurs on a constaté sur le terrain que les arbres se répartissent en
trois catégories : les arbres les plus hauts (dominants), les arbres moyens (codominants)
et les arbres plus petits, sous le couvert des autres : les dominés.
1. Tracez sur un même graphique les trois courbes représentant la circonférence des
troncs en fonction de l’age. Que constate-t-on et comment interprétez-vous les différences
constatées ? Que pensez-vous de l’allure des courbes ? Quel type de fonction peut-on
envisager d’ajuster ?
2. On souhaite vérifier que la croissance en circonférence des troncs peut être modélisé
par une exponentielle saturée de la forme y(t) = ymax (1 − exp(rt)) où y(t) est la cir-
conférence l’instant t, ymax la valeur maximale que la circonférence peut prendre, r un
taux de croissance en circonférence et t le temps. Les valeurs de ymax ont été estimées
empiriquement à 86.4 cm, 65.43 cm et 36.00 cm pour chacune des trois catégories
d’arbres. En remarquant que, d’après l’expression de y(t), la quantité ln(y(t) − ymax )
dépend de façon linéaire de t, estimez au moyen d’une regression linéaire le paramètre

r pour chacun des trois modèles. Vérifiez sur l’un des trois résultats la bonne qualité
de l’ajustement des données.
Ages 1 20 40 60 80 100 120
Dominants 1, 26 22, 29 40, 09 56, 15 63, 49 71, 69 81, 08
Dominés 1, 27 16, 02 29, 42 31, 61 35, 61 35, 69 35, 93
Codominants 1, 29 22, 14 35, 69 49, 23 56, 88 60, 43 63, 74
Chapitre 8
Classification automatique :
introduction
La classification (clustering) est une méthode mathématique d’analyse de données : pour

faciliter l’étude d’une population d’effectif important (animaux, plantes, malades, gènes, etc...),
on les regroupe en plusieurs classes de telle sorte que les individus d’une même classe soient le
plus semblables possible et que les classes soient le plus distinctes possibles. Pour cela il y a
diverses façons de procéder (qui peuvent conduire à des résultats différents...). Dans ce cours
nous présentons deux algorithmes, un premier appelé classification hierarchique ascendante et
un second appelé méthode des centres mobiles.
8.1 Distances entre individus d’une même population

Pour regrouper les individus qui se ressemblent (et séparer ceux qui ne se ressemblent pas),
il faut un “critère de ressemblance”. Pour cela on examine l’ensemble des informations dont on
dispose concernant les individus (pression artérielle, température, taux de métabolisme, ... par
exemple s’il s’agit de malades) notées (xi , yi , . . .) pour le ième individu, et on imagine que chaque
individu est un point Mi = (xi , yi , zi , . . .) de l’espace. S’il n’y a que deux variables relevées (xi , yi )
on obtient ainsi un nuage de points dans le plan Γ = {Mi , i = 1, . . . , n} où n est l’effectif total
de la population. La distance euclidienne de deux individus Mi et Mj est par définition
q
d2 (Mi , Mj ) = (xi − xj )2 + (yi − yj )2
Elle est d’autant plus petite que les deux individus sont semblables (du point de vue des deux
critères retenus) et d’autant plus grande qu’ils sont différents.
On peut associer à chaque nuage d’individus une matrice D = (dij )0≤i≤n,0≤j≤n = (d2 (Mi , Mj )),
dite matrice des distances. C’est une matrice à n lignes et n colonnes, à coefficients positifs,
symétrique (puisque d2 (Mi , Mj ) = d2 (Mj , Mi )) et nulle sur la diagonale (puisque d2 (Mi , Mi ) =
0). Pour un nuage d’effectif n, il y a donc n(n−1)
2 distances à calculer.
A coté de la distance euclidienne, on peut définir d’autres distances (et donc d’autres matrices
des distances). Par exemple
d1 (Mi , Mj ) = |xi − xj | + |yi − yj |
d∞ (Mi , Mj ) = Max {|xi − xj |, |yi − yj |}
8.2 Ecarts entre classes

Supposons le nuage Γ = {Mi , i = 1, . . . , n} décomposé en plusieurs classes Γ1 , Γ2 , .... , Γk et
notons G1 , G2 , .... , Gk les centres de gravité respectifs de chaque classes et notons p1 , p2 , ... ,
53
54 CHAPITRE 8. CLASSIFICATION AUTOMATIQUE : INTRODUCTION
pk les poids respectifs de chaque classe que l’on définit de la façon suivante : si l’on suppose que
tous les individus ont le même poids égal à n1 , le poids pl de la classe Γl est égal à l’effectif de
Γl divisé par n. De cette façon la somme des poids de toutes les classes vaut 1. Rappelons que
le centre de gravité G d’un nuage de points Γ est le point moyen du nuage, c’est-à-dire le point
P P
G = (x, y, . . .) de coordonnées x = n1 ni=1 xi , y = n1 ni=1 yi , ....
Pour mesurer la proximité ou l’écart entre deux classes Γl et Γm , il existe de nombreuses
façons de procéder. On calcule par exemple la quantité Min {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl }
appelée distance du plus proche voisin ou encore Max {d(Mi , Mj ), Mi ∈ Γm , Mj ∈ Γl } ou sim-
plement la distance des centres de gravité d2 (Gm , Gl ). Mais la mesure que l’on utilise le plus
souvent appelée écart de Ward est définie par :
p m pl
d(Γm , Γl ) := d2 (Gm , Gl )2
pm + p l
où pl et pm sont les poids des deux classes.
8.3 Inertie interclasse et inertie intraclasse

On appelle inertie totale d’un nuage Γ = {Mi , i = 1, . . . , n} la moyenne des carrés des
distances de ses points au centre de gravité du nuage. Donc, si G désigne le centre de gravité de
Γ, l’inertie totale de Γ est, si tous les points du nuage sont de même poids égal à n1 ,
1
I(Γ) = d2 (M1 , G)2 + d2 (M2 , G)2 + . . . + d2 (Mn , G)2 . (8.1)
n
L’inertie mesure la dispersion du nuage. Si le nuage Γ est composé de k classes Γ1 , Γ2 , .... ,
Γk , celles-ci seront d’autant plus homogènes que les inerties de chaque classe, I(Γ1 ), I(Γ2 ), ....
, I(Γk ), calculées par rapport à leurs centres de gravité G1 , G2 , .... , Gk respectifs, sont faibles.
La moyenne pondérée de ces inerties est appelée inertie intraclasse :
Iintra = p1 I(Γ1 ) + p2 I(Γ2 ) + . . . + pk I(Γk ).

Les inerties des classes I(Γ1 ), I(Γ2 ), ... sont simplement calculées avec la formule (8.1) ci-dessus
où l’on remplace le centre de gravité G par celui de la classe G1 , G2 , ... et l’effectif n par celui
de la classe.
L’inertie totale d’un nuage n’est généralement pas égale à la somme pondérée des inerties
des classes qui le composent, c’est-à-dire à l’inertie intraclasse (sauf dans le cas où les centres de
gravité de toutes les classes sont confondus) car il faut prendre en compte également la dispersion
des classes par rapport au centre de gravité du nuage. Il s’agit de l’inertie interclasse définie par
Iinter = p1 d2 (G1 , G)2 + p2 d2 (G2 , G)2 + . . . + pk d2 (Gk , G)2 .
On montre le résultat suivant appelé décomposition de Huygens :
Théorème 8.1 L’inertie totale d’un nuage de points composé de différentes classes est la somme
de son inertie intraclasse et de son inertie interclasse, c’est-à-dire :
I(Γ) = I(Γ1 ∪ Γ2 ∪ . . . ∪ Γk ) = Iintra + Iinter .
8.4 Classification hiérarchique ascendante

Pour classifier une population d’effectif n dont les individus sont numérotés 1, 2, ..., on
considère cette population comme la réunion de n classes à un seul élément et on regroupe
progressivement les classes deux à deux selon l’algorithme suivant :
Etape 1 : Calculer la matrice des distances D = (dij )0≤i≤n,0≤j≤n
8.5. MÉTHODE DES CENTRES MOBILES 55
0.8
0.7
0.6
0.5
0.4
0.3
0.2
20 25 24 9 27 2 17 21 4 22 16 7 28 11 8 26 30 1 5 12 3 14 13 23 10 15 6 19 18 29
Etape 2 : Remplacer les deux individus de distance minimale par une classe (à 2 éléments)
numérotée n + 1.
Etape 3 : Calculer la perte d’inertie interclasse dû au regroupement précédent : on peut montrer
qu’il s’agit exactement de l’écart de Ward des deux individus regroupés.
Après ces trois étapes, la population compte alors n − 1 classes (n − 2 classes à un élément
et une à 2 éléments). On peut donc recommencer à l’étape 1 en remplaçant “individus” par
“classes” si nécessaire (et donc “distance entre individus” par “écarts entre classes”). Après
n − 1 itérations, tous les individus sont regroupés en une classe unique.
On construit alors un arbre, appelé dendrogramme (voir dessin ci-dessus) de la façon suivante.
On aligne sur l’axe horizontal des points représentant les différents individus et on les joint
deux à deux, successivement, en suivant cet algorithme de classification hierarchique ascendante
(commençant par les plus proches, etc...). On poursuit ainsi jusqu’à regroupement de tous les
individus en une classe unique. Pour plus de lisibilité, on pourra disposer les individus dans
l’ordre dans lequel les regroupements ont été effectués. Le niveau (hauteur) de chaque noeud
de l’arbre est, le plus souvent, choisi proportionnel à la part restante d’inertie intra sur l’inertie
totale ; dans ce cas, ce niveau est zéro lorsque tous les individus sont séparés (en bas) et vaut
1 lorsqu’il sont tous réunis en une seule classe (en haut). En fait, on trace ce dendrogramme
afin de visualiser le niveau où couper cet arbre pour réaliser la meilleure partition de l’ensemble
initial. On peut comprendre qu’il sera optimal de couper le dendrogramme à un niveau où le
regroupement entre classes conduit à une perte d’inertie inter maximale. On peut vérifier que
l’écart de Ward entre deux classes est en fait égal à la perte d’inertie inter que produirait la
réunion de ces deux classes en une seule. Le niveau des noeuds de l’arbre est donc facile à
calculer à partir des écarts de Ward entre les classes.
8.5 Méthode des centres mobiles

Cette méthode s’applique lorsque l’on sait à l’avance combien de classes on veut obtenir.
Appelons k ce nombre. L’algorithme est le suivant :
Etape 0 : Pour initialiser l’algorithme, on tire au hasard k individus appartenant à la population,
C1 (0), C2 (0), ..., Ck (0) : ce sont les k centres initiaux.
Etape 1 : On regroupe les individus autours de ces k centres de sorte à former k classes Γ1 (0),
Γ2 (0), ..., Γk (0) de la manière suivante : chaque classe Γl (0) est constituée des points plus proches
du centre Cl (0) que des autres centres Γm (0) pour m 6= l.
Etape 2 : On calcule alors les centres de gravité G1 , G2 , .... , Gk des k classes obtenues et on
désigne ces points comme nouveaux centres C1 (I) = G1 , C2 (I) = G2 , .... , Ck (I) = Gk
On répète les étapes 1 et 2 jusqu’à ce que le découpage en classes obtenu ne soit presque
plus modifié par une itération suplémentaire. On peut montrer que la variance intra classe ne
peut que décroı̂tre lorsque l’on passe d’un découpage en classes au suivant.
56 CHAPITRE 8. CLASSIFICATION AUTOMATIQUE : INTRODUCTION
8.6 Exercices
Exercice 1 : Soient M1 = (1, 0), M2 = (0, 1) et M3 = (3, 1) trois points du plan.
1. Calculer les matrices des distances du nuage formé de ces trois points en utilisant
successivement la distance euclidienne d2 puis les distances d1 et d∞ .
2. On ajoute au nuage précédent les deux points M4 = (4, 2) et M5 = (4, 3). Décrire
les étapes successives d’une classification hiérarchique ascendante en calculant no-
tamment les coordonnées et poids des classes obtenues par regroupement et la perte
d’inertie intraclasse à chaque regroupement.
3. En déduire le dendrogramme. Quelle coupure suggérez-vous ?
Exercice 2 : (Sujet inspiré d’un article de John Hartshorne, paru dans le journal de la “British
Ecological Society”)
Un laboratoire d’écologie étudie les espèces micro-animales (larves, ..) présentes dans les
rivières et les étangs. Il réalise, dans 6 sites de rivière, notés R1, R2, R3, R4, R5 et R6, et 3
sites d’étangs, notés E1, E2 et E3, des prélèvements répétés qui lui permettent d’avancer
une liste des espèces présentes dans chacun de ces sites et de repérer les espèces présentes
dans plusieurs sites à la fois. La matrice suivante contient, pour chaque paire de sites A et
B, le nombre d’espèces communes aux 2 sites. Ainsi on y lit par exemple que 11 espèces
sont présentes au site R1 et qu’il y a 7 espèces présentes à la fois au site R1 et au site R2.
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 11 7 4 6 6 7 4 4 3
R2 7 15 8 8 9 6 3 3 2
R3 4 8 13 7 7 4 2 3 2
R4 6 8 7 15 7 6 6 8 6
R5 6 9 7 7 12 4 3 5 4
R6 7 6 4 6 4 10 6 5 5
E1 4 3 2 6 3 6 13 10 9
E2 4 3 3 8 5 5 10 15 11
E3 3 2 2 6 4 5 9 11 12
On se propose de regrouper les 9 sites en trois ou quatre classes composées de sites où ce
sont pratiquement les mêmes espèces qui sont présentes. Pour réaliser cette classification,
on propose de mesurer la distance entre deux sites A et B par la formule
nA + nB − 2nAB
d(A, B) =
nA + n B
où nA (resp. nB ) désigne le nombre d’espèces présentes au site A (resp. au site B) et nAB
le nombre d’espèces en commun entre les sites A et B. On obtient la matrice des distances
suivante :
R1 R2 R3 R4 R5 R6 E1 E2 E3
R1 0 0, 462 0, 666 0, 538 0, 478 0, 334 0, 666 0, 692 0, 74
R2 0, 462 0 0, 428 ...... 0, 334 0, 52 0, 786 0, 8 0, 852
R3 0, 666 0, 428 ...... ...... 0, 44 0, 652 0, 846 0, 786 0, 84
R4 0, 538 0, 466 ...... 0 0, 482 0, 52 0, 572 0, 466 0, 556
R5 0, 478 0, 334 0, 44 0, 482 0 0, 636 0, 76 0, 63 0, 666
R6 0, 334 0, 52 0, 652 0, 52 0, 636 0 ..... ..... 0, 546
E1 0, 666 0, 786 0, 846 0, 572 0, 76 0, 478 ..... ..... 0, 28
E2 0, 692 0, 8 0, 786 0, 466 0, 63 0, 6 ..... ..... 0, 186
E3 0, 74 0, 852 0, 84 0, 556 0, 666 0, 546 0, 28 0, 186 0
1. Compléter les coefficients manquants de cette matrice.
8.6. EXERCICES 57
2. Préciser quels sont les deux sites les plus proches ainsi que les deux sites les plus
éloignés.
3. La classification conduit au dendrogramme représenté ci-dessous. Décrire la compo-
sition des classes de la partition qui vous semble la plus appropriée.
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8 9 7 1 6 2 5 3 4
4. Un autre choix de distance entre les sites aurait-il pu conduire à une partition
différente ? Pourquoi n’a-t-on pas choisi la distance euclidienne ?
Exercice 3 : 1. En choisissant un nuage de trois points alignés sur l’axe des x regroupés
en deux classes, calculer l’inertie totale, l’inertie intraclasse et l’inertie interclasse.
Vérifier le théorème de Huygens dans cet exemple.
2. En considérant cette fois trois points du plan non nécessairement alignés, montrer
le théorème de Huygens (on pourra utiliser le fait que leurs projections sur les deux
axes de coordonnées vérifient le théorème).
Exercice 4 : Soit Γ := {Mi = (xi , yi ), i = 1, . . . , n} un nuage de points du plan, chacun étant
pondéré d’un poids n1 .
1. Quelle formule donne les coordonnées (x, y) du centre de gravité G du nuage en
fonction de xi , yi et n ?
2. En utilisant votre calculette, vérifier sur quelques exemples de nuages la “transitivité”
du centre de gravité, c’est-à-dire le fait que pour calculer les coordonnées de G on
peut, lorsque le nuage est la réunion de deux classes Γ1 et Γ2 , calculer d’abord les
centres de gravité G1 et G2 des deux classes puis calculer le centre de gravité de G1
et G2 affectés de leurs poids respectifs.
Exercice 5 : On considère les 6 points M1 = (−2, 3), M2 = (−2, 1), M3 = (−2, −1), M4 =
(2, −1), M5 = (2, 1) et M6 = (1, 0).
1. En supposant que les deux premiers points M1 et M2 sont les centres initiaux, décrire
par une succession de dessins, l’algorithme des centres mobiles en représentant les
centres, les classes, les nouveaux centres ... jusqu’à stabilisation de l’algorithme. On
calculera au passage si nécessaire les coordonnées des centres.
2. Recommencer en choisissant différemment les centres initiaux. Obtient-on la même
classification ?
Exercice 6 : Classifier les points du nuage précédent par une classification hiérarchique as-
cendante et représenter le dendrogramme (à noter que lorsqu’on doit regrouper les deux
points les plus proches et qu’il existe deux couples de points satisfaisant cette condition,
on convient de choisir les deux points dont les numéros sont les plus petits).
Université de Nice LSV1-MAB
NOM : Prénom : Groupe :
Epreuve partielle : 10 Novembre 2006 (durée 1h30)

LSV1 : Mathématiques Appliquées à la Biologie
Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 4 points,
6 points et 6 points (barème indicatif). On soignera les explications.
Exercice 1 : On considère une population Xt modélisée par une chaı̂ne de Markov à trois états S =
{x1 , x2 , x3 } et dont la matrice de transition est :
 
0, 65 0, 3 0, 05
P= 0 0, 2 0, 8 
0 0 1
1. Quelle est, selon ce modèle, la probabilité que la population passe de l’état x2 à l’état x3 ?
P (Xt+1 = x3 /Xt = x2 ) =
2. Calculer la probabilité d’une trajectoire du type X0 = x1 , X1 = x2 , X2 = x2 , X3 = x3 en

fonction de π0 (x1 ).
3. Donner un exemple de trajectoire de probabilité nulle.
4. On a calculé le carré de la matrice P et trouvé

 
0, 4225 ......... 0, 3225
P2 =  ...... 0, 04 ...... 
0 0 1
Compléter les coefficients manquants, en expliquant comment les calculer.
1
5. Quelle est, selon ce modèle, la probabilité que la population passe de x1 à x3 en deux étapes ?
P (Xt+2 = x3 /Xt = x1 ) =
6. Pour π0 = (0, 5 0, 5 0), calculer le produit π1 = π0 · P.
Exercice 2 : L’observation du développement d’une population d’animaux au cours du temps fait ap-
paraı̂tre les trois états jeunes, adultes et décès, que nous noterons respectivement j, a et d. Parmi
les jeunes, chaque année 30% deviennent adultes et 5% décèdent et parmi les adultes seuls 20%
restent en vie après un an. Bien entendu l’état de mort subsiste avec probabilité 1 d’une année à la
suivante.
1. On modélise cette dynamique par une chaine de Markov à trois états S = {j, a, d}. Ecrire sa
matrice de transition.
2. Si l’on suppose qu’au départ la population est de taille 1000 et se compose approximativement
de 500 jeunes et de 500 adultes, combien y aura-t-il de jeunes et d’adultes respectivement après
un an, selon ce modèle ?
3. Pour les uns et pour les autres, leur nombre a diminué. Pouvez-vous l’expliquer ? Quel défaut
du modèle cela fait-il apparaı̂tre ?
2
Exercice 3 : La figure ci-dessous montre une représentation en toile d’araignée (cobweb) de la trajectoire
de la dynamique ∆Yt = 0, 8Yt (1 − Yt /15) de condition initiale Y0 = 5.
18
16
14
12
Yt+1
10
0
0 2 4 6 8 10 12 14 16 18
Yt
1. Comment appelle-t-on ce type de dynamique ? A quoi correspond la constante 0.8 ?
2. Calculer la valeur de Y1 (indiquer vos calculs)
3. Sans calcul supplémentaire, donner une valeur approchée de Y3 lue sur sa représentation.
Expliquer où l’on peut lire cette valeur.
4. Pouvez-vous deviner une valeur approchée de Y10 ? Justifier votre réponse.
3
Exercice 4 : On s’intéresse à la solution y(t) de l’équation différentielle y 0 = 50 − y de condition initiale
y(0) = 100.
1. Indiquer les coordonnées d’un vecteur tangent à cette solution en t = 0.
2. On a calculé la valeur approchée de cette solution par la méthode d’Euler en prenant le pas
h = 0, 5 et on a obtenu les valeurs suivantes :
t 0 0, 5 1 1, 5 2 2, 5
Solution approchée 100 ..... 62, 5 ...... 53, 125 51, 5625
Calculer les deux valeurs manquantes (en expliquant vos calculs).
3. Comme cette équation est linéaire à coefficients constants, on peut la résoudre par explicite-
ment. On obtient y(t) = Ce−t + A. Calculer les constantes C et A.
4. Compléter le tableau suivant (en explicitant vos calculs) :

t 0 0, 5 1 1, 5 2 2, 5
Solution exacte 100 80, 326 68, 303 61, 156 56, 767 .....
5. Avant même de calculer la valeur manquante dans le tableau précédent, on savait qu’elle était
supérieure à 50. Pourquoi ?
4
Université de Nice Identifiant :....... LSV1-MAB
Epreuve d’examen : 9 Janvier 2007 (durée 2h00)

Les quatres exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points,
4 points et 5 points (barème indicatif). On soignera les explications. Les réponses doivent être données
sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur la
copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous ferez
figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.
Exercice 1 : Une espèce d’oiseaux a une durée de vie de 3 ans. En moyenne, chaque paire d’oiseaux
produit 2 oisillons au cours de leur première année et un échantillon typique de 8 oiseaux d’un an
produit en moyenne 15 oisillons. Au dela de leur deuxième année, les oiseaux ne se reproduisent
plus. Seul 40% des oiseaux d’un an survivent une deuxième année et seuls 30% des oiseaux de deux
ans survivent une troisième année. On suppose enfin que les oiseaux de sexes male et femelle se
répartissent équitablement au sein des couvées et que le taux de survie ne dépend pas du sexe.
1. Ecrire le système dynamique linéaire modélisant l’évolution de cette population structurée en
trois classes d’une année (notées jt , pt et at ) :

 jt+1 = .........
pt+1 = ......... (1)

at+1 = .........
2. Indiquer quelle est la matrice (de Leslie) L de ce système.
3. Si l’on suppose que la population initiale comporte respectivement 200, 64 et 10 oiseaux d’un,
deux et trois ans, combien y en aura-t-il de chaque classe l’année suivante selon ce modèle ?
Combien l’année d’après ?
4. Le calcul des valeurs propres de la matrice L indique qu’elle possède λ = 3/2 pour valeur propre
dominante. Que pouvez-vous en déduire concernant l’évolution de la population d’oiseaux dans
son ensemble ?
5. Pour une population initiale totale de N (0) = 274, on a obtenu les valeurs suivantes N (1) =
419, 2, N (2) = 622, ... , N (9) = 10656, 513, N (10) = 15984, 742 et N (11) = 23977, 127. Ces
valeurs confirment-elles l’évolution attendue ?
1
Exercice 2 : On modélise la dynamique de deux populations de type proies-prédateurs, disons des lapins
L(t) et des renards R(t), par le système de Lotka-Voterra suivant :

 dL(t) = aL(t) − bR(t)L(t)

dt (2)
 dR(t) = −cR(t) + eR(t)L(t)

dt
1. Décrire la dynamique de la population de lapins en l’absence de renards (i.e. si R(t) = 0).
2. Décrire la dynamique de la population de renards en l’absence de lapins (i.e. si L(t) = 0).
3. On suppose que a = 0, 04, b = 0, 0005, c = 0, 2 et e = b ∗ 0, 1. Donner les équations des deux

isoclines horizontales et verticales.
4. Donner les coordonnées du point d’équilibre (non nul).
5. Si le nombre de lapins à l’instant initial est L(0) = 1000 et le nombre de renards R(0) = 50,
ces effectifs vont-ils respectivement augmenter ou diminuer immédiatement après cet instant ?
On pourra s’aider pour répondre d’une esquisse du champs de vecteurs associé.
Exercice 3 : Une biologiste a remarqué que sous une lumière douce, la quantité d’auxine (hormone
végétale qui favorise la croissance en longueur des plantes) produite par les plantes augmentait
avec l’intensité lumineuse à laquelle elles étaient exposées. Pour le confirmer, elle fait l’expérience
suivante : elle sélectionne des plants identiques qu’elle place dans une pièce sombre plusieurs jours.
Puis elle divise ces plants en 8 groupes de 10 plants, chaque groupe étant placé sous une source
lumineuse d’intensité différente. Après deux semaines elle mesure la quantité d’auxine dans chaque
plant et détermine la moyenne par groupe. Voici ses résultats
2
Intensité lumineuse 5 10 20 40 80 160 400 600
Moyenne d’auxine 2.2 3.1 4.5 6.4 9.2 12 20.5 23.9
1. Le tracé suivant représente le nuage de point correspondant à ces données ainsi que la droite des
moindres carrés correspondante. Pensez-vous que la quantité d’auxine produite par les plantes
augmente linéairement avec l’intensité lumineuse à laquelle elles sont exposées ? Pourquoi ?
2. On a représenté cette fois les données (ln xi , ln yi ) obtenues à partir des précédentes en prenant
le logarithme de l’intensité lumineuse et de la moyenne d’auxine. Ce nuage se prête-il mieux à
une modélisation linéaire ?
3. Quelle relation ces données suggèrent-elles entre ces deux variables initiales ? Quel accroisse-
ment d’intensité lumineuse est requis, selon ces mesures, pour doubler la quantité d’auxine ?
Exercice 4 : La succession des quatres dessins suivants correspond aux étapes successives d’une classi-
fication hierarchique ascendantes des cinq points M1 (2, 0), M2 (0, 1), M3 (0, 2), M4 (3, 4) et M5 (5, 4)
progressivement regroupées en classes de deux ou trois points dont les centres de gravité sont notés
G6 , G7 et G8 . On suppose que les cinq points initiaux sont tous affectés du poids 1. La distance
choisie pour cette classification, qui apparait dans les quatres matrices de distance, est l’écart de
Ward.
1. Compléter le troisième dessin en y plaçant les trois points devant y figurer et indiquer sur les
quatres dessins le nom des points.
2. Compléter les six distances manquantes dans les matrices de distances.
3
3. Préciser les coordonnées des points G6 , G7 et G8
4. Calculer les coordonnées du centre de gravité G9 des cinq points.
5. Tracer un dendrogramme résumant cette classification.
4
Université de Nice Identifiant :....... LSV1-MAB
Epreuve d’examen, deuxième session (durée 2h00)

Les cinq exercices peuvent être traités indépendamment et valent respectivement 6 points, 5 points, 5
points, 2 points et 2 points(barème indicatif). On soignera les explications. Les réponses doivent être
données sur cette feuille qui sera ensuite glissée en fin d’épreuve dans la copie cachetée (ne rien écrire sur
la copie elle-même). Merci de choisir un identifiant (succession de quelques chiffres ou lettres) que vous
ferez figurer à la fois ci-dessus et à la fois en haut de la copie cachetée portant votre nom.
Exercice 1 : On étudie l’évolution au cours du temps des formations végétales sur un vaste territoire
en les décomposant pour simplifier en trois catégories, lande, maquis et forêt. On modélise cette
dynamique par une chaine de Markov Xt d’espace d’états S = {l, m, f } et de matrice de transition :
 
0, 4 0, 6 0
P= 0 0, 2 0, 8 
0, 35 0 0, 65
1. Tracer le diagramme en points et flèches associé.
2. Quelle est, selon ce modèle, la probabilité que la population passe de l’état maquis à l’état
forêt ?
P (Xt+1 = f /Xt = m) =
3. Calculer la probabilité d’une trajectoire du type X0 = f, X1 = f, X2 = l, X3 = m en fonction

de π0 (f ).
4. Donner un exemple de trajectoire de probabilité nulle.
5. Quelle est, selon ce modèle, la probabilité que la population passe de l à m en deux étapes ?
P (Xt+2 = m/Xt = l) =
1
6. Connaissant la répartition initiale π0 = (0, 3 0, 4 0, 3), calculer la répartition à l’étape suivante
π1 . Des trois formations végétales, lesquelles progressent, lesquelles regressent ?
Exercice 2 : On étudie l’effectif Pt d’une population d’insectes en fonction du temps t mesuré en jours.
1. On suppose tout d’abord que les variations de cette population sont proportionnelles à son
effectif. Comment appelle-t-on cette dynamique ?
2. S’il y a 15 insectes le deuxième jour et 60 le quatrième, quel était l’effectif à l’instant initial ?
3. On suppose à présent que cette population suit un modèle logistique ∆Pt = rPt − sPt2 avec
P0 = 10, r = 0, 5 et s = 10−2 . Calculer les premiers points de sa trajectoire et décrire sa
dynamique dans ce cas.
4. Tracer une représentation en cobweb de la trajectoire correspondant à P0 = 10.
2
5. Comment varierait, selon ce modèle, la population d’oiseaux dans le cas P0 = 50 ? Même
question pour le cas P0 = 100.
Exercice 3 : On considère une population d’oiseaux dont le cycle de reproduction comporte 3 étapes,
oeufs, oisillons (juveniles) et oiseau (adultes). Si l’on désigne respectivement par ot , jt et at les
effectifs à l’instant t de ces trois classes,

 ot+1 = 6jt + 10at
jt+1 = 0, 5ot (1)

at+1 = 0, 4jt
1. Ecrire ce système sous forme matricielle et indiquer le sens des 4 coefficients 6, 10, 0, 5 et 0, 4.
2. Les formules (1) permettent, à partir des effectifs initiaux des trois classes, (o0 , j0 , a0 ), de
calculer les effectifs (o1 , j1 , a1 ) à l’instant suivant t = 1, puis, (o2 , j2 , a2 ) à l’instant t = 2 et
ainsi de suite. Si (o0 , j0 , a0 ) = (30, 50, 50), on obtient :
t 0 1 2 3 4 5 6
ot 30 ... 290 2460 2470 7960 12330
jt 50 15 400 ... 1230 1235 3980
at 50 20 ... 160 58 492 494
Compléter les valeurs manquantes du tableau puis expliquer vos calculs.
3. Si l’on désigne par Nt = ot + jt + at l’effectif total de la population à l’instant t (et donc N0

l’effectif initial), on peut également calculer à partir de (??) les termes successifs de la suite
(Nt ), ce qui permet d’apréhender aussi la dynamique de cette population dans son ensemble.
On a ici :
t 0 1 2 3 4 5 6
Nt 130 ... 696 2765 3758 .... 16804
Calculer les coefficients manquant de ce tableau puis expliquer expliquer vos calculs.
3
4. Pour avoir une idée du taux de croissance de chacune des classes, on peut calculer les quotients
ot+1 jt+1 at+1
ot , jt et at pour t = 0, 1, 2, ... mais le résultat est très irrégulier et on voit mal sur
ces premiers termes quel taux de croissance on pourrait retenir pour rendre compte de la
dynamique de ces différentes classes d’age. Et si l’on considère la population dans son ensemble,
les quotients NNt+1
t
ne sont pas plus réguliers.
t 0 1 2 3 ... 31 32 33 34 35
jt+1
jt 26, 66 0, 3625 8, 4827 1, 004 ... 2, 000 2 2 2 2
at+1
at 0, 3 26, 66 0, 3625 8, 4827 ... 1, 999 2, 000 2 2 2
pt+1
pt 0, 4 0, 3 26, 66 0, 3625 ... 2, 000 1, 999 2, 000 2 2
On constate que ces taux tendent tous vers la même valeur λ, ici λ = 2. On appelle ce coefficient
λ le taux de croissance asymptotique. Expliquer pourquoi.
5. Expliquer comment l’on peut calculer cette valeur λ.
Exercice 4 : Lorsque l’on calcule la droite de régression par la méthode des moindres carrés ordinaire,
on calcule aussi le coefficients de corrélation linéaire. De quoi s’agit-il et pourquoi le calcule-t-on ?
Exercice 5 : Qu’est-ce qu’une classification hierachique ascendante ? A quoi cela sert-il et comment
peut-on l’obtenir ?

Mathematiques Appliquées Biologie LSV1 2006-2007 S1

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Mathematiques Appliquées Biologie LSV1 2006-2007 S1

Încărcat de

Drepturi de autor:

Formate disponibile

MAB 2004-2005

Mathématiques Appliquées à la Biologie

Notes de cours et énoncés d'exercices 1 : Dynamiques aléatoires :

Partiel (novembre 2006)

MAB 2004-2005.htm[22/09/2018 01:57:20]

Dynamiques aléatoires : chaines de

1.1 La plus simple des dynamiques aléatoires

Fig. 1.1 – Diagramme en points et flèches correspondant à l’exemple de la dynamique de la

1.2 Un exemple en écologie

Mais on ne cherche pas seulement à calculer la probabilité particulière de chaque trajectoire

π1 := (P (X1 = h), P (X1 = a), P (X1 = f )) = (π1 (h), π1 (a), π1 (f )),

on remarque que π1 (h) est égal à

1.3 Puissances de P et loi stationnaire

1. Ecrire la matrice de transition.

Réponses 1. La matrice de transition est la suivante :

P (Xt+1 = E1 /Xt = E1 ) = 0, 99 + 0, 01 · 0, 25 = 0, 9925.

2. En déduire la matrice de transition P de la chaı̂ne de Markov .

Chaines de Markov : compléments

2.1 Propriétés de Markov

P (Xt+1 = xj /Xt = xi , Xt−1 = xk , Xt−2 = xl , . . .) = P (Xt+1 = xj /Xt = xi ).

2.2 Chaines de Markov irréductibles

2.3 Etats récurrents/transitoires

2.4 Exemple de dynamique évoluant vers une loi stationnaire

1. Tracer le diagramme en points et flèche. La chaı̂ne est-elle irréductible ?

et on reste en s durant la seconde. Il n’y a pas d’autres possibilités. Cela conduit au

P (X2 = s/X0 = m) = P (X2 = s/X1 = m) · P (X1 = m/X0 = m)

La probabilité cherchée se lit aussi sur la matrice P2 , c’est le coefficient de la deuxième

1. Tracer le graphe en points et flèches associé à cette chaı̂ne de Markov.

Réponses : 1. Question laissée au lecteur

convaint facilement que :

Ce système implique que p = 14 p, ce qui n’est possible que si p = 0, de même pour

Dynamiques déterministes : les

Dans cette leçon, on s’intéresse à modéliser l’évolution au cours du temps de la taille

3.1 Modèle malthusien

Yt+1 = (1 + r)Yt . (3.2)

3.2 Modèle logistique

comportements, appelés croissance logistique ou croissance amortie présentent une phase de

Fig. 3.3 – Représentation en toile d’araignée (cobweb) de la trajectoire de la dynamique logis-

3.3 Etude graphique (cobweb)

3.4 Equations aux différences (ou récurences)

Yt+1 = F (Yt ) (3.5)

Yt+1 Yt+1 Yt+1

Yt+1 = F (Yt ) étudiée ici :

3. Les 6 premières valeurs de la trajectoire issue de N0 = 2 sont 2 ; 4 ; 3 ; 3.5 ; 3.25 ; 3.375.

Lorsqu’on observe l’évolution (déterministe) d’une quantité variant au cours du temps, on

4.1 Exemple introductif

que cette dérivée, en un point t0 , est par définition égale à

4.2 Equations différentielles et champs de vecteurs

Champ de vecteurs de y’=y Champ de vecteurs de y’=18y^2

4.3 Modèles malthusiens et logistiques : le cas continu

ModŁle malthusien ModŁle de logistique

signe de r : si r > 0, la population croit exponentiellement (explosion) et si r < 0, elle disparaı̂t

qui se réécrit comme précédemment ∆Y Yt rt

modèle logistique continu :

En réalité, si l’on s’intéresse au comportement du système ainsi modélisé, l’expression de la

4.4 Equilibres et stabilité des équilibres

de la façon suivante. On appelle population d’équilibre ou état stationnaire un niveau constant

4.5 Méthode d’Euler

La méthode d’Euler est connue (programmes de 1e S et de terminale S) comme une méthode

points M0 , M1 , M2 , ... Mn .... :

2. On calcule d’une part dy d 10 10

Exercice 3 : Pour l’équation différentielle dy(t)

Exercice 4 : On s’intéresse à la solution de l’équation différentielle dy(t) 2

1. Vérifier que y(t) = y ∗ = 0 est une solution (équilibre).