Sunteți pe pagina 1din 79

M ESURES

DE LA BIODIVERSIT

Eric Marcon
05/03/2013

REMERCIEMENTS
Je remercie Franois Morneau pour sa relecture attentive de la premire version de ce document
et sa contribution dcisive pour la bonne utilisation de R dans les exemples.
Bruno Hrault et Chris Baraloto ont contribu la revue de la littrature de faon significative.

Les opinions mises par les auteurs sont personnelles et nengagent pas lUMR
EcoFoG ou ses tutelles.

MESURES DE LA BIODIVERSIT
Entropie : introduction ......................... 33

Sommaire

Dfinition de lentropie

33

Entropie relative

34

Remerciements ................................... 2

Entropie et biodiversit : historique

35

Notations ............................................. 5
Notions de diversit ............................. 7
Composantes ....................................... 7
Richesse

quitabilit

Rgularit et divergence

Niveaux de ltude ................................ 9


Diversit , et
Dcomposition

Logarithmes dforms

36

Entropie et diversit

37

Biais dchantillonnage

38

Profils de diversit

39

Indice de Hurlbert ............................... 39


Dfinition

39

Biais dchantillonnage

39

quitabilit .......................................... 40

10

Diversit et dcomposition ............. 43

SAD et SAR........................................ 10

Mesures neutres de la diversit ou


.......................................................... 13
Mesures fondes sur les relations aireespces .............................................. 13
Indice de Fisher

Entropie HCDT ................................... 36

14

Dfinitions de la diversit ................. 43

Le dbat sur la dcomposition ............ 44

Dcomposition multiplicative de la
diversit .............................................. 45
Lindice de chevauchement ......... 45

Dcomposition de lindice de Shannon 45

La relation dArrhenius

16

Le modle de Gleason

18

Biais dchantillonnage

46

Synthse

19

Tests

46

Influence de la structure spatiale

20

Taux de couverture

20

Richesse spcifique............................ 21
Techniques destimation non paramtrique
21
Infrence du nombre despces partir de
la SAD
26
Infrence du nombre despces partir de
courbes daccumulation
27
Combien y a-t-il despces diffrentes sur
Terre ?
28

Indice de Simpson .............................. 29


Dfinition

29

Biais dchantillonnage

30

Indice de Shannon.............................. 30
Dfinition

30

Biais dchantillonnage

31

Dcomposition de lentropie gnralise


........................................................... 47
Dcomposition du nombre despces . 49
Dcomposition de lindice de GiniSimpson.............................................. 50
Synthse............................................. 50
Le partitionnement de la diversit selon
Plissier et Couteron........................... 51
Cadre

51

Dcomposition

52

Diversit fonctionnelle et phylogntique


.......................................................... 53
Cadre .................................................. 53
Dissimilarit et distance

53

Distance phylogntique

54

Distance fonctionnelle

54

quivalence des deux diversits

55

Typologie des mesures

55

Biais dchantillonnage

56

FD et PD ............................................. 56
Indice de Rao ...................................... 56
Principe

56

Calcul sous R

57

Maximum thorique

57

Dcomposition

59

Alternatives

60

FAD et MFAD...................................... 60
Hp et I1................................................. 61
Mesures dentropie phylogntique ..... 61
Gnralisation de lentropie HCDT

61

Biais dchantillonnage

62

Entropie et diversit

62

Dcomposition

63

Arbres non ultramtriques

64

Rgularit ........................................... 65

Conclusion ......................................... 67
Bibliographie ...................................... 69

NOTATIONS
Les notations peuvent diffrer de celles de la
littrature cite pour lhomognit de ce
document. Souvent, la littrature cologique
nest pas trs rigoureuse sur la distinction de
ce qui est un paramtre, une variable alatoire ou son estimation. Par exemple, le
nombre dindividus chantillonns (choisi)
devrait tre not , un nombre dindividus
alatoire (rsultat dun processus stochastique) devrait tre not et son estimateur
. La confusion est frquente dans la formu
lation des mesures de diversit et leurs estimateurs. Dans la mesure du possible, des
notations plus rigoureuses que les originales
sont utilises ici.
: laire dtude, et, selon le contexte, sa
surface.

: la diversit vraie (nombre de Hill pour


les diversits et ), nombre quivalent de
communauts pour la diversit . est la
diversit mesure dans la communaut i.

() est la diversit phylogntique.

() : lesprance de la variable alatoire .

: lentropie de Tsallis (ou HCDT).


est lentropie mesure dans la communau
() est lentropie phylogntique.
t i.

: le nombre de communauts qui constituent une partition de la mta-communaut


dans le cadre de la dcomposition de la diversit. Les communauts sont indexes par
.
( ) :
linformation
apporte
par
lobservation dun vnement de probabilit
. ( , ) est le gain dinformation apport par lexprience ( est observ) par rapport aux probabilits attendues.

: le nombre (alatoire) dindividus se


trouvant dans laire dtude, estim par le
. est la mme variable
nombre observ
alatoire, mais restreinte aux individus de
lespce .

: le nombre dindividus chantillonns,


paramtre choisi dans le cadre du protocole
dchantillonnage. est le nombre
dindividus de lespce dans la communaut . Les effectifs totaux sont + (pour
lespce s), + pour la communaut et
le total gnral. Sil ny a quune communaut, le nombre dindividus par espce est
.

: la probabilit quun individu tir au hasard appartienne lespce s. Son estimateur, est la frquence observe. est la
mme probabilit dans la communaut i.

: la probabilit quune espce choisie au


hasard soit reprsente par individus,
=1 =1. Si lespce est choisie explicitement, la probabilit est note .
= {1 ; 2 ; ; ; ; } : la distribution
des probabilits .
: le nombre despces, considr comme
une variable alatoire, estim par .

: le nombre despces, considr comme


une variable alatoire, observes fois dans
lchantillonnage. Lexposant est le nombre
de fois o lespce est dtecte : par
exemple 1 ou >0. Lindice est la taille de
lchantillon : pour la surface ou
pour un chantillon de individus. 0 est le
nombre despces non rencontres dans la
surface . Pour allger les notations, sil ny
a pas dambigut, lexposant est omis pour
les espces prsentes : >0 est not . Si
lindice nest pas not, lchantillon nest
pas prcis et peut tre aussi bien un nombre
dindividus quune surface. 2 est le
nombre despces vues fois dans un
chantillon de taille , au carr.

: le nombre despces observes, avec les


mmes notations que ci-dessus. peut tre
considr comme une ralisation de .
5

12 : le quantile dune loi de Student


degrs de libert au seuil de risque , classi-

quement 1,96 pour grand et = 5%.

NOTIONS DE DIVERSIT
Le terme biodiversit concerne le plus souvent la diversit en termes despces dun
cosystme. On peut bien videmment
sintresser dautres niveaux et dautres
objets, par exemple la diversit gntique
(en termes dallles diffrents pour certains
gnes ou marqueurs) lintrieur dune population ou loppos la diversit des cosystmes. On gardera toujours lesprit que
la prise en compte de la diversit spcifique
nest pas la seule approche, mme si le texte
se sy rfre le plus souvent.
Lobjectif de ce document est de traiter la
mesure de la biodiversit, pas son importance en tant que telle. On se rfrera par
exemple Chapin et al. (2000) pour une
revue sur cette question.
Les calculs ncessaires sont raliss dans R
(R Development Core Team, 2013), essentiellement avec le package entropart
(Marcon
et
Hrault,
submitted-a).
Lensemble du code est disponible sur le site
web 1 o se trouvent les mises jour de ce
document.

Richesse
La richesse est le nombre (ou une fonction
croissante du nombre) de classes diffrentes
prsentes dans le systme tudi, par
exemple le nombre despces darbres dans
une fort.
Un certain nombre dhypothses sont assumes plus ou moins explicitement :

Les classes sont bien connues : compter le


nombre despces a peu de sens si la
taxonomie nest pas bien tablie. Cest
parfois une difficult majeure quand on
travaille sur les microorganismes.
Les classes sont quidistantes : la richesse
augmente dune unit quand on rajoute
une espce, que cette espce soit proche
des prcdentes ou extrmement originale.

Composantes
Une communaut comprenant beaucoup
despces mais avec une espce dominante
nest pas perue intuitivement comme plus
diverse quune communaut avec moins
despces, mais dont les effectifs sont
proche (Figure 1, colonne de gauche). La
prise en compte de deux composantes de la
diversit, appeles richesse et quitabilit,
est ncessaire (Whittaker, 1965).

http://www.ecofog.gf/spip.php?article427

Figure 1 : Importances de la richesse (en haut) et


de lquitabilit (en bas) pour la dfinition de la
diversit

Lindice de richesse le plus simple et le plus


utilis est tout simplement le nombre
despces ou son logarithme ln.
7

Mesures de la biodiversit

Figure 2 : Patrons de biodiversit (Gaston, 2000, figure 1). (a) Le nombre despces de vers de terre augmente en fonction de la surface chantillonne, de 100 m2 plus de 500 000 km2 selon la relation
dArrhenius (voir page 16). (b) Nombre despces doiseaux en fonction de la latitude. (c) Relation entre la
richesse rgionale et la richesse locale. (d) Nombre despces de chauves-souris en fonction de laltitude
dans une rserve au Prou. (e) Nombre despces de vgtaux ligneux en fonction des prcipitations en
Afrique du Sud.

quitabilit
La rgularit de la distribution des espces
(quitabilit en Franais, evenness ou equitability en Anglais) est un lment important
de la diversit. Une espce reprsente
abondamment ou par un seul individu
napporte pas la mme contribution
lcosystme. nombre despces gal, la
prsence despces trs dominantes entrane
mathmatiquement la raret de certaines
autres : on comprend donc assez intuitivement que le maximum de diversit sera
atteint quand les espces auront une rpartition trs rgulire.
Un indice dquitabilit est indpendant du
nombre despces (donc de la richesse).

La plupart des indices courants, comme


ceux de Simpson ou de Shannon, valuent
la fois la richesse et lquitabilit.

Rgularit et divergence
Les mesures classiques de la diversit ne
prennent pas en compte une quelconque
distance entre classes. Pourtant, deux espces du mme genre sont de toute vidence
plus proches que deux espces de familles
diffrentes. Les mesures de diversit phylogntique et de diversit fonctionnelle prennent en compte cette notion, qui ncessite
quelques
dfinitions
supplmentaires
(Mouillot et al., 2005 ; Ricotta, 2007 ;
Pavoine et Bonsall, 2011).

Notions de diversit

La mesure de la diffrence entre deux


classes est souvent une distance, mais parfois une mesure qui na pas toutes les proprits dune distance : une dissimilarit
(voir Dissimilarit et distance, page 53).
Les mesures de divergence sont construites
partir de la dissimilarit entre les classes,
avec ou sans pondration par la frquence.
Les mesures de rgularit dcrivent la faon
dont les espces occupent lespace des
niches. Ce concept est quivalent celui
dquitabilit dans les mesures classiques.

Niveaux de ltude

Figure 3 : Diversit , value par la richesse spcifique. Lhabitat B possde la plus grande richesse (figure issue de Morin et Findlay, 2001).

La diversit est classiquement estime


plusieurs niveaux embots, nomms , et
par Whittaker (1960, p. 320), qui a nomm
la diversit locale quil mesurait avec
lindice de Fisher (voir page 14) et a utilis les lettres suivantes selon ses besoins.

Diversit , et

La diversit est la diversit locale, mesure lintrieur dun systme dlimit. Plus
prcisment, il sagit de la diversit dans un
habitat uniforme de taille fixe.
De faon gnrale (Gaston, 2000), la richesse spcifique diminue avec la latitude
(la diversit est plus grande dans les zones
tropicales, et au sein de celles-ci, quand on
se rapproche de lquateur), voir Figure 2.
La richesse diminue avec laltitude. Elle est
gnralement plus faible sur les les, o elle
dcrot avec la distance au continent, source
de migrations.

Figure 4 : Diversit , value par le nombre


despces nouvelles rencontres dans chaque nouvel habitat (figure issue de Morin et Findlay,
2001).

La diversit est le taux de remplacement


des espces le long dun gradient (topographique ou dhabitats par exemple).
Enfin, la diversit est similaire la diversit , prise en compte sur lensemble du
systme tudi. Les diversits et se mesurent donc de la mme faon.

100
50

lnNs

30

10

10

20

Nb Espces

40

500

50

Mesures de la biodiversit

lnNs

Figure 5 : Histogramme des frquences (diagramme de


Preston) des arbres du dispositif de Barro Colorado
Island (Hubbell et al., 2005). En abscisse, le nombre
darbres de chaque espce (en logarithme), en ordonne,
le nombre despces.

Dcomposition
Whittaker (1977) a propos sans succs une
normalisation des chelles dvaluation de la
biodiversit, en introduisant la diversit rgionale ( tant rserv au paysage et
lhabitat) et la diversit entre les paysages.
Seuls les trois niveaux originaux ont t
conservs par la littrature, sans dfinition
stricte des chelles dobservation.
La distinction entre les diversits et dpend de la finesse de la dfinition de
lhabitat. La distinction de nombreux habitats diminue la diversit au profit de la .
Il est donc important de dfinir une mesure
qui ne dpende pas de ce dcoupage, donc
une mesure additive (ou multiplicative) dcrivant la diversit totale, dcomposable en
la somme (ou le produit) convenablement
pondre de toutes les diversits des habitats (diversit intra) et de la diversit interhabitat.

Nous appellerons communaut le niveau de


dcoupage concernant la diversit et mta10

50

100

150

200

Rang

Figure 6 : Diagramme rang-abondance (diagramme


de Whittaker) correspondant au diagramme de Preston de la Figure 5. Les points sont les donnes, la
courbe est lajustement dune distribution lognormale.

communaut le niveau de regroupement


pour lestimation de la diversit .

SAD et SAR
La courbe aire-espces (SAR : Species Area
Relationship)
reprsente
le
nombre
despces observes en fonction de la surface chantillonne (exemple : Figure 10,
page 16). Elle est la base de certaines mesures de diversit.
La SAR est parfois remplace par une
courbe nombre dindividus-espces (Figure
8, page 15) quand leffort dchantillonnage
est mesur de cette faon.
La distribution de labondance des espces
(SAD) est la loi qui donne labondance attendue de chaque espce dune communaut. Les espces ne sont pas identifies individuellement, mais par le nombre
dindividus leur appartenant. Elle peut tre
reprsente sous la forme dun histogramme

Notions de diversit

des frquences (diagramme de Preston, Figure 5 2) ou bien dun diagramme rangabondance (RAC : Rank Abundance Curve,)
ou diagramme de Whittaker, Figure 6 3. Le
RAC est souvent utilis pour reconnatre des
distributions connues. Izsk et Pavoine
(2012) ont tudi les proprits des RAC
pour les principales SAD.
Les SAD ne sont pas traites en dtail ici :
on se reportera Magurran (1988), McGill
et al. (2007) et Izsk et Pavoine (2012). Les
SAD ncessaires la comprhension de la
suite sont :

La distribution en log-sries de Fisher


(1943)
La distribution log-normale (Preston,
1948),
le modle Broken Stick de MacArthur
(1957).

Le code R ncessaire pour raliser les figures est:


> library(vegan)
> data(BCI)
> Ns <- sort(colSums(BCI), decr =
TRUE)
> N <- sum(Ns)
> hist(log(Ns), main = NULL , xlab
= expression(ln(N[s])), ylab="Nb
Espces")

Code complmentaire pour le diagramme de Whittaker :


> S=length(Ns)
> plot(Ns, type = "b", log = "y",
main = NULL, xlab = "Rang", ylab =
expression(ln(N[s])))
> ranks.lognormal <- S*(1pnorm(log(Ns), mean(log(Ns)),
sd(log(Ns))))
> lines(ranks.lognormal, Ns,
col="red", lwd=3)

11

MESURES NEUTRES DE LA DIVERSIT OU


Les mesures classiques considrent que
chaque classe dobjets est diffrente de
toutes les autres, sans que certaines soient
plus ou moins semblables. Dans ce chapitre,
les classes seront des espces. Les mesures
sont qualifies de neutres au sens o elle ne
prennent en compte aucune caractristique
propre des espces.
Les mesures prsentes ici sont les plus utilises : dans un premier temps, celles fondes sur les relations aire-espces, dont
lindice de Fisher, puis les trois mesures
dentropie (richesse, Shannon, Simpson).
Ces dernires sont sujettes des biais
dchantillonnage (Mouillot et Leprtre,
1999) : la correction de ces biais est traite
en dtail.

nest pas la solution adapte, puisquon rencontre toujours de nouvelles espces (Gotelli
et Colwell, 2001), mme en chantillonnant
des surfaces considrables (50 hectares pour
la Figure 12, au-del du million de km2 pour
la Figure 10, page 16). Dans le cas gnral,
la SAR ne tend pas vers une asymptote, et
nombre despces augmente tant que la surface chantillonne crot (Williamson et al.,
2001). Il ne sagit donc pas destimer un
nombre despce asymptotique pour une
communaut, mais un nombre dpendant de
la surface dchantillonnage. Une revue sur
la faon dobtenir une SAR est fournie par
Scheiner (2003).

Lentropie HCDT permet dunifier ces mesures et les nombres de Hill de leur donner
un sens intuitif.

Mesures fondes sur les


relations aire-espces
En fort tempre, toutes les espces dun
habitat sont rencontres sur une surface infrieure lhectare. Laire minimale est la
surface ncessaire chantillonner pour
caractriser une association vgtale, dans
lapproche est de la phytosociologie fonde
par Braun-Blanquet (1928) : elle ne contient
pas toutes les espces mais un sousensemble caractristique. Elle est de lordre
de 200 m2 en Europe (Chytr et Otpkov,
2003).
En fort tropicale, il existe de nombreuses
espces rares, au sens o la probabilit de ne
pas les rencontrer loccasion dun chantillonnage dune certaine taille nest pas ngligeable.
Lexprience
montre
que
laugmentation de laire dchantillonnage

Figure 7 : Courbes daccumulation et de rarfaction, obtenues par inventaires individuels ou


groups ( samples ). Les courbes de rarfaction
permettent de lisser les courbes daccumulation.
Les courbes obtenues par inventaire group sont
en gnral en dessous des courbes individuelles
cause de lagrgation spatiale (Gotelli et Colwell,
2001, Fig. 1).

Gotelli et Colwell (2001) proposent une revue des problmes les plus communment
rencontrs dans lestimation et la comparaison de la richesse spcifique. Ils suggrent
notamment de calculer la courbe de rarfaction (Figure 7) plutt que dutiliser la courbe
daccumulation obtenue en traant simplement le nombre despces dcouvert en
fonction de leffort dchantillonnage. La
courbe de rarfaction est obtenue en souschantillonnant dans linventaire complet
des effectifs de toutes tailles et en calculant
13

Mesures de la biodiversit

le nombre moyen despces trouv pour


chacun, ce qui permet de lisser la courbe.
Lorsque linventaire est fait par quadrats ou
toute autre mthode qui regroupe les individus (piges insectes, filets de pche), les
courbes montrent moins despces pour le
mme effort dchantillonnage cause de
lagrgation spatiale des espces, problme
trait plus loin.
Il sagit dans un premier temps de mesurer
la diversit , lintrieur du mme habitat,
et non daugmenter la surface chantillonne
le long dun gradient dhabitats (diversit
). Le problme est donc bien la prise en
compte des espces rares. Deux cas sont
traits largement dans la littrature : lindice
de Fisher pour une SAD en log-sries et la
relation dArrhenius (loi de puissance) pour
une SAD log-normale.

Indice de Fisher

Fisher (Fisher et al., 1943) a reli le nombre


despces au nombre dindividus
chantillonns partir du modle suivant :

tant donn la taille de lchantillon et


la probabilit dchantillonner lespce
, lesprance du nombre dindividus
chantillonns dans lespce est .
Le nombre dindividus rellement observ
fluctue alatoirement. Il suit une loi de
Poisson desprance , distribution
bien connue selon Fisher, dmontre
par Pielou (1969, pages 204-205). Cest
une
consquence
directe
de
lindpendance entre les chantillons.
Les probabilits suivent toutes la mme
loi. La densit de probabilit de est
note (), o = permet dallger
lcriture.
La probabilit dobserver individus
dune espce donne est donc la moyenne
sur toutes les valeurs possibles de de la
+

loi de Poisson : = 0

()

La distribution de retenue par Fisher est


une loi gamma, ce qui implique que suit
une loi binomiale ngative de paramtre .
14

On notera que la distribution de nest


pas celle de . La courbe reprsentant en
fonction de son rang nest pas un vrai diagramme rang-abondance, mais un pseudoRAC (Izsk et Pavoine, 2012) et la distribution de est une pseudo-SAD.

En appliquant son modle des donnes,


Fisher remarque que 0, ce qui correspond une distribution comprenant de nombreuses espces et un pseudo-RAC dcroissant rapidement, et retient cette proprit
pour la suite de son raisonnement. Dans ce
cas, et aprs calcul, le nombre despces
chantillonnes pour individus est calculable (pour suffisamment grand) et ne dpend que dun paramtre estim partir
des donnes.
Le modle est donc applicable pour un
grand nombre dobservations et un grand
nombre despces, dont les individus sont
distribus indpendamment. Alors :

= ln(1 + )

(1)

est un indicateur de la biodiversit qui


peut tre interprt comme le nombre
despces nouvelles dcouvertes quand le
nombre dindividus chantillonns est multipli par : cest en effet la pente de la
courbe de en fonction de ln, qui se stabilise partir dune valeur de suffisante.
Kempton (Kempton et Taylor, 1976 ;
Kempton et Wedderburn, 1978) a montr
quil tait identique sa statistique .

Si le nombre dindividus est proportionnel


la surface (saturation de Hubbell, 2001), la
relation de lquation (1) est quivalente
une courbe aire-espces (SAR).
est aussi gal , le nombre fondamental
de la biodiversit de Hubbel (2001) quand le
nombre despces est grand (Alonso et
McKane, 2004) : la SAD de la mtacommunaut (pas celle de la communaut
locale si la dispersion est limite) du modle
neutre est en log-sries.
Dans R, la librairie untb (Hankin, 2007)
contient la fonction fishers.alpha. La fonction fisher.alpha de la librairie vegan

Mesures neutres de la diversit ou

Figure 8 : Courbes nombre dindividus-espces- simules pour illustrer limportance des paramtres
(concentration spatiale) et (nombre total despces) dans le modle de Fisher.
est fix 100 pour toutes les courbes. (a) et (b) : la concentration spatiale ( < ) change drastiquement
le nombre despces attendu. En pratique, seuls S et N ( et dans nos notations) sont observs. Si est
suppos gal 1 par erreur, est sous-estim. (a) et (c) : le nombre despces nest videmment pas infini,
ce qui change fortement la forme de la courbe. Si le nombre dobservations est grand, sera aussi trs
sous-estim. (in Schulte et al., 2005)

(Oksanen et al., 2012) estime selon


Kempton et Taylor (1974)
> library(vegan)
> data(BCI)
> # Ns est un vecteur contenant les
effectifs de chaque espce.
> Ns <- colSums(BCI)
> fisher.alpha(Ns)
[1] 35.05476
> library(untb)
> fishers.alpha(sum(Ns),length(Ns))
[1] 35.05477

Schulte et al. (2005) ont tendu le modle de


Fisher pour prendre en compte un nombre
despces fini et une distribution non
indpendante des individus, prise en compte
par un paramtre dagrgation spatiale c
valable pour toutes les espces.
=

1 +
ln

1 + ()

(2)

o =

1 ( )

Si = et = 1, lquation (2) se
simplifie pour retrouver lquation (1).

Leurs rsultats (Figure 8) montrent que la


non prise en compte de ces deux paramtres
aboutit une sous-estimation systmatique
de , diffrente selon les sites, ce qui invalide les comparaisons inter-sites.

Appliqu des donnes relles (Figure 9), le


modle de Fisher tendu sajuste forcment
mieux (il possde trois paramtres au lieu
dun).
Lapproximation
du
nombre
despces infini parat tre la plus pnalisante parce quelle exclut linflexion de la
courbe pour les grandes valeurs de , mme
si ces valeurs sont rarement atteinte dans les
faits ( 10 > 20 000).
15

Mesures de la biodiversit

Enfin, lindice de Fisher repose lourdement


sur lhypothse que la distribution relle des
espces est conforme au modle. Jost (2007)
montre par un exemple que des interprtations absurdes de lindice peuvent tre faites
si lhypothse nest pas respecte.

La relation dArrhenius
Arrhenius (1921) a tabli le modle de base,
dit loi de puissance :
=

(3)

est la surface, est le nombre despces


dans , et des paramtres.

Preston (1962) a montr que si la SAD est


log-normale, la SAR suit une loi de puissance, et a tabli que la puissance valait
environ 0,25 ( partir de donnes empiriques, pas par ncessit thorique). Les rsultats empiriques ultrieurs (May, 1975 ;
May et Stumpf, 2000) ont fourni des valeurs
gnralement comprises entre 0,2 et 0,3.
Une large mta-analyse conduite par Drakare et al. (2006) partir de 794 SAR
dorigine trs diffrentes fournit une
moyenne de 0,27, comme la mta-analyse
de la Figure 10, mais avec une certaine variabilit que les auteurs relient lchelle
spatiale, au type dorganismes et aux habitats chantillonns, mais aussi la technique
dchantillonnage.

Figure 9 : Comparaison entre le modle de Fisher


et le modle tendu dans trois parcelles forestires
connues. Les modles sont ajusts aux donnes
observes par Condit et al. (1996). Les courbes
lgendes Equation 4 correspondent au modle de
Fisher tendu, quation (2), alors que lEquation 5
est le modle intermdiaire, supposant le nombre
total despces infini. (in Schulte et al., 2005)

16

Figure 10 : Logarithme du nombre despces en


fonction du logarithme de la surface chantillonne (Williamson et al., 2001, fig. 1). Les donnes
sont des relevs despces natives sur 104 sites de
taille variable travers le monde. Les symboles
correspondent divers types dhabitats (les ou
continent, rserves ou non) sans intrt ici. La
valeur de est 0,27. Donnes de Lonsdale (1999).

Le paramtre le plus variable de la loi de


puissance reste donc , un facteur dchelle
dpendant de la richesse de lhabitat.

Mesures neutres de la diversit ou

Figure 11 : Les cinq dispositifs de Plotkin et al. (2000). Chaque dispositif mesure 50 ha et toutes les tiges de
diamtre suprieur 1 cm sont cartographies et dtermines.

Reprsente en logarithmes, la relation est


une droite (Figure 10) :
ln = ln + ln

(4)

Plotkin et al. (2000) ont eu accs de


grands chantillons (5 placettes de 50 hectares dans lensemble du monde tropical,
Figure 11, toutes dtermines correctement
sur le plan botanique et dans lesquels chaque
arbre est positionn). Ils montrent que le
modle log-normal rend mal compte de la
ralit (Figure 12a) pour les petites surfaces.
Harte et al. (1999) ont montr que la loi de
puissance tait quivalente au modle
dautosimilarit, driv de la thorie des
fractales. On considre un rectangle dont
le rapport longueur sur largeur vaut 2. On
obtient le rectangle +1 en plaant deux
rectangles cte cte (et donc le rectangle 1 en coupant en deux). est
le nombre despces rencontres dans .
On dfinit enfin = 1 le facteur de
diminution du nombre despces (dit paramtre de persistance) li la division par 2
de la taille du rectangle.

Figure 12 : Courbes aire-espces (a) et Paramtre


de persistance en fonction de la surface (b) dans 5
forts tropicales (Plotkin et al., 2000). La loi lognormale est reprsente par le trapze sur la figure a, pour une gamme de valeurs de la constante. Elle implique que la relation aire-espces
reprsente en logarithmes soit une droite, ce qui
nest visiblement pas le cas.

Sil sagit dune constante, , indpendante


de la taille du rectangle, lhabitat est dit
auto-similaire : laugmentation du nombre
despces ne dpend pas de lchelle
17

Mesures de la biodiversit

dobservation Si cette condition est respecte, le nombre despces suit la loi de puissance, et = 2 . Pour la valeur classique
de = 0,25, = 0,84. La Figure 12b prsente la valeur de en fonction de la surface chantillonne. Elle augmente avec la
surface, ce qui infirme le modle
dautosimilarit.
Plotkin et al. (2000) ne supposent pas
constant et lui imposent simplement dtre
une fonction de la surface, choisie arbitrairement pour permettre les calculs ultrieurs,
et dont la forme correspond aux observations de la Figure 12b. Aprs calculs, la relation aire-espces est () . ()
est un polynme de degr de , sans constante. Les monmes sont dautant moins
importants que leur degr est lev.
Lapproximation de degr 0 est la loi de
puissance. Celle de degr 1 est retenue par
les auteurs pour estimer le nombre despces
rencontres sur la surface :
=

(5)

Ce modle contient un paramtre k en plus

de la loi de puissance. Les auteurs ont tabli


que les paramtres et taient trs proches
pour les cinq forts ( = 0.125 et =
0.0541 Pasoh), et que leur estimation sur
une fort permettait de prdire avec une trs
bonne prcision la richesse des autres, partir dun chantillon dun hectare ncessaire
pour obtenir le paramtre . La Figure 13
compare les performances de cette mthode
(persistence method), de la loi de puissance
0,25 (loi log-normale) et du modle de Fisher.

Le modle de Gleason
Gleason (1922) rfute le travail dArrhenius
(1921) partir de largument selon lequel le
nombre despces doit se stabiliser quand la
surface augmente, au risque de prvoir une
richesse beaucoup trop leve pour de
grandes surfaces. Les travaux ultrieurs lui
donneront tort (Williamson et al., 2001).
Gleason propose une relation dans laquelle
le nombre despces (et non son logarithme)
crot avec le logarithme de la surface :

Figure 13 : Performance du modle de Plotkin et al. (2000) face au modle log-normal. Les autres SAD concurrentes sont le modle alpha de Fisher et le modle Broken Stick de MacArthur. La courbe reprsente le
nombre despces rencontres Pasoh sur des surfaces de 0 50 ha. Les donnes observes sont des tirages
alatoires dchantillons de la surface souhaite. Lcart-type est reprsent (lintervalle de fluctuation 95%
est de lordre de 2 cart-types). Les valeurs issues du modle ont t obtenues par un paramtrage de et sur
25ha, suppos valide galement sur les autres forts. Le paramtrage de c est obtenu par un chantillon dun
hectare, rpt 1000 fois pour obtenir un intervalle de confiance. Lintervalle de fluctuation 95% est ici encore de lordre de deux cart-types.

18

Mesures neutres de la diversit ou

= ln + ln

(6)

Williams (1964) reprend ce modle et affirme sa validit partir darguments sur la


variabilit de lhabitat quand la surface
dchantillonnage augmente (par opposition
la relation dArrhenius applicable dans un
habitat homogne, et due la distribution
log-normale des espces). Connor et McCoy
(1979) discutent de la faon de tester les
deux hypothses mais ne disposent pas des
donnes pour le faire.
Le modle de Fisher (1) peut tre crit sous
la forme = ln( + ) ln(). Pour
assez grand et sous lhypothse de saturation de Hubbell, est proportionnel +
et le modle de Fisher est quivalent au modle de Gleason.
Bordenave (Bordenave et De Granville,
1998 ; Bordenave et al., 2011) propose un
indice de richesse spcifique (IRS, ou SDI :
Species Diversity Index) gal la pente de la
relation de Gleason. Dans le cadre de
lapproximation prcdente, il est gal .

chelles, ni la forme de la relation aux


chelles extrmes.
Hubbell (2001, chapitre 6) tablit que le
modle de Fisher est pertinent lchelle de
la mta-communaut et donc de la communaut locale en absence de limitation de la
dispersion (si le taux de migration m vaut 1,
la communaut locale est un chantillon de
la mta-communaut). Dans ce cas, la SAR
a la forme de la courbe de la Figure 14, zone
A, et lindice de Fisher est le bon outil de
mesure. Mais la dispersion est limite, et la
distribution de la communaut locale est
plus complique. McGill (2003) montre
quune SAD log-normale sajuste mieux aux
donnes que le modle neutre selon les rsultats de Hubbel. Volkov et al. (2003) tablissent la SAD neutre de faon analytique
qui sajuste mieux aux donnes que le modle log-normal, mais la traduction en SAR
nest pas faite.

Synthse

La relation dArrhenius est plus robuste que


celle de Gleason, selon les rsultats empiriques et des considrations thoriques
(Grcia Martn et Goldenfeld, 2006), y
compris de thermodynamique (Wrtz et
Annila, 2008). Empiriquement, il est difficile destimer lequel des modles est le plus
adapt aux donnes : sur 35 jeux de donnes, Connor et McCoy (1979) montrent que
les rgressions de ou ln en fonction de
ou ln ont des performances similaires en
terme de qualit dajustement (R2), mais
Triantis et al. (2012) valident largement le
modle dArrhenius pour des SAR insulaires.
Preston (1960) argumente en faveur du modle dArrhenius (et en dfaveur de celui de
Gleason) aux chelles intermdiaires et
montre que la courbe aire-espces est triphasique (Figure 14). Ce rsultat fait maintenant
consensus mais pas la dlimitation des trois

Figure 14 : Relation aire-espce triphasique


(figure in Grilli et al., 2012). Zone B : relation
dArrhenius.

Le meilleur modle lchelle locale est


donc celui de Plotkin et al. (2000), qui rfute la fois Gleason et Arrhenius. La SAR
est concave sur une chelle log-log (Figure
12 a). Lutilisation de lindice de Fisher
est donc sujette caution. Sa valeur calcule
plus haut pour BCI est 35, trs diffrente de
la valeur de du modle neutre pour les
mmes donnes (entre 47 et 50, Volkov et
al., 2003, figure 1)
Lchelle plus grande (zone B de la Figure
14) est pour Hubbel un assemblage dun
19

Mesures de la biodiversit

certain nombre de communauts composant


la mtacommunaut (page 186). La SAR
obtenue par simulation suit la loi de puissance dArrhenius. Grilli et al. (2012) dveloppent un modle de SAR valable toutes
les chelles. Ses hypothses sont peu ralistes dans la zone A, mais il valide la loi de
puissance analytiquement lchelle intermdiaire.
La relation dArrhenius est donc systmatiquement valide lchelle rgionale
(Figure 10). On remarquera que la distribution de Fisher, valide par Hubbel pour la
mta-communaut, nest jamais observe
dans la SAR cause de lagrgation spatiale :
en
augmentant
la
surface
dchantillonnage, de nouvelles communauts sont ajoutes progressivement, mais
lchantillonnage de toute la mtacommunaut nest jamais ralis (sauf au
point marquant le passage de la zone B la
zone C).
Enfin, quand lchelle est encore plus
grande, le nombre despces augmente
nouveau plus vite parce que dautres mtacommunauts sont intgres.

Influence de la structure
spatiale
Les modles classiques de courbes aireespces supposent un tirage indpendant des
individus. Sur le terrain, par exemple en
fort, lchantillonnage est continu : sil
existe une structure spatiale comme des
agrgats, la probabilit que larbre suivant
soit dune espce donne dpend de ses voisins, donc de larbre prcdent. Intuitivement, on comprend bien que le nouvel
arbre de la mme espce apporte moins
dinformation, ce qui revient surestimer la
taille de lchantillon ou sous-estimer la
richesse pour une taille dchantillon fixe.
Plotkin et al. (2000) traitent un problme un
peu diffrent : connaissant le nombre total
despces dans les dispositifs de la Figure
11, ils tracent la courbe aire-espces thorique issue du modle de Coleman (1981)
qui considre simplement que la probabilit
20

de ne pas rencontrer une espce suit une loi


binomiale, les tirages tant indpendants. Ce
modle surestime largement la diversit
pour les petites surfaces : la probabilit de
ne pas rencontrer une espce agrgative est
sous-estime. Le biais diminue quand la
surface dchantillonnage augmente, parce
que la taille relative des agrgats diminue.
Les effets de lagrgation peuvent donc tre
opposs selon la question pose. Dans tous
les cas, il suffit de considrer quun agrgat
surestime le nombre darbres de son espce
qui devrait tre pris en compte dans le cadre
dun modle tirages indpendants.
Plotkin et al. (2000) proposent une mthode
permettant de prendre en compte la structure
spatiale pour fournir des modles de courbes
aire-espces fiables, dans un cadre particulier o le nombre total despces et leur
structure spatiale sont connus. La mthode
ncessite une carte des individus. Le semis
de point est considr comme le rsultat
dun processus de Neyman-Scott (1958) :
des centres dagrgats sont tirs de faon
compltement alatoire et les individus sont
rpartis autour des centres selon une loi
normale en deux dimensions. Les paramtres du processus sont estims partir du
semis de points, puis la courbe aire-espces
est obtenue par simulation du processus.
Malheureusement, aucune mthode gnrale
permettant de prendre en compte la structure
spatiale nest disponible.

Taux de couverture
Good (1953) dfinit le taux de couverture de
lchantillonnage (sample coverage) comme
la proportion des espces dcouvertes
= =1 ( > 0) o est la fonction
indicatrice.

Le taux de couverture augmente avec


leffort dchantillonnage. Plus il est lev,
meilleures seront les estimations de la diversit. Pour comparer deux communauts par
des courbes de rarfaction, Chao et Jost
(2012) montrent que le taux de couverture
plutt que la taille de lchantillon doit tre

identique. Les estimateurs de la diversit


dvelopps plus loin reposent largement sur
cette notion pour la correction du biais
dchantillonnage (la sous-estimation systmatique de la diversit due aux espces
non observes).
Lestimateur du taux de couverture, que
Good attribue Turing, est :
1

= 1

(7)

Un meilleur estimateur (son erreur quadratique moyenne est plus faible) est utilis
dans SPADE. Il prend en compte les singletons ( 1 : le nombre despces observes
une seule fois) et les doubletons ( 2 : le
nombre despces observes deux fois) :
1
( 1) 1

= 1

( 1) 1 + 2 2

(8)

Les deux estimateurs sont quasiment identiques ds que est grand.

Chao et al. (1988) puis Zhang et Huang


(2007) proposent lestimateur suivant :

= (1)+1

=1

(9)

Les termes de la somme dcroissent trs vite


avec . En se limitant = 1, lestimateur
se rduit celui de Good, et une approximation de celui de SPADE en se limitant
2.
Le package entropart fournit la fonction
Coverage.N, qui calcule les trois estimateurs
(celui de Zhang et Huang par dfaut) :
> library(entropart)
> # Chargement du jeu de donnes
> data(Paracou618)
> Coverage.N(Paracou618.MC$Ns)
[1] 0.9226675

Esty (1983) complt par Zhang et Zhang


(2009) a montr que lestimateur tait
asymptotiquement normal et a calcul
lintervalle de confiance de :
1
1 1 + 2 2

= 1
2

(10)

O 12 est le quantile dune loi de Student degrs de liberts au seuil de risque

Mesures neutres de la diversit ou

, classiquement 1,96 pour grand et


= 5%.

Richesse spcifique
Lapproche utilise ici est trs diffrente de
la prcdente. On suppose que la communaut locale est de taille fixe et contient
donc un nombre fixe despces, alors que
lapproche par la SAR ne fait pas
dhypothse sur les limites de la communaut et fournit un nombre despces dpendant
de la surface.
On ne fait pas de supposition sur la forme de
la SAD quand on utilise des mthodes
destimation non paramtriques. Les estimateurs les plus connus sont ceux de Chao
(1984 pour Chao1) et le jackknife (Burnham
et Overton, 1979).
Une alternative consiste infrer partir des
donnes les paramtres dune SAD choisie,
et particulirement le nombre total
despces. Cette approche est bien moins
rpandue parce quelle suppose le bon choix
du modle et est beaucoup plus intensive en
calcul.

Techniques destimation
non paramtrique
Dans le cadre dun chantillonnage de
individus, on observe 1 espces diffrentes parmi les existantes. Chaque individu a une probabilit dappartenir
lespce .

On ne sait rien sur la loi des . On sait seulement, comme les individus sont tirs indpendamment les uns des autres, que le
nombre dindividus de lespce observ
dans lchantillon suit une loi binomiale
dont lesprance est . La loi a une forme
en cloche assez prononce qui fait que la
probabilit de rencontrer individus dune
espce est maximum pour = , reste
assez grande quand varie de 1 et devient
21

Mesures de la biodiversit

rapidement trs faible quand sloigne de


(Figure 15).
1

0,9
0,8

1 =
1

1
+ 2
2

(11)

est le nombre despces diffrentes observ, le nombre despces observes


fois. Lchantillon peut tre une surface ou
un nombre dindividus.

0,7
Npi=0,1

P(ni)=r

0,6

Npi=0,5

0,5

Npi=1,0
Npi=2,0

0,4

Npi=5,0
0,3

Si aucune espce nest observe deux fois,


lestimateur est remplac par 1 =
1
+ 1( 1 1)2 (Chao, 2004).

La variance de lestimateur est connue, mais


pas sa distribution :

0,2
0,1
0
0

10

Figure 15 : Densit de probabilit de la loi de binomiale, pour diffrentes espces plus ou moins
rares (valeurs de ). En abscisse, le nombre
dobservations dans lchantillon, en ordonne la
probabilit.

Pour les espces frquentes, est grand,


et les espces sont observes systmatiquement (Figure 15 : pour = 5, la probabilit de ne pas rencontrer lespce est de
lordre de 1%). La difficult est due aux
espces pour lesquelles , lesprance du
nombre dobservations, est petit. La probabilit de les observer est donne par la loi de
binomiale : si est proche de 0, la probabilit dobserver un individu est faible
(Figure 15 : pour = 0,1, la probabilit
de rencontrer lespce une fois est de lordre
de 10%, et pratiquement nulle pour des observations multiples).
Les estimateurs non paramtriques cherchent tirer le maximum dinformation de
la distribution des abondances pour estimer le nombre despces non observes.

Chao1 et Chao2
Chao (1984) estime le nombre despces
non observes partir de celles observes 1
ou 2 fois. Il sagit dun estimateur minimum,
valide condition que les singletons et doubletons reprsentent une part importante de
linformation. Lestimateur est

22

1
1 1

Var1 = 2 2 + 2
2

(12)

1 1
+ 2
4

Si aucune espce nest observe deux fois :


1

Var1 =

1 1 12 1 1
+
2
4
4
1
+ 1
4

(13)

Eren et al. (2012) calculent lintervalle de


confiance 95% :
1

1 1

O :

+ 1 1

Var(1 )

1
2 1+
2
1 1

(14)

(15)

Cet intervalle de confiance est plus petit


quand la valeur maximum thorique du
nombre despces est connue, ce qui est rarement le cas en cologie. Sa formule est
donne en quation 8 de Eren et al. (2012).
Chao (1987) utilise une mthode diffrente
pour obtenir un estimateur du nombre minimum despces tenant compte du nombre
dindividus chantillonns :

2 =

( 1)( 1s)2
2 2s

(16)

Si aucune espce nest observe deux fois,


lestimateur est remplac par 2 =
1

(1) 1 11
2

Mesures neutres de la diversit ou

Lestimateur ACE
Chao et Lee (1992) dveloppent lestimateur
ACE (Abundance-based coverage estimator) travers lestimation du taux de couverture . Lestimateur ACE utilise toutes les
valeurs de correspondant aux espces
rares : concrtement, la valeur limite de
note est fixe arbitrairement, gnralement 10.
Lestimateur prend en compte le coefficient
de variation de la distribution des frquences
( ) : plus les probabilits sont htrognes,
plus le nombre despces non observes sera
grand. Finalement :
=
>

>

(17)

est le nombre despces dites abondantes, observes plus de fois, le


nombre despces dites rares, observes
fois ou moins. est le taux de couverture ne prenant en compte que les espces
rares.
Lestimateur du coefficient de variation est :
2

= max

=1 ( 1)
(=1 )(=1

1; 0

1)

Lorsque lhtrognit est trs forte, un


autre estimateur est plus performant :
2

2
= max
1

1 =1 ( 1)
; 0
(=1 1)

Chao et Shen (2010) conseillent dutiliser le


2
deuxime estimateur ds que
dpasse
0,8. Lestimateur ACE donne normalement
une valeur plus grande que Chao1. Si ce
nest pas le cas, la limite des espces rares
doit tre augmente.

Lestimateur jackknife
La mthode jackknife a pour objectif de
rduire le biais dun estimateur en considrant des jeux de donnes dans lesquels on a
supprim un certain nombre dobservations
(ce nombre est lordre de la mthode).

Burnham et Overton (1979) ont utilis cette


technique pour obtenir des estimateurs du
nombre despces, appels jackknife
lordre , prenant en compte les valeurs de

1
. Les estimateurs du premier et du
deuxime ordre sont les plus utiliss en pratique :
( 1) 1s

(2 3) 1s ( 2)2 2s
1

2 = s +

( 1)
1 =

1
s

(18)

Augmenter lordre du jackknife diminue le


biais mais augmente la variance de
lestimateur.
Chao (1984) a montr que les estimateurs
jackknife pouvaient tre retrouvs par approximation de lindice Chao1.

Calcul
Ces estimateurs peuvent tre calculs de
faon relativement simple laide du logiciel SPADE (Chao et Shen, 2010) disponible sur internet 4 . Le guide de lutilisateur
prsente quelques estimateurs supplmentaires et des directives pour choisir. Il est
conseill dutiliser Chao1 pour une estimation minimale, et ACE pour une estimation
non biaise de la richesse.
Les intervalles de confiance de chaque estimateur sont calculs par bootstrap : mme
quand la variance dun estimateur est connue, sa loi ne lest gnralement pas, et le
calcul analytique de lintervalle de confiance
nest pas possible.
Les estimateurs et leurs intervalles de confiance peuvent galement tre calculs sous
R. Le package vegan dispose pour cela de
deux fonctions specpool() et estimateR().
specpool() est bas sur les incidences des
espces dans un ensemble de sites
dobservation et donne une estimation
unique de la richesse selon les mthodes
Chao2, jackknife (ordre 1 et 2) et bootstrap
(non dtaille ici). Lcart-type de
lestimateur est galement fourni par la
fonction, sauf pour le jackknife dordre 2.
4

http://chao.stat.nthu.edu.tw/softwareCE.html

23

Mesures de la biodiversit

estimateR() est bas sur les abondances des


espces et retourne un estimateur de la richesse spcifique par site et non global
comme specpool.
Exemple :
On utilise les donnes de Barro Colorado
Island (BCI). La parcelle a t divise en
carrs de 1ha. Le tableau dentre est un
dataframe contenant, pour chaque espce
darbres (DBH 10 cm), ses effectifs par
carr.

$Nhat
[1] 244
$SE
[1] 6.164414
$CI
lb ub
[1,] 232 256
> # Vrification, quation (18) :
> sum(DistNs)+DistNs[1]*(sum(BCI)1)/sum(BCI)
1
243.9991

On charge le tableau de donnes :


> library(vegan)
> data(BCI)

On utilise la fonction estimateR pour calculer la richesse des 2 premiers carrs :


> estimateR(BCI[1:2,])
1
2
S.obs
93.000000 84.000000
S.chao1 117.473684 117.214286
se.chao1 12.578970 17.841763
S.ACE
122.848959 117.317307
se.ACE
5.736054
5.571998

Le package SPECIES (Wang, 2011) permet


de calculer les estimateurs jackknife dordre
suprieur 2 et surtout choisit lordre qui
fournit le meilleur compromis entre biais et
variance.
Comparaison des fonctions sur lensemble
du dispositif BCI ( 1 = 225, 1 = 19) :
> specpool(BCI)
Species jack1
jack1.se
All
225 236.6053 6.659395
> # librairie SPECIES
> library(SPECIES)
> # Distribution du nombre
d'espces (vecteur:
> # noms = nombre d'individus
> # valeurs = nombres d'espces
ayant ce nombre d'individus)
> Ns <- colSums(BCI)
> DistNs <- tapply(Ns, Ns, length)
> # Mise au format requis (matrice:
> # colonne 1 = nombre d'individus
> # colonne 2 = nombres d'espces
ayant ce nombre d'individus)
> DistNs.SPECIES <matrix(c(as.integer(names(DistNs)),
DistNs), ncol=2)
> jackknife(DistNs.SPECIES)
$JackknifeOrder
[1] 1

24

La valeur du jackknife 1 fournie par specpool() est fausse. La fonction jackknife() de


SPECIES donne le bon rsultat, avec un
intervalle de confiance calcul en supposant
que la distribution est normale (1,96 carttype au seuil de 95%).

Estimation partir de placettes


distantes
Krishnamani et al. (2004) dveloppent une
mthode permettant lextrapolation de la
richesse mesure sur de petites surfaces (48
placettes de 0,25 ha) de trs grandes zones
(60 000 km, la taille des Western Ghats en
Indes).
Partant de la relation dArrhenius (1921)
vue prcdemment, le nombre despces
dans une surface 1 est
1

= (1 0 ) 0

(19)

c'est--dire le nombre despces dans la surface 0 plus petite multiplie par le rapport
des surfaces la puissance . La valeur de
est constante pour des variations de surface
limites. Lide est donc de procder par
tapes, en partant du nombre despces mesur sur les petites placettes, et extrapolant
vers une surface plus grande. Cette surface
est ensuite prise pour rfrence pour une
nouvelle extrapolation avec une nouvelle
valeur de . En indiant les surfaces de 0
, on obtient :

(20

= ( 1 )1 (1 2 )2 (1 0 ) 0 )

Il reste valuer les diffrentes valeurs de .


lintrieur de chaque placette, lquation
(19) est suffisante. A plus grande distance,
les auteurs utilisent lindice de Srensen,
c'est--dire deux fois la fraction despces
communes entre deux placettes : =
2 1 2 1 + 2. Lindice dpend
principalement de la surface des placettes
et de leur loignement . Pour certaines
plages de distances [ , ] vrifiant
2

1 (placettes loignes), est


proportionnel ( 2 ) . La valeur de
peut donc tre calcule en comptant le
nombre despces communes entre chaque
paire de placettes, et ajustant ln ln( 2 )
sur des plages de distances convenables
pour que reste constant, et donc que la
relation soit linaire.
Cette mthode permet lextrapolation de
trs grandes surfaces de mesures de richesse
faites sur de petites placettes condition
quelles soient assez nombreuses et loignes les unes des autres.

Choix de lestimateur
Des tests pousss ont t mens par Brose et
al. (2003) pour permettre le choix du meilleur estimateur de la richesse en fonction de
la compltude de lchantillonnage 1.
Les auteurs appellent cette proportion couverture (coverage). Le terme completeness a
t propos par Beck et Schwanghart (2010)
pour viter la confusion avec le taux de couverture dfini par Good (vu page 23). La
compltude est infrieure la couverture :
toutes les espces sont le mme poids alors
que les espces manquantes sont plus rares
et pnalisent moins le taux de couverture.
Dans tous les cas, les estimateurs jackknife
sont les meilleurs. Larbre de dcision est en
Figure 16. Le choix dpend principalement
de la compltude (coverage sur la figure).
Une premire estimation est ncessaire par
plusieurs estimateurs. Si les rsultats sont
cohrents, choisir un estimateur jackknife
dordre dautant plus faible que la compltude est grande. Au-del de 96%, le nombre
despce observ est plus performant parce
que les jackknifes surestiment . Sils sont

Mesures neutres de la diversit ou

incohrents (intervalle des estimations suprieur 50% de leur moyenne), le critre majeur est lquitabilit (voir page 39). Si elle
est faible (de lordre de 0,5-0,6), les estimateurs jackknife 2 4 sont performants,
lordre
diminuant
avec
lintensit
dchantillonnage (forte : 10%, faible : 0,5%
de la communaut). Pour une forte quitabilit (0,8-0,9), on prfrera jackknife 1 ou 2.

Figure 16 : Arbre de dcision du meilleur estimateur du nombre despces, in Brose et al. (2003).

Exemple de BCI : le nombre despces estim par jackknife 1 est 244. La compltude
est 225244 = 92%, dans le domaine de
validit du jackknife 1 (74% 96%) qui est
donc le bon estimateur.

Prdiction de la richesse dun


nouvel chantillon
dLa prdiction du nombre despces
couvert dans une nouvelle placette dun habitat dans lequel on a dj chantillonn est
une question importante, par exemple pour
valuer le nombre despces prserves dans
le cadre dune mise en rserve, ou valuer le
nombre despces perdues en rduisant la
surface dune fort.

25

Mesures de la biodiversit

> Sprime <- function(Nprime)


NonObs*(1-(1-(1-C)/NonObs)^Nprime)
> curve(Sprime, 1, 10000)

4
2

3
0

Infrence du nombre
despces partir de la SAD
10000

Distribution de Preston

Figure 17 : Nombres de nouvelles espces dcouvertes en fonction de leffort dchantillonnage


supplmentaire (donnes de BCI). Seulement 7
nouvelles espces seront observes en chantillonnant 10000 arbres supplmentaires (environ 25 ha
en plus des 50 ha de la parcelle qui contiennent
225 espces).

Shen et al. (2003) proposent un estimateur


et le confrontent avec succs des estimateurs antrieurs. On note 0 lestimateur du
nombre despces non observes dans le
premier chantillon, et lestimateur de son
taux de couverture. Lestimateur du nombre
despces du nouvel chantillon de individus est :

= 0 1 1 1

peut tre obtenu par Chao1 ( 0 =

(21)
1

2 2

Preston (1948) fournit ds lintroduction de


son modle log-normal une technique
destimation du nombre total despces par
la clbre mthode des octaves. Elle est disponible dans le package vegan :
> library(vegan)
> data(BCI)
> veiledspec(colSums(BCI))
Extrapolated Observed
Veiled
235.40577 225.0000
10.40577

Lajustement direct du modle aux donnes,


sans regroupement par octaves, est galement possible :
> mod.ll <prestondistr(colSums(BCI))
> veiledspec(mod.ll)
Extrapolated
Observed
Veiled
230.931018 225.000000 5.931018
> plot(mod.ll)

)
35

8000

> # Espces non observes


> (NonObs <jackknife(DistNs.SPECIES)$Nhatlength(Ns))
[1] 19
> # Taux de couverture
> (C <- Coverage.N(Ns))
1
0.9991146
> # Nouvelles espces en fonction
du nombre de nouveaux individus

26

25
Species

Exemple de BCI, suite du code de la page


23 : combien de nouvelles espces seront
dcouvertes en chantillonnant plus ?

30

ou ACE, ou un autre estimateur : dans tous


les cas 0 = 1.

20

6000
x

15

4000

10

2000

Sprime(x)

Le taux de couverture de linventaire de BCI


est trs proche de 100%, donc peu de nouvelles espces seront dcouvertes en augmentant leffort dchantillonnage. La
courbe obtenue est en Figure 17.

16

32

64

Frequency

128 256

512

2048

Maximum de vraisemblance
dune distribution de Fisher
Norris et Pollock (1998) supposent que la
distribution des espces suit le modle de
Fisher (voir page 14) et infrent le nombre
despces par maximum de vraisemblance
non paramtrique (ils ne cherchent pas
infrer les paramtres de la loi de probabilit
de mais seulement ajuster au mieux le
modle de Poisson aux valeurs de observes).
Le calcul est possible avec la librairie
SPECIES de R :
> library(SPECIES)
> # Distribution du nombre
d'espces (vecteur:
> # noms = nombre d'individus
> # valeurs = nombres d'espces
ayant ce nombre d'individus)
> Ns <- colSums(BCI)
> DistNs <- tapply(Ns, Ns, length)
> # Mise au format requis (matrice:
> # colonne 1 = nombre d'individus
> # colonne 2 = nombres d'espces
ayant ce nombre d'individus)
> DistNs.SPECIES <matrix(c(as.integer(names(DistNs)),
DistNs), ncol=2)
> # Regroupement de la queue de
distribution : la longueur du
vecteur est limite 25 pour
allger les calculs.
> DistNs.SPECIES[25, 2] <sum(DistNs.SPECIES[25:dim(DistNs.SP
ECIES)[1],2])
> DistNs.SPECIES <DistNs.SPECIES[1:25,]
> unpmle(DistNs.SPECIES)
MLE= 239

Le problme de cette mthode destimation


est quelle diverge frquemment. Les calculs
naboutissent pas si la queue de distribution
nest pas regroupe (il existe 108 valeurs
diffrentes de dans lexemple de BCI :
aucune des fonctions de SPECIES ne fonctionne en ltat).
Wang et al. (2005) ont amlior sa stabilit
en pnalisant le calcul de la vraisemblance :

Mesures neutres de la diversit ou

suivent une loi gamma et en estimant aussi


ses paramtres. La souplesse de la loi gamma permet dajuster le modle des lois
diverses et lestimateur de Wang est trs
performant.
Il est disponible dans SPECIES : fonction
pcg. Son dfaut est quil ncessite un trs
long temps de calcul (plusieurs heures selon
les donnes).
> # Calcul long (15 minutes)
> pcg(DistNs.SPECIES)
MLE= 236
Selected alpha model: Inf

Infrence du nombre
despces partir de
courbes daccumulation
Cette approche consiste extrapoler la
courbe aire-espces, en contradiction avec
les modles prsents plus haut (Fisher, Arrhenius) qui prvoient que le nombre
despces augmente indfiniment.
Le modle le plus connu est celui de Michaelis-Menten (Michaelis et Menten, 1913)
propos par Clench (1979). En fonction de
leffort dchantillonnage , valu en
temps (il sagit de la collecte de papillons),
le nombre despces dcouvert augmente
jusqu une asymptote gale au nombre
despces total :

(22)

est une constante, que Clench relie la


difficult de collecte.

Sobern M. et Llorente B. (1993) dveloppent un cadre thorique plus vaste qui permet dajuster la courbe daccumulation
plusieurs modles.
Ces modles sont efficaces empiriquement
mais manquent de support thorique pour
justifier leur forme.

> pnpmle(DistNs.SPECIES)
MLE= 239

Enfin, Wang (2010) perfectionne la technique destimation en supposant que les

27

Mesures de la biodiversit

Lestimation empirique du modle de Michaelis-Menten peut tre faite avec R 5. Les


50 carrs de BCI sont utiliss pour fabriquer
une courbe daccumulation :

1
1
1
= +

(23)

Le nombre despce est estim par linverse


de lordonne lorigine du modle.
>
>
>
>
>

y <- 1/nEspeces
x <- 1/nArbres
plot(y ~ x)
lm1 <- lm(y ~ x)
abline(lm1$coef)

220

> data(BCI)
> # Cumul du nombre darbres
> nArbres <- cumsum(rowSums(BCI))
> # Cumul de linventaire
> Cumul <- apply(BCI, 2, cumsum)
> # Nombre despces cumules
> nEspeces <- apply(Cumul, 1,
function(x) length(x[x>0]))
> plot(nArbres, nEspeces)

Pour calculer lintervalle de confiance, il est


plus simple de passer par une transformation
linaire du modle (Lineweaver et Burk,
1934) :

160

> (S <- 1/lm1$coef[1])


(Intercept)
217.002
> 1/confint(lm1)[1,]
2.5 %
97.5 %
223.0217 211.2987

100

120

140

nEspeces

180

200

On voit assez clairement que le modle


sajuste mal quand il est reprsent sous
cette forme.

5000

10000

15000

20000

nArbres

Le modle est ajust par nlsfit. Des valeurs


de dpart doivent tre fournies pour et .
est la valeur de correspondant

= 2. 4 est une approximation suffisante. Pour , le nombre total despces


inventories est un bon choix.
> Ajustement du modle
> (nlsfit <- nls(nEspeces ~ S *
nArbres/(K + nArbres), data =
list(nArbres, nEspeces), start =
list(K = max(nArbres)/4, S =
max(nEspeces))))
K
S
1251.0 232.8
> # Courbe ajuste
> x <- seq(from=0, to=max(nArbres),
length=255)
> lines(x = x, y = predict(nlsfit,
newdata = list(nArbres = x)))

Fiche TD de J.R. Lobry : http://pbil.univlyon1.fr/R/pdf/tdr47.pdf

28

Le nombre despce estim est infrieur au


nombre observ, qui ne se trouve mme pas
dans lintervalle de confiance 95%. Le
modle de Michaelis-Menten ne convient
pas.

Combien y a-t-il despces


diffrentes sur Terre ?
La question de lestimation du nombre total
despces gnre une abondante littrature.
Mora et al. (2011, tableau 1) en font une
revue et proposent une mthode nouvelle.
Dans chaque rgne, le nombre de taxons de
niveaux suprieurs (phylums, classes,
ordres, familles et mme genres) est estim
par des modles prolongeant jusqu leur
asymptote les valeurs connues en fonction
du temps. Cette mthode est applicable
jusquau niveau du genre (Figure 18, A E).
Le nombre de taxon de chaque niveau est li
celui du niveau prcdent, ce qui est reprsent par la Figure 18, G sous la forme du
relation linaire entre le logarithme du logarithme du nombre de taxons et le rang (1
pour phylums, 5 pour genres). La droite est

prolonge jusquau rang 6 pour obtenir le


nombre despces. Une faon alternative de
dcrire la mthode est de dire que le nombre
de taxons du niveau + 1 est gal celui du
niveau la puissance . La pente de la
droite de la figure est ln. Aucune justification de ce rsultat majeur nest donne par
les auteurs, si ce nest leur vrification empirique.

Mesures neutres de la diversit ou

Indice de Simpson
Dfinition

On note la probabilit quun individu tir


au hasard appartienne lespce . Lindice
de Simpson (1949), ou Gini-Simpson, est :

= 1 2

(24)

=1

Figure 18 : volution du nombre de taxons connus


en fonction du temps et valeur estime du nombre
total (ligne horizontale grise, A E). Le nombre
despces connues est trop faible pour utiliser
cette mthode (F). Il est obtenu par extrapolation
de la relation du nombre de taxons dun niveau
celui du niveau suprieur (G). In Mora et al.
(2011), fig. 1, Animalia seulement.

Le nombre total despces estim est 8,7


millions, tous rgnes confondus, dans la
fourchette des estimations prcdentes (de 3
100 millions), et ncessitant prs de 500
ans dinventaires au rythme actuel des dcouvertes (May, 2011).

Il peut tre interprt comme la probabilit


que deux individus tirs au hasard soient
despces diffrentes. Il est compris dans
lintervalle [0; 1[. Sa valeur diminue avec la
rgularit de la distribution : = 0 si une
seule espce a une probabilit de 1, = 1
1 si les espces ont la mme probabilit
= 1 . La valeur 1 est atteinte pour un
nombre infini despces, de probabilits
nulles.
Il est parfois interprt comme un indice
dquitabilit (Morin et Findlay, 2001 par
exemple), mais le nombre despces intervient clairement dans sa valeur : pour une
rgularit identique, lindice augmente avec
le nombre despces.
Deux autres formes de lindice sont utilises. Tout dabord, la probabilit que deux
individus soient de la mme espce, souvent
appele indice de concentration de Simp-

Tableau 1 : Nombre despces actuellement inventories et nombre estim par Mora et al. (2011, tableau 2).

29

Mesures de la biodiversit

son :

= 2

(25)

=1

Enfin, une forme dite rciproque , plus


rare :
=

(26)

est en ralit la mesure dquitabilit


fonde sur lindice de Simpson, not 2
(voir page 40). La nomenclature est assez
confuse pour toutes les formes de lindice, il
est prudent de vrifier que la formule de
calcul correspond bien au nom annonc.
Lestimateur du maximum de vraisemblance
de lindice est :
1

= 1 2

(27)

=1

Le calcul de lindice de Simpson peut se


faire avec la fonction diversity syntaxe :
diversity(x, index = "simpson") disponible
en chargeant la librairie vegan de R ou avec
la fonction Simpson.P de la librairie entropart :
> library(vegan)
> data(BCI)
> Ps <- colSums(BCI)/sum(BCI)
> Simpson.P(Ps)
[1] 0.9736755

Lestimateur est lgrement biais parce


que toutes les espces nont pas t chantillonnes. Un estimateur non biais est (Good,
1953 ; Lande, 1996) :

=
1 2
1
=1

Indice de Shannon
Dfinition
Lindice de Shannon (Shannon, 1948 ;
Shannon et Weaver, 1963), aussi appel
indice de Shannon-Weaver ou ShannonWiener, est driv de la thorie de
linformation.

= ln

(29)

=1

Considrons une placette forestire contenant espces vgtales diffrentes. La probabilit quune plante choisie au hasard appartienne lespce est note . On prlve plantes, et on enregistre la liste ordonne des espces des plantes. Si est
suffisamment grand, le nombre de plantes de
lespce est . On note le nombre de
listes respectant ces conditions :
!
=1( )!

(30)

Dmonstration :
Le nombre de positions possibles dans la
liste pour les individus de la premire es
pce est
. Le nombre de positions
1

(28)

La correction par ( 1) tend rapidement vers 1 quand la taille de lchantillon


augmente : lestimateur est trs peu biais.

30

> Simpson.N(colSums(BCI))
[1] 0.9737209

Biais dchantillonnage

La fonction Simpson.N de entropart accepte


comme argument un vecteur dabondances
(et non de probabilits) et propose par dfaut
la correction de Lande

1
pour la deuxime espce est
. Pour
2
me
la s
espce,
le nombre est
1 1

Les produits de combinaisons se simplifient pour donner lquation (30).

On peut maintenant crire le logarithme de


: ln = ln ! =1 ln . On utilise
lapproximation de Stirling, ln ! ln
, pour obtenir aprs simplifications :

ln = ln

(31)

=1

Il est possible dobtenir des listes de plantes


ne respectant pas les probabilits individuelles, mais comme on suppose assez
grand, leur probabilit doccurrence est
faible (loi des grands nombres) et elles peuvent tre ngliges.
= ln est l'indice de Shannon. Ce rsultat est connu sous le nom de formule de
Brillouin (1962). lorigine, Shannon a
utilis un logarithme de base 2 pour que
soit le nombre moyen de questions binaires
(rponse oui ou non) ncessaire pour identifier lespce dune plante (un caractre utilis dans une chane dans le contexte du travail de Shannon). Les logarithmes naturels,
de base 2 ou 10 ont t utiliss par la suite
(Pielou, 1966a).
La formule (31) est celle de lindice de Theil
(1967), prsent en dtail par Conceio et
Ferreira (2000), lorigine utilis pour mesurer les ingalits de revenu puis pour caractriser les structures spatiales en conomie. Lindice est proportionnel au nombre
de plantes choisies, on peut donc le diviser
par n et on obtient lindice de biodiversit de
Shannon. Ces indices ont t dfinis en
choisissant des lettres au hasard pour former
des chanes de caractres. Leur valeur est le
nombre de chanes de caractres diffrentes
que lon peut obtenir avec lensemble des
lettres disponibles, c'est--dire la quantit
dinformation contenue dans lensemble des
lettres. Lindice de Shannon donne une mesure de la biodiversit en tant que quantit
dinformation.
Lestimateur du maximum de vraisemblance
de lindice est :
1

= ln

=1

(32)

Mesures neutres de la diversit ou

Le calcul de lindice de Shannon peut se


faire avec la fonction diversity syntaxe :
diversity(x, index = "shannon") disponible
en chargeant la librairie vegan de R ou avec
la fonction Shanon.P de la librairie entropart :
> Ps <- colSums(BCI)/sum(BCI)
> Shannon.P(Ps)
[1] 4.270409

Bulmer (1974) tablit une relation entre


lindice de Shannon et lindice de Fisher,
condition que la distribution de
labondance des espces soit log-normale :
= ( + 1) (1)

(33)

est
() est la fonction digamma, et
lestimateur de lindice de Fisher (voir page
14) :
> digamma(fisher.alpha
(colSums(BCI))+1)-digamma(1)
[1] 4.148323

La sous-estimation est assez svre sur cet


exemple.

Biais dchantillonnage
Basharin (1959) a montr que lestimateur
de lindice de Shannon tait biais parce que
des espces ne sont pas chantillonnes. Si
est le nombre despces rel et le nombre
dindividus chantillonns, le biais est :
=

1
+ (2 )
2

(34)

(2 ) est un terme ngligeable. La valeur


estime partir des donnes est donc trop
faible, dautant plus que le nombre
despces total est grand mais dautant
moins que lchantillonnage est important.
Comme le nombre despces nest pas
observable, le biais rel est inconnu. Chao et
Shen (2003) tablissent un estimateur non
biais partir du taux de couverture de
lchantillonnage :
31

Mesures de la biodiversit

ln
=

1 1

(35)

=1

Multiplier les frquences observes par le


taux de couverture permet dobtenir un estimateur non biais des probabilits prenant
en compte les espces non observes.
Le terme au dnominateur est la correction
de Horvitz et Thompson (1952) : chaque
terme de la somme est divis par la probabilit dobserver au moins une fois lespce
correspondante. Il tend vers 1 quand la taille
de lchantillon augmente.

destimation. La fonction logarithme fournit


un exemple simple : lesprance de ln( )
nest pas le logarithme de lesprance de
parce que la fonction ln est concave. Chaque
estimateur fluctue autour de mais vaut
en moyenne. cause de la concavit,
ln( ) est en moyenne infrieur ln( ) :
cette relation est connue sous le nom
dingalit de Jensen (1906). Lindice de
Shannon est concave (Figure 19) donc son
estimateur (32) est biais ngativement,
mme sans prendre en considration les espces non observes.

-x * log(x)

0.1

La fonction Shannon.N de entropart accepte


comme argument un vecteur dabondances
(et non de probabilits) et permet la correction de Chao et Shen.

0.3

Beck et Schwanghart (2010) montrent que la


correction du biais est efficace, mme des
niveaux de compltude de lchantillonnage
(voir page 25) trs faibles.

0.2

0.0

> Shannon.N(colSums(BCI),
Correction = "ChaoShen")
[1] 4.275285

Pielou (1966b) a dvelopp une autre mthode de correction de biais lorsque de nombreux relevs de petite taille sont disponibles. ln est calcul pour un relev choisi
alatoirement puis les donnes du premier
relev sont ajoutes celles dun autre, puis
un autre jusqu ce que = ln
naugmente plus : la diversit augmente
dans un premier temps mais se stabilise
quand leffet des espces ajoutes est compens par celui de la diminution de
lquitabilit due aux espces prsentes dans
tous les relevs. partir de ce seuil,
laugmentation de ln par individu ajout
est calcule pour chaque relev supplmentaire. Son esprance, estime par sa
moyenne calcule en ajoutant tous les rele.
vs disponibles, est
Enfin, la littrature de physique statistique
sest abondamment intresse cette question (Bonachela et al., 2008 en fait une
revue). Le problme trait est la nonlinarit de lindice de Shannon par rapport
aux probabilits qui entraine un biais
32

0.0

0.2

0.4

0.6

0.8

1.0

Figure 19 : courbe 6 de entre 0 et 1.

Le biais peut tre valu par simulation 7 :


10000 tirages sont raliss dans une loi
normale desprance choisie et dcarttype 0.01. Le biais est la diffrence entre
6

Code R :
> curve(-x*log(x), 0.0001, 1)

Code R :
> Biais.p <- function (p) {
+
Ps <- rnorm(10000, p, 0.01)
+
p*log(p)-mean(Ps*log(Ps))
+ }
> Biais <- function (Ps) {
+
# Applique Biais.p chaque
valeur de Ps
+
sapply(Ps, Biais.p)
+ }
> curve(Biais, 0.05, .95)
> abline(h=0, lty=2)

La fonction Shannon.N permet toutes ces


corrections :
> # Grassberger 1988
> Shannon.N(colSums(BCI),
Correction = "Grassberger")
[1] 4.276599
> Shannon.N(colSums(BCI),
Correction = "Grassberger2003")
[1] 4.276491
> Shannon.N(colSums(BCI),
Correction = "Schurmann")
[1] 4.276094

-0.0006

-0.0004

Le biais destimation diminue avec mais


lerreur quadratique augmente. Schrmann
suggre dutiliser = 12 comme meilleur compromis.

Entropie : introduction

-0.0010

-0.0008

Biais(x)

-0.0002

0.0000

ln (connu) et la moyenne des 1000


valeurs de ln (la probabilit est estime par sa ralisation chaque tirage). La
valeur du biais en fonction de est en Figure 20. Le biais de lindice de Shannon est
la somme des biais pour toutes les probabilits spcifiques de la communaut tudie, et
son calcul est toujours lobjet de recherches.

Mesures neutres de la diversit ou

-0.0012

Dfinition de lentropie
0.2

0.4

0.6

0.8


entre 0 et 1.
Figure 20 : biais de

Grassberger (1988) a fourni la correction de


rfrence :
1

=1

(1)

ln() ( )

+ 1

(36)

( ) est la fonction digamma.

Grassberger (2003) la perfectionne :


1

= () ( )

=1

(37)

1 1

(1)

0 1+

Enfin, Schrmann (2004) la gnralise


pour dfinir une famille de corrections dpendant dun paramtre :
1

=1

() ( )

(1)

1
1 1

1+

(38)

Les textes fondateurs sont Davis (1941) et


surtout Theil (1967) en conomtrie, et
Shannon (1948 ; 1963) pour la mesure de la
diversit. Une revue est fournie par
Maasoumi (1993).
Considrons une exprience dont les rsultats possibles sont {1 , 2 , , }. La probabilit
dobtenir

est
,
et
= {1 ; 2 ; ; }. Les probabilits sont
connues a priori. Tout ce qui suit est vrai
aussi pour des valeurs de continues, dont
on connatrait la densit de probabilit.

On considre maintenant un chantillon de


valeurs de . La prsence de dans
lchantillon est peu tonnante si est
grande : elle apporte peu dinformation supplmentaire par rapport la simple connaissance des probabilits. En revanche, si est
petite, la prsence de est surprenante. On
dfinit donc une fonction dinformation,
( ), dcroissante quand la probabilit
augmente, de (0) = + (ou ventuellement une valeur strictement positive finie)
(1) = 0. Chaque valeur observe dans
lchantillon apporte une certaine quantit
dinformation, dont la somme est
linformation de lchantillon.
33

Mesures de la biodiversit

I(p)

10

Entropie relative

0.0

0.2

0.4

0.6

0.8

1.0

Figure 21 : Fonctions dinformation utilises dans


le nombre despces (trait plein), lindice de
Shannon (pointills longs) et lindice de Simpson
(pointills). Linformation apporte par
lobservation despces rares dcrot du nombre
despces lindice de Simpson.

La quantit dinformation attendue de


lexprience est =1 ( ) = (). Si
on choisit ( ) = ln( ), () est
lindice de Shannon, mais bien dautres
formes de ( ) sont possibles. () est
appele entropie. Cest une mesure de
lincertitude (de la volatilit) du rsultat de
lexprience. Si le rsultat est certain (une
seule valeur vaut 1), lentropie est nulle.
Lentropie est maximale quand les rsultats
sont quiprobables.
Si est la distribution des probabilit des
espces dans une communaut, Patil et
Taillie (1982) montrent que :

Si ( ) =

, alors () est le nombre

despces moins 1,
Si ( ) = ln( ), alors () est
lindice de Shannon,
Si ( ) = 1 , alors () est lindice
de Simpson.

Ces trois fonctions dinformation sont reprsentes en Figure 21 8.

Le code R ncessaire pour raliser la figure est:

34

Considrons maintenant les probabilits


formant lensemble obtenues par la ralisation de lexprience. Elles sont diffrentes
des probabilits , par exemple parce que
lexprience ne sest pas droule exactement comme prvu. On dfinit le gain
dinformation ( , ) comme la quantit
dinformation supplmentaire fournie par
lobservation dun rsultat de lexprience,
connaissant les probabilits a priori. La
quantit totale dinformation fournie par
lexprience, =1 ( , ) = (, ),
est souvent appele entropie relative. Elle
peut tre vue comme une distance entre la
distribution a priori et la distribution a posteriori. Il est possible que les distributions
et soit identiques, que le gain
dinformation soit donc nul, mais les estimateurs empiriques ntant pas exactement
gaux entre eux, des tests de significativit
(, ) seront ncessaires.
de la valeur de

Quelques formes possibles de (, )


sont :

La divergence de Kullback-Leibler
(Kullback et Leibler, 1951) connue par les
conomistes comme lindice de dissimilarit de Theil (1967) :

= ln

=1

(39)

Sa proche parente, appele parfois deuxime mesure de Theil (Conceio et


Ferreira, 2000, p. 34), qui inverse simplement les rles de et :

= ln
=1

(40)

> curve((1-x)/x, 0, 1, lty=1,


xlab="p", ylab="I(p)",
ylim=c(0,10))
> curve(-log(x), 0, 1, lty=2,
add=TRUE)
> curve(1-x, 0, 1, lty=3, add=TRUE)

Lentropie gnralise (Maasoumi, 1993),


dordre :

1

(, ) =
1
( + 1)

(41)

Mesures neutres de la diversit ou

Il montre que respecte les 3 axiomes.

Patil et Taillie (1982) ont montr de plus


que :

=1

On peut montrer que = 0 et = 1 .

Lentropie relative est essentielle pour la


dfinition de la diversit prsente dans le
chapitre suivant. En se limitant la diversit
, on peut remarquer que lindice de Shannon est la divergence de Kullback-Leibler
entre
la
distribution
observe
et
lquiprobabilit des espces (Marcon et al.,
2012).

Entropie et biodiversit :
historique

Les premiers travaux consistant gnraliser lindice de Shannon sont dus Rnyi
(1961). Lentropie dordre de Rnyi est :

(42)

=1

Rnyi pose galement les axiomes pour une


mesure dentropie (), o =
{1 ; 2 ; ; } :

Hill (1973) transforme lentropie de Rnyi


en nombres de Hill , qui en sont
simplement lexponentielle :

MacArthur (1955) est le premier avoir


introduit la thorie de linformation en cologie (Ulanowicz, 2001). MacArthur
sintressait aux rseaux trophiques et
cherchait mesurer leur stabilit : lindice
de Shannon qui comptabilise le nombre de
relations possibles lui paraissait une bonne
faon de lvaluer. Mais lefficacit implique la spcialisation, ignore dans qui
est une mesure neutre (toutes les espces y
jouent le mme rle). MacArthur a
abandonn cette voie.

=
ln
1

La symtrie : les espces doivent tre


interchangeables, aucune na de rle
particulier et leur ordre est indiffrent,
La mesure doit tre continue par rapport
aux probabilits,
La valeur maximale est atteinte si toutes
les probabilits sont gales.

Lintroduction dune espce dans une


communaut augmente sa diversit (consquence de la dcroissance de ( )),
Le remplacement dun individu dune
espce frquente par un individu dune
espce plus rare augmente lentropie
condition que () soit concave. Dans la
littrature conomique sur les ingalits,
cette proprit est connue sous le nom de
Pigou-Dalton (Dalton, 1920).

=
=1

1
1

(43)

Le souci de Hill est de rendre les indices de


diversit intelligibles aprs larticle remarqu de Hurlbert (1971) intitul le nonconcept de diversit spcifique . Hurlbert
reprochait la littrature sur la diversit sa
trop grande abstraction et son loignement
des ralits biologiques, notamment en
fournissant des exemples dans lesquels
lordre des communauts nest pas le mme
selon lindice de diversit choisi. Les
nombres de Hill sont le nombre despces
quiprobables donnant la mme valeur de
diversit que la distribution observe. Ils
sont des transformations simples des indices
classiques :

est le nombre despces,


= , lexponentielle de lindice de
Shannon,
2
= 1(1 ), linverse de lindice de
concentration de Simpson.
1

Ces rsultats avaient dj t obtenus avec


une autre approche par MacArthur (1965) et
repris par Adelman (1969) dans la littrature
conomique.
Tsallis (1988) propose une classe de mesures appele entropie gnralise, dfinie
par Havrda et Charvt (1967) pour la premire fois et redcouverte plusieurs fois,
35

Mesures de la biodiversit

notamment par Darczy (1970), do son


nom entropie HCDT (voir Mendes et al.,
2008, page 451 pour un historique complet) :

=
1
1

(44)

-4
lnq(p)
-8

Le nombre despces moins 1 est 0 ,


Lindice de Shannon est 1 ,
Lindice de Gini-Simpson est 2 .

-10

-2

=1

Tsallis a montr que les indices de Simpson


et de Shannon taient des cas particuliers
dentropie gnralise. Ces rsultats ont t
complts par dautres et repris en cologie
par Keylock (2005) et Jost (2006; 2007). L
encore :

(46)

-6

= [1 + (1 )]1

0.0

0.2

0.4

0.6

0.8

1.0

Entropie HCDT
Lentropie HCDT est particulirement attractive parce que sa relation avec la diversit au sens strict est simple, aprs introduction du formalisme adapt (les logarithmes
dforms). Son biais destimation peut tre
corrig globalement, et non seulement pour
les cas particuliers (nombre despces,
Shannon, Simpson). Enfin, sa dcomposition sera prsente en dtail dans le chapitre
suivant.

Figure 22 : Valeur du logarithme dordre de


probabilits entre 0 et 1 pour diffrentes valeurs
de : = (trait plein), la courbe est une droite ;
= (pointills longs) : logarithme naturel ;
= (pointills courts) : la courbe a la mme
forme que le logarithme naturel pour les valeurs
positives de ; = (pointills alterns) : la
courbe est convexe pour les valeurs ngatives de .

Enfin, le logarithme dform est subadditif :


lnq () = lnq + lnq
( 1)lnq lnq

(47)

Ses proprits sont les suivantes :

Logarithmes dforms
Lcriture de lentropie HCDT est largement
simplifie en introduisant le formalisme des
logarithmes dforms (Tsallis, 1994). Le
logarithme dordre est dfini par :
1 1
lnq =
1

(45)

Le logarithme dform converge vers le


logarithme naturel quand 1 (Figure 22).

Sa fonction inverse est lexponentielle


dordre :
36

1
= 1 lnq

lnq () = lnq + 1 lnq

1
lnq = lnq
lnq

lnq

(48)

Et :

1+(1)

(49)

Pour > 1, lim+ lnq = 1( 1),


donc nest pas dfini pour >
1( 1).
Ces fonctions sont implmentes dans le
package entropart : lnq(x, q) et expq(x, q).
Lentropie dordre scrit :

Mesures neutres de la diversit ou

lnq

(50)

Cette forme est bien plus simple que celle de


lquation (44) et sinterprte comme une
gnralisation de lentropie de Shannon
(Marcon et al., submitted).

Le calcul de peut se faire avec la fonction Tsallis.P de la librairie entropart :

communaut, la diversit de la mtacommunaut doit tre .

Lintrt de ces approches est de fournir une


dfinition paramtrique de la diversit, qui
donne plus ou moins dimportance aux
espces rares :

> Ps <- colSums(BCI)/sum(BCI)


> q <- 1.5
> Tsallis.P(Ps, q)
[1] 1.715954

Entropie et diversit

On voit immdiatement que lentropie de


Tsallis est le logarithme dordre du
nombre de Hill correspondant, comme
lentropie de Rnyi en est le logarithme
naturel.

= lnq

(51)

Lentropie est utile pour les calculs : la


correction des biais dchantillonnage
notamment. Les nombres de Hill, ou
nombres despces quivalentes ou
nombres despces efficaces permettent
une apprhension plus intuitive de la notion
de biodiversit (Jost, 2006). En raison de
leurs proprits, notamment de dcomposition (voir le chapitre suivant), Jost (2007)
les appelle vraie diversit . Hoffmann et
Hoffmann (2008) critiquent cette dfinition
totalitaire 9 et fournissent une revue historique plus lointaine sur les origines de ces
mesures. Quoiquil en soit, les nombres de
Hill respectent le principe de rplication
(Chao et al., 2010, section 3 pour une
discussion et un historique) : si communauts de mme taille, de mme niveau de
diversit , mais sans espces en commun
sont
regroupes
dans
une
mta-

Jost (2009) reconnat quun autre terme aurait pu


tre choisi ( diversit neutre ou diversit mathmatique par exemple).

= 1min() est linverse la proportion de la communaut reprsente par


lespce la plus rare (toutes les autres espces
sont
ignores).
Le
biais
dchantillonnage est incontrlable :
lespce la plus rare nest pas dans
lchantillon tant que linventaire nest
pas exhaustif.
0
est le nombre despces (alors que 0
est le nombre despces moins 1) est la
mesure classique qui donne le plus
dimportance aux espces rares : toutes
les espces ont la mme importance, quel
que soit leur effectif en termes
dindividus. Il est bien adapt une approche patrimoniale, celle du collectionneur qui considre que lexistence dune
espce supplmentaire a un intrt en soi,
par exemple parce quelle peut contenir
une molcule valorisable. Comme les espces rares sont difficiles chantillonner, le biais dchantillonnage est trs important, et sa rsolution a gnr une littrature en soi (voir page 13 et suivantes).
1
est lexponentielle de lindice de
Shannon donne la mme importance
tous les individus. Il est adapt une approche dcologue, intress par les interactions possibles : le nombre de combinaisons despces en est une approche satisfaisante. Le biais dchantillonnage est
sensible (voir page 30).
2
est linverse de lindice de concentration de Gini-Simpson donne moins
dimportance aux espces rares. Hill
(1973) lappelle le nombre despces
trs abondantes . Il comptabilise les interactions
possibles
entre
paires
dindividus : les espces rares interviennent dans peu de paires, et influent peu
sur lindice. En consquence, le biais
dchantillonnage est trs petit (page 31).

= 1 est linverse de lindice de


Berger-Parker (Berger et Parker, 1970)
37

Mesures de la biodiversit

qui est la proportion de la communaut


reprsente par lespce la plus abondante : = max( ). Toutes les autres
espces sont ignores.

Le calcul de peut se faire avec la fonction Diversity.P de la librairie entropart :


> Ps <- colSums(BCI)/sum(BCI)
> q <- 1.5
> Diversity.P(Ps, q)
[1] 49.57724

Biais dchantillonnage
La correction du biais dchantillonnage
pour lentropie HCDT repose sur deux approches :

Celle de Chao et Shen (2003), tendue audel de lentropie de Shannon (Marcon et


al., submitted) qui prend en compte les
espces non observes,
Celle de Grassberger (1988) qui prend en
compte la non-linarit de lestimateur.

Le domaine de validit des deux corrections


est diffrent. Quand est petit, les espces
rares non observes ont une grande importance alors que est presque linaire : la
correction de Grassberger disparat quand
= 0. Quand est grand (au-del de 2),
linfluence des espces rares est faible, la
correction de Chao et Shen devient ngligeable alors que la non-linarit augmente.
Un compromis raisonnable consiste utiliser le plus grand des deux estimateurs.
Lestimateur de Chao et Shen est :
1

lnq

(52)

1 1
=1

Celui de Grassberger est :


1

1 =1
=

O =

( +1)

( +1)

(1) (1+) sin


(+1)

(53)

() est la fonction gamma. Lestimateur est

linaire par rapport : le problme est


donc rsolu par la construction de
lestimateur non biais de .
38

La conversion de lestimateur dbiais de


lentropie en estimateur de la diversit pose
un nouveau problme puisque nest pas
une transformation linaire de . Ce dernier biais peut tre nglig (Grassberger,
1988) parce que , lentropie, est la valeur
moyenne de linformation de nombreuses
espces indpendantes et fluctue donc peu
cause de lchantillonnage, contrairement
aux estimateurs des probabilits.
Les fonctions Tsallis.N et Diversity.N de
entropart acceptent comme argument un
vecteur dabondances (et non de probabilits) et proposent par dfaut la correction
combinant Chao et Shen et Grassberger
> Tsallis.N(colSums(BCI), q=1)
[1] 4.276599
> Diversity.N(colSums(BCI), q=1)
[1] 71.99514

Mesures neutres de la diversit ou

Profils de diversit

Indice de Hurlbert

150

Lindice de Hurlbert (1971) est le nombre


despces observes dans un chantillon de
taille choisie :

= [1 (1 ) ]

100

Diversit

200

Dfinition

(54)

50

=1

0.0

0.5

1.0

1.5

2.0

Figure 23 : Profil de diversit 10 calcul pour BCI.


La correction du biais dchantillonnage est la
plus grande de Chao-Shen et Grassberger.

Leinster et Cobbold (2011), aprs Patil et


Taillie (1982), Tothmeresz (1995) et Kindt
et al. (2006), recommandent de tracer des
profils de diversit, c'est--dire la valeur de
la diversit en fonction de lordre
(Figure 23) pour comparer plusieurs communauts. Une communaut peut tre dclare plus diverse quune autre si son profil de
diversit est au-dessus de lautre pour toutes
les valeurs de . Si les courbes se croisent, il
ny a pas de relation dordre (Tothmeresz,
1995).
Pallmann et al. (2012) ont dvelopp un test
statistique pour comparer la diversit de
deux communauts pour plusieurs valeurs
de simultanment.
10

Code R :

> q.seq <- seq(0, 2, .1)


> Ns <- colSums(BCI)
> UBdiversity <- sapply(q.seq,
function(q, N, Correction)
Diversity.N(N, q, Correction),
N=Ns, Correction="Best")
> plot(y=UBdiversity, x=q.seq,
type="l", col="black", lwd=2,
xlab="q", ylab="Diversit",
main="")

Chaque terme de la somme est la probabilit


dobserver au moins une fois lespce correspondante.
Laugmentation de la valeur de permet de
donner plus dimportance aux espces rares.
Lindice peut tre converti en nombre quivalent despces (Dauby et Hardy, 2012)
nots partir de la relation :

1 1

(55)

Lquation doit tre rsolue pour obtenir


partir de la valeur de estime, numriquement pour > 3.

Dans deux cas particuliers, les nombres


quivalents despces de Hurlbert sont identiques aux nombres de Hill : 2 = 2 et
0
= .

Biais dchantillonnage

Hurlbert fournit un estimateur non biais de


son indice ( est la taille de lchantillon,
le nombre dindividus de lespce ) :

= 1

=1

(56)

Dauby et Hardy (2012) montrent que cet


estimateur est trs peu sensible la taille de
lchantillon, et obtient de meilleurs rsultats sur ce point que les estimateurs de Chao
et Shen pour lindice de Shannon ou du
nombre despces.
39

Mesures de la biodiversit

Le calcul de la diversit de Hurlbert est possible avec le logiciel BiodivR 11 (Hardy,


2010).

quitabilit
La rgularit dune distribution est une notion intuitivement assez simple : la faiblesse
de lcart entre la distribution relle et une
distribution parfaitement rgulire, vrifiant
= 1 (Lloyd et Ghelardi, 1964).

Une expression de lquitabilit est souvent


donne partir de lindice de Shannon
(Lloyd et Ghelardi, 1964 ; Pielou, 1966a;
1975). La valeur maximale de lindice de
Shannon est obtenue quand la distribution
est parfaitement rgulire. Alors : =
ln. On a donc dfini lindice, parfois appel indice de Pielou :
=

lity pouvant tre utilis dans un sens plus


large) :
=

(58)

Lquitabilit dordre est le rapport de la


diversit dordre sur la richesse. Cette dfinition respecte tous les critres de Dalton
(1920) :

Invariance par duplication : lquitabilit


ne change pas si chaque espce est remplace par plusieurs nouvelles espces
ayant la mme abondance.
Lquitabilit diminue quand un individu
est transfr dune espce rare une espce frquente.
Lquitabilit diminue quand une espce
rare est ajoute.
Invariance dchelle : lquitabilit ne
dpend que des frquences, pas des abondances absolues.

(57)

est compris entre 0 (une seule espce a


une probabilit de 1) et 1 (toutes les espces
ont la mme probabilit).
Mendes et al. (2008) gnralisent lindice de
Pielou en remplaant lindice de Shannon
par lentropie de Tsallis (ils dfinissent
= ) et tracent des profils
dquitabilit, c'est--dire la valeur de en
fonction de . Ils observent que
lquitabilit est minimale pour une valeur
particulire de quils notent et explo
rent les proprits de et . La limite
de cette approche est labsence de correction
des biais dchantillonnage et surtout la
mauvaise dfinition de lquitabilit (voir cidessous).
Dautres mesures dquitabilit existent
(Smith et Wilson, 1996 ; Ricotta et al.,
2001 ; Ricotta, 2003). Une revue critique en
est faite par Tuomisto (2012) qui argumente
en faveur dune dfinition stricte de
lquitabilit (evenness en Anglais, equitabi11

http://ebe.ulb.ac.be/ebe/Software.html

40

Figure 24 : Courbes de Lorenz de plusieurs jeux


de donnes. Les espces sont classes par frquence croissante, et la courbe reprsente la frquence cumule des espces. Plus la courbe est
loin de la bissectrice, plus le jeu de donnes est
inquitable. Figure extraite de Tuomisto (2012).

Un critre supplmentaire tabli par Smith


et Wilson (1996) est la compatibilit avec la
courbe de Lorenz (1905), construite en classant les espces de la moins frquente la
plus frquente, et en traant le cumul des
frquences en fonction du rang (Figure 12) :
une communaut parfaitement quitable est
reprsente par la bissectrice, la surface
entre la courbe relle et la bissectrice est trs
utilise en conomie pour mesurer
lingalit sous le nom d indice de Gini

(Gini, 1912 ; Ceriani et Verme, 2012). Une


mesure dquitabilit compatible doit tre
plus grande pour une communaut si sa
courbe de Lorenz est plus proche de la bissectrice. Si les courbes de deux communauts se croisent, lordre de leurs quitabilits
est imprvisible.
Lindice de Pielou est le plus utilis dans la
littrature (Tuomisto, 2012) mais nest pas

Mesures neutres de la diversit ou

compatible avec la courbe de Lorenz et nest


pas invariant par duplication parce quil ne
normalise pas une diversit mais une entropie. Lutilisation de est donc bien prfrable, 1 = remplaant avantageusement .

41

DIVERSIT ET DCOMPOSITION
La notion de diversit a t introduite par
Whittaker (1960, p. 320) comme le niveau
de changement dans la composition des
communauts, ou le degr de diffrentiation
des communauts, en relation avec les changements de milieu. La traduction de cette
notion intuitive en une dfinition sans ambigut est encore une question de recherche et
de dbats. Un forum a t consacr la
question dans Ecology (Baselga, 2010 ; Jost,
2010 ; Ricotta, 2010 ; Veech et Crist, 2010a;
2010b ; Wilsey, 2010), conclu par Chao et
al. (2012), et une revue a t faite par
Tuomisto (2010a; 2010b).
Dans la littrature, la diversit est toujours
une mesure drive (Ellison, 2010), c'est-dire calcule partir des diversits et ,
do un abondant dbat sur lindpendance
souhaite mais pas toujours observe entre
les valeurs de diversit et (Baselga,
2010 ; Jost, 2010 ; Veech et Crist, 2010a).

Des exemples montrent comment calculer


cette diversit, principalement laide du
package entropart. Le package contient les
donnes dinventaire de deux hectares du
dispositif de Paracou :
> library(entropart)
> # Chargement du jeu de donnes
> data(Paracou618)

Les donnes sont organises dans le package


sous la forme dun objet MetaCommunity
qui contient notamment la matrice des .
Les parcelles de Paracou sont dans lobjet
Paracou618.MC.
> Paracou618.MC

Dfinitions de la diversit

Pour simplifier lexpos, les individus seront


chantillonns dans des communauts, appartenant une mta- communaut. Le Tableau 2 rsume les notations.

Tuomisto (2010a) passe en revue lensemble


des dfinitions de la diversit dans un article ardu mais trs complet. Toutes ont en
commun :

Enfin, toute ambigut sera vite en appelant entropie les indices de diversit qui sont

des mesures dentropie (Shannon, Simp


son) et diversit leur nombre quivalent .

Une dfinition de la mesure de diversit,


applique la diversit , qui est gnralement une des mesures vues dans le chapitre prcdent,

Communaut

: nombre dindividus de lespce dans la


Espce

Total

Total : mta-communaut

communaut .

+ =

quun individu de la communaut soit de

+ : nombre dindividus de la communaut.

: nombre total dindividus

= + est lestimateur de la probabilit


lespce .

: poids de la communaut

chantillonns

43

Mesures de la biodiversit

Une dfinition de la diversit , qui peut


tre par exemple :
La diversit locale mesure dans
chaque communaut, indpendamment
de toute rfrence hors de la communaut,
De faon quivalente, le nombre
despces efficaces dans les communauts.
Une faon de combiner les diversits et
pour obtenir la diversit , par
exemple :
=
=

Lutilisation des nombres de Hill, la mesure


locale de la diversit et la dfinition de la
diversit comme rapport des diversits
et permet de dfinir la vraie diversit
(Jost, 2006; 2007) qui est un nombre de
communauts quivalentes (compositionnal
units) similaire au nombre despces quivalentes des diversits et . Tuomisto (2011)
milite pour que le terme diversit soit rserv la vraie diversit (homogne un
nombre despces) et que les autres mesures
soient appeles diffremment : entropie
de Shannon ou probabilit de GiniSimpson notamment.

Le dbat sur la dcomposition


Lobjectif est de dcomposer la diversit
totale, note en une composante intergroupes, note et une composante intragroupes note .
Whittaker (1960; 1972) est lauteur de ce
concept. Il a pos le principe que la diversit
devait tre le produit des diversits et .

Lande (1996) a une approche additive et


postule que les mesures de diversits
doivent tre concaves : la diversit dun jeu
de
donnes
regroupant
plusieurs
communauts doit tre suprieure ou gale
la somme pondre des diversits dans
chaque communaut. De cette faon, il est
possible de dfinir une diversit totale gale
44

la somme pondre des diversits (intracommunauts) et (inter-communauts),


toutes les diversits tant positives ou nulles.
Il note que la partition serait plus
facilement interprtable si les diffrentes
composantes de la diversit pouvaient tre
exprims au moyen de la mme formule
(ce qui nest en fait jamais le cas). Une
revue sur les avantages de la dcomposition
additive est propose par Veech et al.
(2002).
Un dbat assez strile est dcoul de
lopposition entre les deux approches,
principalement d la transformation
logarithmique (Jost, 2006), des dfinitions
imprcises et des dmonstrations empiriques
remises en question (Baselga, 2010 ; Veech
et Crist, 2010a). Il reste que la
dcomposition multiplicative permet seule
la dfinition de la diversit en tant que
vraie diversit (Chao et al., 2012).
Jurasinski et al. (2009) distinguent plusieurs
types de mesures de diversit :

La diversit dinventaire (inventory diversity), qui traite des donnes rcoltes sur
une unit spatiale, ce qui correspond la
dfinition des diversits et .
La diversit de diffrentiation (differentiation diversity), qui mesure quel point les
units spatiales sont diffrentes, ce qui
correspond la dfinition de la diversit
donne plus haut
La diversit proportionnelle (proportional
diversity), diversit qui se construit par
diffrence ou rapport des diversits et .

Marcon et al. (2012) montrent que lentropie


de Shannon est une mesure de diversit
de diffrentiation en donnant sa dfinition
indpendamment de et . Cest galement une diversit proportionnelle, comme
toutes les mesures passes en revue par
Tuomisto : la diversit de Shannon permet
dunifier les deux approches.
Lindice de Shannon, coupl son expression sous forme de nombre de Hill, respecte
finalement tous les critres imposs ou souhaits. Sa dcomposition est dtaille cidessous. Enfin, Marcon et al. (submitted)
gnralisent ce rsultat toutes les mesures

de diversits drives de lentropie gnralise de Tsallis.

Dcomposition multiplicative de la diversit


Jost (2007) et Chao et al. (2012) ont montr
que la dcomposition des nombres de Hill
en lments indpendants est multiplicative :

(59)

et sont les nombre de Hill dordre


gaux aux diversits et . Ce sont des
nombres quivalents despces (cf. page 35).

est le nombre de communauts


efficaces ou nombres de communauts
quivalentes , c'est--dire le nombre de
communauts de poids gal ne possdant
aucune espce en commun, qui fourniraient
la mme valeur de diversit .

Lindice de chevauchement

La mesure de diversit est le nombre


quivalent de communauts totalement distinctes qui fourniraient le niveau de diversit

Cette mesure na de sens que compare


nombre de communauts (not ici et non I
pour conserver le nom de lindice tabli
dans la littrature). Plutt quune simple
normalisation suggre par Jost (2007),
Chao et al. (2008) dfinissent un indice de
chevauchement, c'est--dire la proportion
despces partages en moyenne par une
communaut. Si les communauts de
mmes diversits et que les donnes,
contenaient chacune espces quifrquentes, dont seraient communes toutes
les communauts et les autres reprsentes

Diversit et dcomposition

dans une seule, / serait cet indice de chevauchement.


Pour 1 (Chao et al., 2012) :
=

Et :
1

1 1
1 1
1

ln 1 +

ln

=1 =1

=1
ln

(60)

(61)

a t dfini lorigine pour 2.


Chao et al. (2012) ltendent sans prcaution
quelconque. Sa valeur peut tre ngative
pour < 1, on se limitera donc 1.

Dcomposition de
lindice de Shannon
La dcomposition explicite (Tableau 3) est
due Marcon et al. (2012) : la diversit
est la divergence de Kullback-Leibler entre
la distribution des espces dans chaque
parcelle et la distribution moyenne, appele
divergence de Jensen-Shannon (Lin, 1991).
Les diversits et sont les complments
ln des indices de dissimilarit de Theil
(39), divergences de Kullback-Leibler entre
les distributions des espces et leur
quiprobabilit.
La forme de avait t tablie par Ricotta
et Avena (2003), sans la relier celle de
et . Enfin, lide de la dcomposition de
la divergence de Kullback-Leibler, mais
avec une approche diffrente, sans rapprochement avec lindice de Shannon, a t
publie par Ludovisi et Taticchi (2006).
Les mta-communauts peuvent leur tour
tre regroupes un niveau suprieur, la
diversit du niveau infrieur devenant
diversit pour le niveau suprieur. La
dcomposition ou le regroupement peuvent
tre effectus sur un nombre quelconque de
niveaux.
45

Mesures de la biodiversit

Indice

Distribution observe
Frquence des espces dans
la communaut

Frquence des espces dans


la communaut

Frquence des espces dans


la mta-communaut

Distribution attendue
Frquences gales, hors formule

Formule
= ln

Frquence totale des espces

= ln

Frquences gales, hors formule

= ln

Tableau 3 : Dfinition explicite de la diversit de Shannon en tant que divergence entre une distribution observe et une distribution attendue.
Les indices et sont les complments au logarithme du nombre despces de cette divergence.

Calcul sous R : La fonction BetaEntropy.MC calcule lentropie de la mtacommunaut (largument = 1 permet de


choisir lentropie de Shannon).
> # Pas de correction du biais
dchantillonnage
> BetaEntropy.MC(Paracou618.MC,
q=1, Correction = "None")
$Communities
P006
P018
0.3499358 0.5771645

Biais dchantillonnage
Lestimateur du taux de couverture de la
communaut est not , le taux de couver
ture total . Lestimateur sans biais de
est :
(62)

Tous les estimateurs de diversit doivent


tre dbiaiss (voir page 31).
Calcul sous R : BetaEntropy.MC applique
cette correction :
> BetaEntropy.MC(Paracou618.MC,
q=1, Correction="ChaoShen")
$Communities
P006
P018

46

$Total
[1] 0.3618884

Tests
Test de significativit

$Total
[1] 0.4471751

+

1 ln +
+

=1 1 1
+

0.2949188 0.4514132

Lobjectif est de tester si deux communauts


ne sont pas simplement deux chantillons
dune mme communaut, dont les diffrences ne sont que des fluctuations dues au
hasard. Sous lhypothse nulle, les observations sont des ralisations des mmes
probabilits .
Le test est ralis de la faon suivante :

Les effectifs de chaque communaut


sont tirs dans une loi multinomiale
est calcul,
(+ , + ) et
La simulation est rpte un grand
nombre de fois, par exemple 10 000, et les
valeurs extrmes sont limines. Au seuil
de risque = 5%, les 251me et 9750me
valeurs simules dfinissent les bornes de
lintervalle de confiance de lhypothse
nulle.

Lhypothse nulle est rejete si la valeur


nest pas dans cet intervalle,
observe de
en gnral au-del de la borne suprieure. Il
peut arriver que les deux communauts
soient plus semblables que sous lhypothse

nulle, c'est--dire que les frquences varient


moins que dans le tirage dune loi multinomiale, si deux communauts ont t cres
artificiellement avec le mme nombre
dindividus de chaque espce par exemple.
Lorsque les donnes sont issues de communauts relles, le sens mme de ce type de
test est remis en question (Jones et Matloff,
1986) : les communauts relles ne pouvant
pas tre exactement identiques, il suffit
daugmenter la taille de lchantillonnage
pour prouver leur diffrence.

Intervalle de confiance de

Lintervalle de confiance de lestimateur de


peut tre calcul de la mme manire en
simulant les communauts par des tirages
dans des lois multinomiales suivant leurs
frquences : (+ , + ).
Si lintervalle de confiance ne contient pas
0, lgalit des distributions est rejete.

Calcul sous R : la fonction DivEst produit


un graphique avec lintervalle de confiance :

Diversit et dcomposition

Correction des biais

Les simulations ncessaires aux tests crent


un biais dchantillonnage : les espces les
plus rares dans les communauts souvent
limines par les tirages. La correction du
biais des tirages recentre leur distribution
autour des valeurs originales des communauts non dbiaises. Il nexiste pas de correction analytique pour corriger successivement le biais d aux simulations (d la
perte des espces rares des communauts
relles) puis celui d lchantillonnage des
communauts elles-mmes (d la nonobservation des espces rares de la communaut). Marcon et al. (2012) effectuent la
deuxime correction par un recentrage de la
distribution de simule autour de sa valeur observe dbiaise, ce qui permet
dobtenir lintervalle de confiance de
lestimateur de .
La distribution de lestimateur sous
lhypothse nulle ne peut pas tre dbiaise
compltement : elle est systmatiquement
surestime.

> DivEst(q = 1, Paracou618.MC,


Simulations = 1000, Graphic = TRUE)

Dcomposition de
lentropie gnralise

10

La dcomposition additive de lentropie


selon Lande (1996) doit tre la suivante :

Density

15

Beta Diversity

1.50

1.55

1.60

1.65

Diversity

Par dfaut, DivEst corrige les biais. Les rsultats sont prsents sous forme de diversit et non dentropie, la valeur attendue en
cas dgalit des communauts est 1.

= +

(63)

La diversit est la somme pondre des


diversits des groupes constituant la population totale. Le poids de chaque groupe est
, souvent choisi gal au nombre
dindividus de la communaut divis par le
nombre total ou la surface de chaque
groupe, mais qui peut tre arbitraire, tant
que = . Deux faons de pondrer
la somme mergent de la littrature (Chao et
al., 2012). La dfinition classique est selon
Routledge (1979) :

47

Mesures de la biodiversit

1(1)

(64)

La pondration propose par Jost (2007)


est :

1(1)

(65)

La premire est la pondration naturelle. La


seconde, qui pondre par les poids la puissance , prsente des avantages dtaills par
Chao et al. mais son utilisation ne garantit
pas que la diversit soit suprieure la
diversit si les poids des communauts ne
sont pas gaux.
Bourguignon (1979) comme Lande (1996)
dfinissent une mesure dingalit dcomposable comme respectant les proprits
suivantes :

La population totale tant partitionne,


chaque partition recevant un poids , la
composante intra-groupe de la mesure
est gale la somme pondre des mesures dans chaque-groupe = ,.
La composante intergroupe est la mesure dingalit entre les groupes.
La mesure totale est la somme des
mesures intra et intergroupes.

En passant par les nombres de Hill, Jost


(2007) montre que lindice de Shannon est
le seul pouvant tre dcompos de cette faon.

La dmonstration de Jost repose sur le postulat que la transformation de lentropie en


nombre de Hill, dfinie pour la diversit ,
doit avoir la mme forme pour la diversit
. La remise en cause de ce postulat
(Marcon et al., submitted) permet de dcomposer la diversit dordre quelconque
quel que soit le poids des communauts.
La dcomposition de lentropie est faite en
crivant le logarithme dordre de la dcomposition de la diversit, quation (59) :

48

= + lnq

( 1) lnq

(66)

Ceci est la dcomposition de Jost (2007).


Jost dsigne sous le nom de composante
de lentropie le logarithme dordre de la
diversit, quil note . La dcomposition
nest pas additive, mais est indpendant
de lentropie .

Les deux derniers termes peuvent tre regroups et rarrangs pour obtenir conformment la dcomposition additive de
lquation (63) :

= lnq

(67)

Lentropie est la somme pondre par


(et pas autrement) des contributions de
chaque communaut :

= lnq

(68)

est une divergence de Kullback-Leibler


gnralise (Borland et al., 1998). De
mme, peut scrire sous la forme

= ln : la formalisation de la
dcomposition est une gnralisation de la
dcomposition de lentropie de Shannon,
rsume dans le Tableau 4.

Il est intressant dcrire et sous la


forme dentropies, pour faire apparatre leur
fonction dinformation. Pour diffrent de
1, lentropie est :

1
1

(69)

Sa fonction dinformation a t trace Figure 21, page 34.


Lentropie est :

(70)

Diversit et dcomposition
Indice

Entropie

Shannon

Entropie gnralise

Diversit
1

= ln

1
= ln

= lnq

= lnq

1
1

1+(1)

Tableau 4 : Entropie et diversit. Lentropie de chaque communaut se calcule comme lentropie .

Calcul sous R : Les fonctions AlphaEntropy.MC, BetaEntropy.MC, GammaEntropy.MC et AlphaDiversity.MC, BetaDiversity.MC, GammaDiversity.MC permettent de
calculer les entropies et diversits. DivPart
calcule tout en mme temps :
> DivPart(q = 1, Paracou618.MC,
Biased = FALSE)
$TotalAlphaDiversity
[1] 91.70413
$TotalBetaDiversity
[1] 1.464258
$GammaDiversity
[1] 134.2786
$CommunityAlphaDiversities
P006
P018
81.6996 107.0175
$TotalAlphaEntropy
[1] 4.518567
$TotalBetaEntropy
[1] 0.3813489
$GammaEntropy
[1] 4.899916
$CommunityAlphaEntropies
P006
P018
4.403049 4.672992

Dcomposition du
nombre despces
Les rsultats gnraux se simplifient pour
= 0. Lentropie est le nombre despces
de la mta-communaut moins un ( 0 =
1), lentropie est la moyenne pondre du nombre despces des communauts
moins un ( 0 = 1), lentropie est la
diffrence : 0 = .
En termes de diversit :
0

(71)

peut tre suprieur au nombre de communauts (Chao et al., 2012) si les poids
sont trs ingaux, ce qui complique son interprtation. La pondration de Jost donne
pour le nombre despces le mme poids
toutes les communauts et garantit 0 ,
ce qui constitue pour Chao et al. un argument en faveur de son utilisation.

49

Mesures de la biodiversit

Dcomposition de
lindice de GiniSimpson

la dcomposition multiplicative permet


lindpendance, et Jost propose dutiliser
une transformation de 2 comme mesure
de diffrentiation (voir page 45).

Lentropie de Simpson peut aussi tre dcompose comme une variance. La probabilit quun individu appartienne lespce
est . Elle suit une loi de Bernoulli, dont la
variance est (1 ). Cette variance peut
tre dcompose entre les communauts, o
la probabilit est . La dcomposition
entre variance intra et inter-communauts
est :
(1 )

= [ (1 ) + ( )2 ]

(72)

Cette galit peut tre somme sur toutes les


espces pour donner :

= + ( )2

= +

(73)

Lentropie de Simpson peut tre dcompose en sa diversit , somme pondre


des entropies des communauts, et son
entropie , gale la somme pondre des
distances 2 entre la distribution des frquences dans chaque communaut et celle
de lensemble de la communaut.
En gntique, lgalit scrit = +
(Nei, 1973). est lhtrozygotie totale,
dcompose en , lhtrozygotie moyenne
des populations et la diffrentiation absolue entre populations. = est la
diffrentiation relative.

Lentropie calcule de cette manire est


gale 2 calcule lquation (70) pour
le cas gnral, mais la contribution de
chaque communaut est diffrente : la dcomposition de la variance est une faon
alternative de dcomposer lentropie, valable uniquement pour lentropie de Simpson.
Cette dcomposition est remise en cause par
Jost (2007; 2008). tant infrieur ou gal
1, nest pas indpendant de : seule
50

Jost postule que la diversit de Simpson a


la mme relation que les diversits et
:

1
1
1
=
1 1 1

(74)

Do une dcomposition additive diffrente,


qui correspond sa dcomposition gnrale
(66) :
= +

(75)

Il ny a en ralit aucune raison pour que le


nombre quivalent de la diversit ait la
mme forme que celle de la diversit : les
deux diversits sont par nature trs diffrentes, et Hill ne traitait pas la diversit .
La diversit de Shannon est exceptionnelle
parce que, pour des raisons diffrentes, son
nombre de Hill est lexponentielle de
lentropie, et lexponentielle de la dcomposition additive (63) est la dcomposition
multiplicative (59).
Le nombre quivalent de communauts a
une forme lgrement diffrente dun
nombre de Hill (Tableau 4).

Synthse
La diversit mesure par lentropie gnralise peut tre dcompose dans tous les cas
de figure, y compris lorsque les poids des
communauts ne sont pas gaux. Les formules dentropie et de diversit sont rsumes dans le Tableau 4.
Lentropie de Shannon est un cas particulier
dans lequel toutes les controverses disparaissent : lentropie est indpendante de
lentropie , et la pondration de Jost se
confond avec celle de Routledge.

Lentropie de Simpson peut tre dcompose de deux faons : comme une variance
quand les poids des communauts sont donns par leurs effectifs, ou selon le cas gnral. Les deux dcompositions produisent les
mmes valeurs dentropie , mais la contribution de chaque communaut nest pas la
mme.
Lentropie peut tre dcompose hirarchiquement sur plusieurs niveaux (Crist et al.,
2003 ; Marcon et al., 2012).
Les probabilits doccurrence des espces ne
sont pas connues mais estimes partir des
donnes. Les diversits et sont sousestimes, la diversit surestime (Marcon
et al., 2012), dautant plus que lordre de
diversit est faible (le biais est ngligeable
au-del de lindice de Simpson). Des mthodes de correction existent (voir le chapitre prcdent), mais pas pour lentropie
lexception de Shannon. La mthode gnrale consiste donc corriger les entropies
et , calculer lentropie par diffrence et
transformer les rsultats en nombres quivalents (Marcon et al., submitted).
Enfin, il est possible (Crist et al., 2003) mais
controvers (Jones et Matloff, 1986) de tester la significativit de la diffrence entre
communauts. Une meilleure approche consiste calculer lintervalle de confiance de
la diversit due lincertitude sur les estimateurs de probabilits.

Famille

Genre

Espce

Total

Diversit et dcomposition

Le partitionnement de
la diversit selon Plissier et Couteron
Cadre

Un cadre gnral de partitionnement de la


diversit, applicable aux trois indices classiques, est propos par Plissier et Couteron
(2007), en conclusion dune srie darticles
(Plissier et al., 2003 ; Couteron et Plissier,
2004).
Les donnes sont dsagrges jusquau niveau de lindividu. Suivant les notations
prcdentes, les placettes sont considres
comme le regroupement darbres, indics
par .
Le Tableau 5 est appel tableau
doccurrence des espces. Il ne contient que
des 0 et des 1. Chaque arbre (colonne) a une
seule valeur 1 dans la cellule correspondant
son espce.

Un arbre moyen sil pouvait exister appartiendrait partiellement chaque espce, proportionnellement son effectif. Chaque
arbre apporte une quantit dinformation
gale la somme sur toutes les espces des
carts quadratiques entre la valeur , indicatrice de son appartenance lespce , et
la valeur correspondant larbre moyen :
Fort

Placette

Parcelle

Arbre

Total

= 1 si larbre appartient lespce , 0 sinon.


=

+ = + = 1

Tableau 5 : Tableau doccurrence des espces.

51

Mesures de la biodiversit

( )2. La somme peut tre pondre pour donner une importance plus ou
moins grande des espces selon leur frquence : ( )2. La mesure totale, somme sur tous les arbres, est note
:
= ( )2

(76)

Si le poids vaut toujours 1, est


lindice de Simpson.
Si = ln(1 )(1 ), on obtient
lindice de Shannon, et = 1 donne le
nombre despces moins 1.

Dcomposition
Lintrt de la mthode est de permettre
lutilisation de modles linaires et des outils informatiques associs classiques pour
dcomposer la diversit de diffrentes manires (Plissier et Couteron, 2007). Nous
nous intresserons ici la dcomposition de
la diversit totale en diversits et .
Dans ce cadre, la diversit est la partie
explique par le modle (les diffrentes
communauts sont les paramtres explica-

52

tifs), note , alors que la diversit est


rsiduelle, note .
La diversit totale est . La diversit
est calcule de la mme manire, en prenant
pour rfrence la frquence des espces
lintrieur de chaque placette. Dans la placette :

(77)

La diversit est calcule de faon similaire


par la diffrence entre les frquences des
espces dans chaque placette ( )
et leur frquence aprs regroupement .

Le problme est que le poids attribu


chaque espce, , dpend de la distribution
totale des espces. nest donc pas une
diversit puisque sa valeur dpend de
donnes extrieures la placette.
Le poids = 1 pour toutes les espces
rgle le problme. Le modle est alors celui
de la dcomposition de lindice de Simpson
prsent plus haut.

DIVERSIT FONCTIONNELLE ET
PHYLOGNTIQUE

Les mesures neutres de la diversit considrent que toutes les classes auxquelles les
objets appartiennent sont diffrentes, sans
que certaines soient plus diffrentes que
dautres. Par exemple, toutes les espces
sont quidistantes les unes des autres,
quelles appartiennent au mme genre ou
des familles diffrentes. Intuitivement,
lide quune communaut de espces
toutes de genres diffrents est plus diverse
quune communaut de espces du mme
genre est satisfaisante.
Il sagit donc de caractriser la diffrence
entre deux classes dobjets, puis de construire des mesures de diversit en rapport
(Cousins, 1991).

De nombreuses mesures de diversit ont t


cres et plusieurs revues permettent den
faire le tour (Ricotta, 2007 ; Pavoine et
Bonsall, 2011). Les mesures prsentes ici
sont les plus utilises, et notamment celles
qui peuvent tre ramenes aux mesures classiques en fixant une distance gale entre
toutes les espces.
Des exemples montrent comment calculer
cette diversit, principalement laide du
package entropart. Le package contient les
donnes dinventaire de deux hectares du
dispositif de Paracou et la taxonomie des
espces concernes :
> library(entropart)
> # Chargement du jeu de donnes
> data(Paracou618)

Cadre
Dissimilarit et distance
Une similarit ou dissimilarit est toute application valeurs numriques qui permet
de mesurer le lien entre les individus dun
mme ensemble ou entre les variables. Pour
une similarit le lien est dautant plus fort
que sa valeur est grande.
Un indice de dissimilarit (on peut dire
une dissimilarit) vrifie ( et sont deux
individus) :

La dissimilarit dun individu avec luimme est nulle : (, ) = 0.


La dissimilarit entre deux individus diffrents est positive : (, ) 0.
La dissimilarit est symtrique : (, ) =
(, )

Une distance vrifie en plus :

La distance entre deux individus diffrents est strictement positive : (, ) =


0 = .
Lingalit
triangulaire :
(, )
(, ) + (, ). De nombreux indices
de dissimilarit ne vrifient pas cette proprit.

Une distance est euclidienne si elle peut tre


reprsente par des figures gomtriques.
On peut rendre toute distance euclidienne
par ajout dune constante (Cailliez, 1983).
Dans R, utiliser is.euclid() pour vrifier
quune distance est euclidienne, et cailliez()
pour la transformation.
Enfin, une distance est ultramtrique si
(, ) max(, ), (, ). Les distances obtenues en mesurant les longueurs
53

Mesures de la biodiversit

des branches dun dendrogramme (arbre)


rsultant dune classification hirarchique
sont ultramtriques.
La faon exacte de mesurer les longueur de
branche est illustr par la Figure 26, page
56 : la distance entre les espces 1 et 2 est
+ + .

Distance phylogntique

La faon la plus vidente de dfinir une distance entre espces est dutiliser la taxonomie, en attribuant une distance arbitraire
(par exemple 1) deux espces du mme
genre, une autre (par exemple 2) deux espces de la mme famille, etc. La distance
dfinie est ultramtrique.
La taxonomie peut tre remplace avantageusement par une phylognie. La phylognie idale contiendrait lhistoire volutive de
toutes les espces et les distances seraient
les temps de divergence depuis le premier
anctre commun. En pratique, les phylognies sont tablies partir dun nombre de
marqueurs gntiques limits, sans datation
prcise (mais avec des calages partiels
partir de fossiles), et ne sont pas toujours
ultramtriques. Elles peuvent prendre en
compte chaque individu, sans regroupement
par espce.
Dans tous les cas, la distance est une mesure
de la divergence volutive.

Distance fonctionnelle
Lapproche fonctionnelle est diffrente.
Chaque espce ou individu est reprsent
par ses valeurs de traits dans un espace multidimensionnel. Le vecteur de traits est considr comme un proxy de la niche cologique. Les individus proches dans lespace
des traits sont donc considrs comme
proche cologiquement. Les distances entre
les points peuvent tre calcules directement
dans lespace des traits ou, plus frquemment, un arbre est construit par classification
automatique hirarchique.

54

La premire tape consiste donc choisir un


ensemble de traits pertinents et les mesurer
de faon standardise (Cornelissen et al.,
2003). Toute la stratgie relative la photosynthse peut tre par exemple assez bien
rsume par la masse surfacique des feuilles
(Wright et al., 2004), mais, en fort tropicale, ce trait est dcorrl de la densit du
bois (Baraloto et al., 2010a). Dans des
communauts trs diverses, la stratgie
dchantillonnage est soigner particulirement (Baraloto et al., 2010b).
La prise en compte de variables qualitatives
ou de rangs et la possibilit de donnes
manquantes pose un problme pratique de
construction du dendrogramme, trait par
Gower (1971). La formule de Gower, tendue par Podani (1999) dautres types de
variables, calcule la dissimilarit entre deux
espces par la moyenne des dissimilarits
calcules pour chaque trait, dont la valeur
est comprise entre 0 et 1 :

Pour une variable quantitative, la diffrence de valeur entre deux espces est
normalise par ltendue des valeurs de la
variable,
Les variables ordonnes sont remplaces
par leur rang et traites comme les variables quantitatives
Pour des variables qualitatives, la dissimilarit vaut 0 ou 1,
Les valeurs manquantes sont simplement
ignores et nentrent pas dans la moyenne.

Une matrice de dissimilarits est construite


de cette faon. Podani et Schmera (2006)
suggrent dutiliser une classification hirarchique par UPGMA (Sokal et Michener,
1958) quils montrent tre la plus robuste
(pour le calcul de FD, voir page 56) lajout
ou au retrait dun trait ou dune espce.
Un dendrogramme fonctionnel na pas
dinterprtation aussi claire quun arbre phylogntique qui reprsente le processus de
lvolution. Il peut tre interprt comme la
reprsentation des chelles de plus en plus
grossires en allant vers le haut de larbre de
regroupements fonctionnels dans des niches
de plus en plus vastes.

Diversit fonctionnelle et phylogntique

quivalence des deux diversits


Lapproche fonctionnelle tant particulirement complexe et lourde mettre en uvre
(notamment pour la mesure des traits sur
chaque individu), la tentation a t grande
de considrer que la phylognie contenait
plus dinformation fonctionnelle que ce qui
pouvait tre mesur, et donc de considrer la
diversit phylogntique comme proxy de la
diversit fonctionnelle.
Webb (2000) a montr que des communauts darbres tropicaux avaient une moins
grande diversit phylogntique locale
quattendue sous lhypothse nulle dune
distribution alatoire des espces, et a suppos que la cause en tait le filtrage environnemental local, agissant sur les traits et
observables par la phylognie, sous
lhypothse de conservation phylogntique
des traits fonctionnels. La discipline appele
cologie phylogntique des communauts
cherche encore comprendre quels traits
sont conservs et lesquels sont convergents
(Cavender-Bares et al., 2009).
Swenson et Enquist (2009) ont montr que
la relation entre les deux diversits tait
faible. Lutilisation de la diversit phylogntique comme proxy de la diversit fonctionnelle est maintenant dconseille

(Pavoine et Bonsall, 2011).

Typologie des mesures


partir de la littrature (Ricotta, 2007 ;
Pavoine et Bonsall, 2011), une typologie des
mesures de diversit merge. Elle tend les
notions classiques de richesse et quitabilit.
La richesse est laccumulation de classes
diffrentes dans les mesures classiques.
Dans un arbre phylogntique, la longueur
des branches reprsente un temps
dvolution : la richesse en est la somme.
FD, et PD sont des mesures de richesse.
La rgularit est une notion plus complexe
(Figure 25). Elle mesure la faon dont les
espces occupent uniformment lespace des
niches (Pavoine et Bonsall, 2011). Cette
notion est simple dans un espace multidimensionnel (par exemple, lespace des traits
fonctionnels). Dans un arbre phylogntique, la rgularit de larbre est un premier
critre, complt ventuellement par les
abondances. Dans un arbre parfaitement
rgulier, la rgularit se rduit
lquitabilit.
Les mesures de divergence sont des fonctions croissantes de la dissimilarit entre les
espces, gnralement considres par paire.
Certaines sont pondres par les abondances, dautres non. Dans un arbre parfai-

Figure 25 : Rgularit contre irrgularit (Regularity vs. Skewness). Les arbres de A D sont de plus en plus
irrguliers. Larbre A, parfaitement rgulier, est le cadre des mesures classiques de la diversit. La phylognie
tant donne, trois vecteurs dabondance (P1 P3) sont de moins en moins rguliers : dans les cas C et D, la
rgularit maximale nest pas obtenue pour des effectifs identiques, mais en augmentant les effectifs des espces originales (voir Maximum thorique, page 57). La figure est issue de Pavoine et Bonsall (2011, fig. 1)

55

Mesures de la biodiversit

tement rgulier, lindice de Simpson est une


mesure de divergence pondre. Ces mesures sont influences par la richesse et la
rgularit.

les espces sont lies la mme racine (on


dira que larbre est parfaitement rgulier),
PD et FD sont gales la richesse spcifique.

Lentropie phylogntique permet dunifier


ces notions.

Le package entropart fournit la fonction


PDFD.P :

Biais dchantillonnage

> # Vecteur des probabilits


> Ps <- Paracou618.MC$Ps
> PDFD.P(Ps, Paracou618.Taxonomy)
[1] 395

Les mesures de diversit fonctionnelle et


phylogntique sont sujettes aux biais
dchantillonnage, mais il nexiste pas de
technique de correction dans la littrature.
Les mesures dentropie phylogntique peuvent tre corriges.

Indice de Rao

FD et PD

Principe

Les indices les plus simples sont la diversit


phylogntique (Faith, 1992) et sa transposition, la diversit fonctionnelle (Petchey et
Gaston, 2002).

partir de relevs fournissant la frquence


de chaque espce par communaut et dune
matrice de dissimilarit entre paires
despces, lindice de Rao (1982) donne la
dissimilarit moyenne entre deux individus
choisis au hasard.

tant donn un arbre contenant toutes les


espces ou tous les individus tudis, PD ou
FD sont gaux la somme de la longueur
des branches (Figure 26).

Lindice de Rao est une mesure de divergence pondre.

Lindice de Rao est souvent appel entropie


quadratique en raison de sa forme mathmatique.

Formalisation
Les espces sont prises deux deux et sont
donc indices ici par et

Figure 26 : Mesure de la diversit fonctionnelle


FD dune communaut hypothtique de 7 espces.
FD est la somme des longueurs des branches
( + + + + ). La ligne pointille horizontale reprsente la mthode plus ancienne de regroupement des espces un niveau arbitraire
(Petchey et Gaston, 2002, figure 1)

Dans le cas particulier ou toutes les branches


sont de longueur 1, c'est--dire que toutes
56

On note la matrice de dissimilarit dont


les lments sont , la dissimilarit entre
lespce et lespce . Il nest pas ncessaire ce stade que soit une distance.
est le vecteur des probabilits dont et
dont des lments :
Lindice de Rao est :

() =

(78)

Discussion
La dfinition de la distance est essentielle :

Diversit fonctionnelle et phylogntique

en fixant = 1 si deux espces sont


diffrentes, on obtient lindice de GiniSimpson(Gini, 1912 ; Simpson, 1949). Sa
valeur peut tre interprte comme la probabilit quune paire dindividus choisie
au hasard soit de deux espces diffrentes.
Dans un espace unidimensionnel o la
valeur associe lespce est une variable quantitative , choisir =
( )2 2 rend lindice de Rao gal
la variance de .

Pavoine et al. (2005b) ont montr que


lutilisation de distances ordinaires fait que
la valeur maximale de lentropie quadratique
pour un effectif donn est obtenue en liminant les espces intermdiaires en ne retenant que les espces extrmes (le rsultat est
vident en une dimension : la variance est
maximale en ne retenant que les valeurs
extrmes dun chantillon). Ce rsultat est
contraire aux proprits attendues dun indice de diversit. Les auteurs ont tabli que
lutilisation de distances ultramtriques corrige ce dfaut. Lindice atteint alors son
maximum pour des frquences dautant plus
grandes que lespce est originale (Pavoine
et al., 2005a).
Lestimation empirique de lindice se fait
simplement en estimant les probabilits par
les frquences. Le biais destimation na pas
t tudi, mais il est probablement trs
faible, par analogie avec lestimateur de
lindice de Simpson : les espces rares interviennent peu.

Calcul sous R
Le package entropart fournit la fonction
Rao.P :
> # Vecteur des probabilits
> Ps <- Paracou618.MC$Ps
> Rao.P(Ps, Paracou618.Taxonomy)
[1] 0.9593776

Le package ADE4 permet le calcul avec la


fonction divc qui utilise un format diffrent
pour les probabilits et surtout la matrice des
racines carres du double des distances de
lobjet phylog (chaque lment de $Wdist

vaut 2 pour des raisons propres


ADE4) au lieu de larbre lui-mme :
> divc(as.data.frame(Ps),
Paracou618.Taxonomy$Wdist)

divc peut traiter plusieurs communauts simultanment ; Rao.P peut tre utilis avec la
fonction apply :
> divc(as.data.frame
(Paracou618.MC$Psi),
Paracou618.Taxonomy$Wdist)
diversity
P006 2.820856
P018 2.876405
> apply(Paracou618.MC$Psi, 2,
Rao.P, Paracou618.Taxonomy)
P006
P018
2.820856 2.876405

Maximum thorique
Pavoine et al. (2005a) ont dfini loriginalit
dune espce comme sa frquence maximisant lentropie quadratique, sachant la matrice de distances entre espces. Les espces
les plus originales sont celles ayant le moins
despces proches dans la classification.
Loriginalit nest pas intressante dans une
taxonomie : une phylognie doit tre cre
pour illustrer cette notion. Le fichier
rao.traits.csv contient une espce par ligne,
identifie par le champ Code, et un certain
nombre de valeurs de traits en colonnes.
> # Lecture des donnes : traits
pour 34 espces
> read.csv2
("http://www.ecofog.gf/IMG/csv/rao.
traits.csv", row.names=1,
header=T)-> traits

Le rsultat est un data frame nomm traits


8 lignes (espces) et 6 colonnes (traits) :
> # Aperu
> traits[1:4, 1:3]
SLA
Am
Ess 10.10341 97.88627
Me 14.27473 63.52255
S1 13.71211 73.57748
Sr 10.71081 68.03988

Gm
1.454455
1.493502
1.963457
1.305796

La matrice de distances est cre par classification automatique hirarchique.


57

Mesures de la biodiversit

Thick

CvsN

SLA

Ef

> # Transformation de l'arbre du


format hclust au format phylog
> phyf <- hclust2phylog(hf)
> # Affichage avec poids des
variables, Figure 29.
> table.phylog(pcaf$tab[names
(phyf$leaves),], phyf)

Gm

d=

Le rsultat de la classification est un objet


hclust qui doit tre transform en phylog
pour la suite de lanalyse :

Am

> # ACP sur les traits foliaires


> pcaf <- dudi.pca(traits, scale=T,
scannf=FALSE, nf=2)
# Figure 27
> scatter(pcaf)

Vm

Sr
Me

Dg

Ess
S1

Ess

Sr
Bg

Me

SLA

Thick

S1
Am

CvsN

Bg
Gm

Ef

Figure 27 : ACP sur les traits foliaires

Vm

pcaf est une liste qui contient les rsultats de


lACP, utiliser pour la classification :

Dg
-1.5

> # CAH Ward des traits foliaires


> hf <- hclust(dist(pcaf$tab),
"ward")

Figure 29 : Classification automatique des espces,


reprsente par table.phylog

10
8
6
Height
4

Le calcul de loriginalit des espces utilise


la fonction originality :
Dg

Vm

Ef

Bg

S1

Me

Ess

Sr

2
0

2.5

La limite des distances ultramtriques est


leur tendance dformer le jeu de points.
Dans cet exemple, les deux premiers axes de
lACP rendent compte de presque toute
linertie. Le nuage de points est pratiquement contenu dans un plan alors que sa reprsentation en distance ultramtrique est
une hypersphre en 7 dimensions (voir
Pavoine et al., 2005b).

Cluster Dendrogram

dist(pcaf$tab)
hclust (*, "ward")

Figure 28 : Classification automatique des espces


> # Figure 28
> plot(hf, h=-1)

58

-0.5 0.5 1.5

> dotchart.phylog(phyf,
originality(phyf, 5))

La fonction a pour paramtres lobjet phylog


contenant la classification et le numro de la
mthode de calcul utiliser, 5 pour
lentropie quadratique. Sa reprsentation
graphique est faite par dotchart.phylog :

Diversit fonctionnelle et phylogntique

Le deuxime terme de la somme est la diversit inter-communauts. Cest un indice


de Rao : les poids des communauts sont
quivalents aux tableaux de frquences et
les dissimilarits entre communauts sont
quivalentes aux dissimilarits entre espces
de lquation (78). La divergence entre
communauts est construite partir des entropies de chacune : lentropie est dfinie
comme la diffrence entre les entropies et
.

QEbased

Lexemple suivant utilise les communauts


du fichier rao.effectifs.csv :

-1

> # Vecteur contenant 8 espces...


> (read.csv2
("http://www.ecofog.gf/IMG/csv/rao.
effectifs.csv", row.names=1,
header=T)-> effectifs)
P1 P2 P3 P4
Ess 97 36 34 61
Me 62 24 49 4
S1
4 6 6 75
Sr 71 78 99 36
Vm 76 29 34 2
Bg 58 49 47 19
Ef
9 34 91 35
Dg 98 14 95 14

Figure 30 : Originalit des espces

Loriginalit (Figure 30) ne repose que sur


larbre, pas sur la frquence des espces.
Si la distance utilise nest pas ultramtrique, il existe plusieurs distributions possibles despces qui maximisent la diversit
(Pavoine et Bonsall, 2009), le concept
doriginalit na pas de sens dans ce cas.

Il contient 4 communauts.

Dcomposition

Pour obtenir tous les lments de lquation


(80) :

La diversit de la mta-communaut, peut


tre dcompose en une somme (pondre)
de diversits intra et une diversit inter
(Pavoine et al., 2004) en dfinissant une
dissimilarit entre les communauts et :
+

2

, = 2

+ ,

(80)

() : diversit totale. Calculer en


sommant les communauts. Calculer ensuite lentropie quadratique avec divc :
> (tabF<-apply(effectifs [names
(phyf$leaves), ],MARGIN=1,sum))
Sr Ess Me S1 Bg Ef Vm Dg
284 228 139 91 173 169 141 221
> divc(as.data.frame(tabF),
phyf$Wdist)
diversity
tabF 5.870667

(79)

Elle est dfinie par Rao (1982) comme la


diffrence entre lentropie quadratique du
mlange des deux communauts et celles
des deux communauts prises individuellement. Elle peut tre utilise pour calculer un
indice de diversit entre communauts, de la
mme faon quon calcule la diversit entre
espces dune communaut :
() = ( )

( ) : diversit de chaque communaut, fournie par divc :

> divc(effectifs [names


(phyf$leaves), ], phyf$Wdist)
diversity
P1 5.816719
P2 5.897210
P3 5.744483
P4 4.790586

59

Mesures de la biodiversit

La variabilit inter-communauts peut


tre calcule par divc en utilisant la distance fournie par disc, en dfinissant la
matrice des poids (gale aux effectifs) :
> divc(as.data.frame
(colSums(effectifs)),
disc(effectifs[names(phyf$leaves),]
, phyf$Wdist))
diversity
colSums(effectifs) 0.2362187

La fonction disc calcule 2 , :


> disc(effectifs[names
(phyf$leaves), ], phyf$Wdist)
P1
P2
P3
P2 0.4698121
P3 0.4888729 0.6487916
P4 1.0018983 0.8776582 1.3157902

Cette partition suppose que les poids des


communauts sont proportionnels leur
nombre dindividus (Rao, 1982 ; Villeger et
Mouillot, 2008). Hardy et Senterre (2007)
dcomposent (par diffrence entre et )
lindice de Rao de communauts de poids
gaux. Hardy et Jost (2008) montrent que
les deux pondrations sont valides mais
labsence de cadre gnral assurant que la
diversit de Rao est suprieure la diversit motive Guiasu et Guiasu (2011)
proposer une alternative lindice de Rao,
lindice de Gini-Simpson quadratique pondr, dont la concavit est dmontre (ce qui
implique que ), mais dont les autres
proprits restent explorer. La pondration
peut en fait tre quelconque tant que larbre
est ultramtrique, ce rsultat sera obtenu
dans le cadre plus gnral de la dcomposition de lentropie phylogntique (page 63).
La partition peut tre faite avec la fonction
DivPart :
> # Cration d'une mtacommunaut,
poids gaux aux effectifs
> MC <- MetaCommunity(effectifs,
colSums(effectifs))
> DivPart(q=2, MC, Tree=phyf,
Normalize=FALSE)
$TotalAlphaEntropy
[1] 5.634448
$CommunityAlphaEntropies
P1
P2
P3
P4
5.816719 5.897210 5.744483 4.790586

60

$TotalBetaEntropy
[1] 0.2362187
$GammaEntropy
[1] 5.870667

Alternatives
Guiasu et Guiasu (2011) proposent lindice
introduit plus haut :
GSW = (1 )

(81)

Izsk et Pavoine (2011) proposent deux variantes de lindice de Rao dans lesquelles la
distance entre espces dpend de leurs probabilits :
L1 = ( )2

L2 = (ln ln )2

(82)

FAD et MFAD
Les indices FAD et MFAD sont des mesures
de divergence non pondres.
FAD a t propos par Walker et al. (1999),
partir dune matrice de distances dans
lespace des traits (non ultramtrique).
est la distance entre deux espces indices
par et l, alors :
FAD =

(83)

FAD est trs sensible au nombre despces.


Sa version normalise, MFAD (Schmera et
al., 2009) est :
MFAD =

(84)

Les deux indices ont t dvelopps pour


lcologie fonctionnelle. Ils ne prennent pas
en compte la frquence des espces. un
facteur de normalisation prs, ce sont des
cas particuliers de lindice de Rao pour des
effectifs gaux.

Diversit fonctionnelle et phylogntique

Le calcul sous R est simple avec un arbre au


format phylog dADE4 :
> Tree <- Paracou618.Taxonomy
> (FAD <- sum(Tree$Wdist^2/2))
[1] 264159
> (MFAD <- FAD/length(Tree$leaves))
[1] 621.5506

Mesures dentropie
phylogntique
Gnralisation de lentropie
HCDT

Hp et I1
Simultanment, Pavoine et al. (2009) et
Allen et al. (2009) ont propos la gnralisation de lindice de Shannon la diversit
phylogntique. La prsentation de Allen et
al. est donne ici, celle de Pavoine et al.,
plus gnrale, sera dtaille dans le paragraphe suivant.
tant donn une phylognie, comme celle de
la Figure 26, on dfinit pour la branche :
(), la somme des probabilits des feuilles
de la branche, () la longueur la branche.
Par exemple, sur la figure, la branche a
une valeur () gale la somme des probabilits doccurrence des espces 4 et 5
alors que () est seulement la probabilit
de lespce 5.
Lindice dentropie phylogntique est :

= () () ln ()
b

(85)

Dans un arbre parfaitement rgulier, toutes


les branches sont de longueur 1 et est
lindice de Shannon.

Figure 31 : Arbre phylogntique hypothtique


(Chao et al., 2010, figure 1a).

Pavoine et al. (2009) dcoupent larbre phylogntique en priodes. partir de la racine de larbre, une nouvelle priode est
dfinie chaque ramification dune branche
quelconque. Les dbuts et fins de priodes
sont nots , la racine de larbre est fixe
0 = 0. Larbre est ultramtrique.

Nous suivrons plutt les notations de Chao


et al. (2010) en numrotant les priodes
partir du prsent et en notant leur dure.
Figure 31, la premire priode se termine
quand les branches des espces 2 et 3 se
rejoignent. Larbre comprend = 3 priodes.

Lentropie HCDT ( de lquation (44))


est calcule chaque priode. Figure 31, la
deuxime priode (2 ), larbre a trois
feuilles, avec des probabilits gales celle
de lespce 1, la somme de celles des espces 2 et 3, et celle de lespce 4. peut
tre calcule avec ces valeurs de probabili
ts. On notera cette valeur dentropie o
le quantime de la priode.
61

Mesures de la biodiversit

Lindice de Pavoine et al. (2009) est la


somme des pondre par la dure de
chaque priode. Nous le normalisons par la
hauteur totale de larbre () pour dfinir

() :

() =

=1

(86)

Dans un arbre parfaitement rgulier, toutes


les branches sont de longueur 1, il ny a
quune seule priode, et = .

Shimatani (2001), puis Ricotta (2005)


avaient montr que lindice de Rao est la
somme pondre sur chaque priode de
lindice de Simpson, c'est--dire lgalit
(86) pour le cas particulier = 2.

(), gnralisent les mesures


Les indices
dentropie classique la diversit phylog () + 1 est gal PD ou
ntique : 0
1
() est lindice de
FD, () est et 2
Rao. On peut les interprter intuitivement
comme une somme pondre par la longueur des priodes des valeurs de lentropie
chaque priode. la dernire priode
(prs des feuilles), toutes les classes sont
prsentes, la diversit est donc maximale.
En remontant dans larbre, les classes se
confondent et la diversit diminue progressivement. Deux classes peu distantes,
comme les espces 2 et 3 de la Figure 26,
apportent peu de diversit supplmentaire
par rapport une situation o les deux espces seraient confondues (et leurs effectifs
ajouts), contrairement aux espces 4 et 5.

Biais dchantillonnage
La correction du biais dchantillonnage
applicable lentropie gnralise lest aussi
chaque priode de larbre. Les biais sont
de moins en moins importants quand on se
rapproche de la racine de larbre (il est de
moins en moins probable de ne pas observer
une classe quand les classes sont de plus en
plus vastes).
Le package entropart fournit les fonctions
PhyloEntropy.P et PhyloEntropy.N pour
() partir dun vecteur de procalculer
62

babilit ou dabondances. Dans le dernier


cas, la correction de Tsallis.N est applique
chaque priode.
Exemple : le package contient les donnes
dinventaire de deux hectares du dispositif
de Paracou et la taxonomie des espces concernes. Le calcul de lindice de Rao, corrig du biais dchantillonnage utilise le code
suivant :
> data(Paracou618)
> PhyloEntropy.N(Paracou618.MC$Ns,
2, Paracou618.Taxonomy)
$Cuts
1
2
3
0.9863382 0.9710063 0.9234575
$Total
[1] 0.9602673

La fonction retourne la valeur de dans


chaque intervalle (larbre est ici une taxonomie espce-genre-famille, correspondant
aux limites (Cuts) 1, 2 et 3 dont lentropie
().
va en dcroissant) et la valeur de

Entropie et diversit

() peut tre transforme en

Lentropie

diversit de la mme faon que =


(Marcon et Hrault, submitted-b) :

() =

()

(87)

Chao et al. (2010) obtiennent ce rsultat


sans recourir lentropie, mais en moyen
nant la diversit chaque priode de
faon respecter le principe de rplication
(voir page 37) :

() =

1
1

(88)

est lensemble des branches de larbre.


Chaque branche, indexe par , se situe dans
une priode : toutes les branches de la priode sont de mme longueur . Les probabilits associes aux branches, , sont la
somme des probabilits des espces situes

Diversit fonctionnelle et phylogntique

sur les feuilles lies la branche. Figure 31,


larbre possde 9 branches dont les probabilits sont notes en dessous de leur nud
basal.
Attention : les entropies ont un comportement linaire : elles sadditionnent tout au
(). Les
long de larbre pour donner

diversits calcules chaque priode ne


peuvent pas tre sommes sur le modle de
() nest pas la
lquation (86) :
moyenne pondre des diversits aux diffrentes priodes, sauf dans le cas particulier
= 1 o, comme pour la dcomposition de
lindice de Shannon, il en est la moyenne
gomtrique pondre.
Les fonctions PhyloDiversity.P et PhyloDiversity.N de entropart permettent de calculer

(). la suite de lexemple prcdent,

les rsultats sont prsents sous forme de


diversit au lieu dentropie :
> PhyloDiversity.N(
Paracou618.MC$Ns, 2,
Paracou618.Taxonomy)
$Cuts
1
2
3
73.19676 34.49020 13.06463

Lentropie phylogntique est une combinaison linaire de lentropie HCDT donc sa


dcomposition est identique (Marcon et
Hrault, submitted-b). En combinant
lquation (86) et le Tableau 4, on obtient :
(89)

Lentropie est celle de la mta communaut, lentropie est la somme pondre de


celles des communauts, la pondration est
libre mais doit respecter = :

()

()
=

=
() =

= lnq

(91)

o est la probabilit dobserver une des


espces de la branche de larbre la priode (Figure 32) dans la mta communaut, la mme probabilit dans la communaut .
1

La fonction DivPart de entropart permet de


dcomposer lentropie. Les rsultats contiennent la valeur de la diversit :

Dcomposition

=
() + ()

()

Figure 32 : Notations pour la dcomposition de


lentropie phylogntique. En haut : arbre entier,
en bas gauche, arbre sans la premire priode,
en bas droite, dernire priode seule.

$Total
[1] 25.16819

()

Lentropie est :

(90)

> data(Paracou618)
> DivPart(q = 1, Paracou618.MC,
Biased = FALSE,
Tree=Paracou618.Taxonomy)
$TotalAlphaDiversity
[1] 42.70238
$TotalBetaDiversity
[1] 1.291119
$GammaDiversity
[1] 55.13383
$CommunityAlphaDiversities
P006
P018
37.22132 51.31045
$TotalAlphaEntropy
[1] 3.754255
$TotalBetaEntropy
[1] 0.2555089
$GammaEntropy
[1] 4.009764

63

Mesures de la biodiversit

t. La diffrence de taille entre les rectangles


hachurs et les rectangles transparents est
due la prise en compte de la phylognie.
La diversit (rectangles de hauteur 1) est
gale au produit des diversits et (cts
du rectangle plus haut). Si les communauts
taient compltement diffrentes, la hauteur
du rectangle serait gal leur nombre (2 ici).

1.0
0.5

Arbres non ultramtriques

0.0

diversity

1.5

2.0

$CommunityAlphaEntropies
P006
P018
3.616882 3.937894

20

40

60

80

100

120

/ diversity

Figure 33 : Reprsentation graphique de la diversit des deux parcelles du jeu de donnes Paracou618. Les rectangles transparents reprsentent
la diversit neutre, les rectangles hachurs la diversit phylogntique (larbre est la taxonomie
des espces, = ). Dans chaque cas, le rectangle
le plus large, de hauteur 1, reprsente la diversit
. Le rectangle plus haut a pour largeur et longueur les diversits et . Les surfaces des deux
rectangles sont identiques.

La Figure 33 12 donne une reprsentation


graphique de la dcomposition de la diversi12

Code pour raliser la figure :

> data(Paracou618)
> q <- 1
> (Neutre <- DivPart(q,
Paracou618.MC, Biased = FALSE))
> plot(c(0, Neutre$GammaDiversity),
c(0, Paracou618.MC$Ncommunities),
type = "n", xlab =
expression(paste(alpha, " / ",
gamma, " diversity")), ylab =
expression(paste(beta, "
diversity")))
> rect(0, 0, Neutre$GammaDiversity,
1, lty=2)
> rect(0, 0,
Neutre$TotalAlphaDiversity,
Neutre$TotalBetaDiversity, lty=2)
> (Phylo <- DivPart(q,
Paracou618.MC, Biased = FALSE,
Tree=Paracou618.Taxonomy))
> rect(0, 0, Phylo$GammaDiversity,
1, angle=135, density=10)
> rect(0, 0,
Phylo$TotalAlphaDiversity,
Phylo$TotalBetaDiversity,
density=10)

64

Chao et al. (2010) dfinissent la diversit


phylogntique selon lquation (86) quelle
que soit la forme de larbre, y compris sil
nest pas ultramtrique. Dans ce cas, est
remplac par , la longueur moyenne des
branches pondre par la frquence des espces. Cette gnralisation est trs discutable : son sens nest pas clair sur le plan de
la mesure de la diversit au-del du paralllisme de la forme mathmatique.
Larbre de la Figure 34 peut tre dcoup en
priodes mais les deux premires (1 : seule
lespce 2 est prsente ; 2 : les espces 1 et
2 sont prsentes) sont incompltes au sens
o la somme des probabilits ny est pas

gale 1 donc 1 ne dfinit pas une


diversit ces priodes.

Figure 34 : Arbre phylogntique hypothtique


non ultramtrique (Chao et al., 2010, figure 1b).

Pavoine et Bonsall (2009) traitent en dtail


les rsultats aberrants que cause un arbre

Diversit fonctionnelle et phylogntique

non ultramtrique dans le cas particulier de


lentropie de Rao.
Dans ltat actuel des connaissances, aucune
mthode nest applicable de faon satisfaisante aux arbres non ultramtriques.

Rgularit
Lindice + (Clarke et Warwick, 2001) mesure la variance des distances entre paires
despces :

2

=
( 1)
+

(92)

Cadotte et al. (2010) proposent 6 autres mesures de rgularit.


Comme le montrent Mrigot et Gaertner
(2011), les mesures de rgularit nont absolument pas les mmes proprits que les
mesures de diversit : elles peuvent par
exemple augmenter quand on retire des espces originales.

65

CONCLUSION
La biodiversit peut tre mesure de faon
claire et rigoureuse en utilisant lentropie
phylogntique.
Diversit phylogntique
PD / FD
Entropie
phylogntique

I1 / Hp
Rao

q quelconque

Entropie de
Tsallis

q =0, 1 ou 2
Richesse

Shannon
Simpson

Diversit neutre
Figure 35 : Arbre phylogntique hypothtique
non ultramtrique (Chao et al., 2010, figure 1b).

Cette mesure gnralise les indices de diversit classique (Figure 35), traduit clairement
la correspondance entre lentropie et la diversit au sens strict, intgre si ncessaire la
distance entre espces, peut tre dcompose et corrige des biais destimation. Sa

transformation en diversit au sens strict


permet dinterprter les valeurs sous une
forme unique : un nombre quivalent
despces et un nombre quivalent de communauts.
Le package entropart permet de calculer
avec R la diversit dune mta-communaut
partir de donnes dabondances et dun
arbre phylogntique ou fonctionnel.
Dautres mesures de diversit ont t prsentes ici, dautres encore peuvent tre
trouves dans la littrature. Elles ont en gnral un moins bon support mathmatique,
surtout les mesures de diversit , ne peuvent pas tre dcomposes, corriges ou
interprtes. La diversit de Hurlbert possde toutes ses proprits et une correction
trs efficace du biais destimation, mais elle
nest pas gnralise la diversit phylogntique.
La recherche sur la mesure de la diversit
est trs active, ce document volue donc
rgulirement pour prendre en compte les
avances rcentes.

67

BIBLIOGRAPHIE
Adelman, M. A. (1969). Comment on the "H" Concentration Measure as a Numbers-Equivalent.
The Review of Economics and Statistics 51(1): 99-101.
Allen, B., Kon, M. et Bar-Yam, Y. (2009). A New Phylogenetic Diversity Measure
Generalizing the Shannon Index and Its Application to Phyllostomid Bats. American
Naturalist 174(2): 236-243.
Alonso, D. et McKane, A. J. (2004). Sampling Hubbell's neutral theory of biodiversity. Ecology
Letters 7(10): 901-910.
Arrhenius, O. (1921). Species and Area. Journal of Ecology 9(1): 9599.
Baraloto, C., Paine, C. E. T., Poorter, L., Beauchene, J., Bonal, D., Domenach, A. M.,
Herault, B., Patino, S., Roggy, J. C. et Chave, J. (2010a). Decoupled leaf and stem
economics in rain forest trees. Ecology Letters 13(11): 1338-1347.
Baraloto, C., Paine, C. E. T. P., Patio, S., Bonal, D., Hrault, B. et Chave, J. (2010b).
Functional trait variation and sampling strategies in species rich plant communities.
Functional Ecology 24: 208-216.
Baselga, A. (2010). Multiplicative partition of true diversity yields independent alpha and beta
components; additive partition does not. Ecology 91(7): 1974-1981.
Basharin, G. P. (1959). On a Statistical Estimate for the Entropy of a Sequence of Independent
Random Variables. Theory of Probability and its Applications 4(3): 333-336.
Beck, J. et Schwanghart, W. (2010). Comparing measures of species diversity from incomplete
inventories: an update. Methods in Ecology and Evolution 1(1): 38-44.
Berger, W. H. et Parker, F. L. (1970). Diversity of planktonic foraminifera in deep-sea
sediments. Science 168(3937): 1345-1347.
Bonachela, J. A., Hinrichsen, H. et Muoz, M. A. (2008). Entropy estimates of small data sets.
Journal of Physics A: Mathematical and Theoretical 41(202001): 1-9.
Bordenave, B. G. et De Granville, J. J. (1998). Les mesures de la biodiversit : un outil de
conservation en fort guyanaise. JATBA, Revue d'Ethnobiologie 40(1-2): 433-446.
Bordenave, B. G., De Granville, J. J. et Steyn, K. (2011). Quantitative botanical diversity
descriptors to set conservation priorities in Bakhuis Mountains rainforest, Suriname.
Botanical Journal of the Linnean Society 167(1): 94-130.
Borland, L., Plastino, A. R. et Tsallis, C. (1998). Information gain within nonextensive
thermostatistics. Journal of Mathematical Physics 39(12): 6490-6501.
Bourguignon, F. (1979). Decomposable Income Inequality Measures. Econometrica 47(4): 901920.
Braun-Blanquet, J. (1928). Pflanzensoziologie: Grundzge der Vegetationskunde. Springer,
Berlin
Brillouin, L. (1962). Science and information theory. Academic Press, Oxford
Brose, U., Martinez, N. D. et Williams, R. J. (2003). Estimating species richness: Sensitivity to
sample coverage and insensitivity to spatial patterns. Ecology 84(9): 2364-2377.
69

Mesures de la biodiversit

Bulmer, M. G. (1974). On Fitting the Poisson Lognormal Distribution to Species-Abundance


Data. Biometrics 30(1): 101-110.
Burnham, K. P. et Overton, W. S. (1979). Robust Estimation of Population Size When Capture
Probabilities Vary Among Animals. Ecology 60(5): 927936.
Cadotte, M. W., Davies, T. J., Regetz, J., Kembel, S. W., Cleland, E. et Oakley, T. H.
(2010). Phylogenetic diversity metrics for ecological communities: integrating species
richness, abundance and evolutionary history. Ecology Letters 13(1): 96-105.
Cailliez, F. (1983). The analytical solution of the additive constant problem. Psychometrika 48:
305-310.
Cavender-Bares, J., Kozak, K. H., Fine, P. V. A. et Kembel, S. W. (2009). The merging of
community ecology and phylogenetic biology. Ecology Letters 12(7): 693-715.
Ceriani, L. et Verme, P. (2012). The origins of the Gini index: extracts from Variabilit e
Mutabilit (1912) by Corrado Gini. Journal of Economic Inequality 10(3): 421-443.
Chao, A. (1984). Nonparametric estimation of the number of classes in a population.
Scandinavian Journal of Statistics 11: 265-270.
Chao, A. (1987). Estimating the population size for capture-recapture data with unequal
catchability. Biometrics 43(4): 783-791.
Chao, A. (2004). Species richness estimation. in N. Balakrishnan, C. B. Read et B. Vidakovic,
(Eds), Encyclopedia of Statistical Sciences. Wiley, New York.
Chao, A., Chiu, C.-H. et Hsieh, T. C. (2012). Proposing a resolution to debates on diversity
partitioning. Ecology 93(9): 2037-2051.
Chao, A., Chiu, C.-H. et Jost, L. (2010). Phylogenetic diversity measures based on Hill
numbers. Philosophical Transactions of the Royal Society B 365(1558): 3599-609.
Chao, A. et Jost, L. (2012). Coverage-based rarefaction and extrapolation: standardizing
samples by completeness rather than size. Ecology 93(12): 2533-2547.
Chao, A., Jost, L., Chiang, S. C., Jiang, Y. H. et Chazdon, R. L. (2008). A Two-Stage
Probabilistic Approach to Multiple-Community Similarity Indices. Biometrics 64(4): 11781186.
Chao, A. et Lee, S.-M. (1992). Estimating the Number of Classes Via Sample Coverage.
Journal of the American Statistical Association 87(417): 210-217.
Chao, A. et Shen, T.-J. (2010). Program SPADE: Species Prediction And Diversity Estimation.
Program and users guide. CARE. http://chao.stat.nthu.edu.tw/softwareCE.html.
Chao, A. et Shen, T. J. (2003). Nonparametric estimation of Shannon's index of diversity when
there are unseen species in sample. Environmental and Ecological Statistics 10(4): 429443.
Chapin, F. S., Zavaleta, E. S., Eviner, V. T., Naylor, R. L., Vitousek, P. M., Reynolds, H. L.,
Hooper, D. U., Lavorel, S., Sala, O. E., Hobbie, S. E., Mack, M. C. et Diaz, S. (2000).
Consequences of changing biodiversity. Nature 405(6783): 234-242.
Chytr, M. et Otpkov, Z. (2003). Plot sizes used for phytosociological sampling of European
vegetation. Journal of Vegetation Science 14(4): 563-570.
Clarke, K. R. et Warwick, R. M. (2001). A further biodiversity index applicable to species
lists: variation in taxonomic distinctness. Marine Ecology-Progress Series 216: 265-278.

70

Bibliographie

Clench, H. K. (1979). How to make regional lists of butterflies: some thoughts. Journal of the
Lepidopterists' Society 33(4): 216-231.
Coleman, B. D. (1981). On random placement and species-area relations. Mathematical
Biosciences 54(3-4): 191-215.
Conceio, P. et Ferreira, P. (2000). The Young Persons Guide to the Theil Index: Suggesting
Intuitive Interpretations and Exploring Analytical Applications. UTIP Working Paper, 14,
Austin, Texas: 54 p.
Condit, R., Hubbell, S. P., Lafrankie, J. V., Sukumar, R., Manokaran, N., Foster, R. B. et
Ashton, P. S. (1996). Species-Area and Species-Individual Relationships for Tropical
Trees: A Comparison of Three 50-ha Plots. Journal of Ecology 84(4): 549-562.
Connor, E. F. et McCoy, E. D. (1979). The Statistics and Biology of the Species-Area
Relationship. The American Naturalist 113(6): 791-833.
Cornelissen, J. H. C., Lavorel, S., Garnier, E., Diaz, S., Buchmann, N., Gurvich, D. E.,
Reich, P. B., Steege, H. t., Morgan, H. D., Heijden, M. G. A. v. d., Pausas, J. G. et
Poorter, H. (2003). A handbook of protocols for standardised and easy measurement of
plant functional traits worldwide. Australian Journal of Botany 51(4): 335-380.
Cousins, S. H. (1991). Species diversity measurement: Choosing the right index. Trends in
Ecology and Evolution 6(6): 190-192.
Couteron, P. et Plissier, R. (2004). Additive apportioning of species diversity: towards more
sophisticated models and analyses. Oikos 107(1): 215-221.
Crist, T. O., Veech, J. A., Gering, J. C. et Summerville, K. S. (2003). Partitioning species
diversity across landscapes and regions: A hierarchical analysis of alpha, beta, and gamma
diversity. The American Naturalist 162(6): 734-743.
Dalton, H. (1920). The measurement of the inequality of incomes. The Economic Journal
30(119): 348-361.
Darczy, Z. (1970). Generalized information functions. Information and Control 16(1): 36-51.
Dauby, G. et Hardy, O. J. (2012). Sampled-based estimation of diversity sensu stricto by
transforming Hurlbert diversities into effective number of species. Ecography 35(7): 661672.
Davis, H. T. (1941). The theory of econometrics. The Principia Press, Bloomington, Indiana
Drakare, S., Lennon, J. J. et Hillebrand, H. (2006). The imprint of the geographical,
evolutionary and ecological context on speciesarea relationships. Ecology Letters 9(2):
215-227.
Ellison, A. M. (2010). Partitioning diversity. Ecology 91(7): 1962-1963.
Eren, M. I., Chao, A., Hwang, W. H. et Colwell, R. K. (2012). Estimating the Richness of a
Population When the Maximum Number of Classes Is Fixed: A Nonparametric Solution to
an Archaeological Problem. PLoS One 7(5).
Esty, W. W. (1983). A Normal Limit Law for a Nonparametric Estimator of the Coverage of a
Random Sample. The Annals of Statistics 11(3): 905-912.
Faith, D. P. (1992). Conservation evaluation and phylogenetic diversity. Biological
Conservation 61(1): 1-10.

71

Mesures de la biodiversit

Fisher, R. A., Corbet, A. S. et Williams, C. B. (1943). The relation between the number of
species and the number of individuals in a random sample of an animal population.
Journal of Animal Ecology 12: 42-58.
Grcia Martn, H. et Goldenfeld, N. (2006). On the origin and robustness of power-law
species-area relationships in ecology. Proceedings of the National Academy of Sciences
103(27): 10310-10315.
Gaston, K. J. (2000). Global patterns in biodiversity. Nature 405(6783): 220-227.
Gini, C. (1912). Variabilit e mutabilit. Studi Economico-Giuridici dellUniversit di Cagliari,
Universit di Cagliari. 3: 1-158.
Gleason, H. A. (1922). On the Relation Between Species and Area. Ecology 3(2): 158-162.
Good, I. J. (1953). On the Population Frequency of Species and the Estimation of Population
Parameters. Biometrika 40(3/4): 237-264.
Gotelli, N. J. et Colwell, R. K. (2001). Quantifying biodiversity: procedures and pitfalls in the
measurement and comparison of species richness. Ecology Letters 4(4): 379-391.
Gower, J. C. (1971). A General Coefficient of Similarity and Some of Its Properties. Biometrics
27(4): 857-871.
Grassberger, P. (1988). Finite sample corrections to entropy and dimension estimates. Physics
Letters A 128(67): 369-373.
Grassberger, P. (2003). Entropy Estimates from Insufficient Samplings. ArXiv Physics e-prints
0307138.
Grilli, J., Azaele, S., Banavar, J. R. et Maritan, A. (2012). Spatial aggregation and the
speciesarea relationship across scales. Journal of Theoretical Biology 313(0): 87-97.
Guiasu, R. C. et Guiasu, S. (2011). The weighted quadratic index of biodiversity for pairs of
species: a generalization of Raos index. Natural Science 3(9): 795-801.
Hankin, R. K. S. (2007). Introducing untb, an R Package For Simulating Ecological Drift Under
the Unified Neutral Theory of Biodiversity. Journal of Statistical Software 22(12): 1-15.
Hardy, O. J. (2010). BiodivR 1.2. A program to compute statistically unbiased indices of species
diversity within sample and species similarity between samples using rarefaction
principles. http://ebe.ulb.ac.be/ebe/Software.html.
Hardy, O. J. et Jost, L. (2008). Interpreting and estimating measures of community
phylogenetic structuring. Journal of Ecology 96(5): 849-852.
Hardy, O. J. et Senterre, B. (2007). Characterizing the phylogenetic structure of communities
by an additive partitioning of phylogenetic diversity. Journal of Ecology 95(3): 493-506.
Harte, J., Kinzig, A. et Green, J. (1999). Self-similarity in the distribution and abundance of
species. Science 284(5412): 334-336.
Havrda, J. et Charvt, F. (1967). Quantification method of classification processes. Concept of
structural -entropy. Kybernetika 3(1): 30-35.
Hill, M. O. (1973). Diversity and Evenness: A Unifying Notation and Its Consequences.
Ecology 54(2): 427-432.
Hoffmann, S. et Hoffmann, A. (2008). Is there a true diversity? Ecological Economics 65(2):
213-215.
Horvitz, D. G. et Thompson, D. J. (1952). A generalization of sampling without replacement
from a finite universe. Journal of the American Statistical Association 47(260): 663-685.
72

Bibliographie

Hubbell, S. P. (2001). The unified neutral theory of biodiversity and biogeography. Princeton
University Press
Hubbell, S. P., Condit, R. et Foster, R. B. (2005). Barro Colorado Forest Census Plot Data.
https://ctfs.arnarb.harvard.edu/webatlas/datasets/bci.
Hurlbert, S. H. (1971). The Nonconcept of Species Diversity: A Critique and Alternative
Parameters. Ecology 52(4): 577-586.
Izsk, J. et Pavoine, S. (2011). New concentration measures as kinds of the quadratic entropy.
Ecological Indicators 11(2): 540-544.
Izsk, J. et Pavoine, S. (2012). Links between the species abundance distribution and the shape
of the corresponding rank abundance curve. Ecological Indicators 14(1): 1-6.
Jensen, J. L. W. V. (1906). Sur les fonctions convexes et les ingalits entre les valeurs
moyennes. Acta Mathematica 30(1): 175-193.
Jones, D. et Matloff, N. (1986). Statistical Hypothesis Testing in Biology: A Contradiction in
Terms. Journal of Economic Entomology 79(5): 1156-1160.
Jost, L. (2006). Entropy and diversity. Oikos 113(2): 363-375.
Jost, L. (2007). Partitioning diversity into independent alpha and beta components. Ecology
88(10): 2427-2439.
Jost, L. (2008). GST and its relatives do not measure differentiation. Molecular Ecology 17(18):
4015-4026.
Jost, L. (2009). Mismeasuring biological diversity: Response to Hoffmann and Hoffmann
(2008). Ecological Economics 68: 925-928.
Jost, L. (2010). Independence of alpha and beta diversities. Ecology 91(7): 1969-1994.
Jurasinski, G., Retzer, V. et Beierkuhnlein, C. (2009). Inventory, differentiation, and
proportional diversity: a consistent terminology for quantifying species diversity.
Oecologia 159(1): 15-26.
Kempton, R. A. et Taylor, L. R. (1974). Log-series and log-normal parameters as diversity
discriminators for Lepidoptera. Journal of Animal Ecology 43(2): 381-399.
Kempton, R. A. et Taylor, L. R. (1976). Models and statistics for species diversity. Nature
262(5571): 818-820.
Kempton, R. A. et Wedderburn, R. W. M. (1978). A comparison of three measures of species
diversity. Biometrics 34: 25-37.
Keylock, C. J. (2005). Simpson diversity and the Shannon-Wiener index as special cases of a
generalized entropy. Oikos 109(1): 203-207.
Kindt, R., Van Damme, P. et Simons, A. J. (2006). Tree diversity in western Kenya: Using
profiles to characterise richness and evenness. Biodiversity and Conservation 15(4): 12531270.
Krishnamani, R., Kumar, A. et Harte, J. (2004). Estimating species richness at large spatial
scales using data from small discrete plots. Ecography 27(5): 637-642.
Kullback, S. et Leibler, R. A. (1951). On Information and Sufficiency. The Annals of
Mathematical Statistics 22(1): 79-86.
Lande, R. (1996). Statistics and partitioning of species diversity, and similarity among multiple
communities. Oikos 76: 5-13.
73

Mesures de la biodiversit

Leinster, T. et Cobbold, C. (2011). Measuring diversity: the importance of species similarity.


Ecology.
Lin, J. (1991). Divergence Measures Based on the Shannon Entropy. IEEE Transactions on
Information Theory 37(1).
Lineweaver, H. et Burk, D. (1934). The Determination of Enzyme Dissociation Constants.
Journal of the American Chemical Society 56(3): 658-666.
Lloyd, M. et Ghelardi, R. J. (1964). A Table for Calculating the `Equitability' Component of
Species Diversity. Journal of Animal Ecology 33(2): 217-225.
Lonsdale, W. M. (1999). Global Patterns of Plant Invasions and the Concept of Invasibility.
Ecology 80(5): 1522-1536.
Lorenz, M. O. (1905). Methods of Measuring the concentration of Wealth. Quarterly
Publications of the American Statistical Association 9: 209-219.
Ludovisi, A. et Taticchi, M. I. (2006). Investigating beta diversity by Kullback-Leibler
information measures. Ecological Modelling 192(1-2): 299-313.
Maasoumi, E. (1993). A compendium to information theory in economics and econometrics.
Econometric Reviews 12(2): 137-181.
MacArthur, R. (1955). Fluctuations of Animal Populations and a Measure of Community
Stability. Ecology 36(3): 533-536.
MacArthur, R. H. (1957). On the Relative Abundance of Bird Species. Proceedings of the
National Academy of Sciences of the United States of America 43(3): 293-295.
MacArthur, R. H. (1965). Patterns of species diversity. Biological Reviews 40(4): 510-533.
Magurran, A. E. (1988). Ecological diversity and its measurement. Princeton University Press,
Princeton, NJ
Marcon, E. et Hrault, B. (submitted-a). entropart, an R package to partition diversity.
Methods in Ecology and Evolution.
Marcon, E. et Hrault, B. (submitted-b). Partitioning phylodiversity. Methods in Ecology and
Evolution.
Marcon, E., Hrault, B., Baraloto, C. et Lang, G. (2012). The Decomposition of Shannons
Entropy and a Confidence Interval for Beta Diversity. Oikos 121(4): 516-522.
Marcon, E., Scotti, I., Herault, B., Rossi, V. et Lang, G. (submitted). Generalization of the
partitioning of Shannon diversity. PLOS One.
May, R. M. (1975). Patterns of species abundance and diversity. in M. L. Cody et J. M.
Diamond, (Eds), Ecology and Evolution of Communities. Harvard University Press: 81120.
May, R. M. (2011). Why Worry about How Many Species and Their Loss? PLoS Biol 9(8):
e1001130.
May, R. M. et Stumpf, M. P. H. (2000). Species-Area Relations in Tropical Forests. Science
290(5499): 2084-2086.
McGill, B. J. (2003). A test of the unified neutral theory of biodiversity. Nature 422(6934): 881885.
McGill, B. J., Etienne, R. S., Gray, J. S., Alonso, D., Anderson, M. J., Benecha, H. K.,
Dornelas, M., Enquist, B. J., Green, J. L., He, F., Hurlbert, A. H., Magurran, A. E.,
Marquet, P. A., Maurer, B. A., Ostling, A., Soykan, C. U., Ugland, K. I. et White, E.
74

Bibliographie

P. (2007). Species abundance distributions: moving beyond single prediction theories to


integration within an ecological framework. Ecology Letters 10(10): 995-1015.
Mendes, R. S., Evangelista, L. R., Thomaz, S. M., Agostinho, A. A. et Gomes, L. C. (2008).
A unified index to measure ecological diversity and species rarity. Ecography 31(4): 450456.
Mrigot, B. et Gaertner, J.-C. (2011). Incorporation of phylogeny in biological diversity
measurement: Drawbacks of extensively used indices, and advantages of quadratic
entropy. BioEssays 33(11): 819-822.
Michaelis, L. et Menten, M. L. (1913). Die Kinetik der Invertinwirkung. Biochemische
Zeitschrift 49: 333-369.
Mora, C., Tittensor, D. P., Adl, S., Simpson, A. G. B. et Worm, B. (2011). How Many
Species Are There on Earth and in the Ocean? PLoS Biol 9(8): e1001127.
Morin, A. et Findlay, S. (2001). Biodiversit : tendances et
http://simulium.bio.uottawa.ca/bio3515/pdf/presentations/02-Biodiversite.pdf.

processus.

Mouillot, D. et Leprtre, A. (1999). A comparison of species diversity estimators. Researches


on Population Ecology 41(2): 203-215.
Mouillot, D., Mason, W. H. N., Dumay, O. et Wilson, J. B. (2005). Functional regularity: a
neglected aspect of functional diversity. Oecologia 142(3): 353-359.
Nei, M. (1973). Analysis of Gene Diversity in Subdivided Populations. Proceedings of the
National Academy of Sciences of the United States of America 70(12): 3321-3323.
Neyman, J. et Scott, E. L. (1958). Statistical Approach to Problems of Cosmology. Journal of
the Royal Statistical Society B 20(1): 1-43.
Norris, J. L. et Pollock, K. H. (1998). Non-parametric MLE for Poisson species abundance
models allowing for heterogeneity between species. Environmental and Ecological
Statistics 5(4): 391-402.
Oksanen, J., Blanchet, F. G., Kindt, R., Legendre, P., Minchin, P. R., O'Hara, R. B.,
Simpson, G. L., Solymos, P., Stevens, M. H. H. et Wagner, H. (2012). vegan:
Community Ecology Package. http://CRAN.R-project.org/package=vegan.
Pallmann, P., Schaarschmidt, F., Hothorn, L. A., Fischer, C., Nacke, H., Priesnitz, K. U. et
Schork, N. J. (2012). Assessing group differences in biodiversity by simultaneously
testing a user-defined selection of diversity indices. Molecular Ecology Resources 12(6):
1068-1078.
Patil, G. P. et Taillie, C. (1982). Diversity as a concept and its measurement. Journal of the
American Statistical Association 77(379): 548-561.
Pavoine, S. et Bonsall, M. B. (2009). Biological diversity: Distinct distributions can lead to the
maximization of Rao's quadratic entropy. Theoretical Population Biology 75(2-3): 153163.
Pavoine, S. et Bonsall, M. B. (2011). Measuring biodiversity to explain community assembly: a
unified approach. Biological Reviews 86(4): 792-812.
Pavoine, S., Dufour, A.-B. et Chessel, D. (2004). From dissimilarities among species to
dissimilarities among communities: a double principal coordinate analysis. Journal of
Theoretical Biology 228(4): 523537.
Pavoine, S., Love, M. S. et Bonsall, M. B. (2009). Hierarchical partitioning of evolutionary and
ecological patterns in the organization of phylogenetically-structured species assemblages:
75

Mesures de la biodiversit

Application to rockfish (genus: Sebastes) in the Southern California Bight. Ecology Letters
12(9): 898-908.
Pavoine, S., Ollier, S. et Dufour, A.-B. (2005a). Is the originality of a species measurable?
Ecology Letters 8: 579586.
Pavoine, S., Ollier, S. et Pontier, D. (2005b). Measuring, diversity from dissimilarities with
Rao's quadratic entropy: Are any dissimilarities suitable? Theoretical Population Biology
67(4): 231-239.
Plissier, R. et Couteron, P. (2007). An operational, additive framework for species diversity
partitioning and beta-diversity analysis. Journal of Ecology 95(2): 294-300.
Plissier, R., Couteron, P., Dray, S. et Sabatier, D. (2003). Consistency between ordination
techniques and diversity measurements: Two strategies for species occurrence data.
Ecology 84(1): 242-251.
Petchey, O. L. et Gaston, K. J. (2002). Functional diversity (FD), species richness and
community composition. Ecology Letters 5: 402-411.
Pielou, E. C. (1966a). The measurement of diversity in different types of biological collections.
Journal of Theoretical Biology 13(C): 131-144.
Pielou, E. C. (1966b). Species-diversity and pattern-diversity in the study of ecological
succession. Journal of Theoretical Biology 10(2): 370-383.
Pielou, E. C. (1969). An Introduction to Mathematical Ecology. Wiley, New York. 286
Pielou, E. C. (1975). Ecological Diversity. Wiley, New York
Plotkin, J. B., Potts, M. D., Yu, D. W., Bunyavejchewin, S., Condit, R., Foster, R. B.,
Hubbell, S. P., LaFrankie, J., Manokaran, N., Lee, H.-S., Sukumar, R., Nowak, M. A.
et Ashton, P. S. (2000). Predicting species diversity in tropical forests. Proceedings of the
National Academy of Sciences of the United States of America 97(20): 10850-10854.
Podani, J. (1999). Extending Gower's General Coefficient of Similarity to Ordinal Characters.
Taxon 48(2): 331-340.
Podani, J. et Schmera, D. (2006). On dendrogram-based measures of functional diversity.
Oikos 115(1): 179-185.
Preston, F. W. (1948). The Commonness, And Rarity, of Species. Ecology 29(3): 254-283.
Preston, F. W. (1960). Time and Space and the Variation of Species. Ecology 41(4): 611-627.
Preston, F. W. (1962). The Canonical Distribution of Commonness and Rarity: Part I. Ecology
43(2): 185-215.
R Development Core Team (2013). R: A Language and Environment for Statistical Computing.
R Foundation for Statistical Computing. http://www.R-project.org.
Rao, C. R. (1982). Diversity and dissimilarity coefficients: a unified approach. Theoretical
Population Biology 21(24-43).
Rnyi, A. (1961). On Measures of Entropy and Information. 4th Berkeley Symposium on
Mathematical Statistics and Probability, Berkeley, USA, University of California Press.
Ricotta, C. (2003). On parametric evenness measures. Journal of Theoretical Biology 222(2):
189-197.
Ricotta, C. (2005). Additive partitioning of Rao's quadratic diversity: a hierarchical approach.
Ecological Modelling 183(4): 365-371.
76

Bibliographie

Ricotta, C. (2007). A semantic taxonomy for diversity measures. Acta Biotheoretica 55(1): 2333.
Ricotta, C. (2010). On beta diversity decomposition: Trouble shared is not trouble halved.
Ecology 91(7): 1981-1983.
Ricotta, C. et Avena, G. (2003). An information-theoretical measure of -diversity. Plant
Biosystems 137(1): 57 - 61.
Ricotta, C., De Zuliani, E. et Pacini, A. (2001). On the mutual relatedness of evenness
measures. Community Ecology 2(1): 51-56.
Routledge, R. D. (1979). Diversity indices: Which ones are admissible? Journal of Theoretical
Biology 76(4): 503-515.
Scheiner, S. M. (2003). Six types of species-area curves. Global Ecology and Biogeography
12(6): 441-447.
Schmera, D., Ers, T. et Podani, J. (2009). A measure for assessing functional diversity in
ecological communities. Aquatic Ecology 43(1): 157-167.
Schulte, R. P. O., Lantinga, E. A. et Hawkins, M. J. (2005). A new family of Fisher-curves
estimates Fisher's alpha more accurately. Journal of Theoretical Biology 232(3): 305-313.
Schrmann, T. (2004). Bias analysis in entropy estimation. Journal of Physics A: Mathematical
and Theoretical 37(27): L295-L301.
Shannon, C. E. (1948). A Mathematical Theory of Communication. The Bell System Technical
Journal 27: 379423, 623656.
Shannon, C. E. et Weaver, W. (1963). The Mathematical Theory of Communication. University
of Illinois Press
Shen, T.-J., Chao, A. et Lin, C.-F. (2003). Predicting the number of new species in a further
taxonomic sampling. Ecology 84: 798-804.
Shimatani, K. (2001). On the measurement of species diversity incorporating species
differences. Oikos 93(1): 135-147.
Simpson, E. H. (1949). Measurement of diversity. Nature 163(4148): 688.
Smith, B. et Wilson, J. B. (1996). A consumer's guide to evenness indices. Oikos 76(1): 70-82.
Sobern M., J. et Llorente B., J. (1993). The Use of Species Accumulation Functions for the
Prediction of Species Richness. Conservation Biology 7(3): 480-488.
Sokal, R. R. et Michener, C. D. (1958). A statistical method for evaluating systematic
relationships. The University of Kansas Science Bulletin 38(22): 1409-1438.
Swenson, N. G. et Enquist, B. J. (2009). Opposing assembly mechanisms in a Neotropical dry
forest: Implications for phylogenetic and functional community ecology. Ecology 90(8):
2161-2170.
Theil, H. (1967). Economics and Information Theory. Rand McNally and Company, Chicago
Tothmeresz, B. (1995). Comparison of different methods for diversity ordering. Journal of
Vegetation Science 6(2): 283-290.
Triantis, K. A., Guilhaumon, F. et Whittaker, R. J. (2012). The island speciesarea
relationship: biology and statistics. Journal of Biogeography 39(2): 215-231.
Tsallis, C. (1988). Possible generalization of Boltzmann-Gibbs statistics. Journal of Statistical
Physics 52(1): 479-487.
77

Mesures de la biodiversit

Tsallis, C. (1994). What are the numbers that experiments provide? Qumica Nova 17(6): 468471.
Tuomisto, H. (2010a). A diversity of beta diversities: straightening up a concept gone awry. Part
1. Defining beta diversity as a function of alpha and gamma diversity. Ecography 33(1): 222.
Tuomisto, H. (2010b). A diversity of beta diversities: straightening up a concept gone awry.
Part 2. Quantifying beta diversity and related phenomena. Ecography 33(1): 23-45.
Tuomisto, H. (2011). Commentary: do we have a consistent terminology for species diversity?
Yes, if we choose to use it. Oecologia 167(4): 903-911.
Tuomisto, H. (2012). An updated consumers guide to evenness and related indices. Oikos
121(8): 1203-1218.
Ulanowicz, R. E. (2001). Information theory in ecology. Computers & Chemistry 25(4): 393399.
Veech, J. A. et Crist, T. O. (2010a). Diversity partitioning without statistical independence of
alpha and beta. Ecology 91(7): 1964-1969.
Veech, J. A. et Crist, T. O. (2010b). Toward a unified view of diversity partitioning. Ecology
91(7): 1988-1992.
Veech, J. A., Summerville, K. S., Crist, T. O. et Gering, J. C. (2002). The additive
partitioning of species diversity: recent revival of an old idea. Oikos 99(1): 3-9.
Villeger, S. et Mouillot, D. (2008). Additive partitioning of diversity including species
differences: a comment on Hardy & Senterre (2007). Journal of Ecology 96(5): 845-848.
Volkov, I., Banavar, J. R., Hubbell, S. P. et Maritan, A. (2003). Neutral theory and relative
species abundance in ecology. Nature 424(6952): 1035-1037.
Walker, B., Kinzig, A. et Langridge, J. (1999). Original Articles: Plant Attribute Diversity,
Resilience, and Ecosystem Function: The Nature and Significance of Dominant and Minor
Species. Ecosystems 2(2): 95-113.
Wang, J.-P. (2010). Estimating species richness by a Poisson-compound gamma model.
Biometrika 97(3): 727-740.
Wang, J.-P. (2011). SPECIES: An R Package for Species Richness Estimation. Journal of
Statistical Software 40(9): 1-15.
Wang, J.-P., Lindsay, B., Cui, L., Wall, P. K., Marion, J., Zhang, J. et dePamphilis, C.
(2005). Gene capture prediction and overlap estimation in EST sequencing from one or
multiple libraries. BMC Bioinformatics 6(1): 300.
Webb, C. O. (2000). Exploring the phylogenetic structure of ecological communities: An
example for rain forest trees. American Naturalist 156(2): 145-155.
Whittaker, R. H. (1960). Vegetation of the Siskiyou Mountains, Oregon and California.
Ecological Monographs 30(3): 279-338.
Whittaker, R. H. (1965). Dominance and diversity in land plant communities. Science
147(3655): 250-260.
Whittaker, R. H. (1972). Evolution and Measurement of Species Diversity. Taxon 21(2/3): 213251.
Whittaker, R. H. (1977). Evolution of species diversity in land communities. Evolutionary
Biology 10: 1-67.
78

Bibliographie

Williams, C. B. (1964). Patterns in the balance of nature. Academic. 324


Williamson, M., Gaston, K. J. et Lonsdale, W. M. (2001). The speciesarea relationship does
not have an asymptote! Journal of Biogeography 28(7): 827-830.
Wilsey, B. J. (2010). An empirical comparison of beta diversity indices in establishing prairies.
Ecology 91(7): 1984-1988.
Wright, I. J., Reich, P. B., Westoby, M., Ackerly, D. D., Baruch, Z., Bongers, F., CavenderBares, J., Chapin, T., Cornelissen, J. H. C., Diemer, M., Flexas, J., Garnier, E.,
Groom, P. K., Gulias, J., Hikosaka, K., Lamont, B. B., Lee, T., Lee, W., Lusk, C.,
Midgley, J. J., Navas, M.-L., Niinemets, U., Oleksyn, J., Osada, N., Poorter, H., Poot,
P., Prior, L., Pyankov, V. I., Roumet, C., Thomas, S. C., Tjoelker, M. G., Veneklaas,
E. J. et Villar, R. (2004). The worldwide leaf economics spectrum. Nature 428: 821-827.
Wrtz, P. et Annila, A. (2008). Roots of Diversity Relations. Journal of Biophysics 2008:
Article ID 654672.
Zhang, C. H. et Zhang, Z. Y. (2009). Asymptotic Normality of a Nonparametric Estimator of
Sample Coverage. Annals of Statistics 37(5A): 2582-2595.
Zhang, Z. et Huang, H. (2007). Turing's formula revisited. Journal of Quantitative Linguistics
14(2-3): 222-241.

79

S-ar putea să vă placă și