Documente Academic
Documente Profesional
Documente Cultură
Biostatistiques
pour le clinicien
www.biblio-scientifique.net
Biostatistiques pour le clinicien
www.biblio-scientifique.net
Springer
Paris
Berlin
Heidelberg
New York
Hong Kong
Londres
Milan
Tokyo
www.biblio-scientifique.net
Biostatistiques
pour le clinicien
Michel Huguier et Pierre-Yves Bolle
Springer
www.biblio-scientifique.net
Michel Huguier
Service de chirurgie digestive
Hpital Tenon
4, rue de la Chine
75970 Paris Cedex 20
Pierre-Yves Bolle
INSERM U 707
Hpital Saint-Antoine
184, rue du Faubourg-Saint-Antoine
75571 PARIS CEDEX 12
Cet ouvrage est soumis au copyright. Tous droits rservs, notamment la reproduction et la reprsentation, la
traduction, la rimpression, lexpos, la reproduction des illustrations et des tableaux, la transmission par voie
denregistrement sonore ou visuel, la reproduction par microlm ou tout autre moyen ainsi que la conservation
des banques de donnes. La loi franaise sur le copyright du 9 septembre 1965 dans la version en vigueur nautorise
une reproduction intgrale ou partielle que dans certains cas, et en principe moyennant le paiement des droits.
Toute reprsentation, reproduction, contrefaon ou conservation dans une banque de donnes par quelque procd
que ce soit est sanctionne par la loi pnale sur le copyright.
La maison ddition dcline toute responsabilit quant lexactitude des indications de dosage
et des modes demplois. Dans chaque cas il incombe lusager de vrier les informations
donnes par comparaison la littrature existante.
www.biblio-scientifique.net
Sommaire
Introduction .................................................................................... 1
Premire partie
Les donnes fondamentales.
Les diffrentes variables et leur mesure
Introduction .................................................................................... 5
1. Les donnes fondamentales ................................................... 9
Le matriel dtude ..................................................................... 9
Comment a-t-on travaill ? ......................................................... 12
Ce que lon a cherch valuer ................................................... 15
Critres de jugement .................................................................. 16
2. Les variables qualitatives ....................................................... 19
Mesure ................................................................................................ 19
Quelques remarques .......................................................................... 20
3. Les variables quantitatives .................................................... 23
Variables continues. Distributions. Reprsentations graphiques ... 23
Mesures descriptives. La loi normale (Laplace-Gauss).................. 27
La loi binomiale ......................................................................... 32
La loi de Poisson......................................................................... 35
4. Les variables censures .......................................................... 37
Dnitions ................................................................................. 37
Mesures ..................................................................................... 39
La mthode de Kaplan-Meier ...................................................... 41
La mthode actuarielle ............................................................... 44
5. Les variables subjectives ........................................................ 49
Moyens de mesure ...................................................................... 50
Deuxime partie
Les comparaisons
Introduction .................................................................................... 55
1. Protocole mdical dun essai randomis.............................. 59
Le pralable tout essai randomis ............................................. 60
Inclusion des sujets dans ltude.................................................. 60
www.biblio-scientifique.net
VI Biostatistiques pour le clinicien
Troisime partie
Forces dassociation, tudes multifactorielles,
mesures dimpact, causalit
Introduction .................................................................................... 121
1. Les tudes unifactorielles. La rgression linaire
et la corrlation ....................................................................... 123
La corrlation ............................................................................. 123
La rgression linaire .................................................................. 125
www.biblio-scientifique.net
Sommaire VII
Quatrime partie
Le diagnostic
Introduction .................................................................................... 163
1. Les outils de mesure .......................................................... 165
Sensibilit et spcicit ............................................................... 166
Valeurs prdictives...................................................................... 167
Le lien entre ces quantits ........................................................... 168
2. Remarques sur la sensibilit, la spcicit,
les valeurs prdictives. Les courbes ROC ............................. 171
Les trois grandes dnitions ....................................................... 171
Les courbes ROC ........................................................................ 174
Rle de la prvalence de la maladie ............................................. 178
Effectifs ncessaires pour contrler la valeur des intervalles
de conance et des indices informationnels des examens ............. 180
3. La dmarche diagnostique, choix dun examen,
attitude dcisionnelle ............................................................. 183
La dmarche diagnostique .......................................................... 183
Le choix dun examen ................................................................. 187
4. Utilisation des mthodes multifactorielles
dans une dmarche diagnostique ......................................... 195
5. Concordance ........................................................................... 199
Ce que nest pas la concordance .................................................. 199
La concordance ........................................................................ 201
Cinquime partie
Les valuations thrapeutiques
Introduction .................................................................................... 211
1. Les comparaisons thrapeutiques ne reposant pas
sur des essais randomiss ...................................................... 213
Les tudes non contrles ........................................................... 213
www.biblio-scientifique.net
VIII Biostatistiques pour le clinicien
Sixime partie
Les valuations pronostiques
Introduction .................................................................................... 241
1. Exemple utilisant le modle de Cox ...................................... 245
2. Exemple utilisant lanalyse discriminante ........................... 249
Septime partie
Epidmiologie
Introduction .................................................................................... 255
1. Lpidmiologie descriptive :
les enqutes transversales ...................................................... 257
Mesure de frquence (ou de risque absolu) ................................. 257
Rptition des mesures de frquence ........................................... 259
2. Lpidmiologie analytique ................................................... 261
Les enqutes cas-tmoins ............................................................ 261
Les enqutes de cohortes, exposs-non-exposs ........................... 264
Les biais ..................................................................................... 267
Remarques ................................................................................. 268
www.biblio-scientifique.net
Sommaire IX
www.biblio-scientifique.net
Les auteurs
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
2 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Partie
Les donnes fondamentales
Les direntes variables
1
et leur mesure
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
6 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Introduction 7
La description que lon fait dune variable rsulte dun choix. Il est
parfois possible de modifier les caractristiques dune variable.
1. Une variable quantitative peut tre transforme en variable qualita-
tive, en choisissant une (ou des) valeur(s) seuil qui dfinira des classes ;
ainsi, une variable quantitative, comme un amaigrissement, peut tre
transforme en variable qualitative deux classes : amaigrissement de
moins de 4 kg, ou de plus de 4 kg. De mme, une variable censure,
comme la survie, peut, dans certaines conditions, tre transforme en
variable qualitative : survie cinq ans ou non. Ces transformations
font nanmoins perdre de linformation.
2. Une variable subjective peut tre transforme en variable objective
si lon parvient trouver un rfrentiel commun aux observations. Il
existe pour cela plusieurs mthodes que nous indiquerons.
3. Dautres transformations peuvent tre souhaitables ou habituelles.
Dans linfection VIH, par exemple, on prsente souvent les charges
virales (nombre de copies de virions/mL) en logarithme base 10,
cest--dire quune charge virale de 1 million (= 106) est reprsent
par 6 sur lchelle log. Lutilisation de telles transformations permet de
modifier la distribution, par exemple pour la rendre plus proche de la
loi normale (de Laplace-Gauss).
Dernire notion : des variables sont dites dpendantes si leurs valeurs
changent conjointement, par exemple, les valeurs du cholestrol total
et du cholestrol estrifi. Dans le cas contraire, on parle de variables
indpendantes comme la numration des hmaties dune part, et le
dosage des phosphatases alcalines dans le sang dautre part.
Rfrence
1. Bernard C (1865) Introduction la mdecine exprimentale. Baillire, Paris,
p. 226
www.biblio-scientifique.net
Les donnes fondamentales
1
Tout travail doit tre labor avec un objectif prcis, dfini dans
lintroduction du compte rendu de la recherche. Ensuite, comme nous
lavons indiqu, le chapitre Matriel et mthodes doit comprendre
quatre descriptions fondamentales :
ce sur quoi on a travaill ;
quelle a t la mthode de travail ;
ce que lon a cherch valuer ;
quels ont t les critres de jugement de cette valuation.
Ces donnes sont fondamentales pour permettre, soit de reproduire
ltude, soit pour chercher expliquer des diffrences de rsultats avec
ceux dune autre tude qui avait un objectif similaire ou assez proche.
Pour un lecteur, les principes de la lecture critique ne sont que le corol-
laire des mmes principes de llaboration dun travail scientifique.
Le matriel dtude
Le matriel dune tude est constitu par ce sur qui (personnes,
animaux, bactries, virus, etc.) ou ce sur quoi (prlvement tissulaire,
srum, urines, etc.) le travail a port.
Des personnes
Quil sagisse dune tude clinique ou pidmiologique, il convient
de prciser deux donnes : lune concerne les critres dinclusion des
sujets dans ltude, lautre, la description de la population tudie.
Les critres qui ont permis linclusion de chaque sujet dans ltude
dfinissent les caractristiques de lchantillon. Il est parfois ncessaire,
surtout sils ne sont pas symtriques, de dfinir des critres dexclusion
de ltude. Il est vident que la porte des rsultats ne pourra concerner
www.biblio-scientifique.net
10 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les donnes fondamentales 11
Des animaux
Dans un travail portant sur des animaux, il convient de prciser
lespce, la souche, lge, le sexe, le poids des animaux. Leur origine,
leurs conditions dlevage peuvent encore tre utiles connatre. Un
laboratoire avait cru dcouvrir une souche de chats sujette losto-
porose. Les rhumatologues avaient t trs intresss par ce modle
animal jusquau jour o ils se sont aperus que les animaux qui leur
taient fournis avaient une ostoporose due une malnutrition svre
avant leur arrive au laboratoire.
Des prlvements
Tout travail portant sur des chantillons doit indiquer sur qui le
prlvement a t ralis (tre humain ou animal) et sur quoi (tissu,
sang, scrtion, etc.). Dans certains travaux, il est encore nces-
saire de prciser la technique de prlvement elle-mme, ainsi que
les conditions ventuelles de conservation si lchantillon na pas
fait lobjet dun examen immdiat (conglation, fixation, milieu de
culture, etc.).
www.biblio-scientifique.net
12 Biostatistiques pour le clinicien
Dans le temps
Examen rtrospectif de donnes
Il est possible de faire un travail sur lexamen rtrospectif de donnes
recueillies avant la conception dune tude, par exemple sur des dos-
siers plus ou moins anciens. Linconvnient de ce type dtude est que,
par dfinition, le recueil des donnes na pas t tabli dans la perspec-
tive de la ralisation dun travail donn. De ce fait, certaines donnes
peuvent manquer pour quelques sujets ou ne pas tre pertinentes car
la technologie a volu pendant la priode dtude. Nanmoins, de
telles tudes, si elles sont bien faites, sont utiles pour la connaissance
de lhistoire naturelle de certaines maladies et sont presque indispen-
sables avant dlaborer des tudes prospectives.
tudes transversales
Les tudes transversales (cross-sectional en anglais) consistent
recueillir des observations une date donne. Elles servent le plus
souvent quantifier limportance dun problme de sant dans
une population donne. Rptes dans le temps et dans les mmes
www.biblio-scientifique.net
Les donnes fondamentales 13
tudes prospectives
Les tudes prospectives recueillent les donnes au fur et mesure
de linclusion de nouveaux cas dans ltude. Elles limitent les inconv-
nients des tudes rtrospectives. Leur principal inconvnient est sou-
vent leur dure, qui dpend du rythme avec lequel il est possible de
raliser les inclusions.
tudes longitudinales
Les tudes longitudinales consistent suivre dans le temps des
cohortes de sujets, par exemple en pidmiologie, de sujets exposs et
non exposs un facteur de risque potentiel.
Dans lespace
Afin daugmenter le nombre de cas inclus dans une tude rtrospec-
tive ou de rduire le temps des inclusions dans une tude prospective,
il est possible de faire des tudes multicentriques, cest--dire menes
de faon concomitantes par plusieurs quipes diffrentes. Ces tudes
ont comme autre avantage llaboration de protocoles, discuts en
commun et qui doivent tre particulirement prcis. En contrepartie,
elles comportent un risque dhtrognit quil convient de rduire
le plus possible. Par exemple, dans un travail prospectif chirurgical
multicentrique dont lobjectif est de comparer deux techniques chirur-
gicales, il est ncessaire de dfinir avec une grande prcision les pro-
tocoles opratoires afin dassurer une bonne homognit dans leur
ralisation par les diffrents chirurgiens.
Un avantage majeur de ces tudes multicentriques, en pratique cli-
nique, est que, tant ralises par plusieurs participants, leurs conclu-
sions sont plus largement extrapolables que les rsultats dune tude
ralise dans un seul centre, trs spcialis, avec un petit nombre
doprateurs particulirement entrans.
www.biblio-scientifique.net
14 Biostatistiques pour le clinicien
Les statistiques
Les statistiques et les tests font lobjet des autres chapitres de cet
ouvrage. Ils doivent toujours tre prciss. En effet, des auteurs uti-
lisent parfois des logiciels danalyse et des tests statistiques inadapts
aux donnes quils ont recueillies et quils cherchent interprter.
www.biblio-scientifique.net
Les donnes fondamentales 15
Statistique
Dans des comparaisons, seuil des risques accepts et nombre de sujets inclure.
Traitement de linformation.
Tests dinfrence statistique, etc.
www.biblio-scientifique.net
16 Biostatistiques pour le clinicien
Critres de jugement
Assez curieusement, cette dernire partie du chapitre Matriel et
mthodes dun travail et plus encore dun projet de recherche est
parfois lacunaire, alors quelle devrait tre aussi prcise que les autre
parties de ce chapitre [5].
Les critres de jugement diffrent selon ce que lon a cherch valuer.
Si lvaluation a port sur la valeur dun outil diagnostique, le
critre de jugement est la prsence ou labsence de maladie dans la
population sur laquelle cette valuation a port. En fait, ce rfrentiel
externe , cet examen de certitude, ce gold standard, nest pas toujours
vident. Si lon cherche estimer la valeur du Pet-Scan dans le dia-
gnostic de mtastases hpatiques, il faut savoir comment le diagnos-
tic de mtastases a t fait et surtout comment on a pu dterminer
quil ny avait pas de mtastases ? En effet, une tumeur bnigne peut
www.biblio-scientifique.net
Les donnes fondamentales 17
www.biblio-scientifique.net
18 Biostatistiques pour le clinicien
Rfrences
1. Mackie CR, Wood RAB, Preece PE, Cushieri A (1995) A surgical pathology at
early elective operation for suspected acute gallstone pancreatitis: preliminary
report of a prospective clinical trial. Br J Surg 72: 179-81
2. Adloff M, Arnaud JP (1985) tude prospective critique des diffrentes mthodes
de dtection des mtastases hpatiques. Ann Gastroenterol Hepatol 21: 31-4
3. Molkhou JM, Lacaine F, Houry S, Huguier M (1989) Dpistage des mtastases
hpatiques des cancers digestifs. Place des dosages enzymatiques et de
lchographie. Presse Med 18: 1370-4
4. Bonenkamp JJ, Hermans J, Sasako M, et al. (1999) Extended lymph-node
dissection for gastric cancer. N Engl J Med 340: 908-14
5. Chan AW, Altman DG (2005) Identifying outcomes reporting bias in randomised
trials on PubMed : review of publications and survey of authors. BMJ 330: 753
www.biblio-scientifique.net
Les variables qualitatives
2
Mesure
Dans un chantillon, par exemple chez un groupe de patients,
une variable qualitative se mesure, comme chacun sait, par un pour-
centage : sur 76 enfants, si huit ont eu la rougeole, le pourcentage
www.biblio-scientifique.net
20 Biostatistiques pour le clinicien
denfants ayant eu la rougeole est de huit sur 76, soit 10,5 % que lon
2 peut encore crire 0,105.
En fait, ce pourcentage a t estim sur cet chantillon de 76 enfants. Il
est probable que, sur un autre groupe denfants, on aurait observ un
pourcentage diffrent. Si lon faisait des mesures sur un grand nombre
dchantillons, les valeurs des pourcentages observs se rpartiraient
selon une loi normale (cf. p. 17). Ces variations destimation de pour-
centages dun chantillon lautre suggrent de rapporter aussi lin-
tervalle de confiance (confidence interval en anglais) qui donne une
fourchette dans laquelle, partir dune mesure sur un chantillon, on
estime que se situe la ralit. En gnral, cette fourchette est estime
de telle sorte quil y ait 95 chances sur 100 pour que la ralit se situe
dans ses limites. Cest la couverture de lintervalle de confiance
(tableau II). On peut dire aussi que cet intervalle est au risque de
5 % ; cest--dire quil y a 5 % de risque que la ralit se situe en
dehors des limites de la fourchette qui a t estime.
Quelques remarques
Pour tre valide, cette approximation par la loi normale ncessite
que np et nq soient t 5.
www.biblio-scientifique.net
Les variables qualitatives 21
Rfrence
1. The French METAVIR cooperative study group (1994) Intraobserver and
interobserver variations in liver biopsy interpretation in patients with chronic
hepatitis C. Hepatology 20: 15-20
www.biblio-scientifique.net
Les variables quantitatives
3
Distribution
La distribution des variables continues suit, souvent, une courbe en
cloche. La loi normale, au sens biostatistique du terme, encore appele
loi de Laplace-Gauss2 peut alors tre utilise. Il y a dautres lois pour
1 Rappelons ce propos 1) que les abrviations internationales des units de mesure ne peuvent tre
utilises quaprs un nombre ; 2) quelles doivent tre crites en lettres minuscules avec quelques
exceptions, (IC pour intervalle de conance, DS pour dviation standard, L pour litre, Gy pour Gray,
Pa pour Pascal) ; 3) quelles sont invariables ; 4) et que labrviation de minutes est min et non mn
comme on le voit crit trop souvent.
2 Pierre-Simon, marquis de Laplace (1749-1817) tait un mathmaticien, physicien et astronome
franais. Carl Friedrich Gauss (1777-1865) exerait dans les mmes disciplines et tait allemand.
www.biblio-scientifique.net
24 Biostatistiques pour le clinicien
Reprsentation et mesure
Si lon veut reprsenter les valeurs dune variable quantitative conti-
nue en portant en abscisse des valeurs de la variable (par exemple le
taux sanguin dacide urique srique pour 100 mL chez des sujets sains)
et en ordonnes le nombre de sujets qui ont une valeur donne de ce
taux dacide urique, on obtiendrait ce que montre la figure 1. En effet,
la probabilit davoir exactement la mme valeur chez deux sujets
est faible. Elle serait mme nulle si lon tait capable de mesurer les
valeurs avec une prcision aussi grande que possible. Cest, du reste, ce
qui dfinit une variable quantitative continue. En pratique, on calcule
plutt un tableau de frquence (ou de distribution) en comptant les
valeurs dans des classes de mme largeur comme le montre le tableau I.
www.biblio-scientifique.net
Les variables quantitatives 25
www.biblio-scientifique.net
26 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les variables quantitatives 27
m= xi n
o :
m est la moyenne (dans notre exemple 7 mois) ;
xi sont les valeurs observes chez chaque sujet (dans notre exemple 8, 10, 5, etc.) ;
n est le nombre de sujets tudis (dans notre exemple 10).
Si, sur dix malades atteints dun cancer de trs mauvais pronostic, les
dures de survie en mois sont de 8, 10, 5, 12, 5, 4, 7, 6, 8 et 5 mois, la
dure moyenne de survie de ce groupe de malade est de :
www.biblio-scientifique.net
28 Biostatistiques pour le clinicien
8 10 5 12 5 4 7 6 8 5
3 = 7 mois.
10
Si leffectif de lchantillon est faible, comme dans cet exemple, il suffit
dun vnement inusuel pour changer notablement la moyenne. Par
exemple, si la dure de vie du dernier malade avait t de 35 mois
au lieu de 5 mois, le calcul montre que la dure moyenne de survie
serait de 10 mois au lieu de 7 mois. Il convient ainsi de se mfier dun
rsultat exprim par une moyenne lorsque le nombre de mesures qui
a permis son calcul est petit.
Un autre inconvnient de la moyenne est quil faut attendre que tout
ce que lon cherche mesurer puisse ltre, cest--dire la survenue
du dernier lment : dans notre exemple, il faut attendre que tous les
malades soient dcds pour pouvoir calculer la dure moyenne de
survie de cette population.
La mdiane
www.biblio-scientifique.net
Les variables quantitatives 29
Pour chaque valeur observe (x), il est possible de calculer la diffrence ou cart (d)
avec la moyenne (m) : d = x m. Lestimation de la variance (s) est la moyenne des
carrs des carts autour de la moyenne.
2 x
2
x m ou d ou encore x
2 2
Variance s 2 n
n 1 n 1 n 1
Lcart-type est la racine carre de la variance : s = s2 .
Moyenne et mdiane
Comme il est dit plus haut, lorsquune distribution est symtrique,
sa moyenne et sa mdiane sont confondues. Dans le cas contraire,
on peut trouver des exemples comme dans la figure 7, o mdiane
semblable correspondent des moyennes diffrentes et vice-versa.
www.biblio-scientifique.net
30 Biostatistiques pour le clinicien
Fig. 7 Exemples montrant que des courbes de survie diffrentes peuvent avoir
la mme mdiane de survie et que des survies assez similaires peuvent avoir des
mdianes diffrentes.
Loi de Laplace-Gauss
x P
2
1
p(x ) e 2 V2
2SV
p(x) est la probabilit dobserver une valeur dans un intervalle infinitsimal autour de x.
V est lcart-type.
est la moyenne arithmtique.
Rappelons que e indique une exponentielle.
Dans une distribution normale, les valeurs sont symtriques par rap-
port la moyenne (). On dit encore que la distribution est rduite si
sa variance est gale 1 et quelle est centre si sa moyenne est gale
0. Dans une distribution centre, rduite, les probabilits sont donc
dfinies par la formule simplifie :
www.biblio-scientifique.net
Les variables quantitatives 31
www.biblio-scientifique.net
32 Biostatistiques pour le clinicien
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
3 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
La loi binomiale
Lorsque la variable dintrt compte un nombre de succs parmi
n tentatives semblables, il sagit dune variable binomiale. Cest, par
exemple, dans des familles de deux enfants dont les parents ont une
anomalie gntique autosomique rcessive, le cas de distribution des
tares observes chez les enfants, certains enfants ayant la tare, dautres
non. Dans certaines familles, les deux enfants peuvent ne pas avoir
hrit de la tare. Dans dautres familles, ce sera un enfant, dans dautres
encore les deux enfants. Lexpression graphique dune loi binomiale est
celle dun diagramme en btons (fig. 8). Il est possible de calculer la
moyenne et lcart-type dune distribution binomiale. En revanche, ces
deux paramtres, contrairement ce que nous avons indiqu pour la
loi normale, ne suffisent pas dcrire une distribution binomiale.
www.biblio-scientifique.net
Les variables quantitatives 33
Exemple
Lutilit de la loi binomiale est, comme toute loi de distribution,
de permettre le calcul des probabilits. Elle sert aussi laborer des
tests statistiques exacts pour des variables qualitatives comme le test de
Fisher (cf. page 84). Cette utilisation fait appel deux notions : celle de
factorielle et celle de combinatoire.
La factorielle dun nombre est le rsultat de la multiplication de tous
les nombres entiers gaux et infrieurs ce nombre. Par exemple, la
factorielle de 6 est gale 6 u 5 u 4 u 3 u 2 u 1, soit 720. Ceci scrit
6 ! = 720, le ! signifiant factorielle . Par convention, 0 ! = 1.
Une combinatoire (C) est le nombre de faons davoir k vnements,
parmi n. Cela scrit C kn 5. Par exemple, dans le Tournoi de rugby
des six nations reprsentes par lcosse, le pays de Galles, lAngle-
terre, lIrlande, la France, et lItalie, les quipes jouant deux deux
lune contre lautre (k), la combinatoire C kn est le nombre de matchs
ncessaire pour que chacune des six quipes (n = 6) rencontre cha-
cune des autres quipes (k = 2). Cela peut se calculer assez facile-
ment dans notre exemple, mais devient dautant plus difficile que le
nombre dvnements est important. La formule est donne dans le
tableau V.
5 On note plutt actuellement une combinatoire en la faisant gurer entre parenthses : (nk).
www.biblio-scientifique.net
34 Biostatistiques pour le clinicien
n
C kn , soit dans notre exemple :
k !(n k )
6! 6 u 5 u 4 u 3 u 2 u 1 720
15
2 !(6 2) 2 u 1(4 u 3 u 2 u 1) 48
Les donnes
Les seuils adopts dans un examen biologique nincluent que 95 % des valeurs des
sujets sains (p) et 5 % des examens ont un rsultat qui sort des valeurs considres
comme normales (p = 1 q).
Si lon ralise cinq examens biologiques (n = 5) indpendants (non lis entre eux)
chez un sujet normal, la probabilit que lun de ces examens soit anormal (k = 1)
peut tre estime par la loi binomiale.
Lapplication de la loi binomiale donne le rsultat :
p (X = k) = C kn p k qn, soit : C51 p1 q5, ce qui donne : C51 0,051 0,955 = 0,19.
www.biblio-scientifique.net
Les variables quantitatives 35
La loi de Poisson
La loi de Poisson est, elle aussi, utilise pour des variables discrtes.
Son application la plus courante est lapproximation de la loi binomiale
lorsque les vnements sont rares et lchantillon suffisamment grand.
La formule gnrale en est :
Ok O
p(X k) e
k!
www.biblio-scientifique.net
36 Biostatistiques pour le clinicien
Ok O (5 u 0,05)1 0,25
p(X k) e ue 0,25 u 0,78 0,195
k! 1!
La probabilit que lon a calcule avec la loi de Poisson est trs proche
de celle calcule avec la loi binomiale qui tait de 0,19. On peut en
effet dmontrer que lorsque p est suffisamment petit devant n, la loi de
Poisson se rapproche de la loi binomiale. La loi de Poisson a lavantage
dtre mathmatiquement plus simple que la loi binomiale.
Autre illustration, dans notre exemple concernant le risque de neuro-
pathie, on aurait :
50 5
p(X 0) e 1u 7 10 3 0,007.
0!
Un autre exemple dutilisation de la loi de Poisson est celui du comptage
des colonies dans une boit de Ptri. Si une suspension bactrienne
contient 5 000 bactries par litre et que lon ensemence une bote de
Ptri partir de cette suspension, raison de 1 cm3 de solution, la
probabilit quil ny ait pas de colonie ensemence est :
50 5
p(X 0) e
0!
et la probabilit quil y ait au moins une colonie par bote de Ptri est de :
P(X > 0) = 1 P(X = 0) = 1 0,0067 = 0,9933.
Rfrence
1. Morton RF, Hebel JR (1990) pidmiologie et biostatistique. Une introduction
programme. Doin, Paris, p 68-9
www.biblio-scientifique.net
Les variables censures
4
Dfinitions
Des dfinitions sont importantes prciser.
www.biblio-scientifique.net
38 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les variables censures 39
Mesures
Des logiciels permettent de tracer les courbes de survie. Nous allons
en dcrire sur des exemples simples pour bien en faire comprendre
le mcanisme, tout en sachant que la mthode couramment utilise
aujourdhui est celle de Kaplan-Meier.
La mthode directe
La mthode directe nest rappele qu titre historique. En effet,
elle ne prend en compte, dans les calculs, que les sujets pour lesquels le
recul est suffisant. Les autres sujets, ainsi que les sujets perdus de vue,
sont exclus de lanalyse.
Voici un exemple simple (tableau II). Si lon veut valuer le taux de
survie deux ans dun groupe de dix malades pour lequel le recul
pour deux malades est de moins de deux ans, ces derniers ne peuvent
tre pris en compte dans le taux du calcul du taux de survie deux
ans. Si, sur les huit autres malades, avec deux ans de recul, six sont
vivants et deux sont dcds, le taux de survie deux ans est de 6/8,
soit 75 % (le calcul de lintervalle de confiance 95 % montre quil va
de 45 % 100 % !).
www.biblio-scientifique.net
40 Biostatistiques pour le clinicien
Pour deux malades, le recul est < 2 ans : Pour huit malades, le recul est 2 ans :
Ils ne peuvent pas tre pris en compte Six malades sont vivants (V/T)
Deux malades sont dcds (D/T)
La survie deux ans est donc de 6/8 = 75 %
De faon gnrale :
V /T
S /T
V /T D /T
Fig. 1 Expression dune survie par la mthode directe . Dans cette tude,
la survie chez la femme parat augmenter entre 4 ans et 5 ans de recul (daprs
Maillard et al. >1@).
www.biblio-scientifique.net
Les variables censures 41
www.biblio-scientifique.net
42 Biostatistiques pour le clinicien
0 3 6 9 12
Recul
(mois)
_______________________________________________________________________
Malades
1 ------------- dcd
2----------------------- vivant
3------------------------------vivant
4-------------------------------------------dcd
5-------------------------------------------dcd
6------------------------------------------------ vivant
7------------------------------------------------------------vivant
8------------------------------------------------------------------- dcd
9---------------------------------------------------------------------------- vivant
www.biblio-scientifique.net
Les variables censures 43
d
Temps de a probabilit e
c
partici- vivants b de survie survie
exclus-
Malades pation en dbut dcd (a b/a) cumule
vivants
(mois) d'intervalle condi- (d.e)
tionnelle
1 2 9 1 0 8/9 = 0,89 0,89
2 4 8 0 1 1 0,89
3 5 7 0 1 1 0,89
4 7 6 1 0 1 0,89
5 7 6 1 0 4/6 = 0,68 0,60
6 8 4 0 1 1 0,60
7 10 3 0 1 1/2 = 0,50 0,30
8 11 2 1 0 1 0,30
9 12 1 0 1 1 0,30
www.biblio-scientifique.net
44 Biostatistiques pour le clinicien
La mthode actuarielle
Dans la mthode actuarielle, les taux de survie, contrairement lestima-
tion de Kaplan-Meier, sont valus intervalles rguliers, par exemple
un an deux ans, trois ans, etc. comme dans la mthode directe (fig. 4).
Fig. 4 Courbe de survie actuarielle. Les taux sont calculs pour des reculs
intervalles prdtermins (daprs Petrequin et al. >3@).
www.biblio-scientifique.net
Les variables censures 45
0 1 2 3 Recul
(ans)
____________________________________________________________________
a b c e f
d
Vivants Dcds Vivants Survie en fin
Inter- Exclus- risque dans
en dbut dans en fin d'intervalle
valle vivants : l'intervalle
d'inter- l'inter- d'inter- eb
a (b + c) b + c + (d/2)
valle valle valle 2
www.biblio-scientifique.net
46 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les variables censures 47
Rfrences
1. Maillard JN, Huguier M, Conte-Marti J, Lortat-Jacob JL (1972) Pronostic
loign de la rsection pour cancer de lsophage. Nouv Presse Med 1: 2737-41
2. Kaplan EL, Meier P (1958) Non-parametric estimation from incomplete
observation. Am Stat Ass J 53: 457-81
3. Ptrequin P, Huguier M, Lacaine F, Houry S (1997) Cancers de lsophage
rsqus. Modle prdictif de survie. Gastroenterol Clin Biol 21: 12-6
www.biblio-scientifique.net
Les variables subjectives
5
www.biblio-scientifique.net
50 Biostatistiques pour le clinicien
5 Moyens de mesure
Dans ce type de cotation, des tudes ont suggr quil y avait peu de
gain proposer une cotation plus de cinq niveaux couvrant unifor-
mment la gamme des possibilits pour coter un phnomne subjectif.
Il est vident que ces quantifications dun phnomne subjectif laissent
une part linterprtation. Elles constituent toutefois une approche
intressante pour mesurer ces phnomnes. Il sera important de
www.biblio-scientifique.net
Les variables subjectives 51
www.biblio-scientifique.net
52 Biostatistiques pour le clinicien
5 Rfrences
1. Karnofski DA, Abelmann WH, Craver LF, Burchenal JH (1948) The use of nitro-
gen mustards in the palliative treatment of carcinoma. With particular reference
to brochongenic carcinoma. Cancer 1: 634-56
2. Slim K, Bousquet J, Kiatkowsky F, et al. (1999) Premire validation de la version
franaise de lindex de qualit de vie pour les maladies digestives (GIOLI).
Gastroenterol Clin Biol 23: 25-31
3. Hunt SM, McEwen J, McKenna SP (1985) Measuring health status: a new tool
for clinicians and emidemiologists. J Roy Coll Gen Pract 35: 185-8
4. Gervais P, Hbert R, Jbaddi M, Toussignant M (2011) Implantation du
systme de mesure de lautonomie fonctionnelle (SMAF) dans onze milieux
dhbergement et daide domicile du secteur mdico-social franais : tude
PISE-Dordogne. Revue de griatrie 36: 631-44
5. Torrance GW (1987) Utility approach to measuring quality of life. J Chronic
Dis 40: 593-600
www.biblio-scientifique.net
Partie
Les comparaisons 2
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
56 Biostatistiques pour le clinicien
Toute comparaison est expose des biais qui peuvent fausser linter-
prtation des rsultats. Il convient de prvenir au maximum ces biais
par un plan exprimental adapt.
Le biais le plus commun est de faire porter les comparaisons sur des
sous-groupes qui ne sont pas similaires. Pour limiter ce risque, il faut,
au sein de lensemble de la population incluse dans ltude, faire un
tirage au sort pour dterminer deux (ou plusieurs) sous-groupes sur
lesquels vont porter les comparaisons. Cest la randomisation.
En fin dtude, la comparaison des rsultats, mme entre des sous-groupes
qui seraient parfaitement similaires en dehors de la variable dintrt, est
expose plusieurs risques dinterprtation. Ces risques sont les suivants :
Le premier risque, la vue dune diffrence (A > B), est de conclure
que A est suprieur B alors que la diffrence observe est le fait
du hasard et quil ny a pas de diffrence relle entre A et B. Cest le
risque de premire espce, encore appel risque D.
Le second risque est celui dune absence de diffrence significative
(A = B) alors mme que A est diffrent de B. Cest le risque de
seconde espce, encore appel risque E.
Le risque de troisime espce est de conclure tort que A > B ou
A < B alors que cest linverse. Ce risque, encore appel J, est large-
ment plus faible que les prcdents. Il est donc gnralement ngli-
geable. Ses consquences seraient toutefois plus graves.
ct de ces risques, il faut bien diffrencier les tudes dont le but
est de chercher une diffrence, en gnral pour montrer la supriorit
dun examen ou dun traitement sur un autre, tudes qui sont une
dmarche habituelle, notamment en recherche clinique, des tudes
dont le but est de prouver une absence de diffrence, comme dans les
essais dquivalence ou de non-infriorit, tudes qui sont de plus en
plus frquentes dans tous les domaines de la recherche biomdicale.
www.biblio-scientifique.net
Introduction 57
Rfrence
1. Bernard C (1865) Introduction la mdecine exprimentale. Baillire, Paris,
p 342
www.biblio-scientifique.net
Protocole mdical dun essai randomis
1
www.biblio-scientifique.net
60 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Protocole mdical dun essai randomis 61
traitement soit aussi bref que possible. Dans un essai chirurgical com-
parant deux techniques, le tirage au sort doit tre fait lors de linter-
vention, lorsque le chirurgien sest assur que la clause dambivalence
tait respecte. La panseuse, par exemple, indique alors au chirurgien,
aprs ouverture dune enveloppe, celle des deux techniques quil doit
raliser.
La connaissance du nombre de malades exclus de ltude et les raisons
dexclusion permettent de se faire une opinion sur le champ dappli-
cation des rsultats de ltude. En effet, pour fondamentaux que soient
les essais randomiss, lexprience montre que les critres dinclusion
aboutissent ce quelles intressent des populations assez slection-
nes. En thorie, leurs rsultats ne peuvent donc tre utiliss, sils sont
positifs, que pour des malades, eux aussi assez slectionns sur les
mmes critres que ceux sur lesquels ltude avait port.
www.biblio-scientifique.net
62 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Protocole mdical dun essai randomis 63
www.biblio-scientifique.net
64 Biostatistiques pour le clinicien
Rfrences
1. Jorenby DE, Leibshow SJ, Nides MA, et al. (1999) A controlled study of sus-
tained release bupropion, a nicotine patch, or both for smoking cessation. New
Engl J Med 340: 685-62
2. Bells PRF (1997) Surgical research and randomized trials. Br J Surg 84: 737-8
3. www.maaw.info/LearningcurveSummary.htm
4. Bennett CL, Stryker SJ, Ferreira R, et al. (1997) The learning curve for
laparoscopic colorectal surgery. Arch Surg 132: 41-5
5. Watson DI, Baigrie RJn, Jamieson GG (1996) A learning curve for laparoscopic
fundoplication. Definable, avoidable, or waste of time? Ann Surg 224: 198-203
www.biblio-scientifique.net
Protocole statistique dun essai randomis
2
Le tirage au sort
Au sein de la population incluse dans ltude, le tirage au sort est
le moyen qui offre les meilleures garanties que les sous-groupes quil
dtermine soient similaires, sauf en ce qui concerne le traitement allou.
Les diffrences observes en fin dtude pourront ainsi tre clairement
attribuables aux traitements, cest--dire ce que lon cherche va-
luer. Cest bien ce qui fait la spcificit et lintrt des essais randomiss
par rapport aux comparaisons avec recueil rtrospectif des donnes. En
effet, dans ces tudes, il ne sera pas possible de garantir que les deux
sous-groupes compars taient similaires au dpart.
Le tirage au sort est cependant moins simple quil pourrait paratre.
www.biblio-scientifique.net
66 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Protocole statistique dun essai randomis 67
www.biblio-scientifique.net
68 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Protocole statistique dun essai randomis 69
www.biblio-scientifique.net
70 Biostatistiques pour le clinicien
2 Problmes particuliers
La stratification
Un tirage au sort insuffisamment pens ne met pas toujours labri
dune diffrence entre les sous-groupes que lon souhaite comparer, ce qui
complique singulirement linterprtation des rsultats. Cette diffrence,
bien que due au hasard, peut tre gnante lors de cette interprtation si
elle porte sur une caractristique associe la valeur du critre principal.
Cest ce qui a eu la malchance de se produire dans un important essai
randomis sur les cancers oto-rhyno-laryngologiques (ORL). Lide de
cet essai reposait sur des tudes antrieures qui suggraient que la radio-
thrapie tait plus efficace sur des tissus bien oxygns que linverse. Sur
la base de cette donne, un essai randomis a t ralis pour comparer,
chez des malades qui avaient un cancer ORL, la radiothrapie simple
la radiothrapie associe ladministration doxygne hyperbare [1]. Le
critre de jugement tait la survie. Les rsultats ont t similaires dans
les deux groupes. Mais, une fois ltude termine, les auteurs se sont
aperus que, malgr le tirage au sort, les deux sous-groupes de malades
ntaient pas similaires. Le hasard a fait que les malades qui avaient eu de
loxygne hyperbare avaient plus souvent des mtastases ganglionnaires
que les malades de lautre groupe. Or les mtastases ganglionnaires sont
un facteur de mauvais pronostic. Ainsi, labsence de meilleurs rsultats
dans le groupe oxygne hyperbare pouvait tre due au fait que loxygne
namliorait pas lefficacit de la radiothrapie. Mais lautre hypothse
tait que cette amlioration avait t masque par le dsquilibre induit,
par hasard, par la prsence diffrentielle des mtastases ganglionnaires.
Afin de limiter le risque de tels dboires dans un essai randomis,
lorsque lon sait quil existe un facteur de pronostic reconnu comme
tant trs important (dans notre exemple de cancer ORL, des mtas-
tases ganglionnaires), il est prudent de faire une stratification. Cela
consisterait raliser un tirage au sort diffrent pour les malades qui
nont pas de mtastases ganglionnaires et ceux qui en prsentent. Cette
faon de procder garantit qu la fin de linclusion et de lessai, la
proportion de malades qui ont des mtastases ganglionnaires sera la
mme dans les deux sous-groupes que lon cherche comparer.
Sur le plan mathmatique, la stratification augmente ainsi la puissance
des tests dinfrence statistique en diminuant la variance du critre de
jugement. En contrepartie, les modalits du tirage au sort deviennent
un peu plus complexes et donc plus sujettes des causes derreur de
la part des investigateurs. En pratique, il nest souhaitable de recourir
la stratification que lorsquelle semble vraiment justifie et de ne pas
dpasser un, voire deux niveaux de stratification.
www.biblio-scientifique.net
Protocole statistique dun essai randomis 71
Les risques
Rappelons quil y a deux risques principaux dans tout essai
randomis. Le risque de deuxime espce doit tre pris en compte ds
la conception de ltude. Il implique le calcul des effectifs de malades
inclure afin de limiter ce risque, de conclure tort quun traitement
nest pas plus efficace quun autre alors que le nombre de malades
inclus dans ltude est insuffisant. Pendant trs longtemps, labsence
de prise en compte du risque de deuxime espce a t le grand point
faible des essais randomiss. Il sera expliqu propos des comparai-
sons cherchant montrer une diffrence (cf. p. 92).
Lautre risque, de premire espce, se prsente en fin dtude dans la
comparaison des rsultats. Il consiste conclure tort quun traite-
ment est plus efficace quun autre, alors que cest essentiellement le
hasard qui est intervenu dans les diffrences observes. Pour limiter
ce risque, en pratique moins de 5 %, il convient dutiliser des tests
dinfrence statistique (cf. p. 78).
www.biblio-scientifique.net
72 Biostatistiques pour le clinicien
Rfrences
1. Henk JM, Kunkler PB, Smith CW (1977) Radiotherapy and hyperbaric oxygen
in head and neck cancer. Lancet 2: 101-3
2. Conn HO (1974) Therapeutic portacaval anastomosis: to shunt or not to shunt.
Gastroenterology 67: 1065-73
www.biblio-scientifique.net
Rgles thiques, considrations rglementaires
et financement dun essai randomis 3
Rgles thiques
Pour un investigateur, il nest thique denvisager de faire un essai
randomis pour essayer de mettre en vidence la supriorit dun
traitement sur un autre que si, lon espre quun traitement est meil-
leur quun autre, mais que lon nen est absolument pas certain. Si on
nprouve pas un espoir de supriorit, un essai randomis na pas lieu
dtre et si lon a la conviction quun traitement est meilleur quun
autre, il ne serait pas thique non plus de mettre en uvre un essai
randomis.
De mme, il nest thique de faire un essai dquivalence entre deux
traitements que si lon pense quil y a quivalence, mais que lon nen
est pas certain.
Tout patient susceptible dtre inclus dans une tude prospective, doit
donner son consentement clair ; cest--dire doit tre inform du
but de ltude laquelle il accepte de participer, quels sont les avan-
tages que lon espre du nouveau traitement, mais aussi labsence de
certitude et les contreparties ventuelles du nouveau traitement
comme du traitement de rfrence. Les patients, en gnral, com-
prennent bien lintrt de ces tudes pour la collectivit et pour eux-
mmes. La fondation dAide et de recherche en cancrologie a ainsi
rapport le tmoignage dune femme de 34 ans qui avait eu un cancer
bilatral des seins. Elle avait t opre, avait eu de la chimiothrapie et
de la radiothrapie. Sa tumeur ntant pas sensible aux antihormones,
on lui a propos, pour prvenir une rcidive, de participer un essai
europen. Aprs que les mdecins se soient assurs quelle pouvait bien
tre incluse dans cette tude, elle a accept, dit-elle, parce que si on
www.biblio-scientifique.net
74 Biostatistiques pour le clinicien
lui proposait cet essai, ctait forcment pour amliorer ses chances
3 de gurison . Elle a pens : Au pire, que ce traitement ne serait pas
efficace, mais il ne me fera pas de mal. Au mieux, il viterait la rcidive
de mon cancer .
Un autre principe thique est que tout malade doit tre prvenu quil
est toujours libre, tout moment, de refuser continuer participer
une tude.
Dispositions rglementaires1
Il convient de distinguer :
les tudes avec bnfice individuel direct pour le patient. Ce sont
les tudes susceptibles (et seulement susceptibles) de lui apporter un
avantage directement par rapport des traitements antrieurs. Les
essais randomiss entrent dans ce groupe ;
et les tudes sans bnfice individuel direct ; les tudes portant sur
des sujets volontaires sains, de biodisponibilit, par exemple.
Les premires sont le plus souvent ralises dans des services hospi-
taliers, mais il en est de trs utiles et intressantes qui sont faites en
pratique librale. Les secondes, en France, doivent se drouler dans
des centres agrs par le ministre charg de la Sant, par exemple
les Centres dinvestigation clinique (CIC). Le but est de protger et
de rglementer la participation les individus de telles tudes contre
indemnisation.
Toutes les tudes doivent :
1. Avoir un promoteur qui reprsente lentit responsable sur le
plan juridique et rglementaire du bon droulement de ltude.
Lorsque ltude a un financement propre, le promoteur est souvent
le financeur. Le promoteur doit souscrire une assurance couvrant les
dommages ventuels causs au patient qui participe ltude. Les
promoteurs peuvent tre des personnes physiques, mais sont le plus
souvent des institutions publiques comme lInstitut national de la
recherche mdicale (INSERM) ou le Centre national de la recherche
scientifique (CNRS) ou encore des hpitaux, etc. Dautres sont privs,
comme des firmes pharmaceutiques. Le promoteur est galement res-
ponsable de la dclaration dvnements indsirables aux autorits de
sant, cest--dire lAgence franaise de la scurit sanitaire pour les
produits de sant (AFSSAPS).
2. Avoir un investigateur principal qui est le matre duvre de ltude,
cest--dire le coordonnateur scientifique et mdical.
1 Directive europenne du 4 avril 2001 et loi du 9 aot 2004 relative la politique de sant
publique.
www.biblio-scientifique.net
Rgles thiques, considrations rglementaires et financement dun essai randomis 75
Financement
Les essais randomiss sont onreux raliser. Leurs rsultats peuvent
avoir des consquences importantes sur le plan commercial par un effet
de promotion, quil sagisse de mdicaments, de dispositifs mdicaux
ou dappareils dexploration mdicale. Ils sont de plus en plus souvent
financs par des entreprises, notamment pharmaceutiques. Cela pose
un rel problme de lindpendance des investigateurs et des scienti-
fiques qui ralisent ces essais par rapport ceux qui les financent [1],
surtout si ces derniers assurent lenregistrement des donnes.
Lobjectivit scientifique voudrait que le traitement des donnes soit fait
ou bien par linvestigateur principal, ou bien par un tiers indpendant
du promoteur-financeur. Au minimum, pour prserver lindpendance
2 http://clinicaltrials:gov
3 En 2012, prs de 130 000 essais dans 180 pays.
www.biblio-scientifique.net
76 Biostatistiques pour le clinicien
Enregistrement de lessai
Tout essai randomis destin tre publi dans une revue inter-
nationale, doit tre enregistr sur un site comme Clinicaltrials.org. Lors
de cet enregistrement, le protocole sera aussi communiqu, mme sil
nest pas rendu public, pour quil soit possible de vrifier si lanalyse
ralise correspond bien ce qui a t dcid dans le protocole initial.
Un numro denregistrement sera dlivr qui devra tre communiqu
lors de la soumission du manuscrit dcrivant ltude.
Rfrence
1. Davidoff F, DeAngelis CD, Draen JM, et al. (2001) Sponsorship, authorship, and
accountibility. N Engl J Med 345: 825-7
www.biblio-scientifique.net
Comparaisons cherchant montrer une
diffrence (en gnral un bnfice) 4
Dfinition
Le risque de premire espce (ou risque D) est le risque de conclure
tort, au vu des rsultats, quun examen complmentaire, un traite-
ment ou un facteur de pronostic est meilleur quun autre alors que
cest le hasard qui est responsable des diffrences observes. Cest le
risque que prendrait un joueur la roulette qui, sur neuf coups succes-
sifs, voyant sortir le rouge six fois et le noir trois fois, conclurait quil y
a deux fois plus de numros rouges que de numros noirs.
La plupart des publications portant sur des comparaisons thra-
peutiques prennent en compte ce risque de premire espce ; parfois
cependant laide de moyens mal adapts, voire mme inadapts.
Mais il doit tre estim dans toutes les comparaisons que ce soit des
comparaisons entre deux traitements complmentaires ou entre deux
facteurs de pronostic dune maladie, etc.
Les tests dinfrence statistique sont loutil qui permet de limiter le
risque de premire espce en fixant une valeur maximale derreur
quil parat acceptable de tolrer et qui est, dans toutes les disciplines
scientifiques, de 5 %.
www.biblio-scientifique.net
78 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 79
www.biblio-scientifique.net
80 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 81
Tableau V Table du .
Valeur de p
Degrs
de 0,25 0,10 0,05 0,025 0,01 0,005 0,001
libert
1 1,323 2,706 3,841 5,024 6,635 7,879 10,83
2 2,773 4,605 5,991 7,378 9,210 10,60 13,82
3 4,108 6,251 7,815 9,348 11,34 12,84 16,27
4 5,385 7,779 9,488 11,14 13,28 14,86 18,47
5 6,626 9,236 11,07 12,83 15,09 16,75 20,52
www.biblio-scientifique.net
82 Biostatistiques pour le clinicien
Valeur de p
4
Degrs
de 0,25 0,10 0,05 0,025 0,01 0,005 0,001
libert
22 26,04 30,81 33,92 36,78 40,29 42,80 48,27
23 27,14 32,01 35,17 38,08 41,64 44,18 49,73
24 28,24 33,20 36,42 39,36 .42,98 45,56 51,18
25 29,34 34,38 37,65 40,65 44,31 46,93 52,62
Nous avons pris lexemple le plus simple : celui du qui est un test
semi-paramtrique, utilis pour comparer les distributions de deux
variables qualitatives partir dchantillons.
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 83
Les tests paramtriques en fonction des variables qui sont tudies et des effectifs
Variables
qualitatives quantitatives censures
chantillons n (ou groupes de patients)
Indpendants
n=2 ou z t de Student ou logrank
ou Peto
n>2 Analyse de variance logrank
un facteur ou Peto
Apparis
n=2 de McNemar Analyse de variance
deux facteurs
n>2 Stuart-Maxwell Analyse de variance
de Mantel-Haenzel deux facteurs
www.biblio-scientifique.net
84 Biostatistiques pour le clinicien
Les tests non paramtriques en fonction des variables qui sont tudies
et des effectifs
Variables
qualitatives quantitatives censures
chantillons n (ou groupes de patients)
Indpendants
n=2 Test exact Wilcoxon logrank
de Fischer ou Mann-Whitney
n>2 Test exact Kruskall-Wallis logrank
de Fischer
Apparis
n=2 de McNemar Wilcoxon sign
Friedman
n>2 Cochran Q Test de Friedman
ou de deux facteurs
Mantel-Haenzel
De deux variables Coefficient de corrlation
quantitatives des rangs de Spearman et Kendall
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 85
Le test t de Student
Le test t de Student sert comparer deux moyennes dchantillons
indpendants. Prenons lexemple concret du rsultat du dosage de la
ferritine chez les nouveau-ns de deux mois selon que la mre a reu
du fer ou un placebo pendant la grossesse (exemple emprunt [1]).
Les rsultats sont les suivants (tableau VI).
Effectifs (chantillons)
Critre de jugement
(Variable quantitative) n1 n2
Moyennes m1 m2
2
Variances s
1
s22
www.biblio-scientifique.net
86 Biostatistiques pour le clinicien
m1 m2
t
s 2T s 2T
n1 n2
130 190 60
t 2,59
6 574 6 574 23,17
25 24
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 87
www.biblio-scientifique.net
88 Biostatistiques pour le clinicien
Lanalyse de variance
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 89
Lide danalyser des variances pour comparer des moyennes repose sur
le fait, dmontrable mathmatiquement, que lorsque plusieurs moyennes
ne sont pas diffrentes entre elles (hypothse nulle), la variance totale
(S2T) de lchantillon doit tre gale la variance rsiduelle (S2R). Dans
tous les autres cas, (S2T) diffre de (S2R) en lui tant suprieure.
Dans lhypothse nulle, et dans cette seule hypothse, la variance totale
tant gale la valeur rsiduelle, le rapport
s 2 T s 2R
F est nul.
s 2R
Dans tous les autres cas, s 2T est suprieur s 2R.. Une fois calcule la
valeur de F, comme pour le 2 ou le test t, une table de F donne, en
fonction du nombre de degrs de libert, les seuils au-dessus desquels
cette valeur est statistiquement diffrente de 0, cest--dire que les
diffrences observes sont statistiquement significatives.
Supposons que lon veuille comparer dans trois groupes de patients A,
B, et C deffectifs na nb et nc (N tant le nombre total dobservations),
les moyennes ma mb et mc, les variances s 2a, s 2b, et s 2c, pour savoir si elles
sont statistiquement diffrentes ou non. Supposons encore que, pour
chaque patient, les valeurs mesures soient pour le groupe A, xa1, xa2,
xa3, etc., pour le groupe B, xb1, xb2, xb3, etc. et pour le groupe C xc1, xc2,
xc3,, etc.
Lobjectif est de calculer une valeur F et de voir, en se reportant une
table, si cette valeur estime permet ou non de rejeter lhypothse
nulle. Pour cela, il faut calculer la variance totale et la variance rsi-
duelle (tableau XI).
6i (x ai ma )2 6i (x bi m b )2 6i (x ci mc )2
S2 T
N 1
La variance rsiduelle est estime par la formule :
s 2 T s 2R
F
s 2R
www.biblio-scientifique.net
90 Biostatistiques pour le clinicien
89 A 1
96 A 2
98 B 3
101 A 4
104 B 5
106 B 6
108 B 7
Il faut ensuite faire la somme des rangs dans un groupe. Pour des
saisons de simplification, il est plus ais de choisir celui dont leffectif
est le plus petit. Dans notre exemple, trs simplifi, le groupe A. Cette
somme T est gale 1 + 2 + 4. On calcule ainsi la valeur z qui est gale
2,23 (tableau XIII).
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 91
nA est leffectif du groupe A (le plus petit des deux : 3 dans notre exemple).
nB est leffectif de lautre groupe (ici 4).
12 est une constante, quel que soit leffectif (en effet, si nA et nB sont > 10, Z suit
alors une loi normale).
T 0,5 nA nB 1) / 2
z 2,23
nA nB (nA nB 1) /12
www.biblio-scientifique.net
92 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 93
www.biblio-scientifique.net
94 Biostatistiques pour le clinicien
dautant plus puisant que les effectifs inclus sont grands. Se fixer un
4 risque maximum de 10 % veut dire que lon se fixe une puissance
maximale du test de 90 %.
La dmarche du calcul de la puissance est essentiellement une dmarche
a priori lorsque lon labore un essai. Calcule en fin dtude, la notion
de puissance a un intrt plus limit : si lon a rejet lhypothse nulle,
on trouvera bien videmment que le test tait puissant pour la diff-
rence observe et si lon na pas rejet lhypothse nulle, on trouvera
que la puissance tait mdiocre pour la diffrence observe.
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 95
10 % 578 263 79 59 23
www.biblio-scientifique.net
96 Biostatistiques pour le clinicien
2 u V2
N = (1,96 + Z1 )2
'2
est lcart-type.
est la diffrence espre _1 2 _
Pour une puissance de 80 %, on aurait Z1 = 0,84
Puissance (1 )
_ 1 2 _/ 0,80 0,85 0,90 0,95
0,10 1 571 1 797 2 102 2 600
0,30 175 201 234 290
0,50 64 73 85 105
0,70 33 38 44 54
0,90 20 23 27 33
1,10 14 16 18 22
1 est la moyenne observe avec lexamen (ou traitement) de rfrence.
1 est la moyenne espre avec le nouvel examen (ou traitement) de rfrence.
est lcart-type observ avec lexamen (ou traitement) de rfrence.
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 97
www.biblio-scientifique.net
98 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Comparaisons cherchant montrer une diffrence (en gnral un bnfice) 99
Pour cette raison, dans un essai randomis, si lon envisage de faire des
analyses intermdiaires, il faut les prvoir dans le protocole initial et
en tenir compte dans le calcul des effectifs afin de maintenir le risque
de premire espce 0,05. Cela implique de se fixer un premier seuil
de signification du premier test que lon ralise, plus bas que la valeur
habituelle de 0,05. Dans le tableau XVIII, la valeur de 0,05 ne doit pas
tre la valeur du premier test, mais celle du dernier qui est prvu. Il
faut donc inclure un plus grand nombre de sujets que si lon ne faisait
pas de tests intermdiaires. Il existe plusieurs rgles communment
utilises : la rgle de Bonferroni fixe comme seuil de signification de
chaque test, non pas 0,05, mais 0,05/n o n est le nombre de tests quil
est prvu de raliser ; la rgle de Peto fixe un seuil trs faible pour les
premiers tests (en gnral 0,0001) et rserve le gros du risque pour
lanalyse finale.
www.biblio-scientifique.net
100 Biostatistiques pour le clinicien
Rfrences
1. Doyon F, Com-Nougu C (1983) Quest-ce quun test ? Les principaux tests
statistiques. La Revue du Praticien 33: 947-54
2. Reitsma ML, Vanderkerkhof EG, Johnston SC, Hopman WM (2011) Does
health-related quality of life improve in women following gynaecological
surgery? J Obstet Gynaecol Can 33:1241-7
3. Bland JM (2004) The logrank test. BMJ 328: 1073 et 1412
4. Freiman JA, Chalmers TC, Smith H, Kuebler RR (2001) The importance of beta,
the type II of error and sample size in the design and interpretation of the
randomized controlled trial. Survey of 71 Ngative trials. N Engl J Med 345:
825-7
5. Chen HS, Li JQ, Zheng Y, Guo RP, et al. (2006) A prospective randomized trial
comparing percutaneous local elective therapy and partial hepatectomy for
small hepatocellular carcinoma. Ann Surg 243: 21-8
6. Pocock SJ, Hughes MD, Lee RJ (1987) Statistical problems in reporting of
clinical trials. A survey of medical journals. N Engl J Med 317: 426-32
www.biblio-scientifique.net
Autres types dessais randomiss
5
Le principe
www.biblio-scientifique.net
102 Biostatistiques pour le clinicien
Les avantages
Le fait que le sujet soit son propre tmoin devrait, sur le plan arith-
mtique, permettre de diviser par deux le nombre total de sujets
inclure dans ltude pour un seuil donn de risque de deuxime espce,
lorsquil y a deux groupes indpendants. Si ce nombre est N avec un
essai classique, il devient N/2 dans un essai crois, mais on double le
temps de participation de chaque sujet.
En ralit, sur le plan statistique, les choses sont un peu plus complexes.
Si le critre de jugement est quantitatif, le nombre de sujets N' dpend
aussi du coefficient de corrlation r qui va, rappelons-le de 1 + 1
entre les rponses dun sujet aux deux traitements. N' est alors gal :
N
Nc (1 r )
2
Si la corrlation est positive et tend vers + 1, le nombre de sujets nces-
saires diminue car la diffrence de rponse aux traitements sera peu
variable dun patient lautre et donc facilement mise en vidence. Si
la corrlation est nulle, il ny a pas davantage avoir inclus les mmes
patients deux fois puisque les deux sries sont indpendantes. Le cas dune
corrlation ngative des rponses au traitement chez un mme individu
est sans doute plus une curiosit mathmatique quune situation relle.
Les essais croiss apportent des informations supplmentaires celles
dun essai classique en groupes parallles. Ces derniers permettent de
conclure quun traitement A est meilleur quun traitement B. La conclu-
sion logique est alors de traiter les patients avec le produit A. Avec
lapproche dans laquelle le malade est son propre tmoin, la mthode
permet de mesurer la proportion de patients ne rpondant pas au trai-
tement A, mais dont certains peuvent nanmoins bnficier du traite-
ment B en seconde ligne. Cette approche correspond bien une attitude
thrapeutique clinique : quand un traitement est inefficace, on en essaye
un autre, mme sil peut tre globalement moins efficace.
Les conditions
Dans les essais croiss, il faut, bien entendu, pouvoir valuer leffet du
premier traitement administr avant de commencer le deuxime trai-
tement. De plus, il ne faut pas que le traitement administr pendant la
www.biblio-scientifique.net
Autrestypes dessais randomiss 103
Lanalyse statistique
Le calcul initial du nombre de sujets ncessaires et lanalyse statis-
tique reposent sur des tests pour sries apparies. Lorsque la variable
est qualitative, les rponses aux deux traitements peuvent tre toutes
deux positives, toutes deux ngatives ou divergentes. On ne retient pas
les rsultats concordants qui napportent pas dinformation la ques-
tion pose : celle du meilleur traitement.
www.biblio-scientifique.net
104 Biostatistiques pour le clinicien
Cest un peu des observations de ce genre qui, bien que trs rares, ont
5 conduit proposer des analyses squentielles Leur but est de limiter
linconvnient dattendre la fin dun essai randomis classique pour
conclure et donc pour recommander plus rapidement une attitude
meilleure quune autre.
Le principe
www.biblio-scientifique.net
Autrestypes dessais randomiss 105
zones est calcule en dbut dtude selon les mmes principes que ceux
qui servent calculer le nombre de cas quil est ncessaire dinclure
dans un essai randomis classique en tenant compte des seuils choisis
de risques de premire et de deuxime espce.
Aprs chaque analyse, un point peut ainsi tre dtermin et plac sur
le plan squentiel. Lors de lanalyse suivante, partir de lemplacement
du premier point, on place plus loin sur laxe des abscisses un second
point, etc. Le plan squentiel comporte trois zones. Une premire zone
de rejet de lhypothse nulle correspond la supriorit dun traite-
ment par rapport un autre. Une deuxime zone est celle de lhypo-
thse nulle (H0) qui doit faire poursuivre lessai. La troisime zone
est une zone dans laquelle il nest pas possible de rejeter lhypothse
dabsence dgalit de traitement (en formulation unilatrale).
Ds que lon a franchi une droite frontire, cest--dire que lon est
sorti de la zone de continuation de lessai, celui-ci est termin. De
faon gnrale, il est estim que les analyses squentielles permettent
de rduire le nombre de cas inclure dans un essai randomis de 30 %
en moyenne par rapport une analyse unique en fin dessai.
Nanmoins, ce type danalyse squentielle expose au risque de rester
trs longtemps dans la zone de continuation de lessai. Pour ne pas
sexposer cet inconvnient, il est possible de prvoir un test trian-
gulaire, transformant les droites parallles en un triangle (fig. 2) qui
assure un nombre fini de cas inclure dans lessai [3].
www.biblio-scientifique.net
106 Biostatistiques pour le clinicien
Rfrences
1. Kalergis M, Paaud D, Strychard I, et al. (2000) Optimizing insulin delivery:
assessment of three strategies in intensive diabetes management. Diabetes Obes
Metab 2: 299-305
2. ORourke PP, Crone RK, Vacante JP (1989) Extracorporeal membrane
oxygenation and conventional medical therapy in neonates with persistant
pulmonary hypertension of the newborn: a prospective randomized trial.
Pediatrics 84: 957-63
3. Chastang C, Bnichou J (1992) Aspects pratiques de la planification et de
lanalyse dun essai thrapeutique randomis selon le test triangulaire. In :
Chastang C, Pons G, Rgnier (eds) Mthodes nouvelles en pharmacologie
clinique pdiatrique ; relation dose-effet des antibiotiques. Rgles darrt dun
essai clinique. Springer-Verlag, Paris, p 157-80
www.biblio-scientifique.net
Comparaisons cherchant montrer
une quivalence 6
www.biblio-scientifique.net
108 Biostatistiques pour le clinicien
Le principe
www.biblio-scientifique.net
Comparaisons cherchant montrer une quivalence 109
B1
B2
www.biblio-scientifique.net
110 Biostatistiques pour le clinicien
*_'_ est la valeur absolue de la diffrence observe et 'L est la valeur maximale limite que lon
se fixe pour admettre labsence de diffrence.
** Alors que ceux-ci peuvent tre diffrents : problme de la puissance du test.
*** Alors que ceux-ci peuvent tre quivalents : problme de la puissance du test.
www.biblio-scientifique.net
Comparaisons cherchant montrer une quivalence 111
Un exemple est tir dune tude nord-amricaine [4]. Son but tait
de savoir si ladministration de soins par des infirmires nentranait
pas de diffrence de rsultats avec des soins administrs par des mde-
cins. Les auteurs avaient fix comme limite maximale de diffrence ()
acceptable, 10 %.
www.biblio-scientifique.net
112 Biostatistiques pour le clinicien
Lhypothse teste tait, ici, celle dune diffrence entre rsultats des
mdecins et ceux des infirmires. Lhypothse alternative tait celle
dune diffrence qui nexcde pas 10 % et que lon choisira si le test
est significatif. Le pourcentage global de soins de bonne qualit tait de
263/392 = 0,67 (et celui de mauvaise qualit de 129/392 = 0,33).
Il faut commencer par calculer les effectifs thoriques des pourcen-
tages de bons et de mauvais rsultats P1 et P2 des infirmires et des
mdecins. Le calcul de P1 et P2 doit tenir compte du fait que les effectifs
dans les deux groupes ne sont pas similaires. Il est gal :
263 167 263 225
P1 u 0,10 0,71 et P2 u 0,10 0,61
392 392 392 392
La diffrence est bien de 0,10.
Les effectifs thoriques de bons rsultats des mdecins sont donc de
0,71 u 225 = 159,75. En reprenant les totaux de lignes et de colonne
du tableau II, il est facile de calculer par complment les quatre effec-
tifs thoriques.
www.biblio-scientifique.net
Comparaisons cherchant montrer une quivalence 113
Conclusion
Il importe dans la formulation dun essai de bien savoir si lon
cherche mettre en vidence une plus grande efficacit dun produit
par rapport un autre ou bien une quivalence entre des produits .
Cest galement lors de cette tape prliminaire que lon doit dfinir
la marge dquivalence (') au-dessous de laquelle on estime quune
diffrence na pas suffisamment dintrt pour tre prise en compte.
Pour ce faire, on peut saider des tudes antrieures.
Ces tudes dquivalence soulvent parfois encore des problmes
dthique, en particulier dans les tudes de dsescalade en cancro-
logie. Quelle perte de taux de succs peut-on admettre en contrepar-
tie dune rduction notable en toxicit ? Ou encore, quel bilan cot
efficacit peut-on tenter dtablir ?
www.biblio-scientifique.net
114 Biostatistiques pour le clinicien
6 Rfrences
1. Com-Nougue C, Rodary C (1987) Revue des procdures statistiques pour
mettre en vidence lquivalence de deux traitements. Rev Epidem Sant Publi
35: 416-30
2. Weswstlake W (1972) Use of confidence intervals in analysis of comparative
biovailability trials. J Pharm Sci 61: 1340-1
3. Dunnett CW, Gent M (1977) Significance testing to establish equivalence
between treatments with special reference to date in form of 2 x 2 tables.
Biometrics 33: 593-602
4. Mandallaz D, Mau J (1981) Comparison of different methods for decision-
making in bioequivalence assessment. Biometrics 37: 213-322
5. Hauck WW, Anderson S (1984) A new statistical procedure for testing
equivalence in two-groups comparative biovailability trials. J Pharmacokin
Biopharmaceut 12: 83-91
6. Patel HJ, Gupta GD (1981 March) A problem of equivalence in clinical trials.
Eastern North American Region meeting. Richmond Virginia
7. Karnofski DA, Abelmann WH, Craver LF, Burchenal JH (1948) The use of
nitrogen mustards in the palliative treatment of carcinoma. With particular
reference to brochongenic carcinoma. Cancer 1: 634-56
www.biblio-scientifique.net
Conclusions
www.biblio-scientifique.net
116 Biostatistiques pour le clinicien
Cette grille sinspire des recommandations uniformes des comptes rendus dessais
randomiss (Consolidated Standards of Reporting Trials CONSORT) >4, 5@.
Nous avons mis en gras, ce qui nous parat la fois particulirement important et
souvent en dfaut.
1. Expos des hypothses qui ont motiv lessai et son objectif.
2. Les donnes fondamentales :
1. Sujets inclus dans ltude :
critres dinclusion et dexclusion ;
nombre de sujets remplissant les critres dinclusion, mais non entrs dans lessai
et raisons ;
description de lchantillon.
2. Ce que lon cherche valuer :
appareil dinvestigation, dispositif mdical implantable, etc. (fabricant, date) ;
ou traitement mdical (posologie, mode et horaires dadministration, autres
traitements admis ou non) ;
ou traitement chirurgical (technique) ;
ignorance en simple insu (sujet) ou en double insu (sujet et prescripteur) ;
en cas dvnement indsirable, ce qui est prvu ?
3. Les critres de jugement :
principal ;
secondaires ;
recueil par qui et comment (en insu) ?
3. Statistique
1. Calcul des effectifs
en fonction des hypothses mdicales, des risques consentis ;
a-t-il t prvu des analyses intermdiaires ? de sous-groupes ?
2. Randomisation
type (permutation de nombres au hasard ?) ;
centralise ou non ?
stratification ou non ?
intervalle entre le tirage au sort et la mise en uvre de ce que lon cherche valuer.
3. Tests statistiques pertinents en fonction des variables tudies.
4. Analyse des rsultats
dviations par rapport au protocole (inclus secondairement exclus, allocation de
protocole errone, etc.) ; jugement en intention de traiter, puis per protocole.
perdus de vue
description des groupes compars.
5. Considrations thiques et rglementaires
consentement clair ;
promotion et obligations lgales.
6. Lors de llaboration du protocole
date de dbut et de fin espre des inclusions ;
financement.
www.biblio-scientifique.net
Conclusions 117
Cette grille de lecture dun essai randomis et de son corollaire qui est
llaboration du protocole mrite quelques commentaires.
1) Dans la dfinition des donnes fondamentales (2), il ne faut jamais
oublier denvisager les interactions qui peuvent exister entre elles, ce
qui amne souvent revoir ces donnes plusieurs reprises avant de
les arrter dfinitivement.
2) Les critres de jugement (2, 3) doivent tre dtermins a priori et
non au moment de lanalyse des rsultats. Cela est indispensable, ne
ft-ce que pour calculer les effectifs de sujets qui doivent tre inclus
dans lessai.
3) Leur recueil sur des critres objectifs doit se faire, de faon prfren-
tielle, par un observateur indpendant.
4) Le calcul de ces effectifs (3. 1.) est souvent difficile, nglig ou mal
conduit. La prise en compte du risque de deuxime espce est le point
important qui est souvent le plus mal trait dans les essais randomiss.
5) Aucun essai nest parfait. Faire tat des dviations par rapport au
protocole prvu est un signe dhonntet scientifique et rciproquement.
Rfrences
1. Dersimonian R, Charrette LJ, McPeek BA, Mosteller F (1982) Reporting on
methods in clinical trials. N Engl J Med 306: 1332-7
2. Schuman LP, Fischer JS, Thisted RA, Olak J (1999) Clinical trials in general
surgical journals: are methods better reported? Surgery 125: 41-5
3. Charpak Y (1995) Une grille de lecture des essais thrapeutiques randomiss.
Pour quoi faire ? Pour qui ? Le Concours mdical 117: 2865-8
4. Altman DG (1996) Better reporting of randomised controlled trial: the
CONSORT statement. Br Med J 313: 570-1
5. Liem MSL, Van der Graaf Y, Van Vroonhoven JMV (1997) CONSORT
randomized trials and the scientific community. Br J Surg 84: 769-70
www.biblio-scientifique.net
Partie
Forces dassociation,
tudes multifactorielles,
3
mesures dimpact, causalit
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
122 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire
et la corrlation 1
La corrlation
s 2 xy
r
sx sy
www.biblio-scientifique.net
124 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 125
La rgression linaire
La rgression permet dobtenir un modle prdictif entre deux
(rgression simple) ou plusieurs (rgression multiple) variables. Cest
donc une tape supplmentaire par rapport au coefficient de corrla-
tion qui mesurait lassociation. Lorsque les variables sont quantitatives
et que la relation entre elles est linaire, on appelle le modle la rgres-
sion linaire. Elle est utilise, par exemple, pour savoir si la mortalit
postopratoire dans diffrents services de chirurgie est associe ou non
au nombre dinterventions ralises dans chaque service, dans lanne.
Les donnes peuvent tre reprsentes sur un graphique (fig. 2) sur
lequel est port en abscisse, pour chaque hpital, le nombre dinter-
ventions faites dans lanne et en ordonne la valeur correspondante
de lautre variable, dans notre exemple, le nombre de dcs postop-
ratoires. Il en rsulte un modle statistique simple qui est la droite
de rgression linaire dont lquation sexprime sous la forme suivante
indique dans le tableau III.
www.biblio-scientifique.net
126 Biostatistiques pour le clinicien
Modle prdictif
La rgression permet, partir dune association observe, de
dvelopper un modle prdictif, cest--dire, partir dune valeur
dune variable x, de prdire la valeur de lautre variable y. La droite
de rgression prdit la valeur moyenne de y en fonction de x. La
variance de cette prdiction comprend non seulement la variance du
terme derreur (), mais aussi un terme li lincertitude destima-
tion de a et b (fig. 3). Dans une telle rgression, on appelle coeffi-
cient de dtermination la valeur R = r. Celui-ci indique la part de
la variance de Y qui est explique par le modle. La valeur de R est
entre 0 et 1. Plus elle est grande, plus importante est la qualit pr-
dictive du modle.
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 127
Le risque absolu
Le taux dincidence est une mesure descriptive en pidmiologie
correspondant au nombre de nouveaux cas dune maladie, dune rci-
dive ou dun dcs, recenss dans une population pendant une priode
de temps donne. Autrement dit, cest le rapport du nombre de nou-
veaux cas sur leffectif de la population tudie pendant la priode
donne. Lincidence est une mesure du risque absolu. Par exemple, en
France, sur un an, 40 nouveaux cas de cancers du clon chez lhomme
observs dans une population de 100 000 habitants correspond une
incidence annuelle de 40/100 000.
Le taux dincidence peut aussi tre estim en personne-annes. Par
exemple, si 800 personnes risque sont suivies pendant un an, et
600 autres pendant deux ans, et que 26 sont devenues sropositives
au VIH pendant leur suivi, on pourra calculer un taux dincidence de
1,3 pour 100 annes-personnes. Ceci permet dexploiter des donnes
pour lesquelles les dures de suivi sont varies.
Lincidence permet de suivre lvolution de la frquence dune affec-
tion dans le temps. Elle complte la notion de prvalence qui est le
nombre total de cas dune affection un moment donn.
Le risque relatif
Le risque relatif mesure les consquences de la prsence dun
facteur de risque par rapport au risque qui existe dans une popu-
lation dpourvue de ce facteur de risque. Ainsi, tout homme (ou
femme) peut avoir un cancer du poumon, mme sil ne fume pas.
Mais le fait de fumer augmente ce risque (et cette augmentation
est dose dpendante). De mme, aprs une intervention chirurgi-
cale pour une maladie de Crohn, un patient qui fumait et conti-
nue fumer a statistiquement 1,3 5 fois plus de risques, selon les
www.biblio-scientifique.net
128 Biostatistiques pour le clinicien
Chimiothrapie 63 39 102
Non exposs (E ) c d l2
Total c1 c2 N
Le risque relatif des exposs au risque (E) par rapport au groupe non expos (E )
est de :
a / l1
RR
c /l2
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 129
www.biblio-scientifique.net
130 Biostatistiques pour le clinicien
Tests
Comme dans toute comparaison, il est possible, grce un test
statistique de dterminer si le risque relatif ou lodds ratio observs
sont statistiquement diffrents de 1, cest--dire de rejeter lhypothse
dgalit de risque ou dodds ratio entre les deux lments que lon
compare. Dans ce cas, il est possible de conclure une association
entre le facteur tudi et, dans notre exemple, la mortalit.
Intervalle de confiance
Il est aussi souhaitable destimer lintervalle de confiance 95 %
autour dun risque relatif ou dun odds ratio et leur variance (s)
(tableau VI). En fait, on ne calcule pas directement la variance, mais
celle de son logarithme (Ln).
Variance (s)
1 1 1 1
s (Ln odds ratio) =
a b c d
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 131
La force de lassociation
La force de lassociation entre variables expliquantes et variable
explique peut tre estime, selon la nature des variables par la
www.biblio-scientifique.net
132 Biostatistiques pour le clinicien
rgression linaire, les risques relatifs, les odds ratio ou les hazard ratios.
1 Rappelons que si les variables expliquantes et la variable explique
sont quantitatives, cette estimation est faite laide dun coefficient de
corrlation. Si les variables sont qualitatives la force dassociation est
estime laide des risques relatifs ou des odds ratio. Si la variable
expliquer est censure, on utilisera les hazard ratios.
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 133
Fig. 5 Dans les tudes unifactorielles, il peut y avoir des liens entre certaines
variables expliquantes entre elles. Ces variables peuvent alors apporter des
informations qui sont redondantes. Par exemple, plus lextension paritale du
cancer colique est importante, plus il risque dy avoir des mtastases ganglion-
naires et plus il y a de mtastases ganglionnaires, plus il risque dy avoir des
mtastases hpatiques.
www.biblio-scientifique.net
134 Biostatistiques pour le clinicien
Fig. 6 Exemple de classifications des cancers colorectaux qui, reposant sur des
tudes unifactorielles empiriques ne se sont pas avres satisfaisantes et ont fait
lobjet de nombreuses modifications qui ont fini par mener des confusions.
Ajustement
La ralisation dun ajustement est lun des aspects des tudes
multifactorielles. Le principe de lajustement est de permettre de
mesurer lassociation entre deux variables, les autres variables tant
fixes un mme niveau. Ainsi, il y a corrlation entre la pression
artrielle et lge, et entre la pression artrielle et le poids. Le prin-
cipe de lajustement permet de quantifier la corrlation entre la pres-
sion artrielle et lge comme si elles avaient t mesures chez des
individus de mme poids. Lajustement est une approche souvent
utilise lorsquun certain nombre de facteurs (souvent lge, le sexe)
sont connus pour influencer le devenir du patient, mais ne consti-
tuent pas la problmatique centrale dune tude. Les techniques de
lajustement incluent lappariement, la stratification et la modlisa-
tion par rgression.
Rfrences
1. Borley NR, Mortensen NJ, Jewell DP (1997) Preventing postoperative recur-
rence of Cronhs disease. Br J Surg 84: 1493-502
www.biblio-scientifique.net
Les tudes unifactorielles. La rgression linaire et la corrlation 135
www.biblio-scientifique.net
Les tudes multifactorielles
2
Dans les sciences de la vie, sil est intressant dtudier les forces
dassociation entre deux variables, on est beaucoup plus souvent
confront ltude des corrlations quil peut y avoir entre plusieurs
covariables explicatives et une variable que lon cherche expliquer.
Cest, par exemple, le cas des facteurs qui peuvent intervenir dans une
mortalit postopratoire, facteurs lis au malade lui-mme comme son
ge, ses antcdents cardiovasculaires ou respiratoires, etc. ou lis sa
maladie : cancer avec ou sans mtastases ganglionnaires, hpatiques ou
encore du type de lintervention ralise.
La premire tape dune tude multifactorielle (multivariate en
anglais) est une tude unifactorielle qui consiste, parmi toutes les
variables explicatives qui ont t proposes dans ltude, slection-
ner celles qui montrent une association statistiquement significative
avec la variable explique. On retient habituellement pour faire cette
slection un seuil de signification qui peut tre de p = 0,20 et mme
0,25, cest--dire suprieur au p = 0,05 habituel. Ce choix dun seuil
plus lev a pour objectif de privilgier la puissance, cest--dire de
slectionner les variables associes, mme si lassociation est faible, par
rapport au risque de premire espce qui conduit slectionner des
variables qui ne sont pas associes. Il peut, en effet, arriver que, com-
bines dautres variables, les associations deviennent plus fortes.
Bien entendu, une analyse multifactorielle ne peut tudier que les cova-
riables incluses dans ltude. Lnonc de cette vidence a pour seul
but de souligner limportance quil y a de bien rflchir au choix des
covariables que lon introduit dans le modle. Dautre part, pour viter
dtre confront au problme de donnes manquantes, il convient de
faire des tudes prospectives.
Les analyses multifactorielles ont ainsi deux objectifs supplmentaires
par rapport aux analyses unifactorielles :
1) Faire disparatre les covariables lies entre elles au profit de la seule ou
des seules qui sont indpendantes. Cela quivaut tenir compte des asso-
ciations entre ces covariables. On aura cependant intrt, lorsque plusieurs
www.biblio-scientifique.net
138 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes multifactorielles 139
derniers ns pesant plus lourds que les premiers ns. Il existe enfin,
comme cela tait prvisible partir des donnes prcdentes, une
liaison entre lge de la mre et la parit. On peut alors se demander si
la liaison entre lge de la mre et le poids du nouveau-n est dpen-
dante ou non du rang de naissance (fig. 2). Autrement dit, est-ce que
la liaison entre lge de la mre et le poids du nouveau-n persiste ou
non parit constante ?
www.biblio-scientifique.net
140 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes multifactorielles 141
www.biblio-scientifique.net
142 Biostatistiques pour le clinicien
Variable Expression
Outil
expliquante explique des rsultats
Quantitative
Rgression Coefficients
ou qualitative Quantitative
multiple de rgression
ordonne
Analyse
Qualitative Qualitative Valeurs prdictives
discriminante
www.biblio-scientifique.net
Les tudes multifactorielles 143
www.biblio-scientifique.net
144 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes multifactorielles 145
La rgression logistique
www.biblio-scientifique.net
146 Biostatistiques pour le clinicien
Le modle de Cox
Le modle de Cox [3] repose sur le mme principe gnral que les
autres types danalyses multifactorielles. Il est utilis lorsque la variable
explique est une variable censure comme une survie, une rcidive, etc.
www.biblio-scientifique.net
Les tudes multifactorielles 147
Covariable* :
Sexe fminin 2,7 1,07 6,76 0,03
Anastomose < 5 cm de lanus 6,5 2,37 17,87 < 0,001
Exemple
Le modle de Cox est le bon outil pour estimer des facteurs de
pronostic dune maladie. Une tude a ainsi t faite chez des malades
qui avaient un cancer de lsophage, qui a t rsqu de faon
apparemment complte (rsection dite vise curative ) [4]. Sur
21 covariables analyses, en tude unidimensionnelle, neuf taient
statistiquement lies la survie (test du logrank). Elles ont alors t
incluses dans un modle de Cox. Celui-ci a montr que seules quatre
dentre elles taient indpendantes et associes un mauvais pronostic
(tableau IX).
www.biblio-scientifique.net
148 Biostatistiques pour le clinicien
Modle de Cox
Risque-relatif
Coefficient
Covariables cart-type P Instantan
de rgression ()
(HR)
ge < 65 ans 0,05 0,02 0,02 1,05
Classification ASA* 0,39 0,25 0,01 1,47
Infiltration paritale 0,40 0,15 0,03 1,49
Envahissement
0,38 0,19 0,01 1,46
ganglionnaire
* ASA American society of anesthesiology. Ce score est un score global de risque en quatre
classes ordonnes qui tient compte des fonctions vitales dun malade.
www.biblio-scientifique.net
Les tudes multifactorielles 149
Lanalyse discriminante
Lanalyse discriminante est une forme danalyse multifactorielle
dont lobjectif diffre des mthodes prcdentes. Comme son nom le
suggre, elle a pour but, au sein dune population, de chercher discri-
miner le mieux possible, laide de covariables, deux sous-groupes A
et B que diffrencient la survenue ou labsence de survenue de la
variable que lon cherche expliquer.
Si ces deux sous-groupes sont reprsents par le contenu dune ellipse,
il est possible de mesurer la distance qui spare les deux centres de ces
deux ellipses (fig. 3). Plus cette distance D et son carr D, dnomm
coefficient de Mahalanobis [5] sont importants, mieux la combinaison
des covariables expliquantes discrimine les deux sous-groupes.
www.biblio-scientifique.net
150 Biostatistiques pour le clinicien
etc.
Exemple
Une tude a cherch, chez des malades cirrhotiques qui avaient fait
une hmorragie digestive, lie une hypertension portale, les facteurs
de mortalit (ou de survie) un mois [6]. Pour chaque covariable,
il a dabord t fait une analyse discriminante unidimensionnelle en
valuant le coefficient de Mahanalobis et sa signification statistique
(tableau XI). Ces covariables ont t classes par ordre dcroissant
de ce coefficient, cest--dire en commenant par les covariables qui
discriminaient le plus les survivants, des malades dcds. Les auteurs
ont calcul pour chaque covariable le pourcentage de malades bien
classs. Comme on le voit, sil y a une certaine cohrence entre un
coefficient de Mahalanobis lev, la signification du test et le pour-
centage de bien classs, cette cohrence nest pas absolue. Par exemple,
lascite qui tait associe au coefficient de Mahalanobis le plus fort ne
vient quau troisime rang du classement des malades. Il aurait encore
t possible destimer la valeur prdictive de dcs ou de survie de
chaque covariable.
www.biblio-scientifique.net
Les tudes multifactorielles 151
Coefficient % de sujets
Covariables P
de Mahalanobis bien classs
Etc.
Coefficient
Covariables % de sujets bien classs
de Mahalanobis
Ascite 0,364 63
17 covariables 1,710 79
www.biblio-scientifique.net
152 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les tudes multifactorielles 153
www.biblio-scientifique.net
154 Biostatistiques pour le clinicien
Rfrences
1. Cosnes J, Gendre JP, Lacaine F, Naveau S, Le Quintrec Y (1982) Rles compen-
sateurs de lilon et du clon, restant aprs rsection tendue de lintestin grle.
Gastroenterol Clin Biol 6: 159-65
2. Rullier E, Laurent C, Garrelon JL et al. (1998) Risk factors for anastomotic
leakage after resection of rectal cancer. Br J Surg 85: 355-8
3. Cox DR (1972) Regression models and life-tables (with discussion). J R Statis
Soc Br 34: 187-220
4. Petrequin P, Huguier M, Lacaine F, Houry S (1997) Cancers de lsophage
rsqus : modle prdictif de survie. Gastroenterol Clin Biol 21: 12-6
5. Mahalanobis PC (1936) On the generalised distance in statistic. Proc Ntle
Institute Science India 2: 49-55
6. Poynard T, Chaput JC, Mary JY, et al. (1980) Analyse critique des facteurs lis
la mortalit au trentime jour dans les hmorragies digestives hautes du
cirrhotique. Gastroenterol Clin Biol 4: 655-65
7. Birkmeyer JD, Finlayson SR (1998) Misuse of multivariate analysis. Surgery 124: 114
8. Barrier A, Boelle PY, Lemoine A, et al. (2007) Gnomique somatique et pronostic
des cancers colorectaux. Bull Acad Ntle Med 191:1091-103
www.biblio-scientifique.net
La causalit
3
Le risque en excs
Le risque en excs reprsente la diffrence entre le risque de sur-
venue dune maladie chez les sujets exposs au risque et ceux qui ne
www.biblio-scientifique.net
156 Biostatistiques pour le clinicien
Chimiothrapie 63 39 102
Le risque en excs est gal la diffrence entre le risque de mortalit chez les patients
qui ont eu de la chimiothrapie (63/102) moins le risque chez les patients nayant pas
eu de chimiothrapie (70/104) soit :
(63/102) (70/104) = 0,056
Non exposs (E -) c d l2
Total c1 c2 N
Le risque attribuable
Le risque attribuable est encore dnomm fraction tiologique
du risque. Il permet des dcisions en sant publique. Par exemple, si
8 % 12 % des insuffisances rnales terminales sont attribuables la
prise de fortes doses cumules de paractamol [1], cela signifie que si
ce mdicament tait retir du march on pourrait viter, au maximum,
8 % 12 % des insuffisances rnales terminales.
www.biblio-scientifique.net
La causalit 157
Toujours dans notre exemple, une tude ayant montr que chez
les personnes qui ont absorb au cours de leur vie entre 1 000 et
5 000 comprims de paractamol, ce qui reprsente 11,9 % de la
population (les Franais sont les plus gros consommateurs de mdi-
caments au monde avec les Nord-Amricains), le risque relatif associ
linsuffisance rnale terminale tait gal 2,0 [2]. Le risque attri-
buable chez les consommateurs de paractamol tait alors gal :
(2,0 1)/2,0 = 50 %.
Lautre formulation du risque attribuable est le risque attribuable en
population. Cest, par exemple, la fraction des insuffisances rnales
attribuables au paractamol dans la population gnrale qui est de
8 % 12 % (tableau II). Ce risque attribuable en population est gal
9,2 %.
P exposs (RR 1)
RAP
1 P exposs (RR 1)
RAP = 9,2 %
Interprtation
La notion de risque attribuable doit tre interprte avec beaucoup
de discernement. En effet, ce risque tant calcul partir du risque
relatif, il est soumis aux biais qui peuvent affecter ce dernier. Dans
lexemple du paractamol, une mauvaise approximation du risque rela-
tif sur un chantillon isol et peu reprsentatif, aurait pu montrer des
www.biblio-scientifique.net
158 Biostatistiques pour le clinicien
La causalit
Le problme essentiel de lpidmiologiste est de dterminer si
une diffrence estime entre exposs et non exposs nest quune
association non causale ou bien sil existe un effet causal. Cette
notion de causalit est de nature probabiliste. Tous les malades qui
ont un msothliome pleural nont pas t en contact avec lamiante
et toutes les personnes ayant t en contact avec lamiante nauront
pas de msothliome. En revanche, en moyenne, une personne en
contact avec lamiante a plus de risque davoir un msothliome.
Linterprtation des faits est souvent plus complique encore. Par
exemple, on observe que la consommation dalcool est plus leve
chez les fumeurs que chez les non-fumeurs, ce qui pourra entraner
une plus forte incidence des cancers du poumon chez les alcooliques
(association non causale) alors que cest le tabac qui en est respon-
sable (association causale).
Pour prouver quun facteur de risque est non seulement associ la
survenue dune maladie, mais encore responsable, une accumulation
darguments est ncessaire [3]. La causalit ne peut pas tre tablie
simplement sur des critres statistiques. Notamment, on a vu lexis-
tence de facteurs de confusion. Ceux-ci sont des obstacles linter-
prtation causale. Le problme est que lon nest jamais certain davoir
observ tous les facteurs de confusion possibles.
Pour les mdicaments mis sur le march, lalerte au dpart peut tre
donne par les mdecins et les pharmaciens, et depuis juin 2011, par
les patients soit la Commission nationale de pharmacovigilance,
soit la base europenne qui centralise les informations de tous les
pays membres. Lexprience de la vaccination contre la grippe H5N1
dans laquelle cette possibilit a t ouverte aux patients a montr
www.biblio-scientifique.net
La causalit 159
www.biblio-scientifique.net
160 Biostatistiques pour le clinicien
3 Rfrences
1. Ronco PM, Flahault A (1994) Drug-induced end-stage renal disease. N Engl
J Med 334: 1711-2
2. Perneger TV, Whelton PK, Klag MJ (1994) Risk of kidney failure associated with
the use of acetaminophen, aspirin, and nonsteroidal antiinflammatory drugs. N
Engl J Med 331: 1675-9
3. Flahault A, Spira A (2011) La situation pidmiologique en France en 2011.
Rapport. Bull Acad Ntle Med (sous presse)
www.biblio-scientifique.net
Partie
Le diagnostic 4
www.biblio-scientifique.net
Introduction
Rfrence
1. Languille T, Flamant Y, Maillard JN (1980) La douleur biliaire aigu. Essai de
smiologie critique. Gastroentrol Clin Biol 4: 844-7
www.biblio-scientifique.net
Les outils de mesure
1
M+ M Total
S+ a b a+b
S c d c+d
Total a+c b+d N
M + reprsente, au sein de la population tudie, les malades.
M les personnes qui nont pas la maladie.
S + reprsente la prsence du signe (ou le rsultat anormal de lexamen).
S labsence du signe (ou le rsultat normal de lexamen).
Les quatre sous-groupes du champ du tableau correspondent ainsi :
a leffectif des signes prsents chez les malades ;
b leffectif des signes prsents chez des sujets qui nont pas la maladie (appels
faux positifs ) ;
c leffectif des signes absents chez les malades (appels faux ngatifs ) ;
d celui des signes absents chez les sujets qui nont pas la maladie.
www.biblio-scientifique.net
166 Biostatistiques pour le clinicien
M+ M Total
S+ a b a+b
S c d c+d
Total a+c b+d N
La sensibilit (Se) est gale a / (a + c).
La spcificit (Sp) est gale : d / (b + d).
La sensibilit
La sensibilit dun signe est le pourcentage de cas o il est prsent
chez les malades, ce que lon peut encore exprimer en disant que cest
la probabilit du signe sil y a la maladie. Elle est estime par le rapport
du nombre de malades chez lesquels le signe est prsent (a) au nombre
de malades (a + c).
Un signe est dautant plus sensible quil est souvent prsent dans la
maladie. Si c = 0, cest--dire pas de faux ngatifs , la sensibilit du
signe est gale 1 (ou 100 %), ce qui signifie que le signe est toujours
prsent chez les malades. Cest le cas de la fivre dans la typhode, ou
de llvation des transaminases dans les hpatites. Beaucoup dtudes
qui concernent lvaluation dun moyen diagnostique sont rtrospec-
tives et ne portent que sur des patients atteints dune maladie, chez
lesquels un examen complmentaire a t tudi. De ce fait, elles ne
peuvent apprcier que la sensibilit de cet examen, ce qui en limite
beaucoup lintrt comme nous allons le voir.
La spcificit
La spcificit dun signe dans une population mesure le pourcen-
tage de sujets chez lesquels il est absent parmi ceux qui nont pas la
maladie. En termes de probabilit, la spcificit estime la probabilit
www.biblio-scientifique.net
Les outils de mesure 167
M+ M Total
S+ a b a+b
S c d c+d
Total a+c b+d N
La valeur prdictive positive (VPP) est gale a/a + b.
La valeur prdictive ngative (VPN) est gale : d/c + d.
www.biblio-scientifique.net
168 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les outils de mesure 169
www.biblio-scientifique.net
170 Biostatistiques pour le clinicien
2) Les sujets qui ont une hpatite virale ont toujours une lvation des transaminases,
1 ce qui donne :
M+ M Total
S+ 1 b a+b
S 0 d c+d
Total 1 999 1 000
3) Dans la population gnrale, on observe que 5 % des sujets peuvent avoir une
lvation des transaminases sans avoir pour autant une hpatique virale, ce qui
donne (par approximation) :
M+ M Total
S+ 1 50 51
S 0 949 949
Total 1 999 1 000
La sensibilit (Se) du signe est 1/1 soit 100 % ou 1,0 ; la spcificit (Sp) est 949/999
ou 0,05.
p (M+) = 0,001.
p (S+ |M+ ) = Se = 1,0
p (S+ |M) = Sp = 0,05
0,001 u 1,0
La VPP p(M S ) 0,02, soit 2 %
0,001 u 1,0 (1 999) u (1 0,05)
Rfrences
1. Lacaine F, Huguier M, Gremy F (1978) Lefficacit dun examen but diagnos-
tique : de la donne la dcision mdicale. Nouv Presse Med 7: 1451-3
2. Price (1763) An essay towards solving a problem in the doctrine of chances
by the late Rev. Mr Bayes, F.R.S. Philosophical transactions: 370-418. (Nous
remercions la bibliothcaire de la facult de mdecine de Lille qui nous a adress
une photocopie de la publication originale de la communication de Price)
3. Casscells W, Schoenberger A, Graybos T (1978) Interpretation by physicians of
clinical laboratory results. N Engl J Med 299: 999-1000
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit,
les valeurs prdictives. Les courbes ROC 2
www.biblio-scientifique.net
172 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit, les valeurs prdictives. Les courbes ROC 173
www.biblio-scientifique.net
174 Biostatistiques pour le clinicien
Indices globaux
Pour essayer de concilier les termes de cette alternative, examen
sensible, mais peu spcifique ou spcifique, mais peu sensible, des
moyens prenant en compte la fois la sensibilit et la spcificit ont
t proposs.
Ainsi, la fiabilit dun examen estime la somme des vrais posi-
tifs et des vrais ngatifs sur lensemble des cas tudis (a + d)/N.
Un autre outil est le rapport de vraisemblance de lexamen. Cest le
rapport du pourcentage des vrais positifs chez les malades (a/a + c)
sur les faux positifs chez les sujets qui nont pas la maladie (b/b + d).
Par exemple, un rapport de vraisemblance gal quatre signifie que
lexamen est quatre fois plus souvent positif chez les malades que chez
ceux qui nont pas la maladie. Par analogie, il est encore possible de
mesurer le rapport de vraisemblance ngatif quest le rapport du pour-
centage des faux ngatifs chez les malades c/(a + c) sur les vrais
ngatifs chez les sujets qui nont pas la maladie d/(b + d). Un rap-
port de 0,5 signifie que labsence du signe est deux fois moins souvent
observe chez les malades que chez les sujets qui nont pas la maladie.
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit, les valeurs prdictives. Les courbes ROC 175
www.biblio-scientifique.net
176 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit, les valeurs prdictives. Les courbes ROC 177
Fig. 3 Courbe ROC. Par rapport la figure 2, au lieu de porter en abscisses les
valeurs de la spcificit (Sp), il est port leurs complments (1 Sp).
Sous les conditions rappeles ci-aprs, la valeur seuil optimale est celle
qui correspond sur la courbe son point dinflexion, soit encore au
point dintersection de la courbe ROC et de la deuxime bissectrice de
laxe des abscisses et des ordonnes. Ce choix sapplique dans lhypo-
thse dun cot affect aux erreurs de diagnostic quivalent ou peu
prs quivalent pour les faux positifs et les faux ngatifs .
Il existe des tests statistiques qui permettent de comparer les courbes
ROC observes la premire bissectrice qui reprsente une progres-
sion linaire entre la sensibilit et le complment de la spcificit. Il est
encore possible de comparer deux courbes ROC entre elles pour deux
examens diffrents. Des tests statistiques reposent sur la comparaison
des surfaces sous les courbes (AUROC) (fig. 4). Comme il vient dtre
dit, la courbe ROC qui serait sur la premire diagonale correspond
un test sans intrt diagnostique. Dans cette configuration, laire sous
la courbe AUROC correspondrait 0,5. La valeur de lAUROC aug-
mente avec la qualit diagnostique du test dont on peut tester lintrt,
par exemple, en montrant que son AUROC est significativement plus
grande que 0,5.
www.biblio-scientifique.net
178 Biostatistiques pour le clinicien
Fig. 4 Courbes ROC comparant les valeurs diagnostiques de svrit dans les
pancratites aigus entre deux scores diffrents, le score APACHE (aire sous la
courbe : 0,78) et le score de Glasgow (aire sous la courbe : 0,65) laide dun
test de McNemar (p = 0,005) [7].
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit, les valeurs prdictives. Les courbes ROC 179
www.biblio-scientifique.net
180 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Remarques sur la sensibilit, la spcificit, les valeurs prdictives. Les courbes ROC 181
quil y ait environ 2 100 tmoins, cest--dire que ltude devra porter
sur un total de 2 335 chantillons durine.
Rfrences
1. Alderson P, Adam DF, McNeil BJ, et al. (1983) Computed tomography, ultra-
sound, and scintigraphy of the liver in patients with colon or breast carcinoma:
a prospective comparison. Radiology 149: 224-30
2. Molkhou JM, Lacaine F, Houry S, Huguier M (1989) Dpistage des mtastases
hpatiques des cancers digestifs. Place des dosages enzymatiques et de
lchographie. Presse Med 18:1370-4
3. Adloff M, Arnaud JP (1985) tude prospective critique des diffrentes mthodes
de dtection des mtastases hpatiques. Ann Gastroenterol Hepatol 21: 31-4
4. Chan AW, Altman DG (2005) Identifying outcomes reporting bias in randomised
trials on PubMed: review of publications and survey of authors. BMJ 330: 753
5. Smith TJ, Kemeny MM, Sugarbaker PH (1982) A prospective study of hepatic
imaging in the detection of metastastic disease. Ann Surg 33: 519-23
6. Raffaelsen SR, Kronborg O, Larsen C, Fenger C (1995) Intraoperative
ultrasonography in detection of hepatic metastases for coloretal cancer. Dis
Colon Rectum 38: 355-60
7. Mofidi R, Madhavan KK, Garden OJ, Parks RW (2007) An audit of the
management of patients with acute pancreatitis against national standards of
pratice. Br J Surg 94: 844-8
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen,
attitude dcisionnelle 3
La dmarche diagnostique
Le raisonnement intuitif
La dmarche diagnostique intuitive fait appel aux connaissances et
lexprience. Son analyse permet de comprendre laide au diagnostic
que peuvent apporter les probabilits baysiennes.
Cette dmarche diagnostique consiste, partir dun symptme pour
lequel le malade vient consulter, voquer des probabilits diagnos-
tiques a priori qui reposent comme il vient dtre indiqu sur les
connaissances et lexprience. Chez un adulte qui se plaint dune
douleur abdominale aigu, on sait intuitivement quil peut avoir une
appendicite, une cholcystite ou de nombreuses autres affections
moins frquentes.
Ensuite, toujours intuitivement, on intgre dans le raisonnement
dautres donnes que le symptme douleur abdominale aigu
(ge, sexe, autres symptmes, signes dexamen, etc.). Ainsi, dans notre
exemple, si le malade est jeune, le diagnostic dappendicite est plus
probable que sil est g. La localisation de la douleur dans la fosse
iliaque droite augmente encore cette probabilit. En revanche, sil sagit
dune femme, la probabilit a priori dune cholcystite est plus leve
que sil sagit dun homme, la lithiase vsiculaire tant plus frquente
chez la femme que chez lhomme, etc.
On aboutit ainsi, partir des symptmes dont se plaint le malade
et de ses antcdents, puis de lexamen clinique des probabilits
diagnostiques a posteriori.
www.biblio-scientifique.net
184 Biostatistiques pour le clinicien
La dmarche systmatique
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen, attitude dcisionnelle 185
Le raisonnement objectif
la dmarche assez intuitive qui a t dcrite au dbut de ce cha-
pitre, on peut substituer une dmarche plus scientifique. Nous allons
reprendre lexemple dj voqu dune douleur abdominale aigu.
La premire tape a consist utiliser les rsultats des tudes pid-
miologiques sur les causes des douleurs abdominales aigus chez des
patients adultes (plus de 15 ans) venus consulter en urgence lhpital
pour ce symptme. Une tude a ainsi t mene chez 3 500 malades
[3]. Elle a montr que les causes en taient une appendicite dans 26 %
des cas, une cholcystite dans 10 % des cas, etc. ou encore un kyste de
lovaire compliqu dans 2 % des cas. Ce sont les probabilits a priori
des causes de douleurs abdominales aigus.
Cette tude a t complte par la mesure de la sensibilit et la valeur
prdictive positive de chaque signe dans chacune des affections qui
pouvaient tre la cause des douleurs abdominales aigus.
partir de ces donnes, et des probabilits baysiennes, il a t possible
dlaborer une aide au diagnostic en introduisant dans le modle, une
une, les donnes, ce qui aboutit des probabilits a posteriori [4]. Par
exemple, la probabilit a priori dune cholcystite tait de 10 % comme
nous lavons indiqu. Un ge infrieur 50 ans diminuait cette proba-
bilit de 10 % 3 %. Lappartenance au sexe fminin raugmentait la
probabilit de cholcystite de 3 % 7 %. Le sige de la douleur dans
lhypocondre droit augmentait encore cette probabilit, etc.
Les probabilits baysiennes peuvent ainsi sappliquer plusieurs
hypothses diagnostiques a priori. Pour cela, il convient, comme dans
notre exemple, que les diagnostics soient mutuellement exclusifs et
que toutes les hypothses diagnostiques soient envisages, cest--dire
que la somme de leurs probabilits respectives soit de 100 %.
Dans une situation pour laquelle on connat les probabilits a priori de
diffrentes maladies M1, M2, M3, etc. la probabilit dune maladie M1
si un signe S1 est prsent scrit p (M1_S1) :
p(M 1) u p(S1 M 1)
p(M 1 S1)
p(M 1) u p(S1 M 1) p(M 2) u p(S1 M 2) p(S1 M 3) etc.
www.biblio-scientifique.net
186 Biostatistiques pour le clinicien
montr quelles taient une fois sur deux dorigine virale. Ltude des
3 RV en faveur de lorigine virale de laffection a donn les rsultats
indiqus dans le tableau I [5].
Rapport de vraisemblance
ge > 15 ans 1,8
ge < 15 ans 0,6
Selles liquides 1,3
Selles molles 0,3
Vomissements 1,5
Absence de vomissement 0,4
Fivre 0,9
Absence de fivre 1,1
Rhinite 0,6
Absence de rhinite 1,3
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen, attitude dcisionnelle 187
www.biblio-scientifique.net
188 Biostatistiques pour le clinicien
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen, attitude dcisionnelle 189
www.biblio-scientifique.net
190 Biostatistiques pour le clinicien
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen, attitude dcisionnelle 191
www.biblio-scientifique.net
192 Biostatistiques pour le clinicien
Il existe une liste ditems pour amliorer la qualit des publications sur
les moyens diagnostiques (STARD, acronyme pour Standard for repor-
ting of diagnostic accuracy).
www.biblio-scientifique.net
La dmarche diagnostique, choix dun examen, attitude dcisionnelle 193
Rfrences
1. Mornex R (1977) Pour une stratgie des examens paracliniques. Nouv Presse
Med 6: 1725-8
2. Palfrey S (2001) Daring to practice low-cost medicine in a high-tech era. New
England J Med
3. AURC, ARC (1981) Les syndromes douloureux aigus de labdomen. Etude
prospective multicentrique. Nouv Presse Med 10: 3771-3
4. AURC, ARC (1984) Aide au diagnostic et la dcision devant un syndrome
douloureux abdominal aigu. Revue Epidmiol et Sant Pub 32: 40-4
5. Brachet R, Etienney I, Flahault A et al. (1999) Gastro-entrites hivernales.
Calicivirus et Rotavirus ont t les deux familles de virus les plus frquemment
identifies. Le Quotidien du mdecin
6. De Romilly J (1998) Le trsor des savoirs oublis. De Fallois, Paris, p 83
7. Alderson PO, Adams DF, McNeil BJ, et al. (1983) Computed tomography,
ultrasound and scintigraphy of liver in patients with colon or breast carcinoma:
a prospective comparison. Radiology 149: 225-30
8. Blery C (1980) Examens paracliniques pr-opratoires. Le Concours mdical
102: 5607-10
9. National study by the Royal College of radiologists (1979) Preoperative chest
radiology. Lancet 2: 83-6
10. Huguier M, Barrier A, Zacharias T, Valinas R (2006) Rsultats de la tomographie
par mission de positons dans les cancers de lappareil digestif. Bull Acad Natle
Med 190: 75-87
11. Weber JC, Bachellier P, Oussoulzoglou E, Jaeck D (2003) Simultaneous resection
of colorectal primary tumour and synchronous metastases. Br J Surg 90: 956-62
www.biblio-scientifique.net
Utilisation des mthodes multifactorielles
dans une dmarche diagnostique 4
www.biblio-scientifique.net
196 Biostatistiques pour le clinicien
Une tude rtrospective a ainsi t faite chez 503 malades qui avaient
4 eu une cholangiographie peropratoire pour dpister une lithiase de
la VBP (variable explique) [1]. Onze covariables ont t tudies.
Huit dentre elles taient lies lexistence dune lithiase de la VBP en
analyse unifactorielle. Lanalyse multifactorielle, utilisant la rgression
logistique, a slectionn cinq variables lies la probabilit leve dune
lithiase de la VBP : lge, des antcdents de colique hpatique, de cho-
lcystite, la prsence de calculs vsiculaires de moins de 10 mm, et une
VBP de plus de 12 mm. Les rsultats ont t exprims par des odds
ratio ajusts sur les autres variables. Par exemple, les patients ayant une
VBP > 12 mm avaient 22 fois plus de risque davoir une lithiase de la
VBP que ceux qui avaient une VBP < 12 mm et ce, indpendamment
des autres covariables. Il a encore t possible de dterminer, partir
dune quation de rgression logistique (en utilisant le logarithme des
odds ratio), un score dont lquation est indique dans le tableau I.
Les rsultats de cette tude ont ainsi suggr que, chez les malades dont
le score tait infrieur 3,5, la probabilit de lithiase de la VBP tait de
www.biblio-scientifique.net
Utilisation des mthodes multifactorielles dansune dmarche diagnostique 197
Rfrences
1. Huguier M, Bornet P, Charpak Y, et al. (1992) Selective contraindications based
on multivariate analysis for operative cholangiography in biliary lithiasis. Surg
Gynecol Obstet 172: 470-4
2. Montariol T, Rey C, Charlier A, et al. (1995) Preoperative evaluation of the
probability of common bile duct stones. French Association for Surgical
research. J Am Coll Surg 172: 470-4
3. Millat B, Deleuze A, de Saxce B, et al. (1997) Routine intraoperative
cholangiography is feasible and efficient during laparoscopic cholecystectomy.
Hepato-gastroenterol 44: 22-7
www.biblio-scientifique.net
Concordance
5
www.biblio-scientifique.net
200 Biostatistiques pour le clinicien
qui peut exister entre diffrentes variables. Mais ils ne permettent pas
5 dapprcier une concordance.
En voici une illustration.
Supposons que deux cliniciens examinent, de faon indpendante lun
de lautre, 100 malades et fassent les diagnostics suivants dappendicite
aigu (tableau I).
www.biblio-scientifique.net
Concordance 201
La concordance
La concordance brute
La concordance brute ou pourcentage dagrments rpond une
notion simple : cest la proportion observe de diagnostics iden-
tiques chez deux examinateurs. Dans lexemple du tableau I, elle est
de 100 % ; dans celui du tableau II, elle est de 0 %. Dans lexemple du
tableau III, elle est gale :
(a + d) / (a + b + c + d).
Cette mesure nest pas trs sensible aux divergences qui peuvent exister
si les effectifs sont trs dsquilibrs entre les classes utilises dans la
cotation.
www.biblio-scientifique.net
202 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Concordance 203
Po Pa
N=
1 Pa
ce qui donne dans notre exemple :
0,81 0,53 0,28
N= = = 0,60
1 0,53 0,47
www.biblio-scientifique.net
204 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Concordance 205
Le kappa pondr
Dans lvaluation de la concordance, des mesures effectues par deux
examinateurs avec une chelle qui comporte plus de deux niveaux
ordonns, on peut juger que tous les dsaccords nont pas le mme
poids. Prenons lexemple de deux anatomopathologistes qui valuent
le degr de fibrose dans le foie avec le score METAVIR, avec un juge-
ment en trois catgories de fibrose allant de F2 (fibrose modre) F4
(cirrhose). On peut considrer quun cart dune unit, par exemple
sur une mme lame, une cotation de F3 par un lecteur et de F4 par
lautre, est moins grave quun cart de deux units.
Supposons que ces deux anatomopathologistes aient examin les
mmes malades et aient abouti aux conclusions suivantes (tableau XII).
www.biblio-scientifique.net
206 Biostatistiques pour le clinicien
Anatomopathologiste A
Lsion
F2 F3 F4 Total
Anatomopathologiste B
F2 6,5 10 8,5 25
F3 9,1 14 11,9 35
F4 10,4 16 13,6 40
Total 26 40 34 100
www.biblio-scientifique.net
Concordance 207
Conclusions
Lanalyse de concordance permet de dterminer, parmi plusieurs
paramtres histologiques dune maladie, ceux qui prtent le moins
des difficults dinterprtation, cest--dire ceux dont le coefficient
kappa est le plus lev [4].
Rfrences
1. Cohen J (1960) A coefficient of agreement for nominal scales : Educational and
psychological measurement. 20: 37-46
2. Landis JR, Koch GG (1977) The measurement of observer agreement for
categorial data. Biometrics 33: 159-74
3. Henk JM, Kunkler PB, Smith CW (1977) Radiotherapy and hyperbaric oxygen
in head and neck cancer. Lancet 2: 101-3
4. Chastang C, Csarini YP, Beltzer-Garelli H, et al. (1984) tablissement dune
classification pronostique en deux stades du mlanome malin primitif partir
dune analyse multidimensionnelle et dune tude de concordance. Rev Epidm
et Sant Publi 32: 243-8
www.biblio-scientifique.net
Partie
Les valuations thrapeutiques 5
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
212 Biostatistiques pour le clinicien
rsultats, dues dautres facteurs que les traitements que lon cherche
comparer. Ainsi, dans les comparaisons dites historiques , compa-
rant un groupe de malades anciens et de malades traits de faon plus
rcente, des biais sont, par exemple, lis au fait que les malades les plus
rcents ont des affections dont le pronostic spontan est meilleur grce
aux progrs du dpistage ou encore que des traitement(s) associ(s)
celui que lon cherche valuer sont devenus plus efficaces.
Dans les comparaisons qui portent sur deux groupes de malades, vus
pendant la mme priode, le biais habituel est li au fait quil existe des
raisons qui ont gnralement motiv le fait que certains malades aient
reu un traitement et les autres un traitement diffrent.
Dans ces deux types de comparaisons, on peut donc tre quasi cer-
tain que la comparaison des traitements a port sur des groupes de
malades qui ntaient pas similaires.
Nous avons vu que seuls les essais randomiss, mens selon les bonnes
pratiques, garantissaient labsence de ces biais. De ce fait, ils apportent
le meilleur niveau de preuve dans la prise de dcision.
Nous ne reviendrons pas sur ce qui a t dit dans la deuxime par-
tie concernant les comparaisons et particulirement les essais rando-
miss. Ces essais sont encore appels essais contrls parce quil y a
un groupe contrle qui est compar au groupe recevant le nouveau
traitement que lon cherche valuer.
Rfrence
1. Venning GR (1982) Validity of anecdotal reports of suspected adverse drug
reactions: the problem of false alarm. Br Med J 284: 249-52
www.biblio-scientifique.net
Les comparaisons thrapeutiques
ne reposant pas sur des essais randomiss 1
www.biblio-scientifique.net
214 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les comparaisons thrapeutiques nereposantpas sur des essais randomiss 215
comparant ces deux techniques a t ralis [2]. Les mdecins qui pre-
naient la dcision de la sortie du malade de lhpital et de la reprise de
ses activits professionnelles ne savaient pas le type dintervention qui
avait t faite, clioscopie ou mini-laparotomie. Ltude na pas mon-
tr de diffrence entre les deux traitements. Il est donc probable que
la dure dhospitalisation plus brve et la reprise dactivit plus rapide
aprs chirurgie par clioscopie ntaient pas lies la technique, mais
la conviction des chirurgiens qua priori la clioscopie permettait
de faire sortir plus rapidement les oprs de lhpital et de leur faire
reprendre plus tt une activit normale. Cette tude montre, par ail-
leurs, la supriorit des tudes randomises en simple ou en double
insu sur les accords professionnels et les confrences de consensus,
mme si la contrainte exprimentale est parfois difficile respecter.
Un autre exemple concerne la duodno-pancratectomie cphalique
dont nous avons dj parl. Des donnes biologiques et exprimentales
avaient suggr quaprs exrse, lanastomose du pancras corporo-
caudal restant avec lestomac exposerait moins au risque de fistule que
lanastomose avec le jjunum. De fait, une comparaison historique sur
une soixantaine de malades na montr aucune fistule aprs anasto-
mose pancratico-gastrique alors quil en avait t observ 17 % aprs
anastomose pancratico-jjunale [3]. Un essai randomis a nanmoins
t ralis comparant ces deux techniques [4]. Il a montr que le taux
de fistules tait similaire dans les deux groupes infirmant les rsultats
de la comparaison rtrospective. En fait, en lisant les rsultats de la
premire tude portant sur une comparaison historique, on saperce-
vait que, dans les premires annes de cette tude, il avait t surtout
fait des anastomoses pancratico-jjunales alors que dans les dernires
annes, il avait t surtout fait des anastomoses pancratico-gastriques.
Les meilleurs rsultats obtenus avec cette dernire technique sexpli-
quaient donc probablement par une exprience plus importante des
chirurgiens et non pas par le type de drivation pancratique.
Dans les comparaisons historiques, mme si les auteurs cherchent
vrifier a posteriori que les deux groupes qui ont t compars sont
bien similaires, des diffrences peuvent toujours passer inaperues.
Il en est ainsi dvolutions thrapeutique marginales par rapport au
critre de jugement principal.
www.biblio-scientifique.net
216 Biostatistiques pour le clinicien
Leffet placebo
Dans les essais randomiss, si lon cherche apprcier lefficacit
dun traitement, il est souhaitable de constituer un groupe tmoin qui
reoit un placebo du traitement actif, le placebo dsignant une subs-
tance pharmacologiquement inerte. Ce placebo doit avoir le mme
aspect physique que le mdicament. La ncessit de comparer laction
du mdicament avec celle dun placebo, voque propos du traite-
ment de lulcre duodnal se justifie par lexistence, qui a t dmon-
tre, dun effet placebo. Par exemple, sur quinze tudes ayant concern
un peu plus de mille patients ayant des phnomnes douloureux, un
placebo dantalgique tait efficace en moyenne dans 35 % des cas [5].
titre anecdotique, cette tude a paradoxalement montr que les dou-
leurs organiques angoissantes taient celles qui rpondaient le mieux
au placebo.
Leffet placebo peut cependant avoir un substratum biologique comme
cela a t montr par des tudes exprimentales chez lanimal. Il en est
de mme chez lhomme. Par exemple, dans la maladie de Parkinson,
un essai randomis comparant la L-DOPA un placebo a montr au
Pet-Scan que leffet placebo observ correspondait une libration de
dopamine dans le striatum [6].
www.biblio-scientifique.net
Les comparaisons thrapeutiques nereposantpas sur des essais randomiss 217
www.biblio-scientifique.net
218 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Les comparaisons thrapeutiques nereposantpas sur des essais randomiss 219
Rfrences
1. Lowy AM, Lee JE, Pisters PW, et al. (1997) Prospective, randomized trial of
octeotride to prevent pancreatic fistula after pancreaticoduodenectomy for
malignant disease. Ann Surg 226: 632-41
2. Majeed AW, Troy G, Nicholl JP, et al. (1996) Randomized, prospective, single-
blind comparison of laparoscopic versus small-incision cholecystectomy. Lancet
347: 989-94
3. Mason GR, Freeark RJ (1995) Current experience with pancreatogastrostomy.
Am J Surg 169: 217-9
4. Yeo CJ, Cameron JL, Maher MM, et al.(1995) A prospective randomized
trial of pancreaticogastrostomy versus pancreaticojejunostomy after
pancreaticoduodenectomy. Ann Surg 222: 580-92
5. Beecher HK (1955) The powerful placebo. JAMA 1602-6
6. De La Fuente-Fernandez R, Ruth TJ, Sossi V, et al. (2001) Expectation and
dopamine release: mechanism of the placebo effect in Parkinsons disease.
Science 293: 1164-6
7. Von Elm E, Altman DG, Egger M, et al. (2007) The strengthening the reporting
of observational studies in epidemiology (STROBE) Statement. Guideliness for
reporting observational studes. PloS Med 4
www.biblio-scientifique.net
Lorsquun essai randomis nest pas possible
2
www.biblio-scientifique.net
222 Biostatistiques pour le clinicien
1 www.trend-statement.org:asp/trend/asp.
www.biblio-scientifique.net
Lorsquun essai randomis nest pas possible 223
www.biblio-scientifique.net
224 Biostatistiques pour le clinicien
tous les malades de ltude, alors que les scores de propension nin-
2 cluent quune partie du groupe tmoin, slectionne par des carac-
tristiques aussi proches que possible de celles du groupe trait. Les
tudes multifactorielles sont plus applicables quand il ny pas de diff-
rence quantitativement importante entre les deux groupes, et les scores
de propension quand le groupe tmoin est beaucoup plus important
que le groupe dintrt.
www.biblio-scientifique.net
Lorsquun essai randomis nest pas possible 225
Rfrences
1. Solomon MJ, McLeod RS (1995) Should we be performing more randomized
controlled trials evaluating surgical operations? Surgery 118: 459-67
2. Huguier M, Chastang C, Houry S, et al. (1997) Sphincter-saving resection or not
for cancer of the midrectum. Am J Surg 174: 11-5
3. Maciejewski ML, Livingston EH, Smith VA (2011) Survival among high-risk
patients after bariatric surgery. JAMA 305(23): 2419-26
4. Hejblum G, Loos V, Vibert JF, et al. (2008) A web-based Delphi study on the
indications of chest radiography for patients in ICUs. Chest 133: 1107-12
5. Hejblum G, Chalumeau-Lemoine L, Loos V, et al. (2009) Comparison of routine
and on-demand prescription of chest radiography in mechanically ventilated
adult: a multicentre, cluster-randomized, two-period cross-over study. Lancet
374: 1687-93
www.biblio-scientifique.net
Revue systmatique et mta-analyses
des essais randomiss 3
1 Des logiciels comme Revman ont pour but la recherche darticles en vue dune mta-analyse.
www.biblio-scientifique.net
228 Biostatistiques pour le clinicien
2. Les traitements qui ont t valus dans chaque essai doivent tre
3 les mmes ou peu diffrents les uns des autres afin que linterprta-
tion de leur efficacit ne soit pas entache dambigut. Dans notre
exemple de chimiothrapie adjuvante, le ou les produits utiliss, les
posologies, les modes dadministration doivent tre les mmes ou
trs peu diffrents et sil y a des diffrences dun essai lautre qui
paraissent acceptables pour que lessai soit quand mme inclus dans
la mta-analyse, bien entendu, ces diffrences doivent, tre signales.
3. Il faut enfin que les essais aient les mmes critres de jugement, du
moins le mme critre de jugement principal. Il faut encore quils
aient t estims de la mme faon ce qui est vident pour une
survie, mais ne lest pas toujours pour une rcidive ou un dosage
biologique.
Toutes ces conditions sont rarement runies. Nanmoins, il est alors
possible de faire des mta-analyses plus globales afin de dgager des
tendances gnrales, par exemple en incluant tous les essais randomiss
portant sur une mme classe thrapeutique et non pas sur un mme
traitement. Plus rarement, dfaut de comparaison directe entre deux
traitements A et B, il est possible de comparer les rsultats de deux
mta-analyses, lune comparant le traitement A un placebo, lautre le
traitement B un placebo. Lutilisation des odds ratio permet alors,
dfaut de comparaison directe entre le traitement A et le traitement B,
de se faire une opinion sur la supriorit ventuelle dun traitement
par rapport lautre.
www.biblio-scientifique.net
Revue systmatique et mta-analyses desessaisrandomiss 229
www.biblio-scientifique.net
230 Biostatistiques pour le clinicien
Lodds des dcs du groupe trait est gal 2/37 (pt) = 0,05.
Lodds des dcs du groupe contrle trait est gal 1/41 (pc) = 0,02.
2/37 2 u 41
Lodds ratio est gal : = = 2,2 .
1/41 37 u 1
www.biblio-scientifique.net
Revue systmatique et mta-analyses desessaisrandomiss 231
Fistules Intervalle de
Odds ratio
Groupe tmoin Groupe trait confiance 95 %
www.biblio-scientifique.net
232 Biostatistiques pour le clinicien
Rfrences
1. Pignon JP, Poynard T (1991) Mta-analyse des essais thrapeutiques. Gastro-
enterol Clin Biol 15: 229-238
2. Simes J (1986) Publication bias: the case of an international registry of clinical
trials. J Clin Oncol 4: 1429-1441
3. Tramr MR, Reynolds DJM, Moore RA, McQuay HJ (1997) Impact of covert
duplication on meta-analysis: a case study. Br Med J 315: 635-640
4. Urbach DR, Kennedy ED, Cohen HM (1999) Colon and rectum anastomosis do
not require routine drainage. A systematic review and meta-analysis. Ann Surg
229: 174-180
5. Moher D, Cook JD, Eastwood S, et al. (1999) Improving the quality of reports
of meta-analyses of randomised controlled trials : the QUORUM statement.
Lancet 354: 1896-900
www.biblio-scientifique.net
Choix dun traitement
4
1 http//askmedline.nlm.nith/ask/pico.php.
www.biblio-scientifique.net
234 Biostatistiques pour le clinicien
Dans ces valuations, il est souvent souhaitable dinclure, parmi les cri-
4 tres de jugement, la qualit de vie qui prend en compte la perception
par le patient de son propre tat de sant grce des instruments de
mesure qui ont t valids. Parmi ces instruments, on distingue des
instruments gnriques2 et des instruments spcifiques, adapts la
maladie et son traitement. Par exemple, dans les maladies chroniques
inflammatoires de lintestin, cest le cas de lInflammatory Bowel
Disease Questionnaire. Il en est dautres qui sont adapts un groupe
de pathologies comme le Gastrointestinal Quality of Life Index pour les
maladies digestives ou le Quality of Life Questionnaire Core 30 Items,
dclin par organe en cancrologie3.
www.biblio-scientifique.net
Choix dun traitement 235
partir de ces donnes, on peut calculer les cots et les bnfices des
deux stratgies de traitement par rapport labsence de traitement
(tableau III).
www.biblio-scientifique.net
236 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Choix dun traitement 237
www.biblio-scientifique.net
238 Biostatistiques pour le clinicien
Les tudes cot-utilit relient les cots dune action mdicale des
4 critres qui ne sont plus montaires, mais ses consquences expri-
mes en termes mdicaux, par exemple les quivalents dannes de
vie gagnes, pondres par la qualit. On peut ainsi comparer dans
les cancers pidermodes du canal anal, la chirurgie et la radiothra-
pie ou dans le reflux gastro-sophagien, le traitement mdical par les
inhibiteurs de la pompe proton et la chirurgie.
Rfrence
1. Rougier P, Laplanche A, Huguier M, et al. (1992) Hepatic arterial infusion of
floxuridine in patients with liver metastases from colorectal carcinoma: long-
term results of a prospective randomized trial. J Clin Oncol 10: 1112-8
www.biblio-scientifique.net
Partie
Les valuations pronostiques 6
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
242 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Introduction 243
www.biblio-scientifique.net
Exemple utilisant le modle de Cox
1
www.biblio-scientifique.net
246 Biostatistiques pour le clinicien
ASA 1 4
Infiltration paritale 1 3
Envahissement ganglionnaire 0 2
www.biblio-scientifique.net
Exemple utilisant le modle de Cox 247
www.biblio-scientifique.net
248 Biostatistiques pour le clinicien
1 Rfrences
1. Ptrequin P, Huguier M, Lacaine F, Houry S (1997) Cancers de lsophage
rsqus : modle prdictif de survie. Gastroenterol Clin Biol 21: 12-6
2. Chastang C, Csarini JP, Beltzer-Garelli H, et al. (1984) tablissement dune
classification pronostique en 2 stades du mlanome malin primitif partir
dune analyse multidimensionnelle et dune tude de concordance. Rev Epidem
et Sant Publ 32: 243-8
www.biblio-scientifique.net
Exemple utilisant lanalyse discriminante
2
Cet exemple concerne des patients qui ont une cirrhose hpatique
et qui ont fait une hmorragie digestive, le plus souvent due une
hypertension portale. La variable que lon a cherch expliquer est la
mortalit un mois [1].
Comme dans lexemple prcdent, il a dabord t fait une analyse uni-
factorielle de chaque covariable que lon pensait intressant dinclure
dans le modle. Le tableau I montre le coefficient de Mahalonobis et
sa signification statistique.
www.biblio-scientifique.net
250 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Exemple utilisant lanalyse discriminante 251
Rfrence
1. Poynard T, Chaput JC, Mary JY, et al. (1980) Analyse critique des facteurs lis
la mortalit au trentime jour dans les hmorragies digestives hautes du
cirrhotique. Gastroenterol Clin Biol 4: 655-65
www.biblio-scientifique.net
partie
pidmiologie 7
www.biblio-scientifique.net
Introduction
www.biblio-scientifique.net
256 Biostatistiques pour le clinicien
Rfrence
1. Flahault A, Spira A (2012) La situation de lpidmiologie en France en 2011.
Bull Acad Natle Med (sous presse)
www.biblio-scientifique.net
Lpidmiologie descriptive :
les enqutes transversales 1
www.biblio-scientifique.net
258 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Lpidmiologie descriptive: lesenqutestransversales 259
Rfrences
1. Launoy G, Grosclaude P, Pienkowski P et al. (1992) Cancers digestifs en France.
Comparaison de l'incidence dans 7 dpartements et estimation de l'incidence en
France. Gastroenterol Clin Biol 16 :633-8
2. Caisse nationale dassurance maladie (1992) Lactivit chirurgicale dans les
tablissements de sant. Rsultats mdicaux nationaux. Paris, Caisse nationale
dassurance, Tome 1 : 177-8
www.biblio-scientifique.net
Lpidmiologie analytique
2
www.biblio-scientifique.net
262 Biostatistiques pour le clinicien
M+ M
E+ a b
E c d
partir duquel, il est possible de calculer les odds et les odds ratio :
Odds chez les malades : a/b
Odds chez les non malades : c/d
ad
Odds ratio :
bc
Objectifs
Les enqutes cas-tmoins peuvent rpondre deux objectifs un peu
diffrents.
Ou bien elles sont destines tayer ce qui ntait quune hypothse
dune liaison entre, par exemple, une exposition certains anorexi-
gnes et la survenue dune hypertension artrielle pulmonaire et
quantifier la force dassociation. Pour ce faire, on observe un groupe
de sujets ayant une hypertension artrielle pulmonaire et un groupe de
sujets aussi similaires que possible nayant pas dhypertension artrielle
pulmonaire. On compare ensuite entre ces deux groupes, les niveaux
dexposition antrieure aux anorexignes5.
Ou bien ces enqutes sont exploratoires afin de tester un certain nombre
dhypothses. Cest ainsi quun grand nombre de facteurs de risques
potentiels du carcinome vaginal chez la jeune fille avaient t recher-
chs et ont permis de suspecter la prise de Distilbne par la mre.
Lutilit dcisionnelle de ces enqutes cas-tmoins peut tre illustre
5 Cet exemple avait t donn dans notre ouvrage Biostatistiques au quotidien publi par
Elsevier, Paris en 2000.
www.biblio-scientifique.net
Lpidmiologie analytique 263
par un autre exemple [1]. Des mdecins gnralistes ont interrog 500
de leurs malades ayant consult au lendemain des ftes de fin dan-
ne 1995 pour une gastro-entrite. Trente pour cent de ces malades
avaient consomm des hutres dans les dix jours qui avaient prcd
les symptmes. Il tait donc tentant de penser que les hutres taient
responsables dune grande partie de ces gastro-entrites. En ralit,
il tait ncessaire, avant de tirer une telle conclusion avec les cons-
quences que cela aurait pu avoir en matire conomique, notamment
pour les ostriculteurs, dobserver un groupe de sujets similaires, mais
qui navaient pas eu de gastro-entrite. Cette tude a t ralise par les
mdecins du rseau sentinelle . Il sest avr que la consommation
dhutres chez les sujets tmoins tait la mme que celle des malades
qui avaient eu une gastro-entrite. On ne pouvait donc probablement
pas incriminer de faon dterminante les hutres, dans cette pidmie
hivernale de gastro-entrite. Le fait que 30 % des malades atteints de
gastro-entrite avaient consomm des hutres sexpliquait par le fait,
qu cette priode de lanne, beaucoup de Franais mangent des
hutres. Les rsultats de cette enqute suggraient alors de chercher
dautres causes lorigine des gastro-entrites qui avaient t observes.
De fait, en 1999, ce mme rseau de mdecins a permis didentifier la
cause dau moins la moiti des cas de gastro-entrites survenant lors
de ces pidmies hivernales. Il sagissait de familles de virus entriques,
principalement de Calicivirus et de Rotavirus [2].
La mesure de la force dassociation dans une tude cas-tmoins est
lodd ratio dont le calcul est indpendant de la frquence de la maladie
(tableau I). En revanche, il nest pas possible de calculer directement le
risque relatif qui, lui, dpend de la frquence de la maladie.
www.biblio-scientifique.net
264 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Lpidmiologie analytique 265
Moyens destimation
Les enqutes de cohortes comparatives permettent destimer direc-
tement le risque relatif associ lexposition. Lorsque plusieurs fac-
teurs de risque potentiel sont tudis, il est possible et souhaitable de
faire des analyses multifactorielles.
Objectifs
Il existe deux types denqutes exposs-non exposs.
Certaines cohortes sont dites historiques ou rtrospectives .
Elles reposent sur le recueil rtrospectif des donnes en se basant sur
des fichiers dj constitus pour une autre raison. Par exemple, des
cohortes historiques ont t utilises pour tudier lassociation entre
lexposition professionnelle lamiante et la survenue dun msoth-
liome. Il a suffi de reprendre, en milieu professionnel, les comptes ren-
dus des visites en mdecine du travail et les radiographies thoraciques
dun groupe de travailleurs ayant eu une profession les exposant
lamiante et dun groupe de travailleurs de mme ge, de mme sexe et
ayant la mme consommation de tabac et dalcool, mais non exposs
lamiante. Cette comparaison a montr que lexposition profession-
nelle lamiante constituait bien un facteur de risque de msothliome.
Dans les pays o la rglementation lautorise, le croisement de fichiers
nominatifs permet de raliser des cohortes historiques virtuelles
ou lectroniques qui ouvrent de nombreuses et utiles possibilits.
Ainsi, au Canada, le croisement de fichiers de patients qui ont reu
une prescription de mdicaments et de fichiers de patients hospita-
liss pour des ractions indsirables suspectes dtre dues au mme
mdicament, a montr le rle des E2 mimtiques utiliss seuls, sans
corticodes, comme facteur de risque dtat de mal asthmatique [3].
Dautres tudes de cohortes comparatives reposent sur le recueil pros-
pectif de deux cohortes parallles, lune expose un facteur de risque
(par exemple le tabagisme), et lautre non expose. Les sujets sont
alors suivis plusieurs mois, voire plusieurs annes, pendant lesquelles
on collige la survenue dvnements prsums lis lexposition (par
exemple les broncho-pneumopathies et le cancer du poumon). Il
convient de remarquer que lessai randomis est une forme particu-
lire de cohorte comparative avec la particularit que les deux cohortes
sont dtermines par le tirage au sort. Les cohortes comparatives sont,
aprs les essais randomiss, les mthodes de comparaison les moins
sujettes des biais.
www.biblio-scientifique.net
266 Biostatistiques pour le clinicien
Les tudes avec recueil prospectif des donnes sont surtout intres-
2 santes et utiles lorsque le dlai pressenti entre lexposition aux facteurs
de risque et lapparition dune maladie est relativement bref et que
lincidence de la maladie est leve.
En revanche, les dlais dobservation peuvent tre trop longs. Par
exemple, pour lexposition lamiante, il aurait fallu attendre 30 ans
de recueil prospectif des donnes avant que les msothliomes appa-
raissent pour se rendre compte que lamiante augmentait leur risque
de survenue.
Au pire, lorsque lexposition est assez frquente et distribue de
manire htrogne dans la population et que les vnements (mala-
die, dcs) sont rares ou surviennent tardivement aprs lexposition
au facteur de risque potentiel, ltude de cohortes est pratiquement
impossible raliser. Par exemple, pour avoir 95 % de chances de
dtecter un cas dune maladie dont la frquence serait de 1/10 000, il
faudrait suivre 30 000 personnes. La constitution dune telle cohorte
prsenterait des difficults logistiques difficilement surmontables et un
cot considrable alors que quelques cas et leurs tmoins permettent
parfois de reconnatre dventuelles relations entre lexposition un
facteur de risque et lapparition dune maladie.
Le tableau II montre les donnes qui peuvent guider le choix dune
mthode pidmiologique.
www.biblio-scientifique.net
Lpidmiologie analytique 267
Les biais
Le groupe tmoin
Dans toutes les enqutes pidmiologiques, le choix pertinent du
groupe tmoin, cest--dire dans les enqutes cas-tmoins les non-
malades et dans les enqutes exposs-non exposs, les non-exposs,
est fondamental. En effet, lorsquun tirage au sort nest pas possible
comme dans un essai thrapeutique par exemple, il est indispensable
que les chantillons de groupes tmoins soient le plus reprsentatifs
possible de la population afin de limiter le risque de biais li une
slection des sujets au moment de leurs recrutements.
Dautres biais, lors de lanalyse des rsultats, sont le rejet des cas parce
que des donnes sont partiellement manquantes ou encore, dans le
suivi dune cohorte, le fait que des sujets ont t perdus de vue. Des
techniques permettent de limiter les consquences de ces biais comme
lanalyse actuarielle des rsultats (cf. les variables censures p. 37).
www.biblio-scientifique.net
268 Biostatistiques pour le clinicien
2 Remarques
Effectifs
Causalit
www.biblio-scientifique.net
Lpidmiologie analytique 269
www.biblio-scientifique.net
270 Biostatistiques pour le clinicien
Imputabilit
Certaines maladies sont facilement imputables une cause parce
quelles sont particulirement graves, voire mortelles et quelles suc-
cdent brve chance au risque : affection virale fulgurante, expo-
sition des polluants trs forte dose, etc. Mais la grande majorit
des maladies ont des causes multiples. Il devient alors trs difficile,
voire impossible, de montrer quune maladie est imputable un fac-
teur dtermin. Cette impossibilit pose des questions socitales,
notamment en matire dindemnisation des personnes atteintes par
une maladie susceptible dtre favorise par un facteur de risque
environnemental ou mdicamenteux par exemple.
Rfrences
1. Letrilliart L, Desenclos JC, Flahault A (1997) Risk factors for outbreak of acute
diarrhea in France: case-control study. Br Med J 315: 1645-9
2. Brachet R, Etienney I, Flahault A, et al. (1999) Gastro-entrites hivernales :
Calicivirus et Rotavirus ont t les deux familles de virus les plus frquemment
identifies. Le Quotidien du mdecin
3. Spitzer WO, Suisssa S, Ernst P, et al. (1992) The use of E-antagonist and the risk
of death and near death from asthma. New Engl J Med 326: 501-6
4. Herbst AL, Ulfelder H, Poskanzer DC (1971) Adenocarcinoma of the vagin.
Associaition of maternal stilbestrol therapy with tumor appearance in young
women. N Engl J Med 284: 878-81
5. Huguier M (1976) Le tabac : risques calculables. Le Concours Mdical 98:
7291-3
6. Hammond EL, Horn D (1958) Smoking and death rates. Report on forty-four
months of follow-up of 187 783 men. JAMA I. Total mortality 166: 1159-72
7. Flahault A, Spira A (2011) La situation de lpidmiologie en France. Bull Acad
Natle Med (sous presse)
www.biblio-scientifique.net
Prvention et dpistage
3
Prvention
Les enqutes pidmiologiques trouvent un maximum dintrt
lorsquelles ouvrent la possibilit de la mise en uvre de mesures
de prvention, de dpistage ou de matrise des risques. Encore faut-
il prouver quil y a non seulement une association statistique, mais
encore un lien de causalit entre un facteur de risque et une maladie.
Une fois un facteur de risque reconnu, toute politique de prvention
devrait tre assortie dindicateurs qui permettent dvaluer son effi-
cacit, par exemple, le suivi de mesures dimpact, comme la mesure
du risque attribuable avant et aprs lintervention vise prventive.
Ainsi, en France, les campagnes menes entre 1985 et 2003 pour dimi-
nuer le tabagisme ont t trs efficaces parmi les cadres chez lesquels
la proportion de ceux qui consommaient rgulirement des cigarettes
a diminu de 45 % 2 %, alors que chez les ouvriers, cette diminution
a t moindre, passant de 56 % 49 % chez les hommes et quelle
a mme augment dans cette catgorie socioprofessionnelle chez les
femmes de 19 % 31 %.
Dpistage
Le dpistage, au sens strict, est le diagnostic dune maladie avant
lapparition de symptmes ou de signes cliniques. Lhypothse qui
justifie le dpistage est que le traitement plus prcoce de la maladie
quil permet, amliore le pronostic ou rduit le risque que fait courir
la maladie.
Lvaluation des moyens de dpistage dont on dispose se fait, comme
pour le diagnostic en termes de sensibilit, de spcificit et de valeurs
prdictives. De faon gnrale, le dpistage de masse utilise de pre-
mire intention un examen sensible, sans contreparties mdicales, peu
www.biblio-scientifique.net
272 Biostatistiques pour le clinicien
Rfrence
1. Shoemaker D, Black R, Gilles L, Toouli J(1998) Yearly colonoscopy, liver CT and
chest radiography do not influence 5-year survival of colorectal cancer patients.
Gastroenterology 114: 7-14
www.biblio-scientifique.net
pidmiologie thorique
4
www.biblio-scientifique.net
274 Biostatistiques pour le clinicien
le dcompte fin 2010 a montr 312 dcs. Tous les autres organismes
4 de veille sanitaire dans les pays dvelopps ont galement surestim le
risque, en basant leurs projections notamment sur la plus svre des
pandmies passes (celle de 1918), alors que lon a maintenant observ
que sur les 5 dernires pandmies grippales, 4 avaient eu un impact
modr en nombre, quoiquimportant car touchant plutt des indivi-
dus jeunes. Bien entendu, les prvisions peuvent saffiner avec le temps
et se rapprocher alors de la ralit.
En conclusion, autant lestimation prcoce de limportance dune pi-
dmie est difficile, autant lapport de la modlisation mathmatique
comme aide la dcision dune politique de contrle et de prvention
est souvent prcieux.
Rfrence
1. Flahault A, Spira A (2011) La situation de lpidmiologie en France. Bull Acad
Natle Med (sous presse)
www.biblio-scientifique.net
Les logiciels de biostatistiques
Ci-aprs, une liste non exhaustive des logiciels utilisables est donne
par ordre alphabtique. noter que dautres logiciels, non spcifiques,
offrent des capacits statistiques : certains tableurs ainsi que certains
logiciels tourns vers la ralisation de graphiques. Pour des analyses
simples, le choix du logiciel nest pas essentiel, tous les logiciels propo-
sant au minimum les tests usuels. Le choix devra tre fait avant tout
en fonction des ressources disponibles, de lapptence envers lunivers
informatique, et des possibilits locales de soutien !
Biostatgv : Le site internet Biostatgv (http://www.u707.jussieu.fr/
biostatgv) permet de raliser la plupart des tests classiques. Les calculs
sont faits dans le logiciel R (voir ci-aprs). Il sagit donc dune solution
simple pour effectuer des analyses descriptives, ainsi que des tests de
diffrence, dassociation. Il est galement possible de calculer la taille
des essais ou nombre de sujets.
R : Le logiciel R est un logiciel libre, gratuit, disponible sur le site
CRAN (http://cran.r-project.org). Ce logiciel est trs utilis dans le
milieu acadmique. Il peut tre enrichi facilement par un systme de
www.biblio-scientifique.net
276 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Quelques notations en biostatistiques
Les grandes lois de probabilit se notent avec des lettres majuscules cur-
sives avec, entre parenthses, les paramtres de la loi correspondante :
loi normale N (, V) ;
www.biblio-scientifique.net
278 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Lexique
A
Actuarielle (mthode) [actuarial method]
Mthode destimation adapte aux variables censures* (survie, rci-
dive, etc.). Elle repose sur le principe des probabilits conditionnelles*.
Les taux de survie sont valus intervalles rguliers, par exemple tous
les 6 mois, tous les ans.
Ajustement [adjustment]
Ceci consiste prendre en compte linfluence dune tierce variable
dans la mesure de la corrlation entre deux variables dintrt. Le but
est de dterminer si la corrlation persiste lors de cet ajustement. Il est
la base des tudes multifactorielles*.
Alatoire (variable) [random]
Des variables sont dites alatoires lorsque leur valeur dpend de lin-
dividu sur lequel elles sont mesures. Elles se diffrencient ainsi des
constantes, plus souvent prsentes en physique ou en mathmatiques.
Alpha, (risque)
Dsigne le risque de premire espce*.
Ambivalence (clause d) [ambivalence clause]
Dans un essai randomis* les sujets inclus doivent pouvoir recevoir
lune ou lautre des interventions que lon cherche comparer.
Analyse
en composante principale [principal component analysis]
Mthode danalyse multifactorielle* descriptive qui permet de dter-
miner les variables qui contribuent le plus la variabilit observe,
ainsi que les groupes de variables corrles.
www.biblio-scientifique.net
280 Biostatistiques pour le clinicien
Appari (chantillons)
Qualifie deux chantillons dans lesquels chaque observation correspond
prfrentiellement une de lautre chantillon.
Par exemple pression artrielle diastolique et systolique ou encore
cholestrolmie avant et aprs traitement.
www.biblio-scientifique.net
Lexique 281
Association (force d)
Mesure lintensit des liens qui peuvent exister entre deux variables.
Voir : coefficient de corrlation*, risques relatif*, rapports de cote
[odds-ratio]*.
Bayes
Pasteur britannique (XVIIIe sicle), auteur dun thorme qui permet
dinverser le conditionnement dans une probabilit conditionnelle.
Il permet par exemple de relier les valeurs prdictives dun test la
sensibilit et spcificit de celui-ci. Voir : sensibilit, spcificit, valeurs
prdictives.
Causalit [causality]
Relation de cause effet entre un vnement et un autre. Une ques-
tion importante en pidmiologie est de dcider si une association
observe est causale.
www.biblio-scientifique.net
282 Biostatistiques pour le clinicien
Clause dignorance
Dsigne le secret dattribution dans un essai randomis*.
Combinaison [combination]
Nombre de faons de rpartir k succs parmi n tentatives.
www.biblio-scientifique.net
Lexique 283
Concordance [concordance]
Mthode dapprciation de laccord entre plusieurs observateurs
concernant un mme patient.
Courbes de rpartition
Pour variables quantitatives dont les valeurs sont portes en abscisse et
les frquences relatives cumules en ordonnes.
www.biblio-scientifique.net
284 Biostatistiques pour le clinicien
Covariable [covariable]
Dsigne habituellement des variables expliquantes dans une analyse
multifactorielle*.
Variable expliquante*.
Cox (modle de) [Cox model]
Mthode danalyse multifactorielle* pour des variables censures*.
Critre de jugement
Rsultat dun examen, dun traitement, dun pronostic ou la survenue
dune maladie sur lequel est base une comparaison entre chantillons.
On distingue critre principal et secondaire.
D
Date des dernires nouvelles [date of last news]
Dans ltude de la survie, date de lvnement (dcs, rcidive, etc.) ou
date laquelle le sujet a t revu pour la dernire fois.
Date de point [date of follow-up]
Dans ltude de la survie, date laquelle on cesse le suivi. Elle
correspond la date de censure pour tous les sujets nayant pas fait
lvnement dintrt.
Degr de libert [degree of freedom]
Paramtre associ certaines distributions, comme le chi-carr, le
Student. Le nombre de degr de libert permet de choisir le seuil de
rejet de lhypothse nulle dans les tests correspondants.
Delphi
La technique Delphi est une mthode de dtermination de consensus
partir de jugements rpts dun groupe dexperts.
Dpendante (variable) [dependent variable]
Variable dont la valeur se modifie avec les modifications dune ou
dautres variables considres dans ltude.
Descriptives (mthodes multifactorielles) [multivariate descriptive
methods]
Ces analyses, en composante principale, factorielle de correspondance
situent sur un plan les covariables standardises.
Deuxime espce (risque) [beta type of error]
Risque beta*.
Discontinue (variable) [discontinuous variable]
Se dit de variables quantitatives prenant des valeurs entires.
www.biblio-scientifique.net
Lexique 285
Discrte (variable)
Variable discontinue*.
Discrtisation [discretisation]
Transformation dune variable continue en une variable discrte par
arrondi.
Discriminante (analyse) [discriminant analysis]
Analyse discriminante*.
Double aveugle [double blind]
Voir Aveugle*.
E
cart-type [standard deviation]
Racine carre de la variance. Sil sagit de la valeur thorique (de la
population) on la note s, sil sagit dune valeur estime partir dun
chantillon, on note s.
chantillon appari
Voir Appari*.
chelle visuelle analogique [visual analogic scale]
Moyen de mesure de critres subjectifs de jugement.
Effectifs (dune tude) [number]
dans un essai randomis, la dtermination des effectifs est ncessaire
pour limiter le risque de deuxime espce.
pidmiologie [epidemiology]
tymologiquement, tude des pidmies des maladies transmissibles.
Aujourdhui, dsigne ltude des maladies, de leurs facteurs de risque,
et des interventions dun point de vue populationnel.
pidmiologie analytique
tudie les facteurs susceptibles de favoriser la survenue de maladies.
Synonymes : pidmiologie explicative et prdictive.
pidmiologie descriptive
Synonyme de connaissance des indicateurs de sant.
pidmiologie explicative et prdictive
Epidmiologie analytique*.
Enqute (ou tude) cas-tmoins [case control study]
Cas-tmoins (enqute)*.
www.biblio-scientifique.net
286 Biostatistiques pour le clinicien
quivalence
Lquivalence est obtenue lorsque la non-infriorit* est montre dans
les deux sens. Lquivalence nest pas synonyme de test non significatif.
tude
cot-bnfice
Relie les cots ses consquences exprimes en unit montaire.
cot-efficacit
Relie les cots dun traitement ses rsultats en termes de sant
exprims en units physiques.
www.biblio-scientifique.net
Lexique 287
cot-utilit
Relie les cots dune action mdicale ses consquences en termes
mdicaux.
multicentrique [multicentric study]
tude mene en commun par plusieurs centres ou plusieurs quipes.
multifactorielle [multivariate study]
Estime les liens entre des variables expliquantes et une variable que
lon cherche expliquer.
(ou enqute) transversale * [cross-sectional study]
multifactorielle [univariate study]
Estime les liens entre une variable expliquante et une variable que lon
cherche expliquer.
(ou enqute) longitudinale * [cohort study]
Exclus-vivants
Dans lestimation de la survie, les exclus-vivants sont les sujets qui ne
sont pas dcds au moment de la date de point de ltude, celle o
lon cesse de recueillir les nouvelles.
Explique (variable)
Variable que lon cherche expliquer, notamment dans une rgression.
Exposs
En pidmiologie dans une enqute prospective, sujets exposs un
facteur de risque prsum.
Facteurs de confusion
Facteur responsable de la liaison observe entre deux autres variables.
Un facteur de confusion peut mener une conclusion errone dans
une tude pidmiologique.
Factorielle
Rsultat de la multiplication de tous les nombres entiers infrieurs ou
gaux ce nombre (en excluant le zro). On utilise le symbole !
pour noter cette opration.
www.biblio-scientifique.net
288 Biostatistiques pour le clinicien
Fonction de rpartition
Synonyme : frquences relatives cumules.
Frquence cumule
Synonyme : fonction de rpartition.
www.biblio-scientifique.net
Lexique 289
Incidence [incidence]
En pidmiologie, nombre de nouveaux cas dune maladie, recenss
pendant une priode de temps donne (en gnral annuelle).
Insu [blind]
Aveugle*.
Interaction [interaction]
On dit quil y a interaction entre deux facteurs de risque lorsque le
risque relatif associ la prsence conjointe de ces deux facteurs diffre
de celui qui serait confr indpendamment par chacun des facteurs
de risque.
www.biblio-scientifique.net
290 Biostatistiques pour le clinicien
www.biblio-scientifique.net
Lexique 291
Mdiane [median]
Valeur qui partage lchantillon ordonn en deux parties deffectif
gales.
Mta-analyse [meta-analysis]
tude synthtisant toutes les donnes recueillies sur le sujet et se
diffrenciant dune simple synthse bibliographique.
Modle de Cox.
Cox*.
Nominale (variable)
Variable qualitative. Elle peut tre deux ou plusieurs classes et, dans
ce dernier cas tre ordonne ou non.
www.biblio-scientifique.net
292 Biostatistiques pour le clinicien
Non-inferiorit
La non-infriorit dun traitement est montre lorsque lefficacit nest
pas infrieure de plus dune marge, fixe a priori, de lefficacit du
traitement de rfrence.
Odd n.m.
Terme anglais signifiant cote .
Odds-ratio
Anglicisme signifiant rapports de cotes .
P (ou P value)
Probabilit quune diffrence gale la diffrence observe avait, dtre
obtenue sil ny avait pas de diffrence entre les interventions compa-
res. Egalement appel degr de signification.
www.biblio-scientifique.net
Lexique 293
Pondration [weighting]
Attribution chacun des lments servant laborer une moyenne ou
un indice ou un score, dun coefficient qui exprime son importance
relative.
Prcision
En statistique, valeur correspondant la demi-largeur de lintervalle
de confiance.
www.biblio-scientifique.net
294 Biostatistiques pour le clinicien
Prvalence [prevalence]
Dans une population, nombre de cas (anciens et nouveaux) observs
un instant donn.
Propension (score)
Score de propension*.
Randomisation [randomisation]
Essai randomis*.
Rangs [ranks]
Les tests non paramtriques reposent sur la notion de rangs et
saffranchissent ainsi de la contrainte de distribution normale qui est
exige pour utiliser des tests paramtriques.
www.biblio-scientifique.net
Lexique 295
Rgression [regression]
linaire [linear regression]
tudie et mesure la relation mathmatique qui peut exister entre
deux (rgression simple) ou plusieurs (rgression multiple) variables,
lorsque la variable dpendante est quantitative.
logistique [logistic regression]
Mthode danalyse multifactorielle utilisable lorsque la variable expli-
que est qualitative deux classes, les covariables tudies pouvant tre
quantitatives ou qualitatives.
multiple [multiple linear regression]
Rgression intgrant plusieurs variables explicatives.
partielle (coefficient de) [coefficient of partial regression]
Coefficient de rgression partielle*.
simple [single linear regression]
Rgression linaire*.
Risque [risk]
absolu [absolute risk]
Mesure de frquence du nombre de nouveaux cas sur leffectif de la
population tudie pendant une priode donne (incidence) ou de cas
existants un instant donn (prvalence).
attribuable [attributable risk]
Fraction tiologique dun risque pouvant tre soit celui chez les sujets
exposs au risque, soit et le risque attribuable en population.
de premire espce [alpha type of error]
Alpha*.
www.biblio-scientifique.net
296 Biostatistiques pour le clinicien
Sensibilit [sensitivity]
Probabilit quun signe diagnostique soit prsent chez un individu
atteint dune maladie.
www.biblio-scientifique.net
Lexique 297
www.biblio-scientifique.net
298 Biostatistiques pour le clinicien
t (test) [t test]
Test de Student*.
Taux dincidence.
Incidence*.
Transversale (tude)
Epidmiologie descriptive*.
Variable [variable]
alatoire [random variable]
Variable dont les mesures sont soumises des fluctuations dchan-
tillonnage.
www.biblio-scientifique.net
Lexique 299
W
Wilcoxon (test) [Wilcoxon rank sum test]
Test statistique non paramtrique pour comparer la distribution dune
variable quantitative entre deux chantillons. Mann-Whitney*.
www.biblio-scientifique.net
300 Biostatistiques pour le clinicien
X
X (ou plutt ) [Chi square]
Chi carr*.
Y
Yates (correction de) [Yates correction]
Correction parfois employe dans le test du chi-carr. On prfre
cependant utiliser le test exact de Fisher. Fisher*. Chi carr*.
10-31-1470 / Certifi PEFC / Ce produit est issu de forts gres durablement et de sources contrles. / pefc-france.org
www.biblio-scientifique.net