Inserm Psycho Part1

1
ANALYSE
Rflexion sur lvaluation
Ce document sintresse lvaluation scientifique de lefficacit des psycho-

thrapies, mais peut-on valuer scientifiquement lefficacit dune psychoth-
rapie ? En effet, la situation psychothrapeutique met en jeu des tres
humains dans leur singularit subjective. Comment envisager alors de rduire
scientifiquement un tel contexte sans en perdre lessence ? Ces questions ont
bien entendu t abordes au cours de cette expertise collective.
On peut considrer en premire approximation que la dmarche scientifique
consiste tester des hypothses rfutables au moyen dexpriences reproduc-
tibles. Nous trouvons ici trois concepts cls approfondir dans le cadre
particulier de lvaluation des psychothrapies : hypothse, exprience repro-
ductible, rfutabilit. Dans le cas prsent, la ou les hypothses tester sont
clairement identifies : telle modalit de psychothrapie est plus efficace que
telle autre modalit thrapeutique. La possibilit de mettre en uvre des
expriences reproductibles permettant de rfuter ces hypothses est moins
vidente. En effet, peut-on raliser des expriences dans un cadre psycho-
thrapeutique sans interfrer avec le processus de soin et donc sans biaiser les
rsultats ? De telles expriences devront le plus souvent valuer le sujet
dans sa subjectivit ; peut-on raliser des mesures subjectives de la mme
faon que lon ralise des mesures objectives, et ces mesures ont-elles la
mme valeur ? Ces expriences porteront sur des sujets singuliers dans
leur trajectoire de vie et dans leur fonctionnement mental ; comment envi-
sager alors des expriences reproductibles ? Enfin propos de la notion de
rfutabilit, elle fait cho, en recherche clinique, celle dinfrence statis-
tique au travers notamment des tests statistiques dhypothses. Mais peut-on
avoir recours la statistique dans le cadre de lvaluation de psychothrapies
comme on le fait dans le cadre de lvaluation des mdicaments ?
Expriences dans un cadre psychothrapeutique

Ce point concerne en fait la recherche thrapeutique en gnral et pas
seulement le domaine des psychothrapies. Ainsi, dans un essai thrapeu-
tique comparant lefficacit dun antiulcreux un placebo laide dune
mthodologie de double aveugle et dallocation alatoire du traitement, il 3
Psychothrapie Trois approches values
y a effectivement une modification du contexte de soin par rapport la

situation clinique habituelle : ni le mdecin ni le malade ne savent quel
traitement est administr. Rien ne dit alors que la diffrence defficacit
constate en situation exprimentale est vritablement superposable la
diffrence defficacit existant en pratique clinique quotidienne. Certains
champs de la clinique sont plus sensibles que dautres ce biais potentiel, la
psychiatrie en est srement un, mais elle nest pas la seule. Les autorits de
sant sont conscientes de ce problme et suggrent, pour apporter des
lments de rponse cette question, la ralisation dtudes observation-
nelles de terrain, il est vrai moins rigoureuses et plus difficilement interprta-
bles, mais dont les rsultats permettent de corroborer utilement les donnes
issues des essais thrapeutiques classiques.
Lvaluation des psychothrapies relve de la mme logique : lessai thrapeu-
tique comparatif apporte une information capitale du fait de la rigueur et de
la transparence de la mthodologie mise en jeu. Cette information ne se suffit
nanmoins pas elle-mme, elle doit toujours tre interprte la lumire
des spcificits de la pratique clinique relle et pourra ventuellement gagner
tre taye par des tudes complmentaires, qualitatives ou pidmiologi-
ques.
Mesures objectives, mesures subjectives

Pour valuer une psychothrapie, il faut le plus souvent valuer le sujet dans
sa subjectivit. Peut-on raliser des mesures subjectives (tristesse ou intensit
dun dlire par exemple) de la mme faon que lon ralise des mesures
objectives (tension artrielle ou cholestrolmie par exemple) et ces mesures
ont-elles la mme valeur ?
Cette question est essentielle. Lexprience montre en effet que, spontan-
ment, le plus grand nombre considre comme une vidence que la tristesse,
a ne se mesure pas{ , ou que vouloir mesurer la tristesse, cest perdre de
facto sa substance, sa complexit .
Il y a l en ralit un quiproquo concernant la dfinition du mot mesure. Ce
mot, dusage parfaitement courant, est pourtant trs difficile dfinir. Si les
physiciens utilisent implicitement une thorie oprationnelle de la mesure
(les rsultats des mesures peuvent tre manipuls laide de formules et de
lois dcrivant avec une grande prcision les relations unissant les corps physi-
ques), une telle approche est difficile envisager dans le domaine des mesures
subjectives comme la tristesse. En ralit, la mesure dans le domaine de la
subjectivit sentend comme la reprsentation numrique dune caractris-
tique . Le sens commun nous invite en effet constater que lon peut tre
plus ou moins triste. On peut alors envisager de recourir au systme
symbolique numrique pour reprsenter cette intuition que nous avons de
4 lintensit de la tristesse dun sujet. Le recours ce systme symbolique a ses
avantages et ses inconvnients : il permet dune part de bnficier des formi-
ANALYSE
dables outils que les mathmaticiens ont dvelopp au cours des temps pour
manipuler les nombres, il nous fait perdre dautre part un peu de cette
intimit que le langage naturel nous procure partir de lvocation du mot
tristesse .
Quand on considre donc que la tristesse, a ne se mesure pas{ , ce que
lon exprime simplement cest que le mode de reprsentation numrique de la
tristesse est un systme symbolique diffrent du langage naturel que nous
utilisons en permanence. Cette diffrence nimplique nullement que lun des
systmes de reprsentation soit plus ou moins performant que lautre. Ils ont
chacun leur particularit, celle du nombre tant de permettre le recours plus
immdiat une mthodologie dinvestigation de type scientifique. Cela ne
nous indique pas pour autant si la mesure dune caractristique subjective
peut tre compare la mesure dune caractristique objective. L aussi, alors
que spontanment il pourrait sembler vident quune mesure de tristesse est
de nature fondamentalement diffrente dune mesure de cholestrolmie,
lexamen un peu plus approfondi de cette question laisse en ralit perplexe.
Voyons cela partir de quelques exemples.
propos des diffrences entre mesures subjectives et mesures objectives,
certains pourraient remarquer quun attribut subjectif ne correspond rien de
concret, tout juste un mot, qui plus est au sens gnralement imprcis.
Prenons la tristesse. Il est vrai que, curieusement, il est difficile den obtenir
une dfinition1, mais est-ce pour cela que le sens de ce mot est imprcis ?
Bien au contraire. La tristesse est un sentiment lmentaire que tout tre
humain a dj prouv. Il suffit, en fait, que je dise : je suis triste{ pour
que nimporte quelle personne sache exactement ce que je ressens. Pour le
moins, on ne peut voir ici aucune imprcision. loppos, le temps est une
variable objective que chacun mesure quotidiennement. Mais comment
dfinir le temps ? Philosophes ou physiciens ont en pratique bien des diffi-
cults pour rpondre cette question.
propos des ressemblances entre mesures subjectives et mesures objectives,
on remarquera une volution parallle des paradigmes2 de mesure dans les
1. Bien souvent, des synonymes tels que chagrin ou mlancolie sont proposs, termes
eux-mmes dfinis partir des mots triste ou attrist . Le dictionnaire Le Robert vite
cet cueil en suggrant la dfinition : tat affectif pnible, calme et durable . On remarquera
cependant que le remords, par exemple, obit la mme dfinition, or remords et tristesse sont
des sentiments clairement distincts. Enfin, on propose parfois : tat affectif associ la perte
dobjet ; trs sduisante, cette approche a nanmoins le dsavantage de recourir implicite-
ment une thorie (psychanalytique), ce qui ne va pas sans poser problme pour une
dfinition.
2. Dans son sens courant, le terme paradigme dsigne un mot-type qui est donn comme
modle pour une dclinaison, une conjugaison (le paradigme de la conjugaison des verbes du
premier groupe est le verbe chanter ) ; il est, en ce sens, synonyme de modle ou
dexemple. En pistmologie, il a t utilis par Kuhn pour dsigner les accomplissements
passs pouvant servir dexemples et remplacer les rgles explicites, en tant que bases de 5
disciplines de la subjectivit et dans les sciences les plus objectives , la

physique notamment. En effet, si lon prend lexemple de la mesure dune
longueur, lapproche mtrologique la plus lmentaire consiste donner une
impression de la grandeur de lobjet mesurer : cest trs grand , assez
grand { Dans le domaine des mesures subjectives, on notera quil existe des
instruments relevant du mme paradigme ; on citera par exemple lchelle
dimpression clinique globale (CGI).
La mesure dune longueur ne se limite bien sr pas des impressions, il existe
un talon, le mtre. Dans le domaine de la psychopathologie, il existe aussi
des instruments que lon peut associer au paradigme de ltalonnage. Il en est
ainsi des items de lchelle de dpression de Hamilton. Chacun des items de
cette chelle est constitu dune succession de modalits de rfrences parmi
lesquelles il faut choisir celle qui semble tre la plus proche du patient
valuer. Par exemple, pour litem de culpabilit, nous avons : Sadresse des
reproches lui-mme, a limpression quil a caus des prjudices des gens ;
Ides de culpabilit ou ruminations sur des erreurs passes ou sur des actions
condamnables ; La maladie actuelle est une punition. Ides dlirantes de
culpabilit { Nous avons bien l une succession de jalons permettant
dtalonner la mesure, un peu la manire du mtre talon dfini la
Rvolution franaise.
Les physiciens ont cependant abandonn une dfinition du mtre fonde sur
un simple jalon de rfrence. Ainsi, depuis 1983, le mtre est dfini par la
longueur du trajet parcouru dans le vide par la lumire pendant une dure de
1/299 792 458 de seconde . Cette nouvelle dfinition marque une rupture
pistmologique majeure en mtrologie : le processus de mesure fait mainte-
nant partie intgrante dune thorie au sens fort du terme. En effet, cette
dfinition du mtre implique que la vitesse de la lumire dans le vide est une
constante, ce quil est indispensable de vrifier exprimentalement. Cette
vrification se fait en observant des interfrences de franges lumineuses, ce
qui fait appel la thorie ondulatoire de la lumire{
De nombreux instruments de mesure utiliss en psychopathologie relvent
dun tel paradigme, o linstrument est troitement li une thorie. Cest
notamment le cas des instruments plusieurs items, dpendant dune thorie
dfinitoire (celle qui a prsid au choix des items constituant linstrument).
Pour conclure sur ce point, si nous venons de voir que les diffrences entre les
mesures subjectives et les mesures objectives ne sont pas aussi videntes que
lon pouvait le penser a priori, nous avons aussi constat que les instruments
de mesure utiliss le plus frquemment en psychopathologie (les instruments
solution pour les nigmes qui subsistent dans la science normale ; par exemple, lexprience
dite du labyrinthe en T est un paradigme de la thorie du conditionnement oprant de
Skinner, lauscultation est le paradigme de lexamen clinique tel quon le pratique depuis
6 Laennec. Cest en ce sens que ce mot est utilis ici.
constitus dune liste ditems) dpendaient fortement dun systme tho-
ANALYSE
rique. Or dune part ces systmes thoriques ne sont pas toujours bien expli-
cits, mais dautre part ils peuvent ne pas tre congruents avec les thories
psychopathologiques sous-jacentes aux psychothrapies values. Ainsi, il
nest pas rare de voir des thrapies dinspiration psychanalytique values
laide dinstruments dvelopps dans un cadre purement symptomatique. Les
rsultats de telles tudes sont donc ncessairement interprter avec
prudence, mme si certains pourraient alors argumenter que lobjectif nest
pas tant dvaluer la psychothrapie en tant que telle, mais plutt ses effets
(son efficacit). Les instruments dvelopps pour tudier les changements
symptomatiques seraient alors adapts aux examens de toute forme de
psychothrapie, la condition que le contexte de cette comparaison soit bien
admis.
Reproductibilit statistique
Les tudes permettant dvaluer les psychothrapies porteront sur des sujets
singuliers dans leur trajectoire de vie et dans leur fonctionnement mental.
Comment envisager alors des expriences reproductibles ? Cette question se
pose, elle aussi, de la mme faon dans les autres domaines de la recherche
thrapeutique. En effet, si lon value lefficacit dune antibiothrapie dans
le traitement de la tuberculose pulmonaire, compte tenu du cycle du bacille
de Koch, lessai devra staler sur une ou plusieurs annes. Si un investigateur
souhaite reproduire lessai une fois les rsultats publis, il est possible que
lcologie du germe ait chang et que lexprience ne soit plus tout fait la
mme.
En recherche clinique, la notion de reproductibilit est donc affaiblie par
rapport aux sciences exprimentales classiques comme la physique, la chimie
ou la biologie.
Enfin, les rsultats des thrapeutiques ntant que rarement superposables
dun patient lautre, la reproductibilit des tudes cliniques ne peut tre que
statistique. Cela nous amne au dernier point.
Peut-on avoir recours la statistique de la mme faon dans le cadre de
lvaluation de thrapeutiques somatiques et dans le cadre de lvaluation de
psychothrapies ?
La rponse cette question est de nouveau affirmative. En effet, dans un essai
thrapeutique avec allocation alatoire des traitements, la statistique ne fait
que chiffrer la part possiblement attribuable au hasard dans la diffrence
defficacit observe entre les traitements compars. Plus prcisment,
chaque patient a, sans que lon puisse gnralement le savoir a priori, une
aptitude particulire rpondre un traitement donn. Il est possible que le
tirage au sort attribue, par le simple fait du hasard, un plus grand nombre de 7
fois un traitement particulier des patients au potentiel de gurison le plus

lev. Les tests statistiques valuent dans quelle mesure ce phnomne ala-
toire pourrait aboutir lui seul la diffrence defficacit observe entre les
traitements. Ce calcul se fait de la mme faon que le traitement soit mdi-
camenteux ou psychothrapeutique.
La reproductibilit statistique des rsultats issus des essais thrapeutiques en
psychiatrie repose en grande partie sur ladoption de critres diagnostiques
comme ceux du DSM ou CIM-10. Ces critres obeissent cependant une
logique interne qui nest pas sans consquences sur les interprtations que
lon peut raliser de ces rsultats.
En effet, la dmarche du DSM obit une recherche lgitime de consensus
syndromique en psychiatrie. Elle correspond une induction scientifique,
cest--dire au reprage statistique de rgularits doccurrences des signes
pathologiques, avec un degr de prcision aussi grand que possible quant aux
syndromes ainsi diffrencis. Dans lintroduction au DSM-IV, il est pourtant
mentionn que le systme de classification catgorielle a ses limites ,
quon ne postule pas que chaque trouble mental est une entit circonscrite,
aux limites absolues lisolant des autres troubles mentaux ou de labsence de
trouble mental. De plus, les individus qui partagent le mme diagnostic sont
susceptibles dtre htrognes, mme en ce qui concerne les critres de
dfinition du diagnostic. Enfin, les cas limites sont difficiles diagnostiquer
ou ne peuvent ltre que de manire probabiliste.
Mais il existe alors un problme mthodologique incontournable : si linduc-
tion est la mthode de vrification exprimentale par excellence, celle-ci ne
peut, elle seule, laborer les hypothses permettant de confronter dven-
tuelles thories concurrentes pour rendre compte des faits observs. De fait,
mme aux tats-Unis, le DSM-IV na pas fait disparatre les traits de
psychiatrie, qui reposent sur un point de vue nosologique (ltude des mala-
dies) et non plus seulement syndromique (ltude des troubles). Le passage de
la constatation dun syndrome ltablissement dun diagnostic ne peut
relever dune catgorisation inductive (inclusion du cas observ dans la classe
de tous les cas prsentant les mmes caractres), mais dune hypothse abduc-
tive (recherche risque de la classe nosologique non connue a priori qui
rendra le mieux compte du cas singulier observ). Par exemple, un syndrome
de discordance ou dinfluence ne signifie pas automatiquement quil sagit
dune maladie schizophrnique (et inversement, une personne souffrant
dune maladie schizophrnique peut ne pas prsenter lun ou lautre de ces
syndromes). Par ailleurs, il se peut que la classe nosologique ne soit pas la
plus approprie linterprtation des troubles comportementaux et mentaux
regroups en syndromes, do les hypothses (abductives) psychodynamiques,
co-systmiques, humanistes et comportementales-cognitives.
En conclusion, nous venons de voir quil nexiste pas de frein conceptuel

8 vident lvaluation scientifique de lefficacit dune psychothrapie. Il est
en effet possible denvisager de tester lhypothse defficacit de ces traite-
ANALYSE
ments dans le cadre dexpriences reproductibles rfutables. Des nuances
doivent cependant tre apportes cette affirmation : tout dabord la repro-
ductibilit de ces tudes nest pas totale, mais ce problme nest pas propre au
domaine des psychothrapies. Ensuite, ces tudes ne sont interprtables que
si les mesures ralises sont valides. Or, dans le cadre des psychothrapies ces
mesures portent souvent sur un phnotype subjectif. Si nous avons vu que de
telles mesures ne sont pas conceptuellement trs diffrentes des mesures
habituelles, plus objectives, la question de la validit des instruments utiliss
se pose, elle, de faon plus aigu. En effet, les instruments de mesure les plus
sophistiqus ne trouvent de sens vritable que quand ils sont insrs dans un
champ thorique. Une situation idale serait que linstrument retenu dans
ltude soit compatible avec le support thorique utilis par la ou les psycho-
thrapie(s) value(s). Il faudrait alors disposer dune thorie du fonctionne-
ment mental permettant de situer les diffrentes stratgies
psychothrapeutiques les unes par rapport aux autres mais, malheureusement,
sil existe un grand nombre de thories parcellaires du fonctionnement
mental, une thorie globale est bien loin dexister aujourdhui. Une alterna-
tive plus modeste (et limite) est alors de recourir un critre clinique.
9
2
ANALYSE
Aspects mthodologiques
de lvaluation
Paul (1969) a prsent dune faon lapidaire lensemble des questions que
soulve lvaluation des effets thrapeutiques et des processus en jeu dans les
psychothrapies : Quel traitement, par quel thrapeute, est le plus efficace,
pour quel sujet, propos de quel problme, dans quelles circonstances, et
comment ? Ce qui peut donner lieu sept grandes directions de recherche :
dfinir avec prcision les traitements ;
dfinir lefficacit thrapeutique ;
dfinir en termes oprationnels les problmes psychologiques ;
dfinir les sujets en termes oprationnels ;
dfinir les comportements et les attitudes psychologiques qui sont psycho-
thrapiques ;
dfinir comment agissent les traitements : quels sont le ou les processus
thrapeutiques ?
dfinir dans quelles conditions de milieu agissent les traitements.
Cet abord pragmatique de la question pose des problmes gnraux dordre
pistmologique et mthodologique.
Problmes pistmologiques
Il sagit dexaminer tout dabord le problme de la pertinence dune valua-
tion des phnomnes psychothrapiques, qui par nature sont subtils, indivi-
duels, souvent intersubjectifs et de ce fait se prtent peu une quantification
sur le modle des sciences exprimentales, quelles soient dobdience mdi-
cale ou psychologique.
On peut se demander, en effet, si la psychothrapie et ses diffrents modles
ne relvent pas des sciences idiographiques : autrement dit les sciences qui
soccupent de phnomnes uniques, non rptables et dont on ne peut
donner quune description individualise. Les sciences idiographiques sont,
par exemple, lhistoire, la gographie et larchologie. Et lon sait limpor-
tance de la mtaphore archologique dans la description par Freud du 11
processus psychanalytique. En revanche, les sciences nomothtiques seffor-

cent de dfinir des lois, dtablir des relations rptables, de tester des hypo-
thses de plus en plus gnrales et de proposer des modles du
fonctionnement psychologique et des modles dintervention. Le cas indivi-
duel est suppos porter en lui-mme la forme entire de lhumaine condi-
tion que lon peut dgager par induction et reprer dans dautres individus,
au cours dtudes statistiques (Cottraux, 1988).
La recherche en psychothrapie oscille en fait entre les ples nomothtique
et idiographique. Freud (1917) a pass une grande partie de sa vie essayer
dtablir des lois gnrales issues de lexprience analytique, alors quil
pensait pourtant que le travail analytique individuel ne pouvait tre soumis
lenqute statistique.
Protocoles de recherche
la suite de Claude Bernard (1865), les psychologues amricains ont dve-
lopp des protocoles exprimentaux de cas individuels pour valuer les effets
et les processus des psychothrapies, en disant que ces protocoles taient la
pierre de touche de lvaluation, pour ensuite dvelopper des tudes contr-
les sur un nombre lev de cas, afin de valider leur approche en fonction de
critres mthodologiques universels.
La croyance de chaque psychothrapeute en la valeur du systme auquel il
adhre, croyance dont le fondement est rarement rationnel, reprsente un
autre problme. Dvelopper un programme de recherche, autrement dit
formuler un systme psychothrapique sous la forme dun ensemble dhypo-
thses testables, consiste prendre le risque de voir ses croyances seffondrer,
et dtre oblig de modifier sa pratique.
Comme la montr Karl Popper (1963), la recherche scientifique est beau-
coup moins la qute de la Vrit que la mise en place de dispositifs de
contrles susceptibles dliminer progressivement les erreurs. Cest la falsi-
fiabilit (au sens anglais), autrement dit la testabilit , qui implique une
mthodologie susceptible de dmontrer quune hypothse ou une thorie est
vraie ou fausse. Cette oscillation de lindividuel au gnral, et de la
croyance la falsifiabilit , va se retrouver constamment dans les
problmes mthodologiques soulevs par lvaluation des psychothrapies.
Un protocole a pour but dtablir les rgles logiques qui sont ncessaires la
slection et linterprtation objective des donnes recueillies dans le
dessein de rpondre aux questions poses. La mthodologie consiste, de la
manire la plus objective possible, poser les questions, laborer un proto-
cole qui permette de rpondre celles-ci, tout en slectionnant des mesures
fiables et adaptes la question.
La formulation dhypothses de recherche consiste se poser des questions et
12 se donner les moyens dy rpondre. Nombre de facteurs peuvent influencer
Aspects mthodologiques de lvaluation
le cours dune psychothrapie : la nature et le degr du trouble, des vne-
ANALYSE
ments de vie, leffet placebo, la mthode thrapeutique utilise, la relation
thrapeutique, une bonne ou mauvaise alliance thrapeutique ou des change-
ments biologiques. Dans les travaux les plus exprimentaux effectus chez
lanimal, il existe un effet exprimentateur : leffet Rosenthal (Rosenthal,
1966 ; Rosenthal et Rosnow, 1975). De plus, le choix des variables tudies
est intrinsquement li aux hypothses et aux rsultats obtenus.
Notions defficacit et dutilit clinique

Tout projet de recherche est donc li une procdure impliquant la fois un
groupe contrle et des mesures ce qui le rend rducteur, par ncessit. De
nombreuses variables sont prises en compte dans les projets : en particulier
les mesures des symptmes et syndromes, de la personnalit, de lajustement,
du handicap, de la qualit de vie, des processus thrapeutiques, ou de varia-
bles indpendantes ayant valeur de prdiction. Les mta-analyses des essais
contrls se centrent souvent sur la rduction des syndromes et des symp-
tmes les plus reprsentatifs des troubles tudis. Les mta-analyses les plus
rcentes et les mieux faites valuent les diffrents aspects du changement et
certaines se penchent sur les processus. Cette manire multimodale de consi-
drer le problme du changement est rarement prise en compte. Beaucoup de
revues institutionnelles rcentes envisagent seulement le problme de leffi-
cacit, dans la mesure o la dfinition dun rapport cot/efficacit favorable
est devenue le point nodal dans les politiques de sant. Pourtant, la notion
mme defficacit doit tre nuance.
De nombreux auteurs ont insist sur le fait quil ne suffit pas de modifier les
symptmes et les syndromes pour obtenir un rsultat satisfaisant pour le
patient. Dj, dans un rapport de lOMS (Sartorius et coll., 1993), un certain
nombre de critres ont t proposs pour valuer les rsultats des traitements
psychiatriques :
utilit pratique (effectiveness) : rduction des symptmes ; amlioration de
la capacit tenir des rles sociaux et professionnels ; qualit de vie des
patients et de leur famille ;
scurit ;
effets secondaires ;
problmes thiques ;
rapport cot/efficacit compar dautres traitements ;
possibilit dtre appliqu dans des situations sociales varies et par diff-
rentes catgories de professionnels de sant mentale ;
risque de msusage (par exemple dpendance un mdicament).
Aujourdhui, il apparat de plus en plus qu la notion defficacit (efficacy),
qui peut tre mise en vidence par les tudes contrles randomises sur des
populations souvent trs svrement slectionnes et peu reprsentatives de
la pratique, doit se substituer celle dutilit clinique (effectiveness), cest--dire
de lapplication pratique du savoir-faire psychothrapique (Clarkin et coll., 13
1996 ; Gabbard, 1997). Des mta-analyses rcentes ont essay de rpondre

cette question.
Shadish et coll. (1997) ont reclass des tudes incluses dans 15 mta-analyses
des psychothrapies en fonction de leur reprsentativit des conditions clini-
ques habituelles et abouti la conclusion que les rsultats sont les mmes sur
un terrain clinique proche des conditions habituelles que dans des projets de
recherche portant sur des populations de sujets trs slectionns.
Mthodes dvaluation
Lvaluation des psychothrapies a suivi lvolution de la recherche clinique
qui est passe progressivement des tudes de cas individuels aux protocoles
randomiss.
tudes de cas individuels

Lhistoire de la psychothrapie a dbut par des tudes de cas individuels
rapportes par Charcot, Janet, Freud et leurs successeurs immdiats. Les
tudes de cas ont une valeur heuristique irremplaable. Les psychothrapies
modernes doivent toutes quelque chose Lautomatisme psychologique
de Pierre Janet (1889) et aux tudes sur lhystrie de Freud et Breuer
(1895). Tous les travaux en psychothrapie, quel quen soit le type, commen-
cent par des tudes de cas individuels, puis des sries, pour se poursuivre par
des tudes contrles. Les statistiques sur des sries de cas peuvent valuer les
rsultats dun thrapeute ou dune institution. Mais ces statistiques globales,
si elles tudient certains aspects du processus thrapeutique au cours de
recherches corrlationnelles, ne permettent pas de conclure lefficacit dun
traitement par rapport lvolution spontane ou par rapport un autre
traitement. Les protocoles de cas individuels cherchent quantifier une
dmarche fonde sur des cas uniques.
Protocoles de cas individuels dans la recherche en psychothrapie

Ces protocoles, qui allient dmarche quantitative et dmarche qualitative,
sont issus dun modle physiologique destin tudier le fonctionnement
dun organisme mis dans diffrents environnements ou soumis diffrent(e)s
interventions ou traitements. La dmarche quantitative est assure par des
mesures rptes, la dmarche qualitative par le fait que le sujet est son
propre tmoin. Claude Bernard (1865) est le premier auteur avoir mis
laccent sur cette mthode.
Les protocoles de cas individuels ont t initis par Shapiro en Angleterre
dans les annes 1960, puis dcrits dans un ouvrage fondamental par Hersen et
14 Barlow (1976) aux tats-Unis. Les travaux de Kazdin (1982), Barlow et coll.
(1984) et Bellack et Hersen (1984) ont suivi. En langue franaise, on peut
ANALYSE
citer louvrage de Ladouceur et Bgin (1980), et des chapitres dans les
ouvrages de Cottraux et coll. (1985), et Bouvard et Cottraux (1996).
Les protocoles de cas individuels reprsentent une manire simple de
promouvoir la recherche clinique. Ils consistent prendre le sujet comme son
propre tmoin et lvaluer au cours de phases tantt dintervention tantt
de non-intervention. Ils reprsentent un moyen rapide de tester une hypo-
thse sans engager les frais dune tude contrle. Ils ont aussi t utiliss
dans la recherche animale sur le conditionnement oprant. condition
davoir un grand nombre de points de mesure, une analyse statistique compa-
rative des diffrentes phases est possible (Hersen et Barlow, 1976).
Protocole A-B quasi exprimental

Il comporte au moins trois phases :
une ligne de base (ou de rfrence) qui apprcie le comportement avant
tout traitement (phase A). Sa dure varie suivant la nature du problme
tudi, ou le caractre thique de la non-intervention. Une phase de liste
dattente peut tre mise en place pour demander au patient de faire des
mesures rptes dun comportement cible ;
une phase de traitement o est mise en place la procdure thrapeutique
(phase B) ;
une phase de suivi o est valu le maintien des changements comporte-
mentaux obtenus.
La comparaison par inspection des courbes reprsentant la variable choisie
permet dmettre lhypothse que cest lintervention thrapeutique qui a t
responsable des rsultats obtenus.
Pour cette analyse de tendance, il faut au moins trois points par phase pour
analyser le protocole (car par trois points passe une courbe et par deux points
seulement, une droite).
Protocole exprimental A-B-A-B

Le protocole A-B a t critiqu, il est simplement quasi-exprimental et ne
permet pas dtablir un lien causal entre le changement et lintervention.
Le protocole de retrait A-B-A-B est lun des protocoles les plus utiliss ; il est
considr comme un vritable protocole exprimental. Il fait succder par
exemple une phase de liste dattente, une phase dintervention, suivie dune
phase de non-intervention, puis dune nouvelle phase dintervention (proto-
cole A-B-A-B dans lequel A = intervention, B = non-intervention). Des
mesures rptes des variables ltude permettent de voir sil y a chez le
sujet des changements importants durant les phases dintervention, ou sil
samliore spontanment durant les phases sans intervention. Lhypothse
qui sous-tend ce protocole est que si lamlioration observe est lie au
traitement, le retrait plus ou moins prolong de celui-ci saccompagnera dun 15
arrt des progrs en cours, ou mme dun retour ltat initial, ou encore
dune aggravation. Inversement, les progrs reprendront la rintroduction
du traitement. Lorsquun traitement (B) mis en place ne donne pas les
rsultats escompts, il est possible dadjoindre un autre traitement (C) et
dvaluer ainsi laction combine des deux traitements (BC) en ralisant un
protocole A-B-BC-B ou, au contraire, de supprimer lun des deux ingrdients
dun package thrapeutique pour voir sil participe effectivement aux
bons rsultats (protocole AB-C-A-B-C par exemple).
Protocole B-A-B
Dans ce protocole qui est utile lorsquil est ncessaire deffectuer une inter-
vention, pour des raisons pratiques et thiques, on intervient, puis on retire
lintervention, pour la rinstaurer ensuite, si le comportement ou problme
rapparat de manire intense.
Protocole de lignes de base multiples travers les comportements

La mthode utilise ne fait pas appel la prsentation suivie du retrait du
traitement. Elle consiste, aprs avoir effectu la mesure simultane de
plusieurs comportements lors de lignes de base (A), introduire, pour chacun
des comportements problmes que lon mesure, lintervention thrapeutique
(B) des moments diffrents. Les changements comportementaux devront
apparatre aprs lintervention, pour que lon puisse affirmer quil y a eu un
effet spcifique du traitement sur chacun des comportements.
Protocole de lignes de base multiples travers les sujets

Il consiste effectuer le relev dun comportement donn chez plusieurs
sujets et introduire pour chacun deux le traitement des temps diffrents.
Statistiques des cas n = 1

Au-del de la simple analyse de tendance par inspection, trois types de
statistiques ont t proposs :
Comparaison des phases de ligne de base et dintervention. Tous les logi-
ciels de statistiques actuels peuvent effectuer ces calculs simples. Par exemple
A1 + A2 sont compares B1 + B2 avec un test t appari. Il faut au moins
dix points de mesure par phase. Quand il sagit dun protocole A-B-C, il est
ncessaire dutiliser une ANOVA. En cas de protocole plusieurs sujets, on
peut faire une ANOVA valuant leffet sujet et leffet phase et leurs interac-
tions. Ces statistiques sont discutes car elles ne tiennent pas compte de la
corrlation des mesures intra-sujet et elles ne refltent quun effet moyen et
ne prennent pas en compte les tendances (la pente).
Analyses de sries temporelles (time series analysis). Elles permettent de
comparer les moyennes et les pentes de chaque phase en tenant compte des
corrlations. Elles ncessitent un logiciel spcialis. Il faut au moins dix
16 points de mesure par phase.
Rn de Revusky : protocoles lignes de base multiples travers les sujets.
ANALYSE
Cest une forme de statistique non paramtrique qui est surtout utile dans les
protocoles travers les sujets (un effectif dau moins quatre est requis) avec
introduction de la phase B de manire alatoire pour chaque sujet. On value
les changements de rang des sujets lintroduction de B. Une somme des
rangs est calcule et rapporte une table de probabilit (Hersen et Barlow,
1976). Le Rn peut tre fait la main .
Passage du cas individuel au groupe
Ces protocoles peuvent tre pratiqus sur des groupes de sujets en prenant
chaque sujet comme son propre tmoin et en additionnant les rsultats. Il
suffit par exemple de mesurer une ligne de base de non-intervention (A) chez
tous les sujets et deffectuer le traitement de manire identique (B). On se
trouve alors devant un protocole mesures rptes A-B. Une ANOVA
mesures rptes permettra dvaluer lvolution du groupe travers les
phases. Un tel protocole a t utilis de cette faon par Clark et coll. (1985)
pour montrer lefficacit de la thrapie cognitive dans un groupe de
18 patients avec un trouble panique. Ce type dtude permet en partie de
concilier les exigences du cas individuel et de ltude contrle et galement
de rsoudre le problme de la comparabilit des sujets, souvent difficile
tablir.
Limites des protocoles de cas individuels
La limite des protocoles de cas individuels reste la gnralisation de leurs
conclusions lensemble dune population pathologique. Ils reprsentent
avant tout un moyen simple et peu coteux pour tester des hypothses
thrapeutiques et sinitier la recherche clinique en apprenant slectionner
des mesures, observer et enregistrer sur des courbes des vnements
cliniques valus jusque-l de faon intuitive. Pour le chercheur confirm
cest un prlude ncessaire aux tudes contrles, qui permet de rester au
niveau de lindividu et de gnrer des hypothses qui pourraient ne pas
apparatre dans les tudes de groupes parallles, en double aveugle et rando-
mises, effectues trop rapidement.
Protocoles randomiss dans la recherche en psychothrapie

Le noyau dur de la recherche sur le comportement humain est reprsent par
les tudes comparatives, contrles (Meyers et Grossen, 1974). Cependant,
constituer un groupe contrle pour valuer une mthode de psychothrapie
ne va pas sans problmes. Il est pratiquement impossible de comparer aprs
randomisation et en double aveugle une psychothrapie active un
placebo inerte de psychothrapie sur le modle des tudes pharmacologi-
ques. En effet, les phnomnes relationnels et situationnels ainsi que les
attentes des thrapeutes et des patients sont des ingrdients actifs de tout
systme psychothrapique. 17
Placebo en psychothrapie
Plusieurs solutions ont t proposes pour rsoudre le problme du placebo en
psychothrapie. Le groupe attention placebo avec un contact minimum
avec un thrapeute qui nutilise pas les lments supposs actifs de la thrapie
que lon veut tester permet dliminer les effets simples de prise en charge. La
liste dattente durant plusieurs mois avec simple contact tlphonique pose
des problmes thiques et risque daboutir des sorties dessai vers une autre
thrapie. Le contrle par une pseudo-thrapie ou une anti-thrapie gnre
aussi des problmes thiques et pratiques. La comparaison dune thrapie de
rfrence la thrapie teste entrane des problmes dinterprtation, dans la
mesure o la nouvelle thrapie risque davoir les bnfices de la nouveaut et
une prime au changement ( band-wagon effect des auteurs amricains). De
mme, la comparaison dune chimiothrapie une psychothrapie risque
dtre biaise en faveur de la psychothrapie si les patients ont presque tous
eu des chimiothrapies inefficaces, et peuvent venir pour cette raison cher-
cher un autre traitement.
Le double aveugle est impossible, sauf en cas de comparaison dune thrapie
elle-mme, associe un mdicament actif ou un placebo. Cest dire
limportance dune valuation indpendante et aveugle aux hypothses
testes. Il ny a pas de solution idale, sinon dvaluer en dbut de traitement
la croyance des patients et des thrapeutes dans le traitement qui a t tir au
sort et dtudier la corrlation de ces mesures avec les rsultats. Le placebo de
psychothrapie doit avoir des caractristiques qui le rendent aussi vraisem-
blable quune thrapie vritable : le placebo doit tre crdible.
Variables du thrapeute
Un certain nombre de facteurs lis lattitude et au comportement du thra-
peute vis--vis du patient ont t longtemps considrs comme thrapeuti-
ques. Ainsi, la force de persuasion, la possibilit de crer une atmosphre
amicale, laction anti-dmoralisatrice, la chaleur, lempathie, lauthenticit
des sentiments et la considration positive inconditionnelle du patient ont
t invoques. Il faut leur ajouter la comptence, le statut socioprofessionnel,
la crdibilit, le dcor et la clbrit (Parloff et coll., in Garfield et Bergin,
1978). Ces facteurs, souvent invoqus, ont t peu tudis de manire empi-
rique. On tend leur prfrer, actuellement, ltude de lalliance thrapeu-
tique qui renvoie linteraction de deux personnes et non des qualits
personnelles.
Alliance thrapeutique
Le concept dalliance thrapeutique est d Freud (1913) : comprhension
sympathique, affection et amiti sont les vhicules de la psychanalyse . En
thrapie analytique, lalliance thrapeutique rfre aux aspects les plus
rationnels de la relation thrapeutique. Elle est en contraste avec les
18 lments plus transfrentiels et donc irrationnels. Laccent a t mis sur ce
processus particulier par Luborsky et coll. (1985) qui ont ralis une tude
ANALYSE
comparant la thrapie cognitive associe au conseil, la thrapie analytique
associe au conseil et le conseil seul chez des toxicomanes sevrs. La thrapie
cognitive et la thrapie analytique taient gales entre elles et suprieures au
conseil seul. Les qualits du thrapeute ntaient pas corrles aux rsultats.
Les prdicteurs de russite en thrapie cognitive ou en thrapie analytique
taient lalliance thrapeutique et la puret technique : cest--dire suivre
consciencieusement le manuel.
Relation de collaboration empirique
Alford et Beck (1997) ont dfini la relation thrapeutique en thrapie cogni-
tive comme une relation de collaboration empirique qui serait comparable
celle de deux savants travaillant ensemble sur un problme. Elle sert de
fondement lapprentissage qui est li aussi la relation thrapeutique et aux
changements cognitifs du sujet. Cependant, le changement en thrapie est
d aux capacits du sujet et non uniquement la relation et doit se gnra-
liser dans dautres contextes que la thrapie. Les auteurs conseillent donc de
laisser la responsabilit du changement au sujet sans exagrer limportance du
rle du thrapeute. La relation thrapeutique ainsi dfinie est une condition
ncessaire mais non suffisante.
Dans une perspective voisine, Cottraux et coll. (1995) ont essay dvaluer la
relation thrapeutique avec une chelle faite de douze paires dadjectifs bipo-
laires qui permettaient dvaluer sur six points : le thrapeute vu par le
patient et le patient vu par le thrapeute. Cette chelle a t utilise dans un
essai randomis comparant la thrapie cognitivo-comportementale soit avec
buspirone, soit avec placebo, en double aveugle dans le trouble panique avec
agoraphobie. Les rsultats ont montr un effet suprieur de la buspirone sur
lanxit gnralise mais non sur le trouble panique et lagoraphobie. Les
thrapeutes ont t valus plus positivement par les patients que les patients
par les thrapeutes. Les prescripteurs ont t moins bien valus que les
thrapeutes par les patients. Mais il ny a pas eu deffet de la relation thra-
peutique, ainsi mesure, sur la rponse thrapeutique lorsque lon comparait
les rpondeurs aux non-rpondeurs dans les deux groupes.
Mthodes de mesure
Il existe de nombreuses chelles dvaluation des symptmes, des comporte-
ments et des processus psychothrapiques qui actuellement ont reu une
validation et rendent possible ltude de problmes psychopathologiques
varis (Guy, 1976 ; Cottraux et coll., 1985 ; Guelfi, 1993 ; Cottraux et
Blackburn, 1995 ; Cottraux et coll., 1995 ; Bouvard et Cottraux, 1996 ; Yao
et coll., 1996 et 1998 ; Bouvard, 1999 ; APA, 2000 ; Ventureyra et coll.,
2002). Il nest pas possible de dtailler ici toutes les chelles : nous renvoyons
donc le lecteur aux rfrences cites ci-dessus qui regroupent les instruments
disponibles. Il faut, de plus, souligner que cette liste est loin dtre exhaus-
tive. 19
Ces chelles doivent tre compltes par des questionnaires de personnalit

ou des mesures adaptes, en fonction des hypothses testes.
Les tests comportementaux in vivo permettent une mesure directe des perfor-
mances dun sujet et peuvent diffrer notablement des chelles dvaluation.
Le tableau 2.I prsente les principales chelles dvaluation et questionnaires
disponibles en franais.
La vido ou les enregistrements au magntophone permettent dvaluer aussi
bien les patients que les thrapeutes. Malgr les rsistances quils suscitent, ils
servent mettre en vidence aussi bien les processus thrapeutiques que les
rsultats. En diffr, deux juges indpendants et aveugles peuvent coter
les progrs des patients, le contenu de linteraction psychothrapique et
ladhsion des thrapeutes aux hypothses et aux techniques thrapeutiques.
Sur le plan des rsultats et de leur analyse, deux points sont essentiels et
spcifiques lvaluation des psychothrapies : une valuation bien conduite
doit avoir des critres et des mesures multiples, de faon ne pas trop limiter
la porte des conclusions ; elle doit aussi analyser en dtail les lments du
processus thrapeutique.
Critres de jugement
ct de la variation des scores dchelles continues, lvaluation doit
utiliser des critres gnraux, discontinus de bons rsultats ou critres de
jugement . Il peut exister un critre dichotomique unique de jugement
(succs, chec) ou un critre principal et des critres secondaires.
En effet, des changements statistiquement significatifs dune chelle sur un
groupe peuvent ne reflter que des rsultats cliniques mdiocres dont la
moyenne suffit rendre significatifs les tests statistiques, si la puissance statis-
tique est leve du fait du nombre dinclusions. Inversement, labsence de
changement moyen des scores dchelles peut, plus rarement, saccompagner
de changements cliniques intressants pour certains patients ou un sous-
groupe de patients.
Donner la taille deffet , qui reprsente la magnitude de leffet obtenu pour
le sujet moyen de ltude selon quil a le traitement ou son comparateur
(placebo ou autre traitement), reprsente un complment ncessaire aux
analyses statistiques classiques. On trouvera plus loin, au paragraphe sur la
mta-analyse, la dfinition de la taille deffet.
Slection des sujets

Quelles que soient les mthodes utilises pour le recrutement des patients :
annonces, mdias, recrutement dans une consultation hospitalire, tudiants
ou volontaires pays comme aux tats-Unis, elles slectionnent un chan-
tillon. Ltablissement de critres comme ceux du DSM-III puis du DSM-IV
20 (APA, 1994) et leur compatibilit avec les critres de lICD-10 (CIM-10,
Tableau 2.I : Principales chelles dvaluation et questionnaires disponibles en
ANALYSE
franais et dates de leur publication
Dpression
chelle de dpression dHamilton, HAM-D ou HRSD (1967) ; Inventaire de dpression de Beck, BDI (1979) ;
MADRS, chelle dvaluation de la dpression de Montgomery et Asberg (1979) ; chelle de dsespoir
(Beck, 1974) ; chelle dattitudes dysfonctionnelles (Beck et Weissman, 1980) ; Questionnaire des penses
automatiques (Hollon et Kendall, 1985) ; chelle de sociotropie-autonomie, SAS (Beck, 1983) ; chelle de
ralentissement de Widlcher (1981) ; Diagramme HARD (Rufin et Ferreri, 1984)
Anxit globale et anxit gnralise

chelle dapprciation de lanxit dHamilton, HAM-A (1969) ; chelle HAD, anxit et dpression en milieu
hospitalier (Zigmond, 1983) ; chelle de Covi (1984) ; chelle danxit de Beck, BAI (1988) ; Questionnaire
sur les inquitudes du Penn State (1990)
Phobies
chelle des peurs III, FSS III (Wolpe et Lang, 1967) ; Questionnaire des peurs (Marks et Matthews, 1969)
Attaque de panique et agoraphobie

Phobie, panique, anxit gnralise, PPAG (Cottraux, 1985) ; Questionnaire des cognitions agoraphobiques
(Chambless, 1984) ; chelle de svrit du trouble panique, PDSS (Shear, 1992)
Obsessions et compulsions
Liste des obsessions-compulsions, CAC (Marks, 1977) ; Test comportemental dvitement (Marks, 1977) ;
Liste de penses obsdantes, LPO (Bouvard, 1980) ; chelle des quatre rituels cibles (Marks, 1980) ;
chelle de Yale-Brown, Y-BOCS (Goodman, 1989) ; Questionnaire des penses intrusives et de leurs
interprtations, QPII (Yao, 1996) ; Questionnaire sur les croyances obsessionnelles, QCO-87 (Obsessive
compulsive cognitions working group, 2003) ; Inventaire des interprtations des penses intrusives
(Obsessive compulsive cognitions working group, 2003)
Phobie sociale
chelle daffirmation de soi de Rathus (1973) ; chelle danxit sociale de Liebowitz (1987) ; Test des
penses en interaction sociale, TAPIS (Glass, 1982) ; chelle dinfriorit, EDI (Yao, 1998)
Stress post-traumatique
PCL-S (Wheathers, 1993)
tats psychotiques
BPRS, chelle abrge dvaluation psychiatrique (Overall, 1962) ; CPRS, chelle dvaluation
psychopathologique gnrale (Asberg, 1978) ; chelle NOSIE, Nurse observation scale for inpatient
evaluation (Honigfeld, 1969) ; SANS et SAPS, Symptmes positifs et ngatifs dans la schizophrnie
(Andreasen, 1982)
Handicap
chelle de handicap de Sheehan
Qualit de vie
chelle de qualit de vie de Marks (1993, In : Cottraux, 1995) ; Functional status questionnaire, FSQ (Jette,
1986 ; Martin, 1993)
Personnalit
Inventaire multiphasique de personnalit du Minnesota, version abrge Minimult (Hathaway et Mc Kinley,
1991) ; Toronto alexithymia scale, TA 20 (Bagby, 1994) ; PAS, Personality assessment Schedule (Tyrer,
1992) ; SCIDII-PQ (First et coll., 1997) ; PDQ-4 Personality disorder questionnaire (Hyler, 1994) ; International
personality disorders examination, IPDE (Loranger, 1991) ; Inventaire de personnalit dEysenck, EPI (1968) ;
Entretien diagnostic structur pour la personnalit borderline, DIB-R (Zanarini et Gunderson, 1989) ;
Inventaire de personnalit de Cloninger, TCI (1993) ; Questionnaire des schmas, SQI et SQII (Young, 1990
et 1994) ; chelle dimpulsivit de Barrat (1993) ; NEO-PIR, les cinq grands facteurs (Costa et Mc Rae,
1990)
21
Tableau 2.I (suite) : Principales chelles dvaluation et questionnaires dispo-

nibles en franais et dates de leur publication
Relation thrapeutique
Questionnaire dalliance thrapeutique, Haq II (Luborsky et coll., 1996 ; traduction Cottraux, non publie) ;
chelle de relation thrapeutique, ERT (Cottraux, 1995)
Attentes thrapeutiques
chelles dattentes thrapeutiques : thrapeute/patient (Cottraux, 1995)
Instruments dvaluation du fonctionnement global et de la dtresse symptomatique

Mini international neuropsychiatric interview (Sheehan et coll., 1998 ; Lecrubier et coll., 1998) ; Sant-maladie
psychologique, HSRS (Luborsky et coll., 1962-1991) ; Global assessment scale, GAS (Spitzer, 1976) ;
chelle dvaluation globale du fonctionnement (axe V du DSM-IV) ; Adaptation sociale, SAS (Weissman,
1976) ; Questionnaire de sant (Goldberg, 1978) ; Liste de symptmes, HSCL-90-R (Derogatis, 1973) ; CGI,
Impression clinique globale (Guy, ECDEU, 1976)
Ces chelles sont disponibles en franais dans les ouvrages suivants : Cottraux et coll., 1985 ; Guelfi, 1993 ;
Cottraux et Blackburn, 1995 ; Cottraux et coll., 1995 ; Bouvard et Cottraux, 1996 ; Bouvard, 1999
OMS, 1992) ont t vivement critiqus dans notre pays. Pourtant, ils repr-
sentent la meilleure approximation provisoire qui permette la slection rela-
tivement homogne de sujets pour une tude.
Critres de qualit des essais thrapeutiques : les rgles dor

Ds 1975, Luborsky et coll. avaient dfini un ensemble de critres permettant
de juger de ladquation de conception dune tude comparative
(tableau 2.II).
Tableau 2.II : Critres dvaluation dtudes comparatives (daprs Luborsky et

coll., 1975)
Les patients de chaque groupe ont t rpartis de faon alatoire (ou stratifie sur les variables
pronostiques)
Ce sont de vrais patients qui sont utiliss, et non pas des acteurs ou des tudiants volontaires
Les thrapeutes de chaque groupe sont comptents de faon quivalente
Les traitements sont valus de faon quivalente par les patients et les thrapeutes de chaque groupe
Les mesures de rsultats prennent en compte les objectifs cibles du traitement
Les rsultats du traitement sont valus par des mesures indpendantes
Une information a t obtenue propos de lutilisation concurrente dautres traitements que ceux qui sont
valus, quils soient formels ou informels
Des chantillons de chacun des traitements compars sont valus de faon indpendante pour savoir
quel point les thrapeutes adhrent la forme de traitement dcrite dans le manuel
Chacun des traitements compars a t administr des niveaux gaux en termes de longueur ou de
frquence
Chaque traitement a t administr un niveau raisonnable et appropri la forme de traitement
La taille de lchantillon est raisonnable
22
Une chelle dvaluation, construite par Foa et Meadows (1997), compre-
ANALYSE
nant 7 items (tableau 2.III), permet de noter les essais thrapeutiques sur
3 points. Plus la note est haute plus lessai est de qualit. Maxfield et Hyer
(2002) ont propos une version plus labore de cette chelle en ajoutant
3 items supplmentaires (les trois derniers du tableau).
Tableau 2.III : valuation des essais thrapeutiques contrls (daprs Foa et

Meadows, 1997 ; rvise par Maxfield et Hyer, 2002)
Critres Notation
Symptmes clairement dfinis 0 0,5 1

Mesures valides 0 0,5 1
valuateur indpendant et aveugle 0 0,5 1
valuateur entran et fiable 0 0,5 1
Traitement prsent dans un manuel 0 0,5 1
Randomisation 0 0,5 1
Fidlit au traitement 0 0,5 1
Pas dautre traitement concomitant 0 0,5 1
Mesures et entretiens dvaluation multimodaux 0 0,5 1
Dure du traitement optimale 0 0,5 1
Mta-analyse des essais contrls sur les effets des psychothrapies

Le principe de la mta-analyse consiste considrer que lensemble des
tudes sur un sujet donn reprsente une quantit dinformations en liaison
avec lobjectif de la recherche, chaque tude y apportant sa contribution. Il
existe deux parties dans chaque tude, lune commune toutes les tudes qui
servira tester lhypothse, lautre spcifique chaque tude. Cette dernire
est lie lenvironnement et aux sujets. En outre, on prend pour hypothse
que lensemble des tudes est un chantillon de toutes les tudes possibles sur
le thme donn.
La mta-analyse a t invente pour tudier les effets des psychothrapies
(Glass, 1976), mme si sa pratique sest ensuite diffuse lensemble de la
mdecine. Smith et Glass (1977) ont dvelopp une mthode danalyse de la
littrature concernant les tudes contrles sur les effets des psychothrapies.
Elle consiste regrouper les tudes, coder les rsultats, et calculer lampleur
ou la taille de leffet thrapeutique (effect size). Celle-ci correspond, pour
un critre donn que lon tudie en fin de traitement, la diffrence de
distribution entre le groupe ltude et son comparateur (groupe contrle ou
autre traitement).
Le critre est en gnral le score dune chelle dvaluation. La taille deffet
correspond la valeur moyenne du groupe trait moins la valeur moyenne du
groupe contrle, divise par lcart-type du groupe contrle. Toutes les 23
valeurs qui entrent dans lquation sont celles de la fin du traitement. La

taille deffet reflte la diffrence entre les deux groupes en fin de traitement et
le gain ventuel du groupe trait par rapport au groupe contrle. Entre 0,20
et 0,50 une taille deffet est petite, elle est moyenne entre 0,50 et 0,80, et
grande au-del de 0,80.
Si lon admet que la distribution est normale dans les deux groupes, on peut
estimer le percentile du groupe contrle auquel se situe le sujet moyen du
groupe trait (figure 2.1). Pour une taille deffet de 0,00, il se situera dans la
moyenne du groupe contrle. Pour une taille deffet de 1,00, le sujet trait
sera plus amlior que 84 % du groupe contrle et pour une taille deffet de
2,00, il sera plus amlior que 97 % du groupe contrle. Le tableau 2.IV
donne les conversions des tailles deffet en percentiles (Roth et Fonagy,
1996).
En cas de variable binaire (succs/chec), on utilise lodds ratio (OR) qui
permet de comparer les groupes dans les limites dun intervalle de confiance.
La mga-analyse est une variante de la mta-analyse qui prend en compte
tous les sujet de toutes les tudes incluses au lieu de se contenter dun calcul
fond sur le rsultat de chaque tude (DeRubeis et coll., 1999).
Le but de la mta-analyse est essentiellement de rsoudre les problmes des
rsultats discordants en fournissant une information plus prcise sur linten-
sit des effets. Elle devrait aussi tre utile pour lidentification des rpondeurs.
En partant de ces prmisses, on peut dfinir les critres de qualit dune
mta-analyse (Jenicek, 1987 ; Boissel et coll., 1989 ; Cucherat et Cialdella,
1996).
Inclusion de tous les essais de qualit

Ceci implique une recherche extensive des tudes publies dans lensemble
des bases de donnes et galement des tudes non publies auprs des auteurs
ou des structures de recherche et de soins. Toutes les tudes du domaine
concern doivent tre considres. Les critres dinclusion (et dexclusion)
dans une mta-analyse doivent tre clairement noncs. Les tudes rejetes
doivent tre indexes la bibliographie et les raisons de lexclusion justifies
dans le texte de larticle. La slection des tudes doit rester indpendante de
leurs rsultats, ce qui en principe vite les pseudo-mta-analyses slectives
qui sont des plaidoyers pro domo .
Idalement, deux valuateurs indpendants doivent slectionner les tudes et
ne conserver que les essais contrls randomiss sans biais importants. La
qualit des essais doit donc tre prise en compte, ce qui ne va pas sans
discussion et compromis entre totalit et qualit (Greenwald et Russel,
1991). Lutilisation de rgles dor dfinissant la qualit des essais thrapeuti-
ques comme celles de Maxfield et Hyer (2002) ou celles appliques par
lorganisation Cochrane, qui sont voisines, peut rduire le bruit de fond cr
24 par des tudes de basse qualit mthodologique.
ANALYSE
Figure 2.1 : Distribution des scores et taille deffet
La courbe permet de visualiser les diffrences pour une taille deffet gale un.
Tableau 2.IV : Conversion des tailles deffet en percentiles (daprs Roth et

Fonagy, 1996)
Taille deffet Percentile
0,0 50
0,1 54
0,2 57,9
0,3 61,8
0,5 69,1
0,7 75,8
1,0 84,1
1,5 93,3
2,0 97,7
Critres de jugement
Il peut sagir dun critre binaire succs/chec par exemple : dans ce cas, on
rapportera lodds ratio (OR) ou le risque relatif (RR) du groupe trait par
rapport au groupe de comparaison. Dans le cas dun critre quantitatif, ce qui
est le plus souvent le cas en psychiatrie, on rapportera la taille deffet sur le
critre de jugement principal : par exemple une chelle danxit ou de 25
dpression. La conclusion tient compte de linflation du risque alpha, cest--

dire des faux positifs. On donne un seuil de sensibilit plus lev que
p < 0,05 : p < 0,01 est le seuil habituel des mta-analyses.
Utilisation de mthodes statistiques adquates
Plusieurs mthodes ont t proposes. Au dbut des mta-analyses des
psychothrapies, on utilisait le d de Glass calcul selon la formule
suivante qui utilise les valeurs obtenues en fin de traitement.
d (taille deffet) = moyenne du groupe trait moyenne du groupe de comparaison

cart type du groupe de comparaison
Le groupe trait est le groupe chez lequel on veut tudier lampleur de leffet,
le groupe de comparaison peut tre un groupe contrle (placebo, attention
placebo, liste dattente) ou un groupe recevant un traitement dj valid qui
sert de rfrence. Le d a t utilis dans les premires mta-analyses en
particulier celle de Smith et Glass (1977). Certains auteurs ont utilis une
formule voisine, le d de Cohen (1988).
d (taille deffet) = moyenne du groupe trait moyenne du groupe de comparaison

cart type pool des deux groupes
Il existe de trs nombreuses versions de ce d , sans vritable consensus sur
son utilisation.
Dans certaines tudes, la taille deffet est calcule par la comparaison des
scores pr-post-traitement. Elle est gale la diffrence du score aprs traite-
ment moins le score avant traitement divise par lcart-type. Cette taille
deffet tend avoir une valeur suprieure celle de la taille deffet du traite-
ment actif versus le contrle puique leffet placebo nest pas soustrait.
Comparaison des tailles deffet
Il faut rapporter non seulement les tailles deffet mais aussi leurs intervalles de
confiance 95 % et comparer les diffrentes tailles deffet pour voir si elles se
recoupent ou non.
Homognit des tudes
La mta-analyse prend pour hypothse que la taille deffet reprsente la
somme de toutes les tudes rassembles en une seule grande tude. Cepen-
dant, certaines tudes peuvent aller dans un sens et dautres en sens inverse.
Par exemple, une partie des tudes peut montrer que le traitement ltude
est suprieur au placebo, alors que dautres tudes trouvent une galit avec le
placebo. Les moyennes peuvent ne donner quun reflet imparfait des rsul-
tats. Il faut donc complter la mta-analyse, mme si elle est en faveur de
lefficacit du traitement, par une statistique qui dfinit si les tudes sont
homognes ou non, pour, ensuite, rechercher les facteurs dhtrognit. Par
exemple, lorsque des tudes divergent fortement sur un graphique
26 ( outliers ), on peut refaire lanalyse sans ces tudes et tudier en dtail leurs
modalits. Pour dterminer lhtrognit, on utilise en pratique une
ANALYSE
version particulire du v2 la statistique dhtrognit Q . On trouvera le
dtail de ces calculs dans des travaux spcialiss (Hedges et Olkin, 1985 ;
Boissel et coll., 1989 ; Gloaguen et coll., 1998).
Estimation des tudes non publies
Une mta-analyse doit couvrir lensemble des donnes publies. Or certaines
tudes ne sont pas publies pour des raisons diverses ( file drawer problem ).
Certaines tudes prsentes en dtail dans les congrs et dont il existe des
donnes crites sous forme de posters ou de rsums ne sont jamais publies.
Dans ce dernier cas, les tudes peuvent tre recherches. Il est possible de
calculer une statistique (failsafe) qui tient compte de labsence potentielle
dun certain nombre dessais non publis. Cette statistique calcule le nombre
dtudes publies qui rduirait les tailles deffet moyennes obtenues selon une
formule : k[(dk/dc) 1], k reprsente le nombre dessais publis, dk la
moyenne des tailles deffet, dc la valeur selon laquelle leffet obtenu
deviendrait insignifiant : cette valeur est fixe habituellement 0,05 ; certains
ont mme suggr une valeur plus restrictive 0,20 (Whittal et coll., 1999).
Rgles dor pour valuer les mta-analyses
On peut, partir des donnes de la littrature, crer une chelle mesurant la
qualit dune mta-analyse (tableau 2.V).
Tableau 2.V : Proposition de rgles dor pour valuer la qualit des mta-
analyses
Critres Notation
Inclusion de tous les essais de qualit sur le sujet 0 0,5 1

Critres de jugement clairement dfinis 0 0,5 1
Utilisation de mthodes statistiques adquates 0 0,5 1
Prise en compte de la puissance statistique 0 0,5 1
Comparaison des tailles deffet 0 0,5 1
Test de lhomognit des tudes 0 0,5 1
Estimation des tudes non publies 0 0,5 1
Les sept critres nots de 0 1 permettent de donner une estimation globale de la qualit dune mta-analyse.
Mdecine fonde sur les preuves

et efficacit des psychothrapies
Cest la possibilit de reproduire un travail exprimental par une quipe de
recherche indpendante de lquipe initiale qui en prouve la validit. Les
psychothrapies nchappent pas lanalyse de leur efficacit en fonction des
preuves de celle-ci. Les principes de l evidence based medicine , ou mde-
cine fonde sur des preuves, sy appliquent. La rgle est danalyser la littra-
ture dune manire hirarchise. Dans cette perspective, on tudie dans 27
lordre : les mta-analyses ; les tudes contrles ; les tudes non contrles.
En labsence de mta-analyses et dtudes contrles ou non contrles,
lexistence dun consensus fort chez les professionnels concernant les traite-
ments est prise en compte. Plusieurs systmes qui permettent dtablir des
preuves de lefficacit des psychothrapies ont t proposs.
Niveaux de preuve : Van Tulder et coll. (2002) (Cochrane review)

Niveau 1 : une preuve forte est apporte par des rsultats cohrents dans de
nombreuses tudes contrles randomises de haute qualit ;
Niveau 2 : une preuve moyenne est apporte par des rsultats gnrale-
ment cohrents dans une tude contrle de haute qualit et une, ou
plusieurs, tude(s) contrle(s) de basse qualit ou par des rsultats gnrale-
ment cohrents dans de multiples tudes contrles de basse qualit ;
Niveau 3 : preuves limites ou quivoques : seulement une tude contrle
randomise, soit de haute soit de basse qualit, ou des rsultats contradic-
toires dans des tudes contrles multiples.
Niveau 4 : pas de preuve lorsquil ny a aucune tude contrle.
Force de la preuve : Eccles et coll. (1998)

Une autre mthode voisine est celle de la force de la preuve qui est due
Eccles et coll. (1998) cite et utilise dans : Department of Health. Treatment
choice in psychological therapies and counselling. Evidence based practice guide-
line (London, February 2001). Cet ouvrage est le plus rcent sur le sujet de
lvaluation des psychothrapies. La force de la recommandation dune
mthode est fonde sur des preuves :
Force A : directement base sur la catgorie I ;
Force B : directement base sur la catgorie II de preuves ou extrapole de
la catgorie I ;
Force C : directement base sur la catgorie III de preuves ou extrapole de
la catgorie II ;
Force D : directement base sur la catgorie IV de preuves ou extrapole de
la catgorie III.
Catgories I IV
Ia : preuve tablie daprs des tudes mta-analytiques et randomises ;
Ib: preuve tablie daprs au moins une tude contrle ;
IIa : preuve tablie daprs au moins une tude contrle sans randomisa-
tion ;
IIb : preuve tablie daprs au moins un autre type dtudes quasi-
exprimentales ;
III : preuve tablie daprs des tudes descriptives comme les tudes
comparatives, des tudes corrlationnelles et des tudes cas-tmoins ;
IV : preuves venant des opinions des experts ou de comits dexperts ou de
28 lexprience clinique ou dune autorit respecte ou des deux.
Niveaux de preuve scientifique fournis par la littrature selon lAnaes
ANALYSE
Ces niveaux sont proches des niveaux de preuve que nous avons prcdem-
ment envisags. Les critres de lAnaes (2001) reprsentent bien cette opra-
tionnalisation des donnes disponibles concernant un problme de sant
publique prcis. Ils permettent un classement facile des donnes de la
recherche aussi bien que de la clinique pour clairer les dcisions. Le
tableau 2.VI reprsente les niveaux de preuve selon lAnaes.
Tableau 2.VI : Niveau de preuve scientifique et grades des recommandations

selon lAnaes (2001)
Niveau de preuve scientifique fourni par la littrature Grade des recommandations

(tudes thrapeutiques)
Niveau 1 A : Preuve scientifique tablie

Essais comparatifs randomiss de forte puissance
Mta-analyse dessais comparatifs randomiss
Analyse de dcision fonde sur des tudes bien
menes
Niveau 2 B : Prsomption scientifique
Essais comparatifs randomiss de faible puissance
tudes comparatives non randomises bien menes
tudes de cohorte
Niveau 3 C : Faible niveau de preuve
tudes cas-tmoins
Niveau 4
tudes comparatives comportant des biais importants
tudes rtrospectives
Sries de cas
Critres dvaluation des psychothrapies chez lenfant

et ladolescent
la suite dune task force de lAmerican psychological association aux tats-

Unis faisant le point de la recherche sur les psychothrapies pour les troubles
mentaux de ladulte (American psychological association, 1995 ; Chambless et
coll., 1996 et 1998), une task force similaire a t mise en place par lAmerican
psychological association, la fin des annes 1990, pour expertiser les donnes
existantes sur lefficacit des interventions psychosociales dans les troubles
mentaux de lenfant et de ladolescent. Des critres, adapts de ceux labors
par Chambless et coll. (1996) pour ladulte, ont t proposs pour dfinir
deux niveaux dvidence empirique ; ils sont prsents dans le tableau 2.VII. 29
Tableau 2.VII : Critres retenus pour lvaluation des psychothrapies chez

lenfant et ladolescent dfinis par lAmerican psychological association
(Lonigan et coll., 1998)
Critres pour les interventions defficacit bien tablie

Au moins 2 essais intergroupe, bien conduits, par des investigateurs diffrents, dmontrant lefficacit dun
traitement de lune des deux manires : le traitement est suprieur un placebo ou un traitement
alternatif, ou le traitement est quivalent un traitement defficacit dj tablie, avec une puissance
statistique suffisante (n = 30 par groupe)
Ou srie importante (par exemple, plus de 9) dtudes de cas unique utilisant un bon plan exprimental et
comparant lintervention un autre traitement
Et manuels de traitement utiliss pour les interventions, de prfrence
Et les caractristiques de lchantillon dtude sont clairement spcifies
Critres pour les interventions probablement efficaces
Deux tudes montrant que lintervention est plus efficace quune condition contrle de non-traitement (ex.
liste dattente)
Ou 2 tudes intergroupe conduites selon les mmes critres que pour les traitements bien tablis, mais par
le mme investigateur
Ou petite srie (par exemple, plus de 3) dtudes de cas unique utilisant un bon plan exprimental et
comparant lintervention un autre traitement
Et manuels de traitement utiliss pour les interventions
Et les caractristiques de lchantillon dtude sont clairement spcifies
Le terme cas unique se rfre un plan exprimental dans lequel le traitement est alternativement appliqu
et interrompu, soit un individu, soit un groupe dindividus.
BIBLIOGRAPHIE
ALFORD BA, BECK AT. The integrative power of cognitive therapy. The Guilford
Press, New York 1997
AMERICAN PSYCHOLOGICAL ASSOCIATION. Task force on psychological intervention
guidelines. Template for developing guidelines : Interventions for mental disorders
and psychosocial aspects of physical disorders. Washington DC 1995
ANAES (AGENCE NATIONALE DACCRDITATION ET DVALUATION EN SANT). Diag-
nostic et prise en charge en ambulatoire du trouble anxieux gnralis. Recomman-
dations pour la pratique clinique. Paris, 2002. Rsum publi sur Internet :
http://www.anaes.fr
APA (AMERICAN PSYCHIATRIC ASSOCIATION). Diagnostic statistical manual of
mental disorders (Fourth edition) DSM-IV. American Psychiatric Association,
Washington DC 1994. Traduction GUELFI JD, Manuel statistique et diagnostique des
troubles mentaux, Masson, Paris 1996
APA (AMERICAN PSYCHIATRIC ASSOCIATION). Handbook of psychiatric measures.
Washington DC 2000
BARLOW D, HAYES SC, NELSON RO. The scientist practitioner. Research and account-
ability in clinical and educational settings. Pergamon, New York 1984
BELLACK AS, HERSEN M. Research methods in clinical psychology. Pergamon, New
30 York 1984
BERNARD C. Introduction ltude de la mdecine exprimentale. Garnier-
ANALYSE
Flammarion, Paris (1865) 1980
BOISSEL, JP, BLANCHARD, J, PANAK E, PEYRIEUX JC, SACKS H. Considerations for the
meta-analysis of randomized clinical trials. Summary of a panel discussion. Control
Clin Trials 1989, 10 : 254-281
BOUVARD M. Questionnaires et chelles dvaluation de personnalit. Masson, Paris
1999
BOUVARD M, COTTRAUX J. Protocoles et chelles dvaluation en psychiatrie et en
psychologie. Masson, Paris 1996, troisime dition 2002
CHAMBLESS D, SANDERSON W, SHOHAM V, JOHNSON S, POPE K et coll. An update on
empirically validated therapies. Clin Psychol 1996, 49 : 5-18
CHAMBLESS DL, BAKER MJ, BAUCOM DH, BEUTLER LE, CALHOUN KS et coll. Update on
empirically validated therapies II. Clin Psychol 1998, 51 : 3-15
CLARK D, SALKOVSKIS P, CHALKLEY AJ. Repiratorty control as a treatment for panic
attacks. J Behav Ther Exp Psychiatry 1985, 16 : 23-30
CLARKIN JF, PILKONIS PA, MAGRUDER KM. Psychotherapy of depression. Implications
for the reform of the health care system. Arch Gen Psychiatry 1996, 53 : 717-723
COHEN D. Statistical power analysis for behavioral sciences (2nd edition). Lawrence
Erlbaum Associates, Hillsdale NJ 1988
COTTRAUX J. Problmes poss par lvaluation des psychothrapies. Psychol Med
1988, 20 : 199-206
COTTRAUX J, BOUVARD M, LGERON P. Mthodes et chelles dvaluation des
comportements. ditions dapplication psychotechniques, Issy-les-Moulineaux 1985
COTTRAUX J, BLACKBURN IM. Thrapies cognitives des troubles de la personnalit.
Collection mdecine et psychothrapie, Masson, Paris 1995
COTTRAUX J, NOTE ID, CUNGI C, LGERON P, HEIM F et coll. A controlled study of
cognitive-behavior therapy with buspirone or placebo in panic disorder with agora-
phobia. A one year follow-up. Br J Psychiatry 1995, 167 : 635-641
CUCHERAT M, CIALDELLA P. La mta-analyse des essais thrapeutiques : application
en psychiatrie. Encephale 1996, XXII : 378-387
DERUBEIS RJ, GELFAND LA, TANG TZ, SIMONS AD. Medications versus cognitive
behavior therapy for severely depressed outpatients : Meta-analysis of four random-
ized comparisons. Am J Psychiatry 1999, 156 : 1007-1013
ECCLES M, FREEMANTLE N, MASON J. North of England evidence based guidelines
development project : methods of developing guidelines for efficient drug use in
primary care. BMJ 1998, 316 : 1232-1235
FOA EB, MEADOWS EA. Psychological treatments for posttraumatic stress disorder : a
critical review. Annu Rev Psychol 1997, 48 : 449-80
FREUD S. On beginning the treatment : further recommendations on the technique
of psychoanalysis. In : Standard edition of the complet psychological works of
Sigmund Freud (vol. 12). STRACHEY J ed, Hogarth Press, London (1913) 1958 31
FREUD S. Introductory lectures on psycho-analysis. Standard Edition, vol. 15.

Hogarth Press, London (1917) 1961
FREUD S, BREUER J. tudes sur lhystrie. Presses Universitaires de France, Paris
(1895) 1956
GABBARD GO. The economic impact of psychotherapy : a review. Am J Psychiatry
1997, 154 : 147-155
GARFIELD AE, BERGIN SL. Handbook of psychotherapy and behavior change. Wiley,
New York 1978
GLASS GV. Primary, secondary and meta-analysis of research. Educ Res 1976, 5 : 3-9
GLOAGUEN V, COTTRAUX J, CUCHERAT M, BLACKBURN IM. A meta-analysis of the
effects of Cognitive Therapy in depressed patients. J Affect Disord 1998, 49 : 59-72
GREENWALD S, RUSSELL RL. New school for social research. Assessing rationales for
inclusiveness in meta-analysis samples. Psychotherapy Research 1991, 1 : 17-24
GUELFI JD (ed). Lvaluation clinique standardise en psychiatrie (deux volumes).
ditions mdicales Pierre Fabre, Castres 1993
GUY W. ECDEU, Assessment manual for psychopharmacology. NIMH, Rockville
MD 1976
HEDGES LV, OLKIN I. Statistical methods for meta-analysis. Academic Press, New York
1985
HERSEN M, BARLOW D. Single-case experimental designs. Pergamon Press, New York
1976
JANET P. Lautomatisme psychologique. Alcan, Paris 1889. Rd. Odile Jacob, Paris
1998
JENICEK, M. Mta-analyse en mdecine. valuation et synthse de linformation
clinique et pidmiologique. Edisem & Maloine, Paris 1987 : 99-145
KAZDIN A. Single-case research designs : Methods for clinical and applied settings.
Oxford University Press, New York 1982
LADOUCEUR R, BEGIN G. Protocoles de recherche en sciences appliques et fonda-
mentales. Edisem, Maloine, Paris 1980
LONIGAN CJ, ELBERT JC, JOHNSON SB. Empirically supported psychosocial interven-
tions for children : an overview. J Clin Child Psychol 1998, 27 : 138-145
LUBORSKY L, SINGER B, LUBORSKY L. Comparative studies of psychotherapies : is it
true that everyone has won and all must have prizes ? Arch Gen Psychiatry 1975, 32 :
995-1008
LUBORSKY L, MCLELLAN AT, WOODY GE, OBRIEN CP, AUERBACH A. Therapist success
and its determinants. Arch Gen Psychiatry 1985, 42 : 602-611
LUBORSKY L, BARBER JP, SIQUELAND L, JOHNSON S, NAJAVITS LM et coll. The revised
helping alliance questionnaire (Haq-II) : psychometric properties. J Psychother Pract
Res 1996, 5 : 260-271
MAXFIELD L, HYER L. The relationship between efficacy and methodology in studies
32 investigating EMDR treatment of PTSD. J Clin Psychol 2002 ; 58 : 23-41
MARTIN P, PERETTI S. La qualit de vie : le point de vue du psychiatre. Psychiatrie
ANALYSE
1999, 16 (Suppl. 2) : 16-27
MEYERS LS, GROSSENS NE. Behavioral research. Theory, procedure and design. WH
Freeman and Company, San Francisco 1974
OBSESSIVE COMPULSIVE COGNITIONS WORKING GROUP. Psychometric validation of
the Obsessive Beliefs Questionnaire and the Interpretation of Intrusions Inventory.
Part I. Behav Res Ther 2003, 41 : 863-878
OMS. The ICD classification of mental and behavioral disorders. WHO, Genve
1992
PAUL GL. Behavior modification research : Design and tactics. In : Behavior therapy :
Appraisal and status. FRANCKS CM ed, McGraw Hill, New York 1969
POPPER K. Conjectures and refutations. The growth of scientific knowledge. Rout-
ledge and Kegan Paul, London 1963
ROSENTHAL RL. Experimenter Effects in Behavioral Rescarch. Appleton Century
Crofts, New York 1966
ROSENTHAL RL, ROSNOW R. Primer of methods for the behavioral sciences. Wiley,
New York 1975
ROTH A, FONAGY P. What works for whom ? A critical review of psychotherapy
research. The Guilford Press, New York, London 1996
SARTORIUS N, DE GIROLAMO G, ANDREWS G, GERMAN A, EISENBERG L (eds). Treat-
ment of mental disorders. A review of effectiveness. WHO, American Psychiatric
Press, Washington 1993
SHADISH RW, MATT GE, NAVARRO AM ET COLL. Evidence that therapy works in
clinically representative conditions. J Consult Clin Psychol 1997, 65 : 355-365
SMITH ML, GLASS GV. Meta-analysis of psychotherapy outcome studies. Am Psychol
1977, 32 : 752-760
VAN TULDER MW, OSTELO RW, VLAEYEN JW, LINTON SJ, MORLEY SJ, ASSENDELFT WJ.
Behavioural treatment for chronic low back pain (Cochrane Review). In : The
Cochrane Library, Issue 4, 2002
VENTUREYRA VA, YAO SN, COTTRAUX J, NOTE I, DE MEY-GUILLARD C. The validation
of the Posttraumatic Stress Disorder Checklist Scale in posttraumatic stress disorder
and non-clinical subjects. Psychother Psychosom 2002, 71 : 47-53
WHITTAL ML, AGRAS WS, GOULD RA. Bulimia nervosa : a meta-analysis of psychoso-
cial and pharmacological treatments. Behav Ther 1999, 30 : 117-135
YAO SN, COTTRAUX J, MARTIN J, BOUVARD M. Etude de validation dun questionnaire
des penses intrusives et de leurs interprtations (QPII) dans les troubles
obessionnels-compulsifs : importance de linfriorit. Revue Francophone de Clinique
Comportementale et Cognitive 1996, 1 : 14-24
YAO SN, COTTRAUX J, MARTIN R, MOLLARD E, BOUVARD M et coll. Inferiority in social
phobics, obsessive-compulsive and non-clinical controls. A controlled study with
the inferiority scale. In : Behaviour and cognitive therapy today : essays in honour of
Hans J. Eysenck. SANAVIO E ed, Pergamon, Elsevier, London 1998 33
3
ANALYSE
tapes historiques de lvaluation
On peut dfinir la psychothrapie comme un ensemble de mthodes

psychologiques dont le but est de soulager une souffrance dans un cadre
contractuel (Gerin, 1984). Les mthodes dvaluation qui, au dbut des
psychothrapies, taient fondes sur des tudes de cas plus ou moins
nombreux, regroupant des patients semblables ou comparables par des
auteurs ayant une grande notorit, ont progressivement t compltes par
des essais contrls qui ont connu un essor considrable ces trente dernires
annes dans tous les secteurs de soins : le registre des essais contrls de la
Cochrane collaboration compte en 2003 plus de 37 000 entres ayant trait
aux essais contrls. Cette mdecine fonde sur des preuves a cependant
des antcdents lointains que lon peut retrouver la fin du dix-huitime
sicle.
Antcdent aux travaux actuels

Un antcdent lointain aux travaux actuels de recherche contrle sur les
psychothrapies peut tre retrouv lpoque des Lumires.
valuation du baquet de Mesmer (1784)

En 1784, le roi Louis XVI dsigna une commission pour tudier le magn-
tisme animal de Mesmer qui permettait des cures spectaculaires des troubles
psychologiques et physiques, dus, selon Mesmer, un blocage des fluides dans
le corps. Le magntisme tait transmis par des baquets deau aimante selon
une procdure secrte impliquant des morceaux de fer. La commission,
compose dAntoine Lavoisier, Joseph Guillotin et Benjamin Franklin,
effectua une tude en double aveugle : les sujets qui croyaient que leau tait
magntise avaient les rponses cathartiques attendues au fluide magntique
que leau fut magntise ou non. Il sagissait donc dun simple effet de sugges-
tion. Mesmer affirma haut et fort que la magntisation de leau navait pas t
conduite dans les rgles. Le mesmerisme continua jouir dun grand
succs et survcut ce camouflet exprimental. En effet, il conservait de
nombreux partisans, parmi lesquels Lafayette, la reine Marie-Antoinette et
Mozart (McNally, 1999). 35
Ceci confirme le point de vue de Max Planck (1949) et Roland Kuhn

(1962), rapport par Mahoney (1976). Selon Max Planck et Roland Kuhn,
les ides errones ne disparaissent pas parce quon a dmontr la fois leur
fausset et la valeur dides nouvelles, mais bien parce que leurs dfenseurs
sont morts et quune nouvelle gnration a pris leur place pour instaurer un
nouveau paradigme qui, son tour, devra disparatre aprs une lutte plus ou
moins longue, pour laisser la place un paradigme meilleur.
Premiers travaux sur les effets des psychothrapies analytiques

Ds 1917 Coriat publiait un travail : Quelques rsultats statistiques concer-
nant le traitement psychanalytique des nvroses . Mais le travail le plus
important remonte 1920, Berlin, sous limpulsion dOtto Fenichel, qui
avait entrepris, malgr le scepticisme de Freud, des travaux systmatiques
destins prciser la technique psychanalytique. La publication la plus cite
est celle de Knight (1941), qui effectua une tude rtrospective chez
592 patients traits par psychanalyse dans les instituts de Berlin, Londres et
Chicago, ayant eu au moins six mois danalyse. Knight proposa les critres
dvaluation suivants :
amlioration symptomatique ;
productivit accrue ;
adaptation meilleure, et meilleur plaisir sexuel ;
capacit faire face aux conflits psychologiques ordinaires et les
rsoudre ;
amlioration des relations interpersonnelles.
Knight aboutit la conclusion que 55,9 % des sujets ainsi traits avaient t
guris ou grandement amliors. Cependant, en incluant les perdus de vue au
cours des six premiers mois, il aboutissait un taux de rsultats positifs de
30 % seulement.
valuation globale de la littrature (Eysenck, 1952)

Le vritable dbut des recherches contrles est le fait dEysenck (1952), qui
regroupa 19 tudes publies. Eysenck aboutit la conclusion que 44 % des
patients en analyse prsentaient une amlioration, alors que le taux damlio-
ration spontane des problmes nvrotiques tait de 66 % sur deux ans. En
outre, la psychothrapie dite clectique namliorait que 64 % des patients,
tandis que 72 % des patients nvrotiques hospitaliss ou traits par des gn-
ralistes taient amliors. Il y avait donc, selon cette statistique, une relation
ngative entre la psychothrapie et la gurison. La mthodologie rudimen-
taire dEysenck, qui consistait en un regroupement dtudes ayant trait des
problmes disparates et une comparaison un groupe contrle arbitraire, a
36 t critique par Garfield et Bergin (1978). Ces auteurs considrent que le
taux damlioration spontane serait de 30 % et varierait beaucoup selon la
ANALYSE
nature des problmes psychopathologiques tudis. Quelles que soient ses
limites, et ses partis pris, ltude dEysenck eut le mrite douvrir la voie
cinquante annes de recherche contrle fconde.
tude contrle randomise (Paul, 1967)

Ltude de Paul (1967) reprsente une avance du fait de sa mthodologie
rigoureuse. Elle tait effectue sur une population dtudiants ayant un dficit
en comptences sociales et une anxit sociale diffuse dont lexpression la
plus commune tait la peur de parler en public. Le protocole randomis
comparait quatre groupes :
thrapie comportementale (dsensibilisation systmatique, Wolpe (1961
et 1975) : n = 15 ;
thrapie psychodynamique : n = 15 ;
attention placebo sous la forme dune pseudothrapie napportant quun
soutien relationnel : n = 15 ;
contrle : 44 sujets servaient de contrles non traits.
Le traitement tait administr en groupes de trois patients durant cinq
sances pendant six semaines par des thrapeutes expriments.
Lvaluation tait multimodale et indpendante. Elle comprenait une
batterie de six mesures valuant lanxit, la personnalit et des tests compor-
tementaux. Ces derniers mesuraient la rponse de stress social in vivo, cest--
dire leffet sur le symptme cible. Enfin, aprs un suivi de deux ans, les effets
taient valus par une analyse de variance plusieurs facteurs, suivie de
comparaisons multiples sur chacune des mesures. Cette tude a montr que le
groupe soumis une dsensibilisation systmatique avait 85 % de rpondeurs.
Le groupe en thrapie psychodynamique prsentait des rsultats quivalents
au groupe attention placebo (50 % de rpondeurs). Ces deux derniers
groupes prsentaient des rsultats suprieurs au groupe contrle non trait
(22 % de rpondeurs). Sur le suivi de deux ans, il napparut pas de rechute ni
de substitution de symptmes dans le groupe qui avait reu la dsensibilisa-
tion systmatique, daprs les mesures comportementales, danxit et de
personnalit.
Dans le groupe attention placebo, leffet observ, particulirement important
(50 %), permettait dliminer le rle, dans les rsultats de la dsensibilisation
systmatique, dune relation thrapeutique non spcifique. La conclusion des
auteurs tait que la dsensibilisation systmatique reprsentait un traitement
spcifique de lanxit sociale. Il sagissait donc de ce quon appelle
aujourdhui une tude pivotale , abordant aussi bien les aspects pragmati-
ques que les problmes thoriques. Ltude de Paul (1967) prsente gale-
ment lintrt davoir fix des standards pour lensemble de la recherche en
psychothrapie. 37
tude contrle randomise avec des patients ambulatoires

(Sloane, 1975)
la diffrence de ltude de Paul (1967), qui avait recrut des tudiants,

ltude de Sloane (1975a et b) portait sur 94 patients ambulatoires qui
consultaient dans une clinique universitaire pour des troubles varis. Un tiers
prsentaient des troubles qui aujourdhui seraient classs parmi les troubles de
la personnalit, les autres souffraient par ordre croissant de plaintes corpo-
relles, de soucis gnraliss, dune estime de soi abaisse, de difficults rela-
tionnelles (surtout avec le sexe oppos), de difficults interpersonnelles et
danxit gnralise.
La randomisation assigna 31 patients la thrapie comportementale, 30 la
thrapie dorientation analytique et 33 une liste dattente. Les deux groupes
actifs reurent environ 14 sances de psychothrapie sur une dure de quatre
mois. Lvaluation comportait une mesure damlioration globale, des
mesures de trois symptmes cibles, de personnalit et dadaptation. Les thra-
peutes taient expriments et suivaient des lignes directrices crites qui
diffrenciaient clairement les deux formes de psychothrapie. Le groupe
contrle recevait un coup de tlphone par semaine pour sassurer que rien de
grave ne stait produit et pour annoncer une prise en charge prochaine.
Aprs quatre mois, la thrapie analytique et la thrapie comportementale
montraient une amlioration des symptmes cibles chez les patients sup-
rieure celle des patients du groupe contrle, sans diffrence entre elles. En
ce qui concerne lamlioration globale, 93 % des patients en thrapie
comportementale, versus 77 % des patients aussi bien en thrapie analytique
quen liste dattente taient amliors (p < 0,05). Les trois groupes taient
amliors sans diffrence sur les mesures dadaptation sociale.
un an de suivi, les patients ayant eu la thrapie comportementale prsen-
taient plus damliorations des symptmes cibles que les patients en liste
dattente. Ceux qui avaient eu la thrapie analytique ne se diffrenciaient pas
de ceux de la liste dattente. Cependant, les traitements additionnels reus
durant un an dans les deux groupes rendaient la comparaison difficile. Un
autre fait intressant est que 14 patients du groupe contrle (42 %) avaient
dclin loffre de tout traitement aprs quatre mois, car ils staient spontan-
ment amliors. Une des conclusions de ltude, aprs le suivi dun an, tait
que la thrapie comportementale avait des effets la fois spcifiques et plus
profonds et diffus. Ce phnomne est comparable la propagation dune
onde : leffet de diffusion (ripple effect) des thrapies comportementales est
retrouv dans de nombreuses tudes en particulier dans notre pays (Mollard
et Cottraux, 1984). partir de cette priode, la recherche sur les thrapies
comportementales devait se dvelopper considrablement, pour aborder
38 peu prs tous les troubles psychopathologiques.
Revue gnrale de la littrature (Luborsky, 1975)
ANALYSE
Luborsky et coll. (1975), aprs une analyse statistique de 40 tudes, abouti-
rent la conclusion de lefficacit de la psychothrapie en gnral et lqui-
valence des diffrents types de psychothrapie. Toutes les coles de
psychothrapie avaient gagn et mritaient un prix , verdict de loiseau
Dodo dans Alice au pays des merveilles . En effet, dans cette revue, les
rsultats obtenus avec les diffrentes formes de thrapie taient suprieurs
ceux obtenus dans le groupe contrle. En fait, la mthodologie de Luborsky
apparat assez rudimentaire : elle consistait tablir des botes de scores
pour inspecter les frquences de rsultats. Par exemple, pour la comparaison
entre psychothrapies en gnral et contrle, on pouvait observer la configu-
ration suivante de la bote de score :
thrapie ltude meilleure que le comparateur : 20 ;
thrapie ltude et comparateur gaux : 13 ;
comparateur meilleur que la thrapie ltude : 0.
La revue de Luborsky incluait des tudes randomises de recherches portant
sur de vrais patients, recevant de vrais traitements ( bona fide patients
and treatments ) qui taient cods par deux valuateurs indpendants, ce qui
pour lpoque reprsentait un progrs. Mais aucun calcul nest rapport et les
conclusions sont un simple commentaire sur ces frquences. On peut aussi
observer que la revue portait sur un mlange de divers troubles et de diverses
formes de psychothrapie.
Luborsky, cependant, aboutit quelques conclusions spcifiques : la thrapie
comportementale apparaissait meilleure pour les phobies spcifiques que les
autres mthodes, la pharmacothrapie tait meilleure que la psychothrapie
en gnral, et la combinaison pharmacothrapie plus psychothrapie tait
suprieure la psychothrapie seule. La tentative de synthse effectue par
Luborsky avait le mrite douvrir la voie une mthode plus sophistique : la
mta-analyse.
Mta-analyse des effets psychothrapeutiques (Glass, 1976 ;

Smith et Glass, 1977)
Lvaluation des effets et des rsultats des psychothrapies sest ensuite dve-
loppe de manire exponentielle, ce qui obligea les valuateurs inventer
une mthode statistique pour effectuer une analyse quantitative de
lensemble des tudes disponibles : la mta analyse (Glass, 1976 ; Smith et
Glass, 1977 ; Smith et coll., 1980). Devant la ncessit de rendre compte des
effets des psychothrapies aux instances officielles et aux compagnies dassu-
rances, de nombreux travaux ont essay dvaluer, aussi bien globalement que
par trouble psychopathologique, les rsultats de la littrature. On peut
observer, qu partir de cette poque, qui suit le premier choc ptrolier 39
(1973), cest le tiers payant qui reprsentera le demandeur social le plus

pressant dvaluation des psychothrapies. Un autre facteur est lducation
du public par les mdias et le fait que les patients, en gnral, demandent de
plus en plus de comptes aux soignants. La mta-analyse, ainsi que les classifi-
cations des maladies psychiatriques comme le DSM et lICD, a pour objectif
de rpondre cette demande sociale. Cette poque a t marque par des
mta-analyses globales qui ont t fortement critiques
Le travail initial le plus important reste celui du groupe de Smith et Glass
(Smith et Glass, 1977 ; Smith et coll., 1980) qui, aprs avoir regroup
475 tudes portant sur 25 000 sujets, a calcul la taille deffet (effect size). Ils
aboutirent la conclusion que pour lensemble de ces tudes, elle tait de
0,68 ; autrement dit, chez des personnes ayant eu une psychothrapie,
lamlioration moyenne tait de 75 % suprieure celle observe chez des
sujets du groupe tmoin. Ils regrouprent les diffrents types de thrapies en
deux grandes sous-classes :
dsensibilisation systmatique, implosion, modification du comportement
et Gestalt-thrapie ;
thrapie psychanalytique, thrapie non directive de Carl Rogers, psycha-
nalyse dAdler, thrapie cognitive, analyse transactionnelle et thrapie clec-
tique.
Smith et Glass aboutirent la conclusion quil ny avait pas de diffrence
entre ces deux sous-classes.
Critiques de la mta-analyse de Smith et Glass

Une des nombreuses critiques adresses Smith et Glass tait que le regrou-
pement dtudes disparates mettant sur le mme plan des travaux effectus
avec des tudiants volontaires et de vritables patients faisait que leurs
conclusions ne refltaient pas la ralit de la pratique clinique courante
(Rachman et Wilson, 1980). De plus, certaines tudes importantes avaient
t ngliges et le regroupement des thrapies cognitives avec les thrapies
psychanalytiques plutt quavec la thrapie comportementale apparaissait
comme une erreur importante. En fait, si lon reprsente les tailles deffet
mthode thrapeutique par mthode thrapeutique, on saperoit, comme le
montre le tableau 3.I, que trois mthodes cognitivo-comportementales
prsentent les meilleurs rsultats. Et que la seule mthode avoir une taille
deffet importante, cest--dire suprieure 0,80, est la dsensibilisation syst-
matique.
Prioleau et coll. (1983), reprenant 32 tudes contre placebo de ltude de
Smith et Glass (1977), tout en obtenant la mme taille deffet que Smith et
Glass, ont abouti la conclusion quil ny avait pas de diffrence entre un
regroupement de diverses formes de psychothrapie et placebo. Les tudes
taient principalement des tudes ayant trait la thrapie psychanalytique et
40 aux thrapies humanistes, principalement rogerienne (82 %) ; seulement
Tableau 3.I : Rsultats de la mta-analyse de Smith et Glass par mthode
ANALYSE
thrapeutique (daprs Rachman et Wilson, 1980)
Mthode Taille deffet
Dsensibilisation systmatique (TCC) 0,91

Thrapie cognitive (Ellis) (TCC) 0,77
Modification du comportement (TCC) 0,76
Thrapie adlrienne 0,71
Exposition en imagination (TCC) 0,64
Thrapie rogerienne (Thrapie humaniste) 0,63
Thrapie psychanalytique 0,59
Analyse transactionnelle (Thrapie humaniste) 0,58
Gestalt-thrapie (Thrapie humaniste) 0,26
6 tudes sur 32 (18 %) portaient sur des thrapies cognitives ou comporte-

mentales.
Le fait que dans la revue de Smith et Glass il ny avait que 22 % de vrais
patients a entran dautres travaux.
Andrews et Harvey (1981) ont repris, dans ltude de Smith et Glass,
81 tudes ayant trait aux problmes nvrotiques de 2 202 vrais patients et ont
class les thrapies en trois catgories : comportementale (regroupe avec la
thrapie cognitivo-comportementale), psychanalytique (regroupe avec la
thrapie cognitive et la Gestalt-thrapie) et humaniste (thrapie non direc-
tive de Carl Rogers regroupe avec le conseil). Ils ont abouti la conclusion
quil y avait des diffrences entre les trois catgories. La thrapie comporte-
mentale, avec une taille deffet de 0,97, tait suprieure au placebo, la
thrapie analytique brve (taille deffet de 0,74 par rapport au placebo) et la
thrapie humaniste (taille deffet de 0,35 par rapport au placebo). La thrapie
humaniste ne diffrait pas significativement du placebo (tude australienne).
Limites des mta-analyses globales : problmes mthodologiques

La principale pierre dachoppement des tudes mta-analytiques est le
regroupement dtudes concernant des pathologies ou des problmes psycho-
logiques varis et aussi les biais dinclusion tenant lallgeance idologique
des auteurs. Lanalyse de ltude mta-analytique de Wampold et coll. (1997)
permet de comprendre les conclusions abusives qui peuvent tre tires de
mta-analyses qui, la fois, sont globales et prsentent des biais importants
dinclusion. Wampold et coll. (1997) comparaient des thrapies dite de
bonne foi des thrapies reprsentant de simples contrles sans vritable
intention de traiter. Selon ces auteurs, une thrapie de bonne foi est une
thrapie dans laquelle le thrapeute, ayant un bon niveau de matrise et un
manuel, dveloppe une relation et adapte le traitement au patient. Il existait 41
cependant une importante limitation cette tude : elle nincluait pas la

totalit des donnes, contrairement aux rgles habituelles de la mta-analyse.
Seulement six journaux publis aux tats-Unis entre 1970-1995 taient pris
en compte. Les rsultats exprims en taille deffet sont prsents dans le
tableau 3.II.
Tableau 3. II : Rsultats aprs regroupement de thrapies (daprs Wampold et

coll., 1997)
Comparaisons Taille deffet
Thrapie versus pas de traitement 0,82

Thrapie versus placebo 0,48
Placebo versus pas de traitement 0,42
Diffrences entre thrapies de bonne foi 0,00-0,21
Mais on peut observer que sur les 114 tudes incluses, 79 (69 %) comparaient
des formes diffrentes de thrapie cognitive et comportementale entre elles
(Crits-Christoph, 1997). De plus, il est habituel de trouver une quivalence
dans les essais contrls randomiss de ces mthodes qui se recoupent en bien
des points (Cottraux et coll., 2001). En outre, seulement quatre impliquaient
la thrapie analytique, aucune la thrapie familiale, trois incluaient des
enfants et adolescents. Wampold et coll. soulignent dailleurs eux-mmes
quils nenvisagent pas les catgories diagnostiques une par une, et ne
peuvent donc conclure au sujet de lefficacit de chaque type de thrapie
pour chaque problme spcifique. Mais les auteurs ne devraient pas non plus
parler de psychothrapie en gnral, puisque plus des deux tiers des tudes
entres dans la mta-analyse appartiennent au mme courant psychothra-
pique, les thrapies cognitivo-comportementales, et reprsentent de ce fait la
source de variation la plus importante.
On voit ici comment on peut faire dire la mta-analyse ce quon souhaite
entendre. Aussi, la recherche sest maintenant centre sur ltude de traite-
ments spcifiques appliqus des troubles aussi dfinis que possible et les
mta-analyses modernes sefforcent dinclure tous les essais de qualit, y
compris ceux qui ont t publis dans des revues obscures, prsents dans des
congrs ou encore oublis par leurs auteurs dans les tiroirs.
Historique des travaux sur lvaluation des thrapies

familiales
Concernant lvaluation des thrapies familiales, les dix premires tudes
42 dvaluation ont t publies entre 1972 et 1983, recensant 178 articles, dont
83 non contrls. Ces premires tudes nont pas abouti un consensus clair
ANALYSE
concernant lefficacit des thrapies familiales. Mais les revues de la littra-
ture soulignent les dfauts mthodologiques des tudes (caractres inadquat
des groupes contrles, non fiabilit des mesures, absence de dlai suffisant
avant lapprcriation du suivi, aspect mal dfini des fondements thoriques
permettant les comparaisons. Au cours des annes 1980, plusieurs mta-
analyses et revues (Gurman et coll., 1986 ; Hahlweg et Markman, 1988 ;
Hazelrigg et coll., 1987 ; Shadish et coll., 1993) fournissent plusieurs argu-
ments pour conclure lefficacit des thrapies de couple et de famille mais
sans apporter des rsultats trs prcis. La mta-analyse de Shadish et coll.
(1993) marque une tape dans lvolution des travaux. Les auteurs proposent
en effet des indications plus circonstancies, des comparaisons entre diff-
rentes orientations thoriques en thrapie familiale et une analyse de la
signification clinique des rsultats en fonctions des orientations et des
problmes traits. Ils soulignent galement limportance de la prise en
compte des mthodologies des tudes pour lapprciation des rsultats. Un
autre aspect qui vient progessivement lordre du jour dans les tudes est
ltude du maintien des rsultats positifs sur le long terme. Enfin, leffet des
thrapies familiales est apprci non seulement sur le trouble du patient
concern mais aussi sur le fonctionnement global de la famille. Pour les
troubles de lenfant, les thrapies familiales occupent une place de choix. Les
travaux les plus consquents se sont intresss aux techniques psycho-
ducationnelle qui mobilisent la famille et qui ont obtenu des rsultats signi-
ficatifs pour certains troubles (autisme en particulier). Les travaux les plus
rcents sont voqus dans le chapitre sur lvalution des thrapies familiales
Historique des travaux dvaluation de thrapies

chez lenfant
La premire recherche publie sur lvaluation des psychothrapies chez
lenfant est probablement celle dEvelyne Alpern en 1946, comparant deux
approches thrapeutiques courantes : lune dans laquelle lenfant et ses
parents sont vus et traits ensemble, lautre dans laquelle lenfant et ses
parents sont vus et traits sparment. Les rsultats de ltude taient
exprims en termes dimpression du clinicien sur les progrs de lenfant, sans
considration de catgories diagnostiques, ni randomisation aux deux condi-
tions de traitement, ni valuation standardise pr- et post-traitement.
Dix ans plus tard, la revue de Levitt (1957) sur lvaluation des psychothra-
pies chez lenfant, contemporaine de celle dEysenck (1952) chez ladulte,
aboutissait, comme cette dernire, la mme conclusion pessimiste : les
formes traditionnelles de psychothrapie ne sont pas plus efficaces que
labsence de traitement. Dans les annes 1950 et 1960, la premire gnra-
tion dtudes sur lefficacit des psychothrapies posait la question de leur 43
capacit induire une modification de la personnalit, sans spcification ni

diffrenciation des formes de psychothrapie utilises, ni des problmes clini-
ques traiter. Lessor de la thrapie cognitivo-comportementale (TCC) dans
les annes 1960 et 1970 a par la suite fortement contribu promouvoir une
approche plus scientifique, tant de la pratique clinique que de la recherche
thrapeutique. La question Est-ce que la psychothrapie marche ? est
alors remplace par Quelles procdures spcifiques sont les plus efficaces
pour traiter tel ou tel problme clinique ? . Cest le dbut des tudes avec
allocation randomise lun des diffrents traitements poss en comparaison.
Depuis les annes 1980, la troisime gnration de recherches en psychoth-
rapie utilise le modle des essais cliniques contrls issu de la pharmacoth-
rapie, les diagnostics DSM et des manuels dcrivant prcisment les
traitements utiliss.
En conclusion, lre des comparaisons globales de mthodes psychothrapi-

ques, sappliquant des troubles psychopathologiques varis regroups et
impliquant des volontaires, est rvolue. La stratgie actuelle est de comparer
pour chaque trouble selon lICD ou le DSM, des types de psychothrapie bien
dfinis de manire oprationnelle entre elles, au placebo ainsi qu des traite-
ments mdicamenteux. Vu le nombre des essais thrapeutiques contrls
portant sur des troubles prcis, il est relativement facile dtudier les thrapies
cognitives et comportementales et la thrapie interpersonnelle. Il savre plus
difficile dtudier les thrapies familiales non cognitivo-comportementales,
les thrapies psychanalytiques, lhypnose ou les thrapies humanistes
(Gestalt thrapie, analyse transactionnelle, thrapie rogerienne) bien quil
existe des essais contrls pour ces diffrentes mthodes dans diffrentes
indications. Il est de toute faon illusoire de vouloir tudier scientifiquement
toutes les formes de psychothrapie tant donne leur prolifration : 200
400 selon les diverses estimations.
BIBLIOGRAPHIE
ALPERN E. Short clinical services for children in a child guidance clinic. Am J
Orthopsychiatry 1946, 26
ANDREWS G, HARVEY R. Does psychotherapy benefit neurotic patients ? A reanalysis
of the Smith, Glass and Miller data. Arch Gen Psychiatry 1981, 38 : 1203-1208
CORIAT IH. Some statistical results of the psychoanalytic treatment of the psycho-
neuroses. Psychoanal Rev 1917, 4 : 209-216
COTTRAUX J, NOTE ID, CUNGI C, LGERON P, HEIM F et coll. A controlled study of
cognitive-behavior therapy with buspirone or placebo in panic disorder with agora-
phobia. A one year follow-up. Br J Psychiatry 1995, 167 : 635-641
COTTRAUX J, NOTE I, YAO SN, LAFONT S, NOTE B et coll. A randomized controlled
trial of cognitive therapy versus intensive behaviour therapy in obsessive compulsive
44 disorder. Psychother Psychosom 2001, 70 : 288-297
CRITS-CHRISTOPH P. Limitations of the dodo bird verdict and the role of clinical
ANALYSE
trials in psychotherapy research : comment on Wampold et al., 1997. Psychol Bull
1997, 122 : 216-220
EYSENCK HJ. The effects of psychotherapy : An evaluation. J Consult Psychol 1952,
16 : 319-324
GARFIELD AE, BERGIN SL. Handbook of psychotherapy and behavior change. Wiley,
New York 1978
GERIN P. Lvaluation des psychothrapies. Presses universitaires de France, Paris
1984
GLASS GV. Primary, secondary and meta-analysis of research. Educ Res 1976, 5 : 3-9
GURMAN AS., KINSKERN DP, PINSOF WM. Research on marital and family therapies.
In GARFIELD SL, BERGIN AE. eds, Handbook of psychotherapy and behavior changes,
3rd edition, Wiley, New York, 1986 : 565-624
HAHLWEG K, MARKMAN HJ. Effectiveness of behavioral marital therapy : Empirical
status of behavioral techniques in preventing and allieviating marital distress. J
Consult Clin Psychol 1988, 56 : 440-447
HAZELRIGG MD, COOPER HM, BORDUIN CM. Evaluating the effectiveness of family
therapies : An integrative review and analysis. Psychological Bulletin 1987, 101 :
428-442
KNIGHT RP. Evaluation of the results of the psychoanalytic therapy. Am J Psychiatry
1941, 96 : 434-446
KUHN R. The structure of scientific revolutions. University of Chicago Press,
Chicago 1962
LEVITT EE. The results of psychotherapy with children : an evaluation. J Consult
Psychol 1957, 21 : 189-196
LUBORSKY L, SINGER B, LUBORSKY L. Comparative studies of psychotherapies : is it
true that everyone has won and all must have prizes ? Arch Gen Psychiatry 1975, 32 :
995-1008
MAHONEY MJ. Scientist as a subject. The psychological imperative. Ballinger
Publishing Company, Cambridge Massachussets 1976
MCNALLY RJ. EMDR and Mesmerism : A comparative historical analysis. J Anxiety
Disord 1999, 13 : 225-236
MOLLARD E, COTTRAUX J. Changements positifs de linventaire multiphasique de
personnalit du Minnesota (MMPI) chez 70 sujets traits par thrapie comporte-
mentale. Psychol Med 1984, 16 : 2385-2394
PAUL G. Insight versus desensitization in psychotherapy two years after termination. J
Consult Psychol 1967, 31 : 333-348
PLANCK M. Scientific autobiography and other papers. Philosophical Library, New
York 1949
PRIOLEAU L, MURDOCH M, BRODY N. Analysis of psychotherapy versus placebo
studies. Behav Brain Sci 1983, 6 : 275-285 45
RACHMAN S, WILSON GT. The effects of psychological therapy, Pergamon, London,

1980
SHADISH WR, MONTGOMERY LM, WILSON P, WILSON MR, BRIGHT I, OKWUMABUA T. J
Consult Clin Psychol 1993, 61 : 992-1002
SLOANE RB, STAPLES FR, CRISTOL A, YORKSTON NJ, WHIPPLE K. Short-term analyti-
cally oriented psychotherapy versus behavior therapy. Am J Psychiatry 1975a, 132 :
373-377
SLOANE RB, STAPLES FR, CRISTOL A, YORKSTON NJ, WHIPPLE K. Psychotherapy versus
behavior therapy. Harvard University Press, Cambridge, Massachusetts 1975b
SMITH ML, GLASS GV. Meta-analysis of psychotherapy outcome studies. Am Psychol
1977, 32 : 752-760
SMITH ML, GLASS GV, MILLER TI. The benefits of psychotherapy. John Hopkins
University Press, Baltimore 1980
WAMPOLD BE, MONDIN GW, MOODY M, STICH F, BENSON K, AHN HN. A meta-analysis
of outcome studies comparing bona fide psychotherapies : empirically, All must
have prizes . Psychol Bull 1997, 122 : 203-215
WOLPE J. The systematic desensitization treatment of the neuroses. J Nerv Ment Dis
1961, 132 : 189-203
WOLPE J. The practice of Behavior Therapy. Stanford University Press, 1969. In : La
pratique de la thrapie comportementale. Traduction J. Rognant, Masson, Paris 1975
46

Inserm Psycho Part1

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Inserm Psycho Part1

Încărcat de

Drepturi de autor:

Formate disponibile

1

Ce document sintresse lvaluation scientifique de lefficacit des psycho-

Expriences dans un cadre psychothrapeutique

y a effectivement une modification du contexte de soin par rapport la

Mesures objectives, mesures subjectives

avantages et ses inconvnients : il permet dune part de bnficier des formi-

disciplines de la subjectivit et dans les sciences les plus objectives , la

constitus dune liste ditems) dpendaient fortement dun systme tho-

fois un traitement particulier des patients au potentiel de gurison le plus

En conclusion, nous venons de voir quil nexiste pas de frein conceptuel

en effet possible denvisager de tester lhypothse defficacit de ces traite-

processus psychanalytique. En revanche, les sciences nomothtiques seffor-

le cours dune psychothrapie : la nature et le degr du trouble, des vne-

Notions defficacit et dutilit clinique

1996 ; Gabbard, 1997). Des mta-analyses rcentes ont essay de rpondre

tudes de cas individuels

Protocoles de cas individuels dans la recherche en psychothrapie

(1984) et Bellack et Hersen (1984) ont suivi. En langue franaise, on peut

Protocole A-B quasi exprimental

Protocole exprimental A-B-A-B

Protocole de lignes de base multiples travers les comportements

Protocole de lignes de base multiples travers les sujets

Statistiques des cas n = 1

Rn de Revusky : protocoles lignes de base multiples travers les sujets.

Protocoles randomiss dans la recherche en psychothrapie

Ces chelles doivent tre compltes par des questionnaires de personnalit

Slection des sujets

Tableau 2.I : Principales chelles dvaluation et questionnaires disponibles en

Anxit globale et anxit gnralise

Attaque de panique et agoraphobie

Tableau 2.I (suite) : Principales chelles dvaluation et questionnaires dispo-

Instruments dvaluation du fonctionnement global et de la dtresse symptomatique

Critres de qualit des essais thrapeutiques : les rgles dor

Tableau 2.II : Critres dvaluation dtudes comparatives (daprs Luborsky et

Une chelle dvaluation, construite par Foa et Meadows (1997), compre-

Tableau 2.III : valuation des essais thrapeutiques contrls (daprs Foa et

Symptmes clairement dfinis 0 0,5 1

Mta-analyse des essais contrls sur les effets des psychothrapies

valeurs qui entrent dans lquation sont celles de la fin du traitement. La

Inclusion de tous les essais de qualit

Tableau 2.IV : Conversion des tailles deffet en percentiles (daprs Roth et

Taille deffet Percentile

dpression. La conclusion tient compte de linflation du risque alpha, cest--

d (taille deffet) = moyenne du groupe trait moyenne du groupe de comparaison

d (taille deffet) = moyenne du groupe trait moyenne du groupe de comparaison

modalits. Pour dterminer lhtrognit, on utilise en pratique une

Inclusion de tous les essais de qualit sur le sujet 0 0,5 1

Mdecine fonde sur les preuves

Niveaux de preuve : Van Tulder et coll. (2002) (Cochrane review)

Force de la preuve : Eccles et coll. (1998)

Niveaux de preuve scientifique fournis par la littrature selon lAnaes

Tableau 2.VI : Niveau de preuve scientifique et grades des recommandations

Niveau de preuve scientifique fourni par la littrature Grade des recommandations

Niveau 1 A : Preuve scientifique tablie

Critres dvaluation des psychothrapies chez lenfant

la suite dune task force de lAmerican psychological association aux tats-

Tableau 2.VII : Critres retenus pour lvaluation des psychothrapies chez

Critres pour les interventions defficacit bien tablie

BERNARD C. Introduction ltude de la mdecine exprimentale. Garnier-

FREUD S. Introductory lectures on psycho-analysis. Standard Edition, vol. 15.

MARTIN P, PERETTI S. La qualit de vie : le point de vue du psychiatre. Psychiatrie

On peut dfinir la psychothrapie comme un ensemble de mthodes

Antcdent aux travaux actuels

valuation du baquet de Mesmer (1784)