Sunteți pe pagina 1din 105

NOTIONS DE BASE EN

EPIDEMIOLOGIE
1/04/2009

GONFRIER Sébastien (Interne de Santé Publique)


KOENIG David (Interne de Santé Publique)
Département de Santé Publique, Archet 1
CHU de Nice
1
Objectifs Pédagogiques

 Connaître les différentes familles d’épidémiologie


 Calculer et interpréter une prévalence et une incidence
 Calculer et interpréter un risque relatif et un odds ratio
 Discuter les avantages et inconvénients des études cas-
témoins et des études de cohorte au niveau de leur mise
en place et leurs résultats
 Discuter les différents biais qui peuvent affecter ces deux
types d ’études
 Connaître les critères de causalité.
 Savoir interpréter un test statistique

2
Plan du cours

 I] Définitions
 II] Les différents types d’enquêtes
épidémiologiques
 III] Généralités sur les biais
 IV] Interpréter un test statistique
I) Introduction et définitions
Epidémiologie
 Épidémiologie = étude de la distribution des états de
santé et de leurs déterminants dans la population

 Au départ, principale application aux maladies


transmissibles (étude des épidémies)

 Puis extension à d’autres phénomènes de santé


(maladies chroniques, accidents domestiques…)

5
Déterminants de santé

Facteurs qui influencent l’état de santé


 Intrinsèque :
 génétique
 immunitaire
 hormonal
 Extrinsèque :
 comportementaux : tabac, alcool, alimentation, sédentarité
 environnementaux : pollution atmosphérique :
Ex : Tabac = facteur de risque connu de cancer du poumon
Amiante = FDR du mésothéliome pleural

6
Définitions
 Un facteur de risque (FDR) est un facteur dont la
présence ou l’absence augmente le risque absolu de
survenue de la maladie.

2 types :
- intrinsèques (endogènes) = âge, sexe, génétique…
- Extrinsèques (exogènes) = environnementaux ou
comportementaux.

Attention : un FDR n’est pas forcément causal ! (lien


statistique est différent de causalité)

7
 Qui utilise l’épidémiologie ?

 Professionnels de santé : mieux cibler les interventions dans les


populations à risques
(prévention, actions de santé publique , soins)

 Les politiques et les administrations : décider (promotion de la santé,


éducation à la santé)

 Les gestionnaires : planifier, allouer, organiser

 Les usagers : savoir défendre leurs causes (associations de malades)

8
Les 3 grands types d’épidémiologie

 Décrire : épidémiologie descriptive


fréquence des problèmes de santé dans une population
et leur répartition dans le temps et l’espace

 Comprendre : épidémiologie analytique


Identifier les Facteurs de Risque

 Évaluer : épidémiologie évaluative ou d’intervention


efficacité, efficience (coût)

9
II) Les différents types d’enquêtes
épidémiologiques

10
Types d’enquêtes

Enquêtes épidémiologiques

Enquêtes avec intervention Enquêtes d’observation

Évaluation d’un programme


Études descriptives:
Essais thérapeutiques de santé Études étiologiques
de prévalence, d’incidence
(avant-après, ici-ailleurs)

Études de cohorte

Études cas-témoins

Études transversales

11
A] Enquêtes avec intervention
1) Enquêtes évaluatives
 évaluer l’efficacité d’une action de soins, d’une intervention de
santé publique
 Études ici/ailleurs (mortalité, région dépistage + vs
région dépistage -)
 Études avant/après (incidence M, avant vaccination
vs après vaccination)

2) Essais thérapeutiques
 test efficacité d’un nouveau médicament versus groupe
placebo ou médicament de référence (groupe témoin)
Ex : essais randomisés en double aveugle

12
B] Enquêtes descriptives

 Définition : description de l’état de santé de la


population

 Objectifs
 Déterminer la fréquence (prévalence, incidence) de maladies
dans le temps et l’espace
 Déterminer la répartition (âge, sexe, catégories
socioprofessionnelles…) des maladies dans une population
pendant une période donnée
 Formulation des hypothèses étiologiques (FDR, causes)
vérifiées par des enquêtes analytiques

13
Types d’enquêtes

Enquêtes épidémiologiques

Enquêtes avec intervention Enquêtes d’observation

Évaluation d’un programme


Études descriptives:
Essais thérapeutiques de santé Études étiologiques
de prévalence, d’incidence
(avant-après, ici-ailleurs)

Études de cohorte

Études cas-témoins

Études transversales

14
Prévalence « statique »
= Mesure relative qui rapporte le nombre de malades (anciens et
nouveaux cas) à un nombre de sujets.

C’est une proportion qui s’exprime le plus souvent en %.

M = Nombre de malades
N = Population totale étudiée
Prévalence

 Exemple de la toxoplasmose :

Enquête Janvier 1995


Toutes les femmes ayant accouché en France la
dernières semaine de janvier
13485 femmes
7322 sérologie positives

La prévalence de la toxoplasmose chez les femmes enceinte en


France fin janvier 95 était de 54.3%

16
Incidence

 Mesure la fréquence d’apparition d’une maladie chez des


individus sains sur une période de temps donnée (risque
d’être atteint): NOUVEAUX cas.

nouveaux cas d' une maladie


sur une période donnée
Taux d' incidence 
population soumise au risque de la maladie
sur la même période

C’est une mesure dynamique


Taux d’incidence
 Notion de durée d’exposition à un facteur de risque.
 Comparaison dans l’espace et le temps à niveau
d’exposition égal.
 Calcul exact de la durée d’exposition est exprimé en
personnes-temps (PT).

 PT = Somme des durées d’exposition de chaque


individus depuis le début de la période étudiée
jusqu’à ce qu’ils tombent malades, décèdent ou
soient perdus de vue.
Incidence
Exemple de la toxoplasmose

Calcul de l’incidence de la toxoplasmose chez la femme


enceinte

Début de grossesse accouchement

327 nvx cas


13485 femmes 13485 femmes
6995 sérologie positives 7322 sérologie positives

L’incidence de la toxoplasmose pendant la grossesse en


France chez les femmes tombées enceintes la dernière
semaine d’avril 2004 est de 2.4%
20
Exemple: famille D victime de la grippe durant le mois de Janvier

Début des symptômes Guérison


Julie
Marie Pierre
Pierre
Incidence 3/7
Joel

Luc

Véronique
Prévalence 4/7
Valérie

1er janvier 10 1er Février


21
Liaison Incidence-Prévalence

P = TI x d
P = prévalence
TI = Taux d’incidence
d = durée de la maladie

SI population stable, TI petit et incidence et prévalence


constantes au cours du temps.
Exercice
Corrigé
Exercice 2

1) On a vu que P = TI x d
P = 0.03
d = 54 mois soit 54/12 = 4.5 ans.

Donc TI = P / d = 0.03/4.5 = 0.0067 soit 6.7 cas pour


1000 PA.

2) Augmentation de la durée de la maladie, donc


augmentation de la prévalence ; mais incidence non
changée.
C] Enquêtes analytiques

 1) Généralités

 2) Les mesures d’association

 3) Etudes cas-témoins

 4) Etudes de cohorte

 5) Etudes transversales

25
1) Généralités
Types d’enquêtes

Enquêtes épidémiologiques

Enquêtes avec intervention Enquêtes d’observation

Évaluation d’un programme


Études descriptives:
Essais thérapeutiques de santé Études analytique
de prévalence, d’incidence
(avant-après, ici-ailleurs)

Études de cohorte

Études cas-témoins

Études transversales

27
Enquêtes prospectives, rétrospectives

Enquête de cohorte,
rétrospective
Exposition au
facteur de risque Maladie

Temps

Enquête de cohorte, Enquête cas-témoins,


prospective rétrospective

28
29
Types d’enquêtes

 Enquête cas-témoins:

 Compare la fréquence de l’exposition antérieure chez des


sujets atteints par une maladie (cas) et chez des sujets non
atteints (témoins).
 Sujets inclus au moment du diagnostic de la maladie.
Recueil de données rétrospectif.

 Enquête de cohorte:

 compare l’incidence d’une maladie chez des sujets exposés


à sa valeur chez des sujets non-exposés.
 Sujets inclus au moment de l’exposition et suivis dans le
temps.

30
2) Mesures d’association
 Comment mesurer, quantifier l’association
entre une maladie et un facteur de risque?

 2 questions :
  question statistique et épidémiologique
( tester et quantifier la relation).
  relation cause à effet (biais, fluctuation
d’échantillonnage…).
Mesures d’association

Odds ratio

 Facteur de risque Maladie

Risque relatif

33
Définitions
 Un facteur de risque (FDR) est un facteur dont la
présence ou l’absence augmente le risque absolu de
survenue de la maladie.

2 types :
- intrinsèques (endogènes) = âge, sexe, génétique…
- Extrinsèques (exogènes) = environnementaux ou
comportementaux.

Attention : un FDR n’est pas forcément causal ! (lien


statistique est différent de causalité)
Mesures d’association et d’impact
 Niveau individuel
- Risque Relatif (RR)
- Odd-Ratio (OR)

 Niveau population
- Proportion de cas attribuables (PCA) =
risque attribuable.
 L’exposition à un facteur E est-elle associée à
une augmentation du risque de maladie M?

1/ Quantification du risque (OR ou RR)


2/ Prise en compte des fluctuations
d’échantillonnage (IDC)
Risque absolu
 Définition = probabilité qu’en évènement
donné (décès, maladie, effets secondaires…)
surviennent pendant une période déterminée
(jour, mois, année) au sein d’une population
donnée.

 S’apparente au Taux d’Incidence pour une


maladie donnée et éventuellement un groupe
de population.
Risque Relatif
Odds-Ratio (OR)
= rapport des cotes.

OR = ad / bc

Lorsque que p est petit, l’OR s’interprète comme un


RR.
Relation OR et RR
OR et RR
Exemple
Prise en compte des fluctuations
d’échantillonnage (IDC)

 Tout calcul d’un OR ou d’un RR doit


s’accompagner du calcul de son Intervalle
de confiance à 95%.
 Son calcul ne sera pas détaillé ici.
 En revanche il faut savoir interpréter un IDC
d’un OR ou d’un RR.
Interprétation de l’IDC d’un OR ou
d’un RR.
Si l’IDC 95% d’un OR ou d’un RR contient la valeur 1, l’OR (RR) ne diffère
pas significativement de 1 au risque 5%.

Si l’IDC 95% d’un OR ou d’un RR ne contient pas la valeur 1, l’OR (RR)


diffère significativement de 1 au risque 5%.

Exemples :
OR = 2.10 [1.26 - 3.51]  le facteur étudié est un FDR de la maladie.
OR = 2.18 [0.89 - 5.34]  le facteur étudié n’est pas un FDR de la
maladie.
OR = 0.63 [0.26 - 0.89]  la facteur étudié est un facteur protecteur vis-à-
vis de la maladie.
Interprétation
RR<1
OR<1

Facteur protecteur RR≈1


OR≈1
Absence de risque RR>1
OR>1

Facteur de risque

0 1 ∞

46
3) Etudes cas-témoins

47
Études cas témoins (rétrospective)

Témoins :
Malades
choix témoin +++
appariement

Qu’est ce qui différencie les malades des témoins ?


Questionnaires portant sur le passé des cas et des
témoins : exposition ?
Nature des données

Les données de l’étude cas-témoins furent obtenues à partir de


malades hospitalisés à Londres et dans les environs, entre Avril 1948
et Février 1952.
D’abord 20 hôpitaux, puis d’autres, notifièrent aux responsables de
l’enquête les malades admis avec un diagnostic de cancer du
poumon.
Ces malades furent interrogés pour déterminer leurs habitudes
tabagiques.
Il en fut de même des témoins, choisis parmi les malades présentant
d’autres problèmes (principalement non cancéreux), hospitalisés, en
même temps, dans le même hôpital.

49
Quels sont les éléments qui font de l’étude une étude
cas-témoins ?

 Étude comparant les malades à des témoins non malades sur


leur exposition antérieure au tabac.

 Sujets inclus après diagnostic de la maladie.

 Recherche rétrospective de l ’exposition au facteur de risque.

50
Calculer la valeur de l ’odds ratio.
Que signifie cette valeur ?

Le tableau 1 montre l’exposition au tabagisme chez les cas et les


témoins de sexe masculin:

cas témoins Tot.

Fumeurs 1350 1296 2646

Tabagisme
Non-
7 61 68
fumeurs

Tot. 1357 1357 2714

51
Calculer la valeur de l ’odds ratio. Que signifie cette
valeur ?

 OR = 9,08

 Le risque de cancer du poumon est 9 fois plus élevé


chez les fumeurs que chez les non-fumeurs.

52
Calculer la valeur de l ’odds ratio par nombre de cigarettes
fumées /jour. Interpréter.

Le nombre de cas et de témoins de sexe masculin répartis par nombre de


cigarettes consommées quotidiennement est indiqué dans le tableau 2:

Nombre de cigarettes
CAS TEMOINS
Consommées Odds ratio
(Nombre) (Nombre)
quotidiennement

0 7 61 1 (ref)
1-4 49 91 4,6
5 - 14 516 615 7,3
15 - 24 445 408 9,5

25 -49 299 162 16,0

≥50 41 20 17,8

---> Effet dose 53


Les biais des enquêtes cas-
témoins

Définition : Erreurs systématiques dans une étude qui


mettent en causes la validité des résultats

3 types : Biais de sélection


Biais de classement
Biais de confusion

54
Biais de sélection

 Echantillon non-représentatif de la population que l’on


cherche à étudier
 Cas-témoins+++: sélection des cas ET sélection des
témoins
 Non-réponses

55
•Quelle est la représentativité ?

- Des malades hospitalisés avec un cancer du poumon (cas) par rapport à


l ’ensemble des personnes atteintes d ’un cancer du poumon ?

 cas les plus graves


 ou au contraire ceux qui sont encore en vie

- Des malades hospitalisés sans cancer du poumon (témoins) par rapport à


l ’ensemble des personnes n ’ayant pas un cancer du poumon ?

 probablement plus de fumeurs que dans la population générale (ex :


service de cardiologie)
 En général: facteurs de risques communs à plusieurs maladies (ex:
alcool, tabac,…)  surestimation de l’exposition chez les témoins

----> Attention à la sélection des témoins


Comment ces 2 paramètres peuvent-ils affecter
l ’interprétation des résultats ?

 Mauvaise représentativité
---> résultats non extrapolables à l ’ensemble de la population

 Mauvaise sélection de témoins:


surestimation de l’exposition  sous-estimation de l’association
entre exposition et risque de survenue de la pathologie
Biais de classement

 Erreurs de mesure systématiques sur l’exposition et/ou la maladie


(ex: sous-estimation de l’exposition car mauvaise définition)

 Lors de la rédaction du protocole, définition précise de


l’exposition et de la maladie (ou du cas):
 Examens objectifs

 questionnaires standardisés et validés par ailleurs

58
Avantages et inconvénients des études cas-témoins

Cas-témoins

Avantages - maladies rares

- rapidité d’exécution, faible coût

- Peu de problèmes éthiques

Inconvénients - Recueil rétrospectif (perte information )

- Biais de sélection des témoins

- Approximation dans le calcul du risque relatif

59
Critères de causalité
 Critères:
 Relation temporelle: l’exposition précède la maladie.
 Force de l’association (valeur du RR ou de l’odds ratio).
 Présence d’un effet-dose.
 Plausibilité biologique: existence d’un mécanisme d’action
souvent montré par expérimentations chez l’animal.
 Cohérence avec les connaissances générales et les hypothèses.
 Reproductibilité de l’association: plusieurs études dans des
populations et lieux différents.
 Spécificité de l’association: l’exposition est présente chez tous les
malades (ou presque), et pour cette seule maladie.

60
4) Etudes de cohorte

61
Études exposés / non exposés cohorte
prospective
Exposé : fumeur
Maladie Maladie
Maladie MaladieMaladie

MaladieMaladie Recueil Prospectif

1996 2006
Non exposé : non fumeur

• RR > 1 : FDR de
(proportion de malades chez les exposés) maladie
Calcul du RR = • RR=1 : pas d’effet
(proportion de malades chez les non exposés) • RR < 1 : facteur
protecteur
Types d’enquêtes

Enquêtes épidémiologiques

Enquêtes avec intervention Enquêtes d’observation

Évaluation d’un programme


Études descriptives:
Essais thérapeutiques de santé Études étiologiques
de prévalence, d’incidence
(avant-après, ici-ailleurs)

Études de cohorte

Études cas-témoins

Études transversales

63
Enquêtes prospectives, rétrospectives

Enquête de cohorte,
rétrospective
Exposition au
facteur de risque Maladie

Temps

Enquête de cohorte, Enquête cas-témoins,


prospective rétrospective

64
Exemple
 Les données de l’étude de cohorte furent obtenues à partir de
l’ensemble de la population des médecins inscrits au « British Medical
Register », résidant en Angleterre et au Pays de Galles en Octobre
1951.
 Les informations concernant les habitudes tabagiques furent obtenues
par questionnaire.
 Les informations concernant la survenue d’un cancer du poumon furent
obtenues à partir des certificats de décès et d’autres données de
mortalité accumulées au cours de la période de suivi.

65
Exemple
Des questionnaires furent envoyés par la poste en Octobre 1951 à 59 600
médecins, afin de les classer en 3 groupes :

1 – Fumeurs
2 – Anciens fumeurs
3 – Non-fumeurs.

On demanda aux fumeurs et aux anciens fumeurs la quantité de cigarettes


consommées, leur manière de fumer, l’âge auquel ils commencèrent à fumer
et, s’ils avaient arrêté de fumer, depuis combien de temps ils avaient cessé.

Les non-fumeurs furent définis comme toute personne n’ayant jamais fumé
régulièrement plus d’une cigarette par jour au maximum pendant un an.

Des réponses analysables furent reçues de 40 637 médecins, soit 68 % de


l’échantillon initial, 34 445 hommes et 6 192 femmes.

66
Calculer et interpréter les incidences de cancer du poumon
et les risques relatifs pour chaque catégorie de fumeurs

TALBEAU 3

Nombre de
cigarettes Nombre de
Personnes
fumées cancers du
années
/jour poumon

0 3 42 800

1-14 22 38 600
15-24 54 38 900
> 25 57 25 100

Fumeurs
toutes 133 102 600
catégories

TOTAL 136 145 400


67
Calculer et interpréter les taux de cancer du poumon et les
risques relatifs pour chaque catégorie de fumeurs
TALBEAU 3

Nombre de
Taux pour
cigarettes Nombre de
Personnes 1 000
fumées cancers du Risque relatif
années personnes
/jour poumon
années
0 3 42 800 0,07 Réf.

1-14 22 38 600 0,56 8


15-24 54 38 900 1,38 19,7
> 25 57 25 100 2,27 32,42

Fumeurs
toutes 133 102 600 1,3 17,14
catégories

TOTAL 136 145 400

Effet dose. 68
Le tableau 4 concerne les relations entre la consommation de
cigarettes et la mortalité par cancer du poumon en tenant compte
de l’effet de l’arrêt du tabagisme:

Statuts vis-à-vis Nombre Taux pour Risque


de la consommation de cas 1000 personnes relatif
de cigarettes années
Fumeurs 133 1,30 18,57
Fumeurs ayant cessé de fumer
depuis : 5 0,67 9,57
-moins de 5 ans 7 0,49 7,00
- 5 à 9 ans 3 0,18 2,57
-10 à 19 ans 2 0,19 2,71
-20 ans et +
Non fumeurs 3 0,07 réf

69
Qu'est-ce que ces données suggèrent pour la pratique de
la santé publique et de la médecine préventive ?

Arrêter le plus vite possible


Ne pas commencer
Cela vaut la peine d'arrêter

70
Limite principale des études de cohorte

 Pour obtenir un nombre suffisant d’évènements (apparition de la


maladie):

 Il faut un grand échantillon de sujets


 Et/ou
 Il faut une longue période de suivi

 Surtout quand le risque de développer la maladie est faible.

71
Les biais

 Biais de sélection:

• échantillon non-représentatif de la population que l’on cherche à étudier


• Perdus de vue

 Biais de classement:

• erreurs de mesure systématiques sur l’exposition et/ou la maladie (ex:


sous-estimation de l’exposition car mauvaise définition)

 Facteur de confusion

72
Biais de confusion

 Biais de confusion: influence de tiers facteurs sur l’association


entre l’exposition et la maladie

•Ex: on a mis en évidence une Conso de café RR de décès par


(tasses/j) IDM
association entre consommation de
café et mortalité par infarctus du 0 Ref
myocarde (IDM):
1-2 1.3

3+ 2.0

73
Les biais

•On a pu constater que les buveurs de café tendaient aussi à être


fumeurs.
•On sait que la consommation de cigarettes est associée à la mortalité
par IDM.
•On suspecte un biais de confusion.

Conso de cigarettes (paquets/j)

Conso de café RR de décès


0 1-2 3+
(tasses/j) par IDM

0 Ref Ref Ref Ref

1-2 1.5 1.1 0.9 1.3

3+ 1.2 1.0 1.1 2.0


74
Les biais

 A consommation égale de cigarettes, il n’y a pas d’effet


de la consommation de café sur la mortalité par IDM.
 L’association café-mortalité par IDM n’est pas causale.

Tabac

Café IDM

 Solutions pour éliminer un biais de confusion:


 Tirage au sort des 2 groupes
 Restriction de la population d’étude
 Stratification: division de la population “source”
en strates. 2 groupes dans chaque strate
75
Association et causalité
(lien de cause à effet)

 Critères:
 Relation temporelle: l’exposition précède la maladie.
 Force de l’association (valeur du RR).
 Présence d’un effet-dose.
 Plausibilité biologique: existence d’un mécanisme d’action
souvent montré par expérimentations chez l’animal.
 Cohérence avec les connaissances générales et les
hypothèses.
 Consistance (reproductibilité) de l’association: plusieurs
études dans des populations et lieux différents.
 Spécificité de l’association: l’exposition est présente chez
tous les malades (ou presque), et pour cette seule maladie.

76
Avantages et inconvénients des études cas-témoins et des
études de cohorte (à partir des 2 exemples donnés dans cet
exercice).

Cas-témoins Cohortes

Avantages - maladies rares - Recueil prospectif (moins de biais)

- rapidité d’exécution, faible coût - Estimation de l’incidence

- Peu de problèmes éthiques - Calcul précis du risque relatif

Inconvénients - Recueil rétrospectif (biais de -Lourdeur méthodologique et financière


mémorisation) (taille de l’échantillon, moyens du long suivi,
perdus de vue)
- Biais de sélection des témoins - Maladies relativement communes
uniquement
- Approximation dans le calcul du - Problèmes éthiques
risque relatif

77
Comparaison cohorte/cas témoins
Cohorte Cas/témoins
Type prospectif rétrospectif
Coût Élevé ++++ Faible
Rapidité des résultats ------------- +
Longs, peu Rapides
reproductibles Reproductibles
Biais +- ++++++
Perdus de vue Témoins comparables au
cas : biais sélection
Mémorisation
(rétrospectif)
mesure

Maladie multiples Unique


fréquente Maladie Rare
Indicateur RR Risque OR Odds Ratio (IC) 78
5) Enquête transversale

 Recueil de donnée sur un temps court

 Calcul de prévalence

 (Recherche de facteur de risque)

79
Types d’enquêtes

Enquêtes épidémiologiques

Enquêtes avec intervention Enquêtes d’observation

Évaluation d’un programme


Études descriptives:
Essais thérapeutiques de santé Études analytique
de prévalence, d’incidence
(avant-après, ici-ailleurs)

Études de cohorte

Études cas-témoins

Études transversales

80
Enquête Nationale Périnatale en 2003
 Enquête réalisée en octobre 2003
 Totalité des naissances d’enfants nées vivants ou
mort nées survenues pendant une semaine
 15378 enfants
 Recueil de caractéristiques cliniques,
sociodémographiques, comportementales

Caractériser la population étudiée


Suivi dans le temps par des enquêtes répétées

81
Résultats de l’enquête
comparaison à l’enquête précédentes 1998

 Augmentation du recours à la péridurale


 Augmentation de la prévalence des
césariennes
 Augmentation de la prévalence de la
prématurité
 Diminution de la consommation du tabac

82
Résultat de l’enquête
recherche de facteur de risque

 Proposer des hypothèses : expliquer la


prématurité

Comparer les prévalences des prématurités:


chez les fumeuses et non fumeuses
en fonction de l’âge
en fonction de la parité ….

83
84
Exercice
Une enquête cas-témoins visant à étudier le lien entre la
survenue d’un cancer (M) et une exposition (E) est menée chez
300 cancéreux et 600 témoins.
Parmi les cancéreux, 25% ont été exposés.
Parmi les témoins, ils sont 17.5%.

 Y a-t-il une association entre la survenue du cancer et


l’exposition? Quelle est la bonne mesure d’association? Faire le
calcul.
Correction exercice 1
M+ M- Total
E+ 75 105 180

E- 225 495 720

Total 300 600 900

Il s’agit d’une étude cas-témoins, on ne peut donc pas calculer le RR.


Il faut calculer l’Odds-Ratio.

OR = (75x495) / (225x105) = 1.57 [1.12 - 2.20]

 interprétation?
Exercice 2

 On voudrait étudier les facteurs de risque de développer le SIDA


parmi les sujets séropositifs (HIV+).
 On décide de réaliser dans ce but une étude de cohorte
prospective sur 1835 sujets homosexuels HIV+ suivi pendant 18
mois.
 Parmi eux, 59 vont être atteints du SIDA pendant l’étude.
Exercice 2 (suite)

M+ M- Total

E+ 28 431 459
E- 31 1345 1376

Total 59 1776 1835

M+ = SIDA
M- = Pas de SIDA
E+ = Relation sexuelles avec partenaire atteint SIDA
E- = Pas de relation sexuelles avec partenaire atteint SIDA

1/ Peut-on calculer le RR associé au facteur de risque E?


2/ Peut-on calculer l’OR associé au facteur de risque E?
3/ Rôle pronostic de E?
Corrigé exercice 2
1/ Etude de cohorte (prospective) donc on peut calculer le RR.
RR = (28/459) / (31/1376) = 2.71 [1.64 - 4.47].

2/ Lorsque que la maladie est rare, RR peut être estimé par OR.
OR = (28x1345) / (431x31) = 2.82

Résultats très proche car le RR est petit.

3/ Le valeur 1 n’est pas comprise dans l’IDC95% donc le facteur


« relation sexuelles avec un partenaire SIDA » est un facteur de
risque de développer SIDA chez les HIV+
III) Récapitulatif sur les biais
Les erreurs aléatoires

 Erreur de mesure aléatoire : manque de précision


 Liées au hasard (fluctuations d’échantillonnage)
 Plus l’effectif est grand, plus la précision de la
mesure est grande, plus erreurs aléatoires
diminuent (puissance statistique)
 Notion d’intervalle de confiance : mesure la
précision
 IC large : précision –

 IC étroit : précision +
Notion de biais

 Un biais est une erreur systématique (non liée au


hasard) qui compromet la validité de l'enquête et
empêche l'interprétation juste des résultats.
 Il existe trois catégories de biais :
 biais de sélection
 biais de mesure
 biais d’analyse
 Problème : extrapolation des résultats observés sur
l’échantillon à la population ? Représentativité ??
Notion de biais
 Biais de sélection

 L’échantillon doit être représentatif de la population.


Idéal = tirer au sort les personnes dans une liste exhaustive
 Pb : pas de liste exhaustive en population générale (listes
électorales, annuaire téléphone et liste rouge, et sujets sans tel…)
 Biais de volontariat
 => risque de Biais d’échantillonnage = biais de sélection

 Healthy Worker Effect : sélection de sujets dans le cadre


de leur activité professionnelle, sélection à l’embauche =
sélection de populations en meilleur état de santé général

 les personnes gravement malades ou handicapées


sont habituellement exclues de la population active

= HWE : Biais de sélection


Notion de biais
 Biais de mesure

 biais d'investigation (mauvaise reproductibilité du


questionnaire, qualité questionnaire)
 biais de mémorisation (oubli de la part de l'intéressé
d'évènements passés)
 biais de déclaration (réponses fausses, mauvaise
compréhension du questionnaire)
 biais de classement (malades classés chez les non
malades M+ noté M-)
 biais de comportement (changement de comportement
des individus lorsqu'ils sont observés : enquête de cohorte,
sous-déclaration alcoolisme, drogues: craintes, peur)
Notion de biais
 Biais d’analyse :
 Dus à des facteurs de confusions :
 Facteurs associés à la maladie ET à l’exposition
 Corrigeable
IV) INTERPRETER UN TEST
STATISTIQUE
 Quand on observe un résultat dans un
échantillon (ex: trt A > trt B), il y a 3
possibilités:
 A est meilleur que B
 Il y a un biais (un autre facteur explique
cette différence)
 Ce n’est que la variabilité naturelle de la
réponse au traitement
Signification statistique

 Presque toutes les « statistiques » de test sont de la forme

(ce qu’on observe) – (ce à quoi on s’attend s’il n’y a pas d’association)
variabilité naturelle
 En gros, si
(ce qu’on observe) – (ce à quoi on s’attend) > 2 x variabilité

Alors notre attente était fausse : l’association existe réellement


(avec un risque d’erreur de 5%).
1. Faire l’hypothèse nulle qu’il n’y pas de
différence:
 le pourcentage de sujets ayant un ATCD de
tabagisme est le même dans les 2 groupes
(cancer du poumon/ pas de cancer du
poumon)
H0: p1= p0
2. Calculer la statistique de test qui compare le
phénomène observé au phénomène attendu
si l’hypothèse nulle est vraie

(effet observé) – (effet attendu sous H0)

variabilité naturelle
3. Calculer le niveau de signification ou p =
probabilité d’observer une statistique de test au
moins aussi grande si H0 est vraie.
 Toute décision statistique implique un risque d’erreur =
seuil de signification du test = alpha =risque de 1ère
espèce = risque de rejeter à tort H0

 Choisir α =5%=0,05 signifie qu’on accepte une


probabilité de 5 chances sur 100 de conclure à tort à
un effet significatif
4. Interpréter:
 Si p < 0,05, alors on rejette l’hypothèse nulle: on
observe une différence significative au risque
d’erreur près de 5%
 Si p > 0,05, alors on ne rejette pas l’hypothèse
nulle: l’effet observé peut être le résultat du hasard.
L’effet est non significatif. (on n’accepte pas non
plus l’hypothèse non nulle).
 En gros, p est la probabilité à postériori de conclure
à un résultat qui n’existe pas en réalité
Taille de l’échantillon et test non
significatif

 Une différence statistiquement significative signifie que


cette différence ne peut s’expliquer par le seul hasard

 Inversement, une différence non significative n’est pas


forcément due au hasard car elle dépend de la taille de
l’échantillon
 Un petit échantillon est soumis à un risque élevé
d’erreur d’échantillonnage

 Dans ce cas, on ne peut pas conclure (manque de


puissance): il ne faut pas dire qu’il y a absence
d’effet réel

 Il est important de prévoir la taille d’échantillon


(nombre de sujets nécessaires) dans le protocole en
fonction de ce que l’on veut démontrer

S-ar putea să vă placă și