Sunteți pe pagina 1din 16

Tests statistiques

Tests statistiques relatifs aux indicateurs de mortalit en population


Statistical tests for population mortality indicators

Source : Inserm - CpiDc - IFR69 Jougla E. - Rev. Epidm. et Sant Publ., 1997, 45, 7884

INTRODUCTION

DEFINITION D'UN TAUX DE DECES

LOI DE PROBABILITE D'UN TAUX DE DECES

COMPARAISON D'UN TAUX DE DECES OBSERVE A UN TAUX DE DECES THEORIQUE

COMPARAISON DE DEUX TAUX DE DECES OBSERVES

COMPARAISON DE DEUX TAUX DE DECES STANDARDISES (STANDARDISATION DIRECTE OU METHODE DE LA POPULATION TYPE)

INDICE COMPARATIF DE MORTALITE (STANDARDIZED MORTALITY RATIO)

CONCLUSION

REFERENCE

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (1 sur 16) [16/08/2005 17:26:02]

Tests statistiques

L'objectif de cette note est de prsenter un certain nombre de tests simples s'appliquant aux problmes de comparaison les plus frquents rencontrs dans les tudes descriptives de mortalit en population. Ces tests concernent les indicateurs classiques de mortalit : taux bruts et spcifiques de dcs, taux standardiss (mthodes directe et indirecte). Les tests sont bass sur la convergence de la loi de Poisson vers la loi normale. Pour chaque type de comparaison, les intervalles de confiance sont galement prsents. Taux de dcs. Taux standardiss. SMR. Intervalle de confiance. Loi de Poisson.

The objective of this note is to present simple statistical tests applied to common comparison problems met in descriptive studies in the general population. These tests apply to classical mortality indicators : crude and specific death rates, standardized rates (direct and indirect methods). The tests are based on the convergence of the Poisson distribution towards the normal distribution. For each type of comparison, confidence intervals are also provided. Death rate. Standardized rate. SMR. Confidence interval. Poisson distribution

INTRODUCTION Un test statistique s'applique la comparaison de paramtres caractristiques des distributions de variables observes sur des chantillons (comparaison de pourcentages, moyennes...). L'utilisation d'un test est alors justifie par l'existence de fluctuations alatoires des valeurs estimes des paramtres autour de leurs vraies valeurs du fait du tirage au sort des chantillons.

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (2 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Pour l'analyse des variations de mortalit en population, on pourrait penser qu'il n'est pas ncessaire d'avoir recours des tests dans la mesure o les units statistiques considres sont des populations entires et non des chantillons (comparaison du niveau de mortalit de deux pays ou de deux rgions au sein d'un mme pays, comparaison de la mortalit de la population selon le sexe, l'ge...). En fait, mme si les caractristiques d'une population sont fixes, le taux de dcs doit tre considr comme alatoire. La population tudie peut en effet tre elle-mme considre comme un chantillon de sondage d'une population imaginaire forme son image [1,2].

L'objectif de cette note est de prsenter un certain nombre de tests simples mettre en oeuvre concernant les indicateurs descriptifs de mortalit utiliss le plus couramment [3]: taux bruts et spcifiques (par sexe, ge, causes de dcs...), taux standardiss (taux comparatifs et indice comparatif de mortalit ou SMR (1)). Les tests prsents sont bass sur la convergence de la loi de Poisson vers la loi normale. Ils supposent donc que les effectifs de dcs observs sont suffisants. Dans le cas de faibles effectifs, du fait de l'instabilit des taux de dcs, des problmes d'interprtation se posent autres que ceux lis la signification statistique des diffrences observes.

DEFINITION D'UN TAUX DE DECES Un taux de dcs est une notion moins simple apprhender statistiquement qu'une probabilit de dcs. Une probabilit de dcs (ou quotient de dcs en dmographie) s'obtient en rapportant le nombre de dcs observ au cours d'une priode donne l'effectif de la population en vie au dbut de la priode. Il s'agit donc d'une proportion.

: probabilit de dcs observe durant la priode

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (3 sur 16) [16/08/2005 17:26:02]

Tests statistiques

nd

: effectif de dcs observ durant la priode

N0 : effectif de la population au dbut de la priode.


sont alatoires, N0 peut tre considr comme non alatoire [4]. Il existe galement une probabilit thorique (inconnue) de dcs p(2) dans la population. Pour simplifier, nous considrerons dans la suite une priode d'observation d'un an (situation classique dans le contexte des tudes de mortalit en population gnrale). Un taux de dcs est dfini comme le rapport de l'effectif de dcs observ durant l'anne la population risque durant la mme priode (mesure en personnes-annes). Un taux de dcs s'apparente ainsi une vitesse (nombre de dcs observ par unit de temps) :

p et nd

: taux de dcs durant l'anne

nd D

: effectif de dcs observ durant l'anne : cumul des dures de vie vcues durant l'anne par chaque sujet en vie en dbut de priode (nombre de personnes-annes cumules durant l'anne).

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (4 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Dans le cas d'une tude de cohorte, on peut gnralement rapporter le nombre de dcs observ au cumul exact des temps de suivi de chaque sujet. Dans l'analyse des dcs au sein d'une population gnrale, on ne dispose pas du temps de suivi exact de chaque sujet durant la priode d'tude. On utilise alors un dnominateur "moyen" : dure moyenne de suivi de l'ensemble de la population (population moyenne). Dans le cas o le nombre de dcs est petit par rapport l'effectif de la population, cette population moyenne est une estimation fiable de la dure de suivi exact [5]. Les donnes relatives aux populations moyennes sont disponibles lors des recensements et entre les recensements partir des estimations inter-censitaires. Le taux de dcs s'obtient alors par :

Np : effectif de la population moyenne durant l'anne (il s'agit en fait d'un nombre de personnes-annes : Np *1an) Compte tenu du faible nombre de dcs par rapport aux effectifs de la population, les taux de dcs sont souvent donns pour 100 000 personnes (le numrateur est multipli par 105).

(1) Standardized mortality ratio. (2) Pour l'ensemble du contenu de la note, les minuscules indiquent des variables alatoires (que l'on peut estimer) et les majuscules des valeurs thoriques (paramtres).

LOI DE PROBABILITE D'UN TAUX DE DECES Dans l'expression ci-dessus, Np tant non alatoire, on obtient la variance de t par :

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (5 sur 16) [16/08/2005 17:26:02]

Tests statistiques

L'effectif nd de dcs observ dans l'anne suit une loi binomiale de paramtre N0 et P (N0 effectif de la population en vie en dbut d'anne et P probabilit thorique de dcs durant l'anne). N0 tant grand et P petit, cette loi binomiale peut tre approxime par une loi de Poisson de paramtre PN0 estim par pN0 = nd (nd est galement l'estimation de la variance de cette loi de Poisson). On en dduit, l'estimation de la variance d'un taux de dcs :

Si l'effectif nd est suffisant (par exemple, nd > 20), on peut faire une approximation normale de la loi de Poisson. On en dduit la loi de probabilit suivie par un taux de dcs observ :

T
N

: taux de dcs thorique

:loi normale de moyenne et d'cart type

et la formule de l'intervalle de confiance d'un taux de dcs T :

/2 : valeur de la loi normale centre - rduite telle que P(> /2) = (ex: si = 0,05 , /2 = 1,96)

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (6 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Exemple : on a observ en 1992, pour la rgion Aquitaine, 39 dcs par sida chez les femmes entre 25 et 44 ans (population moyenne de l'anne: 425 036). L'intervalle 95% du taux de dcs est :

Dans le cas o les effectifs sont insuffisants pour admettre l'approximation par la loi normale, on doit utiliser l'intervalle de confiance exact d'une loi de Poisson (voir par exemple la table prsente en [4]). Dans l'exemple prcdent, l'intervalle de confiance 95% d'une loi de Poisson de paramtre 39 est : 27,7-53,3, ce qui conduit l'intervalle de confiance pour le taux de dcs : 6,5-12,5. Cet intervalle exact est trs proche de celui obtenu sur la base de l'approximation normale (alors que le nombre de dcs observ n'est pas trs lev).

COMPARAISON D'UN TAUX DE DECES OBSERVE A UN TAUX DE DECES THEORIQUE : Le test est bas sur l'utilisation de la loi normale (on suppose que l'effectif de dcs observ est suffisant). Sous l'hypothse nulle O d'galit au taux thorique , on a :

Exemple: comparaison du taux de dcs par sida observ chez les femmes de 25 44 ans en Aquitaine en 1992 (39 dcs pour une population moyenne de 425 036) au taux thorique: 5,84 pour 100 000.

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (7 sur 16) [16/08/2005 17:26:02]

Tests statistiques

(diffrence significative p<0,01) Application : comparaison d'un taux de dcs observ dans une population (ou dans un sous groupe de population) un taux thorique connu par ailleurs. On pourra galement considrer comme thorique un taux calcul dans une population trs importante par rapport celle dans laquelle est calcul le taux observ. Un cas particulier assez frquent est celui o l'on compare le taux observ d'une souspopulation (par exemple une rgion) au taux national. La population tudie est alors un sous-ensemble de la population de rfrence et les deux taux compars ne peuvent tre considrs comme indpendants. On doit alors utiliser un facteur correctif en multipliant

avec Np : effectif correspondant la sousl'cart-type de t par la quantit population et N : effectif de la population gnrale de rfrence [6]. Le facteur correctif appliqu au dnominateur tant infrieur 1, la puissance du test est ainsi amliore. Dans l'exemple prcdent, si le taux thorique (5,84 pour 100 000) est en fait le taux correspondant la France entire en 1992 (population moyenne: 8 926 430), c'est la formule corrige qu'il faut utiliser:

(diffrence significative p<0,01)

COMPARAISON DE DEUX TAUX DE DECES OBSERVES Soient deux taux de dcs observs dans deux populations :

t1, t2 : taux de dcs observs durant l'anne n1, n2 : effectifs de dcs observs durant l'anne

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (8 sur 16) [16/08/2005 17:26:02]

Tests statistiques

N1, N2 : effectifs des populations moyennes durant l'anne.

On suppose que les effectifs de dcs n1 et n2 sont suffisants pour admettre l'approximation normale des lois de Poisson. On peut alors en dduire les lois suivies par t1 et t2 .

t1 , t2 : taux de dcs thoriques et l'intervalle de confiance de la diffrence de deux taux de dcs t1 , t2 :

Le test est bas sur la loi normale. Sous l'hypothse nulle HO d'galit des deux taux de dcs (1 = 2 )

Du fait de l'hypothse nulle sous-jacente, il est prfrable d'utiliser dans l'expression de la variance de t1- t2 , une estimation commune t du taux de dcs dans les deux populations :

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (9 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Exemple : comparaison du taux de dcs par sida en 1992 chez les femmes de 25 44 ans en Aquitaine (39 dcs) et en rgion PACA (96 dcs) (population moyenne : 425 036 en Aquitaine et 645 853 en PACA).

t1 = 9,18 pour 100 000 et t2 = 14,86 pour 100 000 t = (39+96)* 105/(425 036 + 645 853) = 12,61 pour 100 000

(diffrence significative p<0,05) Lorsque les effectifs des deux populations compares sont identiques, la formule prcdente se rduit la comparaison de deux nombres de dcs observs :

Cette formule trs simple mettre en oeuvre, peut par exemple tre utilise lorsque l'on compare l'volution de la mortalit dans une mme population entre deux priodes de temps proches (en faisant l'hypothse que l'effectif de la population a trs peu chang).

COMPARAISON DE DEUX TAUX DE DECES STANDARDISES (STANDARDISATION DIRECTE OU METHODE DE LA POPULATION TYPE) Un taux de dcs comparatif s'obtient en appliquant les taux de dcs par ge observs dans la population tudie la structure d'ge d'une population de rfrence (lorsque la standardisation est effectue selon l'ge).

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (10 sur 16) [16/08/2005 17:26:02]

Tests statistiques

tc : taux de dcs comparatif (standardis par ge). ti : taux de dcs observ dans la classe d'ge i de la population tudie (k classes d'ge
au total).

NR : effectif de la population moyenne de rfrence. NiR: effectif de la population moyenne de rfrence pour la classe d'ge i. k : nombre de classes d'ge.
En faisant l'hypothse de l'indpendance des variations alatoires par entre les ti, on en dduit l'estimation de la variance d'un taux de dcs comparatif :

tc est une combinaison linaire des ti . Si les effectifs de dcs sont suffisants, les ti suivent des lois normales et donc tc suit galement une loi normale. On en dduit la loi de
probabilit suivie par un taux de dcs comparatif

Tc : taux de dcs comparatif thorique Ti : taux de dcs thorique pour la classe d'ge i

et l'intervalle de confiance d'un taux de dcs comparatif :

Le test de comparaison de deux taux de dcs comparatifs est donn par :

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (11 sur 16) [16/08/2005 17:26:02]

Tests statistiques

tc1, tc2 : taux de dcs comparatifs observs ti1, ti2 : taux de dcs observs pour la classe d'ge i Ni1, Ni2 : effectifs des populations moyennes pour la classe d'ge i
Exemple : comparaison des taux de dcs comparatifs par sida en 1992 chez les hommes de moins de 55 ans en Ile-de France et en rgion PACA

Effectif de dcs en Ile-de-France :

na <25 = 24, na 25-34 = 639, na 35-44 = 584, na 45-54 = 290 et en PACA : nb <25 = 10, nb 25-34 = 210, nb 35-44 = 151, nb 45-54 = 52
Population moyenne en Ile-de-France :

Na <25 = 1 833 998 , Na 25-34 = 916 350 , Na 35-44 = 867 823 , Na 45-54 = 613 374
et en PACA :

Nb<25 = 678 142 , Nb 25-34 = 298 991, Nb35-44 = 309 891 , Nb 45-54 = 235 527
Population de rfrence (France) :

NR<25 = 9 832 413 , NR 25-34 = 4 286 226, NR35-44 = 4 342 139 , Nb 45-54 = 2
932 879. La formule prcdente conduit : z = 4,37 (diffrence significative p < 0,001).

INDICE COMPARATIF DE MORTALITE (STANDARDIZED MORTALITY RATIO)

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (12 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Un SMR (Standardized Mortality Ratio) est le rapport (multipli par 102) d'un nombre observ de dcs (n) un nombre attendu (). Le nombre de dcs attendu est obtenu sur la base de la structure de mortalit d'une population de rfrence (mortalit-type). Un SMR suprieur (infrieur) 100 indique une mortalit plus (moins) leve dans la zone tudie par rapport la population de rfrence.

n : effectif total de dcs observs dans la population tudie i : effectif de la population moyenne tudie pour la classe d'ge i tiR : taux de dcs dans la population de rfrence pour la classe d'ge i
Les donnes de la population de rfrence pouvant tre considres comme non alatoires, on obtient l'estimation de la variance d'un SMR par :

Pour la formule de l'intervalle de confiance d'un SMR, diffrentes solutions ont t proposes [4,5,7-9]. Parmi ces solutions, on peut retenir la mthode de Byar prsente dans Breslow-Day [8] et dans Bouyer [5] qui conduit des rsultats extrmement proches de ceux obtenus avec la mthode exacte base directement sur l'intervalle de confiance d'une loi de Poisson:

Exemple : Pour n = 60 et A = 43,9, on obtient l'intervalle de confiance 95% du SMR : 104-176 (l'intervalle exact bas sur la loi de poisson est identique). Pour n = 8 et A = 13,2, on obtient l'intervalle : 26-119 ( intervalle "exact" galement identique).
file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (13 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Le test du SMR consiste comparer la valeur du SMR 100(O : SMR = 100). Sous O , le nombre de dcs observs n suit une loi de Poisson de paramtre A que l'on peut approximer par une loi normale (si n n'est pas trop faible) :

Pour amliorer l'approximation normale de la loi de Poisson, on peut introduire un terme de correction [8]:

Exemple : n = 60 et A = 43,9, z = 2,35 (SMR significativement diffrent de 100 avec P<0,05). avec n = 8 et A = 13,2, on obtient: z = 1,29 (SMR non significativement diffrent de 100).

CONCLUSION Dans cette note nous avons prsent une srie de tests simples pour les problmes de comparaison les plus frquents dans les tudes descriptives de mortalit en population. Les tests prsents sont utiliser avec prudence dans le cas de trs faibles effectifs. Le critre de convergence des lois de Poisson vers la loi normale varie, de n = 10 [5] n = 50 [4] selon les auteurs. Si les effectifs sont trs faibles, on devra utiliser directement la loi de Poisson. Les exemples numriques indiquent cependant que l'adquation des formules proposes est trs bonne, mme avec des effectifs restreints.

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (14 sur 16) [16/08/2005 17:26:02]

Tests statistiques

Au contraire, lorsque les effectifs de dcs analyss sont trs levs, les tests statistiques sont trs puissants et donc aboutissent gnralement des diffrences trs significatives et des intervalles de confiance trs rduits. L'intrt des tests est alors plus limit et il est important de discuter du sens pidmiologique des diffrences obtenues (indpendamment du degr de signification des tests) [10]. Pour la comparaison de taux, les tests prsents reviennent souvent traiter le taux de dcs comme une proportion et, un taux de dcs tant gnralement trs petit, approximer 1-t par 1 [11]. Les tests sont bass sur la loi normale centre rduite ou, d'une manire quivalente, sur la loi du X2 1 degr de libert en levant les formules au carr. Les dmonstrations s'appuient souvent sur le caractre non alatoire des donnes relatives aux populations de rfrence. On peut trouver une discussion sur la validit de cette hypothse dans [4,7]. Pour chaque type de comparaison, nous avons fait figurer les intervalles de confiance. De nombreux pidmiologistes considrent qu'il s'agit des donnes les plus intressantes fournir en critiquant le caractre arbitraire du choix des seuils de signification associs aux tests statistiques [12]. Les techniques de comparaison prsentes constitue une premire tape de l'analyse des diffrences observes. Les tudes comparatives plus approfondies ncessitent le recours aux techniques de modlisation qui permettent de prendre en compte simultanment un grand nombre de facteurs de confusion [4,8].

Remerciements : F. Hatton, E. Michel, G. Pavillon, L Chri-Challine. REFERENCE : 1. Schwartz D. Mthodes statistiques l'usage des mdecins et des biologistes. Paris, Flammarion, 1993. 2. Chiang CL. The life table and its applications. Florida, Krieger, 1984. 3. Michel E, Jougla E, Hatton F et al. Principaux indicateurs de mortalit. Paris, DGSINSERM, 1995.

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (15 sur 16) [16/08/2005 17:26:02]

Tests statistiques

4. Estve J, Benhamou E, Raymond L. Mthodes statistiques en pidmiologie descriptive. Paris, INSERM, 1993. 5. Bouyer J, Hmon D, Cordier S et al. Epidmiologie-principes et mthodes quantitatives. Paris, INSERM, 1993. 6. Hatton F, Facy F, Laurent F. Une mthode simple de comparaisons partielles. Revue de Statistique Applique 1976 ; 24 : 75-78. 7. Bernard PM, Lapointe C. Mesures statistiques en pidmiologie. Quebec, Universit du Qubec, 1987. 8. Breslow NE, Day NE. Statistical methods in cancer research (vol 2). IARC Scientific Publ n82, Lyon, International Agency for Research on Cancer, 1987. 9. Ulm K. A simple method to calculate the confidence interval of a standardized mortality ratio. Am J Epidemiol 1990 ; 131 : 373-5. 10. Wonnacott TH, Wonnacott RJ. Statistiques. Paris, Economica, 1984. 11. Armitage P, Berry G. Statistical methods in medical research. London, Blackwell Scientific Publications, 1993. 12. Rothman KJ. Modern epidemiology. Boston, Little Brown, 1986.

file:///H|/Serveur%20CpiDc/pages/Test_statistiques_pdf_fr.htm (16 sur 16) [16/08/2005 17:26:02]

S-ar putea să vă placă și