Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Populația generală
Erorile corespunzătoare sunt fals negative. Specificitatea este proportia de persoane sănătoase detectate
de test drept fiind negative:
În general, ratele de schimbare ar putea depăși 100%. Ele nu sunt proporții (o parte este un număr
cuprins între 0 și 1 sau între 0 și 100%). Modificarea ratelor sunt utilizate în principal pentru descriere
și nu sunt implicate în analiza statistica.
Exemplul 1.11 Următorul este un paragraf tipic al unui raport de știri:
Un număr total de 35,238 de cazuri noi de SIDA a fost raportat în 1989 de Centers for Disease
Control (CDC), comparativ cu 32196 raportate în 1988. Creşterea de 9% este cea mai mică după
răspândirea SIDA la începutul anilor 1980. De exemplu, noi cazuri de SIDA au crescut cu 34% în
1988 și 60% în 1987. În 1989, 547 de cazuri de transmitere SIDA de la mame la nou-nascuti au fost
raportate, in crestere cu 17% față de 1988; in timp ce numărul femeilor reprezintă doar 3971 din
35,238 de cazuri noi raportate în 1989; a fost o creștere de 11% față de 1988.
In Exemplul 1.11:
1. Rata de schimbare pentru noi cazuri de SIDA, a fost calculat ca
35,238−32,196
x 100 = 9,4%
32196
(acest lucru a fost rotunjit în jos la cifra raportată de 9%, în buletinul de stiri).
2. Pentru noile cazuri de SIDA transmise de la mama la nou-nascuti, avem
547 − 1988 cazuri
17% = 1988 cazuri x 100, cea ce duce la
547
cazuri în 1988 = 1,17 = 468
(o cifră care se poate obține, așa cum se arată mai sus, dar de obicei nu este raportată din cauza
surplusului) .
Similar, numărul de noi cazuri de SIDA pentru anul 1987 se calculează după cum urmează:
32196− 1987 total
34% = x 100
1987 total
sau
1987 totală = 32196 / 1.34 = 240273.
3. Dintre 1989 noi cazuri de SIDA, proporția de femele este 3971 / 35238 = 0.133 = 11,3%, iar
proporția de bărbați este (35238-3971) / 35238 = 0,887 = 88,7%. Proporţia de femei / bărbați împreună
fiind la 1,0 sau 100% .
3.2 Măsurarea Morbidității și Mortalității
Domeniul statisticii vitale (статистика естественного движения населения) cuprinde aplicații
speciale ale ratelor, unde întâlnim, de obicei, trei tipuri de rate menționate: brute, specifice și ajustate
(sau standardizate). Spre deosebire de ratele de schimbare, aceste măsuri sunt proporții. Ratele brute
sunt calculate pentru un întreg grup major sau o populație; ele nu iau în considerare factori cum ar fi
vârsta, sexul și rasa. Ratele specifice iau în considerare aceste diferențe între subgrupe sau categorii de
boli. Ratele ajustate sau standardizate sunt utilizate pentru a face comparații între două sau mai multe
grupuri care au diferite distribuții de vârstă.
Rată brută anuală de deces este definită ca numărul de decese într-un an calendaristic împărțit la
populație la data de 1 iulie a acelui an (care este, de obicei, o estimare), coeficientul este adesea
multiplicat cu 1000 sau 10 la o altă putere adecvată, rezultând un număr cuprins între 1 și 100 sau între
1 și 1000. De exemplu, populatia din California în 1980 a fost de 23.000.000 (estimată până la 1 iulie)
numărul deceselor în timpul 1980 fiind 190,237:
190,247
Rata brută de deces =23000000 x 1000 = 8.3 decese la 1000 de persoane pe an.
Mortalitatea specifică în funcție de vârsta și cauza sunt definite similar.
În cea ce privește morbiditate, prevalenta bolii, astfel cum sunt definite la punctul 2, este o
proporție utilizată pentru a descrie populația la un anumit moment temporal, pe când incidența este o
rată utilizată în legătură cu cazuri noi:
𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑎𝑛𝑒 𝑐𝑎𝑟𝑒 𝑎𝑢 𝑑𝑒𝑧𝑣𝑜𝑙𝑡𝑎𝑡 𝑏𝑜𝑎𝑙ă î𝑛𝑡𝑟−𝑜 𝑝𝑒𝑟𝑖𝑜𝑎𝑑ă 𝑑𝑒𝑓𝑖𝑛𝑖𝑡ă 𝑑𝑒 𝑡𝑖𝑚𝑝 (𝑎𝑛𝑢𝑙)
rata incidenței = 𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑎𝑛𝑒 𝑖𝑛𝑖ț𝑖𝑎𝑙 𝑓ă𝑟ă 𝑏𝑜𝑎𝑙𝑎 𝑐𝑎𝑟𝑒 𝑎𝑢 𝑓𝑜𝑠𝑡 𝑢𝑟𝑚ă𝑟𝑖ț𝑖 î𝑛𝑡𝑟−𝑜 𝑝𝑒𝑟𝑖𝑜𝑎𝑑ă 𝑑𝑒𝑓𝑖𝑛𝑖𝑡ă 𝑑𝑒 𝑡𝑖𝑚𝑝
Cu alte cuvinte, prevalența prezintă o imagine a experienței morbidității populației la un anumit
moment, în timp ce incidența are ca scop investigarea posibilelor tendințe în dependența de timp. De
exemplu, 35,238 cazuri noi de SIDA în exemplul 1.11 și populația națională, fără SIDA, la începutul
anului 1989 ar putea fi combinate în conformitate cu formula de mai sus pentru a obține o incidență
anuală de SIDA.
O altă utilizarea ratelor este în legătură cu studii de cohortă, unde design-ul epidemiologic
presupune înregistrarea unui grup de persoane și urmărirea lor în anumite perioade de timp; exemplele
includ studii de mortalitate ocupaționale și altele. Design-ul studiului de cohorta se concentreaza mai
degrabă pe o anumita expunere, decât a unei anumite boli ca și în studii de caz-control. Avantajele
unei abordări longitudinale includ posibilitatea de măsurare mai exactă a istoriei expunerii și o
examinare atentă a relațiilor în timp dintre expunere și orice boală în curs de investigare. Fiecare
membru al unui grup aparține uneia dintre cele trei tipuri de terminare:
1. Subiecții sunt încă în viață pe data analizei
2. Subiecți care au murit la o dată cunoscută în perioada studiului
3. Subiecții pierduți pentru urmarire după o dată anumită (aceste cazuri sunt o sursă potențială de
subiectivitate (Bias, необъективность), se recomandă depunerea efortului în scopul reducerii
numărului de subiecți din această categorie.
Contribuția fiecărui membru este durata timpului de urmărire de la înscriere până la terminare
studiului. Coeficientul, definit ca numărul de decese observate pentru cohorta, împărțit la numărul total
urmăriri (în persone-ani, să zicem), este rata pentru a caracteriza experiența de mortalitate a cohortei:
numărul de decese
rata de deces urmărită = total de persoane−ani
Rata poate fi calculată pentru totalul deceselor și pentru cauze distincte de interes, iar acestea sunt,
de obicei, multiplicate cu o putere corespunzătoare a lui 10, să zicem 1000, pentru a rezulta un număr
din una sau două cifre; de exemplu: decese la 1000 de luni de urmărire. Ratele de deces urmărite pot fi
utilizate pentru a măsura eficacitatea tratamentului programelor medicale.
Exemplul 1.12 Pentru a oferi o analiză completă a Tabel 1.6
supraviețuirii pacienților cu boală renală în stadiu terminal Group Age Decese/ 1000
luni de tratament
(ESRD), au fost colectate date pentru un eșantion care a Risc scăzut 1-45 2,75
inclus 929 pacienți ce au inițiat hemodializă pentru prima 46-60 6,93
61+ 13,08
dată de la Programul Regional al Bolilor din Minneapolis, Risc crescut 1-45 10,29
Minnesota, în perioada 1 ianuarie 1976 și 30 iunie 1982; toți 46-60 12,52
pacienții au fost urmăriți până la 31 decembrie 1982. Din 61+ 22,16
acești 929 pacienți, 257 sunt diabetici; 672 - nondiabetici, 386 sunt clasificați ca având risc mic (fără
comorbidități, cum ar fi bolile aterosclerotice cardiace, boli vasculare periferice, pulmonară obstructivă
cronică și cancer). Rezultatele din aceste două subgrupuri sunt prezentate în Tabelul 1.6. (Numai
câteva numere sunt prezentate aici pentru o ilustrare rezumată; detalii, cum ar fi numărul de decese și
luni totale de tratament pentru subgrupuri nu sunt incluse). De exemplu, pentru pacienții cu risc scăzut
de peste 60 de ani, au existat 38 de decese în timpul 2906 luni de tratament.
38
x 1000 = 13,08 decese la 1000 de luni de tratament
2906
Tabel 1.7
Alaska Florida
Grupa de Numărul de Populația Decese per Numărul de Populația Decese per
vârsta decese 100,000 decese 100,000
0-4 162 40,000 405 2,049 546,000 373.3
5-19 107 128,000 83.6 1,195 1,982,000 60.3
20-44 449 172,000 261 5,097 2,676,000 190.5
45-64 451 58,000 777.6 19,904 1,807,000 1,101.5
65+ 444 9,000 4933.3 63,505 1,444,000 4,397.9
Total 1,615 407,000 396.8 91,760 8,455,000 1,085.3
Rata de decese ajustată pentru vârsta la 100.000 locuitori Alaska este 788.6 și pentru Florida este
770.6. Aceste rate ajustate de vârstă sunt mult mai Tabel 1.9
Florida
aproape decât ratele brute, iar rata ajustată pentru Grupe Alaska Numărul
Florida este mai mică. Este important să se țină cont de population
Rata /
100,000
decese
vârsta prevăzute
de faptul că orice populație ar putea fi aleasă drept 0-4
(standard)
40,000 375.3 150
"standard" și din această cauză, o rată ajustată este una 5-19 128,0000 60.3 77
artificială; aceasta nu reflectă datele de la o populație 20-44 172,000 190.5 328
45-64 58,000 1101.5 639
reală. Valorile numerice ale ratelor ajustate depind în 65+ 9,000 4397.9 396
mare parte de alegerea populației etalon. Ele au un Total 407,000 1590
sens real numai în calitate de comparații relative.
Avantajul utilizării populației Statelor Unite ca standard constă în posibilitatea de a ajusta ratele de
deces ale multor state și să le comparăm între ele. Orice populație ar putea fi selectată și utilizată drept
standard. În exemplul 1.13, aceasta nu înseamnă că a existat doar 1 milion de oameni în Statele Unite,
în 1970; această prezintă distribuția pe vârste pentru 1 milion de locuitori din SUA pentru acel an. În
cazul în care singurul nostru scop este să comparăm Florida cu Alaska, am putea alege unul din state
standard și să ajustăm rata de deces a celuilalt; această practică ar economisi jumătate din munca
depusă. De exemplu, dacă vom alege Alaska în calitate de populatie standard, rata de deces ajustată
pentru Florida se calculează după cum se arată în tabelul 1.9. Noua rată ajustată,
1590∗100000
= 390.7 per 100,000
407.000
este diferită decât cea obținută utilizând populația din SUA 1970 ca standard (era 770.6), dar, de
asemenea, arată că, după ajustarea varstei, Rata de deces în Florida (390,7 la 100.000) este ceva mai
mică decât cea din Alaska (396,8 la 100.000, nu este nevoie de ajustare aici, deoarece vom folosi
populația din Alaska ca populatia standard).
4. RAPORTURI (RATIOS)
În multe cazuri, cum ar fi prevalența și incidența bolii, proporțiile și ratele sunt definite în mod
foarte similar, iar termenii proporție și rată pot fi utilizați chiar în mod interschimbabil. Raportul este
un termen complet diferit; acesta este un calcul al formei
a
raport = b
unde a și b sunt valori similare măsurate la diferite grupuri sau în diferite circumstanțe. Un exemplu
este raportul ratei fumatorilor barbați/femei; un astfel de raport este pozitiv și poate depăși 1.0.
4.1 Risсul relativ (Risc Ratio)
În studiile epidemiologice unul din cel mai utilizat raport este riscul relativ, un concept pentru
compararea a două grupuri sau populații cu privire la un anumit eveniment nedorit (de exemplu, boala
sau moarte). Metoda tradițională de exprimare în studiile prospective este, pur și simplu, raportul
dintre ratele de incidență:
incidența bolii în lotul 1
risc relativ = incidența bolii în lotul 2
De asemenea, poate fi calculat raportul dintre prevalențele bolii precum ratele deceselor. De obicei,
se măsoară raportul dintre grupul 1 (expus) și grupul 2, care se află în condiții standard (neexpus la un
anumit factor risc). Un risc relativ mai mare de 1,0 indică efecte dăunătoare, în timp ce un risc relativ
sub 1,0 indică efecte benefice. De exemplu, în cazul în care grupul 1 este format din fumatori si grupul
2 de nefumatori, avem un risc relativ din cauza fumatului. Pe baza datelor Tabel 1.10
privind boala renală în stadiu terminal (ESRD) din Exemplul 1.12, putem Grupa1-45 de vârsta Riscul relativ
3.74
obține riscurile relative datorate diabetului (Tabelul 1.10). Toate cele trei 46-60 1.81
numere sunt mai mari de 1 (indicând mortalitate mai mare pentru 61+ 1.69
ușurință prin observarea grupelor de subiecți cu și fără factor, așa cum se arată mai sus. Într-un studiu
de caz-control datele nu prezintă un răspuns imediat la o astfel de întrebare, iar sarcina noastra e sa
analizăm modul în care putem obține o soluție rapidă și utilă.
Să presupunem că fiecare subiect într-un studiu mare, într-un anumit moment, este clasificat ca
fiind pozitiv sau negativ, în funcție de un factor de risc, și ca având sau nu au o anumită boală în curs
de investigare. Pentru astfel de clasificare, populația poate fi repartizată pe categorii într-un tabel 2 x 2
(Tabelul 1.11). Intrările A, B, C și D din tabel sunt dimensiunile celor patru combinații ale
prezenței/absenței bolii și prezenței/absenței factorului, iar numărul N la colțul din dreapta jos a
tabelului este mărimea totală a populației. Riscul relativ este
𝐴 𝐶 𝐴 (𝐶+𝐷)
RR = 𝐴+𝐵 : 𝐶+𝐷 = 𝐶 (𝐴+𝐵)
𝐴
NOTA! Riscul la cei expuşi (𝐴+𝐵) este probabilitatea ca un individ expus, sa facă boala (indiferent
din ce motiv). Se calculează pe un lot cum este cel din exemplul din tabel, ca raportul dintre numărul
celor care au făcut boala fiind expuşi (48), şi numărul tuturor celor expuşi (200). Deci, în tabelul de
mai jos, riscul la cei expuşi este de 48/200, adică de 0,24 sau 24%.
𝐶
Riscul la cei neexpuşi (𝐶+𝐷) este probabilitatea Boala
“+” prezentă “-” absentă Total
ca un individ neexpus, sa facă boala (indiferent din Expuși “+” 48 152 200
Factor
ce motiv). Se calculează pe un lot cum este cel din de risc Neexpuși “-” 36 1964 2000
Total 84 2116 2200
exemplul din tabel, ca raportul dintre numărul celor
care au făcut boala fiind neexpuşi (36), şi numărul tuturor celor neexpuşi (2000). Deci, în tabelul de
dreapta, riscul la cei neexpuşi este de 36/2000, adică de 0,018 sau 1,8%.
𝐴 𝐶 𝐴 (𝐶+𝐷)
Riscul Relativ, (RR = 𝐴+𝐵 : 𝐶+𝐷 = 𝐶 (𝐴+𝐵)) este raportul dintre riscul la cei expuşi, şi riscul la cei
neexpuşi. În tabelul de mai jos, riscul relativ este 24/1,8=13,3
Interpretare: Riscul relativ ne spune de câte ori este mai mare probabilitatea de a face boala când
eşti expus decât atunci când eşti neexpus. În tabelul de mai sus, riscul relativ fiind 13,3, înseamnă că
cei expuşi au probabilitatea de a face boala de 13,3 ori mai mare decât cei neexpuşi.
În general, valori ale riscului relativ apropiate de 1 arată aproximativ aceeaşi probabilitate de a
face boala, atât la expuşi, cât şi la neexpuşi, şi trebuie considerat că factorul de risc respectiv nu are o
influenţă reală asupra apariţiei bolii.
Dacă riscul relativ are valori mult mai mari ca 1, este o indicaţie că între factorul de risc şi boală
este o legătură de corelaţie care, de obicei este interpretată ca fiind CAUZALĂ, deşi nu este chiar
obligatoriu ca factorul de risc să fie CAUZĂ pentru apariţia bolii.
Există cazuri în care riscul relativ are valori subunitare (mai mici ca 1), caz în care este asimilat cu
un factor PROTECTOR. Aceasta deoarece, în aceste cazuri, este mai mic riscul de a face boala la cei
expuşi, decît la cei neexpuşi.
În multe situații, considerând criteriul boală, numărul de subiecți clasificați ca fiind pozitiv este mai
mic decât numărul celor clasificați negativ. Adică,
Prin urmare, riscul relativ poate fi aproximat după cum urmează:
𝐴∗𝐷 𝐴/𝐵 𝐴/𝐶
RR = = =
𝐵∗𝐶 𝐶/𝐷 𝐵/𝐷
În cazul în care bara oblică denotă divizare. Raportul rezultant, AD / BC, este un risc relativ
aproximativ, dar este adesea menționat ca raportul șanselor deoarece:
1. A/B și C/D reprezintă șansa crescută de a avea boală în grupuri, cu sau fără factor.
2. A/C și B/D reprezintă șansa crescută a expunerii la factorii pentru grupuri, cu sau fără boală. Aceste
două șanse pot fi ușor de estimat folosind studiile caz-control, prin utilizarea frecvențelor de
eșantionare. De exemplu, probabilitatea A/C poate fi estimată printr-un raport a/c, unde a reprezintă
numărul de cazuri expuse și c numărul de cazuri nonexpuse în cadrul eșantionului utilizat în cercetarea
caz-control.
Pentru multe boli rare, termenii riscului relativ și raportul șanselor sunt folosite alternativ
(interschimbabile), din cauza aproximării menționate mai sus. Desigur, acest fapt este pe deplin
acceptabil pentru a trage concluzii cu privire la o raportul șanselor fără a invoca această aproximare
pentru boala care nu este rară. Riscul relativ este un indice epidemiologic important utilizat pentru a
măsura severitatea sau mărimea efectului nociv a factorilor de risc suspectați. De exemplu, dacă noi
avem
RR = 3.0
putem spune că persoanele expuse prezintă risc de a manifesta boala, care Tabel 1.12
este de aproximativ trei ori mai mare decât riscul celor neexpuse. Valoarea Fumatul Cazuri Control
Niciodata 2 56
1,0 nu indică nici un efect, iar factorii benefici rezultă valori ale riscului Exfumator 13 80
relativ care sunt mai mici decât 1,0. Din datele obținute în studii caz- Fumator 38 81
control sau cele retrospective, este imposibil să calculăm riscul relativ Total 53 217
dorit, dar dacă este rezonabil să presupunem că boala este rară (prevalența este mai mică de 0,05, să
zicem), putem calcula raportul șanselor ca etapă și să o folosim ca un risc relativ aproximativ (folosim
notația “aproximativ: ≈ ” pentru acest scop). In aceste cazuri, vom interpreta raportul șanselor
calculată la fel cum am face cu riscul relativ.
Examplul 1.14 Rolul fumatului în etiologia pancreatitei a fost recunoscută de mai mulți ani. Pentru
a estima importanța cantitativă a acestui factor, un studiu a fost efectuat in estul Massachusetts și
Rhode Island, între 1975 și 1979. Nouăzeci și opt pacienți care au avut la externare diagnosticul de
pancreatită au fost incluși în acest studiu caz-control. Lotul martor a inclus 451 de pacienți internați cu
alte scopuri decât boli ale pancreasului și tractului biliar. Informații despre factorul de risc au fost
obținute dintr-un interviu standardizat cu fiecare subiect, realizat de un interviator antrenat.
Unele date pentru barbați sunt prezentate în tabelul 1.12. Pentru aceste date, riscul relative
aproximativ sau raportul șanselor sunt calculate după cum urmează:
a) Pentru ex-fumatori,
13/2
RRe = 80/56 = 4,55
[subscriptului e în RRe indică faptul că suntem calcularea riscului relativ (RR) pentru foștii fumători.]
b) pentru pacienții fumători,
38/2
RRc = 81/56 = 13,14
[subscriptului c din RRc indică faptul că calculăm riscului relativ (RR) pentru fumători.]
În aceste calcule, nefumatorii (care nu fumeaza) sunt folosiți ca grup de referința. Aceste valori
indică faptul că riscul de a avea pancreatită pentru fumători, este de aproximativ 13,14 ori mai mare
decât riscul pentru persoanele care nu fumează. Efectul exfumatorilor este mai mic (4,55 ori), dar este
încă foarte mare (în comparație cu 1,0, lipsa efectului pentru riscul relativ și raportul șanselor). Cu
alte cuvinte, în cazul în care fumătorii ar fi să renunțe la fumat, ei vor reduce propriul lor risc (de la
13.14 ori la 4,55 de ori), dar nu la nivel normal caracteristic persoanele care nu fumează.
NOTA! Deoarece este raportul șanselor nu este alt ceva decât raportul a două “cote”, trebuie întâi
înţeles ce înseamnă cotă. În engleză, cotele se folosesc la casele de pariuri. O cotă de 3 la 2 pentru un
eveniment, înseamnă că la acea casă de pariuri se consideră că sunt 3 şanse pentru şi 2 şanse contra
ca evenimentul să se întâmpe.Sau, două şanse să nu se întâmple, şi trei să se întâmple.
De exemplu, cota echipei României la CM de fotbal a fost într-un an de 1 la 32, adică o şansă
pentru, şi 32 contra. Atenţie, nu e corect să se spună “o şansă din 32…..”. Corect este 1 pentru şi 32
contra.
În studiile clinice, în special în studiile Caz-Martor sau, mai rar, în studiile de cohortă, se foloseşte
Odds Ratio, ca raportul între cota de îmbolnăviri la cei expuşi şi cota de îmbolnăviri la cei neexpuşi.
• Cota de îmbolnăviri la cei expuşi este raportul Boala
dintre numărul celor expuşi la care boala este “+” prezentă “-” absentă Total
Expuși “+” 50 150 200
prezentă şi numărul celor expuşi la care boala este Factor Neexpuși “-” 40 1960 2000
de risc
absent (A/B) Total 90 2110 2200
• Cota de îmbolnăviri la cei neexpuşi este raportul dintre numărul celor neexpuşi la care boala este
prezentă şi numărul celor neexpuşi la care boala este absent (C/D)
În tabelul de mai sus, cotele de îmbolnăviri sunt: la cei expuşi 50/150, adică de 1 la 3, iar la
neexpuşi de 40/1960, adică de 1 la 49.
𝐴∗𝐷
Raportul celor două cote, adică Odds Ratio (OR = 𝐵∗𝐶 ), este raportul dintre 1/3 şi 1/49, adică
49/3=16.3
Ca şi interpretare, valori apropiate de 1, arată cote asemănătoare, cea ce înseamnă că expunerea
nu influenţrază prezenţa bolii. Valori mult peste 1, arată o tendinţă de corelaţie între prezenţa
expunerii şi a bolii la pacienţi, corelaţie care este considerată de obicei ca fiind CAUZALĂ, deşi nu
totdeauna este cazul.
Valori mult sub 1 arată tot o corelaţie, dar în acest caz, expunerea este considerată un factor de
PROTECŢIE.
4.3 Șanse (Odds) generale pentu tabele 2xk
In această secțiune vom generaliza conceptul de raportul șanselor pentru variabile ordinale, care
sunt folosite în cercetări biomedicale.
O variantă de generalizare constă în interpretarea raportul șanselor ca șansele pentru un alt
eveniment. De exemplu, luăm în considerare din nou tabelul 2 x 2 utilizat în secțiunea 4.2 (Tabelul
1.11). Numărul de perechi de caz-control, cu istorii diferite de expunere este (AD + BC); printre
acestea, perechile AD cu un caz expus și perechi BC cu un control expus. Prin urmare, raportul
șanselor AD / BC în secțiunea 4.2, poate fi interpretată ca șansele de a găsi o pereche cu un caz expus
între perechi discordante (o pereche discordantă este o pereche cu istorii diferite).
Interpretarea de mai sus a noțiunii de raportul șanselor ca șansele poate fi generalizată după cum
urmează. Scopul este de a prezenta o metodă eficientă pentru utilizarea tabelelor eventuale 2 x k:
tabele cu două rânduri și k coloane având o anumită ordonare naturală. Imaginea sumară este
generalizarea termenului probabilitate pornind de la termenul de raportul șanselor. Propunem să
analizănm un studiu în ceea ce privește utilizarea centurilor de siguranță în automobile. Fiecare
accident în acest exemplu este clasificat în funcție dacă s-a utilizat o centură de siguranță și la
severitatea leziunilor: fară leziuni, minore, majore sau deces (Tabelul 1.13).
Pentru compararea severității leziunilor la cei care au Tabel 1.13
folosit centurile de siguranță cu cei care nu le-au folosit, Leziuni
Fară Minoră Majoră
putem calcula procentul de utilizatori a centurilor de siguranță Centura Da 75 160 100
Deces
15
în fiecare grup, care scade de la nivelul ''fără'' la nivelul Nu 65 175 135 25
''deces'':
75
Fără: 75+65 = 54%
160
Minoră: = 48%
160+175
100
Majoră: = 43%
100+135
15
Deces: 15+25 = 38%
Ceea ce vedem aici este o tendință (trend) sau o asociere ce indică faptul că cu cît mai mic este
procentul de utilizatori a centurii de siguranță, cu atât mai severe sunt leziunile. Acum vom prezenta
conceptul de șansele generalizate, o statistică specială formulată în mod specific pentru a măsura
gradul unei astfel de tendințe folosind același exemplu și un altul pentru a ilustra utilizarea
conceptului. În general, se ia în considerare tabelul 2 x k cu frecvențele prezentate în tabelul 1.14.
Numărul de concordanțe este calculat: Tabel 1.14
C = a1(b2 + … + bk) + a2(b3 + … + bk) + … + ak- Coloane
Rîndul 1 2 … k Total
1xbk 1 a1 a 2 … ak A
(Termenul perechea de concordanță așa cum 2 b1 b2 … bk B
Total n 1 n2 … nk N
este utilizat mai sus corespunde unei leziuni mai
puțin severe pentru utilizatorul centurii de siguranță.)
Numărul de discordanțe:
D = b1(a2 + … + ak) + b2(a3 + … + ak) + … + bk-1x ak
Pentru a măsura gradul de asociere, folosim indicele C / D, numit șansele generalizate; în cazul în
care există doar două niveluri de leziuni, acest indice nou este redus la raportul șanselor. Atunci când
datele sunt aranjate în mod corespunzător, printr-o ipoteză a priori, rezultatele numărului perechi de
concordanță C (de exemplu, a1b2), variază de la mai mari pe stânga spre mai mici pe dreapta, iar
rezultatele din numărul de perechi de discordanță D (de exemplu, b1a2) se schimbă în direcție opusă.
În această ipoteză coloana 1 este asociată cu rândul 1; În exemplul de mai sus, utilizarea centurii de
siguranță (da, în primul rând) ipotetic este asociată cu leziuni mai puțin grave (nici unul, prima
coloană). În conformitate cu această ipoteză șansele generalizate este mai mare decât 1.
Examplul 1.15 Pentru studiul de mai sus cu privire la utilizarea centurilor de siguranță în
automobile, am folosit datele prezentate în tabelul 1.13,
C = 75 (175 + 135 + 25) + 160 (135 + 25) + 100 x 25
D = 65 (165 + 100 + 15) + 175 (100 + 15) + 135 x 15
ceea ce duce la șansele generalizate
С 53,225
θ = D = 40,025 = 1.33
Pentru două persone cu leziuni diferite, șansele generalizate că persoana Tabel 1.15
cu leziuni mai severe nu utilizează centura de siguranță este 1.33. Cu alte Vârsta Cazuri Control
15 16
cuvinte, persoanele cu leziuni mai severe, au șansele mai mari decât 14-17
18-19 22 25
persoanele cu leziuni mai puțin grave să fie cei care nu au folosit centura de 20-24 47 62
siguranța. 25-29 56 122
≥30 35 78
Următorul exemplu ilustrează utilizarea probabilității generale în studiile
caz-control, cu factor de risc măsurat în scala ordinală.
Exemplul 1.16 Un studiu caz-control al epidemiologiei nașterii premature, definită ca fiind una cu
mai puțin de 37 de săptămâni de gestație, a fost efectuata la Yale-New Haven Hospital din
Connecticut, în 1977. Populația de studiu a constat din 175 mame ce au născut (sarcina una fetală)
prematur și 303 mame ce au născut (sarcina una fetală) la termen. Tabelul 1.15 oferă distribuția vârstei
mamei. Respectiv, avem:
C= 15 (25 + 62 + 122 + 78) + 22 (62 + 122 + 78) + 47 (122 + 78) + 56 x 78 = 23,837
D = 16 (22 + 47 + 56 + 35) + 25( 47 + 56 + 35) + 62 (56 + 35) + 122 x 35 = 15,922
ceea ce duce la șansele generalizate de
С 23,837
θ = D = 15,922 = 1.5
Acest lucru înseamnă că probabilitatea ca o mamă tânără să nască prematur este 1.5. Cu alte cuvinte,
mamele mai tinere ar fi mai susceptibile de a avea o naștere prematură.
Următorul exemplu arată utilizarea probabilității generale pentru tabele de contingență cu mai mult
de două rânduri de date.
Exemplul 1.17 Tabelul 1.16 prezintă Tabel 1.16
rezultatele unui studiu în care fiecare Politica
subiect al unui eșantion de 282 de adulți au Nivelul de educație Fumez Fumez în
Nu fumez Total
fără restricții lucul destinat
fost rugați să indice politica pe care o Școala primara 15 40 10 65
susține dintre cele trei opțiuni prezentate în Școala superioară 15 100 30 145
Colegiu 5 44 23 72
ceea ce privește fumatul în locurile publice. Total 35 184 63 282
Am obținut:
C = 15 (100 + 30 + 44 + 23) + 40 (30 + 23) + 100 x 23 = 8230
D = 5 (100 + 30 + 40 + 10) + 44 (30 +10) + 100 x 10 = 4410
ceea ce duce la probabilitatea generală de:
С 8,230
θ = D = 4,410 = 1.90
Acest lucru înseamnă că probabilitatea, ca o persoana mai educată, adeptă restricțiilor pentru
fumatul in locurile publice, este 1.90. Cu alte cuvinte, persoanele cu studii superioare ar prefera
restricții privind fumatul în locuri publice.
4.4 Metoda Mantel-Haenszel
In majoritatea investigațiilor ne interesează un singur efect, cum ar fi o boală, care se concentrează
pe un singur factor de risc primar, cum ar fi o expunere cu posibil efect dăunător. Cu toate acestea,
există situații în care un anchetator dorește să ajusteze rezultatul la un factor de confuzie care ar putea
influența o analiză statistică. Un factor de confuzie sau variabilă de confuzie, este o variabilă care
poate fi asociată fie cu boala, sau cu expunerea, sau cu ambele. În exemplul 1.2, un studiu caz-control
a fost efectuat pentru a investiga relația dintre cancerul pulmonar și ocuparea forței de muncă în
șantierele navale pe timpul Celui de-al Doilea Război Mondial, în rândul locuitorilor de sex masculin
din Georgia de coastă. In acest caz, fumatul este un potențial factor de confuzie; fumatul poate fi
asociat atât cu cancerul pulmonar, cât și cu locul de muncă, deoarece muncitorii din construcții sunt
susceptibil la a fi fumători. Mai exact, vrem să știm:
(a) printre fumători, dacă construcțiile navale și cancerul pulmonar sunt sau nu asociate
(b) printre nefumatori, dacă construcțiile navale și cancerul pulmonar sunt sau nu asociate
De fapt, datele originale au fost tabelate separat pentru trei Tabel 1.17
niveluri de fumat (nefumatori, fumatul moderat si fumatul grav); în Expunere Clasificarea bolii
+ - Total
exemplul 1.2, ultimele două tabele au fost combinate și prezentate + a b r 1
Total
fumatul, nu este un modificator de efect (adică, fumatul nu afecteaza
1 2
relațiile între cancerul pulmonar și construcții de nave), cu toate acestea, noi nu dorim să facem
concluzii separate, câte una la fiecare nivel de fumat. În acest caz, dorim să reunim date pentru o
decizie combinată. Când atât boala, cât si expunerea sunt binare, se utilizează o metodă populară întru
realizarea acestei sarcini: metoda Mantel-Haenszel. Această metodă oferă o estimare unică pentru rata
probabilității și poate fi rezumată după cum urmează:
1. Formarea tabelului 2 x 2, câte unul la fiecare nivel al factorului de confuzie.
2. Utilizarea datelor prezentate în tabelul 1.17, pentru fiecare nivel al factorului de confuzie.
Deoarece noi considerăm că factorul de confuzie nu este un modificator de efect, raportul șanselor
este constant peste nivelurile sale (la cei care fumează si cei care nu). Raportul șanselor la fiecare nivel
este estimată prin ad/bc; procedura Mantel-Haenszel combină datele de la toate nivelurile ale
factorului de confuzie pentru a obține o estimare combinată (un fel de medie ponderată pentru raportul
șanselor a diferitor nivele specifice):
∑ 𝑎𝑑/𝑛
ORMH= ∑ 𝑏𝑐/𝑛
Exemplul 1.18 Un studiu caz-control a fost efectuat Tabel 1.18
pentru a identifica cauzele pentru rata excepțional de mare Fumatul Construcția Caz Control
Nu Da 11 35
a cancerului pulmonar intre locuitorii de sex masculin din Nu 50 203
Georgia de coastă, așa cum este prezentat pentru prima dată Moderat Da 70 42
Nu 217 220
în Exemplul 1.2. Factorul principal de risc în curs de Intensiv Da 14 3
investigare a fost ocuparea forței de muncă în șantierele Nu 96 50
navale în timpul Celui de-al Doilea Război Mondial, iar Tabel 1.19
Construcții Caz Control Total
datele sunt tabelate separat pentru trei niveluri de fumat Da 11 (a) 25 (b) 46 (r1)
(Tabelul 1.18). Nu 50 (c) 203 (d) 253 (r2)
Total 61 (c ) 238 (c ) 299 (n)
Sunt trei tabele 2 x 2, câte unul pentru fiecare nivel de
1 2
fumat. Vom începe cu tabelul 2 x 2 pentru nefumători (Tabelul 1.19). Pentru nefumatori avem
ad/n = (11 x 203)/299 = 7.47
bc/n= (35 x 50)/299 =5.85
Procesul se repetă pentru fiecare dintre celelalte două nivele de fumat.
Pentru fumatul moderat:
ad/n = (70 x 220)/549 = 28.05
bc/n = (42 x 217)/549 = 16.60
și pentru fumatul intensiv:
ad/n = (14 x 50)/163 = 4.29
bc/n = (3 x 96)/163 = 1.77
Aceste rezultate sunt combinate pentru a obține o estimare combinată a raportul șanselor:
ORMH = (7.47 + 28.05 + 4,28) / (5.85 + 16.60 + 1.77) = 1.64
Această estimare combinată a raportul șanselor: 1.64, reprezintă Tabel 1.20
o creștere de aproximativ 64% a riscului de cancer pulmonar Fumatul OC Caz Control
Nu Da 4 52
pentru cei angajați în industria navală. Nu 34 754
Urmează un exemplu similar care vizează efectele posibile a Da Da 25 83
Nu 171 853
utilizării contraceptivelor orale asupra infarctului miocardic.
Prezentarea a fost prescurtată, păstrând doar datele cheie. Tabel 1.21
Fumatul
Exemplul 1.19 Un studiu caz-control a fost efectuat pentru a - +
investiga relația dintre infarctul miocardic (IM) și utilizarea ad/n 3.57 18.84
bc/n 2.09 12.54
contraceptivelor orale (OC). Datele, stratificate pentru fumat,
sunt prezentate în tabelul 1.20. Aplicarea procedurii Mantel-Haenszel evidențiaza rezultatele
prezentate în tabelul 1.21. Rata probabilității combinate este
ORMH = (3,57 + 18,84) / (2,09 + 12,54) = 1.53
reprezentând o creștere aproximativă de 53% a riscului de infarct miocardic pentru utilizatorii de
contraceptive orale.
4.5 Raportul standardizat al mortalității
In studiul de cohorta, ratele de deces cercetate sunt calculate și utilizate pentru a descrie experiența
de mortalitate a cohortei în curs de investigare. Cu toate acestea, mortalitatea observată în cohorta este
adesea comparată cu cea așteptată din ratele de deces ale populației naționale (utilizată ca standard sau
de referință). La baza acestei metode este compararea numărului de decese observate, d, la cohorta cu
mortalitatea care ar fi fost prevăzută, dacă grupul prezintă rate de deces similare cu cele ale populației
naționale din care face parte cohorta. Dacă e denota numărul prevăzut de decese; atunci comparația se
bazează pe următorul raport, denumit raport standardizat de mortalitate:
SMR = d / e
Numărul așteptat de decese se calculează pe baza tabelelor naționale, iar calculul poate fi aproximat
după cum urmează:
e≈λxT
unde T este timpul total de urmărire (persoane-ani) din cohorta și λ rata anuală de deces din populația
de referință. Desigur, rata anuală de deces a populației de referință se schimbă odată cu vârsta. Prin
urmare, ceea ce facem de fapt în cercetare este mai complicat, deși se bazează pe aceeași idee. În
primul rând, noi subdivizam cohorta în mai multe grupe de vârstă, apoi calculăm λT pentru fiecare
grupă de vârstă, utilizând rata specifică corectă de vârstă pentru fiecare grupa și adăugăm rezultate.
Exemplul 1.20 7000 de muncitori britanici Tabel 1.22
Ani de la intrarea în industrie
expuși la monomerul clorurii de vinil au fost Decese cauzate
urmăriți timp de mai mulți ani pentru a de cancer
1-4 5-9 10-14 15+ Total