Sunteți pe pagina 1din 89

Capitolul 1 EXERCIȚII 1.1 – 1.

46

METODE DESCRIPTIVE PENTRU DATE DISCRETE

Cele mai multe cărți introductive în statistică și biostatistică pornesc cu metodele


pentru centralizarea și prezentarea datelor continue.

Aici vom adopta un alt mod de abordare, ca urmare a faptului că ne adresăm


domeniului științelor biomedicale, deciziile în sănătate fiind frecvent bazate pe
proporții, rații sau rate.

În primul capitol vom vedea cum aceste concepte fac apel la simțul practic și vom
învăța ce semnificații au și cum se folosesc.
18.02.2018 1
1.1. PROPORȚII

Multe rezultate pot fi clasificate ca aparținând uneia din două categorii: prezență
sau absență, alb sau non-alb, bărbat sau femeie, îmbunătățit sau neîmbunătățit.

Bine înțeles, una dintre aceste două categorii este uzual identificată ca fiind de prim
interes: de exemplu, prezența în clasificarea prezent/absent, non-alb în clasificarea
alb/non-alb.

În general, putem redenumi cele două categorii de rezultate ca pozitiv (+) și negativ
(–).

Un rezultat este pozitiv (+) dacă este observată prima categorie și negativ (–) dacă
este observată cea de-a doua categorie.

18.02.2018 2
În concluzia pentru caracterizarea observațiilor făcute asupra unui grup de oameni,
numărul 𝒙 de rezultate pozitive nu este suficient; mărimea grupului 𝒏, sau numărul
total de observații, trebuie, de asemenea, să fie înregistrat.

Numărul 𝑥 ne spune foarte puțin și devine semnificativ doar după ajustarea conform
mărimii 𝑛 a grupului; cu alte cuvinte cele două mărimi menționate 𝒙 și 𝒏 sunt deseori
combinate într-o (mărime) statistică, denumită proporție:

𝑥
𝑝=
𝑛

Termenul (mărimea) statistică semnifică un număr ce rezumă datele observate.

În mod clar, 0 ≤ 𝑝 ≤ 1. Această proporție 𝑝 este uneori exprimată ca procent și se


calculează cu:
𝑥
proporție % = (100)
𝑛
18.02.2018 3
Exemplul 1.1 Un studiu1 a urmărit 12.915 elevi din clasele 7-122.

Raportul stabilește că elevii aparținând minorităților, cam o treime din grup, sunt mai
rar în situația de a fi efectuat recent un control de sănătate, de rutină.

Dintre elevii de origine asiatică, 25,4% au spus că nu fost consultați de un doctor sau
dentist în ultimii doi ani, urmați de 17,7% dintre nativii americani, 16,1% negrii și
10% dintre hispanici. Printre albi, procentul a fost de 6,5%.

1 publicat de Urban Coalition of Minneapolis și University of Minnesota Adolescent Health Program


2 din școlile publice din Minneapolis și St. Paul

18.02.2018 4
Proporția este un număr folosit pentru a în conformitate cu
o (cu caracter binar), care este .

Este de menționat că, pentru caracteristicile cu categorii multiple, se poate aplica


dihotomia prin extragerea unor categorii pentru a forma una nouă și astfel se poate
aplica conceptul de proporție.

Următoarele câteva exemple de utilizare a proporțiilor în științele sănătății vor fi


ilustrative.

18.02.2018 5
1.1.1 Studii comparative

Studiile comparative intenționează să arate posibilele diferențe între două sau mai
multe grupuri; Exemplul 1.1 reprezintă un astfel de studiu comparativ tipic.

Urmărirea citată în Exemplul 1.1 ne oferă și cifrele privind băieții din grup, care
fumează cel puțin o dată pe săptămână.

Dintre asiatici au fost 9.7%, urmați de 11.6% pentru negrii, 20.6% pentru hispanici,
25.4% pentru albi și 38.3% pentru nativii americani.

Suplimentar fată de urmăriri care se desfășoară (pe orizontală), așa cum se


vede în Exemplul 1.1, datele pentru studii comparative pot proveni din surse diferite;
cele două planuri fundamentale sunt cel și cel .

18.02.2018 6
culeg date anterioare, din cazuri selectate și din controale pentru
determinarea diferențelor, dacă există, în raport cu un factor de risc suspectat.

Acestea sunt de obicei denumite studii de tip caz/control; fiecare studiu este axat pe o
anumită afecțiune.

Într-un studiu tipic de caz/control,

unei afecțiuni specifice sunt precizate așa cum vin din registrele de bază
ale populației sau din listele internărilor în spital, iar

sunt eșantionate
fie pe persoane fără afecțiunea respectivă din populația cu risc,
fie pe pacienți spitalizați având un diagnostic diferit de cel aflat în studiu.

18.02.2018 7
Avantajele unui studiu retrospectiv sunt legate de faptul ca este mai ieftin și oferă
răspunsuri problematicii de cercetare relativ rapid, deoarece cazurile sunt deja
disponibile.

Limitările majore se datorează

lipsei de acuratețe a studiilor vechi și

incertitudinii privind oportunitatea probelor de control.

Aceste probleme constituie o piedică pentru folosirea studiilor


retrospective și le fac mai puțin preferate decât studiile prospective.

18.02.2018 8
Urmează un exemplu de studiu retrospectiv privind domeniul sănătății ocupaționale.

TABELUL 1.1 Fumător Construcții Cazuri Controale


navale
Nu Da 11 35
Nu 50 203
Da Da 84 45
Nu 313 270

Exemplul 1.2 Un studiu de tip caz/control a fost inițiat pentru a identifica motivele
incidenței extraordinar de mare a cancerului de plămâni la bărbați3.

Cazurile au fost identificate din următoarele surse:


(a) Cazuri diagnosticate până în 1970 la singurul mare spital din Brunswick
(b) Cazuri diagnosticate în perioada 1975-1976 la trei spitale mari din Savannah
(c) Certificatele de deces din perioada 1970-1974 din zonă.
3rezidenți în zona coastei statului Georgia

18.02.2018 9
Controalele au fost selectate de la camerele de gardă din cele patru spitale și din
certificatele de deces din aceeași perioadă pentru alte cauze decât cele datorate
cancerului de plămâni, de vezică/prostată sau celui cronic de plămâni.

Datele au fost tabelate separat pentru fumători și nefumători (Tabelul 1.1).

Referirea la „construcții navale” se referă la personalul angajat în șantierele navale în


timpul celui de-al doilea război mondial.

Prin folosirea unei tabelări separate, cu prima jumătate de tabel pentru nefumători și
cea de-a două jumătate pentru fumători, am tratat condiția fumător ca un potențial
element de confuzie.

18.02.2018 10
Un este un factor (o expunere prin ea însăși) neaflat sub
investigare dar legat de (aici, cancerul de plămâni) și determinat
de o (construcții navale);
au evidențiat , iar
sunt de cele mai multe ori .

Termenul este folosit aici pentru a sublinia că angajarea în șantierele navale


reprezintă un ; totuși, termenul este folosit și în studii în care factorul
investigat are efecte benefice.

18.02.2018 11
Într-o examinare a fumătorilor din setul de date din Exemplul 1.2, numărul
persoanelor angajate în șantiere navale, 84 și 45, este mic deoarece mărimile celor
două grupuri, cazuri și controale, sunt diferite.
Fumător Construcții navale Cazuri Controale
Nu Da 11 35
Nu 50 203
Da Da 84 45
Nu 313 270

Ajustând aceste valori absolute pentru mărimile grupurilor (397 cazuri și 315
controale), obținem:

Pentru controale,
45
proporția de expunere =
315
= 0,143 sau 14,3%
Pentru cazuri,
84
proporția de expunere =
397
= 0,212 sau 21,2%
18.02.2018 12
Rezultatele relevă istorii de expunere diferite: proporția în rândul cazurilor a fost mai
mare decât în rândul controalelor.

Aceasta nu este o dovadă concludentă, dar este un bun punct de reper, indicând o
posibilă legătură între boală (cancerul de plămân) și expunere (construcții navale).

Examinări similare ale datelor pentru nefumători arată că luând în considerație


numărul de cazuri și de controale, vom avea următoarele valori pentru angajații în
construcții navale:
Pentru controale,
35
proporția de expunere = = 0,147 sau 14,7%
238
Pentru cazuri,
11
proporția de expunere = = 0,180 sau 18,0%
61
Fumător Construcții navale Cazuri Controale
Nu Da 11 35
Nu 50 203
Da Da 84 45
Nu 313 270
18.02.2018 13
Aceste rezultate relevă, de asemenea, : printre
a fost decât printre .

Analizele de mai sus arată de asemenea


, adică,
21,2 − 14,3 = 6,9%

este diferită de , care este


18,0 − 14,7 = 3,3%

Diferențele, 6,9% și 3,3%, sunt măsuri ale intensității legăturii dintre afecțiune și
expunere, câte una pentru fiecare formațiune: cele două grupuri de fumători și
respectiv nefumători.

18.02.2018 14
Calculele de mai sus arată că posibilele efecte ale angajării în șantiere navale (ca un
susceptibil factor de risc) sunt diferite pentru fumători și nefumători.

Această diferență a diferențelor, dacă este confirmată, este numită interacțiune cu trei
elemente sau modificarea efectului, unde
.

În acest caz, fumatul este , dar și un modificator de


efect, care modifică efectul lucrului într-un șantier naval (asupra posibilității de a avea
cancer la plămâni).

18.02.2018 15
Exemplul 1.3 Datele persoanelor înregistrate cu orbire datorată glaucomului sunt
listate în Tabelul 1.2.

TABELUL 1.2
Populația Cazuri Cazuri la 100.000
Albi 32.930.233 2832 8,6
Non-albi 3.933.333 3227 82,0

Pentru aceste date înregistrate ale unei boli, calculele directe ale unei proporții conduc
la o fracție foarte mică, adică numărul de cazuri de boală pe persoană ca risc.

Pentru comoditate, acesta este înmulțit cu 100.000 și astfel rezultatul exprimă


incidența (numărul de cazuri) la 100.000 de oameni.

18.02.2018 16
Acest set de date oferă un exemplu de utilizare a proporțiilor privind răspândirea
(prevalența) bolii, care este definită ca

numărul de persoane bolnave la momentul investigaţiei


răspândirea =
numărul total de persoane examinate

Răspândirea bolii și conceptele legate de aceasta sunt discutate în detaliu în Secțiunea


1.2.2.

Pentru orbirea datorată glaucomului, calculele din Exemplul 1.3 relevă o diferență
izbitoare între rase:

prevalența orbirii este printre non-albi a fost de opt ori mai mare decât printre albi.

Numărul „100.000” a fost ales arbitrar; orice putere a lui 10 poate fi potrivită pentru obține
de exemplu un rezultat între 1 și 100 sau uneori între 1 și 1000; este mai ușor să stabilim ca
rezultat „82 de cazuri din 100.000” decât să spunem că prevalența este 0,00082.
18.02.2018 17
1.1.2 Testul Screening

Alte utilizări ale proporțiilor pot fi găsite în evaluarea testelor screening sau a
procedurilor de diagnosticare.

Conform acestor proceduri pentru observațiile clinice sau tehnicile de laborator,


populația este clasificată în sănătoasă sau incluzându-se într-una dintr-un număr
de categorii de afecțiuni.

Astfel de teste sunt importante în medicină și studiile epidemiologice și pot constitui


baza unor intervenții ulterioare.

Aproape toate aceste teste sunt imperfecte, în sensul că


, în timp ce
.

Ăsta e adevărul, clasificările incorecte sunt inevitabile.


18.02.2018 18
Să presupunem că fiecare persoană dintr-o populație mare poate fi clasificată pozitiv
sau negativ pentru o afecțiune particulară;
această diagnosticare clară poate fi bazată pe metode mai rafinate decât cele folosite în
test sau se poate baza pe evidența ce derivă din trecerea timpului (adică la autopsie).

Pentru fiecare clasă din populație, bolnavi sau sănătoși, se aplică testul, cu rezultatele
prezentate în Figura 1.1.

Populaţia în general
Bolnavi

Sănătoşi

Figura 1.1 Reprezentarea grafică a testului screening

18.02.2018 19
Cele două proporții fundamentale pentru evaluarea procedurilor diagnostice sunt
sensibilitatea și specificitatea.

Sensibilitatea este proporția de persoane bolnave detectate ca pozitive prin test:

numărul de persoane bolnave identificate eronat ca sănătoase


𝐬𝐞𝐧𝐬𝐢𝐛𝐢𝐥𝐢𝐭𝐚𝐭𝐞𝐚 =
numărul total de persoane bolnave

Erorile corespunzătoare sunt fals negative.

Specificitatea este proporția de persoane sănătoase detectate ca negative prin test:

numărul de persoane sănătoase identificate eronat ca bolnave


𝐬𝐩𝐞𝐜𝐢𝐟𝐢𝐜𝐢𝐭𝐚𝐭𝐞𝐚 =
numărul total de persoane sănătoase

Erorile corespunzătoare sunt fals pozitive.


18.02.2018 20
În mod clar, este de dorit ca un test sau o procedură screening să fie puternic sensibilă
și puternic specifică.

Totuși, cele două tipuri de erori se deplasează în direcții opuse;

de exemplu, un efort de a crește sensibilitatea poate conduce la mai multe


erori fals pozitive și invers.

18.02.2018 21
Exemplul 1.4 A fost realizat un test citologic pentru a releva (separa) femeile cu cancer
de col uterin.

A fost considerat un grup de 24.103 de femei constând din:


379 de femei al căror col a fost anormal (cu o dezvoltare suficientă pentru a
justifica preocuparea în legătură cu un posibil cancer) și
23.724 de femei al căror col a putut fi considerat sănătos.

A fost aplicat un test și rezultatele sunt prezentate în Tabelul 1.3.


(Studiul a fost realizat cu un test destul de vechi și este folosit doar pentru ilustrare.)

TABELUL 1.3
Test
Valoarea de adevăr – + Total
– 23.362 362 23.724
+ 225 154 379

18.02.2018 22
Calculele arată că
154
sensibilitatea = = 0,406 sau 40,6%
379

23.362
specificitatea = = 0,985 sau 98,5%
23.724

testul are o specificitate ridicată (98,5%), dar nu este foarte sensibil (40,6%); mai mult
de jumătate din rezultate (59,4%) sunt fals negative.

Concluziile folosirii acestui test sunt:

• Dacă o femeie fără cancer de col uterin este testată, rezultatul va fi aproape sigur
negativ, dar
• Dacă o femeie cu cancer de col uterin este testată, există șansa ca această afecțiune
să nu fie detectată deoarece 59,4% din aceste cazuri conduc la rezultate fals
negative.
18.02.2018 23
Este important să remarcăm că în această secțiune proporțiile au fost folosite astfel
încât atât numărătorul cât și numitorul sunt rezultate măsurate sau frecvențe;
numărătorul corespunde unui subgrup din grupul mai mare implicat la numitor,
rezultând astfel un număr cu valori între 0 și 1 (sau între 0 și 100%).

Generalizarea acestui concept este directă pentru utilizarea sa în cazul caracteristicilor


având mai mult de două categorii de observații rezultate; pentru fiecare categorie
vom defini o proporție și aceste proporții specifice categoriei se adaugă până la 1
(sau 100%).

Exemplul 1.5 O examinare a unui grup de 668 de copii raportați ca având aparținători
dependenți de droguri, a evidențiat că 70% au fost negri, urmați de 18% albi, 8%
nativi americani și 4% alții sau necunoscuți.

18.02.2018 24
1.1.3 Prezentarea proporțiilor
Probabil modul cel mai eficient și convenabil de prezentare a datelor, în special a celor
discrete, este prin realizarea de grafice.

Graficele exprimă informația, tendința generală dintr-un set de date, dintr-o singură
privire.

Ca urmare, graficele sunt de cele mai multe ori mai lesne de analizat decât tabelele;
cele mai multe grafice informative sunt simple și edificatoare.

Bineînțeles că, pentru a atinge acest obiectiv, graficele trebuie să fie construite cu
atenție.

Ca și tabelele, ele trebuie să fie etichetate explicit și să aibă incluse unitățile de măsură
și/sau trebuie să fie inclusă mărimea cantităților.

Nu uitați că graficele trebuie să se descrie singure; trebuie să se autocompleteze și


trebuie să aibă un titlu, fără explicații suplimentare.
18.02.2018 25
Harta de bare

Harta de bare este foarte folosită pentru a ilustra câteva proporții pentru comparație
rapidă.

În cazul aplicațiilor potrivite pentru acest tip de reprezentare, sunt câteva grupuri și
investigăm o caracteristică binară.

Într-o hartă de bare, diferitele grupuri sunt reprezentate de-a lungul axei orizontale;
ele pot fi aranjate alfabetic, după mărimea proporțiilor sau conform unei alte baze
raționale.

O bară verticală este desenată deasupra fiecărui grup, astfel că înălțimea barei este
proporțională cu proporția asociată acelui grup.

Barele trebuie să fie de lățime egală și trebuie să fie separate una de alta astfel încât să
nu implice o idee de continuitate.
18.02.2018 26
Exemplul 1.6 Putem prezenta setul de date cu observații asupra copiilor fără control
medical recent (Exemplul 1.1) printr-o hartă cu bare, așa cum se vede în Figura 1.2.

Figura 1.2 Copii fără un control medical recent.

18.02.2018 27
Harta plăcintă (pie)

Harta plăcintă este un alt tip extrem de popular de grafic.

În aplicațiile care se pretează unor astfel de reprezentări grafice, este vorba de un


singur grup pe care vrem să-l descompunem în câteva categorii.

O hartă plăcintă constă dintr-un cerc; cercul este divizat în sectoare care corespund
mărimii proporțiilor diferitelor categorii.

O hartă plăcintă arată diferențele dintre mărimile diferitelor categorii sau subgrupuri
ca o descompunere a totalului.

Această reprezentare este potrivită, de exemplu, pentru prezentarea unui buget, la


care putem observa rapid diferențele cheltuielile aferente sănătății și cele pentru
apărare sau servicii secrete.
18.02.2018 28
Cu alte cuvinte, o hartă cu bare este potrivită atunci când avem mai multe grupuri,
fiecare asociat cu unor proporții diferite, în timp ce o hartă plăcintă este mai
potrivită atunci când este vorba de un grup care este divizat în mai multe
categorii.

Proporțiile diferitelor categorii dintr-o hartă plăcintă se însumează până la 100%.

Ca și în cazul hărților cu bare, categoriile dintr-o hartă plăcintă sunt uzual aranjate
după mărimea proporțiilor.

Ele pot fi însă aranjate și alfabetic sau după altă bază rațională.

18.02.2018 29
Figura 1.3 Copii ce trăiesc în familii dependente de droguri

Exemplul 1.7 Putem reprezenta setul de date privind copii ce trăiesc în familii cu
dependenți de droguri (Exemplul 1.5) printr-o hartă plăcintă, așa cum se observă în
Figura 1.3.

Un alt exemplu de utilizare a hărții plăcintă este pentru reprezentarea proporțiilor


deceselor din diferite cauze.
18.02.2018 30
Exemplul 1.8 Tabelul 1.4 listează numărul deceselor datorită diferitelor cauze printre rezidenții
din Minnesota pentru anul 1975.
După calculul proporțiilor decesele pentru fiecare cauză: de exemplu,

6448
decese datorate cancerului = = 0,197 sau 19,7%
32.686

putem reprezenta rezultatele prin harta plăcintă din Figura 1.4.

TABELUL 1.4
Cauza decesului Numărul deceselor
Afecțiuni cardiace 12.378
Cancer 6.448
Afecțiuni cerebrale 3.958
Accidente 1.814
Altele 8.088
Total 32.686
Figura 1.4 Cauzele deceselor în rândul
rezidenților din Minnesota, 1975.
18.02.2018 31
Grafice cu linii

Un grafic cu linii este similar unei hărți cu bare, în care însă axa orizontală reprezintă
timpul.

În aplicațiile cele mai potrivite pentru reprezentarea prin grafice cu linii,


o caracteristică binară este observată repetat în timp.

Diferite „grupuri” reprezintă anii consecutivi, astfel că un grafic cu linii este potrivit
pentru ilustrarea modului în care anumite proporții se schimbă în timp.

Într-un grafic cu linii, proporția asociată fiecărui an este reprezentată printr-un punct
la înălțimea adecvată; punctele sunt apoi interconectate prin linii drepte.

18.02.2018 32
Exemplul 1.9 Între anii 1984 și 1987, ratele brute ale deceselor în rândul femeilor din
Statele Unite sunt prezentate în Tabelul 1.5.
Evoluția acestor rate poate fi reprezentată prin graficul cu linii prezentat în Figura 1.5.

TABELUL 1.5
Rata brută a deceselor
Anul la 100.000
1984 792,7
1985 806,6
1986 809,3
1897 813,1

Suplimentar folosirii lor cu proporțiile, graficele cu linii pot fi folosite pentru a descrie
schimbările numărului de apariții și cu măsurătorile continue.
18.02.2018 33
Exemplul 1.10 Graficul cu linii prezentat în Figura 1.6 prezintă tendința în ratele
malariei raportate în US în perioada 1940-1989 (proporția la 100.000 ca mai sus).

18.02.2018 34
1.2. RATE
Termenul rată creează cumva confuzie:
- uneori este folosit în locul termenului proporție așa cum a fost definit în Secț. 1.1;
- alteori el se referă la o cantitate de cu totul altă natură.

În Secțiunea 1.2.1, care se referă la rata schimbării, vom discuta despre astfel de
situații, iar în Secțiunile următoare, 1.2.2 și 1.2.3, ne vom concentra pe ratele folosite
interschimbabil cu proporțiile ca măsuri ale morbidității și mortalității.

Chiar când ne referim la aceleași lucruri – măsuri ale morbidității și mortalității –


există anumite diferențe între cei doi termeni.

În contrast cu natura statică a proporțiilor, ratele au ca scop măsurarea aparițiilor


evenimentelor după o anumită perioadă de timp.

18.02.2018 35
1.2.1 Schimbări
Exemplele obișnuite pentru rate includ folosirea lor pentru a descrie schimbări după o
anumită perioadă de timp.

Rata schimbării este definită prin

noua valoare − vechea valoare


rata schimbării % = × 100
vechea valoare

În general, ratele schimbărilor pot depăși 100%.

Ele nu sunt proporții (o proporție este un număr între 0 și 1 sau între 0 și 100%).

Ratele schimbărilor sunt folosite în primul rând pentru descriere și nu sunt implicate
în analizele statistice uzuale.

18.02.2018 36
Exemplul 1.11 Mai jos avem un raport tipic de prezentare a știrilor:

În 1989, a fost raportat un număr de 35.238 de cazuri noi de SIDA de către Centrul
de Control al Afecțiunilor (CDC), în comparație cu 32.196 raportate în 1988.
Creșterea de 9% este mică deoarece răspândirea SIDA a început în primii ani ai
decadei 8.
De exemplu, cazurile noi de SIDA au ajuns la 34% în 1988 și la 60% în 1987.
În 1989, au fost semnalate 547 de cazuri de SIDA transmisă de la mame la nou
născuți, mai mult cu 17% decât în 1988; în timp ce numărul femeilor afectate a fost
de 3.971 din cele 35.238 de cazuri noi raportate în 1989; aceasta a reprezentat o
creștere de 11% față de 1988.

18.02.2018 37
În Exemplul 1.11:

Rata schimbării pentru noile cazuri de SIDA a fost calculată ca

35.238 − 32.196
× 100 = 9,4%
32.196
(această valoare a fost rotunjită, fiind prezentată ca 9% în știre).

Pentru noile cazuri de SIDA transmise de la mamă la nou născut, avem

547 − (cazurile din 1988 )


17% = × 100
cazurile din 1988
ceea ce conduce la
547
cazurile din 1988 = = 468
1,17
(un număr calculabil, ca mai sus, dar uzual neraportat datorită redundanței).

18.02.2018 38
Similar, numărul de cazuri noi de SIDA pentru 1987 se calculează după cum urmează:
32.196 − (totalul din 1987 )
34% = × 100
totalul din 1987
sau
32.196
totalul din 1987 = = 24.027
1,34

Dintre cazurile noi din 1989, proporția femeilor este

3971
= 0,113 sau 11,3%
35.238

iar proporția bărbaților este

35.238 − 3971
= 0,887 sau 88,7%
35.238

Proporțiile pentru femei și bărbați, însumate ajung la 1 sau 100%.


18.02.2018 39
1.2.2. Măsuri pentru Morbiditate și Mortalitate

Domeniul statisticii vieții face apel la câteva aplicații speciale ale ratelor, dintre care
menționăm trei: brute, specifice și ajustate (sau standardizate).

Spre deosebire de rate, aceste măsuri sunt proporții.

Ratele brute sunt calculate pentru un întreg grup mare din populație; ele neglijează
factori precum vârsta, sexul și rasa.

Ratele specifice consideră tocmai aceste diferențe dintre subgrupuri și categorii de


afecțiuni.

Ratele ajustate (sau standardizate) sunt folosite pentru a realiza comparații


centralizatoare valabile între două sau mai multe grupuri ce au distribuții de vârste
diferite.
18.02.2018 40
Rata brută a deceselor anuale este definită ca numărul de decese dintr-un an
calendaristic, împărțite la populație la 1 Iulie al anului respectiv (care este uzual o
estimare); coeficientul este de obicei înmulțit cu 1000 sau altă putere convenabilă a lui
10, rezultând un număr între 1 și 100 sau 1 și 1000.

De exemplu, în 1980 populația Californiei a fost de 23.000.000 (estimată la 1 Iulie) și


au fost 190.237 decese pe parcursul anului 1980, ceea ce duce la

190.247
rata brută a deceselor = × 1000 = 8,3 decese la 1000 de persoane pe an
23.000.000

Ratele deceselor pe categorii de vârstă și de cauze se definesc similar.

18.02.2018 41
Ca și pentru morbiditate, prevalența bolii, definită în Secțiunea 1.1, este o proporție
folosită pentru a descrie populația la un anumit moment de timp, în timp ce incidența
este rata folosită în conexiune cu noile cazuri:

numărul de persoane care au dezvoltat afecțiunea


pe o anumită perioadă de timp (să spunem un an)
rata incidenței =
numărul de persoane inițial fără afecțiune
care au fost urmărite pentru perioada de timp definită

Cu alte cuvinte, prevalența prezintă o situație instantanee a morbidității populației la


un anumit moment de timp, în timp ce incidența este utilizată pentru a investiga
posibilele tendințe.

De exemplu, cele 35.238 de noi cazuri de SIDA din Exemplul 1.11 și populația națională
fără SIDA la începutul anului 1989 pot fi combinate în formula de mai sus pentru a
identifica incidența SIDA pentru anul respectiv.

18.02.2018 42
O altă utilizare interesantă a ratelor, legată de studiile grupurilor (mari), este
programarea testelor epidemiologice în care sunt implicate grupuri de persoane,
care sunt urmărite pe o anumită perioadă de timp; exemplele includ studii de
mortalitate pe grupuri ocupaționale, printre altele.

Proiectarea studiilor grupurilor se axează mai degrabă pe o expunere particulară decât


pe o anumită afecțiune, cum a fost situația studiilor de caz/control.

Avantajele abordării longitudinale include posibilitatea unor măsurători mai precise a


istoricului expunerii și o mai atentă examinare a dependenței în timp dintre expunere
și orice afecțiune aflată sub investigație.

Fiecare membru al grupului aparține uneia din cele trei tipuri de finalizare:
1. Subiecți care sunt în viață la data analizei
2. Subiecți care au decedat la o dată cunoscută pe durata studiului
3. Subiecți care s-au pierdut după o anumită dată (aceste cazuri sunt o potențială
cauză de dualitate; trebuie depuse eforturi pentru reducerea numărului unor astfel
de subiecți).
18.02.2018 43
Contribuția fiecărui membru este lungimea timpului de urmărire de la înregistrare
până la finalizare.

Raportul, definit ca numărul deceselor observate în grup, raportat la durata totală a


timpilor de urmărire (în persoane-an, să spunem) este rata ce caracterizează
mortalității grupului:

numărul de decese
rata de urmărire a mortalității =
numărul total de „persoane − an”

Ratele pot fi calculate pentru numărul total de decese și pentru diferite cauze, ele fiind
de obicei amplificate cu puteri ale lui 10, să spunem 1000, pentru a rezulta un număr
cu una – două cifre: de exemplu, decesele la 1000 de luni de urmărire.

Ratele de urmărire a mortalității pot fi folosite pentru a măsura eficacitatea


programelor de tratament medical.

18.02.2018 44
Exemplul 1.12 În efortul de a oferi o analiză completă asupra pacienților
supraviețuitori cu afecțiune renală în stadiu final (ESRD), datele au fost colectate pe un
eșantion incluzând 929 de pacienți care făceau dializă pentru prima dată în Programul
Regional de Maladii din Minneapolis, Minnesota, între 1 Ianuarie 1976 și 30 Iunie
1982; toți pacienții au fost urmăriți până la 31 Decembrie 1982.

Dintre acești 929 de pacienți, 257 sunt diabetici; dintre cei 672 non-diabetici, 386 sunt
clasificați cu risc redus (fără co-morbidități cum ar fi arterioscleroză, afecțiune
vasculară periferică, afecțiune pulmonară cronică și cancer).

TABELUL 1.6
Grupuri Vârsta Decese/1000
luni de tratament
Risc scăzut 1–45 2,75
46–60 6,93
61+ 13,08
Diabetici 1–45 10,29
46–60 12,52
61+ 22,16
18.02.2018 45
Rezultatele din aceste două subgrupuri sunt listate în Tabelul 1.6. (Pentru ilustrare,
sunt prezentate doar valorile centralizate; detaliile, precum numărul de decese și
numărul total de luni de tratament pentru subgrupuri, nu sunt incluse.)

De exemplu, pentru pacienții cu risc scăzut, cu vârste de peste 60 de ani, au fost 38 de


decese pe durata celor 2906 luni de tratament, ceea ce conduce la

38
× 1000 = 13,08 decese la 1000 de luni de tratament
2906
Grupuri Vârsta Decese/1000
TABELUL 1.6
luni de tratament
Risc scăzut 1–45 2,75
46–60 6,93
61+ 13,08
Diabetici 1–45 10,29
46–60 12,52
61+ 22,16
18.02.2018 46
1.2.3 Standardizarea Ratelor

Ratele brute, ca măsuri ale morbidității și mortalității, pot fi folosite pentru descrierea
populației și pot fi potrivite pentru investigații asupra variațiilor acestora în timp.

Totuși compararea ratelor brute este de multe ori incorectă deoarece populațiile pot fi
diferite în raport cu o caracteristică importantă precum vârsta, sexul și rasa (acestea
sunt factori potențiali de confuzie).

Pentru a depăși această dificultate, pentru comparație se folosește rata ajustată (sau
standardizată); ajustarea elimină diferența în comparație ca urmare a existenței
confuziei.

18.02.2018 47
Exemplul 1.13 Tabelul 1.7 oferă date privind mortalitatea în Alaska și Florida pentru
anul 1977.

Exemplul 1.13 arată că rata brută a deceselor la 100.000 pentru populația Alaskăi a
fost 396,8 și a Floridei a fost 1085,3, o diferență aproape semnificativă.

18.02.2018 48
Totuși, o examinare mai atentă evidențiază următoarele:

1. Alaska a avut o rată a deceselor mai mare pe clase de vârstă, pentru patru din cele
cinci grupuri de vârstă, singura excepția fiind grupa 45–64 de ani.
2. Alaska a avut un procentaj mai mare din populație în grupurile de vârstă fragedă.

Aspectele identificate sunt esențiale pentru ajustarea ratelor de deces în cele două
state, astfel încât să devină posibilă o comparație valabilă.

O modalitate simplă de a realiza acest lucru, numită metoda directă, este aceea de ne
referi la o populație standard comună, ratele specifice categoriilor de vârstă ale
populațiilor investigate.

Pentru acest scop, este folosită populația U.S. rezultată din recensământul ultimului
deceniu.

18.02.2018 49
Procedura constă în următorii pași:
1. Populația standard este listată pe aceleași grupuri de vârstă.
2. Numărul estimat de decese a populației standard este calculat pentru fiecare grup
de vârstă din cele două populații aflate în studiu comparativ.
De exemplu, pentru grupa de vârstă 0–4, populația U.S. în 1970 a fost 84.416 (la
milion); ca urmare avem:
a) Rata Alaskăi = 405,0 la 100.000. Numărul așteptat de decese este

84.416 405,0
= 341,9 ≃ 342
100.000
b) Rata Floridei = 375,3 la 100.000. Numărul așteptat de decese este

84.416 375,3
= 316,8 ≃ 317
100.000
care este mai mică decât numărul estimat de decese pentru Alaska
obținute pentru același grup.
3. Se obține numărul total de decese așteptate.

18.02.2018 50
4. Rata deceselor ajustată pe vârste este

numărul total de decese așteptate


rata ajustată = × 100.000
totalul populației standard

Calculele sunt detaliate în Tabelul 1.8.

Rata deceselor ajustată pe vârste la 100.000 persoane din populația Alaskăi este 788,6
și pentru Florida este 770,6.
Aceste rate ajustate pe vârste sunt mult mai apropiate decât ceea ce prezintă ratele
brute, iar pentru Florida, rata ajustată este chiar mai mică.
Este important să ne reamintim că orice populație poate fi aleasă drept „standard” și
din acest motiv o rată ajustată este artificială; ea nu reflectă datele pentru o anumită
populație.
Valorile numerice ale ratelor ajustate depind în mare parte de alegerea populației
standard. Ele au sens doar pentru comparații relative.
18.02.2018 51
TABELUL 1.8

Avantajul folosirii populației U.S. ca standard este aceea că putem ajusta datele
deceselor din mai multe state și să le comparăm între ele.

Orice populație poate fi aleasă și folosită ca standard.

În Exemplul 1.13 nu înseamnă că a fost un milion de locuitori în U.S. în 1970; este


prezentată doar distribuția de vârstă la 1 milion de rezidenți americani în acel an.

18.02.2018 52
Dacă nu vrem decât să comparăm Florida cu Alaska, putem alege și unul din cele două
state ca standard și să ajustăm rata deceselor celuilalt; această soluție ne va reduce
munca la jumătate.

De exemplu, dacă alegem Alaska drept populație standard, rata ajustată a deceselor
pentru Florida este calculată și prezentată în Tabelul 1.9.

TABELUL 1.9
Grupuri Populația Alaskăi Florida
de vârstă (folosită ca standard) Rata / 100.000 Numărul deceselor așteptate
0– 4 40.000 375,3 150
5–19 128.000 60,3 77
20–44 172.000 190,5 328
45–64 58.000 1.101,5 639
65+ 9.000 4.397,9 396
Total 407.000 1590

18.02.2018 53
Noua rată ajustată,
1.590 100.000
= 390,7 𝑙𝑎 100.000
407.000

nu este aceeași cu cea obținută folosind populația U.S. din 1970 ca standard (ea a fost
770,6).

Dar ea arată de asemenea că după ajustarea pe vârste, rata deceselor în Florida (390,7
la 100,000) este cumva mai mică decât cea din Alaska (396,8 la 100.000); nu este
nevoie de ajustare aici pentru că folosim populația Alaskăi drept populație standard).

18.02.2018 54
1.3. RAȚII
În multe cazuri, cum ar fi prevalența unei afecțiuni și incidența unei afecțiuni,
proporțiile și ratele sunt definite similar, iar termenii proporții și rate pot fi chiar
înlocuiți între ei.

Rația este un termen complet diferit; ea se calculează în forma

a
rația =
b

unde 𝑎 și 𝑏 sunt cantități similare măsurate din grupuri diferite sau în circumstanțe
diferite.

Un exemplu este rația bărbați/femei în ratele fumătorilor; o astfel de rație este


pozitivă, dar poate depăși valoarea 1,0.

18.02.2018 55
1.3.1 Risc Relativ
Una din cele mai des folosite rații în studiile epidemiologice este riscul relativ, un
concept folosit pentru compararea a două grupuri sau populații în raport cu un anumit
eveniment nedorit (adică afecțiune sau deces).

Metoda tradițională de exprimare a acesteia în studiile prospective este simplă, prin


rația ratelor de incidență:
incidența afecțiunii în grupul 1
riscul relativ =
incidența afecțiunii în grupul 2

Totuși, rația prevalenței bolii ca și ratele de urmărire a deceselor pot fi de asemenea


determinate.

Uzual, grupul 2 este cel aflat în condiții standard – cum ar fi neexpunerea la un anumit
factor de risc, iar grupul 1 (expus) este cel măsurat.

Un risc relativ mai mare ca 1,0 indică efecte dăunătoare, în timp ce un risc relativ mai
mic decât 1 indică efecte benefice.
18.02.2018 56
De exemplu, dacă grupul 1 constă din fumători și grupul 2 din nefumători, avem un risc
relativ datorat fumatului.

Folosind datele pentru boala renală în stadiu final (ESRD) din Exemplul 1.12, putem
obține riscurile relative datorate diabetului (Tabelul 1.10).

TABELUL 1.10 Grupa de vârstă Riscul Relativ


1–45 3,74
46–60 1,81
61+ 1,69

Toate cele trei numere sunt mai mari decât 1 (indicând o mortalitate mai mare pentru
diabetici) și urmează o tendință descrescătoare cu creșterea vârstei.

18.02.2018 57
1.3.2 Șansă și Rație de Șansă

Riscul relativ, numit și rația riscului, este un indicator important în studiile


epidemiologice, deoarece în astfel de studii este de deseori util să măsurăm riscul
crescător (dacă există vreunul) de apariție a unei anumite afecțiuni dacă este prezent
un anumit factor.

În studiile de grupuri (mari) un astfel de indicator este obținut rapid prin observarea
evenimentelor grupurilor de subiecți cu sau fără acel factor, așa cum s-a arătat mai sus.

În studiile de tip caz/control studiul datelor nu oferă un răspuns imediat la acest tip de
întrebare și vom vedea cum putem obține simplu o astfel de informație.

18.02.2018 58
Să presupunem că fiecare subiect dintr-un studiu mare, la un anumit moment de timp,
este clasificat drept pozitiv sau negativ conform unui anumit factor de risc și ca având
sau nu o anumită afecțiune aflată sub investigație.

Pentru orice astfel de categorisire, populația poate fi încadrată într-un tabel 2 × 2


(Tabelul 1.11).

TABELUL 1.11
Afecțiune
Factor + – Total
+ A B A+B
– C D C+D
Total A+C B+D N=A+B+C+D

Intrările A, B, C și D din tabel reprezintă volumele celor patru combinații de prezență/


absență a afecțiunii și prezență/absență a factorului, iar N reprezintă volumul total al
populației.
18.02.2018 59
Riscul relativ este
A C A C+D
RR = ÷ =
A+B C+D C A+B

În multe situații numărul subiecților clasificați pozitiv ca bolnavi este mic în


comparație cu numărul celor clasificați negativ ca bolnavi; adică,

C+D≃D
A+B≃B

și ca urmare riscul relativ poate fi aproximat după cum urmează:

AD A/B A/C
RR ≃ = =
BC C/D B/D

18.02.2018 60
Rația rezultată, AD/BC, este o aproximare a riscului relativ, dar este deseori
menționată ca rație de șansă deoarece:

1. A/B și C/D sunt imparele în favoarea ideii de a avea afecțiunea a subiecților din
grupurile cu sau fără factorul de risc.

2. A/C și B/D sunt imparele în favoarea ideii de a fi expuși la factori pentru


subiecții din grupurile cu sau fără afecțiune.

Aceste două impare pot fi ușor estimate folosind datele de control de caz,
folosind frecvențele de sondaj.
De exemplu, imparele A/C pot fi estimate prin 𝑎/𝑐, unde 𝑎 este numărul de
cazuri de expunere și 𝑐 numărul de cazuri de neexpunere din eșantionul
cazurilor folosite în programarea experimentelor de tip caz/control.

18.02.2018 61
Pentru multe afecțiuni rare, termenii risc relativ și rație de șansă pot fi folosiți
alternativ din cauza aproximării susmenționate.

Bine înțeles, este acceptabil să tragem concluzii asupra unei rații de șansă fără a invoca
această aproximație pentru afecțiunile care nu sunt rare.

Riscul relativ este un indicator epidemiologic important folosit pentru a estima


precizia (seriozitatea) sau mărimea efectului dăunător al factorilor de risc suspectați.

De exemplu, vom avea


RR = 3,0
și putem spune că subiecții expuși au un risc de contractare a bolii care este
aproximativ de trei ori mai mare decât riscul celor neexpuși.

18.02.2018 62
Valoarea perfectă 1,0 indică inexistența vreunui efect și efectele factorilor benefici
rezultă atunci când valorile riscului relativ sunt mai mici de 1,0.

Din datele obținute dintr-un studiu de caz/control sau retrospectiv, este imposibil să
calculăm riscul relativ dorit, dar dacă este rezonabil să presupunem că afecțiunea este
rară (prevalența este, de exemplu, mai mică de 0,05), putem calcula rația impară ca o
cerință necesară și să o folosim ca o aproximare a riscului relativ (folosim notația ≃ în
acest scop).

În aceste cazuri, interpretăm rația de șansă exact cum facem cu riscul relativ.

18.02.2018 63
Exemplul 1.14 Rolul fumatului în etiologia pancreatitei a fost recunoscut de mulți ani.
Pentru a oferi estimări ale semnificației cantitative a acestor factori, un studiu bazat pe
date ale pacienților spitalizați a fost efectuat în Massachusetts și Rhode Island intre
1975 și 1979. 98 de pacienți care la care s-a constatat în spital lipsa pancreatitei au
fost incluși în acest studiu sigur de caz/control.
Grupul de control a constat din 451 de pacienți admiși ca având alte afecțiuni decât
cele de pancreas sau de tract biliar.
Informația privind factorul de risc a fost obținută dintr-un interviu standardizat cu
fiecare subiect, condus de un personal calificat.
Unele date pentru bărbați sunt date în Tabelul 1.12.

TABELUL 1.12
Folosirea țigaretelor Cazuri Controale
Niciodată 2 56
Foști fumători 13 80
Fumători activi 38 81
Total 53 217

18.02.2018 64
Pentru aceste date, riscurile relative aproximative sau rațiile impare sunt calculate
după cum urmează:
(a) Pentru foști fumători,
13/2 13 56
RR e ≃ = = 4,55
80/56 80 2
[Indicele 𝑒 din RR e arată că am calculat riscul relativ (RR) pentru ex-fumători.]
(b) Pentru fumătorii activi,
38/2 38 56
RR c ≃ = = 13,14
81/56 81 2
[Indicele 𝑐 din RR c arată că am calculat riscul relativ (RR) pentru fumători
curenți.]

În aceste calcule, nefumătorii (care nu au fumat niciodată) sunt folosiți ca referință.

18.02.2018 65
Aceste valori indică faptul că riscul de a avea pancreatită pentru fumătorii curenți este
de aproximativ 13,14 ori mai mare decât la cei ce nu au fumat niciodată.

Efectul pentru ex-fumători este mai mic (de 4,55 de ori), dar rămâne foarte ridicat (în
comparație cu 1,0, linia de bază fără efect pentru riscul relativ și rațiile impare).

Cu alte cuvinte, dacă fumătorii aleg să renunțe la fumat ei își vor reduce riscul (de la
13,14 ori la 4,55 ori), dar nu la nivelul normal pentru subiecții care nu au fumat
niciodată.

18.02.2018 66
1.3.3 Șansă Generalizată pentru Tabele Ordonate 𝟐 × 𝐤

În această secțiune, vom face o generalizare interesantă a conceptului de rații de șansă


pentru rezultate uzuale, care este uneori folosită în cercetarea biomedicală.
Această posibilă generalizare se bazează pe faptul că o rație de șansă poate fi
interpretată ca o șansă pentru un alt eveniment.
De exemplu, să considerăm din nou tabelul 2 × 2
folosit în Secțiunea 1.3.2 (Tabelul 1.11).
Numărul perechilor pentru caz/control cu diferite istorice de expunere este (𝐴𝐷 +
𝐵𝐶); dintre ele, perechile 𝐴𝐷 sunt ale cazurilor cu expunere și perechile 𝐵𝐶 sunt ale
cazurilor cu expunere controlată.
Ca urmare 𝐴𝐷/𝐵𝐶, rațiile șanselor din Secțiunea 1.3.2, pot fi interpretate ca șanse de a
găsi o pereche cu un caz expus printre perechile nepotrivite (o pereche nepotrivită este
o pereche caz/control cu istorii de expunere diferite).
Situațiile de mai sus privind conceptul de rație a șansei și șansă poate fi generalizat
după cum urmează.
18.02.2018 67
Scopul este de a prezenta o metodă eficientă de folosire a tabelelor de evenimente
2 × 𝑘 ordonate, tabele cu 2 rânduri și 𝑘 coloane, având o anumită ordonare naturală.

Numărul rezultat este șansa generalizată formulată pentru conceptul de rație de


șansă.

Să considerăm pentru început un exemplu privind folosirea centurilor de siguranță la


automobile.
Fiecare accident din acest exemplu este clasificat după cum centura de siguranță a fost
sau nu folosită și după gravitatea urmărilor accidentului: fără, minore, majore sau
deces (Tabelul 1.13).
TABELUL 1.13
Urmarea accidentului suferit
Centură de siguranță Fără Minor Major Deces
Da 75 160 100 15
Nu 65 175 135 25
18.02.2018 68
Pentru a compara gravitatea urmărilor accidentelor celor care au folosit centura de
siguranță cu ale celor care nu au folosit-o, putem calcula procentul de utilizatori de
centură în fiecare grup de urmări, care crește de la nivelul „fără” la nivelul „deces”, iar
rezultatele sunt:
75
Fără: = 54%
75+65
160
Minor: = 48%
160+175
100
Major: = 43%
100+135
15
Deces: = 38%
15+25
Ceea ce observăm este o tendință sau o asociere care indică faptul că, pentru purtătorii
de centură procentajul este din ce în ce mai mic cu cât crește severitatea urmărilor
accidentului.
18.02.2018 69
Vom prezenta acum conceptul de șansă generalizată, o mărime statistică specifică
pentru măsurarea intensității unei astfel de tendințe și vom folosi același exemplu și
apoi un altul pentru a ilustra utilitatea acestui concept.
În general, considerăm un tablou ordonat 2 × 𝑘 având frecvențele prezentate în
Tabelul 1.14.
Coloană (Nivel)
Rând 1 2 … k Total
TABELUL 1.14 1 a1 a2 … ak A
2 b1 b2 … bk B
Total n1 n2 … nk N
Numărul de concordanțe este calculat cu
𝐶 = 𝑎1 𝑏2 + ⋯ + 𝑏𝑘 + 𝑎2 𝑏3 + ⋯ + 𝑏𝑘 + ⋯ + 𝑎𝑘−1 𝑏𝑘
(Termenul pereche concordantă folosit mai sus corespunde unei urmări
mai puțin severe pentru purtătorii centurii de siguranță.)
Numărul de discordanțe este
𝐷 = 𝑏1 𝑎2 + ⋯ + 𝑎𝑘 + 𝑏2 𝑎3 + ⋯ + 𝑎𝑘 + ⋯ + 𝑏𝑘−1 𝑎𝑘
18.02.2018 70
Pentru a măsura gradul de asociere, vom folosi indexul 𝐶/𝐷 și îl vom numi șansă
generalizată; dacă sunt doar două niveluri de urmări, acest index nou se reduce la
familiara rație de șansă.

Când datele sunt aranjate corespunzător, după o ipoteză apriorică, produsele din
numerele de perechi concordante 𝐶 (adică 𝑎1 𝑏2) se deplasează din poziția de stânga-
sus în poziția dreapta-jos, iar produsul din numărul de perechi discordante 𝐷 (adică
𝑏1 𝑎2) se deplasează din stânga-jos în dreapta-sus.
Prin această ipoteză apriorică, coloana 1 este asociată cu rândul 1.

În exemplul de mai sus, folosirea centurii de siguranță (da, pe primul rând) este
ipoteza asociată cu urmările mai puțin grave ale accidentelor (fără, în prima coloană).

Sub această ipoteză, șansa generalizată rezultată este mai mare ca 1.

18.02.2018 71
Exemplul 1.15 Pentru studiul de mai sus asupra folosirii centurii de siguranță în
automobile, din datele din Tabelul 1.13, avem

𝐶 = 75 175 + 135 + 25 + 160 135 + 25 + 100 25 = 53.225


𝐷 = 65 160 + 100 + 15 + 175 100 + 15 + 135 15 = 40.025
ceea ce conduce la șansa generalizată de
𝐶 53.225
𝜃= = = 1,33
𝐷 40.225

Adică, dată fiind situația a doi subiecți cu grade diferite de afectare, șansa (generalizată)
ca persoana afectată mai grav să nu fi folosit centura este 1,33.

Cu alte cuvinte, subiecții cu afecțiuni mai severe sunt mai degrabă cei care nu au folosit
centura.
18.02.2018 72
Următorul exemplu prezintă șansa generalizată în studiile de caz/control cu un factor
de risc ordinal.

Exemplul 1.16 Un studiul de caz/control al epidemiologiei nașterilor premature,


definit ca produse la mai puțin de 37 de săptămâni de gestație, a fost efectuat la Yale –
New Haven Hospital din Connecticut în anul 1977.
Populația de studiu a constat din 175 mame cu un singur nou născut prematur și
303 mame cu un singur nou născut la termen.

Tabelul 1.15 prezintă distribuția după vârsta mamei.


TABELUL 1.15
Vârsta Cazuri Controale
14–17 15 16
18–19 22 25
20–24 47 62
25–29 56 122
≥30 35 78

18.02.2018 73
Avem
𝐶 = 15 25 + 62 + 122 + 78 + 22 62 + 122 + 78 + 47 122 + 78 +
+ 56 78 = 23.837

𝐷 = 16 22 + 47 + 56 + 35 + 25 47 + 56 + 35 + 62 56 + 35 +
+ 122 35 = 15.922

ceea ce conduce la șansa generalizată:

𝐶 23,837
𝜃= = = 1,50
𝐷 15,922

Această înseamnă că șansele ca mamele mai tinere să aibă o sarcină prematură este 1,5.
Cu alte cuvinte, mamele tinere pot să aibă mai degrabă o sarcină prematură decât
celelalte.

18.02.2018 74
Exemplul următor arată cum se pot folosi șansele generalizate pentru tabelele de
contingență (evenimente neprevăzute) cu mai mult de două rânduri de date.

Exemplul 1.17 Tabelul 1.16 prezintă rezultatele unei supravegheri în care fiecărui
subiect, al eșantionului de 282 de adulți, i s-a cerut să decidă ce anume acceptă din trei
politici posibile privind fumatul în locurile publice.

TABELUL 1.16
Politica (opțiunea) preferată
Nivelul de Fumat fără restricții Fumat permis în zone Fumat interzis Total
educație special destinate
Școală generală 15 40 10 65
Liceu 15 100 30 145
Facultate 5 44 23 72
Total 35 184 63 282

18.02.2018 75
Vom avea astfel:
𝐶 = 15 100 + 30 + 44 + 23 + 40 30 + 23 + 100 23 = 8380
𝐷 = 5 100 + 30 + 40 + 10 + 44 30 + 10 + 100 10 = 4410

ceea ce conduce la șansa generalizată de


𝐶 8380
𝜃= = = 1,90
𝐷 4410

Această înseamnă că șansa ca o persoană mai educată să accepte mai multe restricții
în privința fumatului în locurile publice este 1,90.

Cu alte cuvinte, cu cât gradul de educație este mai mare cu atât sunt mai ușor acceptate
restricțiile privind fumatul în locurile publice.

18.02.2018 76
1.3.4. Metoda Mantel-Haenszel
În multe investigații ne concentrăm pe o singură concluzie, cum ar fi cazul unei
anumite maladii, concentrându-ne pe un factor (de risc) primar, cum ar fi expunerea
cu efecte nocive posibile.

Sunt totuși situații în care un investigator poate dori să prelucreze situația unui factor
de confuzie care poate afecta rezultatul unei analize statistice.

O confuzie, sau o variabilă de confuzie, este o variabilă care poate fi asociată fie cu
maladia, fie cu expunerea, fie cu amândouă.

În Exemplul 1.2, a fost realizat un studiu de caz/control pentru a investiga legătura


dintre cancerul de plămâni și angajarea în șantiere navale în timpul celui de-al
doilea Război Mondial, printre rezidenții din zona de coastă a Georgiei.

În acest caz fumatul este un element de confuzie; s-a găsit că este asociat cu cancerul
de plămâni și poate fi asociat și cu mediul de lucru, deoarece lucrătorii în
construcții navale sunt în general fumători.
18.02.2018 77
Specific, vrem să știm dacă:
(a) Printre fumători, lucrând sau nu în șantiere navale, există o legătură cu prezența
cancerului de plămâni
(b) Printre nefumători, lucrând sau nu în șantiere navale, există o legătură cu
prezența cancerului de plămâni

De fapt, datele originale au fost tabelate separat pentru trei niveluri de fumat
(nefumător, fumător moderat și fumător împătimit); în Exemplul 1.2, ultimele două
tabele au fost combinate și prezentate împreună pentru simplitate.

Acceptând că factorul de confuzie – fumatul – nu este un modificator de efect (adică,


fumatul nu alterează legătura dintre cancerul la plămâni și activitatea pe șantiere
navale), în această etapă nu ne dorim să găsim concluzii separate, câte una pe fiecare
nivel de fumat.

18.02.2018 78
În astfel de situații, vrem să extragem date pentru o decizie combinată. Când atât
maladia cât și expunerea sunt binare, o metodă comună de a atinge acest obiectiv este
metoda Mantel-Haenszel.

Această metodă furnizează o estimare unitară pentru o rație de șansă obișnuită și


poate fi rezumată după cum urmează:

1. Formăm tabele 2 × 2, câte unul pentru fiecare nivel al factorului de confuzie.


2. La un nivel al factorului de confuzie, vom avea datele listate conform Tabelului 1.17.

TABELUL 1.17
Clasificarea afecțiunii
Expunere + – Total
+ 𝑎 𝑏 𝑟1
– 𝑐 𝑑 𝑟2
Total 𝑐1 𝑐2 𝑛
18.02.2018 79
Deoarece presupunem că factorul de confuzie nu este un modificator de efect, rația
de șansă este constantă pe nivelurile acestuia.

Rația șansei la fiecare nivel se estimează prin 𝑎𝑑/𝑏𝑐;


procedura Mantel-Haenszel extrage datele pe nivelurile factorului de confuzie
pentru a obține o estimare combinată (un fel de rație de șansă – Odds Ratio –
mediată pe ponderi în funcție de nivelul specific):

σ 𝑎𝑑/𝑛
OR MH =
σ 𝑏𝑐/𝑛

18.02.2018 80
Exemplul 1.18 A fost realizat un studiu de tip caz/control pentru a identifica motivele
ratei exagerat de mari a cazurilor de cancer pulmonar printre rezidenții bărbați din
zona de coastă a Georgiei, prezentată în Exemplul 1.2.
Primul factor de risc din investigație a fost condițiile de lucru (în spații deschise, în
șantiere navale), în timpul celui de-al doilea război mondial, iar datele au fost tabelate
separat pe trei niveluri privind fumatul (Tabelul 1.18).
TABELUL 1.18
Fumător În șantier naval Cazuri Controale
Nu Da 11 35
Nu 50 203
Moderat Da 70 42
Nu 217 220
Împătimit Da 14 3
Nu 96 50

TABELUL 1.19 - Nefumători


În șantier naval Cazuri Controale Total
Da 11 (𝑎) 35 (𝑏) 46 (𝑟1 )
Nu 50 (𝑐) 203 (𝑑) 253 (𝑟2 )
Total 61 (𝑐1 ) 238 (𝑐2 ) 299 (𝑛)
18.02.2018 81
Sunt aici trei tabele 2 × 2, câte unul pentru fiecare nivel de fumat.

Începem cu tabelul 2 × 2 pentru nefumători (Tabelul 1.19).

Pentru nefumători vom avea:


𝑎𝑑 11 (203)
= = 7,47
𝑛 299
𝑏𝑐 35 (50)
= = 5,85
𝑛 299

Procesul se repetă pentru fiecare dintre celelalte niveluri privind fumatul.

Pentru fumătorii moderați:


𝑎𝑑 70 (220)
= = 28,05
𝑛 549
𝑏𝑐 42 (217)
= = 16,60
𝑛 549

18.02.2018 82
iar pentru cei împătimiți:
𝑎𝑑 14 (50)
= = 4,29
𝑛 163
𝑏𝑐 3 (96)
= = 1,77
𝑛 163

Aceste rezultate sunt combinate pentru a obține o estimare combinată pentru rația
șansei obișnuite:
7,47 + 28,05 + 4,29
OR MH = = 1,64
5,85 + 16,60 + 1,77

Estimarea combinată a rației șansei, reprezintă o creștere aproximativă de 64% a


riscului de cancer la plămâni pentru cei angajați în industria constructoare de nave.

18.02.2018 83
Exemplul următor prezintă o situație similară referitoare la efectele folosirii
contraceptivelor orale asupra infarctului miocardic.

Prezentarea este simplificată, fiind păstrate însă cifrele importante.

Exemplul 1.19 A fost realizat un studiu de tip caz/control pentru a investiga legătura
dintre infarctul miocardic (MI) și folosirea contraceptivelor orale (OC).

Datele, stratificate după consumul de țigarete, sunt listate în Tabelul 1.20.

TABELUL 1.20
Fumătoare Folosirea OC Cazuri Controale
Nu Da 4 52
Nu 34 754
Da Da 25 83
Nu 171 853

18.02.2018 84
Aplicarea procedurii Mantel-Haenszel conduce la rezultatele din Tabelul 1.21.

TABELUL 1.21 Fumătoare


Nu Da
𝑎𝑑/𝑛 3,57 18,84
𝑏𝑐/𝑛 2,09 12,54

Rata combinată de șansă estimată este

3,57 + 18,84
OR MH = = 1,53
2,09 + 12,54

reprezentând o creștere de aproximativ 53% a riscului de infarct miocardic în cazul


folosirii contraceptivelor orale.
18.02.2018 85
1.3.5. Rata Standardizată a Mortalității

În studiile de grup, ratele de deces urmărite sunt calculate și folosite pentru a descrie
evoluția mortalității grupului investigat.

Totuși, mortalitatea observată a grupului este deseori comparată cu cea așteptată din
ratele mortalității ale populației naționale (folosite ca standard sau linie de bază).

Principiul acestei metode este compararea numărului de decese observate, 𝒅, din grup,
cu mortalitatea care ar fi de așteptat dacă grupul ar fi evoluat cu rate similare celor ale
populației naționale din care face parte grupul considerat.
Să notăm cu 𝒆 numărul de decese așteptat.
Pentru comparație se determină următoarea rație, numită rația standardizată a
mortalității:
𝑑
SMR =
𝑒
18.02.2018 86
Numărul așteptat de decese este calculat folosind datele statistice publicate la nivel
național privind viața, iar calculul poate fi aproximat prin:

𝑒 ≃ 𝜆𝑇

unde 𝑇 este timpul total de urmărire (persoane-ani) din grup și 𝜆 este rata anuală a
deceselor din populația de referință.

Bine înțeles, rata anuală a deceselor populației de referință se schimbă în funcție de


vârstă.

Ca urmare, ceea ce cercetăm de fapt este mult mai complicat, cu toate că se bazează pe
aceeași idee.

În primul rând, vom subdivide grupul în multe grupuri de vârstă, apoi vom calcula
produsul 𝜆𝑇 pentru fiecare grup de vârstă, folosind rata corectă specifică vârstei
pentru acel grup, iar în final însumăm rezultatele.
18.02.2018 87
Exemplul 1.20 Circa 7000 de lucrători englezi expuși la monomerul clorură de vinil au
fost urmăriți câțiva ani pentru a determina dacă mortalitatea specifică acestui grup
diferă de cea generală a populației.
Datele din Tabelul 1.22 sunt pentru decesele datorate cancerului și sunt tabelate
separat pentru patru grupuri pe baza duratei de lucru în această industrie.
Aceste date relevă câteva aspecte importante:
Tabelul 1.22
Decese datorate Anii de la angajarea în această industrie
cancerului 1–4 5–9 10–14 15+ Total
Observate 9 15 23 68 115
Așteptate 20,3 21,3 24,5 60,8 126,8
SMR (%) 44,5 70,6 94,0 111,8 90,7

Pentru grupul cu 1–4 ani de la intrarea în această industrie, rata deceselor este
substanțial mai mică față de cea generală a populației (SMR=0,445 sau 44,5%).
Acest fenomen, cunoscut drept efectul muncitorului sănătos, este probabil o consecință
a unui factor de selecție conform căruia muncitorii trebuie să aibă o stare de sănătate
bună (față de populație, în general) la intrarea în câmpul muncii.
18.02.2018 88
Constatăm o atenuare a efectului muncitorului sănătos (adică o tendință de scădere)
cu trecerea timpului, astfel încât rata deceselor din cauza cancerului prezintă un ușor
exces după 15 ani.
(Expunerea la clorură de vinil este cunoscută ca putând induce o formă rară de cancer de ficat
și de a crește ratele cancerului la creier.)
Considerarea raportului rațiilor celor două mortalități standardizate este un alt mod
de a exprima riscul relativ.
De exemplu, riscul relativ corespunzător grupului de 15+ ani este de 1,58 de ori mai
mare decât riscul corespunzător grupului de 5–9 ani, câtă vreme rația celor două rații
de mortalitate corespunzătoare este
111,8
= 1,58
70,6
Similar, riscul grupului de 15+ ani este de 2,51 de ori mai mare decât riscul grupului de
1–4 ani, deoarece rația celor două rații de mortalitate corespunzătoare este
111,8
= 2,51
44,5
EXERCIȚII 1.1 – 1.46
18.02.2018 89