Sunteți pe pagina 1din 23

STATISTICA DESCRIPTIVĂ PETRU DATE CATEGORIALE (DISCRETE)

1. Introducere. Tabele de incidența.


2. Proporții. Studii comparative. Teste screening. Prezentarea proporțiilor. Curba ROC.
3. Ratele. Rata de schimbare. Măsurarea Morbidității și Mortalității. Standardizarea ratelor.
4. Raporturi. Risсul relativ (Risc Ratio). Șansele (Odds) și Raportul Șanselor (Odds Ratio). Șanse
(Odds) generale pentu tabele 2x2. Metoda Mantel-Haenszel. Raportul standardizat al mortalității.
5. Indicatori utilizati în evaluarea unei atitudini terapeutice.
6. Teste clinice şi aprecierea calităţii lor.
7. Statistica descriptivă pentru datele categoriale în SPSS.
(2, 3 și 4 – capitolil I din INTRODUCTORY BIOSTATISTICS, Chap T. Le,
traducere Arnaut O., Placinta A.)
Majoritatea manualelor introductive în statistică și biostatistică încep cu metode pentru sintetizarea
și prezentarea datelor continue. Zonele noastre de interes se găsesc în domeniul științelor biomedicale,
iar deciziile de sănătate se bazează frecvent pe proporții, raporturi sau rate. În acest capitol, vom
vedea modul în care aceste concepte fac apel la un sens comun și vom învăța semnificația și utilitatea
lor.
1. INTRODUCERE
S-a văzut că atunci când avem coloane cu date numerice, este foarte util să se calculeze indicatori
statistici care să ne ofere o imagine sintetică a valorilor care se află pe acele coloane. Dacă însă pe o
coloană avem înregistrate date ordinale sau nominale, nu mai este posibilă calcularea acestor
indicatori. De fapt, ce se poate sintetiza pe o coloană care are înregistrate date despre prezenţa unei
afecţiuni, sau a unui simptom, sau despre grupele sanguine, sau despre stadiul de evoluţie al unei
afecţiuni maligne?
Răspunsul este simplu, nu putem decât număra la astfel de coloane, câţi pacienţi sunt din fiecare
categorie. Dacă este vorba de stadiul evolutiv al unei afecţiuni maligne, vom număra câţi pacienţi sunt
în stadiul 0, câţi sunt în stadiul I şi tot astfel pînă la stadiul IV. Putem eventual exprima aceste numere
prin procente.
În figura de dreaptă, este
prezentat începutul unui tabel în
care, pe primele coloane s-a
înregistrat Numărul curent,
Numele, Vârsta, Sexul, Mediul
de provenienţă, Stadiul clinic şi
Durata supravieţuirii, măsurată
în luni. Tabelul conţine 650 de
paciente cu cancer de sân, dintre
care în figura de mai jos sunt
listate primele 23 (nume fictive!).
În tabelul de mai jos, sunt
centralizate rezultatele numărării
pacientelor pe stadii ale bolii. Sunt
listate frecvenţele absolute (sau
numărul de paciente) din fiecare
stadiu în parte (stadializarea este 0, 1, IIA, IIB, IIIA, IIIB şi IV). Pe coloana cea mai din dreapta sunt
listate şi procentele sau frecvenţele relative.
Frecvența absolute Frecvența relativă
Nr Stadiul Clinic
(Numărul de paciente) (procentul)
1 0 26 4%
2 I 46 7.1%
3 IIA 76 11.7%
4 IIB 102 15.7%
5 IIIA 108 16.6%
6 IIIB 195 30%
7 IV 97 14.9%
8 Total 650 100.0%
În cazul coloanelor pe care s-au înregistrat date de tipul DA-NU, Prezent-Absent, Bărbat-Femeia,
numărătoarea va stabili numai câţi pacienţi au pe coloana respectivă „DA” şi câţi au „NU”. În plus, vor
fi listate la fel, frecvenţele procentuale.
Datele înregistrate pe două sau mai multe coloane şi care sunt de tip nominal sau ordinal, pot fi
studiate prin aşa-numitele tabele de incidenţă (frecvența). De exemplu, dacă unul din criteriile după
care au fost înregistraţi pacienţii este stadiul evolutiv al unei afecţiuni maligne, iar celălalt este
răspunsul terapeutic, fiecare din cele două
criterii de clasificare are în mod normal, un
anumit număr de categorii (clase) în care
trebuie clasificaţi pacienţii.
Stadiul evolutiv ar avea cel puţin patru
categorii (stadiul I, II, III şi IV), iar răspunsul
terapeutic ar putea avea categoriile RC
(remisiune completă, tumora se remite), RP
(remisiune parţială), RN (răspuns negativ) şi D
(dispărut). Un exemplu este furnizat de tabelul
pe dreaptă, care are 16 celule, corespunzător
la 4x4 categorii (celulele cu totaluri depind de celelalte şi ele nu sunt considerate în tabelele statistice
ca aducătoare de informaţie nouă).
Cazul cel mai simplu de tabel de incidenţă este tabelul 2x2. Un astfel de tabel centralizează date
referitoare la două caracteristici care au câte două posibilităţi. De exemplu, dacă din 260 de pacienţi
diabetici se constată că 86 au făcut retinopatie, dintre care 29 au şi nefropatie, iar din restul fără
retinopatie, 2 au nefropatie, atunci aceste date pot fi sintetizate astfel. Un astfel de tabel oferă
posibilitatea de a
aprecia dacă există sau
nu o dependenţă între
prezenţa retinopatiei şi
a nefropatiei, adică
dacă cei doi factori au
sau nu tendinţa de a
apărea în tandem.
2. PROPORȚII
Numeroase rezultate pot fi clasificate drept apartenență la una dintre cele două categorii posibile:
prezență și absență, nealb și alb, de sex masculin și feminin, îmbunătățite și non-îmbunătățite. Desigur,
una dintre aceste două categorii este, de obicei, identificată ca fiind interes primar (categoria
principală): de exemplu, prezența în clasificarea prezența și absența, nealbă în clasificarea albă și
nealbă. Noi putem, în general, clasifica cele două categorii de rezultate în pozitiv (+) și negativ (-). Un
rezultat este pozitiv dacă se remarcă categoria principală și este negativ dacă se remarcă cealaltă
categorie.
În rezumat, este evident că pentru caracterizarea observațiilor făcute asupra unui grup de persoane,
numărul x de rezultate pozitive nu este suficient; mărimea grupului n, sau numărul total de observații
ar trebui să fie, de asemenea, înregistrat. Numărul x ne spune foarte puțin și devine semnificativ numai
după ajustarea la dimensiunea n a grupului; cu alte cuvinte, x și n sunt adesea combinate într-o
statistică numită proporție:
x
p =
n
Termenul statistica reprezintă rezumarea datelor observate la o cifră, o ilustrație. În mod evident, 0 ≤ p
≤ 1. Această proporție este uneori exprimată în procente și se calculează după cum urmează:
𝑥
procent % = 𝑛 х 100%
Exemplul 1.1 În cadrul unui studiu, publicat de Coaliția Urban Minneapolis si Universitatea din
Minnesota Adolescent Health Program, au fost cercetați 12,915 elevi din clasele a VII-a – a XII-a, din
școlile publice Minneapolis și St. Paul. Raportul a stabilit că cea mai mică parte dintre elevi,
aproximativ o treime din grup, nu au avut recent un control fizic de rutina. În rândul studenților din
Asia, 25,4% au declarat că nu au vizitat un medic sau un dentist în ultimii doi ani, urmați de 17,7%
dintre americani nativi, 16,1% din cei de culoare (engl: “blacks”) și 10% din hispanici. Printre
europeni (engl: “whites”), rezultatul a fost de 6,5%.
Proporția este un număr folosit pentru a descrie un grup de oameni, conform unei dihotomii sau
caracteristici binare în curs de investigare. Se remarcă faptul că caracteristicile cu mai multe categorii
pot fi divizate în două părți prin unirea unor categorii în vederea formării uneia noi și, ulterior,
aplicarea conceptului de proporții. Următoarele subpuncte sunt câteva ilustrații ale utilizării proporției
în domeniul științelor medicale.
2.1 Studii comparative
Studiile comparative au scopul de a expune diferențele posibile între două sau mai multe grupe;
Exemplul 1.1 este un astfel de studiu tipic comparativ. Studiul din exemplul 1.1 a furnizat, de
asemenea, următoarele cifre referitoare la băieți din grupul care folosesc tutun cel puțin săptămânal:
printre asiatici, a fost de 9,7%, urmată de 11,6% din elevii de culoare, 20,6% din hispanici, 25,4%
dintre europeni și 38,3% dintre americanii nativi.
În plus, față de studiile transversale (cross-sectional), așa cum se vede în exemplul 1.1, datele
pentru studiile comparative pot proveni din diferite surse; cele două variante fundamentale fiind
retrospective și prospective. Studiile retrospective colectează date din trecut referitor la cazurile
selectate și controleaza dacă sunt diferențe, în cazul expunerii la un factor de risc suspectat. Acestea
sunt de obicei denumite studii de caz-control; fiecare studiu fiind axat pe o anumită boală. Într-un
studiu tipic de caz-control, cazuri de o anumită boală sunt cu atât mai precise, cu cât acestea provin din
baza de registre ale populatiei sau din listele persoanelor spitalizate, iar controalele eșantionează, sau
numărul de persoane sănătoase din populația de risc, sau pacienții spitalizați cu o diagnoză diferită de
cea studiată. Avantajele unui studiu retrospectiv sunt rentabilitatea economică și oferirea relativ rapidă
a răspunsurilor la întrebările cercetate, deoarece cazurile sunt deja disponibile. Limitări majore sunt
datorate inexactității istoriilor expuse și incertitudinea cu privire la caracterul adecvat al eșantionului
de control; aceste probleme împiedică uneori studiile retrospective și le face mai puțin preferate în
raport cu studiile prospective. Ceea ce urmează este un exemplu al unui studiu retrospectiv în
domeniul sănătății la locul de muncă.
Exemplul 1.2 Un studiu caz-control a fost Tabel 1.1
Construcții navale
efectuat pentru a identifica cauzele ratei Fumatul Nu Da
Cazuri
11
Control
35
excepțional de mare de cancer pulmonar în rândul Nu 50 203
locuitorilor de sex masculin din Georgia de coastă. Da Da 84 45
Nu 313 270
Cazurile au fost identificate din următoarele surse: Tabel 1.2
(A) Diagnosticele din anul 1970, la unicul spital Populația Cazuri Cazuri pe 100,000
Alb 32,930,233 2832 8,6
mare din Brunswick Altele 3,933,333 3227 82
(B) Diagnosticele din perioada 1975-1976, la trei
spitale majore în Savannah
(C) Certificatele de deces pentru perioada 1970-1974, în zona de interes.
Controalele au fost selectate din listele de spitalizare la cele patru insituții medicale și din
certificatele de deces din aceeași perioadă, cu excepția celor pentru cancerul pulmonar, cancerul de
vezică sau cancerul pulmonar cronic.
Datele sunt tabelate separat pentru fumatori si nefumatori in tabelul 1.1. Expunerea la "construcții
navale ", se referă la ocuparea forței de muncă în șantierele navale în timpul Celui de-al Doilea Război
Mondial. Prin folosirea unui tabel separat, cu prima jumătate a tabelului pentru nefumatori, iar a doua
jumătate a pentru fumători, vom trata fumatul ca un potențial confounder (factor de confuzie). Un
confounder (factor de confuzie) este un factor, o expunere de la sine, nu în curs de investigare, ci legat
de boala (în acest caz, cancerul pulmonar) și expunere (construcții navale); Studiile anterioare au au
gasit asociere între fumatul și cancerul pulmonar, iar muncitorii din construcții sunt mai susceptibili la
a fi fumători. Termenul expunere este folosit aici pentru a sublinia faptul că ocuparea forței de muncă
în șantierele navale este un factor de risc suspectat; cu toate acestea, termenul este folosit și în studiile
în care factorul investigat are efecte benefice.
La o examinare a fumătorilor în datele stabilite în Exemplul 1.2, numărul de persoane angajate în
șantiere navale, 84 și 45, ne spun puțin, deoarece dimensiunile din cele două grupe, cazuri și martori,
sunt diferite. Ajustând aceste numere absolute la mărimile de grup (397 cazuri și 315 controale), avem:
1. Pentru controale, proporția de expunere = 45/315 = 0.143 = 14,3%
2. Pentru cazuri, proporția de expunere = 84/397 = 0,212 sau 21,2%
Rezultatele arată istorii diferite de expunere: Proporția pentru cazuri a fost mai mare decât cea
pentru controale. Nu este în nici un fel o dovadă concludentă, dar este un indiciu bun, indicând o
posibilă relație între boala (cancer pulmonar) și expunerea (construcții navale). Examinarea similară a
datelor pentru nefumători arată că, luând în considerare numărul de cazuri și controale, avem
următoarele cifre pentru ocuparea forței de muncă:
1. Pentru controale, proporția de expunere = 35/238 = 0,147 sau 14,7%
2. Pentru cazuri, proporția de expunere = 11/61 = 0,180 sau 18,0%
Rezultatele demonstrează, de asemenea, diferite istorii de expunere: Proporția pentru cazuri a fost
mai mare decât cea pentru controale.
Analiza arată, de asemenea, că diferența dintre proporțiile de expunere în randul fumatorilor: 21,2-
14,3 = 6,9% este diferită de diferența dintre proporțiile de expunere in randul nefumatorilor: 18.0 -
14,7 = 3,3%
Diferenţele, 6,9% și 3,3%, sunt măsuri (valori) ce demonstrează interrelația puternică dintre boală
și expunere, câte una pentru fiecare dintre cele două straturi: respectiv, cele două grupuri de fumători și
nefumători. Calculul de mai sus arată că efectele posibile ale ocupării forței de muncă pe șantierele
navale (ca factor de risc suspectat) sunt diferite pentru fumatori si nefumatori. Această deosebire de
diferențe, dacă se confirmă, se numește o interacțiune tridimensionala (three-term interaction) sau
modificarea efectului, în cazul în care fumatul modifică efectul de muncă în șantierele navale ca un
risc pentru cancerul pulmonar. În acest caz, fumatul nu este doar un confounder (factor de confuzie),
acesta este un modificator de efect, care influențează efectele construcțiilor navale (cu privire la
posibilitatea de a avea cancer pulmonar).
Exemplul 1.3 Datele pentru persoane cu orbire din glaucom sunt prezentate în tabelul 1.2. Pentru
aceste date ale bolii înregistrate, calcularea directă a unei proporții rezultă într-o fracțiune foarte mica.
Pentru comoditate, acest lucru este înmulțit cu 100,000, și, prin urmare, rezultatul exprimă numărul de
cazuri la 100,000 de persoane. Acest set de date oferă, de asemenea, un exemplu de utilizare de
proportii ca prevalența bolii, care este definită ca
numărul de persoane bolnave în momentul investigației
prevalența = x 10n
numărul total de persoane examinate
Prevalența bolii și a conceptelor conexe sunt discutate mai detaliu în secțiunea 3.2.
Pentru orbire din glaucom, calculele în Exemplul 1.3 relevă o diferență izbitoare între rasele:
Prevalența orbirii în randul Altele a fost de peste opt ori mai mare decât în randul Alb. Numărul
''100,000'' a fost selectat în mod arbitrar; orice putere de 10 ar fi potrivite, astfel încât să se obțină un
rezultat între 1 și 100, uneori, între 1 și 1000; este mai ușor să se indice rezultatul "'82 cazuri la
100,000 '' decat sa se spună ca prevalenta este 0,00082.
2.2 Teste screening
Alte opțiuni de utilizare a proporțiilor pot fi găsite în evaluarea testelor de screening sau proceduri
de diagnosticare. Ca urmare a acestor proceduri, observații clinice sau tehnici de laborator, persoanele
sunt clasificate ca fiind sănătoase sau ca încadrându-se într-una dintre mai multe categorii de boli.
Astfel de teste sunt importante în medicina și studiile epidemiologice și poate constitui baza unor
intervenții. Aproape toate aceste teste sunt imperfecte, în sensul că persoanele sănătoase vor fi
ocazional clasificate în mod eronat ca fiind bolnave, în timp ce unii oameni care sunt cu adevărat
bolnavi pot să nu fie detectați. Această clasificare eronată este inevitabilă. Să presupunem că fiecare
persoană într-o populație mare poate fi clasificată ca fiind cu adevărat pozitivă sau negativă pentru o
anumită boală; acest diagnostic adevarat se poate baza pe metode mai rafinate decât sunt utilizate în
test, sau poate să se bazeze pe dovezi care apar după o perioadă de timp (de exemplu, la autopsie).
Pentru fiecare clasă de persoane, bolnave și sănătoase, se aplică testul, cu rezultate reprezentate în
figura 1.1.

Populația generală

Bolnavii Testul pozitiv

Figura 1.1 Prezentarea grafică a unui test de screening


Cele două proporții fundamentale pentru evaluarea procedurilor de diagnosticare sunt sensibilitatea
și specificitatea. Sensibilitatea este proporția persoanelor bolnave detectate de test ca fiind pozitive:

număr de persoane bolnave care au test pozitiv


Sensibilitate = numărul total de persoane bolnave

Erorile corespunzătoare sunt fals negative. Specificitatea este proportia de persoane sănătoase detectate
de test drept fiind negative:

numărul de persoane sănătoase care au test negativ


Specificitate = numărul total de persoane sănătoase
și erorile corespunzătoare sunt false positive.
Evident, este de dorit ca un test sau procedura de Tabel 1.3
screening să fie extrem de sensibilă și foarte specifică. Cu Test
Adevăr - + Total
toate acestea, cele două tipuri de erori merg în direcții - 23362 362 23724
opuse; de exemplu, un efort de a crește sensibilitatea poate + 225 154 379
duce la mai multe rezultate pozitive false și vice-versa.
Examplul 1.4 Un test citologic a fost efectuat pentru a identifica femei cu cancer de col uterin. Într-
un grup de femei 24,103 la număr, au fost constatate din 379 de femei ale caror col cervical este
anormal (într-o măsură care este suficient să justifice posibilitatea cancerului) și 23,724 femei ale caror
col cervical este acceptabil sanatos. Un test a fost aplicat, iar rezultatele sunt tabelate în Tabelul 1.3.
(Acest studiu a fost efectuat cu un test destul de vechi si este folosit aici numai pentru ilustrare.)
Sensibilitate = 154/379 = 0,406 = 40,6%
Specificitate = 23,362 / 23,724 = 0,985 sau 98,5%
Datele arată că testul este foarte specific (98,5 %), dar nu foarte sensibil (40,6%); au existat mai mult
de jumătate (59,4%), fals negative. Implicațiile utilizării acestui test sunt:
1. În cazul în care o femeie fără cancer de col uterin este testată, rezultatul ar fi aproape sigur
negativ, dar:
2. Dacă o femeie cu cancer de col uterin este testată, există probabilitate mare ca boala rămîne
neidentificătă, deoarece 59,4% din aceste cazuri rezultatul va fi fals negativ.
Este important de menționat că în această secțiune, proporțiile au fost definite astfel încât, atât
numărătorul, cât și numitorul (числитель и знаменатель) sunt numere sau frecvențe, iar numărătorul
corespunde unui subgroup al grupului mare a numitorului, rezultând un număr între 0 și 1 (sau între
0% și 100%). Este simplu de a generaliza acest concept pentru utilizarea cu caracteristici care au mai
mult de două categorii de rezultate; pentru fiecare categorie putem defini o proporție, iar aceste
proporții specifice categoriei să fie adunate cu 1 (sau 100%).
Exemplul 1.5 O examinare a 668 copii care trăiesc în familii consumatoare de droguri
(crack/cocaină) prezintă 70% rasă de culoare, urmate de 18% rasă europeană , 8% americanii nativi,
iar 4% alte sau necunoscute.
2.3 Prezentarea proporțiilor
Probabil modul cel mai eficient și convenabil de prezentare a datelor, în special date discrete, este
prin utilizarea de grafice. Graficele transmit informația, șabloanele generale dintr-un set de date, într-o
singură reprezentare. Prin urmare, graficele sunt adesea mai ușor de citit decât tabelele; graficele cele
mai informative sunt simple și auto-explicative. Desigur, pentru a atinge acest obiectiv, graficele
trebuie să fie construite cu grijă. Ca și tabele, acestea ar trebui să fie etichetate în mod clar și ar trebui
să fie incluse unitățile de măsură și/sau valorile. Menționăm că graficele trebuie să spună propria lor
poveste; acestea ar trebui să fie complete, necesitând o mică explicație suplimentară sau chiar nici o
explicație.
Diagramele cu bare (Bar charts) sunt un tip foarte popular a graficelor, utilizat pentru afișarea mai
multor proporții în vederea unei comparații rapide. În aplicații potrivite pentru diagrame cu bare, există
diferite grupuri unde noi investigăm o caracteristică binară. Într-o diagramă cu bare, diferitele grupuri
sunt reprezentate de-a lungul axei orizontale; ele pot fi aranjate în ordine alfabetică, în funcție de
mărimea proporțiilor lor, sau în baza altor criterii raționale. O bară verticală este desenată deasupra
fiecărui grup, astfel încât înălțimea barei reprezintă o proporție asociată cu acest grup. Barele ar trebui
să fie de lățime egală și trebuie să fie separate una de alta, astfel încât să nu sugereaze o continuitate.
Examplul 1.6 Va putem prezenta datele stabilite pe copii, fără un control fizic recent (Exemplul
1.1) printr-o diagramă bară, așa cum se arată în Figura 1.2.
Diagramele radiale (Pie Charts) sunt un alt tip popular de grafice. În aplicații potrivite pentru
diagrame radiale, există doar un singur grup, dar noi vrem să-l descompunem în mai multe categorii. O
diagramă radială este formată dintr-un cerc; cercul este împărțit în felii ale căror dimensiuni sunt direct
proporționale cu mărimea categoriei reprezentate. Diagrama radială arată diferențele dintre
dimensiunile diferitelor categorii sau subgrupuri ca o descompunere din total. Este potrivită, de
exemplu, pentru a fi utilizate în prezentarea unui buget, în cazul în care putem vedea cu ușurință
diferența dintre cheltuielile din SUA privind asistența medicală și
de apărare. Cu alte cuvinte, un grafic de bare este un dispozitiv
grafic adecvat, atunci când avem mai multe grupuri, fiecare
asociat cu o proporție diferită; întrucât o diagramă radială este mai
potrivită atunci când avem un grup care este împărțit în mai multe
categorii. Proporțiile diferitelor categorii într-o diagramă radială ar
trebui să însumeze 100%. La fel ca diagrame de bare, categoriile
într-o diagramă radială sunt de obicei aranjate în funcție de
mărimea proporțiilor. Acestea pot fi aranjate în ordine alfabetică
sau în dependență de alt criteriu.
Tabel 1.4 Exemplul 1.7 Noi putem
Cauza Numărul deceselor prezenta datele stabilite asupra copiilor care trăiesc în familii
Bolile cardiovasculare 12378
Cancer 6448 drogate (Exemplul 1.5)
Bolile cerebrovasculare 3958 printr-o diagramă radială
Accidente
Altele
1814
8088
așa cum este prezentat din
Total 32686 figura 1.3.
Un alt exemplu de
utilizare a diagramei radiale este prezentarea proporțiilor de
decese survenite în urma diferitor cauze.
Exemplul 1.8 Tabelul 1.4 prezintă numărul deceselor din
diverse cauze în rândul locuitorilor din Minnesota anul 1975.
După calcularea proporției numărului de decese revenit
fiecărei cauze (de exemplu, decese din cauza cancerului =
6448/32686 = 0.197 = 19,7%) putem prezenta rezultatele ca în
diagrama radială prezentată în Figura 1.4.
Grafice linie (линейная диграмма, Line Graphs). Graficul linie este un grafic liniar similar cu un
grafic cu bare, dar axa orizontală reprezintă timpul. Utilitatea
folosirii unui grafic linie, constă în faptul că o caracteristică
binară se observă în mod repetat în timp. Diferite ''grupuri'' sunt
ani consecutivi, astfel încât un grafic
Tabel 1.5
Anul Rata de deces brute linie este adecvat pentru a ilustra modul
(per 100,000) în care anumite proporții se modifică în
1984 792.7
1985 806.6 timp. Într-o diagramă linie, proporția
1986 809.3 asociată cu fiecare an este reprezentată
1987 813.1
printr-un punct situat la o înălțime
corespunzătoare; punctele sunt apoi conectate prin linii.
Examplul 1.9 Între anii 1984 și 1987, ratele de deces brute
pentru femeile din Statele Unite au fost listate în Tabelul 1.5. Variația ratei brute a mortalității pentru
femeile din SUA pot fi reprezentate de graficul liniar prezentat în Figura 1.5.
Pe lângă avantajul ilustrării proporțiilor asociate fiecărui an, diagramele linie pot fi folosite pentru
descrierea schimbărilor dinamice și, deasemenea, în cazul măsurărilor continue.
Examplul 1.10 Graficul liniar prezentat în figura 1.6
afișează tendința în ratele de malarie raportate in Statele
Unite, între 1940 și 1989 (proporția x 100,000).
Nota! Când rezultatele testelor diagnostice nu sunt
variabile dihotomice (binare) ci continue, se stabileşte o
valoare de prag faţă de care considerăm rezultatul
testului ca pozitiv sau negativ (de exemplu CK-MB=80
u/l, ce se află deasupra este infarct miocardic acut, ce se
află dedesubt nu este). Bineînţeles, putem stabili alte
valori de prag, pentru fiecare dintre ele având o
sensibilitate şi o specificitate: dacă vrem o sensibilitate
mare, scădem valoarea de prag şi nu vom scăpa nici un
infarct miocardic, dar vom diagnostica drept infarcte
pacienţi care nu au – cu alte cuvinte, scădem specificitatea; dacă vrem o specificitate mare, creştem
valoarea de prag şi atunci vom fi mai siguri că un pacient cu testul pozitiv are boala, dar vom avea
mulţi fals negativi, deci vom scăpa pacienţi cu infarct miocardic pe care nu i-am diagnosticat – cu alte
cuvinte, scădem sensibilitatea testului. Aşadar, pentru un test dat, putem creşte sensibilitatea cu preţul
scăderii specificităţii şi viceversa. Un astfel de test poate fi evaluat global prin calculul ariei de sub
curba ROC, care este graficul sensibilităţii în funcţie de
(1-specificitate) - figura pe dreaptă. Cu cât aria se apropie
de valoarea 1, testul este mai bun, cu sensibilitate şi
specificitate mari. Cu cât aria este mai mică, nu putem
creşte sensibilitatea sau specificitatea decât cu preţul unei
din ce în ce mai drastice scăderi a celuilalt parametru;
dacă aria =0,5, testul are aceeaşi valoare ca şi datul cu
banul. Interpretarea rezultatelor: aria curbei este 0,876;
valoarea de prag cu cel mai bun echilibru dintre
sensibilitate şi specificitate este cea de 80µ/l, fiind cea mai
apropiată de colţul din stânga sus al graficului – Sn=0,94,
Sp=0,89; pentru valoarea CK=40 µ/l, Sn=0,99, Sp=0,68;
pentru CK=280 µ /l, Sn=0,43, Sp=0,99
3. RATELE
Termenul rata este oarecum confuz; uneori este utilizat în mod similar cu proporția astfel cum a
fost definită în secțiunea 2; uneori, se referă la o cantitate de o natură foarte diferită. În secțiunea 3.1,
privind rata de schimbare, noi vom reflecta utilitatea specială a acestei variabile, iar în următoarele
două secțiuni, 3.2 și 3.3, ne vom concentra asupra ratelor utilizate în mod similar, cu proporții, ca
măsuri de morbiditate și mortalitate. Chiar și atunci când se referă la același lucru - evaluarea
morbidității și mortalității - există un anumit grad de diferență între acești doi termeni. În contrast cu
natura statica a proporțiilor, ratele sunt menite să măsoare aparițiile evenimentelor în timp sau după o
anumită perioadă de timp.
3.1 Rata de schimbare
Exemplul cunoscut de rate include utilizarea lor pentru a descrie modificările după o anumită
perioadă de timp. Rata de schimbare este definită

valoare nouă − valoarea veche


Rata de schimbare (%) = x 100
valoarea veche

În general, ratele de schimbare ar putea depăși 100%. Ele nu sunt proporții (o parte este un număr
cuprins între 0 și 1 sau între 0 și 100%). Modificarea ratelor sunt utilizate în principal pentru descriere
și nu sunt implicate în analiza statistica.
Exemplul 1.11 Următorul este un paragraf tipic al unui raport de știri:
Un număr total de 35,238 de cazuri noi de SIDA a fost raportat în 1989 de Centers for Disease
Control (CDC), comparativ cu 32196 raportate în 1988. Creşterea de 9% este cea mai mică după
răspândirea SIDA la începutul anilor 1980. De exemplu, noi cazuri de SIDA au crescut cu 34% în
1988 și 60% în 1987. În 1989, 547 de cazuri de transmitere SIDA de la mame la nou-nascuti au fost
raportate, in crestere cu 17% față de 1988; in timp ce numărul femeilor reprezintă doar 3971 din
35,238 de cazuri noi raportate în 1989; a fost o creștere de 11% față de 1988.
In Exemplul 1.11:
1. Rata de schimbare pentru noi cazuri de SIDA, a fost calculat ca
35,238−32,196
x 100 = 9,4%
32196
(acest lucru a fost rotunjit în jos la cifra raportată de 9%, în buletinul de stiri).
2. Pentru noile cazuri de SIDA transmise de la mama la nou-nascuti, avem
547 − 1988 cazuri
17% = 1988 cazuri x 100, cea ce duce la
547
cazuri în 1988 = 1,17 = 468
(o cifră care se poate obține, așa cum se arată mai sus, dar de obicei nu este raportată din cauza
surplusului) .
Similar, numărul de noi cazuri de SIDA pentru anul 1987 se calculează după cum urmează:
32196− 1987 total
34% = x 100
1987 total
sau
1987 totală = 32196 / 1.34 = 240273.
3. Dintre 1989 noi cazuri de SIDA, proporția de femele este 3971 / 35238 = 0.133 = 11,3%, iar
proporția de bărbați este (35238-3971) / 35238 = 0,887 = 88,7%. Proporţia de femei / bărbați împreună
fiind la 1,0 sau 100% .
3.2 Măsurarea Morbidității și Mortalității
Domeniul statisticii vitale (статистика естественного движения населения) cuprinde aplicații
speciale ale ratelor, unde întâlnim, de obicei, trei tipuri de rate menționate: brute, specifice și ajustate
(sau standardizate). Spre deosebire de ratele de schimbare, aceste măsuri sunt proporții. Ratele brute
sunt calculate pentru un întreg grup major sau o populație; ele nu iau în considerare factori cum ar fi
vârsta, sexul și rasa. Ratele specifice iau în considerare aceste diferențe între subgrupe sau categorii de
boli. Ratele ajustate sau standardizate sunt utilizate pentru a face comparații între două sau mai multe
grupuri care au diferite distribuții de vârstă.
Rată brută anuală de deces este definită ca numărul de decese într-un an calendaristic împărțit la
populație la data de 1 iulie a acelui an (care este, de obicei, o estimare), coeficientul este adesea
multiplicat cu 1000 sau 10 la o altă putere adecvată, rezultând un număr cuprins între 1 și 100 sau între
1 și 1000. De exemplu, populatia din California în 1980 a fost de 23.000.000 (estimată până la 1 iulie)
numărul deceselor în timpul 1980 fiind 190,237:
190,247
Rata brută de deces =23000000 x 1000 = 8.3 decese la 1000 de persoane pe an.
Mortalitatea specifică în funcție de vârsta și cauza sunt definite similar.
În cea ce privește morbiditate, prevalenta bolii, astfel cum sunt definite la punctul 2, este o
proporție utilizată pentru a descrie populația la un anumit moment temporal, pe când incidența este o
rată utilizată în legătură cu cazuri noi:
𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑎𝑛𝑒 𝑐𝑎𝑟𝑒 𝑎𝑢 𝑑𝑒𝑧𝑣𝑜𝑙𝑡𝑎𝑡 𝑏𝑜𝑎𝑙ă î𝑛𝑡𝑟−𝑜 𝑝𝑒𝑟𝑖𝑜𝑎𝑑ă 𝑑𝑒𝑓𝑖𝑛𝑖𝑡ă 𝑑𝑒 𝑡𝑖𝑚𝑝 (𝑎𝑛𝑢𝑙)
rata incidenței = 𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑎𝑛𝑒 𝑖𝑛𝑖ț𝑖𝑎𝑙 𝑓ă𝑟ă 𝑏𝑜𝑎𝑙𝑎 𝑐𝑎𝑟𝑒 𝑎𝑢 𝑓𝑜𝑠𝑡 𝑢𝑟𝑚ă𝑟𝑖ț𝑖 î𝑛𝑡𝑟−𝑜 𝑝𝑒𝑟𝑖𝑜𝑎𝑑ă 𝑑𝑒𝑓𝑖𝑛𝑖𝑡ă 𝑑𝑒 𝑡𝑖𝑚𝑝
Cu alte cuvinte, prevalența prezintă o imagine a experienței morbidității populației la un anumit
moment, în timp ce incidența are ca scop investigarea posibilelor tendințe în dependența de timp. De
exemplu, 35,238 cazuri noi de SIDA în exemplul 1.11 și populația națională, fără SIDA, la începutul
anului 1989 ar putea fi combinate în conformitate cu formula de mai sus pentru a obține o incidență
anuală de SIDA.
O altă utilizarea ratelor este în legătură cu studii de cohortă, unde design-ul epidemiologic
presupune înregistrarea unui grup de persoane și urmărirea lor în anumite perioade de timp; exemplele
includ studii de mortalitate ocupaționale și altele. Design-ul studiului de cohorta se concentreaza mai
degrabă pe o anumita expunere, decât a unei anumite boli ca și în studii de caz-control. Avantajele
unei abordări longitudinale includ posibilitatea de măsurare mai exactă a istoriei expunerii și o
examinare atentă a relațiilor în timp dintre expunere și orice boală în curs de investigare. Fiecare
membru al unui grup aparține uneia dintre cele trei tipuri de terminare:
1. Subiecții sunt încă în viață pe data analizei
2. Subiecți care au murit la o dată cunoscută în perioada studiului
3. Subiecții pierduți pentru urmarire după o dată anumită (aceste cazuri sunt o sursă potențială de
subiectivitate (Bias, необъективность), se recomandă depunerea efortului în scopul reducerii
numărului de subiecți din această categorie.
Contribuția fiecărui membru este durata timpului de urmărire de la înscriere până la terminare
studiului. Coeficientul, definit ca numărul de decese observate pentru cohorta, împărțit la numărul total
urmăriri (în persone-ani, să zicem), este rata pentru a caracteriza experiența de mortalitate a cohortei:
numărul de decese
rata de deces urmărită = total de persoane−ani
Rata poate fi calculată pentru totalul deceselor și pentru cauze distincte de interes, iar acestea sunt,
de obicei, multiplicate cu o putere corespunzătoare a lui 10, să zicem 1000, pentru a rezulta un număr
din una sau două cifre; de exemplu: decese la 1000 de luni de urmărire. Ratele de deces urmărite pot fi
utilizate pentru a măsura eficacitatea tratamentului programelor medicale.
Exemplul 1.12 Pentru a oferi o analiză completă a Tabel 1.6
supraviețuirii pacienților cu boală renală în stadiu terminal Group Age Decese/ 1000
luni de tratament
(ESRD), au fost colectate date pentru un eșantion care a Risc scăzut 1-45 2,75
inclus 929 pacienți ce au inițiat hemodializă pentru prima 46-60 6,93
61+ 13,08
dată de la Programul Regional al Bolilor din Minneapolis, Risc crescut 1-45 10,29
Minnesota, în perioada 1 ianuarie 1976 și 30 iunie 1982; toți 46-60 12,52
pacienții au fost urmăriți până la 31 decembrie 1982. Din 61+ 22,16

acești 929 pacienți, 257 sunt diabetici; 672 - nondiabetici, 386 sunt clasificați ca având risc mic (fără
comorbidități, cum ar fi bolile aterosclerotice cardiace, boli vasculare periferice, pulmonară obstructivă
cronică și cancer). Rezultatele din aceste două subgrupuri sunt prezentate în Tabelul 1.6. (Numai
câteva numere sunt prezentate aici pentru o ilustrare rezumată; detalii, cum ar fi numărul de decese și
luni totale de tratament pentru subgrupuri nu sunt incluse). De exemplu, pentru pacienții cu risc scăzut
de peste 60 de ani, au existat 38 de decese în timpul 2906 luni de tratament.
38
x 1000 = 13,08 decese la 1000 de luni de tratament
2906
Tabel 1.7
Alaska Florida
Grupa de Numărul de Populația Decese per Numărul de Populația Decese per
vârsta decese 100,000 decese 100,000
0-4 162 40,000 405 2,049 546,000 373.3
5-19 107 128,000 83.6 1,195 1,982,000 60.3
20-44 449 172,000 261 5,097 2,676,000 190.5
45-64 451 58,000 777.6 19,904 1,807,000 1,101.5
65+ 444 9,000 4933.3 63,505 1,444,000 4,397.9
Total 1,615 407,000 396.8 91,760 8,455,000 1,085.3

3.3 Standardizarea ratelor


Rata brută, ca măsură a morbidității sau a mortalității, poate fi utilizată pentru caracterizarea
populației și poate fi adecvată pentru investigarea variațiilor lor de-a lungul timpului; cu toate acestea,
comparații ale ratelor brute adesea nu sunt valide, deoarece populațiile pot fi diferite în ceea ce
privește o caracteristică importantă, cum ar fi vârsta, sexul sau rasa (acestea sunt potențiali factori de
confuzie (confounder)). Pentru a depăși această dificultate, o rată ajustată (sau standard) este utilizată
pentru comparații; ajustarea modifică compoziția, cu scopul reducerii factorilor de confuzie.
Examplul 1.13 Tabelul 1.7 furnizează datele mortalității în Alaska si Florida, pentru anul 1977.
Exemplul 1.13 arată că în 1977 rata brută a mortalității la 100.000 locuitori pentru Alaska a fost 396,8
și pentru Florida a fost 1085,7, o diferență aproape triplă. Cu toate acestea, o examinare mai atentă
arată următoarele:
1. Alaska, au avut rate de deces specifice vârstei mai înaintate pentru patru din cele cinci grupuri de
vârstă, singura excepție fiind 45-64 ani.
2. Alaska, a avut un procent mai mare al populației cu vârste mai tinere.
Este esențial să ajustăm ratele de deces ale celor două state, în scopul de a face o comparație reală.
Un mod simplu de a realiza acest lucru este aplicarea metodei directe asupra unei populații comune
standarde, analizând rate specifice de vârstă din cele două categorii populaționale în curs de
investigare. În acest scop, se utilizează frecvent populația Statelor Unite din ultimul recensământ
decenal. Procedura constă din următorii pași:
1. Listarea populației standard utilizând aceleași grupe de vârstă.
2. Calcularea numărului prevăzut de decese în populația standard pentru fiecare grupă de vârstă și
pentru fiecare populație din cele două grupuri comparate.
De exemplu, pentru grupul de vârstă 0-4, populația SUA în 1970 a fost de 84416 (per milion); prin
urmare, avem:
(a) rata pentru Alaska = 405,0 la 100.000. Numărul prevăzut de decese este
84,416∗405
= 341.9 = 342
100000
(b) rata pentru Florida = 375,3 la 100.000. Numărul estimat de decese este
84,416∗375.3
= 316.8 = 317
100000
care este mai mic decât numărul de decese prevăzut pentru Alaska, obținut pentru aceeași grupe de
vârstă.
3. Obținerea numărului total de decese prevăzute.
4. Ajustarea Ratei de deces în funcție de vârstă:

𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒𝑐𝑒𝑠𝑒𝑙𝑜𝑟 𝑝𝑟𝑒𝑣ă𝑧𝑢𝑡


rata ajustată = x 100, 000
𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑡𝑜𝑡𝑎𝑙ă
Calculele sunt prezentate în Tabelul 1.8.
Tabel 1.8
Alaska Florida
Grupele de 1970 U.S. Rata Decese Rata Decese
vârsta Standard specifică prevăzute specifică prevăzute
Milion de vârsta de vârsta
0-4 84,416 405.0 342 375.3 317
5-19 294,353 83.6 246 60.3 177
20-44 316,744 261.0 827 190.5 603
45-64 205,745 777.6 1600 1101.5 2266
65+ 98,742 4933.3 4871 4397.9 4343
Total 1,000,000 7886 7706

Rata de decese ajustată pentru vârsta la 100.000 locuitori Alaska este 788.6 și pentru Florida este
770.6. Aceste rate ajustate de vârstă sunt mult mai Tabel 1.9
Florida
aproape decât ratele brute, iar rata ajustată pentru Grupe Alaska Numărul
Florida este mai mică. Este important să se țină cont de population
Rata /
100,000
decese
vârsta prevăzute
de faptul că orice populație ar putea fi aleasă drept 0-4
(standard)
40,000 375.3 150
"standard" și din această cauză, o rată ajustată este una 5-19 128,0000 60.3 77
artificială; aceasta nu reflectă datele de la o populație 20-44 172,000 190.5 328
45-64 58,000 1101.5 639
reală. Valorile numerice ale ratelor ajustate depind în 65+ 9,000 4397.9 396
mare parte de alegerea populației etalon. Ele au un Total 407,000 1590
sens real numai în calitate de comparații relative.
Avantajul utilizării populației Statelor Unite ca standard constă în posibilitatea de a ajusta ratele de
deces ale multor state și să le comparăm între ele. Orice populație ar putea fi selectată și utilizată drept
standard. În exemplul 1.13, aceasta nu înseamnă că a existat doar 1 milion de oameni în Statele Unite,
în 1970; această prezintă distribuția pe vârste pentru 1 milion de locuitori din SUA pentru acel an. În
cazul în care singurul nostru scop este să comparăm Florida cu Alaska, am putea alege unul din state
standard și să ajustăm rata de deces a celuilalt; această practică ar economisi jumătate din munca
depusă. De exemplu, dacă vom alege Alaska în calitate de populatie standard, rata de deces ajustată
pentru Florida se calculează după cum se arată în tabelul 1.9. Noua rată ajustată,
1590∗100000
= 390.7 per 100,000
407.000
este diferită decât cea obținută utilizând populația din SUA 1970 ca standard (era 770.6), dar, de
asemenea, arată că, după ajustarea varstei, Rata de deces în Florida (390,7 la 100.000) este ceva mai
mică decât cea din Alaska (396,8 la 100.000, nu este nevoie de ajustare aici, deoarece vom folosi
populația din Alaska ca populatia standard).
4. RAPORTURI (RATIOS)
În multe cazuri, cum ar fi prevalența și incidența bolii, proporțiile și ratele sunt definite în mod
foarte similar, iar termenii proporție și rată pot fi utilizați chiar în mod interschimbabil. Raportul este
un termen complet diferit; acesta este un calcul al formei
a
raport = b
unde a și b sunt valori similare măsurate la diferite grupuri sau în diferite circumstanțe. Un exemplu
este raportul ratei fumatorilor barbați/femei; un astfel de raport este pozitiv și poate depăși 1.0.
4.1 Risсul relativ (Risc Ratio)
În studiile epidemiologice unul din cel mai utilizat raport este riscul relativ, un concept pentru
compararea a două grupuri sau populații cu privire la un anumit eveniment nedorit (de exemplu, boala
sau moarte). Metoda tradițională de exprimare în studiile prospective este, pur și simplu, raportul
dintre ratele de incidență:
incidența bolii în lotul 1
risc relativ = incidența bolii în lotul 2
De asemenea, poate fi calculat raportul dintre prevalențele bolii precum ratele deceselor. De obicei,
se măsoară raportul dintre grupul 1 (expus) și grupul 2, care se află în condiții standard (neexpus la un
anumit factor risc). Un risc relativ mai mare de 1,0 indică efecte dăunătoare, în timp ce un risc relativ
sub 1,0 indică efecte benefice. De exemplu, în cazul în care grupul 1 este format din fumatori si grupul
2 de nefumatori, avem un risc relativ din cauza fumatului. Pe baza datelor Tabel 1.10
privind boala renală în stadiu terminal (ESRD) din Exemplul 1.12, putem Grupa1-45 de vârsta Riscul relativ
3.74
obține riscurile relative datorate diabetului (Tabelul 1.10). Toate cele trei 46-60 1.81
numere sunt mai mari de 1 (indicând mortalitate mai mare pentru 61+ 1.69

diabetici) și formează o tendință de descreștere odată cu creșterea vârstei.


4.2 Șansele (Odds) și Raportul Șanselor (Raportul cotelor, Odds Ratio)
Riscul relativ este un indice important în studiile Tabel 1.11
epidemiologice, deoarece în astfel de studii este adesea util Boala
pentru măsurarea riscului crescut (dacă este cazul) de a Factor +
+
A
-
B
Total
A+B
manifesta o anumită boală în dependență de prezența unui - C D C+D
anumit factor. In studiile de cohortă acest indice se obține cu Total A+C B+D N=A+B+C+D

ușurință prin observarea grupelor de subiecți cu și fără factor, așa cum se arată mai sus. Într-un studiu
de caz-control datele nu prezintă un răspuns imediat la o astfel de întrebare, iar sarcina noastra e sa
analizăm modul în care putem obține o soluție rapidă și utilă.
Să presupunem că fiecare subiect într-un studiu mare, într-un anumit moment, este clasificat ca
fiind pozitiv sau negativ, în funcție de un factor de risc, și ca având sau nu au o anumită boală în curs
de investigare. Pentru astfel de clasificare, populația poate fi repartizată pe categorii într-un tabel 2 x 2
(Tabelul 1.11). Intrările A, B, C și D din tabel sunt dimensiunile celor patru combinații ale
prezenței/absenței bolii și prezenței/absenței factorului, iar numărul N la colțul din dreapta jos a
tabelului este mărimea totală a populației. Riscul relativ este
𝐴 𝐶 𝐴 (𝐶+𝐷)
RR = 𝐴+𝐵 : 𝐶+𝐷 = 𝐶 (𝐴+𝐵)
𝐴
NOTA! Riscul la cei expuşi (𝐴+𝐵) este probabilitatea ca un individ expus, sa facă boala (indiferent
din ce motiv). Se calculează pe un lot cum este cel din exemplul din tabel, ca raportul dintre numărul
celor care au făcut boala fiind expuşi (48), şi numărul tuturor celor expuşi (200). Deci, în tabelul de
mai jos, riscul la cei expuşi este de 48/200, adică de 0,24 sau 24%.
𝐶
Riscul la cei neexpuşi (𝐶+𝐷) este probabilitatea Boala
“+” prezentă “-” absentă Total
ca un individ neexpus, sa facă boala (indiferent din Expuși “+” 48 152 200
Factor
ce motiv). Se calculează pe un lot cum este cel din de risc Neexpuși “-” 36 1964 2000
Total 84 2116 2200
exemplul din tabel, ca raportul dintre numărul celor
care au făcut boala fiind neexpuşi (36), şi numărul tuturor celor neexpuşi (2000). Deci, în tabelul de
dreapta, riscul la cei neexpuşi este de 36/2000, adică de 0,018 sau 1,8%.
𝐴 𝐶 𝐴 (𝐶+𝐷)
Riscul Relativ, (RR = 𝐴+𝐵 : 𝐶+𝐷 = 𝐶 (𝐴+𝐵)) este raportul dintre riscul la cei expuşi, şi riscul la cei
neexpuşi. În tabelul de mai jos, riscul relativ este 24/1,8=13,3
Interpretare: Riscul relativ ne spune de câte ori este mai mare probabilitatea de a face boala când
eşti expus decât atunci când eşti neexpus. În tabelul de mai sus, riscul relativ fiind 13,3, înseamnă că
cei expuşi au probabilitatea de a face boala de 13,3 ori mai mare decât cei neexpuşi.
În general, valori ale riscului relativ apropiate de 1 arată aproximativ aceeaşi probabilitate de a
face boala, atât la expuşi, cât şi la neexpuşi, şi trebuie considerat că factorul de risc respectiv nu are o
influenţă reală asupra apariţiei bolii.
Dacă riscul relativ are valori mult mai mari ca 1, este o indicaţie că între factorul de risc şi boală
este o legătură de corelaţie care, de obicei este interpretată ca fiind CAUZALĂ, deşi nu este chiar
obligatoriu ca factorul de risc să fie CAUZĂ pentru apariţia bolii.
Există cazuri în care riscul relativ are valori subunitare (mai mici ca 1), caz în care este asimilat cu
un factor PROTECTOR. Aceasta deoarece, în aceste cazuri, este mai mic riscul de a face boala la cei
expuşi, decît la cei neexpuşi.
În multe situații, considerând criteriul boală, numărul de subiecți clasificați ca fiind pozitiv este mai
mic decât numărul celor clasificați negativ. Adică,
Prin urmare, riscul relativ poate fi aproximat după cum urmează:
𝐴∗𝐷 𝐴/𝐵 𝐴/𝐶
RR = = =
𝐵∗𝐶 𝐶/𝐷 𝐵/𝐷
În cazul în care bara oblică denotă divizare. Raportul rezultant, AD / BC, este un risc relativ
aproximativ, dar este adesea menționat ca raportul șanselor deoarece:
1. A/B și C/D reprezintă șansa crescută de a avea boală în grupuri, cu sau fără factor.
2. A/C și B/D reprezintă șansa crescută a expunerii la factorii pentru grupuri, cu sau fără boală. Aceste
două șanse pot fi ușor de estimat folosind studiile caz-control, prin utilizarea frecvențelor de
eșantionare. De exemplu, probabilitatea A/C poate fi estimată printr-un raport a/c, unde a reprezintă
numărul de cazuri expuse și c numărul de cazuri nonexpuse în cadrul eșantionului utilizat în cercetarea
caz-control.
Pentru multe boli rare, termenii riscului relativ și raportul șanselor sunt folosite alternativ
(interschimbabile), din cauza aproximării menționate mai sus. Desigur, acest fapt este pe deplin
acceptabil pentru a trage concluzii cu privire la o raportul șanselor fără a invoca această aproximare
pentru boala care nu este rară. Riscul relativ este un indice epidemiologic important utilizat pentru a
măsura severitatea sau mărimea efectului nociv a factorilor de risc suspectați. De exemplu, dacă noi
avem
RR = 3.0
putem spune că persoanele expuse prezintă risc de a manifesta boala, care Tabel 1.12
este de aproximativ trei ori mai mare decât riscul celor neexpuse. Valoarea Fumatul Cazuri Control
Niciodata 2 56
1,0 nu indică nici un efect, iar factorii benefici rezultă valori ale riscului Exfumator 13 80
relativ care sunt mai mici decât 1,0. Din datele obținute în studii caz- Fumator 38 81
control sau cele retrospective, este imposibil să calculăm riscul relativ Total 53 217

dorit, dar dacă este rezonabil să presupunem că boala este rară (prevalența este mai mică de 0,05, să
zicem), putem calcula raportul șanselor ca etapă și să o folosim ca un risc relativ aproximativ (folosim
notația “aproximativ: ≈ ” pentru acest scop). In aceste cazuri, vom interpreta raportul șanselor
calculată la fel cum am face cu riscul relativ.
Examplul 1.14 Rolul fumatului în etiologia pancreatitei a fost recunoscută de mai mulți ani. Pentru
a estima importanța cantitativă a acestui factor, un studiu a fost efectuat in estul Massachusetts și
Rhode Island, între 1975 și 1979. Nouăzeci și opt pacienți care au avut la externare diagnosticul de
pancreatită au fost incluși în acest studiu caz-control. Lotul martor a inclus 451 de pacienți internați cu
alte scopuri decât boli ale pancreasului și tractului biliar. Informații despre factorul de risc au fost
obținute dintr-un interviu standardizat cu fiecare subiect, realizat de un interviator antrenat.
Unele date pentru barbați sunt prezentate în tabelul 1.12. Pentru aceste date, riscul relative
aproximativ sau raportul șanselor sunt calculate după cum urmează:
a) Pentru ex-fumatori,
13/2
RRe = 80/56 = 4,55
[subscriptului e în RRe indică faptul că suntem calcularea riscului relativ (RR) pentru foștii fumători.]
b) pentru pacienții fumători,
38/2
RRc = 81/56 = 13,14

[subscriptului c din RRc indică faptul că calculăm riscului relativ (RR) pentru fumători.]
În aceste calcule, nefumatorii (care nu fumeaza) sunt folosiți ca grup de referința. Aceste valori
indică faptul că riscul de a avea pancreatită pentru fumători, este de aproximativ 13,14 ori mai mare
decât riscul pentru persoanele care nu fumează. Efectul exfumatorilor este mai mic (4,55 ori), dar este
încă foarte mare (în comparație cu 1,0, lipsa efectului pentru riscul relativ și raportul șanselor). Cu
alte cuvinte, în cazul în care fumătorii ar fi să renunțe la fumat, ei vor reduce propriul lor risc (de la
13.14 ori la 4,55 de ori), dar nu la nivel normal caracteristic persoanele care nu fumează.
NOTA! Deoarece este raportul șanselor nu este alt ceva decât raportul a două “cote”, trebuie întâi
înţeles ce înseamnă cotă. În engleză, cotele se folosesc la casele de pariuri. O cotă de 3 la 2 pentru un
eveniment, înseamnă că la acea casă de pariuri se consideră că sunt 3 şanse pentru şi 2 şanse contra
ca evenimentul să se întâmpe.Sau, două şanse să nu se întâmple, şi trei să se întâmple.
De exemplu, cota echipei României la CM de fotbal a fost într-un an de 1 la 32, adică o şansă
pentru, şi 32 contra. Atenţie, nu e corect să se spună “o şansă din 32…..”. Corect este 1 pentru şi 32
contra.
În studiile clinice, în special în studiile Caz-Martor sau, mai rar, în studiile de cohortă, se foloseşte
Odds Ratio, ca raportul între cota de îmbolnăviri la cei expuşi şi cota de îmbolnăviri la cei neexpuşi.
• Cota de îmbolnăviri la cei expuşi este raportul Boala
dintre numărul celor expuşi la care boala este “+” prezentă “-” absentă Total
Expuși “+” 50 150 200
prezentă şi numărul celor expuşi la care boala este Factor Neexpuși “-” 40 1960 2000
de risc
absent (A/B) Total 90 2110 2200
• Cota de îmbolnăviri la cei neexpuşi este raportul dintre numărul celor neexpuşi la care boala este
prezentă şi numărul celor neexpuşi la care boala este absent (C/D)
În tabelul de mai sus, cotele de îmbolnăviri sunt: la cei expuşi 50/150, adică de 1 la 3, iar la
neexpuşi de 40/1960, adică de 1 la 49.
𝐴∗𝐷
Raportul celor două cote, adică Odds Ratio (OR = 𝐵∗𝐶 ), este raportul dintre 1/3 şi 1/49, adică
49/3=16.3
Ca şi interpretare, valori apropiate de 1, arată cote asemănătoare, cea ce înseamnă că expunerea
nu influenţrază prezenţa bolii. Valori mult peste 1, arată o tendinţă de corelaţie între prezenţa
expunerii şi a bolii la pacienţi, corelaţie care este considerată de obicei ca fiind CAUZALĂ, deşi nu
totdeauna este cazul.
Valori mult sub 1 arată tot o corelaţie, dar în acest caz, expunerea este considerată un factor de
PROTECŢIE.
4.3 Șanse (Odds) generale pentu tabele 2xk
In această secțiune vom generaliza conceptul de raportul șanselor pentru variabile ordinale, care
sunt folosite în cercetări biomedicale.
O variantă de generalizare constă în interpretarea raportul șanselor ca șansele pentru un alt
eveniment. De exemplu, luăm în considerare din nou tabelul 2 x 2 utilizat în secțiunea 4.2 (Tabelul
1.11). Numărul de perechi de caz-control, cu istorii diferite de expunere este (AD + BC); printre
acestea, perechile AD cu un caz expus și perechi BC cu un control expus. Prin urmare, raportul
șanselor AD / BC în secțiunea 4.2, poate fi interpretată ca șansele de a găsi o pereche cu un caz expus
între perechi discordante (o pereche discordantă este o pereche cu istorii diferite).
Interpretarea de mai sus a noțiunii de raportul șanselor ca șansele poate fi generalizată după cum
urmează. Scopul este de a prezenta o metodă eficientă pentru utilizarea tabelelor eventuale 2 x k:
tabele cu două rânduri și k coloane având o anumită ordonare naturală. Imaginea sumară este
generalizarea termenului probabilitate pornind de la termenul de raportul șanselor. Propunem să
analizănm un studiu în ceea ce privește utilizarea centurilor de siguranță în automobile. Fiecare
accident în acest exemplu este clasificat în funcție dacă s-a utilizat o centură de siguranță și la
severitatea leziunilor: fară leziuni, minore, majore sau deces (Tabelul 1.13).
Pentru compararea severității leziunilor la cei care au Tabel 1.13
folosit centurile de siguranță cu cei care nu le-au folosit, Leziuni
Fară Minoră Majoră
putem calcula procentul de utilizatori a centurilor de siguranță Centura Da 75 160 100
Deces
15
în fiecare grup, care scade de la nivelul ''fără'' la nivelul Nu 65 175 135 25
''deces'':
75
Fără: 75+65 = 54%

160
Minoră: = 48%
160+175

100
Majoră: = 43%
100+135

15
Deces: 15+25 = 38%
Ceea ce vedem aici este o tendință (trend) sau o asociere ce indică faptul că cu cît mai mic este
procentul de utilizatori a centurii de siguranță, cu atât mai severe sunt leziunile. Acum vom prezenta
conceptul de șansele generalizate, o statistică specială formulată în mod specific pentru a măsura
gradul unei astfel de tendințe folosind același exemplu și un altul pentru a ilustra utilizarea
conceptului. În general, se ia în considerare tabelul 2 x k cu frecvențele prezentate în tabelul 1.14.
Numărul de concordanțe este calculat: Tabel 1.14
C = a1(b2 + … + bk) + a2(b3 + … + bk) + … + ak- Coloane
Rîndul 1 2 … k Total
1xbk 1 a1 a 2 … ak A
(Termenul perechea de concordanță așa cum 2 b1 b2 … bk B
Total n 1 n2 … nk N
este utilizat mai sus corespunde unei leziuni mai
puțin severe pentru utilizatorul centurii de siguranță.)
Numărul de discordanțe:
D = b1(a2 + … + ak) + b2(a3 + … + ak) + … + bk-1x ak
Pentru a măsura gradul de asociere, folosim indicele C / D, numit șansele generalizate; în cazul în
care există doar două niveluri de leziuni, acest indice nou este redus la raportul șanselor. Atunci când
datele sunt aranjate în mod corespunzător, printr-o ipoteză a priori, rezultatele numărului perechi de
concordanță C (de exemplu, a1b2), variază de la mai mari pe stânga spre mai mici pe dreapta, iar
rezultatele din numărul de perechi de discordanță D (de exemplu, b1a2) se schimbă în direcție opusă.
În această ipoteză coloana 1 este asociată cu rândul 1; În exemplul de mai sus, utilizarea centurii de
siguranță (da, în primul rând) ipotetic este asociată cu leziuni mai puțin grave (nici unul, prima
coloană). În conformitate cu această ipoteză șansele generalizate este mai mare decât 1.
Examplul 1.15 Pentru studiul de mai sus cu privire la utilizarea centurilor de siguranță în
automobile, am folosit datele prezentate în tabelul 1.13,
C = 75 (175 + 135 + 25) + 160 (135 + 25) + 100 x 25
D = 65 (165 + 100 + 15) + 175 (100 + 15) + 135 x 15
ceea ce duce la șansele generalizate
С 53,225
θ = D = 40,025 = 1.33

Pentru două persone cu leziuni diferite, șansele generalizate că persoana Tabel 1.15
cu leziuni mai severe nu utilizează centura de siguranță este 1.33. Cu alte Vârsta Cazuri Control
15 16
cuvinte, persoanele cu leziuni mai severe, au șansele mai mari decât 14-17
18-19 22 25
persoanele cu leziuni mai puțin grave să fie cei care nu au folosit centura de 20-24 47 62
siguranța. 25-29 56 122
≥30 35 78
Următorul exemplu ilustrează utilizarea probabilității generale în studiile
caz-control, cu factor de risc măsurat în scala ordinală.
Exemplul 1.16 Un studiu caz-control al epidemiologiei nașterii premature, definită ca fiind una cu
mai puțin de 37 de săptămâni de gestație, a fost efectuata la Yale-New Haven Hospital din
Connecticut, în 1977. Populația de studiu a constat din 175 mame ce au născut (sarcina una fetală)
prematur și 303 mame ce au născut (sarcina una fetală) la termen. Tabelul 1.15 oferă distribuția vârstei
mamei. Respectiv, avem:
C= 15 (25 + 62 + 122 + 78) + 22 (62 + 122 + 78) + 47 (122 + 78) + 56 x 78 = 23,837
D = 16 (22 + 47 + 56 + 35) + 25( 47 + 56 + 35) + 62 (56 + 35) + 122 x 35 = 15,922
ceea ce duce la șansele generalizate de
С 23,837
θ = D = 15,922 = 1.5
Acest lucru înseamnă că probabilitatea ca o mamă tânără să nască prematur este 1.5. Cu alte cuvinte,
mamele mai tinere ar fi mai susceptibile de a avea o naștere prematură.
Următorul exemplu arată utilizarea probabilității generale pentru tabele de contingență cu mai mult
de două rânduri de date.
Exemplul 1.17 Tabelul 1.16 prezintă Tabel 1.16
rezultatele unui studiu în care fiecare Politica
subiect al unui eșantion de 282 de adulți au Nivelul de educație Fumez Fumez în
Nu fumez Total
fără restricții lucul destinat
fost rugați să indice politica pe care o Școala primara 15 40 10 65
susține dintre cele trei opțiuni prezentate în Școala superioară 15 100 30 145
Colegiu 5 44 23 72
ceea ce privește fumatul în locurile publice. Total 35 184 63 282
Am obținut:
C = 15 (100 + 30 + 44 + 23) + 40 (30 + 23) + 100 x 23 = 8230
D = 5 (100 + 30 + 40 + 10) + 44 (30 +10) + 100 x 10 = 4410
ceea ce duce la probabilitatea generală de:
С 8,230
θ = D = 4,410 = 1.90
Acest lucru înseamnă că probabilitatea, ca o persoana mai educată, adeptă restricțiilor pentru
fumatul in locurile publice, este 1.90. Cu alte cuvinte, persoanele cu studii superioare ar prefera
restricții privind fumatul în locuri publice.
4.4 Metoda Mantel-Haenszel
In majoritatea investigațiilor ne interesează un singur efect, cum ar fi o boală, care se concentrează
pe un singur factor de risc primar, cum ar fi o expunere cu posibil efect dăunător. Cu toate acestea,
există situații în care un anchetator dorește să ajusteze rezultatul la un factor de confuzie care ar putea
influența o analiză statistică. Un factor de confuzie sau variabilă de confuzie, este o variabilă care
poate fi asociată fie cu boala, sau cu expunerea, sau cu ambele. În exemplul 1.2, un studiu caz-control
a fost efectuat pentru a investiga relația dintre cancerul pulmonar și ocuparea forței de muncă în
șantierele navale pe timpul Celui de-al Doilea Război Mondial, în rândul locuitorilor de sex masculin
din Georgia de coastă. In acest caz, fumatul este un potențial factor de confuzie; fumatul poate fi
asociat atât cu cancerul pulmonar, cât și cu locul de muncă, deoarece muncitorii din construcții sunt
susceptibil la a fi fumători. Mai exact, vrem să știm:
(a) printre fumători, dacă construcțiile navale și cancerul pulmonar sunt sau nu asociate
(b) printre nefumatori, dacă construcțiile navale și cancerul pulmonar sunt sau nu asociate
De fapt, datele originale au fost tabelate separat pentru trei Tabel 1.17
niveluri de fumat (nefumatori, fumatul moderat si fumatul grav); în Expunere Clasificarea bolii
+ - Total
exemplul 1.2, ultimele două tabele au fost combinate și prezentate + a b r 1

împreună pentru simplificare. Presupunând că factorul de confuzie, - c


c
d
c
r
n
2

Total
fumatul, nu este un modificator de efect (adică, fumatul nu afecteaza
1 2

relațiile între cancerul pulmonar și construcții de nave), cu toate acestea, noi nu dorim să facem
concluzii separate, câte una la fiecare nivel de fumat. În acest caz, dorim să reunim date pentru o
decizie combinată. Când atât boala, cât si expunerea sunt binare, se utilizează o metodă populară întru
realizarea acestei sarcini: metoda Mantel-Haenszel. Această metodă oferă o estimare unică pentru rata
probabilității și poate fi rezumată după cum urmează:
1. Formarea tabelului 2 x 2, câte unul la fiecare nivel al factorului de confuzie.
2. Utilizarea datelor prezentate în tabelul 1.17, pentru fiecare nivel al factorului de confuzie.
Deoarece noi considerăm că factorul de confuzie nu este un modificator de efect, raportul șanselor
este constant peste nivelurile sale (la cei care fumează si cei care nu). Raportul șanselor la fiecare nivel
este estimată prin ad/bc; procedura Mantel-Haenszel combină datele de la toate nivelurile ale
factorului de confuzie pentru a obține o estimare combinată (un fel de medie ponderată pentru raportul
șanselor a diferitor nivele specifice):
∑ 𝑎𝑑/𝑛
ORMH= ∑ 𝑏𝑐/𝑛
Exemplul 1.18 Un studiu caz-control a fost efectuat Tabel 1.18
pentru a identifica cauzele pentru rata excepțional de mare Fumatul Construcția Caz Control
Nu Da 11 35
a cancerului pulmonar intre locuitorii de sex masculin din Nu 50 203
Georgia de coastă, așa cum este prezentat pentru prima dată Moderat Da 70 42
Nu 217 220
în Exemplul 1.2. Factorul principal de risc în curs de Intensiv Da 14 3
investigare a fost ocuparea forței de muncă în șantierele Nu 96 50
navale în timpul Celui de-al Doilea Război Mondial, iar Tabel 1.19
Construcții Caz Control Total
datele sunt tabelate separat pentru trei niveluri de fumat Da 11 (a) 25 (b) 46 (r1)
(Tabelul 1.18). Nu 50 (c) 203 (d) 253 (r2)
Total 61 (c ) 238 (c ) 299 (n)
Sunt trei tabele 2 x 2, câte unul pentru fiecare nivel de
1 2

fumat. Vom începe cu tabelul 2 x 2 pentru nefumători (Tabelul 1.19). Pentru nefumatori avem
ad/n = (11 x 203)/299 = 7.47
bc/n= (35 x 50)/299 =5.85
Procesul se repetă pentru fiecare dintre celelalte două nivele de fumat.
Pentru fumatul moderat:
ad/n = (70 x 220)/549 = 28.05
bc/n = (42 x 217)/549 = 16.60
și pentru fumatul intensiv:
ad/n = (14 x 50)/163 = 4.29
bc/n = (3 x 96)/163 = 1.77
Aceste rezultate sunt combinate pentru a obține o estimare combinată a raportul șanselor:
ORMH = (7.47 + 28.05 + 4,28) / (5.85 + 16.60 + 1.77) = 1.64
Această estimare combinată a raportul șanselor: 1.64, reprezintă Tabel 1.20
o creștere de aproximativ 64% a riscului de cancer pulmonar Fumatul OC Caz Control
Nu Da 4 52
pentru cei angajați în industria navală. Nu 34 754
Urmează un exemplu similar care vizează efectele posibile a Da Da 25 83
Nu 171 853
utilizării contraceptivelor orale asupra infarctului miocardic.
Prezentarea a fost prescurtată, păstrând doar datele cheie. Tabel 1.21
Fumatul
Exemplul 1.19 Un studiu caz-control a fost efectuat pentru a - +
investiga relația dintre infarctul miocardic (IM) și utilizarea ad/n 3.57 18.84
bc/n 2.09 12.54
contraceptivelor orale (OC). Datele, stratificate pentru fumat,
sunt prezentate în tabelul 1.20. Aplicarea procedurii Mantel-Haenszel evidențiaza rezultatele
prezentate în tabelul 1.21. Rata probabilității combinate este
ORMH = (3,57 + 18,84) / (2,09 + 12,54) = 1.53
reprezentând o creștere aproximativă de 53% a riscului de infarct miocardic pentru utilizatorii de
contraceptive orale.
4.5 Raportul standardizat al mortalității
In studiul de cohorta, ratele de deces cercetate sunt calculate și utilizate pentru a descrie experiența
de mortalitate a cohortei în curs de investigare. Cu toate acestea, mortalitatea observată în cohorta este
adesea comparată cu cea așteptată din ratele de deces ale populației naționale (utilizată ca standard sau
de referință). La baza acestei metode este compararea numărului de decese observate, d, la cohorta cu
mortalitatea care ar fi fost prevăzută, dacă grupul prezintă rate de deces similare cu cele ale populației
naționale din care face parte cohorta. Dacă e denota numărul prevăzut de decese; atunci comparația se
bazează pe următorul raport, denumit raport standardizat de mortalitate:
SMR = d / e
Numărul așteptat de decese se calculează pe baza tabelelor naționale, iar calculul poate fi aproximat
după cum urmează:
e≈λxT
unde T este timpul total de urmărire (persoane-ani) din cohorta și λ rata anuală de deces din populația
de referință. Desigur, rata anuală de deces a populației de referință se schimbă odată cu vârsta. Prin
urmare, ceea ce facem de fapt în cercetare este mai complicat, deși se bazează pe aceeași idee. În
primul rând, noi subdivizam cohorta în mai multe grupe de vârstă, apoi calculăm λT pentru fiecare
grupă de vârstă, utilizând rata specifică corectă de vârstă pentru fiecare grupa și adăugăm rezultate.
Exemplul 1.20 7000 de muncitori britanici Tabel 1.22
Ani de la intrarea în industrie
expuși la monomerul clorurii de vinil au fost Decese cauzate
urmăriți timp de mai mulți ani pentru a de cancer
1-4 5-9 10-14 15+ Total

determina dacă experiența lor de mortalitate Observate


Prevăzute
9
20.3
15
21.3
23
24.5
68
60.8
115
126.8
diferă de populația generală. Datele din tabelul SMR (%) 44.5 70.6 94.0 111.8 90.7
1.22 sunt pentru decesele cauzate de cancer și
sunt tabelate separat pentru patru grupuri, în dependența de numărul anilor de la intrarea în industrie.
Acest table de date prezintă unele caracteristici interesante:
1. Pentru grupul cu 1-4 ani de la intrarea în industrie, avem o rată a mortalității, care este, în mod
substanțial, mai mică decât cea a populației generale (SMR = 0,445 sau 44,5%). Acest fenomen,
cunoscut sub numele de efectul muncitorului sănătos, este, probabil, o consecință a unui factor de
selecție prin care lucrătorii sunt în mod necesar într-o stare de sănătate mai bună (decât persoanele din
populația generală) la momentul intrării lor în funcție.
2. Observăm o atenuare a efectului lucrătorului sănătos (adică, o tendință de scădere), odată cu
trecerea timpului, astfel încât ratele de deces prin cancer arată un ușor exces după 15 ani. (Expunerea
la clorură de vinil este cunoscuta drept cauză de inducerea unei forme rare de cancer la ficat si de a
creste ratele de cancer cerebral).
Utilizarea relației dintre două raporturi standardizate de mortalitate este un alt mod de a exprima un
risc relativ. De exemplu, riscul relativ al grupului 15+ ani este de 1.58 ori mai mare decât riscul
grupului 5-9 ani, din moment ce relația dintre două rapoarte de mortalitate corespunzătoare este
111.8 / 70.6 = 1.58
Similar, riscul grupului 15+ ani este de 2,51 ori mai mare decât riscul de grupa 1-4 ani, deoarece
relațiile dintre două rapoarte de mortalitate corespunzătoare este:
111.8 / 44.5 = 2,51
5. Indicatori utilizați în evaluarea unei atitudini terapeutice
Pentru evaluarea unei atitudini terapeutice se pot calcula urmatorii indicatori medicali (vezi tabelul
din dreaptă, pentru întelegerea adnotatiilor din formule):
1. Rata evenimentului experimental (REE) Răspuns
= proportia pacientilor din grupul caz care “+” “-” Total
“+” experiment a b a+b
prezinta evenimentul de interes (a/(a+b)). Tratament “-” control c d c+d
2. Rata evenimentului de control (REC) = Total a+c b+d a+b+c+d
proportia pacientilor din grupul de control care prezinta evenimentul de interes (c/(c+d)).
3. Reducerea relativa a riscului (RRR) = reducerea procentuala a evenimentelor din grupul caz
fata de evenimentele din grupul martor raportat la evenimentele din grupul martor (|REE-REC|/REC).
Când un tratament experimental creste probabilitatea de apariție a evenimentului dorit, pe baza
formulei RRR se calculeaza cresterea relativă a beneficiului (cresterea proportionala a ratei
evenimentului dorit la grupul caz fata de grupul martor).
Daca tratamentul experimental creste probabilitatea unui eveniment nedorit, pe baza formulei RRR
se calculeaza cresterea relativă a riscului (proporția creșterii ratei de apariție a unui eveniment nedorit
la grupul caz fața de grupul martor).
4. Reducerea absoluta a riscului (RAR) = diferenta absoluta dintre rata evenimentului la grupul
experimental si rata evenimentului la grupul de control (|REE-REC|).
Când un tratament experimental creste probabilitatea de aparitie a evenimentului dorit, pe baza
formulei RAR se calculeaza creșterea absolută a beneficiului (diferența absolută între rata
evenimentului dorit la cazuri și martori).
Daca tratamentul experimental creste probabilitatea unui eveniment nedorit, pe baza formulei RAR
se calculeaza creșterea absoluta a riscului (diferența matematica absoluta între rata evenimentului
nedorit la cazuri și martori).
5. Numarul necesar a fi tratat (NNT) = numarul de pacienți care trebuie sa beneficieze de terapia
luata în studiu pentru a preveni un eveniment nefavorabil. Este o modalitate numerica de a exprima
probabilitatea beneficiului unui tratament, definit ca reciproca reducerii absolute a riscului (1/RAR).
NNT = 3 interpretată că 3 persoane cu simptomatologia de interes trebuie sa primeasca tratament
pentru ca una sa nu mai prezinte simptomatologia!
Când un tratament experimental creste probabilitatea de aparitie a evenimentului dorit, pe baza
formulei NNT se poate calcula numarul necesar a fi tratat.
Dacă tratamentul experimental crește probabilitatea unui eveniment nedorit, pe baza formulei NNT
se calculeaza numarul necesar pentru a dauna (numarul de pacienți care primind tratamentul va
determina apariția unui eveniment nefavorabil).
6. Riscul relativ (RR) = raportul dintre rata evenimentului experimental și rata evenimentului de
control (REE/REC).
7. Raportul Șanselor (RS) = sansa unui raspuns terapeutic pozitiv în grupul celor care primesc
tratamentul de interes raportat la sansa unui raspuns terapeutic pozitiv în grupul celor care primesc
tratamentul standard sau placebo ((a*d)/(b*c)).
Interpretare!
RS ~ 1 - nu exista nici o legatura dintre raspunsul terapeutic pozitiv si tratamentul de interes;
RS < 1 - asociere inversa între raspunsul terapeutic si tratamentul de interes.
Când un tratament experimental crește probabilitatea de apariție a evenimentului dorit se
calculeaza urmatorii indicatori:
1. Creșterea relativă a beneficiului (CBR) = creșterea proporționala a ratei evenimentului dorit la
grupul caz fața de grupul martor (|REE-REC|/REC).
2. Creșterea absolută a beneficiului (CBA) = diferenla absolută între rata evenimentului dorit la
cazuri și martori (|REE-REC|).
3. Numarul necesar a fi tratat (NNT) = este o modalitate numerică de a exprima probabilitatea
beneficiului unui tratament, definit ca reciproca reducerii absolute a riscului (1/RAR).
Când un tratament experimental crește probabilitatea de apariție a unui eveniment nedorit e
calculeaza urmatorii indicatori: :
1. Creșterea relativă a riscului (CRR) = proporția creșterii ratei de apariție a unui eveniment nedorit
la grupul caz fața de grupul martor (|REE-REC|/REC).
2. Creșterea absolută riscului (CAR) = diferența matematica absolută între rata evenimentului
nedorit la cazuri și martori (|REE-REC|).
3. Numarul necesar pentru a dauna (NND) = numarul de pacienți care primind tratamentul va
determina apariția unui eveniment nefavorabil (1/CRR).
6. Teste clinice şi aprecierea calităţii lor
Alte cazuri în care este utilă folosirea tabelelor 2x2, sunt cele în care se evaluează calitatea unui test
clinic la care pacienţii sunt supuşi. Un test clinic, este o metodă de a decide dacă un pacient este
pozitiv sau negativ în ce priveşte existenţa unui simptom, a unei afecţiuni, a unui risc, etc.
Deci, un astfel de test trebuie să ofere posibilitatea de a alege pacienţii care prezintă sau nu un
simptom, o afecţiune, un semn sau altă caracteristică necesară în procesul diagnosticării.
• Vom numi pozitivi, pacienţii care în urma testului au un rezultat pozitiv, adică testul indică prezenţa
afecţiunii, indiferent dacă în realitate afecţiunea este sau nu prezentă la pacientul respectiv
• Vom numi negativi, pacienţii care în urma testului au un rezultat negativ, indiferent dacă în realitate
au sau nu prezentă afecţiunea respectivă.
Un test care se aplică pacienţilor este o metodă care trebuie să aibă mai multe calităţi, între care,
vom enumera două:
• Un procent cât mai mare dintre pacienţii care sunt în realitate pozitivi, ar trebui să apară în urma
testului ca fiind pozitivi
• Un procent cât mai mare dintre pacienţii care sunt în realitate negativi, ar trebui să apară în urma
testului ca fiind negativi
Ideal ar fi ca toţi pacienţii să fie diagnosticaţi de test corect, dar acesta este un ideal care este foarte
greu de atins chiar cu aparatură perfecţionată. Totdeauna există cazuri care sunt extrem de greu de
încadrat sigur într-o categorie sau alta. Aşadar, totdeauna, în urma aplicării unui test la mai mulţi
pacienţi, se vor întâlni cazuri de pacienţi care, fie în realitate sunt pozitivi, iar în urma efectuării
testului apar ca negativi, fie invers.
Pacienţii diagnosticaţi cu un test clinic se împart după două criterii:
 După criteriul bolii (sau al caracteristicii diagnosticate), sunt două categorii: Bolnavi (engl:
diseased) şi Sănătoşi (engl: diseased free). Faptul că un pacient este în una dintre cele două categorii
se stabileşte cu ajutorul aşa-numitului test sigur sau test de aur (engl: golden test). Acest test este un
test care a fost deja verificat ca fiind extrem de precis şi dă o rată de erori minimă.
 După criteriul testului clinic studiat sunt tot două categorii: Pozitivi şi Negativi.
Deci, fiecare din pacienţi, va aparţine uneia din următoarele patru clase, care rezultă în urma
combinării în toate modurile posibile a celor patru categorii de mai sus:
• Real Pozitivi, pacienţii care în realitate sunt Bolnavi iar în urma testului sunt Pozitivi.
• Fals Negativi, pacienţii care în realitate sunt Bolnavi iar în urma testului sunt Negativi. Constituie
erori pentru test. Testul sigur (Golden test)
• Fals Pozitivi, pacienţii care în realitate sunt Bolnavi Sănătoși Total
Sănătoşi iar în urma testului sunt Pozitivi. Testul Pozitivi
Real Pozitivi Fals Pozitivi
P
propus (RP sau 𝑩+ ) (FP sau 𝑺+ )
Constituie celălalt tip de eroare a unui test. (Testul Fals Negativi Real Negativi
Negativi N
• Real Negativi, pacienţii care în realitate sunt clinic) (FN sau 𝑩− ) (RN sau 𝑺− )
Total B S B+S=P+N
Sănătoşi iar în urma testului sunt Negativi.
După ce se stabileşte la fiecare pacient cărei clase aparţine, din cele patru enumerate mai sus, se
realizează un tabel 2x2 ca în pe dreaptă.
Aprecierea calităţii unui test propus trebuie evident să ţină seama de procentul de reuşite ale
acestuia. Dar ce înseamnă reuşite pentru un test clinic? Câteva propuneri ar fi:
• Ce procent din pacienţii bolnavi sunt diagnosticaţi de test ca pozitivi?
• Ce procent din pacienţii sănătoşi sunt diagnosticaţi de test ca negativi?
• Ce procent din pacienţii diagnosticaţi de test ca pozitivi sunt bolnavi?
• Ce procent din pacienţii diagnosticaţi de test ca negativi sunt sănătoşi?
Vom defini aceste rapoarte procentuale şi vom studia modul cum le folosim în aprecierea calităţii
testului. Aceste procente arată calitatea unui test clinic în sensul că testul este cu atât mai valoros cu
cât ele au valori mai mari, mai apropiate de 100%. În plus, vor fi definite mai jos şi două rapoarte
procentuale care exprimă erorile unui test. Este clar că procentele care exprimă erorile trebuie să fie cât
mai mici pentru ca testul să fie valoros.
 Sensibilitatea (Sn) unui test este raportul dintre numărul pacienţilor bolnavi, diagnosticaţi ca
pozitivi şi numărul total de bolnavi. Sn=𝐵 + /B
 Specificitatea (Sp) unui test este raportul dintre numărul pacienţilor sănătoşi, diagnosticaţi ca
negativi şi numărul total de sănătoşi. Sn=𝑆 − /S
 Valoarea predictivă pozitivă (VPP), este raportul dintre numărul pacienţilor diagnosticaţi
corect ca pozitivi şi numărul total al celor diagnosticaţi de test ca pozitivi. VPP=𝐵 + /P
 Valoarea predictivă negativă (VPN), este raportul dintre numărul pacienţilor diagnosticaţi
corect ca negativi şi numărul total al celor diagnosticaţi de test ca negativi. VPN=𝑆 − /N
 Rata fals pozitivă (RFP), este raportul dintre numărul pacienţilor sănătoşi diagnosticaţi greşit ca
pozitivi şi numărul pacienţilor sănătoşi. RFP=𝑆 + /S
 Rata fals negativă (RFN), este raportul dintre numărul pacienţilor bolnavi diagnosticaţi greşit
ca negativi şi numărul pacienţilor bolnavi. RFN=𝐵 − /B
Ca exemplu, să urmărim o clasificarea a Naștere
109 femei după tipul de naştere (prematură Prematură Normală Total
<26 mm 33 15 48
sau normală) şi după lungimea colului Lungime col >26 mm 8 53 61
uterin ca test de decizie a riscului de Total 41 68 109
naştere prematură. Se observă că din 41 de
naşteri premature, 33 au colul sub 26mm iar din 68 de naşteri normale, 53 au colul peste 26, deci limita
de 26mm a lungimii colului uterin este un criteriu de decizie al riscului de naştere premature, având
următoarele indicatori:
• Sn=33/41=0,804=80,4%, Sp=53/68=0,779=77,9%
• VPP=33/48=0,687=68,7%, VPN=53/61=0,868=86,8%
• RFP=15/68=0,221=22,1%, RFN=8/41=0,196=19,6%
Un test este cu atât mai valoros cu cât primii patru din cei şase indicatori sunt mai mari, iar ultimii
doi mai mici. Ideal ar fi ca primii patru să fie apropiaţi de 100%, iar ultimii doi, apropiaţi de 0%. În
practică, se constată că este foarte greu să se atingă valori foarte mari pentru toţi cei patru şi valori
foarte mici pentru ultimii doi. De exemplu, testul studiat prin tabelul 13 este un test destul de valoros.
Doar primii doi indicatori sunt consideraţi fundamentali, ei fiind cei care dau de fapt calitatea
testului clinic propus, în comparaţie cu testul considerat sigur (testul de aur), în cazul de mai sus testul
sigur fiind naşterea propriu-zisă.
7. Statistica descriptivă pentru datele categoriale în SPSS