Documente Academic
Documente Profesional
Documente Cultură
TABELE DE CONTINGENȚĂ
Estimarea efectului:
RR – Risc Relativ sau Raportul Riscurilor(Risk Ratio)
OR – Raportul Cotelor (Odd Ratio)
Diferența riscurilor în forma absolută / relativă
NNT / NNH – număr persoane necesare pentru a observa un eveniment
Compararea frecvențelor:
Testul Chi pătrat (Chi Square test)
Testul Fisher (Fisher test)
- În cadrul afecțiunilor pulmonare se pune problema detectării factorilor de risc: fumat, consum alcool,
mediu toxic de muncă, etc.
- În cadrul apariției alergiilor la copii, se pune problema posibilei cauze datorate părinților alergici, sau
influența posibilă a părinților care fumează sau chiar combinația ambelor cauze.
La modul general – Observăm că există un factor de influență (fumatul, consumul de alcool, alergia
părinților, tratamentul cu un anumit tip de antibiotic, etc.) și prezența sau absența afecțiunii de studiu.
Putem crea un tabel cu frecvențele de apariție ale evenimentelor pentru cele 4 cazuri posibile definite de
prezența/absența factorului respectiv prezența/absența afecțiunii.
Tabelul de contingență - cuprinde frecvențele absolute ale evenimentelor
FACTOR
prezintă atât afecțiunea cât și factorul studiat.
- c d c+d
Factorul poate avea efect pozitiv, negativ sau poate să nu
aibă efect. Total a+c b+d a+b+c+d=n
+ a b a+b
rânduri a datelor din tabel.
- c d c+d Din grupul Factor prezent (+) calculăm riscul de a avea
afecțiunea: R = a
Total
a+c b+d a+b+c+d=n F+ ( a + b)
RF − = c
Din grupul Factor absent (-) calculăm riscul de a avea afecțiunea: (c + d )
a
Astfel Raportul Riscurilor (Risc Ratio) sau Riscul Relativ este: RR =
RF + ( a + b)
=
RF − c
(c + d )
Observație: RR este un raport de probabilități, este sigur pozitiv
deci mai mare sau egal cu 0. Poate tinde la infinit în situația în
care riscul în grupul factor absent este 0 și riscul în grupul factor
prezent este mai mare ca 0 (operația 0/0 nu are sens).
Factor de risc:
Dacă prezența factorul implică o creștere a probabilității de apariție a afecțiunii => factorul se numește de risc.
Daca valorile riscurilor sunt aproape egale RF − RF + implica RR ≈ 1 atunci factorul nu are influență
asupra afecțiunii !
- Cum validăm existența unei influențe (efect) cauzată de prezența factorului studiat?
- Cât de aproape de 1 trebuie să fie valoarea RR astfel încât să putem considera nulă influența factorului studiat
?
- Dacă răspundem la cele 2 întrebări, verificarea sensului în efect al factorul (este de risc sau preventiv) devine
ușor de realizat ?
Răspunsul este evident prin analiza statistică –
Observație 1– la volume mari ale eșantionului precizia poate deveni atât de bună încât putem avea erori f.
mici în estimarea valorii RR de exemplu. Astfel o valoare RR=1.001 poate avea semnificație statistică față de
1 adică risc confirmat. Utilitatea medicală a rezultatului nu poate fi acceptată decât prin decizia unui specialist
în domeniu !
Observație 2 – pentru calculul intervalului de confidență se folosește distribuția standard Gauss Laplace –
aceasta este o distribuție simetrică.
Problema constă în faptul că distribuția RR nu respectă o curbă Gauss-Laplace. Pentru a respecta o astfel de
distribuție valorile RR trebuie logaritmate – cu alte cuvinte se lucrează în spațiul logaritmic unde se calculează
intervalul de confidență (ce este simetric) apoi se aplică funcția inversă deci se exponențiază și se ajunge în
spațiul normal RR.
Concluzie – intervalul de confidență al RR este simetric în forma logaritmică dar în forma normală este
asimetric – caracteristică importantă !
Intervalul de confidență pentru Riscul Relativ (Raportul Riscurilor RR)
b d
RR(limita inf.) este: exp LN ( RR) − z(1− / 2 ) a (a + b) + c (c + d )
b d
RR(limita sup.) este: exp LN ( RR ) + z(1− / 2 ) +
a (a + b) c (c + d )
Încrederea în estimare este standard 95% sau 0.95. Astfel α = 0.05 sau 5%.
Z(1-α/2) este abscisa corespunzătoare densității de probabilitate Gauss-Laplace pentru o încredere simetrică
de 1-α. Pentru 95% încredere Z(1-α/2)=1.96.
b d
Valoarea : z (1− / 2 ) + se numește precizie.
a ( a + b ) c (c + d )
Se notează: LL OR (0.95%) – Lower Limit ; UL OR (0.95%) – Upper Limit
FACTOR
bc
- c d c+d
Ca și în cazul riscului și a raportului riscurilor , putem calcula intervalul de confidență al OR. Este de
asemenea nesimetric deoarece se logaritmează valorile punctuale pentru a respecta o distribuție simetrică de tip
Gauss-Laplace.
Prezentăm mai jos formulele de calcul :
1 1 1 1
OR(limita inf.) este: LL(OR ) = exp LN (OR ) − z(1− / 2 ) + + +
a b c d
1 1 1 1
OR(limita sup.) este: UL(OR ) = exp LN (OR ) + z(1− / 2 ) + + +
a b c d
Intervalul de confidență atât pentru RR cât și pentru OR este simetric în forma logaritmică !
În forma normală acest interval nu este simetric.
Punctul critic pentru un raport este 1. Această valoare arată că numitorul și numărătorul sunt egali. În cazul
analizei de risc valoarea RR=1 sau OR=1, arată lipsa influenței factorului studiat asupra afecțiunii. Valori exact 1
sunt foarte greu de obținut !
Dacă intervalul de confidență (standard 95% încredere) pentru RR sau OR cuprinde valoarea 1 înseamnă că
nu există asociere între cele două variabile (afecțiune și factor), deci nu vom avea semnificație.
Dacă limita inferioară a RR sau OR pentru interval de confidență (cu 0.95 încredere) este mai mare ca 1
atunci efectul expunerii este negativ ducând la o creștere a probabilității de îmbolnăvire (avem factor de risc),
deci avem și semnificație statistică.
Dacă limita superioară a RR sau OR pentru interval de confidență (cu 0.95 încredere) este mai mică ca 1
atunci efectul expunerii este pozitiv (benefic) ducând la o scădere a probabilității de îmbolnăvire (avem factor de
prevenție), deci vom avea și semnificație.
În cadrul studiului riscului se mai definesc următorii indicatori
statistici:
FACTOR
+ a b a+b
FACTOR
+ a b a+b
Se pune problema să aflăm câte persoane expuse sunt necesare pentru a obține un nou eveniment (ex.
îmbolnăvire sau însănătoșire) cauzat de expunere (comparativ cu controlul).
Prezintă două formule de calcul funcție de tipul factorului.
Dacă factorul este de risc, atunci prin expunere crește probabilitatea de apariție a afecțiunii. Numărul
necesar de persoane expuse pentru a obține un eveniment gen afecțiune (NNH – number needed to
harm):
NNH = 1/ARI
Cu cât NNH este mai mare cu atât factorul de expunere prezintă un risc mai mic de îmbolnăvire.
Pentru NNH=10 rezultă că la 10 peroane expuse ne așteptăm să avem o nouă apariție a afecțiunii
comparativ cu persoanele neexpuse (deoarece la numitor este o diferența).
Corespunzător unui factor preventiv, avem număr necesar de
persoane tratate pentru a obține un eveniment gen însănătoșire Frecvențe AFECȚIUNE
(NNT-number needed to treat): absolute Total
NNT = 1/ARR + -
Cu cât NNT este mai mic cu atât tratamentul este mai eficace.
FACTOR
+ a b a+b
Dacă NNT=1 rezultă o persoană tratată implică o persoană
însănătoșită – ideal. - c d c+d
Metodă de lucru
• Se calculează statistica Chi pătrat conform formulei (folosind ambele tabelul de date);
• Se calculează corespunzător statisticii Chi și a gradelor de libertate (k=(nr. rânduri-1)*(nr. col-1)))
semnificația notată p. Aceasta este particulară tabelului de date – caracterizează datele noastre.
• Dacă valoarea semnificației p ≤ 0.05 (atenție – în unele cărți se prezintă valoarea prag a semnificației pentru
acest tip de test p ≤ 0.10; noi vom utiliza standardul de 0.05) atunci avem semnificație deci există o influență
a factorului asupra afecțiunii. În continuare pentru a avea o măsură a efectului se va calcula RR sau OR
funcție de tipul de studiu folosit.
• Dacă valoarea p > 0.05 nu avem semnificație deci factorul nu are influență asupra afecțiunii.
Observație
Consistența datelor (cantitatea de informație) este definită de volumul eșantioanelor de lucru. Este de așteptat
ca odată cu creșterea volumului eșantionului deci a informației culese să avem încredere mai mare în rezultatele
obținute. Devine evidentă întrebarea : care este minimul de date sub care nu mai avem încredere în test ?
Astfel consistența (valididatea) unui test de tip Chi pătrat este definită de procentul de frecvențe așteptate ce
se află sub pragul de 5.
Dacă procentul de frecvențe așteptate de valoare sub 5 este mai mare ca 20% atunci nu putem
accepta rezultatul testului Chi pătrat – cu alte cuvinte avem erori prea mari prin acest calcul.
Iată în cadrul valorilor așteptate avem valoarea 3.6 mai mică ca 5; practic 25% din date sunt mai mici ca 5 –
avem inconsistență în aplicarea testului Chi pătrat. Ca urmare testul exact Fisher trebuie aplicat.
Rezultate obținute
Valoare Valoare
semnificativă ! nesemnificativă !
Observații
- Testele gen Chi pătrat și Fisher verifică existența asocierii dintre date – ne spun dacă frecvențele diferă sau
nu, dar nu cuantifică diferența.
- Magnitudinea efectului este măsurată prin RR sau OR – avem o imagine mai clară: RR=2 înseamnă că este
de două ori mai riscant în prezența factorului să ne îmbolnăvim comparativ cu lipsa expunerii.
- Dacă obținem semnificație prin Chi pătrat ne așteptăm ca în intervalul de confidență (95% încredere) pentru
RR sau OR să nu avem valoarea 1.
Sumar al ideilor principale
- În cadrul tabelelor de contingență compararea frecvențelor se face folosind testul Chi pătrat sau Fisher;
- Condiția de consistență pentru testul Chi pătrat: Mai puțin de 20% din frecvențele așteptate să fie mai mici ca 5;
- Formula de calcul a statisticii Chi pătrat (tabel de contingență): nr . de ev .
(Oi − Ei )2
Notație: O=valori observate, E=valori așteptate.
calculat =
2
i =1 Ei
- Testul Chi pătrat este neparametric;
- Dacă valorile așteptate mai mici ca 5 sunt în procent mai mare de 20% atunci testul Chi pătrat este înlocuit de testul
Fisher;
- Formula de calcul a RR este (conform tabelelor 2x2 prezentate): RR=(a/(a+b))/(c/(c+d));
- Formula de calcul a OR este (conform tabelelor 2x2 prezentate): : OR=(a*d)/(b*c);
- Calculul cotei pentru un eveniment A este (P reprezintă probabilitatea): P( A) P( A )
Spor la învățat !
VĂ MULȚUMESC !