Sunteți pe pagina 1din 62

Analiza datelor calitative

Conținutul acestui curs:

Tabele de contingență

Testul hi-pătrat pentru asociere

Distribuția hi-pătrat

Valori critice pentru distribuția hi-pătrat

Testul exact Fisher

Corecția Yates

Testul hi-pătrat pentru tendințe

Raportul riscurilor RR (riscul relativ)

Raportul cotelor OR (riscul relativ estimat)

Nr. necesar de pacienți care trebuie tratați (NNT)

Analiza datelor calitative

Analiza datelor calitative Datele calitative sunt numite adesea și nominale sau categoriale și apar atunci când

Datele calitative sunt numite adesea și nominale sau categoriale și apar atunci când se pot clasifica subiecții în

și apar atunci când se pot clasifica subiecții în două sau mai multe categorii. Variabile categorice

două sau mai multe categorii.

Variabile categorice cu doar două categorii, sunt numite dicotomice sau binare. Metode:

Testul hi-pătrat de asociere

Testul Fisher exact,

Raportul riscurilor (RR), riscul relativ sau raportul șanselor,

Raportul cotelor (OR) sau riscul relativ estimat

Numărul necesar de tratamente.

Tabele de contingență

Tabel încrucișat pentru două variabile categoriale:

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,

1994)

funcție de grupele stării civile (Meadows et al., 1994) Meadows J, Jenkinson S, Catalan J. (1994)

Tabele de contingență

Tabel încrucișat pentru două variabile categoriale:

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,

1994)

funcție de grupele stării civile (Meadows et al., 1994) tabel de Un astfel de tabel încrucișat
tabel de
tabel
de

Un

astfel

de

tabel

încrucișat

de

frecvențe

se

numește

Un astfel de tabel încrucișat de frecvențe se nume ște contingență sau tabel cu două intrări
Un astfel de tabel încrucișat de frecvențe se nume ște contingență sau tabel cu două intrări

contingență sau tabel cu două intrări. Se mai numește și tabel de tip 4 2. În general un tabel este de tip r c.

Tabele de contingență

Tabel încrucișat pentru două variabile categoriale::

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,

1994)

funcție de grupele stării civile (Meadows et al., 1994) Se dorește testarea ipotezei nule care stabilește
funcție de grupele stării civile (Meadows et al., 1994) Se dorește testarea ipotezei nule care stabilește
funcție de grupele stării civile (Meadows et al., 1994) Se dorește testarea ipotezei nule care stabilește

Se dorește testarea ipotezei nule care stabilește că nu există nici o

relație (asociere) între două variabile (de tip categorial).

(asociere) între două variabile (de tip categorial). Dacă eșantionul este mare putem să folosim testul hi-

Dacă eșantionul este mare putem folosim testul hi-pătrat. Dacă eșantionul este mic, vom folosim testul Fisher exact.

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

Ipoteza nulă: nu există nici o asociere între cele două variabile. Ipoteza alternativă: există o
Ipoteza nulă: nu există nici o asociere între cele două variabile.
Ipoteza alternativă: există o asociere de un anumit tip.

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6
82.6

Proporția de femei care au acceptat testul HIV este de 134/788. Deci din 486 de femei căsătorite ne aşteptăm (estimăm) ca 486 × 134/788 = 82.6 accepte testul HIV, dacă ipoteza nulă referitoare asociere este adevărată.

) ca 486 × 134/788 = 82.6 să accepte testul HIV, dacă ipoteza nulă referitoare asociere
) ca 486 × 134/788 = 82.6 să accepte testul HIV, dacă ipoteza nulă referitoare asociere
) ca 486 × 134/788 = 82.6 să accepte testul HIV, dacă ipoteza nulă referitoare asociere

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6 403.4
82.6
403.4

Proporția de femei care au refuzat testul este = 654/788. Deci din 486 de femei căsătorite, ne aşteptăm ca 486 × 654/788 = 403.4 refuze testul, dacă ipoteza nulă este adevărată. Se observă că 82.6 + 403.4 = 486.

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6 403.4 37.8 184.2
82.6
403.4
37.8
184.2

Pentru 222 femei necasătorite care au un partener ne aşteptăm ca 222 × 134/788 = 37.8 accepte testul la HIV, dacă ipoteza nulă

este adevărată. Pentru 222 femei necasătorite care au un partener

ne aşteptăm ca 222 × 654/788 = 184.2 refuze testul dacă ipoteza nulă este adevărată. Din nou se observă că 37.8 + 184.2 = 222.

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6 403.4 37.8 184.2 8.5 41.5 5.1 29.9
82.6
403.4
37.8
184.2
8.5
41.5
5.1
29.9

Se observă că 82.6 + 37.8 + 8.5 + 5.1 = 134.0 şi 403.4 + 184.2 + 41.5 + 24.9 = 654.0. Frecvențele observate şi cele estimate au același total pe rânduri şi pe coloane.

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6 403.4 37.8 184.2 8.5 41.5 5.1 29.9
82.6
403.4
37.8
184.2
8.5
41.5
5.1
29.9
et al., 1994) 82.6 403.4 37.8 184.2 8.5 41.5 5.1 29.9 Frecvențele așteptate ( estimate )

Frecvențele așteptate (estimate) dacă ipoteza nulă este adevărată:

totalliniex totalcoloana

totalgeneral

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

82.6 403.4 37.8 184.2 8.5 41.5 5.1 29.9
82.6
403.4
37.8
184.2
8.5
41.5
5.1
29.9

Se compară frecvențele observate cu cele estimate. Se adună (observat - aşteptat) 2 /aşteptat pentru fiecare celulă din tabel și se obține 9.15. Daipoteza nulă este adevărată și dimensiunea eșantioanelor este

suficient de mare, atunci această statistică urmează distribuția hi-pătrat,

suficient de mare, atunci această statistică urmeaz ă distribuția hi- pătrat, adesea notată cu  2

Distribuția hi-pătrat

Familii de distribuții, cu un parametru numit grade de libertate.

1 grad de libertate 3 grade de libertate 6 grade de libertate 15 grade de
1 grad de libertate
3 grade de libertate
6 grade de libertate
15 grade de libertate
Densitate de
probabilitate
Densitate de
probabilitate
Densitate de
probabilitate
Densitate de
probabilitate

Valori critice pentru distribuția hi-

pătrat

d.f.-2 9.49 Hi-pătrat cu 4 grade de libertate (d.f.) Densitate de probabilitate
d.f.-2
9.49
Hi-pătrat cu 4 grade de libertate (d.f.)
Densitate de probabilitate

Valori critice pentru distribuția hi-

pătrat

Valori critice pentru distribuția hi - pătrat

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

Pentru un tabel de contingență, gradele de libertate sunt date de: (nr de rânduri –
Pentru un tabel de contingență, gradele de libertate sunt date de:
(nr de rânduri – 1) x (nr de coloane – 1).
Avem (4 - 1) × (2 - 1) = 3 grade de libertate (d.f.), X 2 = 9.15, d.f. = 3.

Valori critice pentru distribuția hi-

pătrat

Valori critice pentru distribuția hi - pătrat

Testul hi-pătrat pentru asociere

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

funcție de grupele stării civile (Meadows et al., 1994) Pentru un tabel de contingență gradele de

Pentru un tabel de contingență gradele de libertate sunt date de:

(nr de rânduri – 1) x (nr de coloane 1). Avem (4 - 1) × (2 - 1) = 3 grade de libertate (d.f.). X 2 = 9.15, d.f. = 3, p < 0.05. Cu ajutorul unui program: p = 0.027 = 0.03

1) = 3 grade de libertate (d.f.). X 2 = 9.15 , d.f. = 3, p
1) = 3 grade de libertate (d.f.). X 2 = 9.15 , d.f. = 3, p

Testul hi-pătrat pentru asociere

Statistica testului urmează o distribuție hi-pătrat care furnizează valori așteptate (estimate) destul de mari. Acesta este un test care se folosește în cazul în care eșantioanele sunt destul de mari.

în cazul în care eșantioanele sunt destul de mari . Cu cât sunt mai mici valorile

Cu cât sunt mai mici valorile estimate cu atât testul va deveni

mai nesigur.

Criteriul convențional pentru ca testul fie valid este următorul: cel puțin 80% din frecvențele estimate depăşesc valoarea 5 şi toate frecvențele estimate depăşesc valoarea 1.

și sub numele de testul hi-pătrat Pearson.
și sub numele de testul hi-pătrat Pearson.

Testul hi-pătrat pentru asociere este, de asemenea, cunoscut

Testul hi-pătrat pentru asociere

Statistica

asociere.

Dacă dublăm frecvențele, valoarea statisticii testului se dublează și ea, însă puterea de asociere rămâne neschimbată.

de

hi-pătrat

este

index

al

nu

un

puterii

Măsuri de asociere (direcția, putere):

- Lambda, Cramer (una din variabile nominală) - Somers (ambele ordinale)

Testul exact Fisher

Testul exact Fisher Este, de asemenea, cunoscut și sub numele de testul exact Fisher-Irwin . Aceasta

Este, de asemenea, cunoscut și sub numele de testul exact Fisher-Irwin. Aceasta se poate aplica pentru orice tip de eşantion. Este folosit în general numai pentru eșantioane mici în tabele de tip 2 x 2 din cauza problemelor de calcul.

Se calculează probabilitățile tuturor tabelelor posibile

care au date totalurile pe rînduri și coloane. Se însumează apoi probabilitățile pentru toate tabelele

pentru care am obținut probabilități mai mici decât cea

observată.

probabilitățile pentru toate tabelele pentru care am obținut probabilități mai mici decât cea observată .
probabilitățile pentru toate tabelele pentru care am obținut probabilități mai mici decât cea observată .

Testul exact Fisher

Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al., 1994)

funcție de grupele stării civile (Meadows et al., 1994) Testul hi- pătrat pentru asociere: X 2
funcție de grupele stării civile (Meadows et al., 1994) Testul hi- pătrat pentru asociere: X 2

Testul hi-pătrat pentru asociere: X 2 = 9.15, d.f. = 3, p = 0.027. Testul Fisher exact: p = 0.029.

et al., 1994) Testul hi- pătrat pentru asociere: X 2 = 9.15, d.f. = 3, p

Corecția Yates

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

?
?
în funcție de tipul de bandaj (Callam et al., 1992) ? Testul Fisher exact: p =

Testul Fisher exact: p = 0.0049. Testul hi-pătrat pentru asociere: X 2 = 8.87, p = 0.0029.

Corecția Yates

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Testul Fisher exact: p = 0.0049.

Testul Fisher exact: p = 0.0049. Testul hi-pătrat pentru asociere: X 2 = 8.87, p = 0.0029.

Rezultatele sunt destul de diferite, deşi ambele conduc la aceeaşi concluzie. Explicație: o frecvență estimată (așteptată) este mică.

Testul Fisher exact produce valoarea p ”corectă”. Testul hi-pătrat conduce la o valoare p care este prea mică.

Corecția Yates

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Testul Fisher exact: p = 0.0049.

Testul Fisher exact: p = 0.0049. Testul hi-pătrat pentru asociere: X 2 = 8.87, p = 0.0029.

Yates a introdus o modificare a testului hi-pătrat pentru tabele de tip 2 x 2 ale cărui valori aproximează foarte bine probabilitățile

obținute în testul Fisher exact.

Aceasta este cunoscută sub denumirea de corecția de continuitate.

obținute în testul Fisher exact. Aceasta este cunoscută sub denumirea de corecția de continuitate .

Corecția Yates

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Testul Fisher exact: p = 0.0049.
în funcție de tipul de bandaj (Callam et al., 1992) Testul Fisher exact: p = 0.0049.

Testul Fisher exact: p = 0.0049.

Testul hi-pătrat pentru asociere: X 2 = 8.87, p = 0.0029. Testul hi-pătrat cu corecția de continuitate: X 2 = 7.84, p = 0.0051. Corecția de continuitate Yates este rar folosită, în locul acesteia fiind preferate testele exacte.

p = 0.0051. Corecția de continuitate Yates este rar folosită, în locul acesteia fiind preferate testele

Testul hi-pătrat pentru tendințe

Numărul de vizite înainte de naștere în funcție de tipul unității într-un studiu desfăsurat într-o maternitate din Scoția (Hundley et al., 2002)

în funcție de tipul unității într -un studiu desfăsurat într -o maternitate din Scoția (Hundley et

Testul hi-pătrat pentru tendințe

Numărul de vizite înainte de naștere în funcție de tipul unității într-un studiu desfăsurat într-o maternitate din Scoția (Hundley et al., 2002)

într -o maternitate din Scoția (Hundley et al., 2002) Testul hi- pătrat : X 2 =
într -o maternitate din Scoția (Hundley et al., 2002) Testul hi- pătrat : X 2 =
într -o maternitate din Scoția (Hundley et al., 2002) Testul hi- pătrat : X 2 =

Testul hi-pătrat: X 2 = 11.36, df = 3 și p = 0.01. Testul nu ia în calcul ordinea categoriilor!

p = 0.01. Testul nu ia în calcul ordinea categoriilor! Testul hi- pătrat pentru tendinț e:
p = 0.01. Testul nu ia în calcul ordinea categoriilor! Testul hi- pătrat pentru tendinț e:

Testul hi-pătrat pentru tendințe: X 2 = 9.33, df = 1 și p = 0.002.

pentru tendinț e: X 2 = 9.33, df = 1 și p = 0.002. Testul hi-

Testul hi-pătrat pentru diferență: X 2 = 2.03, df = 2 și

p = 0.4.

(asociere care nu poate fi explicată liniar)

Raportul riscurilor RR (riscul relativ)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Se dorește o estimare a dimensiunii

Se dorește o estimare a dimensiunii efectului tratamentului.

dorește o estimare a dimensiunii efectului tratamentului. Diferența dintre proporții este de 0.538 - 0.284 =

Diferența dintre proporții este de 0.538 - 0.284 = 0.254 sau de 53.8% - 28.4% = 25.4% (diferența riscului). Proporția de vindecați (probabilitate) se numeşte “risculde

vindecare pentru această populație.

Raportul riscurilor = 53.8/28.4 = 1.89. (>1) Acesta mai este cunoscut și sub denumirea de risc relativ, raportul

ratelor sau RR.

Raportul riscurilor RR (riscul relativ)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Raportul riscurilor = 53.8/28.4 = 1.89.

Raportul riscurilor = 53.8/28.4 = 1.89.

Raportul riscurilor = raport => el are o distributie foarte dificilă (asimetrică!). Deci dacă vom considera logaritmul raportului ratelor, vom obține

ceva care se determină prin adăugare şi scădere de logaritmi ai

frecvențelor. Distribuția devine în acest caz aproximativ normală şi se poate calcula simplu o eroare standard când frecvențele nu sunt mici.

Raportul riscurilor RR (riscul relativ)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Raportul riscurilor , RR = 53.8/28.4

Raportul riscurilor, RR = 53.8/28.4 = 1.89. Log e (RR) = 0.6412 SE pentru Log e (RR) = 0.2256. 95% încredere pentru Log e (RR):

(0.6412 1.96×0.2256, 0.6412 + 1.96×0.2256)=

= (0.1990, 1.0834). 95% încredere pentru RR: (exp (0.1990), exp (1.0834)) = (1.22, 2.95)

Raportul riscurilor RR (riscul relativ)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Log e (RR) = 0.6412, 95%

Log e (RR) = 0.6412, 95% CI: (0.1990, 1.0834). Raportul riscurilor, RR = 53.8/28.4 = 1.89, 95% CI: (1.22, 2.95). Valoarea RR nu este mijlocul intervalului. Intervalul este simetric pe scala logaritmică și nu pe scala naturală. Testul hi-pătrat pentru asociere: X 2 = 8.87, p = 0.0029.

pe scala logaritmică și nu pe scala naturală . Testul hi- pătrat pentru asociere: X 2
pe scala logaritmică și nu pe scala naturală . Testul hi- pătrat pentru asociere: X 2

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Riscul de vindecare = 35/65 =

Riscul de vindecare = 35/65 = 0.538. Cota de vindecare = 35/30 = 1.17.

Cota =
Cota =

Riscul = numărul de apariții a evenimentului împărțit la numărul total.

de apariții ale evenimentului și numărul de neapariții ale

evenimentului. Riscul = 0.538 înseamnă că din 100 de persoane tratate 53.8 persoane se vindeca. Cota = 1.17 înseamnă că pentru fiecare 100 de persoane care nu se vindeca 117 persoane se vindecă.

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Cota de vindecare cu bandaje elastice

Cota de vindecare cu bandaje elastice = 35/30 = 1.17

Cota de vindecare cu bandaje inelastice = 19/48 = 0.40.

35/30

19/48

1.17

2.95

0.40

Raportulcotelor

Pentru fiecare persoană care nu se vindecă, de 2.95 ori mai multe

persoane se vor vindeca dacă folosesc bandaje elastice prin comparație cu cei care folosesc bandaje inelastice.

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Raportul cotelor, OR = (35/30)/(19/48) =

Raportul cotelor, OR = (35/30)/(19/48) = 2.95.

Ca și RR, OR are o distribuție ciudată iar interval de încredere va fi estimat în acelaşi mod. Vom folosi logaritmul raportul cotelor

pentru a aproxima această distribuție cu distribuția normală şi se

poate calcula simplu o eroare standard când frecvențele nu sunt mici.

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Raportul cotelor, OR = (35/30)/(19/48) =

Raportul cotelor, OR = (35/30)/(19/48) = 2.95. log e (OR)=log e (2.95)=1.0809 SE log e (OR)= 0.3679 95% CI pentru log e (OR):

= (1.0809 - 1.96 × 0.3679; 1.0809 + 1.96 × 0.3679) =(0.3598; 1.8020). 95% CI pentru log e (OR): (exp(0.3598), exp(1.8020)) = (1.43; 6.06)

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) log e (OR)=log e (2.95)=1.0809, 95%

log e (OR)=log e (2.95)=1.0809, 95% CI: (0.3598; 1.8020). Raportul cotelor, OR = (35/30)/(19/48) = 2.95, 95% CI: (1.43; 6.06). OR nu se află în mijlocul intervalului de încredere.

Intervalul este simetric pe scara log și nu pe scară naturală.

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Raportul cotelor pentru vindecați , OR

Raportul cotelor pentru vindecați, OR = (35/30)/(19/48) = 2.95.

Nu contează ordinea! Raportul cotelor pentru tratament, OR = (35/19)/(30/48) = 2.95.

cotelor pentru tratament , OR = (35/19)/(30/48) = 2.95. Ambele versiuni dau OR = (35 

Ambele versiuni dau OR = (3548)/(3019).

= 2.95. Ambele versiuni dau OR = (35  48)/(30  19). Numim acest raport ca

Numim acest raport ca raport de produse încrucişate.

Raportul cotelor OR

(riscul relativ estimat)

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Schimbând ordinea rândurilor sau coloanelor se

Schimbând ordinea rândurilor sau coloanelor se inversează raportul de

cote. Raportul cotelor pentru nevindecați: OR=(30/35)/(48/19)= 1/2.95=0.33.

Există numai două rapoarte posibile!

Pe scara logaritmică sunt egale și de semn opus. log e (2.95) = 1.082 şi log e (0.339) = -1.082

Raportul cotelor în studii

de tip caz-control

Raportul cotelor în studii de tip caz-control Un studiu de caz-control este un studiu în care
Raportul cotelor în studii de tip caz-control Un studiu de caz-control este un studiu în care

Un studiu de caz-control este un studiu în care se compară un grup de subiecți cu o anumită caracteristică care ne interesează, adică

grupul de cazuri, cu un alt grup fără acea caracteristică, adică

grupul de control. Istoricul fumatului la pacienții cu accident vascular cerebral

(cazurile) şi lotul de control, cu procente calculate pe rânduri

(Markus et al., 1995)

accident vascular cerebral (cazurile) şi lotul de control, cu procente calculate pe rânduri (Markus et al.

Raportul cotelor în studii

de tip caz-control

Raportul cotelor în studii de tip caz-control Pentru că s-a început cu împărțirea pacienților în cei

Pentru s-a început cu împărțirea pacienților în cei cu accident vascular cerebral şi cei din lotul de control, și nu cu fumatorii și nefumatorii, nu se poate estima procentul de fumători la cei care au accidente vasculare cerebrale. Nu putem calcula riscul de accident vascular cerebral pentru fumători sau pentru nefumători!

cerebral pentru fumători sau pentru nefumători ! Nu putem face raportul dintre acestea pentru a obține

Nu putem face raportul dintre acestea pentru a obține riscul relativ.

Putem, însă, evalua raportul cotelor:

OR = (71 x 101) / (30 x 36) = 6.64.

Raportul cotelor în studii

de tip caz-control

Se știe că accidentul vascular cerebral este o boala destul de comună deși incidența în populație nu este chiar foarte mare.

Noi nu ştim care este prevalența accidentului vascular

cerebral în rândul populației studiate care are vârsta cuprinsă între 35 şi 91 ani, dar se presupune este destul de mică. Pentru ilustrare, vom presupune este de 0.7%.

Dacă vom înmulți a frecvența pentru lotul de control cu 100,

proporția de pacienți cu accident vascular cerebral va fi de 0.7% (101/13801).

Raportul cotelor în studii

de tip caz-control

Date artificiale:

cotelor în studii de tip caz-control Date artificiale: Procentele pe rând sunt neschimbate şi, în

Procentele pe rând sunt neschimbate şi, în consecință, la fel este

raportul cotelor. Acesta are tot valoarea de 6.64.

OR = (71 x 10100) / (30 x 3600) = 6.64. Acum vom avea proporția corectă de indivizi cu accident vascular cerebral pentru fumători și nefumatori.

Riscul relativ va trebui fie, de asemenea, corectat:

RR = (71/3671) / (30/10130) = 6.53

Raportul cotelor în studii

de tip caz-control

Date artificiale:

cotelor în studii de tip caz-control Date artificiale: OR = (71 x 10100) / (30 x

OR = (71 x 10100) / (30 x 3600) = 6.64.

RR = (71/3671) / (30/10130) = 6.53

RR are valoare apropiată de OR! Acest lucru se datorează faptului că atunci când frecvențele
RR are valoare apropiată de OR!
Acest lucru se datorează faptului că atunci când frecvențele
dintr-o categorie sunt mult mai mici decât cele celelalte, OR şi RR
sunt aproape la fel.

Raportul cotelor în studii

de tip caz-control

Date originale:

cotelor în studii de tip caz-control Date originale: OR = (71 x 10100) / (30 x

OR = (71 x 10100) / (30 x 3600) = 6.64.

RR = (71/107) / (30/131) = 2.90 (nu în studiu de tip caz-control!!)

RR este foarte diferit de OR! Aceasta înseamnă că într-un studiu de caz-control, dacă caracteristica care ce definește cazurile este rară în populație, raportul cotelor poate fi folosit ca o estimare a riscului relativ.

ce definește cazurile este rară în populație, raportul cotelor poate fi folosit ca o estimare a

Folosirea lui OR si a lui RR

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Inversarea coloanele nu duce la obținerea
în funcție de tipul de bandaj (Callam et al., 1992) Inversarea coloanele nu duce la obținerea

Inversarea coloanele nu duce la obținerea valorii inverse pentru RR!

Raportul riscurilor pentru nevindecați considerând bandajul elastic:

RR = (30/65) / (48/67) = 0.644. Raportul riscurilor pentru vindecați considerând bandajul elastic:

riscurilor pentru vindecați considerând bandajul elastic: RR = (35/65) / (19/67) = 1.89 1/1.89 = 0.529

RR = (35/65) / (19/67) = 1.89

1/1.89 = 0.529 și nu 0.644.

Folosirea lui OR si a lui RR

Două tabele ipotetice:

Folosirea lui OR si a lui RR Două tabele ipotetice: Aceste tabele au aceleaşi date, RR-uri
Aceste tabele au aceleaşi date, RR-uri diferite și aceleaşi OR.
Aceste tabele au aceleaşi date, RR-uri diferite și aceleaşi OR.

OR este o măsură mult mai bună a puterii relației decât RR.

RR are o interpretare mult mai intuitivă şi este mult mai ușor de înțeles de majoritatea oamenilor. OR este mult mai convenabil pentru analiza statistică.

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Diferența dintre proporții este de 0.538

Diferența dintre proporții este de 0.538 - 0.284 = 0.254,

sau Cât de mulți oameni trebuie se trateze cu bandaj elastic în loc de inelastic pentru a vindeca sau pentru a beneficia o singură persoană în plus? Nr de persoane suplimentar vindecate pe nr de persoane tratate = 0.254. Numărul necesar de pacienți care trebuie tratați pt a salva un pacient (sau pentru a preveni apariția unui efect negativ) NNT = 1/0.254 = 3.9. Clar un NNT (number needed to treat) mic este bun!

53.8% - 28.4% = 25.4%.

unui efect negativ) NNT = 1/0.254 = 3.9. Clar un NNT (number needed to treat) mic

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Numărul necesar de tratamente = 1/0.254

Numărul necesar de tratamente = 1/0.254 = 3.9.

Pentru fiecare 3.9 persoane tratate mai degrabă cu bandaj elastic decât inelastic se estimează că o persoană în plus va fi vindecată. Vom calcula 95% CI pentru diferența dintre cele două proporții şi apoi se

inversează.

Diferență: 95% CI = (0.093; 0.417). NNT: 95% CI =(1/0.093, 1/0.417) adică de la 10.8 la 2.4.

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Numărul necesar de tratamente = 1/0.254

Numărul necesar de tratamente = 1/0.254 = 3.9.

Diferență: 95% CI = (0.093; 0.417). NNT: 95% CI =(1/0.093, 1/0.417) adică de la 10.8 la 2.4. Adică punând valorile în ordinea corectă 95% CI = (2.4, 10.8).

NNT se obține direct atunci când diferența este semnificativă şi intervalul de încredere pentru diferență
NNT se obține direct atunci când diferența este semnificativă şi
intervalul de încredere pentru diferență nu include zero.

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) Diferența = 0.133, NNT = 1/0.133

Diferența = 0.133, NNT = 1/0.133 = 7.5.

Diferență: 95% CI = (-0.059, 0.324). 95% CI include valoarea 0.0 iar diferența nu este semnificativă statistic (hi-pătrat = 1.81, df = 1, p = 0.2)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1)

Ce înseamnă aceste limite?

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) NNT: 95% CI = (1/(-0.059), 1/0.324)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1)

Ce înseamnă aceste limite? NNT poate fi negativ? Un NNT negativ apare când proporția de vindecați pentru tratamentul testat (bandaj elastic) este mai mică decât proporția de vindecați pentru

tratamentul de control (bandaj inelastic). Tratamentul face mai mult rău

decât bine. În acest caz avem numărul necesar de pacienți tratați pentru care apare un efect negativ, notat cu NNTH (number needed to treat to harm), sau NNH.

Numărul necesar de pacienți care

trebuie tratați

Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de bandaj (Callam et al., 1992)

în funcție de tipul de bandaj (Callam et al., 1992) NNT: 95% CI = (1/(-0.059), 1/0.324)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1)

Ce înseamnă aceste limite? Astfel NNT nu poate fi între -1 şi +1. Diferența = 0.0 atunci NNT va fi infinit, adică indiferent de cât de mulți pacienți vor fi tratați nici o persoana în plus nu se va vindeca sau nu va fi afectată.

Numărul necesar de pacienți care

trebuie tratați

Când diferența nu este semnificativă, intervalul de încredere va avea cel puțin una din limitele infinit.

Studiul 1 : Valori imposibile Valori imposibile ”95% CI = (3.1; ), NNTH = (17.5;
Studiul 1 :
Valori imposibile
Valori imposibile
”95% CI = (3.1; ),
NNTH = (17.5; )”
sau
”95% CI = (3.1; ),
NNTH = (-; -17.5)”.
Valori imposibile
Numărul studiului
Numărul studiului
Numărul necesar de pacienți care trebuie tratați nu este de nici
un ajutor atunci când diferența nu este semnificativă!
Diferența între proporțiile de vindecați
NNT

Date în perechi sau studii dublu

Date binare:

încrucișate

Testul McNemar, similar cu testul semnelor, corespunzător

intervalului

de

încredere

proporții. Categorii ordonate:

Testul semnelor

pentru

Categorii neordonate:

Foarte rare în evaluările clinice.

diferența

între

două

Algoritmi, baze de date şi sisteme de gestiune a bazelor de date

Algoritmi, baze de date şi

sisteme de gestiune a

Algoritmi, baze de date şi sisteme de gestiune a bazelor de date

bazelor de date

Algoritmi şi baze de date

Algoritm = secvență “finită” de instrucțiuni, fiecare putând fi efectuată într-un timp determinat şi “rezonabil”.

Exemplu:

dacă BMI>26 şi Vârsta=14 şi Sexul=M, atunci Cat=“obez”

Datele primare:

-Vârstă

14

-Sex

M

1.74

82.5

G

BMI

2 I
2
I

-Înălțime

5%=15.9

85%=22.6

95%=26

-Greutate

se înregistrează în baze de date.

BMI se calculează!

26.9

58

Sisteme de gestiune a bazelor de date

Dată - două înțelesuri principale:

1) reprezentare formalizată a unor fapte, concepte sau

instrucțiuni, adecvată comunicării, interpretării umane

sau prelucrării automate; 2) reprezentare prin caractere cărora li s-a atribuit un înțeles

Aceeaşi dată poate fi înregistrată, pe suportul fizic, în multiple

feluri. De exemplu, numărul 123 ar putea fi plasat – într-o

memorie fie prin reprezentarea sa binară:

0 1 1 1 1 0 1 1

fie ca succesiune de cifre 1”, “2”, “3reprezentate ASCII,

adică astfel:

0 0 1 1 0 0 0 1

0 0 1 1 0 0 1 0

59

0 0 1 1 0 0 1 1

Sisteme de gestiune a bazelor de date

Sisteme de gestiune a bazelor de date Logic : BD = colecție de date cu legături

Logic: BD = colecție de date cu legături între ele. Informatic: BD = ansamblu complex de diverse obiecte informatice. Cele mai importante sunt tabelele de date.

Tabelele de date sunt formate din înregistrări (records), organizate în câmpuri (fields) de diverse tipuri.

sex vârsta greutate … M 14 86.5
sex
vârsta
greutate
M
14 86.5

Înregistrare (obiect concret)

Câmp (atribut al obiectelor)

Valoare a înregistrării/liniei (compatibilă cu tipul câmpului)

Sisteme de gestiune a bazelor de date

Toate înregistrările dintr-un tabel trebuie fie asociate cu obiecte (“entităţi”) similare ! Datele provenite de la o “entitate” (un “individ”) pot fie

stocate în tabele separate!

Recomandare: datele personale de identificare (CNP, data naşterii, numele/prenumele NU SE ÎNREGISTREAZĂ în acelaşi tabel cu diagnosticul sau medicația prescrisă!

Între două tabele de date pot exista legături, de trei tipuri:

- una-la-una (1)

- una-la-multe (2)

- multe-la-multe (3)

(1) (3) (2)
(1)
(3)
(2)

Sisteme de gestiune a bazelor de date

Identificarea unei anumite înregistrări: prin folosirea aşa-numitelor chei primare (primary key). O cheie primară este o formulă de identificare (unică) a înregistrării pe

baza valorilor din anumite câmpuri.

Fiecare dată particulară stocată în baza de date va fi accesibilă prin indicarea adreseisale, care se “calculează” rapid odată cunoscute

numele tabelului de date, numele câmpului şi valoarea cheii primare.

Exemple de sisteme de gestiune a bazelor de date:

(Microsoft) Access, componentă a suitei Office, (Microsoft) SQL Server, (Microsoft) Visual FoxPro,

(IBM) DB2,

Oracle,

MySQL.