Sunteți pe pagina 1din 62

Analiza datelor calitative

Conținutul acestui curs:


• Tabele de contingență
• Testul hi-pătrat pentru asociere
• Distribuția hi-pătrat
• Valori critice pentru distribuția hi-pătrat
• Testul exact Fisher
• Corecția Yates
• Testul hi-pătrat pentru tendințe
• Raportul riscurilor RR (riscul relativ)
• Raportul cotelor OR (riscul relativ estimat)
• Nr. necesar de pacienți care trebuie tratați (NNT)
Analiza datelor calitative
Datele calitative sunt numite adesea și nominale sau
categoriale și apar atunci când se pot clasifica subiecții în
două sau mai multe categorii.
Variabile categorice cu doar două categorii, sunt numite
dicotomice sau binare.
Metode:
 Testul hi-pătrat de asociere
 Testul Fisher exact,
 Raportul riscurilor (RR), riscul relativ sau raportul șanselor,
 Raportul cotelor (OR) sau riscul relativ estimat
 Numărul necesar de tratamente.
Tabele de contingență
Tabel încrucișat pentru două variabile categoriale:
Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,
1994)

Meadows J, Jenkinson S, Catalan J. (1994) Who chooses to have the HIV antibody test in the antinatal clinic? Midwifery 10, 44-48.
Tabele de contingență
Tabel încrucișat pentru două variabile categoriale:
Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,
1994)

Un astfel de tabel încrucișat de frecvențe se numește tabel de


contingență sau tabel cu două intrări.
Se mai numește și tabel de tip 4  2. În general un tabel este de tip r  c.
Tabele de contingență
Tabel încrucișat pentru două variabile categoriale::
Acceptarea testului HIV în funcție de grupele stării civile (Meadows et al.,
1994)

Se dorește testarea ipotezei nule care stabilește că nu există nici o


relație (asociere) între două variabile (de tip categorial).
Dacă eșantionul este mare putem să folosim testul hi-pătrat.
Dacă eșantionul este mic, vom folosim testul Fisher exact.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

Ipoteza nulă: nu există nici o asociere între cele două variabile.


Ipoteza alternativă: există o asociere de un anumit tip.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6

Proporția de femei care au acceptat testul HIV este de 134/788


(17.0%).
Deci din 486 de femei căsătorite ne aşteptăm (estimăm) ca
486 × 134/788 = 82.6 să accepte testul HIV, dacă ipoteza nulă
referitoare asociere este adevărată.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6 403.4

Proporția de femei care au refuzat testul este = 654/788.


Deci din 486 de femei căsătorite, ne aşteptăm ca 486 × 654/788 =
403.4 să refuze testul, dacă ipoteza nulă este adevărată.
Se observă că 82.6 + 403.4 = 486.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2

Pentru 222 femei necasătorite care au un partener ne aşteptăm ca


222 × 134/788 = 37.8 să accepte testul la HIV, dacă ipoteza nulă
este adevărată. Pentru 222 femei necasătorite care au un partener
ne aşteptăm ca 222 × 654/788 = 184.2 să refuze testul dacă ipoteza
nulă este adevărată. Din nou se observă că 37.8 + 184.2 = 222.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Se observă că 82.6 + 37.8 + 8.5 + 5.1 = 134.0 şi


403.4 + 184.2 + 41.5 + 24.9 = 654.0.
Frecvențele observate şi cele estimate au același total pe rânduri şi
pe coloane.
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Frecvențele așteptate (estimate) dacă ipoteza nulă este adevărată:


total liniex totalcoloana
totalgeneral
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Se compară frecvențele observate cu cele estimate.


Se adună (observat - aşteptat)2/aşteptat pentru fiecare celulă din tabel și
se obține 9.15.
Dacă ipoteza nulă este adevărată și dimensiunea eșantioanelor este
suficient de mare, atunci această statistică urmează distribuția hi-pătrat,
adesea notată cu 2.
Distribuția hi-pătrat
Familii de distribuții, cu un parametru numit grade de libertate.
probabilitate

probabilitate
Densitate de

Densitate de
1 grad de libertate 3 grade de libertate
probabilitate

probabilitate
Densitate de

Densitate de

6 grade de libertate 15 grade de libertate


Valori critice pentru distribuția hi-
pătrat
Densitate de probabilitate
d.f.-2
Test unilateral!!

9.49

Hi-pătrat cu 4 grade de libertate (d.f.)


Valori critice pentru distribuția hi-
pătrat
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

Pentru un tabel de contingență, gradele de libertate sunt date de:


(nr de rânduri – 1) x (nr de coloane – 1).
Avem (4 - 1) × (2 - 1) = 3 grade de libertate (d.f.), X2 = 9.15, d.f. = 3.
Valori critice pentru distribuția hi-
pătrat
Testul hi-pătrat pentru asociere
Acceptarea testului HIV în funcție de grupele stării civile (Meadows et
al., 1994)

Pentru un tabel de contingență gradele de libertate sunt date de:


(nr de rânduri – 1) x (nr de coloane – 1).
Avem (4 - 1) × (2 - 1) = 3 grade de libertate (d.f.).
X2 = 9.15, d.f. = 3, p < 0.05. Cu ajutorul unui program: p = 0.027 = 0.03
Testul hi-pătrat pentru asociere
Statistica testului urmează o distribuție hi-pătrat care
furnizează valori așteptate (estimate) destul de mari.
Acesta este un test care se folosește în cazul în care
eșantioanele sunt destul de mari.
Cu cât sunt mai mici valorile estimate cu atât testul va deveni
mai nesigur.
Criteriul convențional pentru ca testul să fie valid este
următorul: cel puțin 80% din frecvențele estimate depăşesc
valoarea 5 şi toate frecvențele estimate depăşesc valoarea 1.
Testul hi-pătrat pentru asociere este, de asemenea, cunoscut
și sub numele de testul hi-pătrat Pearson.
Testul hi-pătrat pentru asociere
Statistica hi-pătrat nu este un index al puterii de
asociere.
Dacă dublăm frecvențele, valoarea statisticii testului se
dublează și ea, însă puterea de asociere rămâne
neschimbată.
Măsuri de asociere (direcția, putere):
- Lambda, Cramer (una din variabile categoriala)
- Somers (ambele categoriale ordonate)
Testul exact Fisher
Este, de asemenea, cunoscut și sub numele de testul
exact Fisher-Irwin.
Aceasta se poate aplica pentru orice tip de eşantion.
Este folosit în general numai pentru eșantioane mici în
tabele de tip 2 x 2 din cauza problemelor de calcul.
Se calculează probabilitățile tuturor tabelelor posibile
care au acelasi total pe rînduri și coloane.
Se însumează apoi probabilitățile pentru toate tabelele
pentru care am obținut probabilități mai mici decât cea
observată.
Testul exact Fisher
Acceptarea testului HIV în funcție de grupele stării civile (Meadows
et al., 1994)

Testul hi-pătrat pentru asociere: X2 = 9.15, d.f. = 3, p = 0.027.


Testul Fisher exact: p = 0.029.
Corecția Yates
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049. ?


Testul hi-pătrat pentru asociere: X2 = 8.87, p = 0.0029.
Corecția Yates
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-pătrat pentru asociere: X2 = 8.87, p = 0.0029.
Rezultatele sunt destul de diferite, deşi ambele conduc la aceeaşi
concluzie. Explicație: o frecvență estimată (așteptată) este mică.
Testul Fisher exact produce valoarea p ”corectă”. Testul hi-pătrat
conduce la o valoare p care este prea mică.
Corecția Yates
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-pătrat pentru asociere: X2 = 8.87, p = 0.0029.
Yates a introdus o modificare a testului hi-pătrat pentru tabele de
tip 2 x 2 ale cărui valori aproximează foarte bine probabilitățile
obținute în testul Fisher exact.
Aceasta este cunoscută sub denumirea de corecția de continuitate.
Corecția Yates
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-pătrat pentru asociere: X2 = 8.87, p = 0.0029.
Testul hi-pătrat cu corecția de continuitate: X2 = 7.84, p = 0.0051.
Corecția de continuitate Yates este rar folosită, în locul acesteia
fiind preferate testele exacte.
Testul hi-pătrat pentru tendințe
Numărul de vizite înainte de naștere în funcție de tipul unității într-un
studiu desfăsurat într-o maternitate din Scoția (Hundley et al., 2002)
Testul hi-pătrat pentru tendințe
Numărul de vizite înainte de naștere în funcție de tipul unității într-un
studiu desfăsurat într-o maternitate din Scoția (Hundley et al., 2002)

Testul hi-pătrat: X2 = 11.36, df = 3 și p = 0.01.


Testul nu ia în calcul ordinea categoriilor!
Testul hi-pătrat pentru tendințe: X2 = 9.33, df = 1 și p = 0.002.
Testul hi-pătrat pentru diferență: X2 = 2.03, df = 2 și p = 0.4.
(asociere care să nu poate fi explicată liniar)
Raportul riscurilor RR (riscul relativ)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Se dorește o estimare a dimensiunii efectului tratamentului.


Diferența dintre proporții este de 0.538 - 0.284 = 0.254 sau de
53.8% - 28.4% = 25.4% (diferența riscului).
Proporția de vindecați (probabilitate) se numeşte “riscul” de
vindecare pentru această populație.
Raportul riscurilor = 53.8/28.4 = 1.89. (pE/pI>1)
Acesta mai este cunoscut și sub denumirea de risc relativ, raportul
ratelor sau RR.
Raportul riscurilor RR (riscul relativ)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Raportul riscurilor = 53.8/28.4 = 1.89.


Raportul riscurilor = raport => el are o distributie foarte dificilă
(asimetrică!).
Deci dacă vom considera logaritmul raportului ratelor, vom obține
ceva care se determină prin adăugare şi scădere de logaritmi ai
frecvențelor.
Distribuția devine în acest caz aproximativ normală şi se poate
calcula simplu o eroare standard când frecvențele nu sunt mici.
Raportul riscurilor RR (riscul relativ)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Raportul riscurilor, RR = 53.8/28.4 = 1.89.


Loge(RR) = 0.6412
SE pentru Loge(RR) = 0.2256.
95% încredere pentru Loge(RR):
(0.6412 – 1.96×0.2256, 0.6412 + 1.96×0.2256)=
= (0.1990, 1.0834).
95% încredere pentru RR: (exp (0.1990), exp (1.0834)) = (1.22, 2.95)
Raportul riscurilor RR (riscul relativ)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Loge(RR) = 0.6412, 95% CI: (0.1990, 1.0834).


Raportul riscurilor, RR = 53.8/28.4 = 1.89, 95% CI: (1.22, 2.95).
Valoarea RR nu este mijlocul intervalului.
Intervalul este simetric pe scala logaritmică și nu pe scala naturală.
Testul hi-pătrat pentru asociere: X2 = 8.87, p = 0.0029.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de tipul de
bandaj (Callam et al., 1992)

Riscul de vindecare = 35/65 = 0.538.


Cota de vindecare = 35/30 = 1.17.
Riscul = numărul de apariții a evenimentului / numărul total.
Cota = numărul de apariții ale evenimentului / numărul de neapariții ale
evenimentului.
Riscul = 0.538 înseamnă că din 100 de persoane tratate 53.8 persoane se
vindeca.
Cota = 1.17 înseamnă că pentru fiecare 100 de persoane care nu se vindeca
117 persoane se vindecă.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Cota de vindecare cu bandaje elastice = 35/30 = 1.17


Cota de vindecare cu bandaje inelastice = 19/48 = 0.40.
35/30 1.17
Raportul cotelor    2.95
19/48 0.40
Pentru fiecare persoană care nu se vindecă, de 2.95 ori mai multe
persoane se vor vindeca dacă folosesc bandaje elastice prin
comparație cu cei care folosesc bandaje inelastice.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor, OR = (35/30)/(19/48) = 2.95.


Ca și RR, OR are o distribuție ciudată iar interval de încredere va fi
estimat în acelaşi mod. Vom folosi logaritmul raportul cotelor
pentru a aproxima această distribuție cu distribuția normală şi se
poate calcula simplu o eroare standard când frecvențele nu sunt
mici.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor, OR = (35/30)/(19/48) = 2.95.


loge(OR)=loge (2.95)=1.0809
SE loge(OR)= 0.3679
95% CI pentru loge(OR):
= (1.0809 - 1.96 × 0.3679; 1.0809 + 1.96 × 0.3679)
=(0.3598; 1.8020).
95% CI pentru loge(OR): (exp(0.3598), exp(1.8020)) = (1.43; 6.06)
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

loge(OR)=loge (2.95)=1.0809, 95% CI: (0.3598; 1.8020).


Raportul cotelor, OR = (35/30)/(19/48) = 2.95, 95% CI: (1.43; 6.06).
OR nu se află în mijlocul intervalului de încredere.
Intervalul este simetric pe scara log și nu pe scară naturală.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor pentru vindecați, OR = (35/30)/(19/48) = 2.95.


Nu contează ordinea!
Raportul cotelor pentru tratament, OR = (35/19)/(30/48) = 2.95.
Ambele versiuni dau OR = (3548)/(3019).
Numim acest raport ca raport de produse încrucişate.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Schimbând ordinea rândurilor sau coloanelor se inversează raportul de


cote.
Raportul cotelor pt trat (bandajul elastic): OR = (35/19)/(30/48) = 2.95
Raportul cotelor pt trat (bandajul inelastic): OR=(19/48)/(35/30)= 1/2.95=0.33.
Există numai două rapoarte posibile!
Pe scara log sunt egale și de semn opus: loge(2.95) = 1.082 şi loge(0.339) = -1.082.
Raportul cotelor în studii
de tip caz-control
Un studiu de caz-control este un studiu în care se compară un grup
de subiecți cu o anumită caracteristică care ne interesează, adică
grupul de cazuri, cu un alt grup fără acea caracteristică, adică
grupul de control.
Istoricul fumatului la pacienții cu accident vascular cerebral
(cazurile) şi lotul de control, cu procente calculate pe rânduri
(Markus et al., 1995)
Raportul cotelor în studii
de tip caz-control

Pentru că s-a început cu împărțirea pacienților în cei cu accident vascular


cerebral şi cei din lotul de control, și nu cu fumatorii și nefumatorii, nu se
poate estima procentul de fumători la cei care au accidente vasculare
cerebrale.
Nu putem calcula riscul de accident vascular cerebral pentru fumători
sau pentru nefumători!
Nu putem face raportul dintre acestea pentru a obține riscul relativ.
Putem, însă, evalua raportul cotelor:
OR = (71 x 101) / (30 x 36) = 6.64.
Raportul cotelor în studii
de tip caz-control
Se știe că accidentul vascular cerebral este o boala destul de
comună deși incidența în populație nu este chiar foarte mare.
Noi nu ştim care este prevalența accidentului vascular
cerebral în rândul populației studiate care are vârsta cuprinsă
între 35 şi 91 ani, dar se presupune că este destul de mică.
Pentru ilustrare, vom presupune că este de 0.7%.
Dacă vom înmulți a frecvența pentru lotul de control cu 100,
proporția de pacienți cu accident vascular cerebral va fi de
0.7% (101/13801).
Raportul cotelor în studii
de tip caz-control
Date artificiale:

Procentele pe rând sunt neschimbate şi, în consecință, la fel este


raportul cotelor. Acesta are tot valoarea de 6.64.
OR = (71 x 10100) / (30 x 3600) = 6.64.
Acum vom avea proporția corectă de indivizi cu accident vascular
cerebral pentru fumători și nefumatori.
Riscul relativ va trebui să fie, de asemenea, corectat:
RR = (71/3671) / (30/10130) = 6.53
Raportul cotelor în studii
de tip caz-control
Date artificiale:

OR = (71 x 10100) / (30 x 3600) = 6.64.


RR = (71/3671) / (30/10130) = 6.53
RR are valoare apropiată de OR!
Acest lucru se datorează faptului că atunci când frecvențele
dintr-o categorie sunt mult mai mici decât cele celelalte, OR şi RR
sunt aproape la fel.
Raportul cotelor în studii
de tip caz-control
Date originale:

OR = (71 x 10100) / (30 x 3600) = 6.64.


RR = (71/107) / (30/131) = 2.90 (nu în studiu de tip caz-control!!)
RR este foarte diferit de OR!
Aceasta înseamnă că într-un studiu de caz-control, dacă
caracteristica care ce definește cazurile este rară în populație,
raportul cotelor poate fi folosit ca o estimare a riscului relativ.
Folosirea lui OR si a lui RR
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Inversarea coloanele nu duce la obținerea valorii inverse pentru RR!


Raportul riscurilor pentru nevindecați considerând bandajul elastic:
RR = (30/65) / (48/67) = 0.644.
Raportul riscurilor pentru vindecați considerând bandajul elastic:
RR = (35/65) / (19/67) = 1.89
1/1.89 = 0.529 și nu 0.644.
Folosirea lui OR si a lui RR
Două tabele ipotetice:

Aceste tabele au aceleaşi date, RR-uri diferite și aceleaşi OR.


OR este o măsură mult mai bună a puterii relației decât RR.
RR are o interpretare mult mai intuitivă şi este mult mai ușor de
înțeles de majoritatea oamenilor.
OR este mult mai convenabil pentru analiza statistică.
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Diferența dintre proporții este de 0.538 - 0.284 = 0.254,


sau 53.8% - 28.4% = 25.4%.
Cât de mulți oameni trebuie să se trateze cu bandaj elastic în loc de inelastic
pentru a vindeca sau pentru a beneficia o singură persoană în plus?
Nr de persoane suplimentar vindecate pe nr de persoane tratate = 0.254.
Numărul necesar de pacienți care trebuie tratați pt a salva un pacient (sau
pentru a preveni apariția unui efect negativ) NNT = 1/0.254 = 3.9.
Clar un NNT (number needed to treat) mic este bun!
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Numărul necesar de tratamente = 1/0.254 = 3.9.


Pentru fiecare 3.9 persoane tratate mai degrabă cu bandaj elastic decât
inelastic se estimează că o persoană în plus va fi vindecată.
Vom calcula 95% CI pentru diferența dintre cele două proporții şi apoi se
inversează.
Diferență: 95% CI = (0.093; 0.417).
NNT: 95% CI =(1/0.093, 1/0.417) adică de la 10.8 la 2.4.
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Numărul necesar de tratamente = 1/0.254 = 3.9.


Diferență: 95% CI = (0.093; 0.417).
NNT: 95% CI =(1/0.093, 1/0.417) adică de la 10.8 la 2.4.
Adică punând valorile în ordinea corectă 95% CI = (2.4, 10.8).
NNT se obține direct atunci când diferența este semnificativă şi
intervalul de încredere pentru diferență nu include zero (NNT1!)
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

Diferența = 0.133, NNT = 1/0.133 = 7.5.


Diferență: 95% CI = (-0.059, 0.324).
95% CI include valoarea 0.0 iar diferența nu este semnificativă statistic
(hi-pătrat = 1.81, df = 1, p = 0.2)
NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??
Ce înseamnă aceste limite?
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??


Ce înseamnă aceste limite? NNT poate fi negativ?
Un NNT negativ apare când proporția de vindecați pentru tratamentul testat
(bandaj elastic) este mai mică decât proporția de vindecați pentru
tratamentul de control (bandaj inelastic). Tratamentul face mai mult rău
decât bine. În acest caz avem numărul necesar de pacienți tratați pentru
care apare un efect negativ, notat cu NNTH (number needed to treat to
harm), sau NNH.
Numărul necesar de pacienți care
trebuie tratați
Vindecarea rănilor pentru pacienți cu ulcer la gambă în funcție de
tipul de bandaj (Callam et al., 1992)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??


Ce înseamnă aceste limite?
Diferența = 0.0 atunci NNT va fi infinit, adică indiferent de cât de mulți
pacienți vor fi tratați nici o persoana în plus nu se va vindeca sau nu va fi
afectată.
Numărul necesar de pacienți care
trebuie tratați
Când diferența nu este semnificativă, intervalul de încredere va
avea cel puțin una din limitele infinit.
Diferența între proporțiile de vindecați

Valori imposibile Studiul 1 :


”95% CI = (3.1; ),
NNTH = (17.5; )”
NNT

Valori imposibile
sau
”95% CI = (3.1; ),
Valori imposibile
NNTH = (-; -17.5)”.

Numărul studiului Numărul studiului

Numărul necesar de pacienți care trebuie tratați nu este de nici


un ajutor atunci când diferența nu este semnificativă!
Date în perechi sau studii dublu
încrucișate
Date binare:
Testul McNemar, similar cu testul semnelor, corespunzător
intervalului de încredere pentru diferența între două
proporții.
Categorii ordonate:
Testul semnelor
Categorii neordonate:
Foarte rare în evaluările clinice.
Algoritmi, baze de date şi
sisteme de gestiune a
bazelor de date
Algoritmi şi baze de date

Algoritm = secvență “finită” de instrucțiuni, fiecare putând fi


efectuată într-un timp determinat şi “rezonabil”.
Exemplu:
dacă BMI>26 şi Vârsta=14 şi Sexul=M, atunci Cat=“obez”

Datele primare:
G
BMI  2 -Vârstă 14
I -Sex M
-Înălțime 1.74
5%=15.9 -Greutate 82.5
85%=22.6 se înregistrează în baze de date.
95%=26

BMI se calculează! 26.9


58
Sisteme de gestiune a bazelor de date
Dată - două înțelesuri principale:
1) reprezentare formalizată a unor fapte, concepte sau
instrucțiuni, adecvată comunicării, interpretării umane
sau prelucrării automate;
2) reprezentare prin caractere cărora li s-a atribuit un înțeles
Aceeaşi dată poate fi înregistrată, pe suportul fizic, în multiple
feluri. De exemplu, numărul 123 ar putea fi plasat – într-o
memorie – fie prin reprezentarea sa binară:
01111011
fie ca succesiune de cifre “1”, “2”, “3” reprezentate ASCII,
adică astfel:
00110001 00110010 00110011
59
Sisteme de gestiune a bazelor de date
Logic: BD = colecție de date cu legături între ele.
Informatic: BD = ansamblu complex de diverse obiecte
informatice. Cele mai importante sunt tabelele de date.

Tabelele de date sunt formate din


înregistrări (records), organizate în
câmpuri (fields) de diverse tipuri. sex vârsta greutate …

Înregistrare (obiect concret)


M 14 86.5
Câmp (atribut al obiectelor)

Valoare a înregistrării/liniei
(compatibilă cu tipul câmpului)
60
Sisteme de gestiune a bazelor de date
Toate înregistrările dintr-un tabel trebuie să fie asociate cu
obiecte (“entităţi”) similare !
Datele provenite de la o “entitate” (un “individ”) pot să fie
stocate în tabele separate!
Recomandare: datele personale de identificare (CNP, data
naşterii, numele/prenumele NU SE ÎNREGISTREAZĂ în acelaşi
tabel cu diagnosticul sau medicația prescrisă!
Între două tabele de
date pot exista
legături, de trei
(1)
tipuri:
- una-la-una (1) (3)
- una-la-multe (2) (2)
- multe-la-multe (3)

61
Sisteme de gestiune a bazelor de date
Identificarea unei anumite înregistrări: prin folosirea aşa-numitelor
chei primare (primary key).
O cheie primară este o formulă de identificare (unică) a înregistrării pe
baza valorilor din anumite câmpuri.
Fiecare dată particulară stocată în baza de date va fi accesibilă prin
indicarea “adresei” sale, care se “calculează” rapid odată cunoscute
numele tabelului de date, numele câmpului şi valoarea cheii
primare.
Exemple de sisteme de gestiune a bazelor de date:
(Microsoft) Access, componentă a suitei Office,
(Microsoft) SQL Server,
(Microsoft) Visual FoxPro,
(IBM) DB2,
Oracle,
MySQL.
62

S-ar putea să vă placă și