Sunteți pe pagina 1din 62

Analiza datelor calitative

Coninutul acestui curs:


Tabele de contingen
Testul hi-ptrat pentru asociere
Distribuia hi-ptrat
Valori critice pentru distribuia hi-ptrat
Testul exact Fisher
Corecia Yates
Testul hi-ptrat pentru tendine
Raportul riscurilor RR (riscul relativ)
Raportul cotelor OR (riscul relativ estimat)
Nr. necesar de pacieni care trebuie tratai (NNT)
Analiza datelor calitative
Datele calitative sunt numite adesea i nominale sau
categoriale i apar atunci cnd se pot clasifica subiecii n
dou sau mai multe categorii.
Variabile categorice cu doar dou categorii, sunt numite
dicotomice sau binare.
Metode:
Testul hi-ptrat de asociere
Testul Fisher exact,
Raportul riscurilor (RR), riscul relativ sau raportul anselor,
Raportul cotelor (OR) sau riscul relativ estimat
Numrul necesar de tratamente.
Tabele de contingen
Tabel ncruciat pentru dou variabile categoriale:
Acceptarea testului HIV n funcie de grupele strii civile (Meadows et al.,
1994)

Meadows J, Jenkinson S, Catalan J. (1994) Who chooses to have the HIV antibody test in the antinatal clinic? Midwifery 10, 44-48.
Tabele de contingen
Tabel ncruciat pentru dou variabile categoriale:
Acceptarea testului HIV n funcie de grupele strii civile (Meadows et al.,
1994)

Un astfel de tabel ncruciat de frecvene se numete tabel de


contingen sau tabel cu dou intrri.
Se mai numete i tabel de tip 4 2. n general un tabel este de tip r c.
Tabele de contingen
Tabel ncruciat pentru dou variabile categoriale::
Acceptarea testului HIV n funcie de grupele strii civile (Meadows et al.,
1994)

Se dorete testarea ipotezei nule care stabilete c nu exist nici o


relaie (asociere) ntre dou variabile (de tip categorial).
Dac eantionul este mare putem s folosim testul hi-ptrat.
Dac eantionul este mic, vom folosim testul Fisher exact.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

Ipoteza nul: nu exist nici o asociere ntre cele dou variabile.


Ipoteza alternativ: exist o asociere de un anumit tip.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6

Proporia de femei care au acceptat testul HIV este de 134/788


(17.0%).
Deci din 486 de femei cstorite ne ateptm (estimm) ca
486 134/788 = 82.6 s accepte testul HIV, dac ipoteza nul
referitoare asociere este adevrat.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6 403.4

Proporia de femei care au refuzat testul este = 654/788.


Deci din 486 de femei cstorite, ne ateptm ca 486 654/788 =
403.4 s refuze testul, dac ipoteza nul este adevrat.
Se observ c 82.6 + 403.4 = 486.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2

Pentru 222 femei necastorite care au un partener ne ateptm ca


222 134/788 = 37.8 s accepte testul la HIV, dac ipoteza nul
este adevrat. Pentru 222 femei necastorite care au un partener
ne ateptm ca 222 654/788 = 184.2 s refuze testul dac ipoteza
nul este adevrat. Din nou se observ c 37.8 + 184.2 = 222.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Se observ c 82.6 + 37.8 + 8.5 + 5.1 = 134.0 i


403.4 + 184.2 + 41.5 + 24.9 = 654.0.
Frecvenele observate i cele estimate au acelai total pe rnduri i
pe coloane.
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Frecvenele ateptate (estimate) dac ipoteza nul este adevrat:


total liniex totalcoloana
totalgeneral
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

82.6 403.4
37.8 184.2
8.5 41.5
5.1 29.9

Se compar frecvenele observate cu cele estimate.


Se adun (observat - ateptat)2/ateptat pentru fiecare celul din tabel i
se obine 9.15.
Dac ipoteza nul este adevrat i dimensiunea eantioanelor este
suficient de mare, atunci aceast statistic urmeaz distribuia hi-ptrat,
adesea notat cu 2.
Distribuia hi-ptrat
Familii de distribuii, cu un parametru numit grade de libertate.
probabilitate

probabilitate
Densitate de

Densitate de
1 grad de libertate 3 grade de libertate
probabilitate

probabilitate
Densitate de

Densitate de

6 grade de libertate 15 grade de libertate


Valori critice pentru distribuia hi-
ptrat
Densitate de probabilitate
d.f.-2
Test unilateral!!

9.49

Hi-ptrat cu 4 grade de libertate (d.f.)


Valori critice pentru distribuia hi-
ptrat
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

Pentru un tabel de contingen, gradele de libertate sunt date de:


(nr de rnduri 1) x (nr de coloane 1).
Avem (4 - 1) (2 - 1) = 3 grade de libertate (d.f.), X2 = 9.15, d.f. = 3.
Valori critice pentru distribuia hi-
ptrat
Testul hi-ptrat pentru asociere
Acceptarea testului HIV n funcie de grupele strii civile (Meadows et
al., 1994)

Pentru un tabel de contingen gradele de libertate sunt date de:


(nr de rnduri 1) x (nr de coloane 1).
Avem (4 - 1) (2 - 1) = 3 grade de libertate (d.f.).
X2 = 9.15, d.f. = 3, p < 0.05. Cu ajutorul unui program: p = 0.027 = 0.03
Testul hi-ptrat pentru asociere
Statistica testului urmeaz o distribuie hi-ptrat care
furnizeaz valori ateptate (estimate) destul de mari.
Acesta este un test care se folosete n cazul n care
eantioanele sunt destul de mari.
Cu ct sunt mai mici valorile estimate cu att testul va deveni
mai nesigur.
Criteriul convenional pentru ca testul s fie valid este
urmtorul: cel puin 80% din frecvenele estimate depesc
valoarea 5 i toate frecvenele estimate depesc valoarea 1.
Testul hi-ptrat pentru asociere este, de asemenea, cunoscut
i sub numele de testul hi-ptrat Pearson.
Testul hi-ptrat pentru asociere
Statistica hi-ptrat nu este un index al puterii de
asociere.
Dac dublm frecvenele, valoarea statisticii testului se
dubleaz i ea, ns puterea de asociere rmne
neschimbat.
Msuri de asociere (direcia, putere):
- Lambda, Cramer (una din variabile categoriala)
- Somers (ambele categoriale ordonate)
Testul exact Fisher
Este, de asemenea, cunoscut i sub numele de testul
exact Fisher-Irwin.
Aceasta se poate aplica pentru orice tip de eantion.
Este folosit n general numai pentru eantioane mici n
tabele de tip 2 x 2 din cauza problemelor de calcul.
Se calculeaz probabilitile tuturor tabelelor posibile
care au acelasi total pe rnduri i coloane.
Se nsumeaz apoi probabilitile pentru toate tabelele
pentru care am obinut probabiliti mai mici dect cea
observat.
Testul exact Fisher
Acceptarea testului HIV n funcie de grupele strii civile (Meadows
et al., 1994)

Testul hi-ptrat pentru asociere: X2 = 9.15, d.f. = 3, p = 0.027.


Testul Fisher exact: p = 0.029.
Corecia Yates
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049. ?


Testul hi-ptrat pentru asociere: X2 = 8.87, p = 0.0029.
Corecia Yates
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-ptrat pentru asociere: X2 = 8.87, p = 0.0029.
Rezultatele sunt destul de diferite, dei ambele conduc la aceeai
concluzie. Explicaie: o frecven estimat (ateptat) este mic.
Testul Fisher exact produce valoarea p corect. Testul hi-ptrat
conduce la o valoare p care este prea mic.
Corecia Yates
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-ptrat pentru asociere: X2 = 8.87, p = 0.0029.
Yates a introdus o modificare a testului hi-ptrat pentru tabele de
tip 2 x 2 ale crui valori aproximeaz foarte bine probabilitile
obinute n testul Fisher exact.
Aceasta este cunoscut sub denumirea de corecia de continuitate.
Corecia Yates
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Testul Fisher exact: p = 0.0049.


Testul hi-ptrat pentru asociere: X2 = 8.87, p = 0.0029.
Testul hi-ptrat cu corecia de continuitate: X2 = 7.84, p = 0.0051.
Corecia de continuitate Yates este rar folosit, n locul acesteia
fiind preferate testele exacte.
Testul hi-ptrat pentru tendine
Numrul de vizite nainte de natere n funcie de tipul unitii ntr-un
studiu desfsurat ntr-o maternitate din Scoia (Hundley et al., 2002)
Testul hi-ptrat pentru tendine
Numrul de vizite nainte de natere n funcie de tipul unitii ntr-un
studiu desfsurat ntr-o maternitate din Scoia (Hundley et al., 2002)

Testul hi-ptrat: X2 = 11.36, df = 3 i p = 0.01.


Testul nu ia n calcul ordinea categoriilor!
Testul hi-ptrat pentru tendine: X2 = 9.33, df = 1 i p = 0.002.
Testul hi-ptrat pentru diferen: X2 = 2.03, df = 2 i p = 0.4.
(asociere care s nu poate fi explicat liniar)
Raportul riscurilor RR (riscul relativ)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Se dorete o estimare a dimensiunii efectului tratamentului.


Diferena dintre proporii este de 0.538 - 0.284 = 0.254 sau de
53.8% - 28.4% = 25.4% (diferena riscului).
Proporia de vindecai (probabilitate) se numete riscul de
vindecare pentru aceast populaie.
Raportul riscurilor = 53.8/28.4 = 1.89. (pE/pI>1)
Acesta mai este cunoscut i sub denumirea de risc relativ, raportul
ratelor sau RR.
Raportul riscurilor RR (riscul relativ)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Raportul riscurilor = 53.8/28.4 = 1.89.


Raportul riscurilor = raport => el are o distributie foarte dificil
(asimetric!).
Deci dac vom considera logaritmul raportului ratelor, vom obine
ceva care se determin prin adugare i scdere de logaritmi ai
frecvenelor.
Distribuia devine n acest caz aproximativ normal i se poate
calcula simplu o eroare standard cnd frecvenele nu sunt mici.
Raportul riscurilor RR (riscul relativ)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Raportul riscurilor, RR = 53.8/28.4 = 1.89.


Loge(RR) = 0.6412
SE pentru Loge(RR) = 0.2256.
95% ncredere pentru Loge(RR):
(0.6412 1.960.2256, 0.6412 + 1.960.2256)=
= (0.1990, 1.0834).
95% ncredere pentru RR: (exp (0.1990), exp (1.0834)) = (1.22, 2.95)
Raportul riscurilor RR (riscul relativ)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Loge(RR) = 0.6412, 95% CI: (0.1990, 1.0834).


Raportul riscurilor, RR = 53.8/28.4 = 1.89, 95% CI: (1.22, 2.95).
Valoarea RR nu este mijlocul intervalului.
Intervalul este simetric pe scala logaritmic i nu pe scala natural.
Testul hi-ptrat pentru asociere: X2 = 8.87, p = 0.0029.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de tipul de
bandaj (Callam et al., 1992)

Riscul de vindecare = 35/65 = 0.538.


Cota de vindecare = 35/30 = 1.17.
Riscul = numrul de apariii a evenimentului / numrul total.
Cota = numrul de apariii ale evenimentului / numrul de neapariii ale
evenimentului.
Riscul = 0.538 nseamn c din 100 de persoane tratate 53.8 persoane se
vindeca.
Cota = 1.17 nseamn c pentru fiecare 100 de persoane care nu se vindeca
117 persoane se vindec.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Cota de vindecare cu bandaje elastice = 35/30 = 1.17


Cota de vindecare cu bandaje inelastice = 19/48 = 0.40.
35/30 1.17
Raportul cotelor 2.95
19/48 0.40
Pentru fiecare persoan care nu se vindec, de 2.95 ori mai multe
persoane se vor vindeca dac folosesc bandaje elastice prin
comparaie cu cei care folosesc bandaje inelastice.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor, OR = (35/30)/(19/48) = 2.95.


Ca i RR, OR are o distribuie ciudat iar interval de ncredere va fi
estimat n acelai mod. Vom folosi logaritmul raportul cotelor
pentru a aproxima aceast distribuie cu distribuia normal i se
poate calcula simplu o eroare standard cnd frecvenele nu sunt
mici.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor, OR = (35/30)/(19/48) = 2.95.


loge(OR)=loge (2.95)=1.0809
SE loge(OR)= 0.3679
95% CI pentru loge(OR):
= (1.0809 - 1.96 0.3679; 1.0809 + 1.96 0.3679)
=(0.3598; 1.8020).
95% CI pentru loge(OR): (exp(0.3598), exp(1.8020)) = (1.43; 6.06)
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

loge(OR)=loge (2.95)=1.0809, 95% CI: (0.3598; 1.8020).


Raportul cotelor, OR = (35/30)/(19/48) = 2.95, 95% CI: (1.43; 6.06).
OR nu se afl n mijlocul intervalului de ncredere.
Intervalul este simetric pe scara log i nu pe scar natural.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Raportul cotelor pentru vindecai, OR = (35/30)/(19/48) = 2.95.


Nu conteaz ordinea!
Raportul cotelor pentru tratament, OR = (35/19)/(30/48) = 2.95.
Ambele versiuni dau OR = (3548)/(3019).
Numim acest raport ca raport de produse ncruciate.
Raportul cotelor OR
(riscul relativ estimat)
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Schimbnd ordinea rndurilor sau coloanelor se inverseaz raportul de


cote.
Raportul cotelor pt trat (bandajul elastic): OR = (35/19)/(30/48) = 2.95
Raportul cotelor pt trat (bandajul inelastic): OR=(19/48)/(35/30)= 1/2.95=0.33.
Exist numai dou rapoarte posibile!
Pe scara log sunt egale i de semn opus: loge(2.95) = 1.082 i loge(0.339) = -1.082.
Raportul cotelor n studii
de tip caz-control
Un studiu de caz-control este un studiu n care se compar un grup
de subieci cu o anumit caracteristic care ne intereseaz, adic
grupul de cazuri, cu un alt grup fr acea caracteristic, adic
grupul de control.
Istoricul fumatului la pacienii cu accident vascular cerebral
(cazurile) i lotul de control, cu procente calculate pe rnduri
(Markus et al., 1995)
Raportul cotelor n studii
de tip caz-control

Pentru c s-a nceput cu mprirea pacienilor n cei cu accident vascular


cerebral i cei din lotul de control, i nu cu fumatorii i nefumatorii, nu se
poate estima procentul de fumtori la cei care au accidente vasculare
cerebrale.
Nu putem calcula riscul de accident vascular cerebral pentru fumtori
sau pentru nefumtori!
Nu putem face raportul dintre acestea pentru a obine riscul relativ.
Putem, ns, evalua raportul cotelor:
OR = (71 x 101) / (30 x 36) = 6.64.
Raportul cotelor n studii
de tip caz-control
Se tie c accidentul vascular cerebral este o boala destul de
comun dei incidena n populaie nu este chiar foarte mare.
Noi nu tim care este prevalena accidentului vascular
cerebral n rndul populaiei studiate care are vrsta cuprins
ntre 35 i 91 ani, dar se presupune c este destul de mic.
Pentru ilustrare, vom presupune c este de 0.7%.
Dac vom nmuli a frecvena pentru lotul de control cu 100,
proporia de pacieni cu accident vascular cerebral va fi de
0.7% (101/13801).
Raportul cotelor n studii
de tip caz-control
Date artificiale:

Procentele pe rnd sunt neschimbate i, n consecin, la fel este


raportul cotelor. Acesta are tot valoarea de 6.64.
OR = (71 x 10100) / (30 x 3600) = 6.64.
Acum vom avea proporia corect de indivizi cu accident vascular
cerebral pentru fumtori i nefumatori.
Riscul relativ va trebui s fie, de asemenea, corectat:
RR = (71/3671) / (30/10130) = 6.53
Raportul cotelor n studii
de tip caz-control
Date artificiale:

OR = (71 x 10100) / (30 x 3600) = 6.64.


RR = (71/3671) / (30/10130) = 6.53
RR are valoare apropiat de OR!
Acest lucru se datoreaz faptului c atunci cnd frecvenele
dintr-o categorie sunt mult mai mici dect cele celelalte, OR i RR
sunt aproape la fel.
Raportul cotelor n studii
de tip caz-control
Date originale:

OR = (71 x 10100) / (30 x 3600) = 6.64.


RR = (71/107) / (30/131) = 2.90 (nu n studiu de tip caz-control!!)
RR este foarte diferit de OR!
Aceasta nseamn c ntr-un studiu de caz-control, dac
caracteristica care ce definete cazurile este rar n populaie,
raportul cotelor poate fi folosit ca o estimare a riscului relativ.
Folosirea lui OR si a lui RR
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Inversarea coloanele nu duce la obinerea valorii inverse pentru RR!


Raportul riscurilor pentru nevindecai considernd bandajul elastic:
RR = (30/65) / (48/67) = 0.644.
Raportul riscurilor pentru vindecai considernd bandajul elastic:
RR = (35/65) / (19/67) = 1.89
1/1.89 = 0.529 i nu 0.644.
Folosirea lui OR si a lui RR
Dou tabele ipotetice:

Aceste tabele au aceleai date, RR-uri diferite i aceleai OR.


OR este o msur mult mai bun a puterii relaiei dect RR.
RR are o interpretare mult mai intuitiv i este mult mai uor de
neles de majoritatea oamenilor.
OR este mult mai convenabil pentru analiza statistic.
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Diferena dintre proporii este de 0.538 - 0.284 = 0.254,


sau 53.8% - 28.4% = 25.4%.
Ct de muli oameni trebuie s se trateze cu bandaj elastic n loc de inelastic
pentru a vindeca sau pentru a beneficia o singur persoan n plus?
Nr de persoane suplimentar vindecate pe nr de persoane tratate = 0.254.
Numrul necesar de pacieni care trebuie tratai pt a salva un pacient (sau
pentru a preveni apariia unui efect negativ) NNT = 1/0.254 = 3.9.
Clar un NNT (number needed to treat) mic este bun!
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Numrul necesar de tratamente = 1/0.254 = 3.9.


Pentru fiecare 3.9 persoane tratate mai degrab cu bandaj elastic dect
inelastic se estimeaz c o persoan n plus va fi vindecat.
Vom calcula 95% CI pentru diferena dintre cele dou proporii i apoi se
inverseaz.
Diferen: 95% CI = (0.093; 0.417).
NNT: 95% CI =(1/0.093, 1/0.417) adic de la 10.8 la 2.4.
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Numrul necesar de tratamente = 1/0.254 = 3.9.


Diferen: 95% CI = (0.093; 0.417).
NNT: 95% CI =(1/0.093, 1/0.417) adic de la 10.8 la 2.4.
Adic punnd valorile n ordinea corect 95% CI = (2.4, 10.8).
NNT se obine direct atunci cnd diferena este semnificativ i
intervalul de ncredere pentru diferen nu include zero (NNT1!)
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

Diferena = 0.133, NNT = 1/0.133 = 7.5.


Diferen: 95% CI = (-0.059, 0.324).
95% CI include valoarea 0.0 iar diferena nu este semnificativ statistic
(hi-ptrat = 1.81, df = 1, p = 0.2)
NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??
Ce nseamn aceste limite?
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??


Ce nseamn aceste limite? NNT poate fi negativ?
Un NNT negativ apare cnd proporia de vindecai pentru tratamentul testat
(bandaj elastic) este mai mic dect proporia de vindecai pentru
tratamentul de control (bandaj inelastic). Tratamentul face mai mult ru
dect bine. n acest caz avem numrul necesar de pacieni tratai pentru
care apare un efect negativ, notat cu NNTH (number needed to treat to
harm), sau NNH.
Numrul necesar de pacieni care
trebuie tratai
Vindecarea rnilor pentru pacieni cu ulcer la gamb n funcie de
tipul de bandaj (Callam et al., 1992)

NNT: 95% CI = (1/(-0.059), 1/0.324) = (-16.9, 3.1) ??


Ce nseamn aceste limite?
Diferena = 0.0 atunci NNT va fi infinit, adic indiferent de ct de muli
pacieni vor fi tratai nici o persoana n plus nu se va vindeca sau nu va fi
afectat.
Numrul necesar de pacieni care
trebuie tratai
Cnd diferena nu este semnificativ, intervalul de ncredere va
avea cel puin una din limitele infinit.
Diferena ntre proporiile de vindecai

Valori imposibile Studiul 1 :


95% CI = (3.1; ),
NNTH = (17.5; )
NNT

Valori imposibile
sau
95% CI = (3.1; ),
Valori imposibile
NNTH = (-; -17.5).

Numrul studiului Numrul studiului

Numrul necesar de pacieni care trebuie tratai nu este de nici


un ajutor atunci cnd diferena nu este semnificativ!
Date n perechi sau studii dublu
ncruciate
Date binare:
Testul McNemar, similar cu testul semnelor, corespunztor
intervalului de ncredere pentru diferena ntre dou
proporii.
Categorii ordonate:
Testul semnelor
Categorii neordonate:
Foarte rare n evalurile clinice.
Algoritmi, baze de date i
sisteme de gestiune a
bazelor de date
Algoritmi i baze de date

Algoritm = secven finit de instruciuni, fiecare putnd fi


efectuat ntr-un timp determinat i rezonabil.
Exemplu:
dac BMI>26 i Vrsta=14 i Sexul=M, atunci Cat=obez

Datele primare:
G
BMI 2 -Vrst 14
I -Sex M
-nlime 1.74
5%=15.9 -Greutate 82.5
85%=22.6 se nregistreaz n baze de date.
95%=26

BMI se calculeaz! 26.9


58
Sisteme de gestiune a bazelor de date
Dat - dou nelesuri principale:
1) reprezentare formalizat a unor fapte, concepte sau
instruciuni, adecvat comunicrii, interpretrii umane
sau prelucrrii automate;
2) reprezentare prin caractere crora li s-a atribuit un neles
Aceeai dat poate fi nregistrat, pe suportul fizic, n multiple
feluri. De exemplu, numrul 123 ar putea fi plasat ntr-o
memorie fie prin reprezentarea sa binar:
01111011
fie ca succesiune de cifre 1, 2, 3 reprezentate ASCII,
adic astfel:
00110001 00110010 00110011
59
Sisteme de gestiune a bazelor de date
Logic: BD = colecie de date cu legturi ntre ele.
Informatic: BD = ansamblu complex de diverse obiecte
informatice. Cele mai importante sunt tabelele de date.

Tabelele de date sunt formate din


nregistrri (records), organizate n
cmpuri (fields) de diverse tipuri. sex vrsta greutate

nregistrare (obiect concret)


M 14 86.5
Cmp (atribut al obiectelor)

Valoare a nregistrrii/liniei
(compatibil cu tipul cmpului)
60
Sisteme de gestiune a bazelor de date
Toate nregistrrile dintr-un tabel trebuie s fie asociate cu
obiecte (entiti) similare !
Datele provenite de la o entitate (un individ) pot s fie
stocate n tabele separate!
Recomandare: datele personale de identificare (CNP, data
naterii, numele/prenumele NU SE NREGISTREAZ n acelai
tabel cu diagnosticul sau medicaia prescris!
ntre dou tabele de
date pot exista
legturi, de trei
(1)
tipuri:
- una-la-una (1) (3)
- una-la-multe (2) (2)
- multe-la-multe (3)

61
Sisteme de gestiune a bazelor de date
Identificarea unei anumite nregistrri: prin folosirea aa-numitelor
chei primare (primary key).
O cheie primar este o formul de identificare (unic) a nregistrrii pe
baza valorilor din anumite cmpuri.
Fiecare dat particular stocat n baza de date va fi accesibil prin
indicarea adresei sale, care se calculeaz rapid odat cunoscute
numele tabelului de date, numele cmpului i valoarea cheii
primare.
Exemple de sisteme de gestiune a bazelor de date:
(Microsoft) Access, component a suitei Office,
(Microsoft) SQL Server,
(Microsoft) Visual FoxPro,
(IBM) DB2,
Oracle,
MySQL.
62