Sunteți pe pagina 1din 46

CURSUL 6

ANALIZA DATELOR CALITATIVE

DATE CALITATIVE
Datele calitative (nominale sau categoriale) i apar atunci cnd subiecii
se pot clasifica n dou sau mai multe categorii

bolnav/sntos
starea unui pacient ca fiind "precar", "echilibrat", "bun" sau
"excelent
M/F
Datele calitative pot fi nregistrate i sub form de coduri numerice 1, 2, 3,
sau 4 ns numrul nu are o semnificaie numeric (nu reprezint o
cantitate). Am putea codifica "da" ca fiind 1 i "nu" ca fiind 2, sau "da", ca
fiind 2 i "nu" ca fiind 1 i nu s-ar face nici o diferen n analiza lor.
Variabile categorice cu doar dou categorii, de exemplu "viu" sau
"mort", sau "feminin" sau "masculin" sunt numite atribute, date dicotomice
sau binare
datele cantitative - numere pentru care magnitudinea (valoarea)
reprezint ceva (sunt rezultatul unei msurtori) - tensiunea arterial

Metode statistice pentru analiza datelor calitative


testul hi-ptrat de asociere
testul Fisher exact
testul hi-ptrat pentru trend-uri
raportul riscurilor, riscul relativ sau raportul
anselor (RR)
riscul relativ estimat sau raportul cotelor (OR)
numrul necesar de pacieni care trebuie tratai.

TABELE DE CONTINGEN
Un tabel de contingen este un tabel construit pentru dou variabile categoriale (tabel
cu dou intrri)

Acceptarea testului HIV n funcie de grupele strii civile (Meadows et al., 1994)

Totalurile rndurilor i coloanelor sunt numite totaluri marginale, iar numrul total de observaii
din tabel se numete total general
Ne vom referi adesea la un tabel folosind dimensiunea tabelului.
Tabel de tip 4x2 deoarece are patru rnduri i dou coloane. Uneori se folosete termenul
general de tabel de tip rxc unde r indic numrul de rnduri i c numrul de coloane

TESTUL HI-PTRAT
Testarea ipotezei nule - nu exist nici o relaie ntre dou variabile.
Vom folosi termenul de "asociere" pentru o relaie ntre dou
variabile categorice.
Dac eantionul este mare putem s folosim testul hi-ptrat.
Dac eantionul este mic, vom folosi testul Fisher exact
Ipoteza nul stabilete c nu exist nici o asociere ntre cele dou
variabile (pentru care este construit tabelul de contingen).
Ipoteza alternativ se refer la faptul c exist o asociere de un
anumit tip.

Testul hi-ptrat se bazeaz pe calculul frecvenelor pe care ne-am


atepta s le obinem n celule, n cazul n care nu exist absolut
nici o asociere (frecvene estimate sau frecvene ateptate).

Proporia de femei care au acceptat testul HIV este de 134/788. Deci, din 486 de femei cstorite ne
ateptm ca 486 134/788 = 82.6 s accepte testul HIV, dac ipoteza nul (referitoare la asociere) este
adevrat.
n mod similar, proporia de femei care au refuzat testul este = 654/788. Deci din 486 de femei cstorite,
ne ateptm ca 486 654/788 = 403.4 s refuze testul, dac ipoteza nul este adevrat.
Se observ c 82.6 + 403.4 = 486. Deci suma frecvenelor estimate (ateptate) este aceeai ca i suma
frecvenelor observate.
n acelai mod, pentru 222 femei necastorite care au un partener ne ateptm ca 222 134/788 = 37.8
s accepte testul HIV, dac ipoteza nul este adevrat, i 222 654/788 = 184.2 s refuze testul. Din nou
se observ c 37.8 + 184.2 = 222, numrul total din al doilea rnd.
n mod similar se obin frecvenele estimate sau ateptate pentru toate celulele din tabel. Se observ c
82.6 + 37.8 + 8.5 + 5.1 = 134.0 i 403.4 + 184.2 + 41.5 + 24.9 = 654.0. Frecvenele observate i cele estimate
au aceleai totaluri pe rnduri i pe coloane. Se poate vedea, de asemenea, c pentru fiecare celul
din Tabelul 1, am calculat o frecven la care ne ateptm (frecven estimat) n Tabelul 2, cu ajutorul
formulei

n mod similar se obin frecvenele estimate sau ateptate pentru toate celulele din tabel. Se observ c
82.6 + 37.8 + 8.5 + 5.1 = 134.0 i 403.4 + 184.2 + 41.5 + 24.9 = 654.0.
Frecvenele observate i cele estimate au aceleai totaluri pe rnduri i pe coloane. Pentru fiecare celul
din frecvenelor observate, am calculat o frecven la care ne ateptm (frecven estimat) n cel deal doilea tabel, cu ajutorul formulei

TESTUL HI-PTRAT
Testul hi-ptrat pentru tabele de contingen folosete diferenele dintre
frecvenele observate i cele ateptate (estimate). Cu ct sunt mai mari aceste
diferene cu att aceasta reprezint o dovad mai puternic a faptului c cele
dou variabile sunt asociate. Nu se poate face doar o nsumare a acestor
diferene pentru c suma lor este ntotdeauna zero.
Vom proceda n acelai fel ca atunci cnd am calculat abaterea standard i
anume, le vom ridica la ptrat.

Cu ct sunt mai mari frecvenele, cu att este mai mare i valoarea posibil a
diferenei dintre frecvenele observate i cele estimate.
Eantioanele mari produc diferene mai mari dect eantioanele de mici
dimensiuni.
Aceast problem se poate corecta prin mprirea ptratului diferenei dintre
frecvena observat i cea ateptat la valorile estimate (ateptate) - motivele
exacte pentru aceast alegere sunt mai degrab abstracte i matematice
Vom calcula acest raport (observat - ateptat)2/ateptat pentru fiecare celul
din tabel i apoi vom nsuma toate rapoartele

TESTUL HI-PTRAT
n exemplul nostru aceast sum este de 9.15

Suma rapoartelor (observat - ateptat)2/ateptat este numit statistica hiptrat i uneori este scris ca X2.
Aceasta reprezint statistica testului. Din formularea clasic a unui test de
semnificaie, aceast statistic ar trebui s urmeze o anumit distribuie,
n cazul n care ipoteza nul este adevrat. Pentru acest test, distribuia
este distribuia hi-ptrat.
"Hi-ptrat", de cele mai multe ori apare scris ca fiind 2, unde este litera
greceasc "chi", pronunat "ki".
Distribuia hi-ptrat este asemntoare cu distribuia t, de care este strns
legat.

Exist o ntreag familie de distribuii, iar un membru special al acestei


familii este definit printr-un singur parametru numit grade de libertate

TESTUL HI-PTRAT
Atunci cnd numrul gradelor de libertate este mic
distribuia este asimetric spre dreapta, iar cnd
numrul gradelor de libertate crete ea devine mult mai
simetric, putnd eventual s arate ca i distribuia
normal. Ne ateptm ca acest lucru s se ntmple,
deoarece aceast distribuie este obinut prin
nsumarea unor entiti i, acestea tind s genereze
distribuia normal, cnd numrul de entiti nsumate
crete.

La fel ca i la distribuia t, la distribuia normal nu exist o formul


simpl pentru calculul ariei de sub curb i, prin urmare, pentru a
calcula probabilitatea de a depi o anumit valoare dat.
Se poate folosi un tabel de probabiliti laborios calculate printr-o
metod matematic de aproximare

TESTUL HI-PTRAT
Pentru un tabel de contingen gradele de libertate sunt date de
formula:
(nr de rnduri 1) x (nr de coloane 1)
(4 - 1) (2 - 1) = 3 grade de libertate

Statistica testului chi-ptrat pentru datele noastre este 9.15, valoare care se afl ntre cele
dou puncte, astfel nct probabilitatea testului este ntre 5% i 1%. Vom scrie acest lucru ca p
<5% sau p <0.05. Dac folosim un program de analiz statistic, am obine valoarea mai
exact de p = 0.027 pe care o puteam rotunji la o cifr semnificativ i astfel p = 0.03

Condiii care trebuiesc ndeplinite referitor la datele


observate pentru ca testul hi-ptrat s fie valid:
eantionul trebuie s fie suficient de mare
observaiile trebuie s fie independente ntre ele

Testul hi-ptrat este valid n cazul n care cel puin 80%


din frecvenele estimate (ateptate) depesc valoarea
5 i toate frecvenele estimate depesc valoarea 1.
Acest criteriu este ndeplinit pentru eantioane mari.
Cu ct valorile estimate tind s devin mai mici, cu att
va fi testul mai instabil.

Pentru tabelul nostru, toate valorile estimate depesc 5.0


Deoarece avem 8 frecvene estimate am putea accepta ca 8 x
0.2 = 1.6 din frecvenelor estimate s fie mai mici ca valoarea 5.
Vom rotunji aceast valoare n jos la 1.0 i vom spune c o
frecven estimat cu valoare ntre 1 i 5 nu ar fi o problem.
Pentru un tabel de tip 2 x 2, 20% din celule reprezint 4 x 0.20 = 0.80,
care este mai puin de 1, deci nici o celul nu ar trebui s aib
frecvena estimat mai mic dect 5
Testul hi-ptrat pentru asociere ntr-un tabel de contingen este,
de asemenea, cunoscut i sub numele de testul hi-ptrat Pearson
Statistica hi-ptrat nu este un indice care indic puterea de
asociere.

Dac vom dubla frecvenele, se va dubla i valoarea statisticii hiptrat ns puterea de asociere rmne neschimbat.

TESTUL FISHER EXACT


(testul exact Fisher-Irwin)
n cazul n care testul hi-ptrat nu este valid, deoarece frecvenele
estimate sunt prea mici
se poate aplica pentru orice tip de eantion, dei este folosit n
general numai pentru eantioane mici n tabele de tip 2 x 2, din
cauza problemelor de calcul
Se calculeaz probabilitile tuturor tabelelor posibile, care au
date totalurile pe rnduri i coloane.
Se nsumeaz apoi probabilitile pentru toate tabelele pentru
care am obinut probabiliti mai mici dect cea observat
Pentru ex testul Fisher exact d p = 0.029. Vom compara aceast
valoare cu cea obinut pentru testul hi-ptrat, adic cu p = 0.027.
Sunt foarte asemntoare. Acest lucru nu este ntotdeauna
adevrat

testul Fisher exact: p = 0.029


0.027.

testul hi-ptrat p =

CORECIA YATES
corecia de continuitate a testului hi-ptrat

Pentru tabele cu frecvenele estimate mici, testul hi-ptrat d


probabiliti mai mici dect testul Fisher exact.
Yates a introdus o modificare a testului hi-ptrat pentru tabele de
tip 2 x 2 ale crui valori aproximeaz foarte bine probabilitile
obinute n testul Fisher exact.
Testul modific diferena dintre frecvena observat i cea
ateapt fcnd-o mai apropiat de zero cu 0.5 nainte de
ridicarea la ptrat

este aplicat la tabele 22 atunci cnd exist celule cu mai puin


de 5 elemente (anumii autori o recomand la toate tabelele 22).
Prin corecia Yates se obine o mai bun aproximare a distribuiei
binomiale, rezultatul este conservator n sensul c se obine mai
greu semnificaia dect la aplicarea direct a testului 2 .

YATES

Riscul relativ - definiii


Este o msur a legturii ntre o boal i prezena unui factor de
risc, presupus a influena apariia bolii
Riscul Relativ, este raportul dintre riscul la cei expui, i riscul la cei
neexpui.

Riscul relativ
Ne arat de cte ori este mai mare riscul la expui fa
de neexpui i este o msur a forei asocierii dintre
factorul de risc (expunere) i efect (boal)
Cu ct este mai mare RR, cu att argumentul c
expunerea i efectul sunt asociate este mai puternic
Riscul atribuibil ne arat ci indivizi vom salva de la
efectul urmrit dac eradicm expunerea. Cu ct riscul
atribuibil este mai mare, cu att efectul evitrii expunerii
este mai mare

Studiile cazcontrol
Studii n care se urmrete realizarea
asocierii expunerii la un factor de risc a unei
serii de cazuri ce prezint boala respectiv
(caz), n comparaie cu un grup neafectat
de boal (control, martor)

I. Recenzii sistematice,
metaanaliza

II. Studii clinice randomizate

III. Studii de cohort

IV. Studii cazcontrol


V. Studii transversale

VI. Studii de caz i serii de


cazuri

Nivelul dovezii (evidence-based medicine).


Piramida studiilor

Studiile caz-control
Sunt cele mai frecvente studii epidemiologice analitice,
observaionale
Sunt studii longitudinale (se refer la un interval de timp)
Retrospective (cercettorul privete napoi, de la boal spre
o cauz posibil a acesteia)

Unitatea de observaie: individul (nu grupul, populaia)


Se studiaz n special bolile cu:
o perioad lung de laten (ex. cancerul)
cu o incubaie de durat
boli care sunt rare

Factorul de risc (FR), n studiul caz-control este reprezentat de un


eveniment care a survenit n trecutul subiecilor, naintea declanrii bolii
Exemple de FR:
Fumatul
Medicamente administrate
Caracteristici individuale (grupa
sanguin), etc.

Sursa informaiilor: anamneza,


istoricul afeciunii din fia medical,
etc.

Un indicator al asocierii ntre factorul de risc i boal este depistarea unei


expuneri mai mari la factorul de risc al cazurilor, comparativ cu cel al
grupului de control, asocierea avnd importan etiologic

Studiul caz- martor se utilizeaz cnd


prevalena bolii n populaie este mic
Permite studiul asociaiei mai multor
factori de risc cu aceeai boal
maladiile cronice unde sunt
incriminai mai muli factori de risc

Studiile caz martor sunt criticate deoarece


nu sunt realizate ntr-o manier experimental,
direcia studiului fiind de la boal spre factorul
de risc

Este necesar eantionarea


cazurile luate n studiu trebuie s fie reprezentative
pentru toate cazurile din maladia luat n studiu

ntrebare: selectm cazuri prevalente (care au


boala de un timp), sau incidente (nou diagn.)
mai uor s lum prevalente, mai ales n cazul bolilor rare, unde
pentru a gsi incidente trebuie s ateptm destul de mult
Din punctul de vedere al validitii - indicat s lum cazuri
incidente (reducem suprareprezentarea cazurilor cu evoluie
de lung durat i erorile sistematice de memorie)
Exemplu: n cazurile vechi de boal, frecvena FR < n urma comportamentului modificat al
bolnavului; va fi o diferen sistematic ntre cazurile diagnosticate de mai mult timp, deoarece
pacienii pot fi informai despre cauzele bolii, iar martorii nu sunt informai

n cazul maladiilor rare lum n studiu i cazuri noi i cazuri vechi

B.

Lotul martor
poate fi
constituit din:

Lotul martor

1.

Un eantion dintr-o anumit populaie, pentru grupul


de cazuri ce fac parte din acea populaie

2.

Un grup de pacieni internai sau luai n eviden la


aceeai instituie de unde sunt selectate cazurile, dar
cu alt diagnostic

3.

Un grup de persoane din aceeai populaie ca i


cazurile, asemntoare cu acestea din punct de
vedere al altor factori de risc

4.

Grupuri de vecintate - grup de rude sau vecini ale


cazurilor

Msurarea asociaiei FR - efect


Datele obinute ntr-un studiu caz martor se introduc ntr-un tabel de contingen 2x2

SAU

a persoanele ce fac boala dintre cei expui ; b - persoanele ce nu fac boala dintre cei expui.
c - persoanele ce fac boala dintre cei nonexpui ; d - persoanele ce nu fac boala dintre cei nonexpui.
a+b totalul expuilor. c+d totalul nonexpuilor. a+c totalul bolnavilor. b+d - totalul nonbolnavilor

Pentru msurarea forei asociaiei epidemiologice n anchetele de tip caz


control se utilizeaz odds ratio (raportul cotelor, OR)

Cota (odds, O) unui eveniment este definit ca raportul dintre probabilitatea


realizrii acelui eveniment raportat la probabilitatea nerealizrii lui

Diferena ntre probabilitate i cot


(ODDS)
Termenii cot i probabilitate (risc) sunt folosii
frecvent, n situaii diverse, de multe ori fcnd
confuzie ntre ei. n statistic lucrurile sunt diferite.
Ambii termeni arat ct de probabil este ceva,
dar se calculeaz diferit, fiind folosii n situaii
diferite.
Probabilitatea =

Cota =

numrul cazurilor egal posibile care realizeaz evenimentul


numrul cazurilor egal posibile

numrul de apariii ale evenimentului


numrul de neapariii ale sale

Prob=1/6

Odds=1/5

Riscul este probabilitatea de a suferi efectul


Cota (odds) este raportul dintre probabilitatea de a suferi
efectul i probabilitatea de a nu-l suferi

Odds=

n cazul unei anchete


epidemiologice raportul
cotelor (OR) se definete:

OR =

cota bolii la expui


cota bolii la nonexpui

n cazul bolilor rare (ex: bolile cronice cu prevalen <10%), impactul aciunii factorului de risc n
populaie se msoar cu riscul atribuit (RA) n populaie:

P0 prevalena expunerii la martori


P prevalena expunerii n populaia general

cota este ntotdeauna


mai mare dect riscul,
iar raportul cotelor
(odds ratio) este
ntotdeauna mai mare
dect riscul relativ.
Riscul bolii la expui

Cota bolii la expui

OREXP= a/c

Riscul bolii la nonexpui

Cota bolii la ne-expui

ORNEEXP= b/d

Riscul relativ

Raportul cotelor

Riscul relativ - demonstreaz de cte ori este mai


mare riscul bolii la expui fa de cei nonexpui.
Deci, grupul expuilor are un risc de RR ori mai
mare de apariie a bolii dect grupul nonexpui

Cota bolii la expui e de OR mai mare dect la


neexpui sau ansa expunerii la factorul de risc (F)
este de (OR) mai mare n cazul celor care sufer de
boala B fa de ansa de a fi fost expus la factorul F
n cazul persoanelor sntoase

Exemplul 1:

este diabetul factor de risc pentru infarctul acut de miocard?


Identificm

cazurile (indivizi cu infarct miocardic acut)


martorii (indivizi fr infarct miocardic acut)
i comparm pe unii cu ceilali n privina existenei diabetului:

Dac diabetul este mai frecvent la cazuri dect la martori, este posibil
ca acesta s fie factor de risc.

Care sunt cotele (odds) diabetului zaharat (n acest caz factor de risc) la cazuri,
respectiv la martori (aadar, cotele factorului de risc la bolnavi i la sntoi?

Dac avem mai muli martori pentru 1 caz, puterea studiului va crete. Numrul cazurilor este de
obicei limitat (boala este rar de cele mai multe ori), dar martorii ar putea fi orici. Creterea
puterii statistice a studiului nu mai e la fel de spectaculoas atunci cnd se depete un nr. de 4
martori/1caz

cota diabetului la cei cu infarct miocardic este

ORIMA/DZ=20/80=0,25 ; ORMARTORI=40/360=0,111

raportul cotelor OR= 0,250/0,111=2,25


Cum OR estimeaz riscul relativ (RR), pe care n studiile caz-martor nu avem cum s-l calculm,
putem spune c pacienii cu infarct miocardic au un risc de 2,25 de ori mai mare s aib
diabet dect pacienii fr infarct miocardic, iar transpus n relaia cauz-efect pe care o
studiam noi, c pacienii cu diabet au un risc de 2,25 ori mai mare s fac infarct dect
pacienii fr diabet

Calculul valorilor ateptate


Date iniiale

Valori ateptate

Dac in urma analizei statistice se obine p<0,05


nseamn c avem un rezultat semnificativ statistic

Prezentarea i prelucrarea datelor n EpiInfo

Pentru OR sunt calculate i


intervalele de ncredere
[a, b]. Interpretarea lor este
imediat:

Dac a1b, atunci


variabila de expunere este
un factor indiferent

Dac 1 < a, atunci


variabila de expunere este
un factor de risc

Dac b < 1, atunci


variabila de expunere este
un factor de protecie

Testul statistic adecvat este testul Chi

Dac in urma analizei statistice se obine p<0,05 nseamn c avem un rezultat


semnificativ statistic
Intervalul de ncredere (IC) sa nu conin valoarea 1 (limita inferioara a
intervalului sa fie mai mare de 1)
Interpretare OR in functie de IC:
Pentru OR cu valoare mai mare de 1 si IC cu valori apropiate de OR calculat care nu
include valoarea 1 putem decide ca exista asociere pozitiva intre factorul de risc si boala
Pentru valori OR mai mari decat 1 si IC include valoarea 1 se poate concluziona ca factorul
de risc studiat este indiferent (oricat de mare ar fi valoarea lui calculata)

Atenie nu e important dac valoarea indicatorului este sau nu n interval, ea


ntotdeauna se afl n intervalul de ncredere! Conteaz dac absena efectului
sau a diferenei se afl sau nu n interval

Pentru evaluarea existenei unei legturi ntre boal i factorul de risc


-testul Hi ptrat (Chi square) (testul bidirecional two tails)
ales ntruct sunt date de tip calitativ
n formatul: p=valoare (cu maxim 3 zecimale)-numele testului folosit
Ex: p=0.005 test student pentru eantioane perechi
interpretare:
dac p<0,05 se respinge ipoteza nul (nonexistena legturii) i se
consider ca fiind adevrat ipoteza alternativ (existena legturii)
dac p>0,05 nu se poate respinge ipoteza nul
p este probabilitatea de a obine un rezultat ca cel gsit din cauza
ntmplrii n situaia n care n realitate nu exist legtur ntre parametrii
urmrii

NUMRUL NECESAR DE PACIENI CARE TREBUIESC TRATAI


NNT (number needed to treat)

conceput ca o modalitate util de a prezenta rezultatele unui studiu clinic, astfel ca medicii s poat
aprecia cu uurin eficacitatea unui tratament
reprezint numrul de pacieni care ar trebui s urmeze, mai degrab un anumit tratament dect altul,
pentru a se obine beneficii suplimentare pentru un singur pacient
EXEMPLU:
Ct de muli oameni trebuie s se trateze cu bandaj elastic n loc de inelastic pentru a obine o singur
vindecare suplimentar?
Dac diferena este de 25.4%, aceasta nseamn c pentru fiecare 100 de persoane pe care le tratm
cu bandaj elastic n loc de inelastic, 25.4 se vor vindeca suplimentar. Prin urmare, pentru a vindeca o
persoan n plus, trebuie s se trateze 100/25.4 = 3.9 pacieni. Pentru fiecare 3.9 persoane tratate cu
bandaj elastic n loc de inelastic, se estimeaz c o persoan n plus va fi vindecat

n mod clar un NNT mic este bun, deoarece este necesar s tratm doar civa pacieni pentru ca unul n
plus s se vindece
NNT poate fi negativ? Un NNT negativ apare cnd proporia de vindecai pentru tratamentul testat
(bandaj elastic) este mai mic dect proporia de vindecai pentru tratamentul de control (bandaj
inelastic). Tratamentul face mai mult ru dect bine. n acest caz, avem numrul de pacieni necesar a fi
tratai pentru a determina apariia unui efect negativ, notat cu NNTH (number needed to treat to harm)

S-ar putea să vă placă și