Sunteți pe pagina 1din 3

Dac n regresia linear multipl ncercam s prezicem, din mai multe variabile independente, o variabil dependent numeric, regresia

logistic o folosim cnd vrem s prezicem o variabil nominal dihotomic. Regresia logistic poate fi rezultatul unui studiu etiologic sau terapeutic, ca i celelalte tipuri de analiz multivariabil, regresia logistic cuantific asocierea dintre un factor de risc (sau tratament) i o boal (sau orice eveniment), dup ajustarea pentru celelalte variabile, prognostic sau diagnostic (prin regresia logistic se ajunge la diverse scoruri sau reguli de predicie clinic). Atunci cnd un pacient slbete involuntar, ne ntrebm dac acesta nu are un cancer, iar printre cele mai simple elemente pe care le evalum sunt vrsta pacientului, hemoglobina i VSH. Variabila dependent (cancerul ca etiologie a scderii ponderale) este nominal dihotomic (pacientul poate s aib sau s nu aib cancer), n timp ce variabilele independente sunt n acest caz numerice continue (vrsta, hemoglobina, VSH). Din experien, tim c este mai probabil cancerul atunci cnd pacientul are o vrst mai naitat, un VSH mai mare i are i anemie. Se efectueaz un studiu de cohort - sunt inclui toi pacienii cu scdere ponderal involuntar important, se msoar i se introduc n baza de date variabilele independente (vrsta, VSH, hemoglobina), apoi se caut cauza scderii ponderale, rezultatul acestei cutri fiind o variabil nominal dihotomic (cancer DA/NU). Iniial vom dori s vedem dac pacienii cu cancer difer de cei fr cancer n privina variabilelor independente, n analiz univariat (se compar, prin teste parametrice= Student t dac acestea au o distribuie normal sau neparametrice= Mann-Whitney, dac nu au o distribuie normal vrsta, VSH i hemoglobina celor cu cancer i a celor fr cancer) i vom veda c acestea difer semnificativ statistic. n acelai timp tim c VSH crete direct proporional cu vrsta i invers proporional cu hemoglobina, i atunci ne ntrebm dac VSH crescut este legat ntr-adevr de cancer, sau este doar un factor de confuzie, fiind mai mare numai pentru c pacienii cu cancer sunt mai n vrst i au mai degrab anemie. Una din metodele de a verifica acest lucru este s efectu m o analiz multivariat. Rezultatul regresiei logistice este tot o ecuaie, care prezice cel mai bine o variabil efect binar (cancer da/nu) din una sau mai multe variabile care pot fi cantitative (n exemplul nostru vrsta, VSH, hemoglobina) sau binare. n loc de a lucra cu probabiliti (care se pot afla ntre 0 i 1), regresia logistic lucreaz cu logaritmul natural (ln) al cotei (odds), care poate lua orice valoare, pozitiv sau negativ. Ecuaia regresiei logistice poate fi exprimat astfel: ln(odds Y) = 0 + 1 X1 + 2 X2 + 3 X3 + .... nXn, adic ln(odds cancer) = 0 + 1(vrsta) + 2(VSH) + 3 (Hb), unde sunt coeficien ii calculai de programul statistic i care sunt de fapt logaritmii naturali ai odds ratio ai fiecrei variabile, iar 0= constanta = logaritmul natural al odds cancerului la indivizii la care toate variabilele au valoarea 0. Din tabelul 1 vedem c variabilele luate n calcul sunt asociate cu etiologia neoplazic independent una de cealalt, iar VSH este asociat cu acesta: dup ajustarea pentru vrst i anemie, OR pentru VSH este rmne semnificativ statistic (p=0,016, intervalul de ncredere nu l conine pe 1). Observm, n acelai timp, c OR pentru toate variabilele sunt foarte mici, apropiate de 1 i nesemnificative clinic: aceasta din cauz c am folosit variabile numerice, iar semnificaia unei OR de 1,044 pentru vrst este c pacienii cu o anumit vrst au un risc de a avea cancer de 1,044 de ori mai mare dect cei cu vrsta imediat inferioar (pacienii de 59 de ani au un risc de cancer de 1,044 de ori mai mare dect pacienii de 58 de ani, iar pacienii de 58 de ani au un risc de 1,044 de ori mai mare de cancer dect pacienii de 57 de ani); la fel se interpreteaz i pentru VSH sau hemoglobin (observm c pentru hemoglobin OR este subunitar i coeficientul negativ, pentru c valoarea hemoglobinei este invers proporional cu riscul de cancer).

Putem lucra cu vrsta, VSH, hemoglobina ca variabile dihotomice - prin anumite procedee (curba ROC) am vazut c valorile de prag care discrimineaz cel mai echilibrat ntre cancer i noncancer sunt 63 pentru vrst, 10 pentru hemoglobin i 29 pentru VSH. n acest caz, putem cuantifica asocierea dintre cancer i aceste variabile sub form de riscuri relative cu intervale de incredere, iar testul statistic aplicat este X2. Rezultatele acestei analize univariate sunt: riscurile relative de cancer sunt 3,15 pentru vrst peste 62 de ani, 2,5 pentru anemie i 2,36 pentru VSH (valoarea de prag fiind 29mm/h). Efectund regresia logistic, rezultatul acesteia este cel din tabelul 2, iar ecuaia este: lnODDS (CANCER) = -2,36 + 1,150x(AGE>62) +0,921x(ANEMIA) +0,861x(ESR>29) unde fiecare variabil poate lua valori de 0 sau 1 (anemie=0 dac Hb>10, 1 dac Hb=<10; vrsta=0 dac <63ani i 1 dac>=63 ani etc.). De obicei, n baza de date se codific 0 dac condiia asociat cu efectul este absent (vrst tnr, VSH sczut, NU anemie) i cu 1 dac aceasta este prezent (vrst naintat, VSH crescut, DA anemie), la fel i pentru variabila dependent (1 pentru cancer, 0 pentru noncancer). Din tabel vedem din nou c anemia, vrsta peste 62 de ani i VSH peste 29mm/h sunt factori de predicie pentru prezena cancerului, cu odds ratio (care nu sunt altceva dect estimri, ntotdeauna supraevaluate, ale riscului relativ) de 3,45, 3,29 respectiv 3,15, aadar se menin cele din analiza univariat, ceea ce nseamn c nu au fost rezultatul unor confuzii (cel puin n cadrul celor trei variabile studiate). Ecuaia de regresie logistic ne folosete dac vrem s calculm care este, pn la urm, riscul de cancer (variabila dependent) atunci cnd tim valorile variabilelor independente. S presupunem, de exemplu, c suntem n faa unui pacient cu scdere ponderal cu vrsta de 58 de ani, Hb=11g% i VSH=25mm/h. Toate valorile sunt sub valorile de prag, deci variabilele independente vor lua valoarea 0, i atunci ecuaia este: lnODDS(cancer) = -2,36, deci ODDS(cancer) = e- 2,36 = 0,0944 i nu ne mai rmne dect s convertim odds n risc dup formula risc=odds/(1+odds) = 0,0944/1,0944 = 0,086, adic 8,6% care reprezint probabiltatea ca acest pacient s aib cancer. Dac pacientul din exemplul de mai sus ar fi avut un VSH de 32mm/h, atunci variabila VSH ar fi luat valoarea 1 i acuaia ar fi devenit: lnODDS(cancer) = -2,36+0,861=-1,499, deci odds(cancer)= e-1,499 =0,2233 i probabilitatea ca acest pacient s aib cancer este 0,2233/1,2233=0,1825 adic 18%. i, n fine, pentru un pacient cu anemie, VSH mai mare de 29mm/h i vrsta peste 63 de ani toate varabilele independente din ecuaie ar fi luat valoarea 1, iar ecuaia ar fi fost lnODDS (cancer)= 2,36+1,150+0,921+0,861=0,572, iar odds (cancer) =e0,572=1,772, deci riscul de cancer= 1,772/2,772=0,639, adic 64% (pentru toate variantele, vezi tabelul 3).