Documente Academic
Documente Profesional
Documente Cultură
MG LP09 PDF
MG LP09 PDF
Lucrarea practică 9
Indicaţii generale:
Prin formularea unui model matematic explicit, un investigator doreşte să descrie
cât de multă variaţie din variabila răspuns (de exemplu din durata de supravieţuire după
diagnosticarea bolii pentru un grup de indivizi) poate fi explicată în termenii uneia sau a
mai multor variabile predictor „statistic semnificative” cu care este corelată.
În acest scop ar putea încerca exprimarea „probabilităţii de supravieţuire” pe o
durată mai mare decât durata d ca funcţie liniară de valorile variabilei (variabilelor)
predictor.
În cercetarea biologică este des folosită regresia logistică (logit). Iar prelucrarea
datelor de supravieţuire se face în primul rând cu tehnica Kaplan-Meyer.
Compararea eficacităţii a două teste biologice se poate face grafic, prin diagrame
de tipul ROC (receiver operating characteristics).
Teme
38: regresia logistică
39: analiza supravieţuirii cu Epi Info
specială: compararea testelor prin curbe ROC în Excel
134
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 11 2015/2016
135
MG - Lucrarea practică 9 2015/2016 UMF “Carol Davila” – Informatică Medicală şi Biostatistică
0.0
10 15 20 25 30 35
136
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 11 2015/2016
137
MG - Lucrarea practică 9 2015/2016 UMF “Carol Davila” – Informatică Medicală şi Biostatistică
Preluaţi graficele (pe care EpiInfo le livrează sub forma de fişiere de tipul JPG) şi
comentaţi-le în fişierul-document Word intitulat nume_COMENTARIU.doc. Comparaţi
comportarea atât „pe termen scurt” (imediat după începerea tratamentului) cât şi „pe
termen lung”. Nu ar trebui să lipsească nici comentariul privind numărul de observaţii de
care ar trebui să dispunem pentru a putea trage concluzii „certe” privind superioritatea
unui tratament asupra altuia (şi nici aprecieri privind „calitatea vieţii” după începerea
tratamentului).
În fişierul LP09_3.xls găsiţi următoarele date înregistrate pentru nou-născuţii cu
greutatea la naştere sub 1 kg:
– sexul, în coloana SEX, valori „F” sau „M”;
– regiunea geografică de domiciliu a părinţilor (5 valori, identificaţi-le), în coloana
REGGEO;
– data naşterii, în coloana DATANAST;
– decedat, valori „Da” sau „Nu”;
– data decesului, în coloana DATADECES (completată dacă este cazul).
Preluaţi cu EpiInfo acest fişier şi încercaţi să răspundeţi – plasând răspunsurile în
documentul Word nume_INFANT.doc – la următoarele întrebări:
1) numărul de decedaţi (comanda Select);
2) distribuţia decedaţilor pe sexe, pe regiuni geografice (comanda Frequencies);
3) distribuţia decedaţilor pe sexe şi pe regiuni geografice (comanda Tables).
Creaţi o nouă variabilă, DurataVietii, în care plasaţi durata vieţii fiecărui subiect
decedat (în zile). Calculaţi media şi mediana acestei noi variabile (comanda Means), apoi
mediile pe sexe. Se poate afirma că durata vieţii la subiecţii de sex feminin diferă de cea a
subiecţilor de sex masculin? Completaţi fişierul nume_COMENTARIU.doc. cu
concluziile d-voastră.
Tema specială: compararea testelor prin curbe ROC în Excel.
Reluăm tema utilizării curbelor ROC (receiver operating characteristics), de data
aceasta pentru compararea eficacităţii a două teste biologice în detecţia aceleiaşi maladii.
Vom utiliza Excel, mai precis creând un fişier „carte de calcul” denumit nume_2ROC, cu
cinci foi de calcul denumite „Datele”, „CalculeCK” şi „CalculeT”, respectiv „GraficCK”
şi „GraficT”.
Testul troponinei T tinde să înlocuiască testul CK (creatin-fosfokinazei) în depistarea
infarctului de miocard deoarece: (a) este mai specific în cazul afectării muşchiului cardiac,
şi (b) poate fi efectuat pe o durată mai îndelungată de timp. Valorile obţinute nu sunt
sensibile la afectarea altor muşchi (prin injecţii, exerciţii fizice sau medicamente).
Să comparăm cele două teste folosind un lot de 44 pacienţi, asupra cărora au fost
efectuate ambele teste. Unii dintre aceştia au avut confirmat ulterior diagnosticul „infarct
miocardic”. Rezultatele măsurătorilor (exprimate pentru testul CK în unităţi/litru iar pentru
testul TT în micrograme/litru) precum şi diagnosticul final le veţi prelua din fişierul
LP09_4.xls.
Plasaţi coloana diagnosticelor, urmată de coloanele CK şi TT, în domeniul A1:C45 al
foii de calcul „Datele” din fişierul nume_2ROC.
Aşa cum aţi procedat întro lucrare practică anterioară, veţi începe prin a determina
valorile extreme ale testelor. În celula D1 plasaţi textul „Extreme CK”, în E1 plasaţi textul
„Extreme T”, apoi în celulele din domeniul D2:E3 inseraţi formulele de calcul
corespunzătoare. (În D2 formula =MIN(B2:B45), ... în E3 formula =MAX(C2:C45).)
Copiaţi acum pentru calcule datele din coloanele A:B în foaia „CalculeCK”. Aici le
veţi sorta în ordine crescătoare după valorile testului (coloana B?) după care, pe coloana
139
MG - Lucrarea practică 9 2015/2016 UMF “Carol Davila” – Informatică Medicală şi Biostatistică
141