Sunteți pe pagina 1din 14

Analiza evenimentelor

Cornelia Muresan
Universitatea Babes-Bolyai
Structura cursului

 Analiza evenimentelor biografice


 Introducere
 Domenii de utilizare si exemple
 Notiuni: - eveniment, episod, timp al procesului
- populatie expusa riscului, trunchiere
- probabilitati de supravietuire, rata hazard

 Tabele de supravietuire
 SPSS: comenzi si exemplu

 Regresia Cox (introducere)

 Lucrare de laborator
2
Analiza evenimentelor biografice

 Ce este Event History Analysis (EHA) ?

Ansamblu de metode, tehnici si indicatori destinat analizei biografiilor;


adica o analiza specifica perspectivei cursului vietii.

Se realizeaza pe baza unor date:

- logitudinale (ordonate cronologic) culese la nivel de individ


- combinand in mod simultan marcatori personali, de grup si sociali

 Se utilizeaza in numeroase domenii ale cunoasterii, dar

 Interesul comun este indreptat catre :


Studierea aparitiei unor evenimente si evaluarea probabilitatilor de a se
produce in timp
Studierea duratei de timp in care persista o anumita stare

3
Domenii ale cunoasterii unde se utilizeaza:

 Medicina (analiza de supravietuire): efectul diferitelor medicatii si a diverselor


tratamente in prelungirea vietii sau a starii de sanatate. Spitalizari, recidivarea
unor boli tratate anterior, episoade psihotice, etc.

 Demografie (analiza evenimentelor de viata): parasirea casei parintesti,


casatoria, divortul, recasatoria, nasterea, avortul, migratia, etc. Descrierea
fenomenelor si studierea efectului unor factori cum sunt: varsta, educatia, etc.

 Stiintele sociale (altele decat demografia): evaluarea programelor sociale,


infractionalitatea, somajul si activitatea in campul muncii, etc. Atunci cand se
urmareste:
- producerea unor schimbari calitative in vietile oamenilor (ex: angajare in
campul muncii, iesirea din dependenta de ajutoare sociale, renuntarea la
comportamente adictive, plasarea copiilor orfani in ingrijire, etc.)
- mentinerea cat mai indelungata a persoanelor aflate sub risc in afara
comiterii/intamplarii unor fapte nedorite (ex: a se sinucide, a abuza copii,
violenta domestica, a se reapuca de baut / fumat / droguri, abandonul scolar,
a ucide, a fura, a comite infractiuni, etc.)

 Inginerie (analiza de anduranta): cat timp trece pana se strica motorul?


4
Eveniment, episod, timp al procesului

 Doua din conceptele fundametale EHA: eveniment si episod

 Evenimentul este o schimbare calitativa in circumstante, si nu schimbari


cantitative graduale.

 Episodul este intervalul de timp dintre doua evenimente.

 Exemple:
- nastere (evenimentul) si interval de varsta pana la nastere (episodul)
- divort (evenimentul) si durata casatoriei pana la divort (episodul)
- recidiva (evenimentul) si interval de timp de la eliberare la comiterea
unei noi infractiuni (episodul)
- sarcina adolescentina (ev) si '? interval de timp de la participarea la
programul de preventie? de la prima experienta sexuala? de la 15 ani?

 decizia asupra evenimentelor si a episoadelor este cruciala in EHA.


Importanta luarii in considerare a scopului si obiectivelor practice ale
cercetarii in decizia asupra a ceea ce este episodul .
5
Eveniment, episod, timp al procesului

 Timp al procesului: durata scursa de la un eveniment initial, cand individul intra


sub risc

 Unitatea de timp pentru masurarea episoadelor este f. importanta in EHA:

anul, luna, saptamana, ziua, ora?

 In demografie
Ex1: luna (pt. nasterea in cadrul casatoriei, ziua ar fi prea mult)

 In evaluarea programelor:
Ex2: luna (pt iesirea din dependenta de ajutorul social, daca acesta se acorda lunar);
Ex3: ziua, saptamana (pt recidiva / abstinenta, anul ar fi prea lung)

 Alegerea inadecvata a unitatii de timp distorsioneaza rezultatele


In situatia din ex2, alegerea anului ca unitate de masura pentru episodul de
dependenta de ajutor social ar face ca cel mai scurt episod sa fie 1 an, cand de fapt el
poate fi 3 luni. Asta ar face ca rezultatele sa fie supraevaluate, adica sa rezulte ca
familiile primesc ajutor mai mult timp decat primesc de fapt.
6
Populatie expusa riscului si trunchiere

 Populatia expusa riscului este populatia careia i se poate intampla


teoretic evenimentul.
A fi expus riscului nu exprima neaparat un pericol. Riscul e un termen
neutru in EHA.
Ex: Mamele cu un singur copil risca sa dea nastere unui al 2-lea copil,
dar nu sunt in pericol vis a vis de dezirabilitatea evenimentului: In schimb
pacientii tratati de cancer risca sa recidiveze, inclusiv in sensul
indezirabilitatii evenimentului.

 Trunchierea este un concept unic in EHA.


Trunchierea la stanga e atunci cand o persoana intra sub risc (incepe un
episod) inainte de inceperea studiului si nu se cunoaste nimic din ce s-a
intamplat inainte de inceperea urmaririi. Solutie: eliminarea cazurilor (doar
pt SPSS)
Trunchierea la dreapta e atunci cand nu s-a observat inca sfarsitul
episodului, iar evenimentul se poate intampla dupa incheierea studiului, sau
poate sa nu se intample niciodata. Eliminarea cazurilor fara evenimente
observate ar distorsiona mult rezultatele (am considera doar indivizii cu
episoade scurte). Solutie: tratata de EHA, prin introducerea variabilei stare
(1- eveniment, 0- trunchiere / censored)
7
Probabilitati de supravietuire si rata hazard

 Probabilitatea de supravietuire este estimatia probabilitatii ca indivizii din


populatia expusa riscului sa supravietuiasca evenimentului de la un interval
de durata la urmatorul.

 Probabilitatea cumulata de supravietuire exprima estimatia probabilitatii


ca o persoana sa supravietuiasca evenimentului de la momentul intrarii sub
risc pana la un moment dat de timp.

 Rata hazard este estimatia probabilitatii de aparitie a evenimentului in


conditiile in care persoana este expusa riscului (Allison 1984).
Mai exact ea este estimatia probabilitatii pe unitatea de timp ca o persoana
care a supravietuit evenimentului pana la inceputul intervalului sa
experimenteze evenimentul pe parcursul acelui interval de timp (Norusis 1993).
(In abordarea in timp discret rata hazard este o probabilitate.)

Exprima propensitatea instantanee, intensitatea de producere a


evenimentului la momentul de timp t , cu conditia sa nu se fi produs pana
atunci.
(In abordarea in timp continu rata hazard nu mai este o probabilitate, poate fi >1.)

 Durata medie/mediana de supravietuire indicatori ai tendintei centrale


pentru longevitatea (timpul petrecut) in starea de supravietuire
8
Tabele de supravietuire. Exemplu SPSS

 Fisier SPSS: Breast cancer survival.sav


 Numar observaii: 1207
 Lista de variabilele:

ID
AGE Age (years)
PATHSIZE Pathologic Tumor Size (cm)
Ipc:
LNPOS Positive Axillary Lymph Nodes
HISTGRAD Histologic Grade Sansele de
4 M Unknown supravietuire a
ER Estrogen Receptor Status pacientelor operate
0 Negative
1 Positive
de cancer la san sunt
2 M Unknown cu atat mai mari cu
PR Progesterone Receptor Status cat marimea tumorii
0 Negative patologice este mai
1 Positive mica.
2 M Unknown
STATUS Status
0 Censored
1 Died
PATHSCAT Pathological Tumor Size (Categories)
0 0 cm
1 <= 2 cm
2 2-5 cm
3 > 5 cm
LN_YESNO Lymph Nodes?
0 No
9 TIME
1 Yes
Time (months)
Tabele de supravietuire. Exemplu SPSS

 Fisierul de date: Breast cancer survival. sav


 C-da: Survival, Life tables
Life Table
Survival Variable time Time (months)

Number Number Number Number Cumul


Intrvl Entrng Wdrawn Exposd of Propn Propn Propn Proba-
Start this During to Termnl Termi- Sur- Surv bility Hazard
Time Intrvl Intrvl Risk Events nating viving at End Densty Rate
------ ------ ------ ------ ------ ------ ------ ------ ------ ------
0 1207 129 1142.5 2 .0018 .9982 .9982 .0001 .0001
12 1076 183 984.5 15 .0152 .9848 .9830 .0013 .0013
24 878 147 804.5 14 .0174 .9826 .9659 .0014 .0015
36 717 166 634.0 20 .0315 .9685 .9355 .0025 .0027
48 531 153 454.5 8 .0176 .9824 .9190 .0014 .0015
60 370 121 309.5 5 .0162 .9838 .9041 .0012 .0014
72 244 91 198.5 7 .0353 .9647 .8723 .0027 .0030
84 146 59 116.5 0 .0000 1.0000 .8723 .0000 .0000
96 87 39 67.5 1 .0148 .9852 .8593 .0011 .0012
108 47 25 34.5 0 .0000 1.0000 .8593 .0000 .0000
120 22 19 12.5 0 .0000 1.0000 .8593 .0000 .0000
132 3 3 1.5 0 .0000 1.0000 .8593 .0000 .0000
Numar Numar Numar Numar Probab Denste
Intrvl expusi perdti expusi eveni- Probab Probab suprv de
de timp risc la in la mente de a supra- cumul proba- Rata
10
(incep) intrare intrvl risk termnl termina vietui (la sf) bilit Hazard
Tabele de supravietuire Kaplan Meier

 C-da: Survival, Kaplan-Meier, Factor ', Compare Factor '


Kaplan Maier
Survival Analysis for time Time (months)

Factor Pathological Tumor Size (Categories) pathscat <= 2 cm


Survival Time Standard Error 95% Confidence Interval
Mean: 126.73 1.28 ( 124.23, 129.23 )

Factor pathscat = 2-5 cm


Survival Time Standard Error 95% Confidence Interval
Mean: 108.48 3.23 ( 102.15, 114.82 )

Factor pathscat = > 5 cm


Survival Time Standard Error 95% Confidence Interval
Mean: 63.20 9.75 ( 44.10, 82.30 )

Survival Analysis for time Time (months)


Total Number Number Percent
Events Censored Censored
pathscat <= 2 cm 826 31 795 96.25
pathscat 2-5 cm 283 33 250 88.34
pathscat > 5 cm 12 2 10 83.33
Overall 1121 66 1055 94.11

Test Statistics for Equality of Survival Distributions for pathscat


Statistic df Significance
11 Log Rank 33.00 2 .0000
Tabele de supravietuire. Life Table

 C-da: Survival, Life tables, Factor', Options:Compare Levels of Factor

Life Table
Survival Variable TIME Time (months)
for PATHSCAT Pathological Tumor Size (Categories)
= 1 <= 2 cm

...

Comparison of survival experience using the Wilcoxon (Gehan) statistic


Survival Variable TIME Time (months)
grouped by PATHSCAT Pathological Tumor Size (Categories)

Overall comparison statistic 30.018 D.F. 2 Prob. .0000

Group label Total N Uncen Cen Pct Cen Mean Score

1 <= 2 cm 826 31 795 96.25 15.6634


2 2-5 cm 283 33 250 88.34 -42.0636
3 > 5 cm 12 2 10 83.33 -86.1667

12
Regresia Cox

Analiza descriptiva si inferentiala:Tabele de supravietuire


Life-Table, Kaplan-Meier

Analiza cauzala: Regresia ratei hazard


Cox Regression

Perspectiva cursului vietii si analiza evenimentelor


(Curs in semestrul III)

13
Interpretarea rezultatelor
1. Pentru testarea ipotezei de cercetare, trebuie comparate functiile de supravietuire pana la eveniment (si
in general toti indicatorii statistici EHA: rate hazard, durate medii si mediane, etc). Acest lucru se poate
fie cu procedura Life-Table (cerand optiunea Compare Levels), fie cu procedura Kaplan-Meier (unde
testarea semnificatiei statistice este implicita). In amble cazuri se va specifica numele testului statistic,
gradele de libertare, nivelul de semnificatie, si se trag concluziile referitoare la ipoteza nula.
Ex. Testul Log Rank pentru compararea complexa a functiilor de supravietuire, arata o valoare de 33,
careia ii corespunde, pentru 2 grade de libertate, un nivel de semnificatie p < 0,0001. Ipoteza nula a
egalitatii functiilor se respinge.

2. Pentru estimarea probabilitatilor de supravietuire pana la o durata specificata se lucreaza cu


probabilitatile cumulate de supravietuire. Se prezinta rezultatele separat pentru fiecare subgrup, si se
compara:
Ex: Pacientele cu tumori mici (pana in 2 cm) au probabilitatea de a supravietui 5 ani de la operatie de
95,44%, cele cu tumori medii (2-5 cm), au o probabilitate mai mica 81,64%, in timp ce cele cu tumori
mari (peste 5 cm) au o probabilitate de supravietuire si mai mica 67,50%.

3. Pentru evaluarea riscului maxim se examineaza ratele hazard pe toate intervalele in care exista un
minim de populatie expusa riscului (de regula 15). Se fac comparatii atat in ceea ce priveste durata cat si
intensitatea.
Ex: Riscul maxim de deces este in cel de al 7-lea an (intervalul 72-84 luni) de la operatia de cancer la
san: adica 0,0030 decese pe luna. Un risc mare se inregistreaza si in anul al 4-lea, unde probabilitatea
lunara de deces este 0,0027.

4. Pentru calculul duratelor medii avem nevoie de procedura Kaplan-Meier.


Ex: Durata medie de supravietuire a pacientelor operate de cancer la san cu tumori mici, sub 2 cm, este
de 126,73 luni (aprox. 10 ani si jumatate), pentru cele cu tumori medii de 2-5 cm, este 108,43 luni (circa
9 ani), in timp ce pentru cele cu tumori mari, peste 5 cm, durata medie de supravietuire este 63,20 luni (5
ani si 3 luni).
5. Se trag concluziile in termenii ipotezei de cercetare de la care s-a pornit.
14 Ex: Pe baza datelor de monitorizare a pacientelor operate de cancer de san, s-a constatat ca sansele de
supravietuire a pacientelor operate de cancer la san sunt cu atat mai mari cu cat tumoarea a fost mai
mica.