Documente Academic
Documente Profesional
Documente Cultură
Supravieţuirea se referă la analiza în timp a probabilităţii de apariţie a unui anumit eveniment. Decesul
a fost iniţial urmărit, iar ca variabilă de lucru timpul până la producerea acestuia.
Putem da câteva exemple atât pozitive dar şi negative ca efect, care au făcut temele de studiii în cadrul
cercetărilor:
1 – O parte din pacienţii care iniţial au fost incluşi în studiu vor fi pierduţi pe parcurs datorită cauzelor
obiective (pierderea contactului cu persoana prin diferite forme: schimbarea adresei, abandon, deces din
alte cauze, sau terminarea studiului şi neapariţia evenimentului studiat). Acestea sunt cunoscute ca date
cenzurate (sau eliminate) şi sunt utile până în momentul înlăturării din studiu.
2 – Putem înrola în studiu noi pacienţi ce apar pe perioada definită de analiză. Aceştia la rândul lor
aduc un aport de informaţie care ajută la creșterea preciziei în estimările făcute.
Metoda Kaplan Meier este o tehnică statistică neparametrică ce permite estimarea probabilităţii de
supravieţuire în timp, acceptând lucrul cu date cenzurate cât şi introducerea de noi cazuri în perioada de
cercetare.
METODĂ
Să considerăm cazul standard în care evenimentul studiat este decesul și dorim să studiem funcția de
supraviețuire. Aceasta este probabilitatea ca la momentul T>ti pacienții să se afle în viață. Dacă
cunoaștem probabilitatea de deces atunci probabilitatea de supraviețuire este Psupraviețuire = 1-Pdeces.
Este clar că în timp această probabilitate variază, scade şi astfel forma sa este descrescătoare. Cu cât
timpul trece cu atât mai puţini pacienţi vor fi în viaţă şi astfel probabilitatea de supravieţuire va scădea.
La diferite momente de timp ti au loc evenimente ce reprezintă decesul sau cenzura. Punctele de
deces afectează probabilitatea de supravieţuire deci aceasta trebuie recalculată. Volumul pacienților la
risc pe un anumit subinterval depinde atât de decesele cât și de cenzurile anterioare. Astfel și cenzurile
afectează probabilitatea de supraviețuire respectiv deces.
Dacă este să avem o prezentare în timp a apariţiei evenimentelor ce caracterizează starea pacienţilor
(cenzură sau deces) cât şi a înrolării de noi cazuri, acestea ar putea fi reprezentate grafic asemănător
celor din figura următoare. Observăm că există un start (marcat cu romb negru) şi apoi evenimentul ce
defineşte sfârşitul (marcat prin cerc).
Eveniment de studiu
realizat Pacienţi
Pacienţi
P1
P1
Cenzură P2
P2
Sfârşit studiu
Sfârşit studiu T0 T1 T2 T3 Ti
Reperul este determinat Timp
timp (calendaristic)
Figura 1. Monitorizarea pacienţilor pe perioada de studiu. Figura 2. Aducerea la reper zero în timp a pacienţilor din studiu.
Evenimentele au loc la momentele notate: T1, T2, … Ti, … Tn. Între acestea se respectă relaţia: T1 < T2 <
… < Ti < … < Tn. Momentul de start este T0 definit de scopul studiului. Aici trebuie să se acorde o atenţie
deosebită, deoarece poate exista o mare relativitate în stabilirea momentului de start (de ex. în cancerul de
sân, care este momentul de determinare a prezenţei neoplaziei ?). Toate cazurile luate în studiu trebuie să
fie tratate uniform pentru a nu introduce erori.
CALCLUL FUNCȚIEI DE SUPRAVIEȚUIRE
Probabilitatea
Etapele de calcul sunt detaliate în tabelul
Eveniment
Prob. De alăturat.
Cenzuri
cumulată de
urmărit
Pacienţi la supraviețuire
Ziua
Coloana E: =1-C3/D3
Coloana F: =PRODUCT($E$2:E3)
Coloana G: =1-SUM($C$2:C3)/$C$12
Am repetat calculul din tabelul anterior ținând cont de cenzuri – probabilitatea cumulată de supraviețuire
fiind calculată în coloana F.
În coloana G am aplicat formula directă fără a ține cont de cenzuri.
Cum era de așteptat rezultatele sunt identice.
REPREZENTAREA GRAFICĂ A FUNCȚIEI DE SUPRAVIEȚUIRE
Percentiles
25.0% 50.0% 75.0%
Estimate Std. Error Estimate Std. Error Estimate Std. Error
13.000 1.149 10.000 1.480 6.000 1.442
urmărit
decât evenimente cenzurate
Ziua
- În ultima zi avem un
eveniment cenzurat.
1 7 2
2 4 0 Observații:
3 2 2
4 3 3
6 1 2 - Probabilitatea de
8 3 4 supraviețuire se calculează numai
10 2 1
în momentele în care avem
11 2 2
13 1 2 decese (cenzurile modifică
14 1 1 volumul eșantionului deci
total 25 20 participă la calculul supraviețuirii)
- Dacă avem cenzuri în ultimul
interval de timp atunci nu se
atinge valoarea 0 a probabilității
de supraviețuire.
COMPARAȚII ÎNTRE FUNCȚIILE DE SUPRAVIEȚUIRE
Dacă sunt mai multe grupuri de date ce reprezintă funcţii diferite de supravieţuire atunci acestea pot fi
comparate prin teste statistice ca: Log Rank (Mantel-Cox), Breslow (Generalized Wilcoxon) sau Tarone-Ware
(existente în aplicația SPSS). Aceste teste reprezintă statistici de tip Chi pătrat (𝜒2).
Metoda Log Rank ponderează în mod egal evenimentele, Breslow folosește ca ponderi pentru fiecare
eveniment numărul de pacienți la risc iar Tarone-Ware folosește ca ponderi radical din pacienții la risc.
Metoda de calcul pentru testul Log Rank (există diferite forme ale statisticii).
Această metodă ponderează evenimentele în mod egal și are putere mare dacă condiția de hazard
proporțional este respectată.
Pentru fiecare grup se determină valorile observate ale frecvenţelor absolute (valorile determinate
experimental, notate cu O) şi se calculează de asemenea valorile aşteptate (expected values, notate cu E).
De exemplu pentru două loturi de 30 respectiv de 40 pacienţi, în care avem în prima săptămână un singur
deces, putem calcula aceste valori ale frecvenţilor:
- frecvenţa absolută observată O=O1+O2=1, respectiv relativă este 1/(30+40)=0.0142.
- frecvenţa absolută aşteptată în grupul 1 este Egrup1=30 * 0.0142=0.428
- frecvenţa absolută aşteptată în grupul 2 este Egrup2=40 * 0.0142=0.572
Se determină pentru fiecare grup frecvenţele absolute aşteptate în fiecare moment și apoi se calculează
suma frecvenţelor observate totale şi aşteptate pentru grupul 1 respectiv grupul 2.
σ O − σ Ejt 2
σ
t jt t
În final se află statistica Chi pătrat: χ = j
2 σ E
t jt unde j reprezintă grupul iar t timpul.
Numărul gradelor de libertate este nr. de grupuri -1.
În final se compară valoarea calculată cu valoarea tabelată.
Observaţii
Menţionăm că în cazul studiului decesului, panta echivalentă a curbei de supravieţuire este de dorit să fie
cât mai mică, implicând ca graficul să fie cât mai aproape de o paralelă cu axa XX’. Aceasta ar implica o
scădere lentă a probabilităţii de supravieţuire în timp. Efectul ar fi un timp de viaţă îndelungat, evident sperat
poate de mulţi dintre noi.
Dacă intenţionăm să studiem timpul necesar pentru ca un medicament să aibă efect în însănătoşirea
pacientului, atunci de dorit este ca panta să fie cât mai mare, adică efectul să fie cât mai rapid.
Iată, depinzând de situaţia în care ne aflăm, forma grafică a funcţiei poate diferi, având caracteristici dorite
chiar opuse, tocmai datorită scopului optim de atins.
Probabilitate cumulată
Probabilitate cumulată
Eveniment = deces Eveniment = efect tratament
Timp
Timp
Exemplu de realizare a analizei de supravieţuire folosind metoda Kaplan Meier în SPSS
Lansarea în execuţie se realizează apelând meniul şi urmând calea: Analyze → Survival → Kaplan-Meier
- Curba Kaplan-Meier (KM) reprezintă funcția de supraviețuire – descrie în timp modificarea probabilității de
supraviețuire P(T>ti);
- Deoarece avem în timp decese curba este descrescătoare dar poate ajunge la un moment dat constantă;
- Tehnica KM permite introducerea de noi pacienți pe durata studiului;
- Tehnica KM acceptă pierderea de participanți pe durata studiului (cenzuri);
- Un participant la studiu în final se poate afla într-una din cele două stări: eveniment studiat îndeplinit sau
cenzură;
- Se pot compara curbele KM prin teste neparametrice folosind statistici de tip Chi pătrat;
- Dacă comparăm mai mult de două funcții de supraviețuire și obținem semnificație nu știm care dintre
curbe diferă (se pot compara două câte două sau metoda Cox).
- Metoda KM nu ține cont de eventualele covariabile ce pot afecta probabilitatea de supraviețuire (metoda
Cox este dezvoltată pentru aceasta);
- În timp volumul eșantionului scade (datorită cenzurilor și evenimentelor îndeplinite). Dacă am reprezenta
curba KM cu intervale de confidență acestea ar crește odată cu timpul;
- Deoarece timpul măsurat nu respectă de obicei o distribuție normală, cuartilele sau la modul general
cuantilele (percentile) ne dau informații pertinente în studiul supraviețuirii;
- Metoda KM reprezintă o formă generală de analiză a probabilității cumulate a evenimentului în timp – nu
este dedicată doar supraviețuirii.
Exemplu – R pachetul survival
Avem un fișier ce conține trei coloane care descriu timpul, evenimentul respectiv grupul (salvat sub
formă text cu delimitare tab). Este un fișier generic, timpul este exprimat în zile, evenimentul este definit cu 1
respectiv grupul cuprinde două valori, 1 și 2.
Încărcăm pachetul survival:
> library(survival)
Avem o varietate de parametri pentru reprezentarea grafică (putem afișa chiar valoarea semnificației
comparării curbelor). Folosim funcția ggsurvplot(). Această funcție se găsește în pachetul survminer.
> library(survminer)
> ggsurvplot(KM1,conf.int = TRUE, surv.median.line = "hv",pval=TRUE,break.time.by=2)
Putem compara curbele de supraviețuire prin mai
multe teste – exemplificăm doar pentru log rank test
(rho=0):
>survdiff(Surv(zi, eveniment) ~ grup, data =
data_1,rho = 0)
Iată avem doar două coloane ce definesc timpul până la eveniment respectiv tipul evenimentului.
Vom avea o singură curbă Kaplan Meier ce o putem caracteriza statistic.
> library(survival) # încărcăm pachetul necesar analizei
> data_1=read.delim(file.choose(), sep = "\t", header=TRUE) # încărcăm datele de lucru
> KM1 <- survfit(Surv(zi, eveniment==1) ~ 1, data = data_1) # calculăm datele necesare creării
analize KM. Aici s-a folosit funcția survfit ce creează un obiect numit KM1 face apel la funcția Surv ce
depinde de un singur grup ~ 1.
> summary(KM1) # afișăm sumarul calculelor din obiectul KM1
Situația unui singur set de date
$lower
25 50 75
4 8 11
$upper
25 50 75
8 11 NA
Reprezentarea grafică
> library(survminer)
> ggsurvplot(KM1,fun="pct",conf.int = TRUE, surv.median.line = "hv",break.x.by=2,xlab="Zi", palette =
"blue", risk.table = TRUE)
> ggsurvplot(KM1,fun="cumhaz",conf.int = TRUE,break.x.by=2,xlab="Zi", palette = "red")
VĂ MULȚUMESC !