Sunteți pe pagina 1din 21

ANALIZA SUPRAVIEŢUIRII

METODA KAPLAN-MEIER

COMPARAREA CURBELOR DE SUPRAVIEŢUIRE.

Sef lucr. Dr. Mihaela Moscalu


ANALIZA SUPRAVIEŢUIRII

 Suntem adesea interesaţi în studiul intervalului de timp până la apariţia unui eveniment de
interes.
 Supravieţuirea se referă la analiza în timp a probabilităţii de apariţie a unui anumit eveniment.
 Dacă considerăm „decesul” evenimentul urmărit, variabila ce caracterizează perioada de viaţă
este timpul scurs până la realizarea acestuia.
 În cadrul "analizei supravieţuirii" putem aborda orice analiză a timpului până la un efect
(eveniment),
 care nu este neapărat decesul (infarct miocardic, hemoragie digestivă, decompensare,
recidivă, etc.) şi
 rareori poate fi şi unul bun (vindecarea, o sarcina dorita etc.).

 În consecinţă, în baza de date a studiului vom avea:


 variabilele dependente (efect: deces, recidiva, aparitia unei complicatii, etc.)
 independente (factori de risc, factori de confuzie potenţiali etc.)
 şi o variabilă timp.
ANALIZA SUPRAVIEŢUIRII

Exemple de evenimente (pozitive sau negative) care pot constitui


obiectul unei cercetări pe baza analizei supravieţuirii:

 Timpul scurs de la îmbolnăvire până la deces


 Timpul scurs până la apariţia recidivelor etc.
SAU
 Timpul scurs până la însănătoşire în cazul aplicării unui tratament
(intervenţie)
 Timpul scurs până la apariţia unei sarcini în urma aplicării unui
tratament (intervenţie) etc.

Cum putem examina acest interval de timp.


Cum extragem informaţii din datele culese.
Cum interpretăm rezultatele obţinute.
ANALIZA SUPRAVIEŢUIRII
 Să presupunem că se doreşte studierea eficacităţii unui nou tratament pentru o afecţiune
severă, ce determină în general decesul pacientului. Putem spune că acest tratament este
eficient dacă la sfârşitul unei perioade cât mai mari de timp numărul de pacienţi care au
supravieţuit este cât mai mare.
 Primul pas pentru evaluarea noastră îl constituie, bineînţeles, înregistrarea datei la care se
începe aplicarea tratamentului. Astfel, putem afla cu uşurinţă numărul de zile (săptămâni,
luni, ani) care au trecut de atunci şi până la sfârşitul studiului.
 Initial avem nevoie de informaţii (date corespunzătoare fiecărui pacient în parte):
 variabila timp (o coloană de date – timp) şi
 o altă variabila ce defineşte realizarea sau nu a evenimentului urmărit.
ANALIZA SUPRAVIEŢUIRII

Trebuie să răspundem la întrebarea:


Care este supraviețuirea în prima lună de tratament, sau care este supravieţuirea medie, sau în
cât timp am pierdut de exemplu 50% din pacienţi, dar 30% dintre aceştia?

 Evident toate întrebările sunt legate de conceptul de timp.

 Am putea în primă etapă să folosim noţiunile specifice din statistica descriptivă deci, am putea
caracteriza populaţia prin indicatorii statistici de:
 localizare: medie, mediana, modul;
 variatie: dispersia, amplitudinea, intervalul intercuartilic;
 distribuţie de frecvenţă,
 sau se pot realiza comparaţii între aceşti indicatori pentru diferite loturi studiate.
ANALIZA SUPRAVIEŢUIRII
PROBLEME SPECIFICE:
 Pe parcursul studiului se pierd pacienţi din diferite motive (schimbare de adresă, abandon,
deces din alte cauze sau terminarea studiului şi neapariţia evenimentului analizat etc.). Astfel,
suntem nevoiţi să eliminăm datele incomplete pe perioada de analiză. Dacă pierdem cantităţi
importante de informaţie putem compromite întregul studiu.
 Datele pierdute se numesc date cenzurate. Acestea conţin informaţie parţială.
 De asemenea pot apărea cazuri noi care ar trebui incluse în lot. Dacă am transla toate
înregistrările la o origine de timp comună am putea ţine cont de informaţia chiar parţial
introdusă. Ar trebui să folosim într-un mod corect această informaţie care ne-ar aduce, evident,
un plus de informaţie care ajută la eliminarea indeciziilor existente.
 Nu putem, de exemplu, să calculăm durate medii de supravieţuire, pe de o parte pentru că
duratele de supravieţuire par a nu avea o distribuţie Gaussiană, iar pe de altă parte, pentru că
nu se poate calcula media dacă nu se ştiu toate duratele de supravieţuire, aşadar nu poţi
analiza datele până nu a decedat şi ultimul pacient. Ori asta nu se întâmplă de obicei în studii,
întotdeauna mai rămân pacienţi în viaţă la sfârşitul studiului.

Analiza de tip Kaplan-Meier permite exact acest tip de lucru cu date cenzurate şi/sau noi.

Practic profităm de toată informaţia pe care o avem pe parcursul intervalului de timp investit în
cercetare.
ANALIZA SUPRAVIEŢUIRII

 Cenzurarea şi anormalitatea distribuţiei datelor de supravieţuire necesită metode statistice


adecvate pentru analizarea lor corectă.
 Datele de supravieţuire (sau evoluţia unei populaţii) se descriu grafic prin curbe de
supravieţuire.
 Curba Kaplan Meier reprezintă evoluţia probabilităţii de supravieţuire în timp.
 Ca metodă de calcul într-un mod vag exprimată, aceasta reprezintă: numărul de cazuri în
viaţă raportat la numărul total de cazuri de la începutul studiului.
ANALIZA SUPRAVIEŢUIRII
 Analiza supravieţuirii trebuie interpretată în mod corect ca o analiză în timp a realizării
evenimentului.

 Funcţia de supraviețuire este descrisă de probabilitatea ca la momentul Ti pacienţii să se afle


în viaţă.
 Această probabilitate se deduce cunoscând numărul de decese şi numărul de cazuri cenzurate
în fiecare interval de studiu.

 Probabilitatea de supravieţuire este complementară probabilităţii decesului.


Cumulative Proportion Surviving (Kaplan-Meier)
AGE (value cut off for age - 65 years old)
Complete Censored

1.0

0.9
Cumulative Proportion Surviving

0.8

0.7

0.6

0.5

0.4
age<65
years old
0.3
age>=65
10 20 30 40 50 60 70 80 90 100 110
years old
Time
ANALIZA SUPRAVIEŢUIRII
 În timp această probabilitate de supravietuire variază, scade şi astfel ea va capăta o tendinţă
descrescătoare. Cu cât timpul trece cu atât mai puţini pacienţi vor fi în viaţă.
 La diferite momente de timp Ti se produc evenimente ce reprezintă decesul sau cenzura. Acestea definesc
punctele în care probabilitatea de supravieţuire îşi schimbă valoarea.
 Reprezentarea timpului de apariţie a evenimentelor ce caracterizează starea pacienţilor (cenzura/deces) cât
şi a momentului înrolării de noi cazuri.
 Există un moment de start (romb) pentru fiecare pacient şi de asemenea momentul apariţiei evenimentului
(sfârșitul urmăririi - cerc).

Monitorizarea pacienților pe perioada de studiu


ANALIZA SUPRAVIEŢUIRII

 Pentru o interpretare corectă trebuie să realizăm o translaţie în sensul aducerii tuturor


punctelor de start la un moment de referinţa comun, considerat reper 0 al axei timpului.
 Dacă pierdem pacienţi în perioada de studiu, atunci pe fiecare subinterval vom avea
probabilităţile diferite. Va trebui să calculăm probabilitatea pe subinterval şi vom face apel la
teoria probabilităţilor.
 Evenimentele au loc succesiv la momentele notate T1 < T2 < … < Ti < … < Tn.
ANALIZA SUPRAVIEŢUIRII

 Momentul de start T0 este definit de scopul studiului.

 Aici trebuie să se acorde o atenţie deosebită deoarece, poate exista o mare relativitate în
stabilirea momentului de start (de ex.: în cancerul de sân, care este momentul de determinare
a prezenţei neoplaziei?).
 Toate cazurile luate în studiu trebuie să fie tratate uniform pentru a nu introduce erori.

Aducerea la reper zero în timp a pacienţilor din studiu


ANALIZA SUPRAVIEŢUIRII

Există trei funcţii care descriu distribuţia de supravieţuire:

 Funcția de supravieţuire S(t)

 Funcţia densitate de probabilitate f(t) şi F(t) – funcţia de probabilitate


cumulată

 Funcţia hazard h(t) şi H(t) – funcţia hazard cumulată.


ANALIZA SUPRAVIEŢUIRII - FUNCŢIA DE SUPRAVIEŢUIRE
 S(t) reprezintă probabilitatea ca un individ să supraviețuiască mai mult decât momentul t.
 Dacă nu avem elemente cenzurate, funcţia de supravieţuire este:
S(t)=număr de pacienţi in viaţă la momentul t/număr total de pacienţi luaţi în studiu
 Această formulă este corectă pentru un volum foarte mare a eşantionului.
 Pentru a caracteriza corect funcţia de supravieţuire se foloseşte mediana în locul mediei. Aceasta
exprimă corect valoarea centrală, deoarece distribuţia în general nu este de tip normal iar cazurile
extreme pot influenţa în mod eronat valoarea mediei.
 Sunt foarte utile şi cuartilele, cele trei valori ce împart distribuţia în 4 grupe de probabilităţi egale
cu 25% (cuartila 2 - Q50(Me) - este tocmai mediana).
 Mediana reprezintă timpul (luni, ani, săptămâni) pentru care probabilitatea de supravieţuire a
scăzut la jumătate, 50%.
 Se poate astfel determina curba de supravieţuire. În continuare se calculează cuartilele prin
metoda grafică prin trasarea de drepte paralele cu abscisa în punctele de probabilităţi egale cu
0.75, 0.50 respectiv 0.25.
ANALIZA SUPRAVIEȚUIRII - FUNCŢIA HAZARD

 h(t) se defineşte ca fiind probabilitatea realizării evenimentului studiat într-un


timp foarte scurt (Δt) cunoscând că până la momentul t evenimentul nu s-a
realizat.

 Funcţia hazard exprimă riscul de a deceda în unitatea de timp la o anumită


vârstă, sau riscul general de a se realiza evenimentul la un moment t.

 Se mai numeşte şi rată condiţionată a mortalităţii, sau


rată instantanee de producere a evenimentului.

 Dacă nu avem evenimente cenzurate pentru h(t) aven formula:


h(t) = (numărul de evenimente realizate începând cu t)
[(nr. de pacienţi ajunşi în studiu în momentul t) x (Δt)]
METODA KAPLAN MEIER
COMPARAREA CURBELOR DE SUPRAVIEŢUIRE.

 Analiza în timp a evenimentului.

 Metoda Kaplan Meier este o tehnică statistică neparametrică ce determină


probabilităţile de supravieţuire în timp, acceptă lucru cu date cenzurate şi
permite introducerea de noi cazuri în perioada de cercetare.

 Curba Kaplan Meier reprezintă evoluţia probabilităţii de supravieţuire în


timp.

 Ca metodă de calcul într-un mod vag exprimată, aceasta reprezintă:

numărul de cazuri în viaţă raportat la numărul total de cazuri de la începutul


studiului.
METODA KAPLAN MEIER
 Curba de supravieţuire arată cum variază proporţia de pacienţi în viaţă (sau care nu au realizat
evenimentul predefinit (deces/vindecare, ...) în timp. Astfel, se porneşte de la 100%
supravieţuitori la începutul studiului şi acest număr scade pe măsură ce timpul trece.
 Pe axa absciselor (axa timpului) se consideră mai multe intervale corespunzătoare perioadelor
consecutive, momentul t = 0 fiind considerat, pentru toţi pacienţii, momentul începerii
tratamentului.
 La timpul t=0, toţi pacienţii sunt în viaţă, astfel că Y=100%. Apoi, decesul fiecărui pacient este
vizibil ca o treaptă în jos de-a lungul curbei. Dacă studiul (şi astfel axa X) se întinde destul, Y
poate atinge valoarea 0.

N=38 – total cazuri intrate in studiu


32 cazuri raman in viata dupa 1 luna

S(t) reprezinta estimarea probabilitatii de supravietuire


METODA KAPLAN MEIER

 După trecerea a t intervale de timp se poate calcula (şi reprezenta grafic) proporţia pacienţilor
care au supravieţuit cel puţin durata t. Deci, variabila timp este o durată (perioadă) de timp şi
nu o dată calendaristică. Ea reprezintă numărul de perioade de timp de la data iniţială.
 Dacă datele analizate conţin două variabile de tip dată (ex. data de început, data decesului
pacientului) ele trebuie transformate în durate (perioade) de timp.
METODA KAPLAN MEIER

 Variabila de stare trebuie să fie o variabilă categorială reprezentând evenimentul de interes. Ea poate fi o variabilă
numerică sau text (string) ce conţine codul pentru un anumit eveniment. Variabila de stare trebuie să definească
clar un anumit eveniment (ex. data la care pacientul a raportat primele simptome).
 Variabila de stratificare. Este o variabilă categorială ce reprezintă un efect de grupare. Într-o setare medicală, o
variabilă de stratificare poate fi tipul de boală. Dacă "type" este setată ca variabilă de stratificare, se pot obţine
grafice de supravieţuire pentru fiecare tip de boală. Apoi se pot compara indicii de supravieţuire dintre diversele
tipuri de boală.
 Variabila de factor. Este o variabilă categorială care reprezintă un efect cauzal (de ex., tratamentele). Într-o setare
medicală o variabilă de factor poate fi tipul de tratament aplicat (de ex. tipul de injecţie). Dacă tratamentul este
setat (ales) ca variabilă de factor, ieşirea (output-ul) va include grafice (curbe) de supravieţuire în cadrul fiecărui
strat (de ex. fiecare tip de gripă). Apoi se pot compara indicii de supravieţuire între grupele de tratament, aparte
pentru fiecare tip de gripă. Variabila de factor se poate considera ca fiind principala variabilă de grupare, iar
variabila de stratificare ca fiind o variabilă de subgrupare. Dar ambele sunt opţionale.
METODA KAPLAN MEIER - EXEMPLU
 Avem următoarele date prezente în tabelul de mai jos. Acestea descriu evenimentele de tip deces respectiv
cenzură. Determinam prin metoda Kaplan Meier curba de supravieţuire şi calculam cuartilele. Numărul total
de pacienţi este 22+21=43.
Prob. Condiţionată
Pacienţi la risc Prob. de supravieţuire
An Cenzuri Eveniment urmărit pe interval
1 1 1 43 1-1/43=97.67% 97.67%
2 2 2 43-1-1=41 1-2/41=95.12% 0.97.67 x 95.12=92.91%
3 2 2 41-2-2=37 1-2/37=94.59% 92.91 x 94.59=87.89%
4 3 3 37-2-2=33 1-3/33=90.91% 87.89 x 90.91=79.90%
6 3 1
33-3-3=27 1-1/27=96.30% 79.90 x 96.30=76.94%
8 3 4
10 4 3 27-3-1=23 1-4/23=82.61% 76.94 x 82.61=63.56%
11 2 2 23-3-4=16 1-3/16=81.25% 63.56 x 81.25=51.64%
13 1 2 16-4-3=9 1-2/9=77.78% 51.64 x 77.78=40.17%
14 1 1
9-2-2=5 1-2/5=60.00% 40.17 x 60=24.10%
22 21
Total 5-1-2=2 1-1/2=50.00% 24.10 x 0.50=12.05%
43

1. Se va determina numarul pacientilor la risc pentru primul interval care este egal cu suma tuturor
pacienţilor luaţi în studiu. Pe celelalte intervale se scade în mod reperat atât numărul de cenzuri cât
şi numărul de evenimente urmărite realizate.

2. In etapa 2 se calculează probabilitatea condiţionată de supravieţuire. Aceasta are valoarea egala cu 1


din care se scade raportul dintre numărul de evenimente urmărite şi numărul de pacienţi la risc.
Aceasta probabilitate creşte sau descreşte pe fiecare interval în funcţie de numărul de evenimente.

3. Prin înmulţirea cumulată a probabilităţilor condiţionate se obţine probabilitatea de supravieţuire.


Aceasta descreşte şi poate ajunge uneori până la 0.
METODA KAPLAN MEIER
 În continuare se poate reprezenta grafic curba de supravieţuire. Pentru aceasta vom folosi
graficul de tip scatter (XY).
 Valorile probabilităţii de supravieţuire.
An Supravieţuire
1 1
1 97.67%
2 97.67%
2 92.91%
3 92.91%
3 87.89%
4 87.89%
4 79.90%
6 79.90%
6 76.94%
8 76.94%
8 63.56%
10 63.56%
10 51.64%
11 51.64%
11 40.17%
13 40.17%
13 24.10%
14 24.10%
Citim din grafic cuartilele:
14 12.05% Supravieţuire de 75% avem la 8 ani.
Supravieţuire de 50% avem la 11 ani.
Supravieţuire de 25% avem la 13 ani.
METODA KAPLAN MEIER
COMPARAŢII ÎNTRE FUNCŢII DE SUPRAVIEŢUIRE
 Dacă sunt mai multe grupuri de date care reprezintă funcţii diferite de supravieţuire, atunci
acestea pot fi comparate prin teste statistica ca:
 Log Rank (Mantel-Cox)
 Breslow (Generalized Wilcoxon) sau
 Tarone-Ware.
 Aceste teste reprezintă statistici de tip Chi-pătrat (χ2) pentru care se poate calcula nivelul de
semnificaţie (p), pentru un anumit interval de confidenţă.
Cumulative Proportion Surviving (Kaplan-Meier)
BMI
Complete Censored

1.0

Cumulative Proportion Surviving


0.9

0.8

0.7

0.6

0.5
BMI [18.5-24.9]
10 20 30 40 50 60 70 80 90 100 110
BMI >=25
Time

 În cazul studiului decesului panta echivalentă a curbei de supravieţuire este de dorit să fie cât mai
mică.
 Dacă se studiază timpul necesar însănătoşirii în urma unui tratament, atunci este de dorit ca panta
să fie cât mai mare, efectul să fie cat mai rapid.

S-ar putea să vă placă și