Documente Academic
Documente Profesional
Documente Cultură
METODA KAPLAN-MEIER
Suntem adesea interesaţi în studiul intervalului de timp până la apariţia unui eveniment de
interes.
Supravieţuirea se referă la analiza în timp a probabilităţii de apariţie a unui anumit eveniment.
Dacă considerăm „decesul” evenimentul urmărit, variabila ce caracterizează perioada de viaţă
este timpul scurs până la realizarea acestuia.
În cadrul "analizei supravieţuirii" putem aborda orice analiză a timpului până la un efect
(eveniment),
care nu este neapărat decesul (infarct miocardic, hemoragie digestivă, decompensare,
recidivă, etc.) şi
rareori poate fi şi unul bun (vindecarea, o sarcina dorita etc.).
Am putea în primă etapă să folosim noţiunile specifice din statistica descriptivă deci, am putea
caracteriza populaţia prin indicatorii statistici de:
localizare: medie, mediana, modul;
variatie: dispersia, amplitudinea, intervalul intercuartilic;
distribuţie de frecvenţă,
sau se pot realiza comparaţii între aceşti indicatori pentru diferite loturi studiate.
ANALIZA SUPRAVIEŢUIRII
PROBLEME SPECIFICE:
Pe parcursul studiului se pierd pacienţi din diferite motive (schimbare de adresă, abandon,
deces din alte cauze sau terminarea studiului şi neapariţia evenimentului analizat etc.). Astfel,
suntem nevoiţi să eliminăm datele incomplete pe perioada de analiză. Dacă pierdem cantităţi
importante de informaţie putem compromite întregul studiu.
Datele pierdute se numesc date cenzurate. Acestea conţin informaţie parţială.
De asemenea pot apărea cazuri noi care ar trebui incluse în lot. Dacă am transla toate
înregistrările la o origine de timp comună am putea ţine cont de informaţia chiar parţial
introdusă. Ar trebui să folosim într-un mod corect această informaţie care ne-ar aduce, evident,
un plus de informaţie care ajută la eliminarea indeciziilor existente.
Nu putem, de exemplu, să calculăm durate medii de supravieţuire, pe de o parte pentru că
duratele de supravieţuire par a nu avea o distribuţie Gaussiană, iar pe de altă parte, pentru că
nu se poate calcula media dacă nu se ştiu toate duratele de supravieţuire, aşadar nu poţi
analiza datele până nu a decedat şi ultimul pacient. Ori asta nu se întâmplă de obicei în studii,
întotdeauna mai rămân pacienţi în viaţă la sfârşitul studiului.
Analiza de tip Kaplan-Meier permite exact acest tip de lucru cu date cenzurate şi/sau noi.
Practic profităm de toată informaţia pe care o avem pe parcursul intervalului de timp investit în
cercetare.
ANALIZA SUPRAVIEŢUIRII
1.0
0.9
Cumulative Proportion Surviving
0.8
0.7
0.6
0.5
0.4
age<65
years old
0.3
age>=65
10 20 30 40 50 60 70 80 90 100 110
years old
Time
ANALIZA SUPRAVIEŢUIRII
În timp această probabilitate de supravietuire variază, scade şi astfel ea va capăta o tendinţă
descrescătoare. Cu cât timpul trece cu atât mai puţini pacienţi vor fi în viaţă.
La diferite momente de timp Ti se produc evenimente ce reprezintă decesul sau cenzura. Acestea definesc
punctele în care probabilitatea de supravieţuire îşi schimbă valoarea.
Reprezentarea timpului de apariţie a evenimentelor ce caracterizează starea pacienţilor (cenzura/deces) cât
şi a momentului înrolării de noi cazuri.
Există un moment de start (romb) pentru fiecare pacient şi de asemenea momentul apariţiei evenimentului
(sfârșitul urmăririi - cerc).
Aici trebuie să se acorde o atenţie deosebită deoarece, poate exista o mare relativitate în
stabilirea momentului de start (de ex.: în cancerul de sân, care este momentul de determinare
a prezenţei neoplaziei?).
Toate cazurile luate în studiu trebuie să fie tratate uniform pentru a nu introduce erori.
După trecerea a t intervale de timp se poate calcula (şi reprezenta grafic) proporţia pacienţilor
care au supravieţuit cel puţin durata t. Deci, variabila timp este o durată (perioadă) de timp şi
nu o dată calendaristică. Ea reprezintă numărul de perioade de timp de la data iniţială.
Dacă datele analizate conţin două variabile de tip dată (ex. data de început, data decesului
pacientului) ele trebuie transformate în durate (perioade) de timp.
METODA KAPLAN MEIER
Variabila de stare trebuie să fie o variabilă categorială reprezentând evenimentul de interes. Ea poate fi o variabilă
numerică sau text (string) ce conţine codul pentru un anumit eveniment. Variabila de stare trebuie să definească
clar un anumit eveniment (ex. data la care pacientul a raportat primele simptome).
Variabila de stratificare. Este o variabilă categorială ce reprezintă un efect de grupare. Într-o setare medicală, o
variabilă de stratificare poate fi tipul de boală. Dacă "type" este setată ca variabilă de stratificare, se pot obţine
grafice de supravieţuire pentru fiecare tip de boală. Apoi se pot compara indicii de supravieţuire dintre diversele
tipuri de boală.
Variabila de factor. Este o variabilă categorială care reprezintă un efect cauzal (de ex., tratamentele). Într-o setare
medicală o variabilă de factor poate fi tipul de tratament aplicat (de ex. tipul de injecţie). Dacă tratamentul este
setat (ales) ca variabilă de factor, ieşirea (output-ul) va include grafice (curbe) de supravieţuire în cadrul fiecărui
strat (de ex. fiecare tip de gripă). Apoi se pot compara indicii de supravieţuire între grupele de tratament, aparte
pentru fiecare tip de gripă. Variabila de factor se poate considera ca fiind principala variabilă de grupare, iar
variabila de stratificare ca fiind o variabilă de subgrupare. Dar ambele sunt opţionale.
METODA KAPLAN MEIER - EXEMPLU
Avem următoarele date prezente în tabelul de mai jos. Acestea descriu evenimentele de tip deces respectiv
cenzură. Determinam prin metoda Kaplan Meier curba de supravieţuire şi calculam cuartilele. Numărul total
de pacienţi este 22+21=43.
Prob. Condiţionată
Pacienţi la risc Prob. de supravieţuire
An Cenzuri Eveniment urmărit pe interval
1 1 1 43 1-1/43=97.67% 97.67%
2 2 2 43-1-1=41 1-2/41=95.12% 0.97.67 x 95.12=92.91%
3 2 2 41-2-2=37 1-2/37=94.59% 92.91 x 94.59=87.89%
4 3 3 37-2-2=33 1-3/33=90.91% 87.89 x 90.91=79.90%
6 3 1
33-3-3=27 1-1/27=96.30% 79.90 x 96.30=76.94%
8 3 4
10 4 3 27-3-1=23 1-4/23=82.61% 76.94 x 82.61=63.56%
11 2 2 23-3-4=16 1-3/16=81.25% 63.56 x 81.25=51.64%
13 1 2 16-4-3=9 1-2/9=77.78% 51.64 x 77.78=40.17%
14 1 1
9-2-2=5 1-2/5=60.00% 40.17 x 60=24.10%
22 21
Total 5-1-2=2 1-1/2=50.00% 24.10 x 0.50=12.05%
43
1. Se va determina numarul pacientilor la risc pentru primul interval care este egal cu suma tuturor
pacienţilor luaţi în studiu. Pe celelalte intervale se scade în mod reperat atât numărul de cenzuri cât
şi numărul de evenimente urmărite realizate.
1.0
0.8
0.7
0.6
0.5
BMI [18.5-24.9]
10 20 30 40 50 60 70 80 90 100 110
BMI >=25
Time
În cazul studiului decesului panta echivalentă a curbei de supravieţuire este de dorit să fie cât mai
mică.
Dacă se studiază timpul necesar însănătoşirii în urma unui tratament, atunci este de dorit ca panta
să fie cât mai mare, efectul să fie cat mai rapid.