Documente Academic
Documente Profesional
Documente Cultură
Proiect Modele de Durata
Proiect Modele de Durata
Cuza" Iaşi
Facultatea de Economie şi Administrarea Afacerilor
Proiect
Modele de durată
Iaşi
2010
1. Elemente pentru caracterizarea funcţiei de supravieţuire
a) Conceptul de supravieţuire
Pentru a definii funcţiile de supravieţuire si hazard, trebuie mai întâi definit conceptul
de supravieţuire. În cazul supravieţuirii biologice, moartea este lipsită de ambiguitate, dar
pentru fiabilitatea mecanică, eşecul nu pot fi bine definit, deoarece pot exista sisteme
mecanice, în care eşecul este parţial, o chestiune de grad sau nelocalizat în timp. Chiar şi în
problemele biologice, unele evenimente (de exemplu, atac de cord sau insuficienţă a unor
organe) pot avea aceleaşi ambiguitate. Teorie subliniată de mai sus îşi asumă evenimente bine
definite la momente specifice; alte cazuri pot fi mai bine tratate de alte modele, care în mod
explicit iau în considerare evenimente ambigue.
Teoria de supravieţuire presupune că moartea sau eşecul se întâmplă doar o singură
dată pentru fiecare subiect. Studiul evenimetelor recurente este relevant în sistemele de
fiabilitate, precum şi în multe domenii ale ştiinţelor sociale şi de cercetare medicală.
b) Funcţia de supravieţuire
Funcţia de supravieţuire este prin definiţie o completare a funcţiei de repartiţie:
S ( t ) =1 − F ( t ) = P(T > t )
Fiecare funcţie de supravieţuire R(t) este monoton descrescătoare, iar R (u) <R (t)
pentru u> t. Timpul, t = 0, poate reprezinta originea, de obicei începutul unui studiu sau de
începerea funcţionării unor sistem. R (0) poate reprezenta probabilitatea ca sistemul să nu
reuşească imediat după operaţie.
Funcţia de supravieţuire reprezintă probabilitatea ca momentul morţii să fie mai târziu
de o perioadă de timp specificată. Funcţia de supravieţuire este numită, de asemenea, funcţie
de urmaş sau funcţe de fiabilitate în probleme de supravieţuire mecanice.
Funcţia de supravieţuire trebuie să fie necrescătoare: S (u) ≤ S (t) în cazul în care u> t.
Acest lucru reflectă faptul că noţiunea de supravieţuire la o vârstă mai târzie este posibilă
numai în caz de supravieţuire la toate vârstele tinere. Având în vedere această proprietate,
funcţia de distribuţie pe durata de viaţă şi de densitate a evenimentului (F şi F de mai jos) sunt
bine definite. Funcţia de supravieţuire tinde de obicei către 0, S (t) → 0 AS t → ∞, deşi limita
ar putea fi mai mare decât zero, dacă viaţa veşnică este posibilă.
Varianţa se calculează în cayul funcţiei de supravieţuire după următoarea relaţie de calcul:
∞
V (T ) = 2 ∫ tS (t )dt − E (T ) 2
0
Pentru o funcţie de supravieţuire, valoarea Y pe grafic începe la 1 şi uniform scade la
zero. Funcţia de supravieţuire ar trebui să fie în raport cu funcţia cumulativă de distribuţie.
c) Variabile şi parametrii
T- timpul sau durata până la producerea unui eveniment, numit şi timpul de
supravieţuire (survival time),
T este o variabilă aleatoare pozitivă (T≥0), definită cu precizie, pentru care se
stabileşte cu exactitate mărimea duratei de la începutul studiului şi până în momentul în care
se produce evenimentul. Termenul de eveniment face referire fie la un eşec, respectiv moarte,
apariţia unei boli, fie la un eveniment pozitiv.
Abordarea neparametrică
di
Pentru hazardul cumulate se utilizează următoarea relaţie de calcul:
H (ti ) = ∑
Funcţia de supravieţuire se calculează astfel:
exp( − H ( t i ) )
Varianţa estimatorului Nelson-Aalen era
i / ti 〈 t ndii
următoarea formulă de calcul:
Abordarea parametrică
Estimarea parametrică constă în alegerea formei unei distribuţii, V ( H ( t) = ∑ 2
i / ti 〈 t ni
ca de exemplu: distribuţia exponenţială, distribuţia Weibull, distribuţia
log-normală, distribuţia Gamma şi distribuţia Gompertz-Makenham.
În cazul distribuţiei Weibull, funcţia de supravieţuire se
calculează astfel:
α
S (t ) = e − λ t , t〉 0
Conform distribuţiei log-normală, funcţia de supravieţuire are următoarea formă:
ln ( tα )
S (t ) = 1 −φ
β
a) Conceptul de hazard
Hazardul reprezintă:
- este o mărime latentă care măsoară un potenţial instantaneu de producere a unui
eveniment;
- manieră intuitivă în cazul unui eveniment repetabil;
b) Funcţia hazardului
Funcţia de hazard (sau rata de risc, rata de default, rata de deces, risc instantaneu, etc)
este prin definiţie: f (t ) S ' (t ) d
h( t ) = = =− ln S ( t )
S(t ) S (t) dt
t
S ( t ) = exp − ∫ h( s ) ds t
Funcţia hazardului cumulat 0 H ( t ) = ∫ h( s ) ds
se notează în general (H fiind crescător): 0
sau S ( t ) = exp ( − H ( t ) )
În anumite teste de competenţă H(T) urmează o lege exponenţială de parametru 1:
( ) ( ) ( ) ( ( ))
P( H ( T ) > x ) = P T > H −1 ( x ) = S H −1 ( x ) = S H −1 ( x ) = exp − H H −1 ( x ) = exp( − x )
O particularitate a funcţiei de hazard este că aceasta este crescătoare doar dacă este
singură dacă durata de viaţă reziduală în funcţie de u este stochastic decrescătoare ca funcţie
de u. Astfel, se utilizează funcţia de hazard pentru a specifica un model de durată.
c) Variabile şi parametrii
Modelul Cox este o sub-categorie a modelelor de supravieţuire, în care efectul unui
tratament în conformitate cu studiul are un efect multiplicativ asupra ratei de risc al
subiectului. De exemplu, un medicament poate să reducă la jumătate o probabilitate imediată
de accident vascular cerebral.
Modele de supravieţuire cuprind din două părţi: funcţia de bază de pericol, de multe ori
notate Λ 0 (t), descriind modul de pericol (risc), modificări în timp, la nivelul iniţial al
variabilelor concomitente, precum şi parametrii de efect, care descriu modul în care variază în
funcţie de pericol, ca răspuns la covariabilele explicative. Sir David Cox a observat că dacă
ipoteza hazardelor cumulate se aplică, atunci este posibil să se estimeze parametrul the efect
(s) fară luarea în considerare a funcţiei de control.
Modelul Cox cunoscut şi dub numele de model semiparametric, are următoarele componente:
i. componenta neparametrică, datorată absenţei ipotezei asupra formei funcţiei riscului
h0(t) sau asupra distribuţiei duratei T0;
ii. componenta parametrică, care exprimă efectele predictorilor asupra hazardului
predictorii fiind parametrizaţi sub formă liniară.
d) Metode de estimare
Modelu Cox sau semiparametric cu hazarduri proporţionale este estimate prin
maximizarea unei funcţii de verosimilitate parţială, care este independentă de funcţia de
referintă h0(t) şi de parametrii acesteia.
Statisticile Wald şi Score Test sunt folosite pentru a testa semnificaţia unui
subansamblu de parametri după o lege Chi pătrat, pentru un număr de grade de libertate egal
cu numărul coeficienţilor b sau a numărul de variabile explicate.
În cazul în care nu se poate realiza cu exactitate un calcul al verosimilităţii, se recurge
la aproximarea Breaslow. Potrivit acesteia, atunci când mai multe durate se termină la
momentul ti, se defineşte contribuţia fiecărei dintre ele utilizând acelaşi numitor.
e) Proprietăţile modelului
Modelul Cox indică rata hazardului sau riscul de default de a cunoaşte evenimentul
studiat în funcţie de o combinaţie liniară de factori explicativi şi permite cunatificarea şi
testarea efectelor proprii ale predictorilor, asupra riscului de tranziţie către o altă parte.
Acest model se deosebeşte prin faptul că nu presupune o ipoteză asupra formei
distribuţiei duratelor, lucru care a întărit încrederea în acest model.
Principalele caracteristici ale modelului Cox:
i. oferă posibilitatea de a estima coeficienţii β fără nici o ipoteză asupra formei lui
h0 ;
ii. caracterizat de curbele LLS, logaritmul antilogaritmului funcţiei de
supravieţuire, paralele pentru diversele combinaţii ale valorilor variabilelor
explicative (fapt care facilitează o identificare geometrică pentru curbele
estimate).
3) Pentru un eşantion de 104 pacienţi cu afecţiuni cardiace s-a înregistrat timpul până la
producerea primului infact:
ti i − di )
wi/2 ni- wi/2 V[S (t)]
1,5 103,5 0,00018
1 99 0,00009 4) Se dă următorul set
4 93 0,00020 de date pentru durată :
5 80 0,00039 3, 4, 5+, 6, 6+, 8+, 11,
14, 15, 16+,unde « + »
10,5 61,5 0,00042
semnifică o durată
10,5 38,5 0,00100 cenzurată la dreapta :
10,5 15,5 0,00085
a) Să se estimeze funcţia de supravieţuire şi varianţa estimatorului Kaplan-Meier
ti ni di wi mi 1-mi S(ti)
0 10 0 0 0 1 1
1 10 0 0 0 1 1
2 10 0 0 0 1 1
3 10 1 0 0,1 0,9 0,9
4 9 1 0 0,1 0,9 0,81
5 8 0 1 0 1 0,81
6 8 1 1 0,125 0,875 0,71
7 7 0 0 0 1 0,71
8 7 0 1 0 1 0,71
9 7 0 0 0 1 0,71
10 7 0 0 0 1 0,71
11 7 1 0 0,142 0,858 0,6
12 6 0 0 0 1 0,6
13 6 0 0 0 1 0,6
14 6 1 0 0,166 0,834 0,5
15 5 1 0 0,2 0,8 0,4
16 4 0 1 0 1 0,4
di
V [ S(t)] = [ S(t )] ∑ ni( n ( formulaGre enwood )
2
ti i − di )
di
V ( H (t )) = ∑ 2 =0,124
ti <t ni
c) Să se estimeze funcţia de supravieţuire folosind estimaţiile Nelson-Aalen de la subpunctul
b.
S (t ) = exp( −H (t ))
S(t)
0,9
0,81
0,72
0,62
0,53
0,43
N Percent
Censored 0 .0%
Total 76 100.0%
Total 0 .0%
Total 76 100.0%
Omnibus Tests of
Model Coefficients
-2 Log Likelihood
513.305
Overall (score) Change From Previous Step Change From Previous Block
a. Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: 513.305
Mean
varsta 43.697
sex 1.737
tip_boala 1.553
Data on the recurrence times to infection, at the point of insertion of the catheter, for kidney
patients using portable dialysis equipment. Catheters may be removed for reasons other than
infection, in which case the observation is censored. Each patient has exactly 2 observations.
The data set has been used by several authors to illustrate random effects ("frailty") models for
survival data. However, any non-zero estimate of the random effect is almost entirely due to
one outlier, subject 21.
• patient id
• follow-up time
• status: 0 = censored, 1 = infection
• age
• sex (1 = male, 2 = female)
• disease type
o 0 = Glomerulo Nephritis
o 1 = Acute Nephritis
o 2 = Polycystic Kidney Disease
o 3 = Other
• estimate of the frailty, as listed in the reference below