Documente Academic
Documente Profesional
Documente Cultură
RESUMEN
En este trabajo se revisa la metodologa de la inferencia no
paramtrica, con muestras en las que existen datos censurados,
desarrollada fundamentalmente en los ltimos quince aos. La
censura considerada es la aleatoria por la derecha. Los tpicos
aqu revisados son los relativos al estudio del estimador de
Kaplan-Meier, asi como sus aplicaciones a la estirnacin funcional, los contrastes de hiptesis, intervalos y bandas de confianza,
regresin lineal, estimacin de curvas y aplicaciones. A su vez,
recientes tcnicas de estimacin no paramtrica y paramtrica
son tambin revisadas y aplicadas a datos de inters suministrados por el Hospital General de Galicia relativos a tiempos de
vida en procesos tumarales.
Palabras clave.^ Censura aleatoria por la derecha, estimador de
Kaplan-Meier.
Clasificacin A MS .^ 6 2 C; 0 5.
(')
f ^r ^^tai^;n^ ^ t ^E^^^ti^^i ^^
1.
b)
F- Y
(1 .1 )
f T(x,tl^,F) dF(x) = 0
(1. 2 )
,.
La prctica totalidad de los estimadores f^ (camo se puede ver para ms
detalles en el libro de Serfling ( 1980) ) existentes en la literatura relativa a
la inferencia no pararntrica sin censura, pueden ser obtenidos a partir de
1a formulacin ( 1 .2). Basta con ver la siguiente relacin amplia de ejemplos:
i) T(x,l), F) = 1(^^/^>^l) f(x))/f(x), donde f es la densidad asociada a F,,, da
lugar^ a la estimacin de mxima verosimilitud.
iii T(x,(l,F) _`i'(x-ll), siendo `^' una funcin de R en R, representa la M
estimacin.
r
iii)
iv)
r (t)dt=0, representa la R
JoJ
^^7
(1 . 3}
> N (O,c^)
(1.4)
con
H( fl )= JT (x, f1, F} dF (x) ,
^ = 1 (Q(y)- 1QdF)2dF(y)
Y
da
lugar a la
ii) ^^(x,(I,F) = J'(F(x) )t)x representa 1a varianza asinttica de los L estimadores, ... etc., resultando en cierta med^da que todos (os mtodos descritos
en el libro de Serfling (1 980) tienen una varianza asinttica que puede ser
expresada de una forma unificada va la derivada de Riesz.
Una visin todava ms general fu la introducida por Gon^lez Manteiga
(1990), sin ms que tener en cuenta que el parmetro fl descanocido
pudiera ser realmente una curva ^l(x), asociada a una medicin de depen-
Si de forma alternativa a{ 1.2) se sustituye ahora la distribucin condicionada terica por una estimacin no paramtrica de la misma se obtiene de
forr^na unificada la varianza asinttica de todos los estimadores no paramtricos de la regresin existentes hasta la actualidad. En particular si se
utiliza un estimador no paramtrico tipo ncleo, por ejemplo el introducido
por Yang (1 981 )(con X unidimensional}:
^
N (o,Var(Q{Y}lX=x) cK}
^
donde O es el estimador no paramtrico resultante de (1 .5), h es el valor
del parmetro ventana utilizado y eK=K2{u)du, siendo K la funcin ncleo. ^
La varianza asinttica de todos los estimadores no paramtricos de curvas midiendo fas dependencias entre un vector de covariables y una variabie respuesta unidimensional puede tambin ser vista de forma unificada.
En base a esta visin genera! de la estimacin no paramtrica funcional
uno puede deducir un cierto grado de teora consolidada. Nuestro objetivo
en lo que sigue de trabajo va a ser la extensin de la estimacin funcional
bajo la existencia de censura unidimensional considerando sus posibles
aplicaciones.
2.
^^y
Los modelos estadsticos con muestras censuradas son de especial inters en ciencias experimentales como la medicina, la ingeniera,... etc. y han
tenido un desarrollo muy intenso en los ltimos aos, siendo la censura
aleatoria por la derecha la desarrollada por nosotros a lo largo de todo el
traba jo.
ii)
^ ^()
iii)
r
_ ^o {1-H(s) )-' dH,(si
A diferencia del contexto en el que no hay censura, no se puede estimar
la funcin de distribucin F poblacional mediante la distribucin emprica
en aquellas situaciones en las que por lo menos existe un dato censurado.
Alternativamente, uno puede, mediante las correspondientes empricas, estimar H, H, y ^1 respectivamente por:
H(t) _ (^ i // Z; < t } ),ln
H ,,,(t) = (^ { i% Z; ^ t , T, < C; } } /n
r
A ( t ) _ ^o
dH ^ ( s )
^`^ ( t)
1- H(s)
^-'
n-Rango(Z^)
^i ^
donde ^3;(t) = 1{z;s t. r;S c; ^Teniendo en cuenta el problema que encierra la posible presencia de la
observacin Z^,,, no censurada, donde Z^,,, es el estadstico ordenado
mximo, es aconsejable la sustitucin en los denorninadores de la expresin n(t) por !as cantidades n- Rango (Z;) + 1. Con esta versin corregida y
en base a que 1-F(t) = exp {-A(t) }, resulta de forma natural un estimador
para la distribucin F en el context0 de datos censurados a travs de
(2.1 )
^
1-F(t)
0
n - Rango (Z^)
^ is,{^^
si t < Z^,,,
n - Rango (Z;) + 1
(2.2 )
en el resto
3.
^ ^^^r^^^r>i^r^ic^.^ r tiF^^^^^^^ ^^
i) (Breslow-Crowley (1 974) ). " Bajo la suposicin de que las distribuciones F y G sean continuas, se verifica puntualmente en cada x E R, con
x< To y H(To} < 1, lo siguiente:
^
^ n ( F(x) - F(x} )
d -^ N (o,cr^(x) )
X
con cr^ (x) _ (1- F(x) ) 2 Jo (1 /(1- H (x) )^) dH , (x) ".
ii) (Breslow-Crowley (1 974) ). '" Bajo las suposiciones anteriores se verifica globalmente en el intervalo [O,To] :
d---^. Z(.1
^ t F - F)
o`- x` To
log n^.
n
si
donde
x
V(x)=f o i/(1 -H(y) )2dH, (y} y ^ es la funcin de distribucin de una IV (0,1 }".
^i^
Todas las propiedades anteriores resuttan las conocidas para {a distribucin emprica en ausencia de censura. Esto es consecuencia de que, en
dicho caso, H es F, H, es tambin F y por tanto V(x)=F(x)/(1 -F(x) ). A su
vez, la distribucin asinttica global puede extenderse a todo R, dando
{ugar a{ proceso Gaussiano, cuyo supremo en valor abso{uto tiene la distribucin de Kolmogorov-Srnirnov, corno ya es conocido.
^ Otras propiedades de inters del estimador de Kaplan-Meier de notable
importancia son {as relativas a su eficiencia, cuando se trata de estimar ia
distribucin F desconocida en cada punto x. Desde ese punto de vista
Fernndez Sotelo-Gonzlez Manteiga ( 1 986), prueban que el estimador de
Kaplan-Meier puede ser mejorado bajo el criterio del error cuadrtico medio. En efecto, considerando la versin suavizada del mismo.
Fs(x) = J (1 /hn} K ( (x-u) /h) d F ( u)
( 3.1 )
donde
I
v)
^(n) - n
(f(x}/(1-G(x} ) } J 2zK(z}K(z) dz
nhn
(1 -F(x) )2 V(x)
li m
n -^ ^
siendo f la densidad asociada a F, K una funcin ncleo positiva de segundo orden, es decir, JK=1, f zK(z)dz-o, JK(z)z2dz> O y K positiva y h el
parmetro ventana de la suavizacin. Por otro lado i(n) es el va{or entero
para el que
Z i^
Fn(x) - 1
-(^- H n(a(j } xn
con
n
a _ ^ ^S; /n
,_ ^
1a proporcin de censura emprica. Suavizando este estimador mediante el
mismo mecanismo que el desarrollado con el estimador de Kaplan-Meier
en (3.1 ) se obtienen anlogas propiedades de eficiencia.
4.
I^.f 1 ftf ti( I^\(1 f' ^ft ^^1f l ftl( ^t (^(),. f)^^ I c)ti E f^ti1 Ft ^11x)ti
^r (x) _ (1 - F(x) )2 ` n , ^ ^
t ^/Z^ `^.
(n - Rango (Z,) )^
.
^ l
^
F(x} - F (x)
(1 -F(x} ) / K(x)
> W (o K (xi )
donde
K(x) = 1-v(x) /(1 +v(x) ), con la funcin v previamente definida en el apartado anterior y W el puente browniano en el intervala (0,1 ). Para ms
detalles relativos a este proceso consultar el libro de Billingsley (1 968),
donde se puede ver que dicho proceso est definido como Wt-tW,, con W^
un proceso Gaussiano de media cero y funcin de covarianza Cov(s, t)= s si
S< t. Los procesos W y W son conocidos tambin como movimiento
browniano y puente browniano respectivamente.
^
F(x1 - F(x)
^ `^ (K(x) )
_
^n ^
(1 -F(x) ) / K(x)
sup
^ W(K(x) ) ^`^(Klx) =
O' x^ T 0
sup
u T KIT^ ^
>
Iw(u)I ^(u)
^ Zh
P { s ^. ^ ^
a. ^< b
119 $4).
b1
c)
As por ejemplo, considerando las correspondientes estimaciones empricas y el eX adecuado, la banda de igual precisin viene dada por
[ F(x) -- (1 /^) er ^r(x) ] con x tal que a ^ K(x) ^ b donde K^ (t) es
la correspondiente estimacin emprica de K. EI nombre de igual precisin
es obviamente atribuible a que la banda posee en cada punto x una
anchura directamente proporcional a la varianza empricamente estimada
del estimador de Kaplan-Meier.
Iguales razonamientos se podrian aplicar a las otras bandas, observndose en general que la anchura de la banda resultante va a estar ntimamente
ligada a la funcin ^ utilizada. En esa lnea de resultados se encuentran los
profundos estudios de simulacin realizados por Nair(1984). Las conclusiones por ! obtenidas podrian resumirse de la siguiente manera:
i) EI funcionamiento de la banda de Renyi es ineficiente, siendo ms
estrecha que las bandas de igual precisin y de Hali-Wellner nicamente
en la cola superior. Esto es obviamente consecuencia de la penalizacin
que imprime la funcin `l' en esos puntos, ya que para ellos u tiende a 1 y
por tanto 4' tiende a^, obligando a que la diferencia entre el estimador
de Kaplan-Meier y la funcin terica desconocida sea cada vez ms pe^
quena.
ii) Las bandas de Hall-Wellner y de igual precisin son muy competitivas. La primera es rns estrecha en los puntos medios mientras que la
itima lo es ms en las colas. De anloga forma la explicacin de este
hecho radica en la naturaleza de `^. A su vez el mejor funcionamiento de la
banda de igual precisin se incrementa a rnedida que aumenta la propor-
cin de censura.
iii) Los valores crticos asintticos proveen aproximaciones razonables
para muestras finitas.
ftif F F^tf \( I^t 1(^ F'^^Ft ^!^1F i Rl('^^ C()^. [)-^ T<)ti ( f ^l Ft ^fX)^
^37
Por otro lado obsrvese que de las tres bandas citadas solo la de
Hall-Wellner es extensi^ n de la clsica de Kolmogorov -Smirnov. En efecto
esta sale como consecuencia de particularizar a=0 y b=1. Es decir soporte
sin restricciones. Adems a diferencia de sta las bandas construidas con
censura son de anchura aleatoria, siendo necesario un mecanismo de
muestreo secuencial cuando se quiera construir una banda de anchura
acotada por un cierto valor d. En esta lnea de actuacin es interesante el
trabajo de Dikta-Kurtz-Stute (1 989) quienes consideran la banda de
Hall-Wellner secuencial.
CONTRASTE D E H I PTES I S.
Las dos vas estudiadas para contrastar si la distribucin poblacional
desconocida F es Fo, bajo el modelo de censura aqu tratado, son la
correspondiente extensin del contraste de Kolmogorov-Smirnov y del contraste ,^.
Respecto al primer mecanismo se actuara en funcin de la banda utilizada rechazando la hiptesis en el caso de que en algn tramo la distribucin
Fo est fuera de la banda. EI mecanismo alternativo es el descrito por el
test ^ para este contexto. EI estudio del mismo fu desarrollado muy
recientemente por Akritas ( 1988). EI procedirniento en esencia es como
sigue. Si estamos interesados en contrastar la hiptesis F=Fo, que supondremos continua, establecindose una particin en R+ a travs de
A^- [a; ,, a^), con ,j =1 ,..., k y ao < a, <... < ak= ^ se tienen las sigu ientes
probabilidades
G= 1 - (1-H)/(1-Fo)
( N,; - np,;}
L
;= T
nP,;
P,
I^I \I>lti11^
Z^?^
^ t1!'^tl)l ^
T (Z;, i^ n , F ^ ^ (S^
(1 in) ^
-0
(1 - G (Z,) )
..
donde G es el estimador de Kaplan-Meier de la variabie que censura.
Indudablemente este mtodo ha de ser objeto de futuros trabajos.
I^+f f kf ti( I^ ^( ^ I'^^K ^ti1f I kl( ^^ c(1^, O^\ 1Oti ([ ttil K^(M ^ ^
METODO DE COX.
, Basado en la idea de modelos de fallo proporcionales supone que la
razn de fallo condicional de la variable de inters T viene dada por
^.(t/x) _ ^^o(t)exp{xtj^ ^
donde x es el vector p-dimensional de covariables, ^3 el vector
p-dimensional de coeficientes a estimar y^o la razn de fallo de la variable
T para cuando x=0.
La estructura del modelo anterior permite construir de la siguiente forma ^
una funcin de verosimilitud parcial en ^^. Si R(t) son los individuos aun
vivos en el instante t- y si un paciente muere en el instante t, entonces la
probabilidad de que ese paciente sea el isirr^o de entre los que estn en
riesgo en R (t) es
e x p { ^ ^j }
exp { ^^ }
^
-_ R (tl
L=I1
,_^
^.
/ ^
R (Z^^)^
exp ( x` l^^ )
^^r;^
^
FSTA[)I^TI( ^1 f S[,^^`t)[ A
n J t,'2 clF(^ ; a, b i
donde F(.;a,b) es el estimador de Kaplan-Meier basado en la muestra
{(^^,^^) }^^ ^ con ; = Z;-a-x; b, i=1,...,n 1os residuos estimados a travs de una
estimacin piloto inicial de (a,^^). Miller sugiere tomar como dicha estimacin la de mnimos cuadrados con los datos no censurados.
EI mecanismo es por tanto iterativo resultando la siguiente relacin recursiva en las estimaciones
..
^k+1-
r
ILX
l
J
-1
L
X- X^^ ] W(^^k) L
( 6.1 )
donde
X=((x,^^ ) es la matriz de variables predictoras,
n
,.
X`'' r(^ c^^;(^^k) x,^) es la matriz de promedios ponderada segn los pesos
;-^
^
de los saltos del estimador de Kaplan-Meier
cl^,{ f3k), i=1,..., n, representantes
^
en (os puntos , = Z,-x; ^jk correspondientes a la fase k-sima de la recursvidad en la estimacn y
.
{
^v,(^jk)
}
;
Z
(Z,,...,
Z)`.
diagonal
W (f^k) r
Finalmente J3 es el estimador que se obtiene en una etapa k suficientemente grande estimndose posteriormente a como
x; j^k +
^
^_e^^e;
-}
1- F ( ,; o, j^k )
^i ( ^jk ^ ^i
A
[ i^ _ ^^ , t Z ( ^k )
( fj . 2 )
T, si
^=1
^
i=1,...,n
E^
/ x, ^ ^;z + x; ^^
1 - G (Z,/x,)
Z,
i=1, .., n.
1 - ^ (Z,)
^
donde G es el estimador de Kaplan-Meier de la varable que censura
basado en ia muestra {(Z,,1 -^),) },n,, _y M es una constante dependiente de
n y de la muestra, que establece un truncamiento para evitar la inestabilidad del estimador de Kaplan-Meier en las colas.
Con fa correspondiente nueva variable respuesta, se aplicara el mtodo
de mnimos cuadrados para la obtencin del nuevo estimador. A pesar de
no ser recursivo, este mtodo tiene un gran problema ante la eleccin dei
valor M en la prctica.
EI segundo de ellos, Koul-Susarla-Van Ryzin (1 981 b), consiste en definir
como. nuevos estimadores aquellos que resulten de (a optimizacin de!
funcinal
,
.`^,. ^
^^
x 3 ` = L,
t^.^^
;_^
1 - G (z;)
1, z.i_ M;^
(Z, - a- X;1^)2
n
Finalmente el tercer mtodo, Koul-Susarla-Van Ry2in (1 982 ^ , est basado en una extensin del mtodo de uckley-James al contexto de censura
aleatoria bajo la hiptesis comn a todos los mtodos de Koul-Susarla-Van
Ryzin.
Ya que bajo esta hiptesis la nueva variable respuesta satisface
Z*= ^^Z; + (1 -rS;) E (T,/T, > Z,}=rS,Z, + (1-h,} E(T,/,=O) _
=s,Z,+c1-a,) .
6.
f^(X} ; (1 /nh) ^ K 1
x - T,
=1 K(
i` 1
hn
X'u )(1/h)dFfu)
^n
^
i { 1 f nh^ ) ^
'-'
K { (x-Z,) /h) ;
..
( 1 - ^(Z,) )
^
donde G es el estimador de Kaplan-Meier de la variable que censura.
Yandell (1 9$1 } obtiene el error cuadrtico medio de dicho estimador
aportando fa correspondiente ventana ptima terica. Marron y Padgett
{ 1 986) proponen el mtodo de validacin cruzada para este contexto
{cross validation), aportando propiedades de optimalidad asinttica de la
ventana "cross validation" respecto de ia ptima terica. Finalmente Diehl
y Stute { 1 985) prueban propiedades de consistencia, dando errores de
convergencia del tipo logaritmo iterado. Asimismo prueban resultados relativos a la convergencia dbil tanto puntuaimente como globaimente.
ESTIMACI^N DE LA FUNCICJN DE RAZON DE FALLO
Varios procedimientos fueron elaborads para !a estimacin de fa funcin
de razn de failo r(t)=f(t)/(1 -F(t) ). La razn de sto quiz sea atribuible a
la gran importancia que tiene la razn de fallo en el cantexto de la fiabiiidad, camp de naturai aparicin de los datos censurados.
^45
A(t) = f o ^(s) ds
A
,^
= l 1 /h) ^ K (
;_^
t - Zr;^
^ d (s) _
) (ar;^/ (n-+ 1) ^
EI propio Yandell (1981, 1983) propone camo estimador natural, teniendo en cuenta la forma de la expresin de la razn de fallo, a
^
^
{ (^r^,.X,j },n,
^- r
S n ( tlX=x}=
^^.,1^^
, S1
t^ Z ln1
,en el resto
dande
J^^(t) = 1{z1,, ^.^,^__, }
e^ emplo del tipo
ItiF F.Kf.^( 1-1 tiO P-1K^1ti11 TFtI( ^(()ti l)^lOti (. (`til K^^(X)ti
Cin,(X)
= I 1 /n) K,,(x'Z,)
resultando el estimador de
Por otro lado, de este estimador es fcil conocer los saltos dando lugar
de forma natural a un estimador no paramtrico de la funcin de regresin
con datos censurados (el primero a nuestro juicio en la literatura existentel,
resultando
Z; ; B,,; (x)
1 - G (Z;^X=X)
t ti 1^[)tti T I( ^[^T'^1tO[ ^^
[ G.
i-1
^ ^ T; ^
r-1
Z; = m i n { T;, C; }
donde
T;=2+0.01Z,;+0.5Z2;
C; = 2+ 0.01 Z,, + 0.5Z2i +^;
con i= 1,...,n, siendo ^; una normai de media cero y desviacin tpica ^r y^,
una normal independiente de la anterior de media tl y desviacin tpica rr,
garantizndose de esta forma la independencia condicional entre T y C.
I^IF^E RF.tiI('1-1 ti() P-^R7!^1E TR1('A ('<)ti DA-T-()S ('f tiSl R^1[X1S
^^y
,.
M.S.E.(^)= ^
;=o
[1
;_^ ^i^,-^^1^
/
+(1^N)^
% Censura = ^ 1 - ^ ^
-^
Q^
^ ^ 100%
Por otro iado la eleccin de los cuatro valores distintos para la ventana
est nicamente encaminada a analizar la posible forma de U del error
cuadrtico medio y es obviamente independiente del tamao muestral.
Dicha farma para la funcin error cuadrtico medio es apreciada en porcentajes bajos de censura. En efecto cuando el porcentaje aumenta la
ventana ptima se encuentra para valores superiores a ios elegidos para el
estudio de simulacin. A su vez en estudios elaborados por nosotros recientemente parece apreciarse un buen funcionamento del mtodo de
validacin cruzada para una eieccin automtica inicial de la ventana
tGanzlez Manteiga-Cadarso Surez (1 990) ).
rr
0. 1
MlLLER
0 . 02581
BUCKLEY
JAMES
0 . 1 7008
BUCKLEY
JAMES MOD.
0,27376
ESTIIVIACION
SUAViZADA
0.28293
0.26103
0.261 97
0.27054
0.4231 7
0.5
0.40053
0.65244
0.69927
0.33482
0.29297
o.287sa
0.68680
.
1 . 57567
2 . 01 6+D2
1.95569
0.5091 7
0.37390
0.341 87
1 .62361
6 . 24627
7 . 23230
7.16742
1.12500
0.671 84
0.5571 6
I^I 1 Ftf ^+( I^ ti(1 f' ^ft ^tit{ I kl( \(()\ f) 1 T(1^, ^ F\^,I K^Ix^ti
MILLER
BUCKLEY
BUCKLEY
ESTIMACION
JAMES
JAMES MOD.
SUAVIZADA
0.1
0.5
0.03944
0.52823
2.04109
8.08201
0.36190
0.54301
0.95236
2.631 16
9,01742
0.65451
0.48877
0.33499
0.31058
1.01301
0.84245
0.61971
0.38599
0.342 74
2.56330
1.28759
0.90604
0.50726
0.42751
8.69837
2.68961
1 .83080
0.93486
0.73327
c^
MILLER
gUCKLEY
JAM ES
BUCKLEY
JAM ES MOD.
ESTIMACION
5UAVIZADA
1 .401 52
0.1
0.5
0.06487
0.74603
0.97369
0.97065
1.71338
1.69312
0.98577
0.57198
0.47448
1 .681 13
1.1 1 139
0.60014
Q.50220
2.43340
1
2.87294
1 1.31367
4.39953
13.91292
4.25516
13.70472
1 .60733
0 82730
0.65721
4.64209
3.05158
1 .50346
1.13734
^5?
0,1
MILLER
0.12893
BUCKLEY
JAMES
1.18697
BUCKLEY
JAMES MOD.
1.7 4233
ESTIMACION
SUAVIZADA
3.{J5742
2" 13021
1 .1 2051
0.84533
3.14021
0.5
2.39126
4.1 1 C^26
3.75469
2.21491
1 .1 6584
0.89282
3.?9464
9.36609
37.25566
7.98803
22.12668
6.$7453
17.34526
2.73035
1.46332
1.14852
5.93612
4.33053
2.39933
1.91 902
MILLER
BUCKLEY
BUCKLEY
ESTIMACION
JAMES
JAMES MOD.
SUAVIZADA
0.18272
0.1
0.5
0.01067
0.16842
0 . 65419
O.C^3233
0.22156
0 . 78910
0.0245E
0.23412
0.7031 1
0.19396
0.23425
0.2551 1
0.24499
0 . 22950
0.24434
0.25976
0.38438
0.32189
0.28527
0.28706
2.61338
2.99318
2.86345
0.83(J48
0.63027
0.43297
0.39397
i`^F f KF ^<'I^1 tit) I'-^R ^titf ^T RI( 1 (`()\ [)^^^ 1(1^ ( E\^1 Ft ^fX)1
0.1
MILLER
0.02078
BUCKLEY
JAMES
0.05981
BUCKLEY
JAMES MOD.
ESTI MACION
SUAVIZADA
0.04869
0.32 504
0.28378
0.26496
0.26988
0.47949
0.5
0.25393
0.97448
0.30879
1.00613
0.32876
0.97656
0.37498
a.28828
a.28o62
0.73232
0.54765
0.35556
0.32 542
1.55648
3.82797
3.69026
3.58654
1.1 1016
0.60719
0.50133
MILLER
BUCKLEY
JAMES
BUCK^LEY
JAMES MOD.
ESTIMACION
SUAVIZADA
0.77755
0.1
0.03738
0.11376
0.09563
a.60720
0.402 8 8
0.35054
0.5
0.35452
1.33385
0.40308
1.24980
0.47632
0.92302
0.6581 1
0.40012
0.35596
1.16655
1.33125
0.9342 5
0.52142
0.4442 7
2.5421 4
15.24449
4.46359
4.25786
1.75938
0.90663
0.72650
MILLER
BUCKLEY
JAMES
BUCKLEY
JAMES MOD.
ESTIMACION
SUAVIZADA
1 .84808
0.1
0.05460
0.3001 5
0.1 9840
1.34107
0.7 3 503
0.59590
1 .89907
0.5
0.5125
0.71262
O.fi4367
1.32506
0.7241 7
0.59014
1
2.14146
1.97736
1.54685
2.49239
1.73859
0.94183
0.76129
4.28461
8 . 43407
6 . 62410
6 . 43898
3^Q1 508
1 .61045
1.29007
MILLER
gUCKLEY
JAMES
BUCKLEY
JAMES MOD.
ESTIMACICJN
SUAViZADA
0.1 81 24
0.1
0.00579
^J.O1023
0.00854
023830
0.29083
0.32407
0.5
0.09998
0.10441
0 . 10035
0.2U1 72
0.24343
0.28703
0.31 635
0.2491 1
0.39452
1.55499
0.38478
1.49812
0.3654$
1.35$02
0.26370
0.29567
0.31 957
0.41 544
0.34460
0.33547
0.34529
Itil f Kt ti( I ^ ti(^ f'^K ^titf I KI( ^ c(^^ O^ Ic^ti ^ I"I K 1fN>ti
rr
0. 1
MILLER
0 . 01 15$
BUCKLEY
JAMES
0 . 01439
BUCKLEY
JAMES MOD.
0 . 01245
ESTIMACION
SUAVIZADA
0.22320
0 . 2 5002
0.28823
0.31937
0. 5
0 . 14760
0.57399
2.26951
0 . 12180
0.43960
1.69044
0.11658
0.26592
0.25650
0.2 8100
0.304 7 5
0.44389
0.35466
0.28791
0.2 912 0
0.308 7 6
1.63987
0.65663
0.4191 5
0.35080
0.34746
^r
MILLER
BUCKLEY
JAMES
BUCKLEY
JAMES MOD.
ESTIMACION
SUAVIZADA
0.3472 7
0.1
0.5
0.02088
0.21681
0.82 2 59
0.02161
0.14973
0.52 610
0 . 02087
0.13677
0.50643
0.29532
0.29974
0.31832
0.39002
0.29868
0.29216
0.30676
0.53666
0.36080
0.31936
0.32262
1 .^1^201
3.22168
2.00237
2 . 00221
0.57^50
0.4^-^ 12
0.4037 5
MILLER
BUCKLEY
JAMES
BUCKLEY
JAMES MOD.
ESTIMACION
SUAVIZADA
1.40991
0.1
0.03815
0.04052
0.04115
0.77695
0.47323
0.3 5108
1.73601
0.5
0.3381 1
0.21507
0.23417
0.86299
0.49810
0.36806
1 .1 5791
1.26498
4.95585
0.73553
2.76028
0.71231
2.11345
0.63314
0.45074
0.42327
2.092 51
1.08331
0.71462
0.64022
A pesar del buen funeionamiento ^que presenta !a nueva clase de estimadores en !a prctica uno ha de ser prudente en ia eleccin del estimador
piloto no paramtrico inicial. En efecto exponemos en lo que sigue un
ejemplo ilustrativo relativo a la importancia de esta eleccin.
Se considera una muestra de tamao n=70 correspondiente al logaritmo
en base 10 de !os tiempos de seguimiento correspondientes a enfermos de
adenocarcinoma renal desde el da en que se les somete a tratamiento
quirrgico, siendo la entrada de pacientes serial desde Enero de 1970
hasta enero de 1990. EI conjunto de estas datos ha sido aportado por el
Servicio y Ctedra de Urologa del Hospital General de Galicia.
De entre las covariabies de inters tratadas en ei estudio de estos datos
(Cadarso Surez 11 990) ) nos centraremos aqu para nuestro propsito en
la covariable velocidad de sed^mentacin globular (VSG ). Representando
por + el dato censurado y por x el no censurado, la figura 1 3 muestra un
plot de los datos con un 38,6I de censura. A su vez muestra la estimacin
no paramtrica de la funcin de regresin en trazo continuo y la correspondiente estimacin paramtrica lineal con la nueva metodologa, utilizndose
una ventana de validacin cruzada con el mtodo ncieo en el estimador
piloto no paramtrico.
I`f f Ftf `(^I ^ tic^ f^1Ft^ltitf Tltlc ^ (()^ f)^T^^ti( E^tit El ^()c^ti
^57
,.
Z^ = rS Z+(1 -^) E(Z/T > Z)
cn
n
j=1
^ 1-j^ gjx)
J=1
AGRADECIMIENTOS
Nuestros agradecimientos a los dos referees por su lectura crtica y
constructiva que sin duda mejor notablemente la presentacin de este
trabajo.
^St^
Fsr^tt^itir^t :^ E ^F^^^^c^t a
_..____^...^
^ LOGC T) _C DI^S)
4. G^
3. 2
2. 4
_^ ..
v T ^'
^C,+
^-+
^^.-
^r
_^
X
^
1. 6
^--r
X
X
X
m^^^^^ ^ ,^^^^TT^^^^^^^^ I I !
^2. ^7
',
^
^
64 .^
^6. a
^V S G ^^
Figura: 13
LOG( T) _ C DI^S) ^
--+-------
40
3. 2
+
+
^x
,*
x
+
x
+ +
+
x
x +
x ^oc ^ ^ x
x
xx
-^-
x
x
i. 6
x
x
8
x
--^c
r
@
Figura: 14
^2. @
64, @
9^. @
128. ^16@. 0
7.
359
BI BLIOGRAFIA
BERAN, R. 11 981 ), "Nonparametric regression with randomly censored survival data". Technical report, Univ. California, Berkeley.
P. (1968), "Weak convergence of probability measures'".
Wiley, New York.
BILLINGSLEY ,
BRES^ow, N. y CROWLEY, J. (1974), "A large sample study of the lfe tabfe
and product-limit estimates under random censorship". Ann. of Stat., 2,
437-453.
BUCKLEY, J. y JAMES ,
W. (1 989), "Sequential fixed-width confidence bands for distribution functions under random censoring"". Metrika,
36, 167-176.
^ ^ l)
FALK, M. (1 983), "Relative efficiency and deficiency of kernel type estimators of smooth distribution functions". Stat. Neerlandica. 37, 2, 78-$3.
FALK, M. { 1 984), "Relative deficiency of kernel type estimators of quantiles" Ann. Stat., 12, 261-268.
FALK, M. (1 985), "Asymptotic normality of the kernel quantile estimator".
Ann. Stat., 13, 428-433.
FARALDO ROCA, P. y GONZLEZ MANTEIGA, W. ( 1 984), "Obtencin del SesgO,
varianza y error cuadrtico medio de una familia axiomtica de estimadores no paramtricos para funciones de distribucin. Actas del XIV
congreso naciona I de la S E I O. G ranada. 180-1 91.
M. A . y GONZLEZ MANTEIGA, W. (1986), "Suavizacin
no paramtrica en fiabilidad"'. Trabajos de Estadstica. 1, 2, 1 3-36.
FERNNDEZ SOTELO ,
A. y REJTO , L. (1 981 ^, "A L1L type result for the product limit
estirnator". Z. Wahrscheinlichkeitstheorieverw. Gebiete. 56, 75-86.
FbLDES ,
W.
Inference'using
parametric and nonparametric estimation. The censored data case". 47.
with randomly right-censored data using prior nonparametric estimation". NATO. Advanced Study Institute on Nonparametric Functional
Estimation and Related Topics. Kluwer. (en prensa).
GHORAY, J. (1989), "Deficiency of the MLE of a smooth survival function
under the proportional hazard mOdel". Commun. Stat.- Theory Meth. 1 8,
8, 3047-3056.
HALL ,
KAPLAN, E. L. y MEIER, P. (1958), "Nonparametric estimation from incomplete observations"'. J.A.S.A. 53, 457-481.
Kou^, H. L., SUSARLA, V. y VAN RYZiN, J. (1 981 a), '"Regression analysis with
randomly right censored data". Ann. Stat, 9, 6, 12 7 6-1288.
. (19$1 b}, "Least squares regression
analysis with censored survival data"'. Technical Report. (recibido por
cOmunicacin personal).
MILLER, R. G. (1976), "Least squares regression with censored data". Biometrika, 63, 449-464.
NADARAYA, E. (1964), " On estimating regression". Theory Prob. Appl., 9,
141-142.
^6_'
SUMMARY