Sunteți pe pagina 1din 14

w

w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 2
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
INTRODUCCIN____________________________________________________
En ocasiones puede resultar ventajoso, o incluso necesario, comenzar el anlisis de las
observaciones con mtodos analticos y grficos que no requieran de grandes supuestos previos
sobre el modelo. Tales mtodos no paramtricos permiten interpretar los datos obtenidos sin la
distorsin que podra causar la eleccin de un modelo subyacente no demasiado acertado. En
algunos casos, estos mtodos no paramtricos sern suficientes para realizar el anlisis de los
datos. En otras ocasiones, sin embargo, supondrn un paso intermedio hacia un modelo ms
estructurado (paramtrico) que permita profundizar ms en el anlisis de las observaciones.
En la primera parte de este math-block se proporcionan un conjunto de frmulas a partir de las
cuales se podrn calcular estimadores no paramtricos e intervalos de confianza para la funcin de
distribucin F(t), tanto en el caso de observaciones con censura arbitraria simple como en el caso
de observaciones con censura arbitraria mltiple. Se usar la hoja de clculo Excel para ilustrar el
uso de dichas frmulas.
Como referencia bibliogrfica, se recomienda consultar Lawless (1982) [13] y Nelson (1982) [18].
De forma anloga a como se enfoc el anlisis paramtrico (en el math-block Fiabilidad III), las
partes segunda y tercera del presente math-block contienen ejemplos prcticos de anlisis no
paramtrico desarrollados con ayuda de los programas MINITAB y STATISTICA.

OBSERVACIONES CON CENSURA ARBITRARIA SIMPLE_________________
Notacin: La mayora de las investigaciones sobre tiempos de fallo comienzan en el instante t = 0
con una muestra inicial de n dispositivos. Al final de cada intervalo temporal, se suele disponer de
informacin sobre el estado de dichos dispositivos. En lo que sigue, se denotar por d
i
al nmero
de dispositivos que han fallado en el intervalo (t
i-1
, t
i
].
Parece lgico pensar que un buen estimador no paramtrico de F(t
i
) ser:
( ]
n
d
n
n
t F
i
j
j
i

) (

i
t 0, en fallos de

Se puede demostrar que este ) (

i
t F es el EMV de F(ti ). Observar, adems, que este estimador
est definido para todos los valores de ti (extremos superiores de los intervalos):
Si d
i
= 0, entonces: [ ]
i i
t t F t F , ) (

) (

1 1 - i
t t


Si d
i
> 0, ( ]
i i i i
t t t F t F t F , ) (

) (

) (

1 1
t , siendo creciente ) (

t F y ) (

) (

1 i i
t F t F <


w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 3
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Un intervalo de confianza para F(t
i
) a nivel 1- vendr dado por:
]
]
]
,

,
) (
~
~
), (
~
i i
t F t F , siendo:


donde ) (

i
t F F y
( )
2
,
1
; v v p
es aquel valor que, en una distribucin F con (v
1
,v
2
) grados de
libertad, deja a su derecha un rea p.
Ejemplo (censura arbitraria simple): Supongamos que se parte de una muestra de 100
dispositivos que comienzan a funcionar en el instante t = 0. Se sabe que, transcurrido un ao, ha
fallado 1 dispositivo. Otros dos dispositivos fallan entre el primer y segundo ao, y 2 ms dejan de
funcionar entre el segundo y tercer ao.
Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularn y representarn
grficamente los estimadores de F(t
i
) as como sus intervalos de confianza asociados (archivo
Censura_simple.xls):
A la hora de construir la hoja de clculo, se han usado las siguientes frmulas:
F5 = E5/$B$11
G5 = (1+(($B$11-$B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11-2*$B$11*F5+2;2*$B$11*F5))/($B$11*F5))^(-1)
H5 = (1+($B$11-$B$11*F5)/(($B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11*F5+2;2*$B$11-2*$B$11*F5)))^(-1)
.....
Etc.
Observar que, una vez construda esta hoja de clculo, es inmediata la obtencin obtener de
intervalos de confianza a nivel 1- (para ello slo es necesario cambiar la casilla B13).
( )
1
F

n 2 , 2 F

n 2 n 2 ; 2 /
i
F

n
) 1 F

n n (
1 ) t ( F
~

+

+
+
( )
1
F

n 2 n 2 , 2 F

n 2 ; 2 /
i
) 1 F

n (
F

n n
1 ) t ( F
~
~

+

+
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 4
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
OBSERVACIONES CON CENSURA ARBITRARIA MLTIPLE_______________
Notacin: Supngase que se dispone de una muestra inicial de n dispositivos, los cuales han
comenzado a funcionar en el instante t = 0. Si una unidad no ha fallado en del intervalo i-simo (t
i-1
,
t
i
], o bien se habr perdido su pista en dicho intervalo (con lo que sera una observacin censurada
por intervalo), o bien se sabr que ha continuado funcionando en el intervalo siguiente. En caso de
ser una observacin censurada, supondremos que el instante de censura coincide con el extremo
superior del intervalo (t
i
).
Se denotar por:
d
i
= nmero de unidades que han fallado en el intervalo (t
i-1
, t
i
],
r
i
= nmero de unidades censuradas en el intervalo (t
i-1
, t
i
],
n
i
= nmero de unidades entrantes en el intervalo (t
i-1
, t
i
], i.e., aquellas que funcionen
correctamente al inicio del mismo:
m 1,..., i ,

1
0
1
0
i
j
j
i
j
j i
r d n n
donde m es el nmero de intervalos, y se sobreentiende que d
0
= 0, y r
0
= 0.
Segn se vio al presentar la tabla de supervivencia (en el math-block Fiabilidad I), un buen
estimador no paramtrico para la funcin de supervivencia sera:
( )


i
j
j i
p t S
1
1 ) (

, i = 1,...,m
Por tanto, un estimador no paramtrico para la funcin de distribucin F(t
i
) ser:
) (

1 ) (

i i
t S t F , i = 1,...,m
Se puede comprobar que ) (

i
t F es el EMV de F(t
i
). Observar, adems, que este ltimo estimador
est definido para todos los valores de t
i
(extremos superiores de los intervalos):
Si d
i
= 0, entonces: [ ]
i i
t t F t F , ) (

) (

1 1 - i
t t


Si d
i
> 0, ( ]
i i i i
t t t F t F t F , ) (

) (

) (

1 1
t siendo creciente ) (

t F y ) (

) (

1 i i
t F t F <



El siguiente resultado, conocido como Frmula de Greenwood, proporciona un buen estimador
para la varianza de ) (

i
t F :
( ) ( ) ( ) ( )



i
j
j j
j
i i i
p n
p
t S t S Var t F Var
1
2
) 1 (

) (

) (


La raz cuadrada de la frmula anterior es un estimador de
F
s

, el error estndar de ) (

i
t F .
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 5
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Un intervalo de confianza para F(t
i
) a nivel 1- vendr dado por:
]
]
]
,

,
) (
~
~
), (
~
i i
t F t F , siendo:
donde ) (

i
t F F y
( )


F F
s z
w
F


exp
) 2 / (
, siendo z
/2
el percentil 1 - /2 en una N(0,1).
Ejemplo Censura Arb. Mltiple: Supongamos que se parte de una muestra de 300 dispositivos
que comienzan a funcionar en el instante t = 0. Transcurrido un ao han fallado 4 dispositivos, y
hay 99 observaciones censuradas (no se sabe qu ha ocurrido con dichas unidades). Durante el
segundo ao han fallado 5 dispositivos, y el nmero de observaciones censuradas es de 95.
Finalmente, durante el tercer ao, han fallado otros dos dispositivos, siendo 95 el nmero de
observaciones censuradas.
Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularn y representarn
grficamente los estimadores de F(ti) as como sus intervalos de confianza asociados (archivo
Censura_multiple.xls):


F6 = D11-D5-E5
H6 = 1-G6
I6 = H5*H6
K6 = I6^2*(G5/(F5*H5)+G6/(F6*H6))
L6 = J6/(J6+(1-J6)*(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6)))))
M6 = J6/(J6+(1-J6)/(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6)))))
Etc.
w ) F

1 ( F

) t ( F
~
i
+

w / ) F

1 ( F

) t ( F
~
~
i
+

w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 6
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
ESTIMADOR DE KAPLAN-MEIER______________________________________
Hasta ahora, se ha supuesto que los tiempos de fallo exactos no eran conocidos, ya que para ello
hubiera sido necesario realizar un proceso de inspeccin continuo. En cualquier caso, es obvio que
conforme se vaya aumentando el nmero de inspecciones realizadas, ir disminuyendo la longitud
de los intervalos, con lo que la mayora de stos no contendrn fallo alguno, pues todos los fallos
se hallarn concentrados en slo unos pocos intervalos.
Notar que la funcin F(t) ser constante en todos aquellos intervalos sin fallos, incrementndose
slo en los intervalos en que haya uno o ms fallos. Si el tamao de los intervalos es
suficientemente pequeo, cada intervalo registrar a lo sumo un nico fallo, con lo que se obtendr
una funcin F(t) escalonada: ser constante en todos los intervalos sin fallos, y dar un salto en
aquellos intervalos que contengan un fallo. En el lmite, conforme la longitud de los intervalos
tienda a 0, el estimador ) (

t F que se obtiene se conoce como estimador de Kaplan-Meier o


estimador Producto-lmite.
BANDAS DE CONFIANZA PARA MUESTRAS GRANDES________________
En las pginas anteriores, se han proporcionado frmulas con las cuales es posible hallar
intervalos de confianza para el valor de la funcin F(t) en un instante concreto t
i
. Sin embargo, en
ocasiones puede resultar conveniente disponer de intervalos de confianza para F(t) en todo un
rango continuo de posibles valores de t.
Cuando el tamao de la muestra sea suficientemente grande, la mayora de paquetes estadsticos
actuales permiten obtener estas bandas de confianza, las cuales sern especialmente tiles a la
hora de determinar si las observaciones se alejan significativamente de un determinado modelo
paramtrico.
Lgicamente, para cualquier valor de t, la amplitud de estas bandas ser mayor que la del
correspondiente intervalo de confianza (puesto que las bandas debern contener a los intervalos
de confianza puntuales, siendo su precisin menor que la de estos ltimos).
TIEMPOS DE CENSURA NO CONOCIDOS______________________________
Al desarrollar los mtodos anteriores, se ha supuesto que todas las censuras ocurren en el extremo
superior de cada intervalo. En tal sentido, se puede equiparar el conjunto de observaciones que
entra en cada intervalo con el conjunto de observaciones en riesgo. Al hacer esta hiptesis no se
est restando generalidad al modelo siempre que los tiempos de censura sean conocidos, ya que
en tal caso, bastar con tomar los extremos de los intervalos de forma que coincidan con tales
tiempos.
Sin embargo, si en vez de conocer de forma exacta los tiempos de censura, lo nico que se
supiese es que dichos tiempos estn contenidos en una serie de intervalos temporales, ya no sera
posible identificar el conjunto de observaciones entrantes con el conjunto de observaciones en
riesgo, ya que este ltimo va disminuyendo a lo largo del intervalo (debido a que se producen en l
censuras). En tal caso, se optara por tomar el nmero de observaciones en riesgo como el nmero
de observaciones entrantes en un intervalo menos la mitad de las censuradas en dicho intervalo
(tal y como se hizo en el math-block Fiabilidad I cuando se present la tabla de supervivencia).
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 7
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
ANLISIS NO PARAMTRICO CON MINITAB
Cuando no resulte posible ajustar los tiempos de fallo observados por ninguna distribucin
conocida, no se podr recurrir a los mtodos paramtricos, vistos el math-block "Fiabilidad III", para
describir la distribucin de los datos, por lo que deberemos utilizar otros mtodos que no se basen
en ninguna distribucin terica (mtodos no paramtricos). La opcin Non-Parametric Dist.
Analysis de MINITAB ofrece el estimador de Kaplan-Meier, la tabla de supervivencia (que ya se
explic en el math-block "Fiabilidad I"), y la tabla de Turnbull.
Se mostrarn a continuacin sendos ejemplos de anlisis no paramtrico segn los datos
contengan observaciones censuradas a derecha o por intervalos.
EJEMPLO ANLISIS NO PARAMTRICO CON CENSURA A DERECHA______.
Se pretende realizar un anlisis no paramtrico de los datos pertenecientes al caso de las cubiertas
para motores visto en el math-block Fiabilidad II (observaciones censuradas slo a derecha).
Entrada de datos (input): Se debern indicar las variables de inters as como las columnas de
censura:
Se opta por el estimador de Kaplan-Meier para este ejemplo (otra opcin sera la tabla de
supervivencia) y se requiere el grfico de la funcin de supervivencia:
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 8
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Salida de datos (output): a continuacin se muestran los resultados:
Distribution Analysis: Tiemp80

Variable: Tiemp80
Censoring Information Count
Uncensored value 37
Right censored value 13
Censoring value: Comp80 = 0
Nonparametric Estimates

Characteristics of Variable
Standard 95,0% Normal CI
Mean(MTTF) Error Lower Upper
55,7000 2,2069 51,3746 60,0254
Median = 55,0000
IQR = * Q1 = 48,0000 Q3 = *

Kaplan-Meier Estimates
Number Number Survival Standard 95,0% Normal CI
Time at Risk Failed Probability Error Lower
Upper
23,0000 50 1 0,9800 0,0198 0,9412 1,0000
24,0000 49 1 0,9600 0,0277 0,9057 1,0000
27,0000 48 2 0,9200 0,0384 0,8448 0,9952
31,0000 46 1 0,9000 0,0424 0,8168 0,9832
... ... ... ... ... ... ...
59,0000 22 1 0,4200 0,0698 0,2832 0,5568
60,0000 21 1 0,4000 0,0693 0,2642 0,5358
61,0000 20 1 0,3800 0,0686 0,2455 0,5145
62,0000 19 1 0,3600 0,0679 0,2270 0,4930
64,0000 18 1 0,3400 0,0670 0,2087 0,4713
66,0000 17 1 0,3200 0,0660 0,1907 0,4493
67,0000 16 2 0,2800 0,0635 0,1555 0,4045
74,0000 13 1 0,2585 0,0622 0,1366 0,3803

Distribution Analysis: Tiemp100

Variable: Tiemp100
Censoring Information Count
Uncensored value 34
Right censored value 6
Censoring value: Comp100 = 0
Nonparametric Estimates

Characteristics of Variable
Standard 95,0% Normal CI
Mean(MTTF) Error Lower Upper
41,6563 3,4695 34,8561 48,4564
Median = 38,0000
IQR = 30,0000 Q1 = 24,0000 Q3 = 54,0000

Kaplan-Meier Estimates
Number Number Survival Standard 95,0% Normal
CI
Time at Risk Failed Probability Error Lower
Upper
6,0000 40 1 0,9750 0,0247 0,9266
1,0000
10,0000 39 1 0,9500 0,0345 0,8825 1,0000
11,0000 38 1 0,9250 0,0416 0,8434 1,0000
14,0000 37 1 0,9000 0,0474 0,8070 0,9930
... ... ... ... ... ... ...
54,0000 11 1 0,2500 0,0685 0,1158 0,3842
68,0000 8 1 0,2187 0,0667 0,0881 0,3494
69,0000 7 1 0,1875 0,0640 0,0620 0,3130
72,0000 6 1 0,1563 0,0605 0,0376 0,2749
76,0000 5 1 0,1250 0,0559 0,0154 0,2346

Distribution Analysis: Tiemp80; Tiemp100

Comparison of Survival Curves
Test Statistics
Method Chi-Square DF P-Value
Log-Rank 7,7152 1 0,0055
Wilcoxon 13,1326 1 0,0003
La tabla de Kaplan-Meier nos ofrece
informacin (para cada intervalo) sobre:
n de unidades en riesgo, n de
observaciones que han fallado,
probabilidad de sobrevivir hasta ese
instante, etc.
Adems, MINITAB realiza dos
test para contrastar la
hiptesis nula de que todos
los grupos muestrales son
iguales
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 9
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
De los resultados se concluye que el tiempo de fallo mediano para una temperatura de 80 C es de
55 meses, y de 38 meses en el caso de una temperatura de 100 C. As que el incremento de
temperatura conlleva a una disminucin del tiempo mediano de fallo de aproximadamente 17
meses.
Las estimaciones sobre supervivencia estn registradas en la tabla de Kaplan-Meier. Por ejemplo,
a 80 C, un 90% de las cubiertas seguirn funcionando correctamente tras 31 meses, mientras que
a 100 C dicho porcentaje de cubiertas slo sobreviviran unos 14 meses.
La ltima parte del output anterior contiene los resultados de dos test distintos que contrastan la
hiptesis nula de que todos los grupos de muestras son similares en cuanto a sus tiempos de fallo.
En el ejemplo de las cubiertas para motores, se obtiene un p-valor significativo tanto para el test
Log-Rank como para el test de Wilcoxon (considerando = 0,05), por lo que se confirma la
existencia de diferencias sensibles entre los tiempos de fallo a 80 C y a 100 C.
Adems de los informes anteriores, el programa proporciona tambin el siguiente grfico no
paramtrico de la funcin de supervivencia de cada grupo, en el cual se aprecian las mencionadas
variaciones entre ambos por cuanto al tiempo de fallo se refiere:
Tiemp80
Tiemp100
80 70 60 50 40 30 20 10 0
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
Time to Failure
P
r
o
b
a
b
i
l
i
t
y
Nonparametric Survival Plot for Tiemp80-Tiemp100
Kaplan-Meier Method
Censoring Column in Comp80-Comp100
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 10
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
EJEMPLO ANLISIS NO PARAMTRICO CON CENSURA ARBITRARIA______

Para mostrar cmo llevar a cabo un anlisis no paramtrico cuando las observaciones estn
censuradas a derecha, izquierda y/o por intervalos (censura arbitraria), se recurrir nuevamente el
ejemplo de los neumticos introducido en el math-block Fiabilidad III:
Entrada de datos (input): como siempre, en primer lugar se deben indicar las variables que
contienen los tiempos de fallo y las columnas de censura:

Salida de datos (output): a continuacin se muestran e interpretan los resultados:
Distribution Analysis, Start = Inicio and End = Fin

Variable
Start: Inicio End: Fin
Frequency: Frec

Censoring Information Count
Right censored value 71
Interval censored value 694
Left censored value 8

Turnbull Estimates

Interval Probability Standard
Lower Upper of Failure Error
* 10000,00 0,0103 0,0036
10000,00 20000,00 0,0129 0,0041
20000,00 30000,00 0,0181 0,0048
30000,00 40000,00 0,0323 0,0064
40000,00 50000,00 0,0479 0,0077
50000,00 60000,00 0,1125 0,0114
Aqu aparecen el n de
obs. censuradas a
derecha, el n de obs.
censuradas por intervalos,
y el n de obs. censuradas
Probabilidad condicional de
que la unidad falle en cada
intervalo bajo el supuesto
de que ha llegado hasta l
en buen estado
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 11
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
60000,00 70000,00 0,1876 0,0140
70000,00 80000,00 0,2988 0,0165
80000,00 90000,00 0,1876 0,0140
90000,00 * 0,0918 *



Survival Standard 95,0% Normal CI
Time Probability Error Lower Upper
10000,00 0,9897 0,0036 0,9825 0,9968
20000,00 0,9767 0,0054 0,9661 0,9873
30000,00 0,9586 0,0072 0,9446 0,9726
40000,00 0,9263 0,0094 0,9078 0,9447
50000,00 0,8784 0,0118 0,8554 0,9014
60000,00 0,7658 0,0152 0,7360 0,7957
70000,00 0,5783 0,0178 0,5435 0,6131
80000,00 0,2794 0,0161 0,2478 0,3111
90000,00 0,0918 0,0104 0,0715 0,1122

La tabla de Turnbull muestra en primer lugar las probabilidades de fallo para cada intervalo. As,
por ejemplo, la probabilidad de que un neumtico que haya llegado en buen estado hasta los
60.000 km. falle en los prximos 10.000 km. es de 0,1876.
Adems, esta tabla tambin proporciona la funcin de supervivencia: se aprecia, en la columna
correspondiente, que un 92,63% de los neumticos pasaron en buen estado los 40.000 km.

Funcin de
Supervivencia
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 12
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
ANLISIS NO PARAMTRICO CON STATISTICA
Volviendo al ejemplo de los porttiles, introducido en el math-block Fiabilidad III (archivo
fiabilidad.sta), y sobre el cual ya se llev a cabo un anlisis paramtrico, se construir ahora una
tabla de supervivencia (Life Table):
Entrada de datos (input): Dentro del mdulo Survival Analysis, seleccionar la opcin Life Tables &
Distributions :
Pulsar ahora sobre el botn Variables y seleccionar las primeras seis variables en la lista de la
izquierda. Despus, seleccionar la variable Censur? como el indicador de censura en la lista de la
derecha:
Salida de datos (output): se obtendr la siguiente pantalla:

w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 13
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Ya slo falta pulsar sobre el botn Life Table para obtener una completa tabla de supervivencia:

EJEMPLO ESTIMADOR DE KAPLAN- MEIER____________________________

Como alternativa a clasificar los tiempos de fallo observados en una tabla de supervivencia, se
podra estimar la funcin de supervivencia directamente de los datos. Intuitivamente, se trata de
crear una tabla de supervivencia de forma que cada intervalo temporal contenga una nica
observacin. As, sera posible estimar la funcin de supervivencia en cada intervalo sin ms que
multiplicar las probabilidades de supervivencia de los intervalos (observaciones) anteriores. Este
estimador de la funcin de supervivencia se llama estimador producto-lmite o estimador de
Kaplan-Meier.
La ventaja del mtodo Kaplan-Meier respecto a la tabla de supervivencia es que las estimaciones
resultantes no dependen de cmo se agrupan los datos en los intervalos. De hecho, Kaplan-Meier
se podra considerar como un caso particular de la tabla de supervivencia.
Entrada de datos (input): Para aplicar Kaplan-Meier al ejemplo de los ordenadores porttiles, se
debe elegir la opcin Kaplan & Meier product-limit method :

Nuevamente, se pulsar sobre el botn Variables y se seleccionarn las primeras seis variables en
la lista de la izquierda, as como la variable Censur? como el indicador de censura en la lista de la
derecha.
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 14
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Salida de datos (output): se obtendr la siguiente pantalla:
Para obtener el estimador Kaplan-Meier, pulsar sobre el botn Product-limit survival analysis :
Es posible obtener una representacin grfica de la funcin de supervivencia pulsando sobre
Graph of survival times vs. cum. proportion surviving :

Survival Function
Complete Censored
Survival Time
C
u
m
u
l
a
t
i
v
e

P
r
o
p
o
r
t
i
o
n

S
u
r
v
i
v
i
n
g
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 500 1000 1500 2000
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 15
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Con este grfico se aprecian mejor las caractersticas de la funcin de supervivencia: dicha funcin
decrece rpidamente durante, aproximadamente, los 100 das posteriores a la reparacin.
Despus, la funcin va decreciendo de forma mucho menos acentuada.
As, parece lgico concluir que los primeros 100 das despus de la reparacin configuran un
perodo crtico en la supervivencia de los porttiles.
Por ltimo, tambin es posible obtener los percentiles de la funcin de supervivencia sin ms que
pulsar sobre Percentiles of survival function :

A partir de este ltimo output, se puede afirmar que el 25% de todos los porttiles fallarn antes
de los primeros 64 das tras la reparacin. El 50% de todos los porttiles sobrevivirn ms de 679
das (casi dos aos). El percentil 75 no pudo calcularse debido a que tan slo las observaciones
censuradas mostraban perodos de duracin largos segn se aprecia en la tabla de supervivencia
anterior (estn representadas con el signo +).

S-ar putea să vă placă și