Documente Academic
Documente Profesional
Documente Cultură
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 2
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
INTRODUCCIN____________________________________________________
En ocasiones puede resultar ventajoso, o incluso necesario, comenzar el anlisis de las
observaciones con mtodos analticos y grficos que no requieran de grandes supuestos previos
sobre el modelo. Tales mtodos no paramtricos permiten interpretar los datos obtenidos sin la
distorsin que podra causar la eleccin de un modelo subyacente no demasiado acertado. En
algunos casos, estos mtodos no paramtricos sern suficientes para realizar el anlisis de los
datos. En otras ocasiones, sin embargo, supondrn un paso intermedio hacia un modelo ms
estructurado (paramtrico) que permita profundizar ms en el anlisis de las observaciones.
En la primera parte de este math-block se proporcionan un conjunto de frmulas a partir de las
cuales se podrn calcular estimadores no paramtricos e intervalos de confianza para la funcin de
distribucin F(t), tanto en el caso de observaciones con censura arbitraria simple como en el caso
de observaciones con censura arbitraria mltiple. Se usar la hoja de clculo Excel para ilustrar el
uso de dichas frmulas.
Como referencia bibliogrfica, se recomienda consultar Lawless (1982) [13] y Nelson (1982) [18].
De forma anloga a como se enfoc el anlisis paramtrico (en el math-block Fiabilidad III), las
partes segunda y tercera del presente math-block contienen ejemplos prcticos de anlisis no
paramtrico desarrollados con ayuda de los programas MINITAB y STATISTICA.
OBSERVACIONES CON CENSURA ARBITRARIA SIMPLE_________________
Notacin: La mayora de las investigaciones sobre tiempos de fallo comienzan en el instante t = 0
con una muestra inicial de n dispositivos. Al final de cada intervalo temporal, se suele disponer de
informacin sobre el estado de dichos dispositivos. En lo que sigue, se denotar por d
i
al nmero
de dispositivos que han fallado en el intervalo (t
i-1
, t
i
].
Parece lgico pensar que un buen estimador no paramtrico de F(t
i
) ser:
( ]
n
d
n
n
t F
i
j
j
i
) (
i
t 0, en fallos de
Se puede demostrar que este ) (
i
t F es el EMV de F(ti ). Observar, adems, que este estimador
est definido para todos los valores de ti (extremos superiores de los intervalos):
Si d
i
= 0, entonces: [ ]
i i
t t F t F , ) (
) (
1 1 - i
t t
Si d
i
> 0, ( ]
i i i i
t t t F t F t F , ) (
) (
) (
1 1
t , siendo creciente ) (
t F y ) (
) (
1 i i
t F t F <
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 3
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Un intervalo de confianza para F(t
i
) a nivel 1- vendr dado por:
]
]
]
,
,
) (
~
~
), (
~
i i
t F t F , siendo:
donde ) (
i
t F F y
( )
2
,
1
; v v p
es aquel valor que, en una distribucin F con (v
1
,v
2
) grados de
libertad, deja a su derecha un rea p.
Ejemplo (censura arbitraria simple): Supongamos que se parte de una muestra de 100
dispositivos que comienzan a funcionar en el instante t = 0. Se sabe que, transcurrido un ao, ha
fallado 1 dispositivo. Otros dos dispositivos fallan entre el primer y segundo ao, y 2 ms dejan de
funcionar entre el segundo y tercer ao.
Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularn y representarn
grficamente los estimadores de F(t
i
) as como sus intervalos de confianza asociados (archivo
Censura_simple.xls):
A la hora de construir la hoja de clculo, se han usado las siguientes frmulas:
F5 = E5/$B$11
G5 = (1+(($B$11-$B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11-2*$B$11*F5+2;2*$B$11*F5))/($B$11*F5))^(-1)
H5 = (1+($B$11-$B$11*F5)/(($B$11*F5+1)*DISTR.F.INV($B$13/2;2*$B$11*F5+2;2*$B$11-2*$B$11*F5)))^(-1)
.....
Etc.
Observar que, una vez construda esta hoja de clculo, es inmediata la obtencin obtener de
intervalos de confianza a nivel 1- (para ello slo es necesario cambiar la casilla B13).
( )
1
F
n 2 , 2 F
n 2 n 2 ; 2 /
i
F
n
) 1 F
n n (
1 ) t ( F
~
+
+
+
( )
1
F
n 2 n 2 , 2 F
n 2 ; 2 /
i
) 1 F
n (
F
n n
1 ) t ( F
~
~
+
+
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 4
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
OBSERVACIONES CON CENSURA ARBITRARIA MLTIPLE_______________
Notacin: Supngase que se dispone de una muestra inicial de n dispositivos, los cuales han
comenzado a funcionar en el instante t = 0. Si una unidad no ha fallado en del intervalo i-simo (t
i-1
,
t
i
], o bien se habr perdido su pista en dicho intervalo (con lo que sera una observacin censurada
por intervalo), o bien se sabr que ha continuado funcionando en el intervalo siguiente. En caso de
ser una observacin censurada, supondremos que el instante de censura coincide con el extremo
superior del intervalo (t
i
).
Se denotar por:
d
i
= nmero de unidades que han fallado en el intervalo (t
i-1
, t
i
],
r
i
= nmero de unidades censuradas en el intervalo (t
i-1
, t
i
],
n
i
= nmero de unidades entrantes en el intervalo (t
i-1
, t
i
], i.e., aquellas que funcionen
correctamente al inicio del mismo:
m 1,..., i ,
1
0
1
0
i
j
j
i
j
j i
r d n n
donde m es el nmero de intervalos, y se sobreentiende que d
0
= 0, y r
0
= 0.
Segn se vio al presentar la tabla de supervivencia (en el math-block Fiabilidad I), un buen
estimador no paramtrico para la funcin de supervivencia sera:
( )
i
j
j i
p t S
1
1 ) (
, i = 1,...,m
Por tanto, un estimador no paramtrico para la funcin de distribucin F(t
i
) ser:
) (
1 ) (
i i
t S t F , i = 1,...,m
Se puede comprobar que ) (
i
t F es el EMV de F(t
i
). Observar, adems, que este ltimo estimador
est definido para todos los valores de t
i
(extremos superiores de los intervalos):
Si d
i
= 0, entonces: [ ]
i i
t t F t F , ) (
) (
1 1 - i
t t
Si d
i
> 0, ( ]
i i i i
t t t F t F t F , ) (
) (
) (
1 1
t siendo creciente ) (
t F y ) (
) (
1 i i
t F t F <
El siguiente resultado, conocido como Frmula de Greenwood, proporciona un buen estimador
para la varianza de ) (
i
t F :
( ) ( ) ( ) ( )
i
j
j j
j
i i i
p n
p
t S t S Var t F Var
1
2
) 1 (
) (
) (
La raz cuadrada de la frmula anterior es un estimador de
F
s
, el error estndar de ) (
i
t F .
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 5
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Un intervalo de confianza para F(t
i
) a nivel 1- vendr dado por:
]
]
]
,
,
) (
~
~
), (
~
i i
t F t F , siendo:
donde ) (
i
t F F y
( )
F F
s z
w
F
exp
) 2 / (
, siendo z
/2
el percentil 1 - /2 en una N(0,1).
Ejemplo Censura Arb. Mltiple: Supongamos que se parte de una muestra de 300 dispositivos
que comienzan a funcionar en el instante t = 0. Transcurrido un ao han fallado 4 dispositivos, y
hay 99 observaciones censuradas (no se sabe qu ha ocurrido con dichas unidades). Durante el
segundo ao han fallado 5 dispositivos, y el nmero de observaciones censuradas es de 95.
Finalmente, durante el tercer ao, han fallado otros dos dispositivos, siendo 95 el nmero de
observaciones censuradas.
Usando las ecuaciones anteriores, y con ayuda de EXCEL, se calcularn y representarn
grficamente los estimadores de F(ti) as como sus intervalos de confianza asociados (archivo
Censura_multiple.xls):
F6 = D11-D5-E5
H6 = 1-G6
I6 = H5*H6
K6 = I6^2*(G5/(F5*H5)+G6/(F6*H6))
L6 = J6/(J6+(1-J6)*(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6)))))
M6 = J6/(J6+(1-J6)/(EXP(DISTR.NORM.INV(1-$D$13/2;0;1)*RAIZ(K6)/(J6*(1-J6)))))
Etc.
w ) F
1 ( F
) t ( F
~
i
+
w / ) F
1 ( F
) t ( F
~
~
i
+
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
Anlisis no paramtrico de los tiempos de fallo
Proyecto e-Math 6
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
ESTIMADOR DE KAPLAN-MEIER______________________________________
Hasta ahora, se ha supuesto que los tiempos de fallo exactos no eran conocidos, ya que para ello
hubiera sido necesario realizar un proceso de inspeccin continuo. En cualquier caso, es obvio que
conforme se vaya aumentando el nmero de inspecciones realizadas, ir disminuyendo la longitud
de los intervalos, con lo que la mayora de stos no contendrn fallo alguno, pues todos los fallos
se hallarn concentrados en slo unos pocos intervalos.
Notar que la funcin F(t) ser constante en todos aquellos intervalos sin fallos, incrementndose
slo en los intervalos en que haya uno o ms fallos. Si el tamao de los intervalos es
suficientemente pequeo, cada intervalo registrar a lo sumo un nico fallo, con lo que se obtendr
una funcin F(t) escalonada: ser constante en todos los intervalos sin fallos, y dar un salto en
aquellos intervalos que contengan un fallo. En el lmite, conforme la longitud de los intervalos
tienda a 0, el estimador ) (