Documente Academic
Documente Profesional
Documente Cultură
Matrices
Yanyuan Ma y Marc G. Genton
Instituto de Tecnologa de Massachusetts
E-mail:? Yanyuan math.mit.edu, Genton
math.mit.edu
Recibido 04 de enero 1999; publicado en lnea
el 06 de abril 2001
En este trabajo, proponemos un nuevo estimador de componente a componente de una matriz
de dispersin, basado en un estimador muy robusto de escala. La idea clave es la eliminacin de
un estimador de ubicacin en el procedimiento de estimacin de la dispersin. Las propiedades
de robustez se estudian por medio de la funcin de inuencia y el punto de ruptura. Adems
Tambin se analizaron las caractersticas tales como la varianza y la eciencia asinttica. Se
muestra en el enfoque de componente a componente, para las distribuciones gaussianas multivariantes, que la estimacin de matriz de covarianza es ms difcil que la estimacin de matriz
de correlacin.
La razn es que la varianza asinttica del estimador de covarianza aumentos con el aumento de
la dependencia, mientras que disminuye con el aumento de la dependencia de estimadores de
correlacin. Tambin demostramos que la varianza asinttica de dispersin estimadores para
distribuciones gaussianas multivariantes es proporcional a la asinttica varianza del estimador
subyacente escala. El valor de proporcionalidad depende slo en la dependencia subyacente.
Por lo tanto, en el medio slido estimador de dispersin es entre la mejor opcin slida en el
momento presente en el enfoque de componente a componente, porque es-lugar libre y combina pequeas propiedades de robustez variabilidad y tales como la alta punto de ruptura y
funcin de inuencia limitada. Un estudio de simulacin se lleva a cabo a n de evaluar el
comportamiento del nuevo estimador. En primer lugar, una composicin comparacin con otro
estimador robusto de componente a componente basado en la mediana se realiza absoluta estimador de escala de desviacin. Las propiedades altamente robustos de la se conrman nuevo
estimador. Una segunda comparacin con estimadores globales como El mtodo de la estimador
momento, el elipsoide de volumen mnimo, y el mnimo Tambin se realiza estimador de covarianza determinante, con dos tipos de valores atpicos. En este caso, el estimador de la matriz
altamente robusto dispersin resulta ser una interesante Ing compromiso entre la alta eciencia
del mtodo de momento en estimador situaciones no contaminadas y las propiedades altamente
robustas del mnimo elipsoide volumen y estimadores mnimos determinantes de covarianza en
contaminadas situaciones. 2001 Academic Press
AMS clasicaciones temticas: 62H12; 62G35. Palabras y frases clave: punto de ruptura; componente a componente; funcin de inuencia; robustez; estimador de escala.
1. INTRODUCCIN
Matrices de dispersin, es decir, la covarianza y correlacin matrices, juegan un papel importante en muchos mtodos de estadstica multivariante. Por ejemplo, que son las piedras angulares del anlisis de componentes principales, discriminante anlisis, anlisis factorial, anlisis
de correlacin cannica, y muchos otros (por ejemplo Mardia et al., 1979). Adems, las matrices de dispersin son en s mismos cantidades de inters, ya que representan una medida de
1
1X
donde b =
xi
n i=1
n
(1984, 1985), y se discute en Rousseeuw y Leroy (1987), y van Rousseeuw Zomeren (1990). El
mtodo busca de un elipsoide volumen mnimo, que contiene m = b(n + p + 1)=2c puntos, donde
b c denota la parte entera. Ms precisamente, consiste en encontrar bM V E y b M V E tales que
el determinante de se minimiza sujeta a
donde a2 es una constante ja, por ejemplo desde 2p en el caso de los datos de Gauss. El
MVE tiene un punto de ruptura de la muestra nita de m, es decir, 50 % asintticamente.
Dos algoritmos (remuestreo y proyeccin) para calcular un aproximado solucin de MVE se
puede encontrar en Rousseeuw y van Zomeren (1990). El estimador MVE se ha generalizado a
multivariantes S-estimadores (Davies, 1987; Lopuhaa ?, 1989;? Lopuhaa y Rousseeuw, 1991).
Li y Chen
(1985) propusieron un estimador de matriz de dispersin basado en robustifying director componentes a travs de tcnicas de persecucin proyeccin. Una clase de estimadores de proyeccin
para matrices de dispersin fueron estudiados por Maronna, Stahel y Yohai (1992). Tyler (1994)
discute nito punto desglose muestra de proyeccin basada
estimadores, en particular, el estimador Stahel-Donoho. Maronna y Yohai (1995) estudiaron
los comportamientos asintticos y nito-muestra de la Stahel? Donoho estimadores robustos
multivariados. De un estudio de simulacin, concluyeron que se comparan favorablemente con
otras propuestas como la M-multivariado o S-estimadores, y MVE de Rousseeuw. Sin embargo,
el principal inconveniente sigue siendo la falta de mtodos posibles para calcular los estimadores
de mayores dimensiones que p = 2:
Recientemente, Rousseeuw y Van Driessen (1999) propusieron un algoritmo rpido (FASTMCD) para el estimador mnimo Covarianza Determinante (MCD). Originalmente propuesto
por Rousseeuw (1984, 1985), el uso de este estimador fue hasta ahora obstaculizada por el
elevado tiempo de clculo de los algoritmos existentes. El objetivo es encontrar MCD h de
n observaciones cuya clsica covarianza matriz tiene el determinante ms bajo. El estimador
MCD, b M CD , de la matriz de covarianza es entonces el mtodo de momento estimador de estos h
observaciones. Rousseeuw y Van Driessen (1999) han demostrado que el muestra nita punto de
MCD desglose m se han denido anteriormente, cuando h = m, es decir, 50 % asintticamente.
Adems, Croux y Haesbroeck (1999) mostraron MCD que es ms eciente que MVE en altas
dimensiones, y por lo tanto recomendar el uso de MCD.
3. el estimador muy robusto
3.1. La dispersin entre dos variables aleatorias
Tradicionalmente, la estimacin de la covarianza entre dos variables aleatorias X e Y se basa
en un enfoque de ubicacin, ya que Cov(X; Y ) = E[(X E(X)) (Y E(Y ))]; produciendo, por
ejemplo, el estimador (1) de . Sin embargo, estimacin de covarianza tambin puede basarse
en un enfoque de escala, por medio de la siguiente identidad (Huber, 1981; Gnanadesikan,
1997):
[V ar (X= + Y = ) V ar (X=
Y = )] ;
8 ; 2R
(3)
4
En general, X e Y se pueden medir en diferentes unidades, y la eleccin
= X y p= Y es
p
recomendable (Gnanadesikan y Kettenring, 1972), donde X = V ar(X) y Y = V ar(Y ).
La eleccin de un estimador robusto de la varianza en (3) produce un estimador robusto de la
covarianza entre X y Y.
Cov(X; Y ) =
En el contexto de la estimacin de escala, Rousseeuw y Croux (1992, 1993) propone un estimador simple, explcito y muy robusto de escala, Qn ,
Qn (z) = d fjzi
(4)
n
) + 2)=4c + 1
2
y b c denota la parte entera. El factor d es la coherencia: para la distribucin de Gauss, d =
2;2191: Esto signica que ordenamos el conjunto de todos absoluta diferencias jzi zj j en orden
creciente para i < j; i; j = 1; 2; :::; n; y a continuacin, calcular su estadstica de orden k-simo
(aproximadamente el cuantil 1=4 para n grande). Este valor se multiplica por d, produciendo
de este modo Qn . Tenga en cuenta que este estimador calcula la estadstica de orden k-simo
n
de la ( ) Distancias entre puntos.
2
donde z = (z1 ; :::; zn )T es una muestra de una variable aleatoria Z; k = b((
[Q2n (x= + y= )
Q2n (x=
y= )] ;
(5)
4
donde: = Qn (x), = Qn (y). Como se muestra en la Seccin 4, tiene un avance punto de
cada de 50 %, que es el mismo que el Qn estimador. Aqu, 50 % punto de ruptura signica que
entre los pares n de observacin fxi; yig ; i = 1; :::; n valores, la mitad de ellos puede contener
contaminados (arbitrarias) y la estimacin no ser totalmente destruida. Tenga en cuenta que
en el medio slido estimador de covarianza bQ tambin puede llevarse a cabo conO(n log n)
tiempo y O(n) de almacenamiento.
A n de obtener un estimador muy robusto de la correlacin
e Y , podramos dividir el estimador bQ (x; y) en
1 2
[Q (x= + y= ) Q2n (x=
y= )]
(6)
4 n
donde: Qn (x), = Qn (y). Sin embargo, esto no es una correlacin naturales estimador porque
no est limitada y entre 1 y 1. Por lo tanto, nos
considere lo siguiente estimador muy robusto correlacin bQ de ;
bQ (x; y) =
y= )
y= )
(7)
donde el denominador es un estimador del valor 4 que asegura jbQ (x; y) j 1. Tenga en cuenta
que bQ (x; y) depende de la eleccin de la constante d apareciendo en Eq. (4), mientras que
bQ es independiente de la eleccin de d. Sin embargo, d puede ser calculado para diversas
distribuciones, aunque el caso es gaussiana generalmente preferido.
3.2. Dispersin entre p variables aleatorias
Tenga en cuenta que dado que el mtodo que proponemos se componente a componente en
lugar de global, no hay garanta de que tenemos una matriz denida positiva en el nal de la
estimacin. Rousseeuw y Molenberghs (1993) propusieron tres tipo de mtodos para transformar
la matriz estimada a una denida positiva matriz. Ellos son, respectivamente, el mtodo de
reduccin, el mtodo de valor propio, y el mtodo de escalado. Cuando el propio covarianza es
la cantidad de inters, hay que transformarla en una matriz denida positiva usando uno de
estos mtodos, mientras que si algunas entradas en particular de la matriz son los valores de
inters, entonces los valores estimados debe proporcionar una buena estimacin de la valores
reales.
4. PROPIEDADES DEL PERITO
4.1. puntos Desglose
Se sabe que el punto de ruptura Qn es 50 % (Rousseeuw y Croux, 1993). Inspeccionar X= +
Y = (o X=
Y = ), podemos ver que mientras como xi (o yi ) est contaminada, entonces
x= + y= (o x=
y= ) est contaminado. As que en los pares (x1 ; y1 ); :::; (xn ; yn ), podemos
tener como mximo la mitad de los pares de concentraciones que contiene datos contaminados.
Si nos jamos en un par como una observacin, entonces el estimadores bQ y bQ son robustos
frente a ms de la mitad de la contaminacin observaciones. As, tienen punto de ruptura 50 %
En la estimacin de la matriz de covarianza y la matriz de correlacin R, que forman pares de
todo el observaciones de Xi y Xj (i; j = 1; :::; p), y el estimador permite en la mayora la mitad
de las parejas para estar contaminada. Por lo tanto, entre la observacin n vectores x1 ; x2 ; :::; xn ,
a lo sumo la mitad de ellos puede contener datos contaminados.
En otras palabras, el punto de la componente a componente altamente robusto desglose estibQ es 50 % Tenga en cuenta que en el contexto de la dispersin la estimacin de
madores b Q y R
la matriz, otro tipo interesante de punto de ruptura es cuando valores atpicos causan la matriz
estimada para convertirse en singular. Sin embargo, este No es el caso de nuestros estimadores
bQ . incluso sin valores atpicos, que han de ser transformado a denitud
de dispersin b Q y R
positiva por medio de uno de los tres mtodos mencionados en el apartado 3.2.
4.2. Funcin Inuencia
La funcin de inuencia (Hampel, 1974) es una herramienta para describir la robustez ness
propiedades de un estimador. Su importancia radica en su heurstica atractivo interpretacin:
mide el sesgo asinttico causada por un innitesimal contaminacin de las observaciones. Denotemos por Q , Q , y Q la estadstica funcional (por ejemplo Huber, 1981;. Hampel et al,
6
Puesto que el estimador de correlacin bQ (x; y) se puede escribir como en la ecuacin. (7), se
tiene:
IF (u; v) ;
Q; F
2
(
2
+
2 2
2
+
2
+
+ IF
+ IF
; Q; F+
; Q; F+
IF
u
X
IF
; Q; F
; Q; F
Q; F
IF
; Q; F+
IF
; Q; F
(11)
Q; F
Q; F
V (Q; F ) =
Z
Z
IF (u; v) ;
Q; F
IF (u; v) ;
Q; F
IF (u; Q; F ) ;
dF (u; v)
dF (u; v)
Q; F
dF (u)
(12)
0
0
donde
2
X
es la covarianza y
2
Y
0
0
2
X
X Y
2
Y
Q;
= 2V (Q; )
2
X
2
Y
2
X
= 1;215
2
Y
(13)
Q;
2 2
) = 2V (Q; )(1
2 2
) = 1; 215(1
(14)
donde representa la funcin de distribucin gaussiana estndar, es decir, con media cero y
varianza uno.
En la Tabla I, se calcula la varianza del estimador de covarianza y de el estimador de correlacin
para diferentes varianzas y covarianzas subyacentes.
Los resultados se presentan en la cuarta y quinta columnas de la Tabla I. Proposicin la 1 es
de hecho vlido para un estimador de dispersin basado en cualquier estadstica funcional de
escala. Por ejemplo, podemos reemplazar la Qn estimador en Proposicin 1 con el estimador de
mxima verosimilitud de MLE escala, y calcular la forma cerrada de la varianza del estimador
de covarianza bM LE y del estimador correlacin bM LE :
CUADRO I
1
1
1
1
1
1
1
2
Y
1
1
1
1
2
3
10
V
0
0;2
0;5
0;8
0;5
0;5
0;5
Q;
1;215
1;264
1;519
1;993
2;735
3;950
12;458
Q;
1;215
1;120
0;683
0;157
0;930
1;021
1;155
8
Ef f v Q ;
0;823
0;701
0;296
0;040
0;498
0;589
0;745
Ef f v Q ;
0;823
0;791
0;658
0;501
0;732
0;758
0;803
Nota. Los valores numricos de las varianzas asintticas se calcularon con la Proposicin 1
y los valores numricos de las eciencias asintticas se calcularon con la Proposicin 3.
COROLARIO 1. La varianza asinttica del estimador de covarianza bM LE es
V
M LE
2
X
2
Y
(15)
M LE ;
2 2
) = (1
);
(16)
Por lo tanto, la varianza asinttica de los estimadores de covarianza aumenta con aumento de la
dependencia, mientras que disminuye con el aumento de la dependencia de estimadores de correlacin. De hecho, vemos que la varianza asinttica de estimadores de dispersin para distribuciones gaussianas multivariantes es proporcional cional a la varianza asinttica del estimador
subyacente escala. El valor de proporcionalidad depende slo de la dependencia subyacente.
4.4. Informacin de Fisher
Para distribuciones de Gauss, una forma cerrada de la informacin de Fisher tanto covarianza
y correlacin se pueden obtener:
Proposicin informacin 2. La informacin de Fisher de la covarianza es
I( ;
)=
2 2
X Y
2 2
X Y
)=
(17)
2 )2
es
1+ 2
2 )2
(1
(18)
Tenga en cuenta que a partir de la informacin de Fisher para la covarianza , es lineal remitir
a obtener la informacin de Fisher para la correlacin, ya que la correlacin Es simplemente
X
4.5. Eciencia
La eciencia se dene como la inversa del producto de la informacin Fisher y la varianza
asinttica del estimador. As, por las distribuciones gausianas, podemos calcular la eciencia
asinttica de bQ y bQ
Proposicin 3. La eciencia asinttica del estimador de covarianza bQ es
E
Q;
(
2V (Q;
2
X
2 2
2
Y
)(
2
X
2
Y
2 )2
= 0;823
(
(
2
X
2
X
2
Y
2
Y
2 2
Q;
1
2V (Q; ) (1 +
2)
= 0;823
1
1+
(19)
2 )2
(20)
M LE ;
)=
2
X
2
X
2
Y
2
Y
2 2
(21)
2 )2
M LE ;
)=
1
1+
(22)
5. COMPARACIONES
En primer lugar, comparamos el estimador que hemos propuesto aqu, bQ , con el mximo
probabilidad uno, bM LE , y otro componente a componente slido estimador, bM AD , basado en
la desviacin media absoluta (por ejemplo, Hampel et al., 1986). A continuacin Comparar
b Q con los estimadores globales b M M E ; b M V E y b M CD Nos centramos en la estimacin de
covarianza aqu ya que como vamos a sealar en la seccin 5.1, se es ms difcil que la estimacin
de correlacin.
5.1. Comparacin con MLE y MAD
Como hemos sealado, la Proposicin 1 es vlido para cualquier estimador de dispersin sobre
la base de un M-estimador de escala (Genton y Ma, 1999). En la Fig. 1, trazamos la varianza
asinttica del tres estimadores de covarianza bQ , bM LE y bM AD , para una distribucin gaussiana
normalizada con correlacin . del mismo modo nosotros tambin representamos la varianza
asinttica de los tres correlacin correspondiente estimadores de la Fig. 2. Las tres curvas de
la gura. 1 y en la Fig. 2 se calculan con la frmula de la Proposicin 1 y en el Corolario 1.
Podemos ver que
dos. para los tres estimadores, la varianza asinttica aumenta cuando la covarianza entre los
dos variables aleatorias aumenta.
cuando la covarianza (correlacin) entre dos variables aleatorias aumenta, la varianza asinttica
del estimador de covarianza aumenta, mientras que el varianza asinttica de los estimadores
de correlacin disminuye. Como cuencia cuencia, la estimacin de la correlacin es ms fcil
que la estimacin de la covarianza, en el sentido de que tiene menor variabilidad. En la de
Gauss estndar independiente caso de distribucin, es decir, = 0, la varianza asinttica de la
covarianza estimador y el estimador de correlacin tienen el mismo valor.
Nota. Los datos siguen una distribucin de Gauss estndar independiente, y se calcul la media
y la varianza despus de ejecutar 1.000 muestras. Los tres estimadores son todo imparcial, y
la varianza de la bM AD es signicativamente mayor que los otros dos.
Hemos llevado a cabo algunas simulaciones para probar la media y la varianza de la estimadores
de dispersin basado en el Qn , MLE, y estimadores MAD. la simulacin fue de dos variables
aleatorias gaussianas normalizadas con covarianza 0 y 0,5, y en base a 1000 muestras. Los
11
tamaos de las muestras fueron 20, 100 y 200. Los resultados se presentan en la Tabla II y III.
Podemos ver que los estimadores son imparciales y la varianza de los estimadores aumenta a
medida que la variacin entre las dos variables se incrementa al azar.
5.2. Comparacin con MME, MVE, y MCD
Con el n de comparar la gran robustez estimador componente a componente b Q con los
estimadores globales b M M E ; b M V E y b M CD , que lleva a cabo algunos
TABLA III
Nota. Los datos siguen una distribucin gaussiana con media cero y varianza uno, y la covarianza
# entre las dos variables aleatorias fue de 0,5. Se calcul la media y la varianza despus de
ejecutar 1.000 muestras. Los tres estimadores son todo imparcial, y la varianza de la bM AD es
signicativamente mayor que los otros dos.
simulaciones en tres variables, es decir,
Distribucin gaussiana. En la Tabla IV,
0
1
0
= @ 0 A;
0
y en la tabla V,
0
1
1
= @ 2 A;
3
es una matriz 3
1;0 0;9
@
0;9 1;0
=
0;5 0;2
0
1
0;5
0;2 A ;
3;0
1
1;0 0;8 0;5
= @ 0;8 1;0 0;8 A ;
0;5 0;8 1;0
3, a partir de un multivariante
(23)
(24)
Ambas situaciones son algunas correlaciones de gran tamao (0,9 en (23) y 0,8 en (24)). Generamos 1.000 conjuntos de datos, cada uno con un tamao de muestra de 100 y se utiliz el cuatro
estimadores para el clculo de la matriz de covarianza . En la estadstica software S-Plus, el
b M M E , b M V E , y b M CD estimadores son, respectivamente, implementado como var, cov.mve, y
cov.mcd$cov (tenga en cuenta que la ltima dos funciones dan un paso estimadores reweighted
basado en MVE y MCD, vase, por ejemplo Rousseeuw y Van Driessen (1999)). Implementamos b Q en S-Plus desde un C-rutina proporcionada por Croux y Rousseeuw (1992). Sobre la
base de las matrices de covarianza estimadas 1000, hemos calculado la media y la varianza de
las estimaciones. Los resultados se presentan en la Tabla IV y V. En las primeras columnas,
los datos no contienen valores atpicos, en el segunda columna, 10 % de los datos tienen una
matriz de covarianza 9 (explotar escriba los valores extremos), en la tercera columna, 10 % de
los datos tienen una covarianza matriz =9 (implosionar valores extremos tipo). En estos ejemplos, las matrices b Q son denida positiva. En caso de que no son denida positiva, como una
transformacin se describe al nal de la Seccin 3.2 se debe aplicar. Por conveniencia, llamar a
12
la suma de los valores absolutos de todas las entradas de una matriz de la 1-norma de la matriz, y denotan por k k1 . El ms pequeo de 1-norma en cada columna se destaca por la fuente
negrita. A partir de las tablas, se puede observar que cuando no hay valores atpicos, b M M E se
comporta mejor, b Q es ligeramente peor, mientras b M V E y b M CD se comportan peor. Cuando
los valores extremos son de explotar tipo (la observacin tiende a ser mucho ms grande que
el valor verdadero), b M V E tiene la mejor estimacin, seguido por b M CD y b Q , mientras que
b M M E da la peor resultado. Para los valores extremos que son de tipo implosin (la observacin
tiende a ser mucho ms pequeo que el valor verdadero), b M M E y b Q tanto dan relativamente
buenas estimaciones, mientras que b M V E es peor y b M CD da el peor resultado. Esto se puede
entender si nos damos cuenta de que los estimadores b M V E y b M CD slo tener en cuenta la
mitad de las observaciones que se distribuyen ms cercana a un centro estimada. Por lo tanto
los valores atpicos explosin no tendrn mucho
13
14
efectuar en los estimadores, mientras que la implosin valores atpicos puede traer importantes
desaar a los estimadores. En otras palabras, b M V E y b M CD son robustos slo en contra de
la explosin de los valores extremos, no implosin valores atpicos. b M M E da muy buenos
resultados en el caso de implosin debido a que los valores de implosionar que probamos son
No caso extremo y slo pueden llevar 10 % de los datos, por lo que en virtud el procedimiento
promediado, el efecto de implosin es muy pequea. b Q no es la mejor en cualquiera de las tres
simulaciones, pero es relativamente bueno en las tres simulaciones. As, en la prctica, cuando
uno no sabe muy bien qu tipo de valores atpicos existen y cuntos porcentaje de los datos
estn contaminados, b Q es una estimador adecuado a utilizar. En particular en lo que no hay
valores atpicos, el sesgo de b Q es casi tan pequeo como el sesgo de b M M E . Tenga en cuenta
que los resultados de la simulacin para b Q son vlidos slo para (23) y (24) porque nuestro
estimador no es afn invariante. Sin embargo, los resultados para (23) y (24) son bastante
similares.
6. CONCLUSIN
Un nuevo estimador de componente a componente de una matriz de dispersin, basado en
una altamente estimador robusto de la escala, se ha propuesto en este artculo. su robustez
propiedades fueron estudiados por medio de la funcin de inuencia y el desglose punto. Otras
caractersticas tales como la varianza y la eciencia asinttica eran tambin analizado. Una
ventaja importante de la novela estimador es que su comportamiento es cerca de el mtodo
de momento estimador en situaciones no contaminadas, mientras que es muy robusto en los
contaminados. Se demostr en el enfoque de componente a componente, para las distribuciones
gaussianas multivariantes, que la estimacin de matriz de covarianza es ms difcil que la matriz
de correlacin estimacin. La razn es que la varianza asinttica de la covarianza aumenta con
el aumento de la dependencia del estimador, mientras que disminuye con creciente dependencia
de estimadores de correlacin. Tambin hemos podido comprobar que la varianza asinttica de
los estimadores de dispersin de Gauss multivariado distribuciones es proporcional a la varianza asinttica de la escala subyacente estimador. El valor de proporcionalidad depende slo
de la subyacente dependencia. Por lo tanto, la gran robustez estimador de dispersin es la
mejor robusto eleccin en el momento presente en el enfoque de componente a componente, ya
que combina pequeas propiedades de variabilidad y robustez, como punto de ruptura y alta
acotada funcin de inuencia. Un estudio de simulacin se llev a cabo con el n de evaluar
15
el comportamiento de la nueva estimador. En primer lugar, una comparacin con otra estimador robusto componente a componente basado en la escala de desviacin absoluta mediana
estimador, se llev a cabo. Las propiedades altamente robusto del nuevo estimador fueron conrmados. Por otra parte, se ha demostrado que el comportamiento de la nueva estimador es
mejor que el basado en el MAD, aunque este ltimo es el B-estimador robusto dispersin componente a componente ms (Genton y Ma, 1999). Una segunda comparacin con estimadores
globales como el mtodo de estimador momento, el mnimo volumen estimador de elipsoide, y
el covarianza mnimo estimador determinante, tambin se ha realizado, con dos tipos de valores
atpicos. En este caso, la matriz de dispersin muy robusto estimador resulta ser un compromiso
entre la alta eciencia de la mtodo de momento estimador en situaciones no contaminadas y
la muy propiedades robustas del volumen mnimo elipsoidales y covarianza mnimo estimadores
determinantes en situaciones contaminados, con la explosin de tipo de valores atpicos.
7. PRUEBAS
7.1. Prueba de la Proposicin 1
La varianza asinttica de bQ a las
es
El cambio de variables
rendimientos
+ X
y
Y
X
+ X
y es independiente
16
Tenga en cuenta que usamos la propiedad lineal de la funcin de inuencia (Hampel et al.,
1986): IF ( x; Q; X ) =: IF (x; Q; X ); n : 8 2 R. Por lo tanto:
es
donde A = bu2 + av 2
Fisher, tenemos
2 uv y B = 2ab
dejar
Entonces, tenemos
18
Sea p =
s2 =[4
q
p
p p
ab( ab + )] y q = t2 =[4 ab( ab
Donde
AGRADECIMIENTOS
Los autores agradecen a Xavier de Luna por sus comentarios sobre una versin anterior de
la papel. Tambin agradecemos a dos rbitros annimos por los comentarios que ayudaron a
mejorar el papel.
Referencias
1. algoritmos en tiempo eciente C. Croux y PJ Rousseeuw, para dos estimadores altamente
robustos de escala, Comput. Estatista. 2 (1992), 411- 428.
2. C. Croux, PJ Rousseeuw, y O. Ho? Ssjer, generalizadas S-estimadores, J. Amer. Estatista.
Assoc. 89 (1994), 1271- 1281.
3. C. Croux y G. Haesbroeck, la funcin y la eciencia de la covarianza mnimo Inuencia
estimador de la matriz de dispersin determinante, J. multivariado anal. 71 (1999), 161?
190.
19
20
21