Sunteți pe pagina 1din 2

Maestra en Estadstica Aplicada

Cesar Ramon Gomez Avila


An
alisis de datos. Tecnicas aplicadas a datos de proximidad
Resumen Tema 1
Universidad de Granadas, Espa
na

31 de octubre de 2016

1.

Preliminares

Definici
on 1.1. Una matriz de distancias D es llamada Euclidiana si existe una configuracion de puntos en alg
un
espacio Euclidiano cuyas distancias est
an dadas por D; es decir, si para alg
un p existen puntos x1 , . . . , xn Rp tal
que:
0
d2rs = (xr xs ) (xr xs )
(1)
El siguiente teorema nos permite decir si D es euclidiana, y, en caso afirmativo, como encontrar una configuraci
on
correspondiente de puntos. En primer lugar necesitamos un poco de notacion. Para cualquier distancia matriz D,
sea
1
(2)
A = (ars ) , ars = d2rs
2
y sea
B = HAH,
(3)
donde H = I n1 11 es la matriz de centrado.
Teorema 14.2.1 Sea D una matriz de distancias y se define D por (3). D es Euclidiana si y solo si B es semidefinida
positiva. En particular, los siguientes resultados se mantienen:
0

1. Si D es una matriz matriz Euclidiana de distancias entre puntos para una configuracion Z = (z1 , , zn ) ,
entonces
0
r, s = 1, , n
(4)
brs = (zr z) (zs z) ,
0

En forma matricial (4) se convierte en B = (HZ) (HZ) as que B 0. Note que B puede ser interpretada
como matriz del producto interior centradapara la configuracion Z.
2. Inversamente, si B es semidefinida positiva de rango p entonces la configuracion correspondiente a B puede
ser construida de la siguiente manera. Sean 1 >  > n denotan los valores propios positivos de B con
vectores propios correspondientes X = x(1) , , x(p) normalizados por
x0(i) x(i) = i ,

i = 1, , p.

(5)

Entonces los puntos P , en Rp con coordenadas xr = (xr1 , , xrp ) (xr es la r-esima fila de X) tienen distancia
entre puntos dada por D. Ademas, esta configuracion tiene centro de gravedad X = 0, y B representa la matriz
de producto interior para esta configuracion.[1]
Demostraci
on Primero demostraremos (1). Supongamos
0

d2rs = 2ars = (zr zs ) (zr zs ) .


Podemos escribir


B = HAH =

 

1
1
1
1
1
J A I J = A AJ JAJ + 2 JAJ,
n
n
n
n
n

(6)

(7)

Donde J = 110 . Ahora tenemos


n

1X
1
AJ = (ar ) =
ars ,
n
n s=1

1
1X
JA = (as ) =
ars ,
n
n r=1

n
1
1 X
JAJ
=
(a
)
=
ars

n2
n2 r,s=1

(8)

As que
brs = ars ar as + a

(9)

de (6) tenemos ars =

0
(zr zs ) (zr zs )
, y de la ecuacion anterior se llega a brs = (zr z) (zs z)
2

Para probar la otra parte del teorema asumamos B 0 y tomemos la configuracion de puntos dada por el teorema.
1
Sea = X 2 , formada por los vectores propios estandarizados de B. Si le aplicamos una descomposicion espectral
tenemos
B = 0 = XX 0
Si brs = x0r xs , asi que B representa la matriz de producto interior para esta configuracion, por lo que
0

(xr xs ) (xr x s) = x0r xr 2x0r xs + x0s xs = brr 2brs + bss = arr 2ars + ass = 2ars = d2rs

Referencias
[1] Mardia, Kent y Bibby, Multivariate Analysis, Academic Press, (1997)

S-ar putea să vă placă și