Sunteți pe pagina 1din 6

UNIVERSITAS SCIENTIARUM

Revista de la Facultad de Ciencias Julio-diciembre de 2003


PONTIFICIA UNIVERSIDAD JAVERIANA Vol. 8, 39-44

OBTENCIÓN DE LA MATRIZ DE VARIANZAS Y


COVARIANZAS A TRAVÉS
DE LOS PRODUCTOS KRONECKER PARA MODELOS
BALANCEADOS

Luz Marina Moya Moya

Facultad de Ciencias, Pontificia Universidad Javeriana, Bogotá, Colombia


E-mail: luz.moya@javeriana.edu.co

RESUMEN
Se presenta una metodología basada en la teoría de productos Kronecker que facilita la construcción de
la matriz de varianzas y covarianzas cuando se trabaja en diseños con estructura balanceada de datos. El
método propuesto puede ser aplicado a modelos mixtos con efectos fijos o aleatorios con cualquier
número de factores. La matriz de varianzas y covarianzas se construye bajo los supuestos usuales para
modelos finitos o infinitos.
Palabras clave: Productos Kronecker, matriz de varianzas y covarianzas, diseños balanceados, modelos
lineales.
ABSTRACT
We present a method for constructing variance and covariance matrices for balanced design using the
Kronecker product. The method can be applied to fixed, random, or mixed models with any number of
factors. The covariance matrices are constructed under the usual infinite and finite model assumptions.
Key words: Kronecker product, variance and covariance matrices, balanced designs, linear models.

INTRODUCCIÓN piada de la matriz de varianzas y covarian-


zas, así como de su inversa.
Los modelos de efectos mixtos tienen gran
importancia por sus múltiples aplicaciones A través de los años algunos autores 2 se
especialmente en la determinación de pa- han dado a la tarea de presentar propuestas
rámetros genéticos e índices de selección para hallar esta matriz. Muchos de estos tra-
de especies animales y/o vegetales1 . bajos se han concebido desde la perspecti-
va puramente teórica. Indudablemente la
En este tipo de modelo es importante de- descripción más completa sobre el estudio
terminar los mejores estimadores lineales de modelos de varianza se encuentra en
insesgados (MELI), y los mejores predicto- Searle et al. (1972), en donde se abordan
res lineales (BLUP), con el objeto de reali-
zar inferencia puntual y por intervalos, para
tomar decisiones apropiadas.
1 PIANOLA, DANIEL. los métodos estadísticos en el
mejoramiento genético.
Tanto los MELIS como los BLUP depen- 2 HENDERSON, C.R, LAMOTTE y RAO, PATTERSON y
den del conocimiento de la estructura apro- THOMSON.

39

6-OBTENCION.p65 39 06/10/03, 09:18 a.m.


Universitas Scientiarum Vol. 8, Ed. Especial, Matemáticas, 39-44

detalladamente varias propuestas por otros Adicionalmente, el valor esperado de y es:


autores; desde su formulación, hasta deta-
lles técnicos de cálculo y estimación. E ( y ) = X β y E ( y | U ) = X β + ZU

El objetivo de este artículo es proveer un por lo cual e = y – E (y | U). A e se le atribuye


algoritmo basado en la teoría de productos la estructura usual de varianza-covarianza
Kronecker que se aplique directamente a de un componente de error, esto es:
diseños balanceados con cualquier núme-
ro de factores fijos o aleatorios para cons- E ( e) = 0 y Var (e ) = σ e2 I N
truir la matriz de varianzas y covarianzas.
Tomamos el siguiente modelo por ejemplo,
· El modelo mixto general si:
La formulación del modelo mixto general y = µ + τ i11 + τ i22 + e, i1 = 1,K , n1 , i2 = 1,K , n2
originalmente propuesta por Harley y Rao
con n1 niveles del factor aleatorio τ y n2
1
(1967) y aceptada como estándar en el cam-
po de la estimación de las componentes de niveles del factor aleatorio τ 2 . .
varianza es la siguiente:
Entonces la estructura del modelo (1) para
Sea el modelo y = X β + ZU + e (1)
este ejemplo será: X = 1n n este vector co-
1 2

Donde lumna es de tamaño n1n2 × 1 con entradas de


unos, µ el efecto medio general, µ = β.
y : Vector de observaciones.
β : Vector de parámetros desconocidos aso-
τ 1 
ciados a los efectos fijos. En el modelo (1) U = τ 2 
X : Matriz conocida asociada a los efectos  
fijos.
conτ = [τ1 ,τ 2 ,K,τ n1 ] 3,τ = [τ1 ,τ 2 ,K,τ n2 ]
1 1 1 1 T 2 2 2 2 T
U : Vector no observable asociado a los efec-
tos aleatorios.
Z : Usualmente es una matriz de incidencia
y Z =  I n1 ⊗ 1n2 ; 1n1 ⊗ I n2 
asociada a efectos aleatorios en general
observable.
e : Vector no observable o vector de térmi- donde Z1 = I n1 ⊗ 1n2 y Z 2 = 1n1 ⊗ I n2
nos del error.
y asumimos que:
Como:
1 2 2 2
ZU =  Z1 Z 2 K Z s  U1 U 2 K U s 
T τ ≈ N (0, σ 1 ) y τ ≈ N (0, σ 2 ), 4
τ τ

Entonces:
s
y = X β + ∑ ZiU i +e
i =1
3 AT es la transpuesta de una matriz, es decir las
filas se intercambian por las columnas.
y la varianza de y se define como:
2 2
s 4 τ ≈ N (0, σ 2 ) tiene distribución normal con me-
τ
Var ( y ) = ∑ Z i Z σ + σ I
i
T
i
2 2
e N dia cero y varianza σ 22
i =1 τ

40

6-OBTENCION.p65 40 06/10/03, 09:18 a.m.


Julio-diciembre de 2003

Por lo tanto, la varianza de y utilizando la 5. Para A y B matrices cuadradas no sin-


fórmula (2) es gulares
−1 −1 −1
n1
( A ⊗ B) =A ⊗B
Var ( y ) = ∑ Z i Z iT σ τ2i + σ e2 I N = σ e2 I N
i =1
6. Sea DK una matriz diagonal de orden K
N
+ ( I n1 ⊗ J n2 )σ τ21 + ( J n1 ⊗ I n2 )σ τ22 . con elementos di:
Dk ⊗ A = d1 A ⊗ d 2 A ⊗ K ⊗ d5 k A
· Productos Kronecker
A p×k ⊗ Dk = ( A ⊗ I k )( I q ⊗ D ) 5
El producto Kronecker de dos matrices q
A pxq y Bmxn se define como: = ( A ⊗ I )( ⊕i =1 D )

 a11B ⋅ ⋅ a1q B 
 ⋅ ⋅ 
7. λ ( A ⊗ B ) = ( λ A) ⊗ B = A ⊗ ( λ B ) para
⋅ ⋅
Apxq ⊗ Bmxn = 
todo escalar λ .
 ⋅ ⋅ ⋅ ⋅ 
a B  8. A ⊗ ( B ⊗ C ) = ( A ⊗ B ) ⊗ C
 p1 ⋅ ⋅ a pq B 
9. ( A ⊗ B )( F ⊗ G ) = ( AF ) ⊗ ( BG )
Ejemplo: Sea 10. ( A + B ) ⊗ C = A ⊗ C + B ⊗ C
11. A ⊗ ( B + C ) = A ⊗ B + A ⊗ C
1 0
2 1 
A=  y B=2 1  el producto
 0 −1   MATERIALES Y MÉTODOS
 0 −1
Los modelos de componentes de varianza
Kronecker es:
son modelos lineales que incorporan tér-
 1 0 1 0   2 0 1 0 minos aleatorios, lo cual genera una matriz
2  2 1 1 2 1  
       4 2 2 1 de varianzas y covarianzas.

  0 −1  0 −1   0 −2 0 −1
A⊗ B =  =
 1 0 1 0   0 0 −1 0  Esta matriz V como lo vimos en los mode-

0  2 1  −1  2 1   0 0 −2 −1 los mixtos tiene la estructura
      
  0 −1  0 −1   0 0 0 1 s
V= ∑Z Z
i =1
i
T
i σ i2 donde Z Z T puede ser escri-
i i

y tenemos las siguientes propiedades: ta en términos de productos Kronecker, de


matrices IS y JS6 .
1. ( A ⊗ B )T = AT ⊗ BT .
De acuerdo a esta estructura el algoritmo
2. Para X y Y vectores: de la matriz V es:
T T T
X ⊗ Y = YX =Y ⊗ X .
Sea P el número de subíndices asociados a
3. Sea λ un escalar: la variable respuesta, los cuales dependen
λ ⊗ A = λ A = A ⊗ λ = Aλ.
4. En matrices particionadas:  2A O1
5 ⊕ representa la suma directa. A ⊕ B=  0O −B1
 
[ A1 A2 ] ⊗ B = [ A1 ⊗ B ; A2 ⊗ B ]
6 IS Representa la matriz identidad de tamaño
A ⊗ [ B1B2 ] ≠ [ A ⊗ B1; A ⊗ B2 ] S x S, y JS la matriz de unos con tamaño S x S.

41

6-OBTENCION.p65 41 06/10/03, 09:18 a.m.


Universitas Scientiarum Vol. 8, Ed. Especial, Matemáticas, 39-44

de los efectos e interacciones fijos y definiendo la función indicadora


aleatorios del modelo. Se tiene entonces 2P
particiones de productos Kronecker con 2 1 si aparece J s
δ efecto = 
matrices IS y JS, las cuales son resumidas
 0 si aparece I s
por la expresión.

 I n ⊗ I n ⊗ L ⊗ I nn 
T
se puede rescribir (3) como
 1 2 
 I n ⊗ I n ⊗ L ⊗ J nn 
 1 2  ∆ = [00 K 0;00 K1;K ;111K 0;111K1]
∆ P =
0
M 
1×2
J ⊗ J ⊗L J ⊗ J 
 n1 n2 nn−1 nn 
 J ⊗ J ⊗L ⊗ J  Para el ejemplo anterior
 n1 n2 nn

∆ = [000;001;010;100;110;101;011;111]
Para ejemplizar el algoritmo tomamos un
diseño factorial a dos vías jerárquico, cuyo
modelo tiene la forma: Caracterizado el vector ∆ se construye el
yi1i2i3 = µ + τ + τ + (τ τ ) vector asociado con las componentes de
1
i1
2
i2
1 2
+ ei1i2i3
i1i2 varianza θ 0 , según el siguiente criterio:
i1 = 1,2,K , n1 , i2 = 1,2,K , n2 , i3 = 1, 2,K , n3
Las componentes del vector fila θ 0 son σ a
2

en donde µ es el efecto medio general, τ i1 1


si existe una relación directa entre el
es el efecto del i1 -ésimo nivel del factor subíndice del efecto y la posición del cero
en ∆ , es decir para nuestro ejemplo la pri-
reglón, τ i22 es el efecto del i2 -ésimo nivel
mera componente de ∆ es 000 entonces el
del factor columna, (τ 1τ 2 ) i i es el efecto de
12 subíndice del efecto que tiene tres compo-
la interacción entre τ 1
y τ i22 , ei1i2i3 e es el nentes es ei1i2i3 por lo tanto la a se remplaza
i1
por e y la varianza que tomamos para esa
componente del error aleatorio y
primera posición es σ e2 , en caso de que no
τ i11 ≈ N (0,σ τ21 ), τ i22 ≈ N (0,σ τ22 ), haya ninguna relación se coloca cero.
(τ τ )
1 2
i1i2
≈ N (0,σ τ21τ 2 ), e ≈ N (0,σ e2 ).
Entonces

En este modelo P=3 corresponde a la canti- θ0 =  σe2 στ21τ2 0 0 0 στ22 στ21 0  (4)
dad de subíndices presentes en el modelo,
y por lo tanto ∆ 0 es:
( )
T
Con esto tenemos V como V = ∆ 0 θ 0 ,
 I n1n2n3 
T remplazando ∆ 0 , θ 0 , y multiplicando ob-
 I ⊗J  tenemos:
 n1n2 n3

 I n1 ⊗ J n2 ⊗ I n3  V = I n1n2n3σ e2 + I n1n2 ⊗ J n3σ τ21τ 2 + J n1 ⊗ I n2 ⊗ J n3σ τ22 + I n1 ⊗ J n2 n3σ τ21
 
J n1 ⊗ I n2 n3 
∆0 =  (3)
 J n1 n2 ⊗ I n3  Teniendo en cuenta el procedimiento ante-
 
 J n1 ⊗ I n2 ⊗ J n3  rior podemos deducir la fórmula general de
 I n1 ⊗ J n2 n3  V para diseños jerárquicos balanceados.
 
 J n1 n2 n3 

42

6-OBTENCION.p65 42 06/10/03, 09:18 a.m.


Julio-diciembre de 2003

Definimos el modelo general de la forma: de nabo. Se tomaron cuatro plantas de nabo


de cada parcela en forma aleatoria, luego
yi1i2 Kin = µ + τ i11 + τ i22 + τ i33 + K + τ inn−−11 + (τ 1τ 2 )i i + (τ 1τ 3 )i i + K + se seleccionaron tres hojas al azar de cada
12 13

(τ 1τ n−1 )i i + (τ 2τ 3 )i i + K + (τ 2τ n−1 )i i + K + (τ n−2τ n−1 )i


1 n −1 23 2 n −1 n − 2in −1
planta y de cada hoja se tomaron dos mues-
tras de 100 mg, en las que se determinó el
+ (τ 1τ 2τ 3 ) + (τ 1τ 2τ 4 ) + K + (τ n − 4τ n − 3τ n − 2τ n −1 )
i1i2i3 i1i2 i4 in − 4 in − 3in − 2 in −1 contenido de calcio por métodos microquí-
+ K + (τ 1τ 2 Kτ n −1 ) + ei1i2i3Kin micos.
i1i2 Kin −1

TABLA 1
donde Planta, i1 Hoja, i1 i2 Determinaciones
yi1i2i3 yi1i2 . yi1 .. y...
i1 = 1, 2 , K , n 1 , i 2 = 1, 2 , K , n 2 , K ; i n −1 = 1, 2, K , n n −1 ; i n = 1, 2 , K , n n
i1 =1,...,4 i2 =1,2,3

τ i11 ≈ N (0, σ τ21 ), τ i22 ≈ N (0, σ τ22 ), K, (τ 1τ 2 ) ≈ N (0, σ τ21τ 2 ), K, 1 1 3.28 3.09 6.37
i1i 2
2 3.52 3.48 7.00
(τ τ
1 2
Kτ n −1 )
i1i 2Ki n−1
≈ N (0, σ τ21τ 2Kτ n−1 ), e ≈ N (0, σ e2 ) 3 2.88 2.80 5.68 19.05

Si P=n corresponde a la cantidad de 2 1 2.46 2.44 4.90


subíndices presentes en el modelo pode- 2 1.87 1.92 3.79
3 2.19 2.19 4.38 13.07
mos ver que el número de elementos co-
rrespondientes es 2n y se tiene que 3 1 2.77 2.66 5.43
como: 2 3.74 3.44 7.18
3 2.55 2.55 5.10 17.71
T
 I n1n2 Knn 
 I n1n2 Knn −1 ⊗ J nn  4 1 3.78 3.87 7.65
  2 4.07 4.12 8.19
 I n1Knn− 2 ⊗ J nn−1 ⊗ I nn 
  3 3.31 3.31 6.62 22.46 72.29
 M 
∆ =
0
I n1n2 Knn −2 ⊗ J nn −1 nn  El modelo utilizado en el ejemplo es
 
 I n1 n2 Knn −3 ⊗ J nn − 2 ⊗ I nn −1 ⊗ J nn  yi1i2i3 = µ + τ i21 + τ (1i1 ) i2 + e( i1i2 ) i3 ,
 M 
 
 J n1 n2 Knn −1 ⊗ I nn  i1 = 1,K,4, i2 = 1,2,3, i3 = 1, 2.
 J n1 n2 Knn 
 
Donde µ es la media general, τ es el efecto
1

θ 0 = σ e2 ;σ τ21τ 2Kτ n−1 ;0;σ τ21τ 3 ;σ τ21τ 2Kτ n− 2 ;0;στ21τ 2Kτ n− 3 ;K;στ2n−1 ;0;σ τ2n ;0;0
de la i1 -ésima planta, τ 2 es el efecto de la i2
-ésima hoja en la i1 -ésima planta y la e es el
Sustituyendo en V = ∆ 0 (θ 0 ) , obtenemos la
T

error aleatorio, y además se supone que:


fórmula general de la matriz de varianzas y
covarianzas para diseños jerárquicos balan- τ 1 ≈ N (0,σ τ21 ) , τ 2 ≈ N (0,σ τ22 ) e ≈ N (0,σ e2 )
ceados como.
En primer lugar hallamos ∆ 0 y θ 0 para ha-
V = σ e2 I n1n2 n3Knn + σ τ21 I n1 ⊗ J n2 Knn−1 nn + K + σ τ2n J n1 n2 Knn−1 ⊗ I nn
τn
llar la matriz de varianzas y covarianzas
+ ∑ σ τ21k ( I n1 ⊗ J n2n3Knk −1 ⊗ I nk ⊗ J nk +1Knn si k = τ k1 , k1 = 2,K, n) para este modelo:
k =τ 2 T
 I 24 
+K + σ τ2n−1τ n J n1 n2Knn−2 ⊗ I nn−1 nn + K + σ τ21τ 2Kτ n−1 In1 n2Knn−1 ⊗ J nn I ⊗ I ⊗ J 
 4 3 2

 I4 ⊗ J 3 ⊗ I2 
Veamos ahora el siguiente ejemplo:  ⊗ ⊗ 
J I3 I2 
∆0 =  4 y θ 0 = σ e2 ;0;0;0;σ τ22 ;σ τ21 ;0;0 
J4 ⊗ J3 ⊗ I2 
 
Se toma un experimento que consiste en  J 4 ⊗ I3 ⊗ J 2 
determinar a largo plazo el contenido de  I4 ⊗ J 3 ⊗ J 2 
 
calcio promedio en las hojas de un cultivo  J 24 

43

6-OBTENCION.p65 43 06/10/03, 09:18 a.m.


Universitas Scientiarum Vol. 8, Ed. Especial, Matemáticas, 39-44

de donde tenemos: de P, el número de subíndices asociados


 I 4 ⊗ I3 ⊗ I 2 
T
σ 
2
e
a la variable respuesta. Se tiene enton-
I ⊗I ⊗J    ces 2 P particiones de productos
 4 3 2  0 
 I4 ⊗ J 3 ⊗ I2  0  Kronecker con matrices IS y JS, de don-
J ⊗I ⊗I    de obtenemos ∆ . Utilizando la función
0

0 
V = 4 3 2 
σ 22  indicadora podemos caracterizar ∆ , para
 J 4 ⊗ J3 ⊗ I2 
   τ  poder construir el vector asociado con
 J 4 ⊗ I3 ⊗ J 2  σ 22 
 I4 ⊗ J 3 ⊗ J 2   τ  las componentes de varianza θ 0 , con
  0 
J4 ⊗ J3 ⊗ J2  0  esto tenemos V como V = ∆ 0 (θ 0 )T , y
 
= I 24σ e2 + σ τ21 I 4 ⊗ J 3 ⊗ J 2 + σ τ22 J 4 ⊗ I 3 ⊗ J 2 . remplazando ∆ 0 , θ 0 obtenemos la ma-
triz de varianzas y covarianzas para mo-
Para predecir el valor promedio utilizamos delos balanceados con n vías de clasifi-
el mejor predictor lineal insesgado: cación.

BLUP ( x β ) = DZ TV −1 ( y − (x (x V T −1
x ) x TV −1 y
−1
))
LITERATURA CITADA
Donde D es una matriz diagonal de tamaño
16x 16 que contiene todas las varianzas GRAYBILL, F.A. ON QUADRATIC ESTIMATES OF
VARIANCE COMPONENTS, ANN. MATH. STAT.
σ τ2 , σ τ2 del modelo en su diagonal princi-
1 2
1954, 25: 367-372.
pal y los elementos por fuera de la diago-
nal son ceros. LÓPEZ, L.A, & IEMMA, A. ON THE ESTIMATION OF
VARIANCE COMPONENTS, BIOMETRICS. 1973,
Efectuando los productos y hallando la in- 29: 311-330.
versa de V se obtiene que:
LÓPEZ, L.A. CÁLCULO DE LA MATRIZ INVERSA DE
BLUP ( x β ) = 3,0120833 COMPONENTES DE VARIANZAS EN ESTRUCTURAS
BALANCEADAS Y DESBALANCEADAS, REVISTA
el valor promedio que se predice es de
3,0120833 calcio en las hojas de nabo. COLOMBIANA DE ESTADÍSTICA, SANTA FE DE
BOGOTÁ, 19-20, 1989, 113-124.
CONCLUSIONES
SEARLE, S.R, ANOTHER LOOK AT HENDERSON’S
METHODS OF ESTIMATING VARIANCE COMPONENTS,
1. Esta metodología sirve para agilizar el
desarrollo y solución de algunos pro- BIOMETRICS, 1968, 24: 749-789.
blemas de aplicación en la determina-
SEARLE, S.R, LINEAR MODELS, JOHN. WILEY AND
ción de parámetros genéticos e índices
SONS. NEW YORK, N.Y. 1971.
de selección de especies animales y / o
vegetales que requieren de la matriz de SEARLE, S.R, CASELLA, G. & MCCULLOCH, C.E,
varianzas y covarianzas. VARIANCE COMPONENTS, JOHN. WILEY AND
2. Facilita la inferencia puntual donde se SONS. NEW YORK, N.Y. 1992.
necesita la matriz de varianzas y cova-
rianzas.
Recibido: 20-05-2003
3. El algoritmo para la obtención de la ma- Aceptado: 6-08-2003
triz de varianzas y covarianzas requiere

44

6-OBTENCION.p65 44 06/10/03, 09:18 a.m.

S-ar putea să vă placă și