Análisis Factorial Confirmatorio

Doctorado Interuniversitario en Marketing
Anlisis de Datos Avanzado

ANLISIS FACTORIAL CONFIRMATORIO
Apuntes y ejercicios

Dr. Joaquin Aldas-Manzano
Departamento de Comercializacin e Investigacin de Mercados
Departament de Comercialitzaci i Investigaci de Mercats
2

Nota importante

Los presentes apuntes forman parte del borrador del libro de Joaqun
Alds y Ezequiel Uriel Anlisis Multivariante Aplicado que ser
prximamente publicado por la editorial Thomson-Paraninfo. Por lo
tanto, como tal borrador pueden existir erratas, siendo bienvenidos todos
los comentarios que las detecten y sugerencias sobre la mejora del
captulo.

3

13 ECUACIONES ESTRUCTURALES:
ANLISIS FACTORIAL CONFIRMATORIO

13.1 INTRODUCCIN

El presente captulo es el primero de los dos captulos dedicados a ecuaciones estructurales.
Adems de su inters en si mismo, facilita el trnsito al segundo captulo dedicado a modelos
de estructuras de covarianza. Por qu el desarrollo del Anlisis Factorial Confirmatorio
(AFC) facilita este trnsito? Bsicamente por dos razones. En primer lugar, porque su
desarrollo se sigue con facilidad una vez el lector ha visto el captulo dedicado al anlisis
factorial exploratorio y, en segundo lugar, porque la herramienta estadstica que lo resuelve
es, esencialmente, la misma que emplearemos en los modelos de estructuras de covarianza.

Muchos son los textos que el lector puede utilizar para profundizar en el anlisis del AFC que,
en su gran mayora, tambin incluyen el desarrollo de los modelos de estructuras de
covarianza. La eleccin de uno u otro suele ir ligada a la decisin acerca del programa
estadstico que se prefiera utilizar. El SPSS inclua, hasta hechas recientes, el programa
LISREL (Jreskog y Srbom, 1989) como mdulo opcional, convirtindolo en el de uso ms
extendido. Si se opta por este programa, Sharma (1996) ofrece una buena introduccin con
salidas comentadas o, si se prefiere un texto con mayor profundidad, puede recurrirse a Long
(1983). Si, por el contrario, el lector opta por el EQS (Bentler, 1995), con un sistema de
notacin mucho ms intuitivo en nuestra opinin (Bentler y Weeks, 1980), una buena gua es,
sin duda, el texto de Byrne (1994). Una buena alternativa para aquellos que no se atreven a
decidirse por uno u otro tipo de software, es recurrir al mdulo CALIS del SAS, que permite
utilizar alternativamente cualquiera de las dos notaciones. En este caso, Hatcher (1994) es un
buen texto. Finalmente, puede recurrirse a Ullman (1996) para una aproximacin a esta
tcnica con salidas comparadas de todos los programas mencionados.

4
Dado que, como hemos indicado, la notacin de Jreskog y Srbon (1989) es la ms
conocida, ser la que utilizaremos en el desarrollo del tema. Sin embargo, llegado el
momento, presentaremos tambin la de Bentler y Weeks (1980) y demostraremos la
equivalencia de ambas.

Para introducirnos en el AFC es necesario presentar una serie de convenciones y trminos no
utilizados hasta el momento. Lo haremos basndonos en un ejemplo que nos servir para ver
la diferencia entre el AFC y el anlisis factorial exploratorio y los modelos de estructuras de
covarianza que analizaremos en el prximo tema.
CASO 13.1 Componentes de la inteligencia

Supongamos que un investigador ha recogido las notas de 275 alumnos de secundaria en seis
asignaturas: Lengua (L), Filosofa (FSF), Historia (H), Matemticas (M), Fsica (FSC) y
Qumica (Q). En el cuadro 13.1 se recogen las correlaciones entre estas seis variables. Nuestro
investigador se plantea una cuestin a la que quiere dar respuesta. Asumiendo que las notas de
un alumno miden su inteligencia (I), deseara saber si estas se agrupan en un nico factor (la
inteligencia) o, por el contrario, miden distintos aspectos de la misma, por ejemplo, la
inteligencia cuantitativa (IQ) y la inteligencia verbal (IV).

Cuadro 13.1 Matriz de correlaciones entre las notas de los 275 estudiantes

L FSF H M FSC Q
X
1
=L 1
X
2
=FSF 0,493 1
X
3
=H 0,401 0,314 1
X
4
=M 0,278 0,347 0,147 1
X
5
=FSC 0,317 0,318 0,183 0,587 1
X
6
=Q 0,284 0,327 0,179 0,463 0,453 1

Si suponemos que el investigador no tiene una hiptesis a priori acerca de qu estructura es la
adecuada (un nico componente de la inteligencia o dos), decidir efectuar un anlisis
factorial exploratorio para ver cuntos factores obtiene. Su planteamiento aparece recogido
grficamente en la figura 13.1. Las variables observadas o manifiestas o indicadores, es decir,
aquellas que se han medido (las notas en los alumnos en nuestro ejemplo), aparecen insertadas
en un cuadrado y se denotan como X
1
,...,X
6
. Las variables latentes, esto es las no observables
o subyacentes (por ejemplo, los factores, como la inteligencia en general, o la inteligencia
verbal o cuantitativa en particular), aparecen rodeadas por crculos. Una flecha recta desde
una variable latente a una variable observada, indica una relacin de causalidad. As el factor
1
est causando las notas de los alumnos en las seis asignaturas, es decir, la mayor o
menor inteligencia cuantitativa provoca que los alumnos tengan notas diferentes. El trmino
que aparece en cada una de las relaciones causales o paths es el parmetro que mide la
intensidad de la relacin, esto es, el trmino que denominamos carga factorial en una
anlisis factorial exploratorio, o el coeficiente estandarizado asociado a una variable
independiente en una regresin mltiple.

5
Figura 13.1 Modelo de anlisis factorial exploratorio

x1 x2 x3 x4 x5 x6
1 2 3 4 5 6
1
2
11
21 31 41
51
61 12
22
32
42 52
62
12=21

Las variables latentes son de dos tipos. Los mencionados factores comunes (), que son
comunes en cuanto que sus efectos son compartidos por ms de una variable observada, y los
factores especficos o errores (). Como se comprueba en la figura 13.1, cada uno de estos
factores afecta solamente a una variable observada, y son errores aleatorios que se pueden
haber producido en la medida de la variable observada. Finalmente, la flecha curva con dos
puntas que une a los factores comunes, indica que estas variables estn correlacionadas con
una intensidad
12
.

Planteados los convenios de representacin y los trminos empleados en el AFC que son
comunes a los de los modelos de estructuras de covarianza, que se examinarn en el prximo
tema, nos restara por sealar las diferencias del anlisis factorial confirmatorio con respecto
al anlisis factorial exploratorio, examinado en el tema 12, o con respecto al modelo de
estructuras de covarianza.

Volviendo a nuestro ejemplo, el investigador quiere saber si las notas estn midiendo un
nico componente de la inteligencia o, por el contrario, reflejan el efecto de varios
componentes. Como l no tiene establecida una hiptesis a priori, su anlisis factorial ha de
contemplar como plausibles todas las posibilidades. Un caso extremo consistira en que todas
las variables carguen de forma significativa sobre un solo factor. Un caso intermedio, aunque
puede haber otras muchas combinaciones, consistira en que un grupo de variables cargue
significativamente sobre un factor y el resto de variables lo haga sobre un segundo factor. La
figura 13.1 recoge todas las posibilidades y, en concreto, estos dos casos. En el primer caso,
11
,
21
, ... ,
61
seran significativos, mientras que
12
,
22
, ... ,
62
no lo seran. En el segundo
caso,
11
,
21
y
31
tendran un valor significativo y
41
,
51
,
61
no (las notas en literatura,
filosofa e historia cargan sobre un factor, inteligencia verbal, y no sobre el otro); por otra
parte,
12
,
22
,
32
tendran un valor no significativo, mientras que
42
,
52
,
62
s (las notas en
6
matemticas, fsica y qumica cargan sobre un factor, la inteligencia cuantitativa). El
investigador debe efectuar un anlisis factorial exploratorio con objeto de averiguar cul de
las dos posibilidades (o cualquiera de las otras muchas que sugiere la figura 13.1) es ms
verosmil de acuerdo con los datos.

Ahora bien, el investigador basndose en estudios previos o en una revisin de la literatura
existente, puede considerar la hiptesis, por ejemplo, de que no existe una medida global de la
inteligencia sino dos tipos alternativos de la misma: inteligencia verbal (que explicara las
calificaciones en lengua, filosofa e historia) e inteligencia cuantitativa (que explicara las
obtenidas en matemticas, fsica y qumica). Si ste es el caso, el anlisis exploratorio ya no
tiene sentido, ya que el investigador lo que pretende es confirmar o no la verosimilitud de su
hiptesis. Su planteamiento aparece recogido ahora en la figura 13.2.

El investigador puede plantearse otra hiptesis alternativa segn la cual, s existe una sola
medida global de la inteligencia que, a su vez, causa la inteligencia verbal y la cualitativa
(figura 13.3). Su misin consistira, ahora, en determinar cul de los dos modelos es ms
verosmil de acuerdo con los datos. En este segundo caso, ha establecido una relacin de
causalidad, no de correlacin, entre una o ms variables latentes. El modelo deja de ser un
AFC para convertirse en un modelo de estructuras de covarianza. Ntese en la figura 13.3
que, ahora, los factores
1
y
2
no son variables independientes (adems de salir una flecha
causal de ellas, tambin la reciben), por lo que estn sujetos a un error de prediccin que se
denomina perturbacin (disturbance) y que se suele denotar mediante la letra . Los
coeficientes de estos path se designan con la letra .

Figura 13.2 Modelo de AFC

x1 x2 x3 x4 x5 x6
1 2 3 4 5 6
1
2
11
21 31
42
52 62
12=21
12=21
32=23
45=54 56=65
13=31 46=64

7
Figura 13.3 Modelo de estructuras de covarianzas
x1 x2 x3 x4 x5 x6
1 2 3 4 5 6
1
2
11
21 31
42
52 62
3
13
23
1
2

13.2 FORMALIZACIN MATEMTICA DEL AFC

A partir del problema de AFC ilustrado en la figura 13.2, presentaremos a continuacin la
formalizacin del mismo siguiendo la notacin de Jreskog y Srbom, (1989), tal y como la
ofrece Long (1983). La relacin entre las variables observadas y las latentes de la figura 13.2,
pueden expresarse:

1 11 1 1
2 21 1 2
3 31 1 3
4 42 2 4
5 52 2 5
6 62 2 6
x
x
x
x
x
x

= +
= +
= +
= +
= +
= +

Si recurrimos a la notacin matricial, la anterior expresin adoptara la forma:

0
1 11 1
0
2 21 2
0
3 31 3 1
0
4 42 4 2
0
5 52 5
0
6 62 6
x
x
x
x
x
x

= +

o de manera compacta:

8
= + x (13-1)

donde, en general, x es un vector q1 que contiene las q variables observadas, es un vector
s 1 que contiene los s factores comunes, es una matriz qs que contiene las cargas
factoriales de las variables latentes y es un vector q1 de los factores especficos o errores.
Asumimos que el nmero de variables observadas ser siempre mayor que el de factores
comunes, o lo que es lo mismo que q>s.

Tanto las variables latentes como las observadas de la expresin (13-1) vienen expresadas
como desviaciones sobre la media, con lo que la esperanza de cada vector es otro vector de
ceros:

E(x)=0; E()=0 y E()=0.

Este desplazamiento respecto al origen, no afecta a las covarianzas entre las variables.

Si denotamos como a la matriz de varianzas covarianzas entre las variables observadas
(vector x), de acuerdo con 13.1, resulta que:

( ) ( )( ) E E

= =

xx + +

Teniendo en cuenta que la traspuesta de una suma de matrices es la suma de las traspuestas y
que la traspuesta de un producto es el producto de las traspuestas en orden inverso, tenemos
que:

( )( ) [ ] E = + +

y teniendo en cuenta la propiedad distributiva y calculando la esperanza:

[ ]
[ ] [ ] [ ] [ ]
E
E E E E
= + + +
= + + +

Dado que la matriz no contiene variables aleatorias, al ser constantes los parmetros
poblacionales, se tiene que:

[ ] [ ] [ ] [ ] E E E E = + + + (13-2)

Si hacemos

[ ]
[ ]
E
E
=
=

y asumimos que y estn incorrelacionados entre s, la expresin (13-2) puede escribirse
del siguiente modo:

9

+ = (13-3)

Es muy importante, para desarrollos posteriores, analizar el contenido de la expresin (13-3).
As, en el primer miembro aparece una matriz que contiene q(q+1)/2 varianzas y covarianzas
distintas de las variables observadas
1
. En el segundo miembro aparecen qs cargas factoriales
(), s(s+1)/2 varianzas y covarianzas entre los factores comunes () y q(q+1)/2 varianzas y
covarianzas entre los factores especficos (). Por lo tanto, la expresin (13-3) expresa los
q(q+1)/2 elementos distintos de en funcin de [qs+s(s+1)/2+q(q+1)/2] parmetros
desconocidos de las matrices , y . As pues, los parmetros que se debern estimar
aparecen vinculados mediante la expresin (13-3) a los valores de las varianzas y covarianzas
poblacionales de las variables observadas.

En el ejemplo ilustrado en la figura 13.2 se introducen restricciones adicionales sobre las
cargas factoriales y se asume que
1
,
2
y
3
estn incorrelacionadas con
4
,
5
y
6
. Teniendo
en cuenta estas restricciones y dado que existen q=6 variables observadas y s=2 factores
comunes, las matrices que contienen los parmetros a estimar adoptarn la forma siguiente:

11 12 13
21 22 23
11 12 31 32 33
12 22 44 45 46
54 55 56
64 65 66
0
11
0 0 0
0
0 0 0 21
0
0 0 0
31
; ;
0 0 0 0
42
0 0 0
0
52
0 0 0
0
62

= = =

donde los subrayados indican que esos elementos de las matrices y son 0 por la
especificacin concreta que tiene el modelo que se quiere contrastar. Lgicamente, si el
investigador asumiera otras hiptesis la configuracin de estas matrices sera distinta. De
hecho, tal como hemos comentado anteriormente, en general, la matriz tiene 6(6+1)/2 = 21
elementos distintos a estimar (el tringulo inferior), mientras que en nuestro caso, dado el
modelo especificado, slo hay 12.

A qu se reduce, a grandes rasgos, el mtodo AFC? La finalidad de este mtodo es obtener
estimaciones de las matrices , y que hagan que la matriz de varianzas y covarianzas
poblacional estimada obtenida a partir de ellas, sea lo ms parecida posible a la matriz de
varianzas y covarianzas muestral que se obtiene a partir de los valores muestrales de las
variables observadas. Pero para poder entrar en el procedimiento de estimacin, es necesario
abordar previamente el problema de la identificacin que se plantea en el mtodo AFC.

13.3 IDENTIFICACIN DEL MODELO EN EL AFC

En el epgrafe anterior, hemos visto que en el mtodo AFC disponemos de una serie de datos
(las varianzas y covarianzas muestrales de las variables observadas) y con ellos hemos de
estimar una serie de parmetros (cargas factoriales, varianzas y covarianzas de los factores
comunes, y varianzas y covarianzas de los factores especficos o errores). Al igual que ocurre

1
Para determinar el nmero de varianzas y covarianzas distintas, tngase en cuenta que es una matriz q q
simtrica
10
con un sistema de ecuaciones lineales, podemos disponer en principio de ms ecuaciones que
incgnitas, del mismo nmero o de mayor nmero de incgnitas que ecuaciones. Pues bien, la
identificacin del modelo en el AFC hace referencia, precisamente, a la cuestin de si los
parmetros del modelo pueden o no ser determinados de forma nica.

En palabras de Long (1983), si se intenta estimar un modelo que no est identificado, los
resultados que se obtendrn sern estimaciones arbitrarias de los parmetros lo que
desembocar en interpretaciones carentes de sentido. En el apndice A13.1 se demuestra
cmo, si no se imponen restricciones a los parmetros a estimar, necesariamente habr un
nmero infinito de soluciones posibles para los mismos.

Qu tipo de restricciones pueden imponerse a los parmetros? Por ejemplo, si una carga
factorial
ij
de la matriz se fija a 0, estaremos indicando que el factor
j
no afecta
causalmente a la variable observada x
i
. Si fijamos a 0 el elemento
ij
de la matriz ,
estaremos sealando que los factores
i
y
j
estn incorrelacionados. Si todos los elementos de
la matriz fuera de la diagonal se fijan a 0, los factores sern ortogonales (como ocurre en el
anlisis factorial exploratorio, por ejemplo). Restricciones similares se pueden imponer a los
elementos de la matriz .

Long (1983) seala que existen una serie de condiciones para que el modelo est identificado:
necesarias (si no se dan, el modelo no est identificado), suficientes (si se dan el modelo est
identificado, pero si no se dan no tiene porqu no estarlo) y necesarias y suficientes (si se dan
el modelo est identificado y si no se dan est no identificado). No hay acuerdo entre la
literatura acerca de si existen o no las condiciones necesarias y suficientes. Jreskog y
Srbom (1989) sealan que el anlisis de la llamada matriz de informacin, construida a partir
de la matriz de varianzas y covarianzas de los estimadores de los parmetros, puede servir
para establecer si el modelo est identificado. Estos autores sealan que si la matriz de
informacin es definida positiva es casi seguro que el modelo est identificado. Por el
contrario, si la matriz de informacin es singular, el modelo no est identificado. Las
cursivas son de Long (1983) y las introduce porque indica que, dado que los programas
existentes verifican esta condicin, si no hacen advertencias acerca de problemas en esta
matriz, estaramos ante un buen indicador de que el modelo est identificado pero, en su
opinin, an siendo la matriz definida positiva es posible, aunque improbable, que el modelo
no est identificado. Otros autores, como Hatcher (1994) y Ullman (1996) confan tambin en
las advertencias de los programas como indicadores de no identificacin. En general, la
mayora de textos optan por recomendar que se comprueben una serie de condiciones
necesarias que suelen demostrarse como lo suficientemente exigentes para garantizar la
identificacin del modelo. Siguiendo a Hatcher (1994) y Ullman (1996), el investigador
debera centrarse en las siguientes tareas:

1. Comparar el nmero de datos con el nmero de parmetros que han de estimarse. Los
datos son siempre las varianzas-covarianzas muestrales, y hemos visto que existen
q(q+1)/2. Como el nmero de parmetros a estimar es qs+[s(s+1)/2]+[q(q+1)/2], el
modelo estar sin identificar si no se imponen, al menos, qs+[s(s+1)/2] restricciones.
Decimos al menos porque slo si hay ms datos que parmetros, el modelo est
sobreidentificado (caso particular de identificacin), lo que hace que, al existir grados
de libertad, ser posible la aceptacin o el rechazo del modelo.
2. Establecer una escala para los factores comunes. Esto se consigue fijando la varianza
de cada factor comn a 1 o el coeficiente de regresin (carga factorial) de una de las
variables observadas que cargan sobre cada factor a 1. Si esto no se hace se produce el
11
denominado problema de indeterminacin entre la varianza y las cargas factoriales, es
decir, es imposible distinguir entre los casos en los que un factor tiene una varianza
grande y las cargas son pequeas y el caso en que las varianzas son pequeas y las
cargas altas.
3. Asegurar la identificabilidad de la parte del modelo que contiene la relacin entre las
variables observadas y los factores. Para ello debe analizarse el nmero de factores y
el nmero de variables observadas que cargan sobre cada factor. Si solo hay un factor,
el modelo puede estar identificado si el factor tiene al menos tres variables con cargas
no nulas sobre l. Si hay dos o ms factores, examnese el nmero de variables
observadas de cada factor. Si cada factor tiene tres o ms variables que cargan sobre
l, el modelo puede estar identificado si los errores asociados con los indicadores no
estn correlacionados entre s, cada variable carga slo sobre un factor y los factores
pueden covariar entre ellos. Si slo hay dos indicadores por factor, el modelo puede
estar indentificado si los errores asociados con cada indicador no estn
correlacionados, cada indicador carga slo sobre un factor y ninguna de las
covarianzas entre los factores es igual a cero.
4. Fijar arbitrariamente el coeficiente de regresin del trmino de error al valor 1
2
.

La aplicacin de las condiciones expuestas al modelo de la figura 13.2, que nos viene
sirviendo de ejemplo, se ilustran en figura 13.4.

Figura 13.4 Modelo de AFC identificado
x1 x2 x3 x4 x5 x6
1*
1*
1=11
21=* 31=*
1=42
52=*
12=21=*
0=12=21 0=32=23
0=45=54 0=56=65
2*
62=*
1 1 1 1 1 1
2* 3* 4* 5* 6*
0=13=31 0=46=64

2
En el modelo (13-1), como puede verse, los coeficientes correspondientes al trmino de error () son 1. Sin
embargo, en algunos programas de ordenador para tratamiento del AFC se permite fijar los coeficientes a
valores distintos de 1.
12
En primer lugar, recordemos que disponemos para estimar el modelo sealado de
6(6+1)/2=21 datos, que se corresponden con las varianzas covarianzas de las variables
observadas. Tenemos que estimar, en principio, 62+(23/2)+(67/2)=36 parmetros. Estos
parmetros son 12 coeficientes de regresin (cargas factoriales), la varianza de los 2 factores
comunes, la covarianza entre ellos, 6 coeficientes de regresin entre las variables observadas
y los factores especficos, las 6 varianzas de los factores especficos y las 15 covarianzas entre
esos factores especficos.

Veamos en qu medida las condiciones de determinacin anteriores influyen en esta situacin.

En primer lugar, resolvemos el problema del establecimiento de la escala de los factores
comunes. Obsrvese en la figura 13.4 como se ha fijado a 1 el coeficiente de regresin entre la
variable x
1
y el primer factor y ente la variable x
4
y el segundo factor. Como indicbamos
podramos haber fijado a 1 la varianza de ambos factores y dejar libres los mencionados
parmetros. Ntese que hemos sealado con un * aquellos parmetros que sigue siendo
necesario estimar tras la identificacin del modelo.

A continuacin aseguramos la identificabilidad de la parte del modelo que contiene la relacin
ente las variables observadas y los factores. En nuestro caso tenemos dos factores y tres
variables observadas sobre cada uno de ellos. Entonces, tal como sealamos con anterioridad,
se han adoptado los supuestos de que los errores asociados con los indicadores () no estan
correlacionados entre s (es decir, las covarianzas
ij
se han hecho 0, como se observa en la
figura 13.4), y de que cada variable carga slo sobre un factor. Por otra parte, s se ha
permitido que las covarianzas entre los factores sean no nulas (las
ij
estn marcadas con *
para ser estimadas).

Finalmente, los coeficientes de regresin entre las variables observadas y los trminos de
error se han fijado arbitrariamente a 1.

Tras haber efectuado estas restricciones, cabe preguntarse el modelo est identificado, o
sobreidentificado, y, en consecuencia, puede ser sometido a contraste? En otras palabras,
hay ms datos que parmetros a estimar? O, anlogamente, disponemos de grados de
libertad suficientes? Los datos son, segn hemos visto, 21, mientras que los parmetros a
estimar son los siguientes:

1 covarianza entre los factores comunes
2 varianzas de los factores comunes
4 coeficientes de regresin entre las variables observadas y los factores comunes.
6 varianzas de los factores especficos (errores).

Es decir, hay 13 parmetros a estimar, con lo que tenemos 8 grados de libertad, dado que el
nmero de datos es 21. Por tanto, el modelo puede someterse a contraste. A continuacin
aprovecharemos el ejemplo para presentar la sintaxis que nos permite estimarlo mediante uno
de los programas que indicbamos al comienzo del captulo, concretamente, el EQS.

El EQS se basa en la notacin de Bentler y Weeks (1980) que se limita a distinguir entre
variables dependientes e independientes en el AFC. Una variable ser independiente cuando
de ella slo salga una flecha causal y ser dependiente si recibe alguna. Este programa denota
como V
i
a las variables observadas, como F
i
a los factores comunes y como E
i
a los factores
13
especficos. Si un parmetro se ha de estimar, aparece sealado con un asterisco en la
ecuacin correspondiente y si se ha fijado que toma un valor determinado, se indica
expresamente. Las covarianzas, de no especificarse, se suponen que son nulas.

El cuadro 13.2 muestra la sintaxis del EQS para estimar el modelo de AFC, tal y como se ha
especificado en la figura 13.4.

Cuadro 13.2 Sintaxis de EQS para el problema de AFC

Bajo el apartado de /SPECIFICATIONS se refleja la siguiente informacin: el nmero de
casos, (CASE=275, tal y como se indic en el cuadro 13.1 que recoga los datos originales);
numero de variables observadas (VAR=6); la seleccin de mxima verosimilitud como
mtodo de estimacin
3
(ME=ML); indicacin de que la matriz de datos suministrada es una
matriz de correlaciones (MA=COR); e indicacin de que el anlisis se efecte sobre la matriz
de varianzas covarianzas (ANAL=COV). Estas dos ltimas instrucciones tienen dos
implicaciones: en primer lugar, es necesario suministrar al programa la matriz de

3
En el epgrafe siguiente se examinarn los mtodos de estimacin
/TITLE
CFA INTELIGENCIA VERBAL Y CUANTITATIVA

/SPECIFICATIONS
CASE=275; VAR=6; ME=ML; MA=COR; ANAL=COV;

/MATRIX
1.000
0.493 1.000
0.401 0.314 1.000
0.278 0.347 0.147 1.000
0.317 0.318 0.183 0.587 1.000
0.284 0.327 0.179 0.463 0.453 1.000

/STANDARD DEVIATIONS
1.0900 0.5900 0.9800 1.1000 0.4100 1.1100

/LABELS
V1=L; V2=FSF; V3=H; V4=M; V5=FSC; V6=Q;
F1=IV; F2=IQ;

/EQUATIONS
V1= F1+E1;
V2=*F1+E2;
V3=*F1+E3;
V4= F2+E4;
V5=*F2+E5;
V6=*F2+E6;

/VARIANCES
F1 TO F2=*;
E1 TO E6=*;

/PRINT
EFFECT=YES;
FIT=ALL;

/COVARIANCES
F1 TO F2=*;

/LMTEST
/WTEST

/END
14
correlaciones, lo que se hace bajo el apartado /MATRIZ y, en segundo lugar, para que el EQS
realice el anlisis en trminos de matriz de varianzas covarianzas es necesario ofrecerle las
desviaciones tpicas de las variables observadas (/STANDARD DEVIATIONS).

El planteamiento de las ecuaciones se hace en el apartado /EQUATIONS. Puede comprobarse
que las variables observadas son dependientes siendo explicadas por los factores comunes (F
i
)
y por los especficos (E
i
). As, la primera ecuacin:

V1=F1+E1

La anterior ecuacin recoge la particularidad de que el parmetro de F1 (
1
, en la notacin
anterior) es 1, porque se ha fijado a este valor tal y como se ve en la figura 13.4 (
11
=1) y lo
mismo ocurre con el parmetro del trmino de error E1. En cambio, en la segunda ecuacin:

V2=*F1+E2

el coeficiente del trmino de error sigue estando fijado a 1, pero es necesario estimar el
parmetro de F1 (
21
=*).

Todas las varianzas, tanto de los factores especficos como de los comunes han de estimarse,
tal como indica la instruccin /VARIANCES y lo mismo ocurre con las covarianzas ente los
factores comunes F1 y F2 (as lo indica la instruccin / COVARIANCES). As pues, queda
comprobada la sencillez de la sintaxis del programa cuando seguimos la notacin de Bentler y
Weeks (1980), dado que todo se reduce a distinguir entre variables dependientes e
independientes, lo que permite deducir de manera natural las ecuaciones. Las dos ltimas
instrucciones (/LMTEST y /WTEST) las analizaremos ms adelante. En el epgrafe siguiente,
que dedicamos a la estimacin del modelo, comentaremos las salidas resultantes de la
ejecucin del programa EQS con la sintaxis anterior.

15
13.4 ESTIMACIN DE MODELOS EN EL AFC

A partir de lo descrito, y siguiendo a Sharma (1996), el proceso de estimacin del AFC puede
sintetizarse en los dos pasos siguientes:

1) Dada la matriz de varianzas covarianzas muestrales (S), se estiman los parmetros
del modelo factorial hipotetizado.
2) Se determina el ajuste del modelo hipotetizado. Esto es, se determina en qu
medida la matriz de varianzas covarianzas estimada (
) est prxima a la matriz de

varianzas covarianzas muestral S.

Presentaremos a continuacin algunos de los mtodos de estimacin disponibles. Profundizar
en todos ellos va ms all del alcance de este libro, y recomendamos recurrir a Bentler (1995)
para ello. Sin embargo, se ofrecern los fundamentos bsicos de cada uno de ellos.

Como hemos sealado, el investigador parte de una matriz de varianzas y covarianzas
muestral S. Como ya se ha indicado, la matriz de varianzas y covarianzas poblacional
, condicionada al modelo (13-1), est relacionada con los parmetros poblacionales por la
conocida expresin (13-3):

= +

Estimar el modelo, supone encontrar valores, a partir de los datos muestrales, para las
matrices anteriores (que denotamos con ^) que cumplan las restricciones impuestas en el
proceso de identificacin y que hagan que la matriz de varianzas y covarianzas estimada
mediante la expresin siguiente, sea lo ms parecida posible a S:

= + (13-4)

Long (1983) ilustra el proceso de estimacin como sigue. Inicialmente existirn infinitas
matrices estimadas de , y que satisfagan la expresin anterior, pero habr que rechazar
todas aquellas soluciones que no cumplan las restricciones que se han impuesto en la
identificacin del modelo. Llamemos genricamente
*
,
*
y
*
a las matrices que s
cumplen las restricciones. Esas matrices permiten obtener una estimacin de la matriz de
varianzas covarianzas poblacional * mediante (13-4). Si esta ltima matriz est prxima a S,
entonces las estimaciones de los parmetros contenidas en
*
,
*
y
*
seran razonables en el
sentido de ser consistentes con los datos de S.

Necesitamos una funcin, a la que denominamos una funcin de ajuste, que nos indique en
qu medida
*
est prxima a S. Long (1983) denota a estas funciones de ajuste con la
expresin F(S;
*
) y estn definidas para todas las matrices que cumplen las restricciones
marcadas en la identificacin del modelo. Si entre dos matrices que cumplen esta condicin se
verifica que F(S;
1
) < F(S;
2
), entonces concluiremos que

1
est ms prxima a S que

2
. Consecuentemente, aquellos valores de

*
,
*
y
*
que minimizan el valor de F(S;
*
)
sern las estimaciones de los parmetros poblacionales finales

y , .
Los procedimientos de estimacin que vamos a describir a continuacin son los siguientes:
mnimos cuadrados no ponderados, mnimos cuadrados generalizados, mxima verosimilitud,
16
estimacin por la teora de la distribucin elptica y estimacin con libre distribucin
asinttica.

13.4.1 Estimacin por mnimos cuadrados no ponderados

La estimacin por mnimos cuadrados no ponderados ULS (Unweighted Least Squares) toma
como estimadores a los valores que minimizan la siguiente funcin de ajuste:

( ) ( )
2
*
1
2
ULS
F tr

=

S
; (13-5)

donde por tr indicamos la traza de la matriz resultante de la operacin subsiguiente, esto es, la
suma de los elementos de su diagonal. Long (1983) y Ullman (1996) indican que este mtodo
tiene dos limitaciones que hacen que no sea muy utilizado. En primer lugar, no existen
contrastes estadsticos asociados a este tipo de estimacin y, en segundo lugar, los
estimadores dependen de la escala de medida de las variables observadas, esto es, no se
alcanzara el mismo mnimo de (13-5) si las unidades del nivel de renta, por ejemplo,
estuviera medida en pesetas que si lo estuviera en millones.

Este mtodo tiene, sin embargo, algunas ventajas. As, no es necesario asumir ningn tipo de
distribucin terica de las variables observadas, frente a la hiptesis de normalidad
multivariante que asumen otros mtodos de estimacin. Por ello, si la violacin de esta
hiptesis fuera muy evidente, algunos autores recomiendan recurrir a la estimacin por este
mtodo, pero tomando como datos de partida la matriz de varianzas covarianzas estandarizada
o matriz de correlaciones - para corregir el problema de la dependencia de las unidades de
medida.

13.4.2 Estimacin por mnimos cuadrados generalizados

La estimacin por mnimos cuadrados generalizados GLS (Generalized Least Squares) se
basa en ponderar la matriz cuya traza se calcula en (13-5) mediante la inversa de matriz de
varianzas covarianzas muestral, esto es:

( ) ( )
2
* * 1
1
;
2
GLS
F tr

=

S S S (13-6)

13.4.3 Estimacin por mxima verosimilitud

La estimacin por mxima verosimilitud ML (Maximum Likelihood) implica minimizar la
siguiente funcin de ajuste:

( ) ( )
* * 1 *
; log log
ML
F tr q
= +

S S S (13-7)

donde toda la notacin es conocida, salvo q que es el nmero de variables observadas y el
hecho de denotar como | | al determinante de la matriz de referencia. Como seala Long
(1983) cuanto ms se aproximen las matrices S y
*
, ms se aproximar el producto S
*1
a la
matriz identidad qq. Como la traza de esa matriz identidad es la suma de los q unos de la
17
diagonal (o sea, q), el primer trmino de (13-7) se aproximar a q cuando las matrices estn
prximas, compensndose con el trmino q de (13-7). Por otra parte, la diferencia de los
logaritmos de los determinantes de S y
*
tender a 0, dado que, cuando las matrices estn
prximas, tambin lo estarn sus determinantes. De esta forma, cuando las matrices sean
iguales la funcin de ajuste ser cero.

13.4.4 Estimacin por la teora de la distribucin elptica

La estimacin EDT (Elliptical Distribution Theory) se basa en la distribucin de probabilidad
de este nombre. La distribucin normal multivariante es un caso particular de esta familia con
parmetro de curtosis
4
igual a cero. En este caso, la funcin a minimizar adopta la forma:

( )
( )
( ) ( )
2 2
1
* * 1 * 1
1
; 1
2
EDT
F tr tr

= +

S S W S W (13-8)

siendo y funciones de curtosis y W cualquier estimador consistente de .

13.4.5 Estimacin con libre distribucin asinttica

La estimacin ADF (Asymptotically Distribution Free) minimiza una funcin definida
mediante la siguiente expresin:

( ) ( ) [ ] ( ) [ ]
* 1
;
ADF
F
= S s W s (13-9)

donde s es el vector de datos, es decir, la matriz de varianzas covarianzas muestrales pero
escrita en forma de un solo vector; es el la matriz de varianzas covarianzas estimada, de
nuevo puesta en forma de vector y donde con el trmino () se ha querido indicar que se
deriva de los parmetros del modelo (coeficientes de regresin, varianzas y covarianzas). W
es una matriz que pondera las diferencias cuadrticas entre las matrices de varianzas y
covarianzas muestrales y estimadas. En este caso, cada elemento de esa matriz se obtiene:

ijkl ijkl ij kl
w =

siendo
ijkl
momentos de 4 orden y
ij
y
kl
las covarianzas.

13.4.6 Comparacin de los distintos procedimientos de estimacin

Resumimos a continuacin los resultados del trabajo de Hu, Bentler y Kano (1992), que
analizaron mediante simulacin de Monte Carlo cmo se comportaban los distintos
procedimientos de estimacin ante distintos tamaos muestrales, violacin de las hiptesis de
normalidad y de independencia entre los trminos de error y los factores comunes.

Estos autores encontraron que, en caso de que fuera razonable asumir la normalidad, el
mtodo ML funcionaba mejor cuando el tamao muestral era superior a 500, mientras que

4
El coeficiente de curtosis de una distribucin es igual al coeficiente estandarizado de cuarto orden menos 3.
18
para tamaos inferiores a esa cifra tena un mejor comportamiento el mtodo EDT.
Finalmente, el mtodo ADF slo ofreca buenos resultados con muestras superiores a 2500
casos.

Cuando el supuesto de normalidad se violaba, los mtodos de ML y GLS solo daban buenos
resultados con muestras superiores a 2500 casos, aunque el GLS funcionaba algo mejor que el
ML en muestras inferiores. Pese a no adoptar el supuesto de normalidad, el mtodo ADF
tampoco daba buenos resultados con muestras inferiores a 2500 casos.

Cuando se produce una violacin del supuesto de independencia entre los trminos de error y
los factores comunes, los mtodos de ML y GLS funcionan muy mal, y tambin el ADF salvo
que la muestra fuera superior a 2500 casos. En cambio, el EDT funcionaba significativamente
mejor que los dems.

A la luz de lo expuesto, Ullman (1996) recomienda:

Los mtodos de ML y GLS son la mejor opcin con pequeas muestras siempre que
sea plausible la asuncin de normalidad e independencia.
En el caso en que ambos supuestos no parezcan razonables, se recomienda recurrir a la
estimacin ML denominada escalada. Una descripcin de este procedimiento se
encuentra en Bentler (1980) y es una opcin de estimacin del EQS.

Veamos, a modo de ilustracin, el resultado de estimar mediante mxima verosimilitud las
matrices de (13-4). Para facilitar la familiarizacin con el EQS se ha seleccionado la parte del
output resultante de aplicar la sintaxis recogida en el cuadro 13.2 que contiene esta
informacin.

En primer lugar, el programa ofrece la matriz S de varianzas covarianzas muestrales (cuadro
13.3). Como se seal al comentar la sintaxis, al programa se le ha suministrado una matriz de
correlaciones y las desviaciones tpicas de las variables observadas. A partir de esta
informacin el programa calcula la matriz de varianzas covarianzas muestral.

Cuadro 13.3 Matriz S de varianzas covarianzas muestrales

La matriz , que contiene los coeficientes de regresin entre las variables observadas y los
factores comunes, se obtiene directamente de las ecuaciones que el EQS denomina ecuaciones
de medida y que se recogen en el cuadro 13.4. En estas ecuaciones aparecen tambin los
estadsticos para contrastes de significatividad de cada coeficiente, as como los errores
estndar, cuya interpretacin se ofrecer ms adelante.

L FSF H M FSC Q
V 1 V 2 V 3 V 4 V 5 V 6

L V 1 1.188
FSF V 2 0.317 0.348
H V 3 0.428 0.182 0.960
M V 4 0.333 0.225 0.158 1.210
FSC V 5 0.142 0.077 0.074 0.265 0.168
Q V 6 0.344 0.214 0.195 0.565 0.206 1.232
19
De este cuadro se deduce directamente que la estimacin de es la siguiente
5
:

1 0
0, 509 0
0, 604 0
0 1
0 0, 373
0 0,817

=

Cuadro 13.4 Matriz de coeficientes de regresin

La estimacin de (matriz de varianzas covarianzas de los factores comunes) aparece
separada en dos elementos de la salida del EQS (ambas recogidas en el cuadro 13.5):
varianzas entre las variables independientes y covarianzas entre las variables
independientes. De esta salida se obtiene que la estimacin de la mencionada matriz es:

0, 636 0, 388
0, 388 0, 698

=

Cuadro 13.5 Matriz estimada de varianzas covarianzas entre factores comunes

5
Los subrayados indican que ese parmetro se fijo al valor sealado durante la identificacin del modelo.
MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS

L =V1 = 1.000 F1 + 1.000 E1

FSF =V2 = .509*F1 + 1.000 E2
.068
7.467

H =V3 = .604*F1 + 1.000 E3
.096
6.319

M =V4 = 1.000 F2 + 1.000 E4

FSC =V5 = .373*F2 + 1.000 E5
.039
9.467

Q =V6 = .817*F2 + 1.000 E6
.096
8.552
20

Finalmente resta por obtener la estimacin de la matriz , que contiene las varianzas y
covarianzas entre los factores especficos o trminos de error. Si se observa la figura 13.4, se
comprueba que, durante la identificacin del modelo, todas las covarianzas se fijaron a 0
(como se indica con un subrayado en la matriz que se muestra a continuacin), por lo que slo
se han estimado las varianzas. El cuadro 13.6 ofrece la informacin que nos permite obtener
la estimacin de la matriz :

0, 552 0 0 0 0 0
0 0,183 0 0 0 0
0 0 0, 728 0 0 0
0 0 0 0, 512 0 0
0 0 0 0 0, 071 0
0 0 0 0 0 0, 767

=

Basta operar matricialmente de acuerdo con la expresin (13-4) para obtener la estimacin de
la matriz de varianzas covarianzas poblacional (el EQS no la ofrece):

1,188
0, 324 0, 348
0, 384 0,196 0, 960
0, 388 0,197 0, 234 1, 210

0,145 0, 074 0, 087 0, 260 0,168
0, 317 0,161 0,191 0, 570 0, 213 1, 232

=

(13-10)

VARIANCES OF INDEPENDENT VARIABLES
----------------------------------

V F
--- ---
I F1 - IV .636*I
I .117 I
I 5.443 I
I I
I F2 - IQ .698*I
I .112 I
I 6.244 I
I I

COVARIANCES AMONG INDEPENDENT VARIABLES
---------------------------------------

V F
--- ---
I F2 - IQ .388*I
I F1 - IV .068 I
I 5.712 I
I I
21
Cuadro 13.6 Matriz estimada de varianzas covarianzas entre factores especficos

La diferencia entre la matriz de varianzas covarianzas muestral S y la matriz de varianzas y
covarianzas poblacional estimada recogida en (13-10) es la denominada matriz residual de
covarianzas. Esta matriz nos indica en qu medida el modelo ha sido capaz de ajustarse a los
datos. Para que el ajuste sea bueno, los valores de cada uno de sus elementos deben ser
pequeos. El EQS ofrece esta matriz tal y como la recogemos en el cuadro 13.7.

Cuadro 13.7 Matriz residual de varianzas covarianzas

13.5 BONDAD DE AJUSTE DEL MODELO ESTIMADO

Antes de pasar a interpretar los resultados del anlisis factorial confirmatorio que se ha
efectuado, es necesario determinar hasta qu punto el modelo asumido se ajusta a los datos
muestrales. Si detectramos problemas de ajuste, sera necesario plantear algn tipo de
VARIANCES OF INDEPENDENT VARIABLES
----------------------------------

E D
--- ---
E1 - L .552*I I
.088 I I
6.256 I I
I I
E2 - FSF .183*I I
.025 I I
7.294 I I
I I
E3 - H .728*I I
.071 I I
10.281 I I
I I
E4 - M .512*I I
.075 I I
6.828 I I
I I
E5 - FSC .071*I I
.010 I I
6.807 I I
I I
E6 - Q .767*I I
.079 I I
9.655 I I
I I

RESIDUAL COVARIANCE MATRIX (S-SIGMA) :

L FSF H M FSC Q
V 1 V 2 V 3 V 4 V 5 V 6
L V 1 0.000
FSF V 2 -0.007 0.000
H V 3 0.044 -0.014 0.000
M V 4 -0.055 0.028 -0.076 0.000
FSC V 5 -0.003 0.003 -0.014 0.004 0.000
Q V 6 0.027 0.053 0.003 -0.005 -0.006 0.000

AVERAGE ABSOLUTE COVARIANCE RESIDUALS =
0.0163
AVERAGE OFF-DIAGONAL ABSOLUTE COVARIANCE RESIDUALS = 0.0228

22
reespecificacin del mismo hasta que se lograra un mejor ajuste. Analizaremos, a
continuacin, una serie de criterios que se calculan en la mayor parte de programas que
abordan este tema. Como ya avanzamos, los estadsticos elaborados con esta finalidad son
muchos ms de que los que aqu se muestran. La seleccin efectuada recoge, desde nuestro
punto de vista, los ms utilizados.

13.5.1 Matriz residual de covarianzas

Como indicbamos al presentar los distintos mtodos de estimacin del AFC, el objetivo
bsico de los mismos es que la matriz de covarianzas poblacional estimada se parezca lo ms
posible a la muestral S. En otros trminos, puede expresarse lo anterior diciendo que la
diferencia entre ambas matrices, a la que llamamos matriz residual de covarianzas, est lo ms
cercana posible a una matriz nula 0. Los valores de esta matriz deberan ser pequeos y estar
homogneamente distribuidos. Como seala Byrne (1994), residuos grandes asociados a
algunos parmetros, podran indicar que han sido ml especificados, y ello afectara
negativamente al ajuste global del modelo. El EQS proporciona la matriz residual de
covarianzas recogida en el cuadro 13.7, as como su versin estandarizada que mostramos en
el cuadro 13.8. En ambos casos calcula los promedios de estos residuos teniendo en cuenta los
elementos de la diagonal y obvindolos. Este segundo promedio se justifica porque,
normalmente, son los elementos de fuera de la diagonal los que tienen ms influencia sobre el
estadstico
2
que mostraremos ms adelante (Bentler, 1995).
23

Cuadro 13.8 Matriz residual estandarizada de varianzas covarianzas y otra informacin relacionada

Asimismo, el programa ordena de mayor a menor los 20 residuos estandarizados ms grandes
en valor absoluto, de tal manera que puedan identificarse las variables con mayores errores.
Finalmente, muestra un grfico con la distribucin de estos residuos, distribucin que debera
ser simtrica y centrada en cero.

Examinando los resultados de nuestro ejemplo en concreto, observamos que el error promedio
de los elementos fuera de la diagonal es pequeo (0.0282), indicando un buen ajuste. El
elemento que muestra un mayor residuo es el asociado a las variables V2 y V6 (notas en
qumica y filosofa), pudiendo indicar una mala especificacin, lo que ser analizado
posteriormente para comprobar si procede su reespecificacin. Finalmente comprobamos que
STANDARDIZED RESIDUAL MATRIX:

L FSF H M FSC Q
V 1 V 2 V 3 V 4 V 5 V 6
L V 1 0.000
FSF V 2 -0.011 0.000
H V 3 0.041 -0.024 0.000
M V 4 -0.046 0.043 -0.070 0.000
FSC V 5 -0.007 0.013 -0.035 0.010 0.000
Q V 6 0.022 0.081 0.003 -0.004 -0.014 0.000

AVERAGE ABSOLUTE STANDARDIZED RESIDUALS = 0.0201
AVERAGE OFF-DIAGONAL ABSOLUTE STANDARDIZED RESIDUALS = 0.0282

LARGEST STANDARDIZED RESIDUALS:

V 6,V 2 V 4,V 3 V 4,V 1 V 4,V 2 V 3,V 1
0.081 -0.070 -0.046 0.043 0.041

V 5,V 3 V 3,V 2 V 6,V 1 V 6,V 5 V 5,V 2
-0.035 -0.024 0.022 -0.014 0.013

V 2,V 1 V 5,V 4 V 5,V 1 V 6,V 4 V 6,V 3
-0.011 0.010 -0.007 -0.004 0.003

V 2,V 2 V 3,V 3 V 6,V 6 V 5,V 5 V 4,V 4
0.000 0.000 0.000 0.000 0.000

DISTRIBUTION OF STANDARDIZED RESIDUALS

----------------------------------------
! !
20- -
! !
! !
! !
! ! RANGE FREQ PERCENT
15- -
! ! 1 -0.5 - -- 0 0.00%
! ! 2 -0.4 - -0.5 0 0.00%
! ! 3 -0.3 - -0.4 0 0.00%
! * ! 4 -0.2 - -0.3 0 0.00%
10- * * - 5 -0.1 - -0.2 0 0.00%
! * * ! 6 0.0 - -0.1 11 52.38%
! * * ! 7 0.1 - 0.0 10 47.62%
! * * ! 8 0.2 - 0.1 0 0.00%
! * * ! 9 0.3 - 0.2 0 0.00%
5- * * - A 0.4 - 0.3 0 0.00%
! * * ! B 0.5 - 0.4 0 0.00%
! * * ! C ++ - 0.5 0 0.00%
! * * ! -------------------------------
! * * ! TOTAL 21 100.00%
----------------------------------------
1 2 3 4 5 6 7 8 9 A B C EACH "*" REPRESENTS 1 RESIDUALS
24
el 100% de los residuos cae dentro del intervalo [0.1; 0.1] de forma prcticamente simtrica
y, como se ha sealado, centrada en cero. En sntesis, el ajuste del modelo, a partir del anlisis
de los residuos es bueno, aunque puede existir un problema debido a la interrelacin entre las
variables V2 y V6.

13.5.2 Estadsticos
2
para el contraste global del modelo

Como hemos visto anteriormente, se ha denominado a la matriz de varianzas covarianzas
del vector x condicionado al modelo (13-1); su estimacin se ha denotado por
. Por otra
parte, vamos a denominar
nc
a la matriz de varianzas covarianzas de x no condicionada al
modelo; la estimacin de esta matriz es directamente la matriz muestral S. En el caso de que
el modelo sea adecuado para explicar el comportamiento de x, ambas matrices sern iguales.
Por lo tanto, podemos establecer la siguiente hiptesis nula:

0
:
nc
H = (13-11)

La hiptesis alternativa postula que la matriz
nc
es igual a cualquier matriz que sea definida
positiva. Para el contraste de estas hiptesis en Bentler y Bonett (1980) se propone el
siguiente estadsico:

0
ML
N F

donde N es el nmero de datos y
0
ML
F es el valor que toma la funcin de ajuste (13-7) al
realizar la estimacin por mxima verosimilitud. Este estadstico se distribuye, bajo la
hiptesis nula, como una
2
con q(q+1)-k grados de libertad, siendo q el nmero de
variables independientes y k el nmero de parmetros a estimar. Si el modelo es el adecuado,
se puede esperar que se rechace la hiptesis nula planteada en este contraste. En el EQS a
este estadstico se le denomina Chi Square.

El EQS ofrece, adems, un segundo estadstico denominado independence model chi-square.
Este estadstico se distribuye tambin como una
2
bajo la hiptesis nula de que existe una
completa independencia entre las variables (matriz de correlaciones identidad). En este caso,
si el modelo es el apropiado, cabe esperar que el estadstico tome valores elevados. Por el
contrario, si todas las variables observadas fueran independientes entre s el modelo de AFC
propuesto no tendra sentido y, consecuentemente, este estadstico tomara valores bajos.

El cuadro 13.9 recoge junto a los dos estadsticos citados, otros estadsticos que miden la
bondad del ajuste que comentaremos posteriormente. Por otra parte el estadstico
2
para este
modelo en que son independientes las variables observadas es efectivamente muy alto
(392,8). Por otra parte, el estadstico
2
para contrastar la hiptesis nula (13-11) tiene 6
(6+1)-13 = 8 grados de libertad y toma el valor 8,84 con un p=0,355, lo que nos permite
aceptar la hiptesis nula de igualdad entre las matrices para los niveles usuales de
significacin. Este estadstico se utiliza, en definitiva, para contrastar la validez del modelo
terico propuesto por el investigador.

25
Cuadro 13.9 Estadsticos de bondad de ajuste

En la construccin del estadstico
2
se ha tenido en cuenta que (i) se asume la hiptesis de
normalidad de las variables observadas, (ii) el anlisis se basa en una matriz de varianzas y
covarianzas y no en una matriz de correlaciones y (iii) el tamao muestral es lo
suficientemente grande para que se justifiquen las propiedades asintticas del contraste.
Ahora bien, dado que rara vez se cumplen simultneamente estos requisitos, Bentler y Bonett
(1980), Long (1983) y Ullman (1996), entre otros, sealan que la utilizacin de este
estadstico debe efectuarse con precaucin con muestras grandes, dado que incluso pequeas
diferencias entre las matrices de covarianzas muestral y estimada sern evaluadas como
significativas por el contraste. Este limitacin ha llevado al desarrollo de ms de 30
indicadores ad hoc de bondad de ajuste (vase Marsh, Balla y McDonald, 1988; Tanaka,
1993; Browne y Cudeck, 1993 o Williams y Holahan, 1994 para una revisin de los mismos),
algunos de los cuales se mostrarn a continuacin.

13.5.2 Estadsticos ad hoc

Un primer grupo de estadsticos se correspondera con los denominados por Ullman (1996)
ndices comparativos de ajuste. Los distintos modelos que se pueden plantear en un AFC van
desde el que hemos denominado modelo independiente (variables sin ninguna relacin) y que
tendra tantos grados de libertad como el nmero de datos menos el de varianzas que se han
de estimar, hasta el llamado modelo saturado, con ningn grado de libertad. Los ndices que
se proponen son comparativos en el sentido de que comparan el valor del modelo terico que
se evala, con el del modelo independiente.

ndice NFI

El ndice NFI (Normed Fit Index) ha sido propuesto por Bentler y Bonnett (1980) y compara
el valor del estadstico
2
del modelo terico con el del modelo independiente:

2 2
2
indep teorico
indep
NFI

=

GOODNESS OF FIT SUMMARY

INDEPENDENCE MODEL CHI-SQUARE = 392.818 ON 15 DEGREES OF FREEDOM

INDEPENDENCE AIC = 362.81793 INDEPENDENCE CAIC = 293.56637
MODEL AIC = -7.15793 MODEL CAIC = -44.09210

CHI-SQUARE = 8.842 BASED ON 8 DEGREES OF FREEDOM
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS 0.35579
THE NORMAL THEORY RLS CHI-SQUARE FOR THIS ML SOLUTION IS 9.157.

BENTLER-BONETT NORMED FIT INDEX= 0.977
BENTLER-BONETT NONNORMED FIT INDEX= 0.996
COMPARATIVE FIT INDEX (CFI) = 0.998
BOLLEN (IFI) FIT INDEX= 0.998
McDonald (MFI) FIT INDEX= 0.998
LISREL GFI FIT INDEX= 0.989
LISREL AGFI FIT INDEX= 0.971
ROOT MEAN SQUARED RESIDUAL (RMR) = 0.027
STANDARDIZED RMR = 0.044
ROOT MEAN SQ. ERROR OF APP.(RMSEA)= 0.020
90% CONFIDENCE INTERVAL OF RMSEA ( 0.000, 0.075)
26
Para que sea satisfactorio este estadstico, como la mayor parte de los que examinaremos a
continuacin, debe alcanzar valores superiores a 0,90 (Bentler, 1992).

En nuestro ejemplo, como puede comprobarse en el cuadro 13.9, su valor es el siguiente:

392, 81 8, 84
0, 977
392, 81
NFI

= =

Algunos trabajos han demostrado que este ndice tiene una tendencia a subestimar el ajuste
del modelo si las muestras son pequeas (Bearden, Sharma y Teel, 1982), llevando a sus
autores a plantear dos modificaciones del mismo, el ndice NNFI y el CFI.

ndice NNFI

El Nonnormed Fit Index (NNFI) incorpora los grados de libertad de los modelos terico e
independiente y aunque se evita as la subestimacin del ajuste, puede provocar en algunos
casos extremos valores fuera del rango 0-1. Otra limitacin es que, en pequeas muestras,
puede indicar un ajuste excesivamente bajo si se compara con otros modelos, tal y como
apuntan Ullman (1996) y Anderson y Gerbing (1984).

2 2
2
indep
indep teorico
teorico
indep indep
gl
gl
NNFI
gl

En el ejemplo que nos ocupa, y tomando la informacin del cuadro 13.9, este estadstico
ofrece tambin un buen ajuste:

15
392, 81 8,84
8
0, 996
392,81 15
NNFI

= =

ndice CFI

Este ndice (Comparative Fit Index), propuesto por Bentler (1988), corrige por el nmero de
grados de libertad del siguiente modo:

( ) ( )
( )
2 2
2
indep indep teorico teorico
indep indep
gl gl
CFI
gl

En nuestro ejemplo este ndice tambin toma un valor satisfactorio:

( ) ( )
( )
392, 81 15 8.84 8
0, 998
392, 81 15
CFI

= =

27

ndice IFI

Propuesto por Bollen (1989), pretende corregir la posibilidad de que el NNFI tome valores
por encima del intervalo razonable 0-1. Para ello se formula as:

2 2
2
indep teorico
indep teorico
IFI
gl

En nuestro ejemplo este ndice tambin alcanza valores de ajuste razonables. A partir de la
informacin del cuadro 13.9, se obtiene el siguiente valor:

392, 81 8, 84
0, 998
392, 81 8
IFI

= =

ndice MFI

Propuesto por McDonald y Marsh (1990), el ndice MFI entrara en los denominados ndices
de ajuste absoluto en contraposicin a los anteriores que hemos denominado comparativos,
por basarse en poner en relacin el modelo terico con el independiente. El MFI solo toma en
consideracin la
2
del modelo terico y responde a la expresin siguiente:

2
1
2
teorico teorico
gl
N
MFI e

=

donde toda la notacin es conocida salvo N que indica el tamao de la muestra. Con los datos
del cuadro 13.9 se comprueba que:

1 8,84 8
2 275
0, 998 MFI e

= =

ndice GFI

Ullman (1996) denomina a este ndice y al AGFI que, como se ver, es una sencilla
correccin de aquel, ndices de proporcin de varianza. El ndice GFI (Goodness of Fit Index)
es una ratio entre los elementos ponderados de la matriz de covarianzas poblacional estimada
y los elementos ponderados de la matriz de covarianzas muestral. Concretamente, su
expresin es la siguiente:

( )
( )

tr
GFI
tr

=
W
s Ws

donde el vector contiene las varianzas de la matriz de covarianzas estimada y el vector s las
de la matriz muestral. La matriz W es una matriz de ponderacin que vara en funcin del
mtodo de estimacin elegido: la matriz identidad en el ULS, la matriz de covarianzas
muestral en el GLS, la inversa de la matriz de covarianzas estimada en el ML, etctera. Segn
puede verse en el cuadro 13.9, este estadstico toma el valor 0,981.
28

ndice AGFI

El Adjusted Goodness of Fit Index (AGFI) es una correccin del anterior que se hace en
funcin del nmero de parmetros que se han de estimar (a los que denominanmos k) y el
nmero de datos disponibles (a los que denominamos d). Esta correccin adopta la forma:

1
1
1
GFI
AGFI
k
d

En nuestro ejemplo, con la informacin del cuadro 13.9, y recordando que se dispona de 21
datos y 13 parmetros a estimar, el valor del estadstico es el siguiente:

1 0, 989
1 0, 971
13
1
21
AGFI

= =

ndice AIC

Este ndice, denominado Akaike Information Criterion (Akaike, 1987) forma parte de un
nuevo grupo que Ullman (1996) denomina ndices de grado de parsimonia, por cuanto tienen
en cuenta no solamente la bondad de ajuste estadstico sino tambin el nmero de parmetros
a estimar. Su expresin adopta la forma:

2
2
teorico teorico
AIC gl =

Para nuestro ejemplo, con la informacin del cuadro 4.9 se obtiene el siguiente valor:

8,84 2 8 7,15 AIC = =

Qu valor debe tomar este ndice? Ullman (1996) seala que lo suficientemente bajo pero,
dado que no est normalizado a un intervalo 0-1, suficientemente bajo solo puede
entenderse en trminos comparativos con otros modelos tericos, es decir, servir como
indicador para sealar si el modelo que hemos contrastado es mejor o peor que otro modelo
contrastado previamente, pero no ofrece un nivel de ajuste absoluto. Esta es la razn de que
siempre vaya acompaado por el AIC del modelo independiente, que se supone que es la base
que cualquier modelo terico debe mejorar y cuanto mayor sea la diferencia del valor del AIC
del modelo comparado con el valor correspondiente independiente, tanto mejor. En nuestro
ejemplo lo mejora muy claramente, dado que el AIC en el modelo independiente toma el
valor:

392,81 2 15 362,81 AIC = =

ndice CAIC

El Consistent AIC (CAIC) es la correccin propuesta por Bozdogan (1987) al AIC, siendo
vlidos todos los comentarios efectuados para este ltimo. Su expresin es la siguiente:

29
( )
2
ln 1
teorico teorico
CAIC N gl = +

En nuestro ejemplo, como puede verse en el cuadro 13.9, toma el siguiente valor:

( ) 8, 84 ln 275 1 8 44, 09 CAIC = + =

que debe compararse con el CAIC del modelo independiente:

( ) 392, 81 ln 275 1 15 293, 56 CAIC = + =

ndice RMR

El ltimo grupo de ndices que analizaremos son los que Ullman (1996) denomina basados en
los residuos que no son sino un promedio de las diferencias entre las varianzas y covarianzas
muestrales y las estimadas que se derivan del modelo. Esto es:

( )
( )
2
1 1
1 / 2
q i
ij ij
i j
s
RMR
q q
= =
=
+

donde toda la notacin es conocida, pero recordemos que q era el nmero de variables
observadas. En nuestro ejemplo este ndice toma el valor de 0.027.

Como los residuos sin estandarizar estn afectados por la escala en que se mide la variable, se
suelen utilizar los residuos estandarizados construyndose el llamado SRMR (Standardized
RMR) que est acotado entre 0 y 1, siendo recomendables valores inferiores a 0,05. Como
puede verse en el cuadro 13.9, el ndice SRMR se sita ligeramente por debajo de 0,05
(0,044).

13.5.3 Convergencia en el proceso de estimacin

Byrne (1994) plantea que, en cuanto que la estimacin del modelo es un proceso iterativo, el
hecho de que el algoritmo converja de una manera rpida, es indicador de un buen ajuste del
modelo. La autora considera que, si despus de dos o tres iteraciones, el cambio medio en las
estimaciones de los parmetros se estabiliza en valores muy bajos, estaremos probablemente
ante un ajuste adecuado.

El EQS ofrece (cuadro 13.10) la informacin del nmero de iteraciones que han sido
necesarias para la convergencia y el cambio medio en los parmetros en cada una de ellas
(parameter abs change). Puede comprobarse como, efectivamente, esta convergencia se ha
producido en apenas 6 iteraciones y cmo, a partir de la tercera, los cambios han sido
mnimos.

30

Cuadro 13.10 Historial de iteraciones

Al presentar los distintos ndices de ajuste, hemos podido comprobar que en el modelo que
hemos tomado como ejemplo se ha obtenido un buen ajuste a los datos. Llegados a este
punto, vamos a analizar e interpretar los resultados que hemos mostrado.

13.6 INTERPRETACIN DEL MODELO

Hasta este momento nos hemos centrado en analizar la razonabilidad del modelo en trminos
globales (su ajuste). Ahora vamos a examinar si los estimadores de los parmetros son
tambin razonables en dos sentidos: (i) toman valores adecuados tericamente? y (ii) son
significativos?.

La mayor parte de la informacin necesaria para esta fase, ya se ha mostrado en los cuadros
13.4, 13.5 y 13.6 y a ellos referiremos nuestros comentarios.

En primer lugar, vamos a analizar si los valores que toman los parmetros estimados son o no
compatibles con el modelo estadstico. Para que exista tal compatibilidad las respuestas a las
siguientes preguntas deben ser en todos casos negativas:

Existen correlaciones superiores a la unidad?
Existen cargas factoriales estandarizadas fuera del intervalo 1,+1?
Son los residuos estandarizados anormalmente grandes o pequeos?
Hay estimaciones negativas de las varianzas?

Si hubiera respuestas no negativas, y aunque el ajuste global del modelo fuera ptimo,
estaramos ante un indicador claro de que (Long, 1983) esta incompatibilidad puede haberse
originado por uno o ms de los siguientes motivos:

1. El modelo est mal especificado.
2. Los datos no respaldan la hiptesis de normalidad multivariante de las variables
observadas
3. La muestra es demasiado pequea
4. El modelo est demasiado cerca de no estar identificado, lo que hace la estimacin de
algunos parmetros difcil o inestable.
5. Los valores perdidos de algunas variables observadas han provocado que cada
elemento de la matriz de covarianzas muestral est calculado sobre una muestra
diferente.
ITERATIVE SUMMARY

PARAMETER
ITERATION ABS CHANGE ALPHA FUNCTION
1 0.298689 1.00000 0.88599
2 0.124292 1.00000 0.10692
3 0.026794 1.00000 0.03287
4 0.008439 1.00000 0.03231
5 0.001469 1.00000 0.03227
6 0.000443 1.00000 0.03227
31

Si se revisan los cuadros 13.4 a 13.6 se puede comprobar que, en el modelo del ejemplo, no se
presenta ninguna de las incompatibilidades sealadas.

La segunda cuestin que debemos examinar es la significatividad estadstica de cada
parmetro individual. Centraremos la explicacin en los coeficientes de regresin entre
variables observadas y factores comunes, aunque lo expuesto es vlido para el resto de
parmetros (varianzas y covarianzas).

Si tomamos, por ejemplo, la segunda ecuacin del cuadro 13.4, comprobamos que aparecen
las tres lneas que estn reproducidas en el cuadro 13.11. La primera de ellas ofrece la
ecuacin correspondiente a la variable observada calificacin en Filosofa (FSF o V2). Esta
ecuacin se expresa como una combinacin lineal del factor comn inteligencia verbal (F1)
multiplicado por el coeficiente de regresin estimado (0,509) y un error de medida (E2).

Cuadro 13.11 Ecuacin con errores estndar y estadstico t

En la segunda lnea aparece el error estndar (0,068) y el estadstico t (coeficiente/error
estndar = 7.467) que permite contrastar la hiptesis nula de que el parmetro es nulo.
Aunque la significatividad depende de los grados de libertad, para una muestra de un tamao
mayor de 60, valores superiores a 1,96 permiten rechazar dicha hiptesis nula para un nivel
de significacin 0,05, o superiores a 2,56 para 0,01. La carga factorial (o coeficiente
de regresin) es, pues, significativa en este caso, as como en el resto de los coeficientes que
aparecen en el cuadro 13.4.

Es habitual ofrecer, sobre todo en la publicacin de los resultados, la solucin estandarizada
del AFC, esto es, aquella en que se recalculan los estimadores para asegurar que las varianzas
de los factores comunes y de las variables observadas son igual a la unidad. Esto se hace,
bsicamente, para facilitar la comparacin de los resultados con trabajos precedentes. Esta
informacin, tal como la proporciona el EQS, se recoge en el cuadro 13.12 para las
ecuaciones fundamentales (estimacin de las coeficientes de regresin de los factores
comunes y de los factores especficos), y las correlaciones entre los factores comunes.
FSF =V2 = .509*F1 + 1.000 E2
.068
7.467
32

Cuadro 13.12 Solucin estandarizada

Esta informacin se suele presentar grficamente tal y como se recoge en la figura 13.5.

Figura 13.5 Modelo AFC estimado
x1 x2 x3 x4 x5 x6
1
1 2
2 3 4 5 6
0,582
0,732 0,688 0,492 0,759 0,760 0,615
0,682 0,725 0,871 0,651 0,650 0,789

STANDARDIZED SOLUTION:

L =V1 = .732 F1 + .682 E1
FSF =V2 = .688*F1 + .725 E2
H =V3 = .492*F1 + .871 E3
M =V4 = .759 F2 + .651 E4
FSC =V5 = .760*F2 + .650 E5
Q =V6 = .615*F2 + .789 E6

CORRELATIONS AMONG INDEPENDENT VARIABLES
---------------------------------------

V F
--- ---
I F2 - IQ .582*I
I F1 - IV I
I I

33

13.7 REESPECIFICACIN DEL MODELO

Como seala Ullman (1996), existen bsicamente dos motivos para reespecificar un modelo
(esto es, eliminar o introducir relaciones entre las variables que los conforman): (i) mejorar su
ajuste o (ii) contrastar alguna hiptesis terica. Existen, sin embargo, muchos problemas que
pueden generarse como consecuencia de una reespecificacin poco meditada. Como veremos
a continuacin, existen dos instrumentos analticos el contraste del multiplicador de
Lagrange y el contraste de Wald que nos indican qu relaciones causales pueden aadirse o
eliminarse y qu mejoras en el ajuste obtendramos con cada una de esta modificaciones. Si el
investigador cae en la tentacin de ir incorporando o eliminando relaciones sin ms, hasta
lograr un ajuste razonable y no tiene en cuenta si estas modificaciones estn o no soportadas
por el marco terico que sustenta su investigacin, puede provocarse que el modelo al que se
llega no sea en absoluto generalizable (McCallumn, Roznowski y Necowitz, 1992).

En este mismo sentido, Pedhazur (1982) y Sorbom (1989) afirman que es cientficamente
incorrecto modificar un modelo simplemente porque mejore su ajuste, ya que el cambio debe
ser tericamente interpretable y el investigador debe ser capaz de justificar cul es el motivo
para aadir una relacin causal determinada.

Todo lo expuesto lleva a Hatcher (1994) a plantear las siguientes recomendaciones para la
modificacin de un modelo, aunque la mayora se basan en el trabajo de McCallumn,
Roznowski y Necowitz (1992):

1. Utilizar muestras grandes. Los modelos basados en menos de 100 o 150 casos llevan
a modelos finales poco estables si las modificaciones se basan en los datos y no en la
teora.
2. Hacer pocas modificaciones. Es posible que las primeras modificaciones puedan estar
derivadas de un modelo que refleje las relaciones poblacionales; las siguientes,
probablemente, reflejarn relaciones especficas de la muestra.
3. Realizar solo aquellos cambios que puedan ser interpretados desde una perspectiva
terica o tengan soporte en trabajos precedentes. En todo caso, se deben detallar todos
los cambios realizados sobre el modelo inicial en el informe del trabajo final.
4. Seguir un procedimiento paralelo de especificacin. Siempre que sea posible, el
investigador debera trabajar con dos muestras independientes. Si las dos muestras
desembocan en las mismas modificaciones del modelo, se podr tener una mayor
confianza en la estabilidad del mismo.
5. Comparar modelos alternativos desde el principio. Ms que proponer un modelo e ir
modificndolo, puede ser conveniente en algunas ocasiones plantear modelos
alternativos y determinar con cul se obtiene un mejor ajuste.
6. Finalmente, describir detalladamente las limitaciones de su estudio. Como indica
Hatcher (1994), la mayora de los trabajos que se publican estn basados en una nica
muestra y sobre los que se efectan sucesivas modificaciones basadas en los datos
hasta lograr un ajuste razonable. Si se sigue este enfoque, sera recomendable que el
trabajo advirtiera al lector de todas estas circunstancias.

Una vez planteadas estas precauciones, veamos a continuacin los instrumentos de que se
dispone para reespecificar un modelo.

34
13.7.1 Significatividad de los parmetros

La primera modificacin posible, y la ms obvia, para mejorar el ajuste de un modelo es
eliminar aquellos parmetros cuyos estimadores no sean significativos de acuerdo con los
resultados de contraste t. Aunque esta accin puede que no haga disminuir el valor de la
2
, s
que puede hacer aumentar la probabilidad de que no sea significativa gracias al aumento del
valor crtico para un nivel de significacin determinado al eliminar grados de libertad (Long,
1983).

En nuestro ejemplo, tal y como se comprueba en los cuadros 13.4, 13.5 y 13.6, todos los
coeficientes estimados son significativos

13.7.2 Contraste del multiplicador de Lagrange

El contraste ML permite evaluar la mejora que se obtiene al aadir una relacin causal o una
nueva covarianza al modelo terico. Para determinar si esta mejora es estadsticamente
significativa, el estadstico lleva asociado un nivel de significacin.

El EQS ofrece dos versiones de este contraste, la univariante y la multivariante. En la
univariante se muestra el incremento que se producira en la
2
si se introdujera, por separado,
cada una de las relaciones consideradas. Esta aproximacin univariante tiene el problema de
que, al no considerar las covarianzas entre los distintos parmetros estimados, harn que
aparezcan como candidatos a aadirse al modelo y mejorar su ajuste bastantes parmetros. El
enfoque multivariante, sin embargo, identifica el parmetro que conducira a un mayor
incremento en el estadstico
2
del modelo. Despus de tener en consideracin su
introduccin, muestra el parmetro cuya inclusin causara el siguiente mayor incremento.

Cuadro 13.13 Contraste univariante del multiplicador de Lagrange

LAGRANGE MULTIPLIER TEST (FOR ADDING PARAMETERS)

ORDERED UNIVARIATE TEST STATISTICS:

NO CODE PARAMETER CHI-SQUARE PROBABILITY PARAMETER CHANGE
-- ---- --------- ---------- ----------- ----------------

1 2 6 E3,E1 4.741 0.029 0.156
2 2 12 V2,F2 4.741 0.029 0.174
3 2 6 E5,E4 2.098 0.148 0.063
4 2 12 V6,F1 2.098 0.148 0.182
5 2 6 E4,E1 1.714 0.190 -0.065
6 2 6 E4,E2 1.680 0.195 0.035
7 2 6 E2,E1 1.675 0.196 -0.091
8 2 12 V3,F2 1.675 0.196 -0.142
9 2 6 E4,E3 1.540 0.215 -0.058
10 2 6 E6,E2 1.413 0.235 0.034
11 2 12 V1,F2 1.125 0.289 -0.167
12 2 6 E3,E2 1.125 0.289 -0.039
13 2 12 V4,F1 1.000 0.317 -0.134
14 2 6 E6,E5 1.000 0.317 -0.031
15 2 6 E5,E2 0.387 0.534 -0.006
16 2 6 E5,E1 0.190 0.663 0.008
17 2 12 V5,F1 0.069 0.793 -0.013
18 2 6 E6,E4 0.069 0.793 -0.022
19 2 6 E6,E3 0.055 0.815 0.012
20 2 6 E6,E1 0.034 0.853 0.010
21 2 6 E5,E3 0.017 0.897 -0.002
22 2 0 V1,F1 0.000 1.000 0.000
23 2 0 V4,F2 0.000 1.000 0.000

35

Cuadro 13.14 Contraste multivariante del multiplicador de Lagrange

Los cuadros 13.13 y 13.14 recogen la informacin sealada que se solicit al programa con la
opcin /LMTEST que apareca en la sintaxis ofrecida en el cuadro 13.2. En el contraste
univariante, se observa que hay dos parmetros que, individualmente, seran candidatos a
conseguir una mejora significativa del modelo. Estos dos parmetros se corresponden con la
introduccin de una covarianza entre los factores especficos E1 y E3, en el primer caso, y
con la inclusin de una relacin causal entre la variable observada V2 y el factor comn F2,
en el segundo caso. En ambos casos el contraste ofrece el valor aproximado que tendra el
parmetro si se aadiera (parameter change).

Sin embargo, como se ha sealado, estos contrastes tienen el inconveniente que no tiene en
cuenta las covarianzas entre los distintos estimadores de los parmetros, por lo que es
conveniente centrar la atencin en el contraste multivariante, que descuenta estos efectos
comunes. Si nos fijamos en el cuadro 13.14, comprobamos que ahora slo propone la
inclusin de una relacin, o path causal, entre la variable V2 y el factor comn F2. Y slo
incluye este parmetro porque el enfoque multivariante hace que compruebe que, tras hacerlo,
ninguna otra adicin provocara mejoras significativas en la
2
. La necesidad estadstica de
introducir este parmetro no es excesiva, dado que el contraste demuestra que la mejora sera
slo significativa al 5% y no al 1% (p=0.029) y hara que el estadstico
2
disminuyera en
4.74 unidades. Debe producirse esta modificacin del modelo? La respuesta debe proceder
del anlisis terico del investigador. El modelo tiene un ajuste suficientemente razonable,
tiene sentido que exista una relacin causal entre la inteligencia cuantitativa y la filosofa?
existe soporte terico para esta relacin? hay trabajos previos que lo apuntan? Si no es as,
no debera introducirse la relacin propuesta por el contraste LM, dado que el ajuste del
modelo sin ella es razonable.

13.7.3 Contraste de Wald

Mientras que el contraste LM se utiliza para plantearse si deberan aadirse nuevos
parmetros al modelo, en el contraste de Wald se aplica para cuestionarse si deberan
suprimirse algunos de los parmetros existentes. En este caso, para confirmar la validez del
modelo lo deseable sera, al contrario de lo que ocurre con el contraste de los multiplicadores
de Lagrange, no poder rechazar la hiptesis nula de que los parmetros son cero.

MULTIVARIATE LAGRANGE MULTIPLIER TEST BY SIMULTANEOUS PROCESS IN STAGE 1

PARAMETER SETS (SUBMATRICES) ACTIVE AT THIS STAGE ARE:

PVV PFV PFF PDD GVV GVF GFV GFF BVF BFF

CUMULATIVE MULTIVARIATE STATISTICS UNIVARIATE INCREMENT
---------------------------------- --------------------

STEP PARAMETER CHI-SQUARE D.F. PROBABILITY CHI-SQUARE PROBABILITY
---- ----------- ---------- ---- ----------- ---------- -----------
1 V2,F2 4.741 1 0.029 4.741 0.029
36
En nuestro ejemplo, como se comprueba en el cuadro 13.15, no hay relaciones que pudieran
suprimirse pero, en el caso de que existieran, deberan hacerse las mismas consideraciones de
naturaleza terica que se han efectuado en el caso de inclusin de nuevos parmetros.

En general, tanto el contraste LM como el de Wald son procedimientos paso a paso, por lo
que el error tipo I suele sobreestimarse. Por esta razn algunos autores (Ullman, 1996)
recomiendan ser conservadores en el nivel de significacin considerado. Por ejemplo =0,01
para Lagrange y =0.05 para Wald.

Tambin seala esta autora que, de acuerdo con McCallum (1986), el orden en que los
parmetros se eliminen o aadan puede afectar a la significatividad de los restantes, por lo que
se recomienda aadir todos los parmetros necesarios antes de eliminar los innecesarios.

Cuadro 13.15 Contraste de Wald

13.8 UN EJEMPLO COMPLETO DE AFC

Desarrollaremos ahora un ejemplo completo de AFC pero recurriendo, en esta ocasin a un
programa distinto, el mdulo CALIS del SAS, de tal forma que el lector pueda apreciar las
similitudes y diferencias entre dos de los programas ms utilizados para este tipo de anlisis.

CASO 13.2 Validez convergente de una escala de medida de la orientacin de mercado

El problema con que nos enfrentamos es el siguiente. Como seala Martn Armario (1993),
las organizaciones se ven obligadas a estar pendientes tanto de sus clientes como de la
competencia, aunque su gestin de marketing puede variar la importancia que concede a uno
u otro factor a lo largo del tiempo. Nuestro investigador quiere desarrollar un instrumento de
medida de estos dos aspectos del enfoque de marketing, la orientacin al cliente y la
orientacin a la competencia, para determinar, en cada momento del tiempo, cul est
primando por encima del otro en un sector determinado.

Basndose en el trabajo de Narver y Slater (1990), desarrolla una escala de 11 preguntas
donde las 6 primeras se han diseado para medir la orientacin al cliente y las 5 siguientes
para medir la orientacin a la competencia, tal y como se sintetiza en el cuadro 13.16.

Pero una escala de medida debe demostrar su validez convergente, esto es, si se supone que
esas 11 preguntas estn midiendo dos factores latentes o constructor distintos, cada grupo de

WALD CONTRASTE (FOR DROPPING PARAMETERS)
MULTIVARIATE WALD TEST BY SIMULTANEOUS PROCESS

CUMULATIVE MULTIVARIATE STATISTICS UNIVARIATE INCREMENT
---------------------------------- --------------------

STEP PARAMETER CHI-SQUARE D.F. PROBABILITY CHI-SQUARE PROBABILITY
---- ----------- ---------- ---- ----------- ---------- -----------

************
NONE OF THE FREE PARAMETERS IS DROPPED IN THIS PROCESS.
37
variables observadas deben tener cargas significativas sobre su respectivo factor comn, y no
sobre los dems (puede consultarse Kster, Vila y Alds, 2000 para profundizar en el tema de
la validacin de escalas). Por este motivo, tras realizar una encuesta a 375 empresas, con el
cuestionario del cuadro 13.16, se realiza una aplicacin del mtodo AFC para constatar la
plausibilidad del modelo recogido en la figura 13.6. Si este modelo ofrece un ajuste razonable
y todas las cargas factoriales planteadas son significativas, ser una evidencia que apoyar la
validez convergente de estos indicadores (Anderson y Gerbing, 1988).

Cuadro 13.16 Escala de medida a validar

Fuente: adaptado de Narver y Slater (1990)

Sometido a un primer anlisis descriptivo las 11 variables, obtenemos la matriz de varianzas y
covarianzas que se recoge en el cuadro 13.17 y que ser el punto de partida de nuestro
anlisis.

Valore su acuerdo o desacuerdo con las siguientes afirmaciones en una escala de siete puntos
donde 1=totalmente en desacuerdo; 7=totalmente de acuerdo.

ORIENTACIN AL CLIENTE
V1. Nos preocupamos por responder a las exigencias de los clientes
V2. Ofrecemos servicios post-venta
V3. Comprendemos las necesidades de los clientes
V4. Nos fijamos objetivos de satisfaccin del cliente
V5. Medimos el grado de satisfaccin del cliente
V6. Las acciones de mi empresa van dirigidas a que el cliente obtenga ms por el mismo precio

ORIENTACIN A LA COMPETENCIA
V7. Poseemos informacin sobre la cuota de mercado de la competencia
V8. Damos una respuesta rpida a las acciones de la competencia
V9. La alta direccin efecta anlisis de las estrategias de la competencia
V10. El personal de ventas regularmente comparte informacin con nuestro negocio en relacin a
la estrategia de los competidores.
V11. Vemos como ventajas competitivas las oportunidades de mercado
38
Figura 13.6 Modelo terico sujeto a contraste
1
2
v1
1
v2 v3 v4 v5 v6
2 3 4 5 6
v7 v8 v9
7 9 9
v10
10
v11
11
11 21 31 41 51 61
12=21
72 82 92 102 112
Orientacin
al cliente
Orientacin a la
competencia

Cuadro 13.17. Matriz de varianzas covarianzas del ejemplo
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
V1 8,48
V2 4,03 8,79
V3 3,32 2,68 5,32
V4 4,76 4,81 2,71 10,14
V5 5,34 4,62 2,62 5,02 8,60
V6 2,72 1,89 1,68 2,23 2,33 7,31
V7 1,97 3,54 1,05 3,45 2,46 0,60 8,61
V8 1,56 1,47 1,39 2,52 1,03 1,07 1,94 7,07
V9 1,81 2,97 1,70 2,26 2,36 0,53 3,04 2,53 7,34
V10 1,53 2,72 0,28 2,43 1,55 0,27 3,03 1,92 3,08 8,09
V11 0,06 0,52 0,60 -0,37 0,84 1,34 -0,61 0,29 0,83 0,43 1,34

El primer paso consiste en identificar el modelo terico ilustrado en la figura 13.6. Para ello
es necesario determinar los parmetros que se han de estimar y los que se han de constreir a
un valor prefijado, de acuerdo con las especificaciones dadas. En este sentido, se llevan a
cabo las siguientes tareas:

1. Establecimiento de la escala de los factores comunes. Puede fijarse la carga factorial
entre una variable observada y el factor comn a 1 o la varianza de ese factor comn a
1. En este caso, se ha optado por fijar la varianza del factor comn a uno, como se
ilustra en la figura 13.7.
2. Comprobacin de la identificabilidad de la parte del modelo que contiene la relacin
entre las variables observadas y los factores. Como tenemos dos factores y ms de tres
variables observadas por cada uno de ellos, se han asumido las siguientes supuestos:
los trminos de error estn incorrelacionados entre s; cada variable carga solo sobre
un factor; se permite a los factores que covaren; y se fijan a 1 los parmetros de los
coeficientes de regresin de los trminos de error en las ecuaciones de las variables
observadas. Todos estos supuestos se recogen en la figura 13.7.
.
39
3. Determinacin de los grados de libertad. Tras las restricciones anteriores, se dispone
de 1112/2=66 datos y de 23 parmetros a estimar: las 11 varianzas de los trminos de
error, los 11 coeficientes de regresin entre las variables observadas y los factores
comunes y la covarianza entre dichos factores. El modelo est, pues, sobreidentificado
y tiene 43 grados de libertad.

Figura 13.7 Modelo terico identificado
1 2
v1
1*
v2 v3 v4 v5 v6
2* 3* 4* 5* 6*
v7 v8 v9
7* 9* 9*
v10
10*
v11
11*
11=* 21=* 31=* 41=* 51=* 61=*
12=21=*
72=* 82=* 92=* 102=* 112=*
Orientacin
al cliente
Orientacin a la
competencia
11=1 22=1
1 1 1 1 1 1 1 1 1 1 1

Una vez identificado el modelo, escribimos la sintaxis del SAS CALIS que permite su
contrastacin, tal como aparece recogida en el cuadro 13.18. Hemos optado por utilizar la
opcin de formulacin equivalente al EQS (opcin LINEQS de la sintaxis) para facilitar la
comparabilidad de la misma con la mostrada con anterioridad. Comentamos a continuacin
los elementos bsicos de la misma.

40
Cuadro 13.18 Sintaxis del SAS CALIS

Como se puede comprobar al examinar el cuadro 13.18, la sintaxis del SAS CALIS es muy
similar a la del EQS. La primera parte de la misma (DATA) se limita a suministrar al
programa la matriz de varianzas covarianzas con la que ha de trabajar y el nmero de casos
(375) que la han generado. En la segunda parte (PROC CALIS) se dan las siguientes
instrucciones: el anlisis se ha de efectuar sobre la matriz de varianzas covarianzas
(COVARIANCES) y no sobre la matriz de correlacin; se debe imprimir la matriz de
correlacin (CORR); se debe imprimir la matriz de varianzas covarianzas residual, tanto la
absoluta como la estandarizada (RESIDUAL); se solicita que ofrezca los indicadores
necesarios para reespecificar el modelo, caso de que el ajuste no sea bueno, es decir, los
contrastes de Wald y multiplicadores de Lagrange (MODIFICATION); y, finalmente, se
indica al programa que efecte una estimacin por mxima verosimilitud (METHOD=ML).
Caso de optar por otro procedimiento se utilizaran los siguientes cdigos: GLS para mnimos
cuadrados generalizados; LSGLS para realizar primero una estimacin por mnimos
DATA D1 (TYPE=COV);
INPUT _TYPE_ $ _NAME_ $ V1-V11;
CARDS;
N . 375 375 375 375 375 375 375 375 375 375 375
COV V1 8.48 . . . . . . . . . .
COV V2 4.03 8.79 . . . . . . . . .
COV V3 3.32 2.68 5.32 . . . . . . . .
COV V4 4.76 4.81 2.71 10.14 . . . . . . .
COV V5 5.34 4.62 2.62 5.02 8.60 . . . . . .
COV V6 2.72 1.89 1.68 2.23 2.33 7.31 . . . . .
COV V7 1.97 3.54 1.05 3.45 2.46 0.60 8.61 . . . .
COV V8 1.56 1.47 1.39 2.52 1.03 1.07 1.94 7.07 . . .
COV V9 1.81 2.97 1.70 2.26 2.36 0.53 3.04 2.53 7.34 . .
COV V10 1.53 2.72 0.28 2.43 1.55 0.27 3.03 1.92 3.08 8.09 .
COV V11 0.06 0.52 0.60 -0.37 0.84 1.34 -0.61 0.29 0.83 0.43 8.25
;

PROC CALIS COVARIANCE CORR RESIDUAL MODIFICATION METHOD=ML;
LINEQS
V1=LV1F1 F1+E1,
V2=LV2F1 F1+E2,
V3=LV3F1 F1+E3,
V4=LV4F1 F1+E4,
V5=LV5F1 F1+E5,
V6=LV6F1 F1+E6,
V7=LV7F2 F2+E7,
V8=LV8F2 F2+E8,
V9=LV9F2 F2+E9,
V10=LV10F2 F2+E10,
V11=LV11F2 F2+E11;
STD
F1=1,
F2=1,
E1-E11=VARE1-VARE11;

COV
F1 F2=CF1F2;

VAR V1-V11;

RUN;
41
cuadrados sin ponderar, seguida de otra por mnimos cuadrados generalizados; LSML para
realizar primero una estimacin por mnimos cuadrados sin ponderar seguida por una por
mxima verosimilitud; y, finalmente, ULS para realizar una estimacin por mnimos
cuadrados sin ponderar.

El paso siguiente consiste en introducir las ecuaciones que, como se seal, se efecta en este
caso siguiendo la notacin de Bentler y Weeks (1980), lo que se le indica al programa
mediante la instruccin LINEQS. A partir de aqu la sintaxis es inmediata y se deriva de
manera directa de la figura 13.7. Las variables se denotan con la letra V, los coeficientes de
regresin con la letra L (de loadings) seguida por los dos elementos que une (V1 y F1, por
ejemplo), los factores comunes se denotan con la letra F y los trminos de error por la letra E.
El trmino STD introduce las varianzas que se desea estimar o fijar a un valor determinado. Si
se fijan se pone el valor (F1=1) y si se dejan libres para su estimacin, se le asigna un nombre
(E1-E11=VARE1-VARE11). De forma anloga, las covarianzas entre los factores comunes se
introduce con COV; as se indica que se quiere estimar la covarianza entre F1 y F2
asignndole el nombre CF1F2 mediante la instruccin: F1 F2 = CF1F2.

Explicada la sintaxis del SAS CALIS, pasamos a examinar los resultados. En primer lugar, el
programa ofrece la matriz de varianzas covarianzas residual como primer indicador de ajuste.
Lo hace tanto en su versin original como estandarizada y, al igual que el EQS, muestra los
10 residuos ms grandes y una media de los residuos, tanto global, como los que estn fuera
de la diagonal. En el cuadro 13.19 ofrecemos la matriz de residuos estandarizados. De su
anlisis se comprueba que existen algunas variables con residuos elevados, como V7 y V2 o
V10 y V3, lo que constituye un indicio de que la relacin entre las mismas no ha sido bien
recogida por el modelo propuesto.

Si se analiza grficamente la distribucin de los residuos (cuadro 13.20) se comprueba que
aunque la distribucin es aproximadamente simtrica y centrada en cero, existen demasiados
residuos fuera del intervalo [-1;1], mostrando tambin problemas en el ajuste del modelo.

Finalmente, el anlisis del historial de iteraciones (cuadro 13.21) no muestra problemas de
convergencia, ya que sta se produce a partir de la tercera iteracin, no efectuando el
programa ninguna advertencia sobre la misma (GCONV convergence criterion satisfied).

42
Cuadro 13.19 Matriz de residuos estandarizados

Asymptotically Standardized Residual Matrix

V1 V2 V3 V4 V5 V6

V1 0.000000000 -3.357227097 2.967204321 -1.246975692 3.069122401 1.877452055
V2 -3.357227097 0.000000000 0.076573558 1.190600216 0.003342966 -1.095682629
V3 2.967204321 0.076573558 0.000000000 -1.095790386 -2.237389256 1.328560327
V4 -1.246975692 1.190600216 -1.095790386 0.000000000 -0.208504765 -0.509764345
V5 3.069122401 0.003342966 -2.237389256 -0.208504765 0.000000000 -0.260239832
V6 1.877452055 -1.095682629 1.328560327 -0.509764345 -0.260239832 0.000000000
V7 -1.059194816 4.496137954 -1.053078900 3.393318795 0.480245969 -1.372962599
V8 -0.262920898 -0.138686540 1.601857105 2.567732915 -2.183475608 0.864289775
V9 -2.517730704 2.723908897 1.162790049 -0.628459373 -0.427554446 -1.977122902
V10 -1.962033167 2.459194714 -3.515198142 0.916976181 -2.047080370 -2.106146228
V11 -0.570490414 0.702822447 1.403369934 -1.558406356 1.539342408 3.138667879

V7 V8 V9 V10 V11

V1 -1.059194816 -0.262920898 -2.517730704 -1.962033167 -0.570490414
V2 4.496137954 -0.138686540 2.723908897 2.459194714 0.702822447
V3 -1.053078900 1.601857105 1.162790049 -3.515198142 1.403369934
V4 3.393318795 2.567732915 -0.628459373 0.916976181 -1.558406356
V5 0.480245969 -2.183475608 -0.427554446 -2.047080370 1.539342408
V6 -1.372962599 0.864289775 -1.977122902 -2.106146228 3.138667879
V7 0.000000000 -1.144338122 -1.465373166 1.084653990 -3.135821742
V8 -1.144338122 0.000000000 1.252373332 -0.449518533 0.093296378
V9 -1.465373166 1.252373332 0.000000000 0.699166646 1.881433740
V10 1.084653990 -0.449518533 0.699166646 0.000000000 0.310648263
V11 -3.135821742 0.093296378 1.881433740 0.310648263 0.000000000

Average Standardized Residual = 1.256
Average Off-diagonal Standardized Residual = 1.507

Rank Order of 10 Largest Asymptotically Standardized Residuals

V7,V2 V10,V3 V7,V4 V2,V1 V11,V6 V11,V7 V5,V1 V3,V1 V9,V2
4.4961 -3.5152 3.3933 -3.3572 3.1387 -3.1358 3.0691 2.9672 2.7239

V8,V4
2.5677

43
Cuadro 13.20 Distribucin de los residuos estandarizados

Cuadro 13.21 Historial de iteraciones

Covariance Structure Analysis: Maximum Likelihood Estimation

Distribution of Asymptotically Standardized Residuals
(Each * represents 1 residuals)

-3.75000 - -3.50000 1 1.52% | *
-3.50000 - -3.25000 1 1.52% | *
-3.25000 - -3.00000 1 1.52% | *
-3.00000 - -2.75000 0 0.00% |
-2.75000 - -2.50000 1 1.52% | *
-2.50000 - -2.25000 0 0.00% |
-2.25000 - -2.00000 4 6.06% | ****
-2.00000 - -1.75000 2 3.03% | **
-1.75000 - -1.50000 1 1.52% | *
-1.50000 - -1.25000 2 3.03% | **
-1.25000 - -1.00000 6 9.09% | ******
-1.00000 - -0.75000 0 0.00% |
-0.75000 - -0.50000 3 4.55% | ***
-0.50000 - -0.25000 4 6.06% | ****
-0.25000 - 0 2 3.03% | **
0 - 0.25000 14 21.21% | **************
0.25000 - 0.50000 2 3.03% | **
0.50000 - 0.75000 2 3.03% | **
0.75000 - 1.00000 2 3.03% | **
1.00000 - 1.25000 3 4.55% | ***
1.25000 - 1.50000 3 4.55% | ***
1.50000 - 1.75000 2 3.03% | **
1.75000 - 2.00000 2 3.03% | **
2.00000 - 2.25000 0 0.00% |
2.25000 - 2.50000 1 1.52% | *
2.50000 - 2.75000 2 3.03% | **
2.75000 - 3.00000 1 1.52% | *
3.00000 - 3.25000 2 3.03% | **
3.25000 - 3.50000 1 1.52% | *
3.50000 - 3.75000 0 0.00% |
3.75000 - 4.00000 0 0.00% |
4.00000 - 4.25000 0 0.00% |
4.25000 - 4.50000 1 1.52% | *


Levenberg-Marquardt Optimization
Scaling Update of More (1978)
Number of Parameter Estimates 23
Number of Functions (Observations) 66

Optimization Start: Active Constraints= 0 Criterion= 0.428 Maximum Gradient Element= 0.036
Radius= 1.000

Iter rest nfun act optcrit difcrit maxgrad lambda rho
1 0 2 0 0.4045 0.0233 0.0439 0 0.882
2 0 3 0 0.4032 0.00128 0.00188 0 0.903
3 0 4 0 0.4031 0.000074 0.00304 0 0.956
4 0 5 0 0.4031 5.396E-6 0.00018 0 1.037
5 0 6 0 0.4031 4.375E-7 0.00022 0 1.120
6 0 7 0 0.4031 3.825E-8 0.00003 0 1.187
7 0 8 0 0.4031 3.513E-9 0.00002 0 1.236
8 0 9 0 0.4031 3.32E-10 4.06E-6 0 1.267

Optimization Results: Iterations= 8 Function Calls= 10 Jacobian Calls= 9 Active Constraints= 0
Criterion= 0.40309939 Maximum Gradient Element= 4.06181E-6 Lambda= 0 Rho= 1.267
Radius= 0.00005455

NOTE: GCONV convergence criterion satisfied.

44
Cuadro 13.22 Indices de bondad de ajuste

Los indicadores de bondad de ajuste aparecen en el cuadro 13.22. En dicho cuadro se han
subrayado aquellos que se comentaron en el desarrollo del tema y que estn presentes en el
programa SAS CALIS. Todos parecen sealar que existe un problema de ajuste. As aunque
la chi cuadrado es inferior a la del modelo independiente (150,75<1109,31), es significativa,
con lo que se rechaza la hiptesis nula de que las matrices
nc
y sean iguales, hecho no
deseable. Por otra parte, los ndices NFI (0,8641) y NNFI (0,8693) no son superiores a 0,9; lo
mismo ocurre con los ndices CFI (0,8978) y AGFI (0,8940).

Esta informacin ya debera llevar al investigador a dudar de la validez convergente de la
escala que ha utilizado. Pero si pese a saber que su escala no es vlida en este sentido, desea
saber cul es la causa que origina los problemas en su instrumento de medicin, debera
seguir con el anlisis de los resultados. En primer lugar, debe analizar la significatividad de
los parmetros estimados, dado que quizs los problemas de ajuste se deban solamente a que
alguno de los items de la escala no guarde una relacin significativa con el factor. El cuadro
13.23 nos muestra la parte de la solucin que afecta a la relacin entre las variables
observadas y los factores comunes. De su anlisis se aprecia que prcticamente todas las
cargas factoriales son significativas, ya que los estadsticos t, excepto el correspondiente a
V11, superan ampliamente a 2 en valor absoluto.

Una primera modificacin podra ir en la lnea de eliminar esta relacin. Pero recordemos
nuestra insistencia de que no se trata de lograr un ajuste estadstico, sino que cada
reespecificacin del modelo debe tener una justificacin terica de acuerdo con los objetivos
de la investigacin. En este caso, si la eliminacin de la relacin desembocara en un buen
ajuste, la nica consecuencia sera que la escala que mide la orientacin a la competencia

Fit criterion . . . . . . . . . . . . . . . . . . 0.4031
Goodness of Fit Index (GFI) . . . . . . . . . . 0.9309
GFI Adjusted for Degrees of Freedom (AGFI). . . . 0.8940
Root Mean Square Residual (RMR) . . . . . . . . . 0.4684
Parsimonious GFI (Mulaik, 1989) . . . . . . . . . 0.7278
Chi-square = 150.7592 df = 43 Prob>chi**2 = 0.0001
Null Model Chi-square: df = 55 1109.3122
RMSEA Estimate . . . . . . 0.0819 90%C.I.[0.0679, 0.0963]
Probability of Close Fit . . . . . . . . . . . . 0.0001
ECVI Estimate . . . . . . . 0.5302 90%C.I.[0.4391, 0.6422]
Bentler's Comparative Fit Index . . . . . . . . . 0.8978
Normal Theory Reweighted LS Chi-square . . . . . 152.5770
Akaike's Information Criterion. . . . . . . . . . 64.7592
Bozdogan's (1987) CAIC. . . . . . . . . . . . . . -147.0986
Schwarz's Bayesian Criterion. . . . . . . . . . . -104.0986
McDonald's (1989) Centrality. . . . . . . . . . . 0.8662
Bentler & Bonett's (1980) Non-normed Index. . . . 0.8693
Bentler & Bonett's (1980) NFI . . . . . . . . . . 0.8641
James, Mulaik, & Brett (1982) Parsimonious NFI. . 0.6756
Z-Test of Wilson & Hilferty (1931). . . . . . . . 7.2937
Bollen (1986) Normed Index Rho1 . . . . . . . . . 0.8262
Bollen (1988) Non-normed Index Delta2 . . . . . . 0.8989
Hoelter's (1983) Critical N . . . . . . . . . . . 149

45
tendra un item menos de los inicialmente propuestos, pero sera vlida en un sentido
convergente, lo que puede ser hasta deseable en trminos de parsimonia.

Para estimar este nuevo modelo, bastara eliminar la ltima ecuacin del cuadro 13.18 y
cualquier referencia a la variable V11 de la sintaxis, incluyendo la matriz de varianzas y
covarianzas. Si se hace esto, se obtendra el ajuste del modelo que sintetizan los ndices del
cuadro 13.24 donde, aunque se producen ligeras mejoras, estas no son suficientes para
considerar como bueno el ajuste del modelo. Llegados a este punto, el investigador ya sabe
que en ningn caso su escala va a gozar de validez convergente, porque cualquier otro tipo de
modificacin que ahora presentaremos ya supone cambios demasiados importantes respecto al
modelo terico como para considerarlo vlido. Qu otras modificaciones se pueden
introducir? El cuadro 13.25 nos ofrece los contraste de Lagrange y de Wald que nos sirven
como indicador.

Cuadro 13.23 Parmetros estimados


Manifest Variable Equations

V1 = 2.2132*F1 + 1.0000 E1
Std Err 0.1372 LV1F1
t Value 16.1305

V2 = 2.0465*F1 + 1.0000 E2
t Value 14.1828

V3 = 1.3029*F1 + 1.0000 E3
t Value 11.0399

V4 = 2.2377*F1 + 1.0000 E4
t Value 14.5202

V5 = 2.2573*F1 + 1.0000 E5
t Value 16.4143

V6 = 1.0553*F1 + 1.0000 E6
t Value 7.2583

V7 = 1.7469*F2 + 1.0000 E7
t Value 10.5077

V8 = 1.2564*F2 + 1.0000 E8
t Value 8.1613

V9 = 1.8519*F2 + 1.0000 E9
t Value 12.1590

V10 = 1.6100*F2 + 1.0000 E10
t Value 9.9469

V11 = 0.2065*F2 + 1.0000 E11
t Value 1.1834

46
Cuadro 13.24 Indices de bondad de ajuste tras eliminar V11

Si nos fijamos en las propuestas de modificacin de la matriz (se denomina GAMMA en el
programa SAS), esto es, las que afectan a las relaciones entre las variables observadas y los
factores comunes, vemos que el multiplicador de Lagrange mayor corresponde a una posible
relacin entre V2 y F2 que, en ningn momento estaba planteada tericamente. Sin embargo,
si el modelo ajustara mejor con su inclusin, podramos estar ante un indicador que es
compartido por los dos constructos analizados (F1 y F2) que, quizs, pueda servir de base
para realizar una posible modificacin de la escala. Por qu no prestamos atencin a los
multiplicadores de Lagrange asociados al vector de errores (PHI)? Eso es debido a que, al
establecer relaciones entre los trminos de error entre s y con los factores, no tendramos
justificacin terica para hacer alguna propuesta sobre ellos. Finalmente, el contraste de Wald
nos plantea que eliminemos la relacin entre la variable V11 y el factor F2, lo que ya
sabamos, puesto que este parmetro (LV11F2) haba resultado ser no significativo.


Fit criterion . .......................... 0.3157
Goodness of Fit Index (GFI) . . . . . . . . . 0.9395
GFI Adjusted for Degrees of Freedom (AGFI). . .0.9022
Root Mean Square Residual (RMR) . . . . . . . 0.4415
Parsimonious GFI (Mulaik, 1989) . . . . . . . .0.7099
Chi-square = 118.0681 df = 34 Prob>chi**2 =0.0001
RMSEA Estimate . . . 0.0813 90%C.I .[0.0656, 0.0976]
Probability of Close Fit . . . . . . . . 0.0008
ECVI Estimate . . . . 0.4314 90%C.I.[0.3521, 0.5316]
Bentler's Comparative Fit Index . . . . 0.9184
Normal Theory Reweighted LS Chi-square . . 120.3436
Akaike's Information Criterion. . . . . . . . 50.0681
Bozdogan's (1987) CAIC. . . . . . . . . .. -117.4474
Schwarz's Bayesian Criterion. . . . . . . -83.4474
McDonald's (1989) Centrality. . . . . . . . . 0.8940
Bentler & Bonett's (1980) Non-normed Index. . .0.8920
Bentler & Bonett's (1980) NFI . . . . . . . . .0.8902
James, Mulaik, & Brett (1982) Parsimonious NFI.0.6726
Z-Test of Wilson & Hilferty (1931). . . . . . .6.4426
Bollen (1986) Normed Index Rho1 . . . . . . . .0.8547
Bollen (1988) Non-normed Index Delta2 . . . . .0.9193

47
Cuadro 13.25 Multiplicadores de Lagrange y contraste de Wald

Para la introduccin de las dos cambios sealadas hay que modificar la sintaxis de 13.18,
expresando la ecuacin correspondiente a V2 de esta forma

V2=LV2F1 F1+LV2F2 F2+E2

y eliminando la correspondiente a V11:

V11=LV11F2 F2+E11;

Con estas modificaciones el ajuste del modelo mejora significativamente, como se aprecia en
el cuadro 13.26, logrndose incluso que el estadstico
2
sea no significativo para un nivel
=0,05 (p=0,08) y que los ndices GFI, AGFI, NFI, NNFI y CFI superen el valor de 0,9.
Como se comprueba en el cuadro 13.27, todos los parmetros que relacionan los factores
comunes con las variables observadas son significativos (t supera ampliamente 2 en valor
absoluto), como tambin lo es la covarianza entre los factores comunes y el resto de
parmetros estimados (cuadro 13.28). De la solucin estandarizada del cuadro 13.29,
obtendramos la sntesis grfica del modelo que se ilustra en la figura 13.8.

Rank order of 10 largest Lagrange multipliers in _PHI_

E2 : F1 E2 : F2 E10 : E3 E2 : E1
21.1267 : 0.000 21.1263 : 0.000 13.6276 : 0.000 11.2709 : 0.001

E11 : E6 E7 : E2 E11 : E7 E1 : F1
10.4606 : 0.001 9.9540 : 0.002 9.8334 : 0.002 9.5723 : 0.002

E1 : F2 E5 : E1
9.5721 : 0.002 9.4192 : 0.002

Rank order of 5 largest Lagrange multipliers in _GAMMA_

V2 : F2 V1 : F2 V4 : F2 V6 : F2
21.1261 : 0.000 9.5720 : 0.002 5.4948 : 0.019 3.9647 : 0.046

V7 : F1
3.8312 : 0.050


Stepwise Multivariate Wald Test
---------------------------------------------------------------------------
Cumulative Statistics Univariate Increment
Parameter Chi-Square D.F. Prob Chi-Square Prob
---------------------------------------------------------------------------
LV11F2 1.400515 1 0.2366 1.400515 0.2366

48
Cuadro 13.26 Indices de bondad de ajuste tras eliminar V11 e introducir la relacin V2F2


Fit criterion . . . . . . . . . . . . . . . . . . 0.2580
Goodness of Fit Index (GFI) . . . . . . . . . . . 0.9519
GFI Adjusted for Degrees of Freedom (AGFI). . . . 0.9198
Root Mean Square Residual (RMR) . . . . . . . . . 0.3884
Parsimonious GFI (Mulaik, 1989) . . . . . . . . . 0.6980
Chi-square = 44.8992 df = 33 Prob>chi**2 = 0.0810
RMSEA Estimate . . . . . . . . . 0.0455 90%C.I.[., 0.0764]
Probability of Close Fit . . . . . . . . . . . . 0.5596
ECVI Estimate . . . . . . . . . . 0.5280 90%C.I.[., 0.6556]
Bentler's Comparative Fit Index . . . . . . . . . 0.9739
Normal Theory Reweighted LS Chi-square . . . . . 43.9820
Akaike's Information Criterion. . . . . . . . . . -21.1008
Bozdogan's (1987) CAIC. . . . . . . . . . . . . . -158.5388
Schwarz's Bayesian Criterion. . . . . . . . . . . -125.5388
McDonald's (1989) Centrality. . . . . . . . . . . 0.9666
Bentler & Bonett's (1980) Non-normed Index. . . . 0.9644
Bentler & Bonett's (1980) NFI . . . . . . . . . . 0.9102
James, Mulaik, & Brett (1982) Parsimonious NFI. . 0.6675
Z-Test of Wilson & Hilferty (1931). . . . . . . . 1.3992
Bollen (1986) Normed Index Rho1 . . . . . . . . . 0.8776
Bollen (1988) Non-normed Index Delta2 . . . . . . 0.9745

49
Cuadro 13.27 Ecuaciones entre variables observadas y factores comunes

Manifest Variable Equations

V1 = 2.2636*F1 + 1.0000 E1
t Value 11.2943

V2 = 1.4923*F1 + 0.8903*F2 + 1.0000 E2
Std Err 0.2551 LV2F1 0.2674 LV2F2
t Value 5.8511 3.3291

V3 = 1.3095*F1 + 1.0000 E3
t Value 7.5568

V4 = 2.2110*F1 + 1.0000 E4
t Value 9.7174

V5 = 2.2799*F1 + 1.0000 E5
t Value 11.2967

V6 = 1.0767*F1 + 1.0000 E6
t Value 5.0485

V7 = 1.8117*F2 + 1.0000 E7
t Value 7.5486

V8 = 1.1893*F2 + 1.0000 E8
t Value 5.2878

V9 = 1.8173*F2 + 1.0000 E9
t Value 8.2568

V10 = 1.6372*F2 + 1.0000 E10
t Value 6.9860

50
Cuadro 13.28 Varianzas trminos de error y covarianzas entre factores comunes

Cuadro 13.26 Indices de bondad de ajuste tras eliminar V11 e introducir la relacin V2F2

Variances of Exogenous Variables
---------------------------------------------------------------------
Standard
Variable Parameter Estimate Error t Value
---------------------------------------------------------------------
F1 1.000000 0 0.000
F2 1.000000 0 0.000
E1 VARE1 3.355968 0.505628 6.637
E2 VARE2 4.355047 0.558798 7.794
E3 VARE3 3.605119 0.423623 8.510
E4 VARE4 5.251300 0.681533 7.705
E5 VARE5 3.401862 0.512702 6.635
E6 VARE6 6.150721 0.682929 9.006
E7 VARE7 5.327597 0.746134 7.140
E8 VARE8 5.655471 0.668561 8.459
E9 VARE9 4.037574 0.628791 6.421
E10 VARE10 5.409506 0.713664 7.580

Covariances among Exogenous Variables
--------------------------------------------------------------------
Standard
Parameter Estimate Error t Value
--------------------------------------------------------------------
F2 F1 CF1F2 0.532588 0.081180 6.561
Equations with Standardized Coefficients

V1 = 0.7773*F1 + 0.6291 E1
LV1F1
V2 = 0.5034*F1 + 0.3003*F2 + 0.7039 E2
LV2F1 LV2F2
V3 = 0.5678*F1 + 0.8232 E3
LV3F1
V4 = 0.6943*F1 + 0.7196 E4
LV4F1
V5 = 0.7775*F1 + 0.6289 E5
LV5F1
V6 = 0.3982*F1 + 0.9173 E6
LV6F1
V7 = 0.6174*F2 + 0.7866 E7
LV7F2
V8 = 0.4473*F2 + 0.8944 E8
LV8F2
V9 = 0.6708*F2 + 0.7417 E9
LV9F2
V10 = 0.5756*F2 + 0.8177 E10
LV10F2

51
Figura 13.8 Modelo final estimado
1 2
v1
1
v2 v3 v4 v5 v6
2 3 4 5 6
v7 v8 v9
7 9 9
v10
10
Orientacin
al cliente
Orientacin a la
competencia
0.532
0.629 0.703 0.823 0.719 0.628 0.917
0.786 0.894 0.741 0.817
0.617 0.447 0.670 0.575
0.567 0.694 0.777 0.398
0.300
0.503
0.777

REFERENCIAS BIBLIOGRFICAS

Akaike, H. (1987): Factor Analysis and AIC. Psychometrika, vol. 52, pp. 317-332.
Anderson, J.C. y Gerbing, D.W. (1984): The effect of sampling error on covergence,
improper solutions, and goodness of fit indices for maximum likelihood confirmatory
factor analysis. Psychometrika, vol. 49, pp. 155-173.
Anderson, J.C. y Gerbing, D.W. (1988): Structural equation modelling in practice: A review
and recommended two step approach. Psychological Bulletin, n 103, pp. 411-423.
Bearden, W.O.; Sharma, S. y Teel, J.E. (1982): Sample sizes effects on chi square and other
statistics used in evaluating causal models. Journal of Marketing Research, Vol. 19,
pp. 425-430.
Bentler, P.M. (1988): Comparative fit indeces in structural models. Psychological Bulletin,
107, pp. 238-246.
Bentler, P.M. (1992): On the fit of models to covariances and methodology to the Bulletin.
Psychological Bulletin, 112, pp. 400-404.
Bentler, P.M. (1995): EQS Structural Equations Program Manual. Encino, CA: Multivariate
Software, Inc.
Bentler, P.M. y Bonett, D.G. (1980): Significance tests and goodness of fit in the analysis of
covariance structures. Psychological Bulletin, 88, pp. 588-606.
Bentler, P.M. y Weeks, D.G. (1980): Linear structural equations with latent variables.
Psychometrika, vol. 45, pp. 289-308.
Bollen, K.A. (1989): Structural Equations with Latent Variables. Nueva York: Wiley.
Bozdogan, H. (1987): Model selection and Akaikes information criteria: The general theory
and its analytical extensions. Psychometrika, vol. 52, pp. 345-370.
Browne, M.W. y Cudeck, R. (1993): Alternative ways of assessing model fit. En Bollen,
K.A. y Long, J.S. (eds), Testing Structural Models. Newbury Park: Sage.
Byrne, B. (1994): Structural Equation Modeling with EQS and EQS/Windows. Thousand
Oaks, CA: Sage.
52
Hatcher, L. (1994): A Step-by-Step Apporach to Using the SAS System for Factor Anlisis and
Structural Equation Modelling. Cary, NC: Sas Institute Inc.
Hu, L.T.; Bentler, P.M. y Kano, Y. (1992): Can test statistics in covariance structure
analyses be trusted?. Psychological Bulletin, n 112, pp. 351-362.
Jreskog, K.G. y Srbom, D. (1989): Lisrel 7: A guide to the Program Applications. Chicago:
SPSS Inc.
Long, J.S. (1983): Confirmatory Factor Analysis. Sage University Paper series on
Quantitative Applications in the Social Sciences, n 07-033. Newbury Park, CA: Sage.
Marsh, H.W.; Balla, J.R. y McDonald, R. (1988): Goodness of fit indexes in confirmatory
factor analysis: the effect of sample size. Psychological Bulletin, Vol. 105, pp. 430-
445.
Martn Armario, E. (1993): Marketing. 1 edicin. Barcelona: Ariel.
McCallum, R.C. (1986): Specification searches in covariance structure modelling.
Psychological Bulletin, 100, pp. 107-120.
McCallum, R.C.; Roznowski, M. y Necowitz, L.B. (1982): Model modifications in
covariance structure analysis: the problem of capitalization on chance. Psychological
Bulletin, 111, pp. 490-504.
McDonald, R.P. y Marsh, H.W. (1990): Choosing a multivariate model: noncentrality and
goodness of fit. Psychological Bulletin, 107, pp. 247-255.
Narver, J.C. y Slater, S.F. (1990): The effect of a market orientation on business
profitability. Journal of Marketing, vol. 54, octubre, pp. 20-35.
Pedhazur, E. (1982): Multiple Regression in behavioural research. Nueva York: Holt.
Sharma, S. (1996): Applied Multivariate Techniques. Nueva York: John Wiley & Sons, Inc.
Sorbom, D. (1989): Model modification, Psychometrika, vol 54, pp. 371-384.
Tabachnick, B.G. y Fidell, L.S. (1996): Using Multivariate Statistics. 3 edicin. Nueva York:
Harper Collins.
Tanaka, J.S. (1993): Multifaceted conceptions of fit. En Bollen, K.A. y Long, J.S. (eds),
Testing Structural Models. Newbury Park: Sage.
Ullman, J.D. (1996): Structural Equation Modelling, en Tabachnick y Fidell (1996), pp.
709-812.
Vila, N.; Kster, I. y Alds, J. (2000): Desarrollo y Validacin de Escalas de Medida en
Marketing. Quaderns de Treball. N 104. Facultad de Economa, Universitat de
Valencia.
Williams, L.J. y Holahan, P.J. (1994): Parsimony-based fit indices for multiple indicator
models: Do they work? Structural Equation Modeling, Vol. 1, pp. 161-189.

53
APNDICE

A13.1 El problema de la indentificacin

Consideremos un modelo de AFC tal y como fue planteado en la ecuacin (13-1):

= + x

Por otra parte, la matriz que contiene las varianzas y covarianzas de las variables
observadas puede descomponerse tal y como se mostraba en la ecuacin (13-3)

= +

Si no se impone ningn tipo de restriccin a los parmetros de , y y si existe un
conjunto de parmetros que cumplen (13-3), entonces habr un infinito nmero de ellos.
Vemoslo. Sea M cualquier matriz ss no singular, por tanto, invertible. Si definimos:

1
;
= M M
&& &&
=
entonces:

( )
( )
( )
1
1
= +
=
M M
M M
&& &&
+
+
= +

de tal forma que si x cumple (13-1), tambin se cumple que:

= x
&& &&
+

La matriz de varianzas covarianzas de
&&
vendr dada por

[ ] [ ] E E E = = =

( M M M M
&&&& &&
= ( ) )

Si operamos en (13-3) se obtiene que:

( )
( )
( )
( ) ( )
1 1
1 1

= +
=
M M M M
MM MM
&& && &&
+
+
= + =

Por lo tanto, si cumple (13-3), tambin se cumple que:

&& && &&
= +

Dado que las matrices marcadas con slo seran iguales a las originales en el caso en que
M=I, existen infinitas matrices M invertibles que dan lugar a infinitas soluciones del modelo.
En consecuencia, este modelo se definira como no identificado.
54
Ejercicio Anlisis Factorial Confirmatorio
Shimp y Sharma (1987) desarrollaron una escala de 17 temes para medir las tendencias
etnocntricas de los consumidores en lo referente a comprar productos hechos fuera de los
Estados Unidos frente a comprar productos norteamericanos. Se adjunta una copia del
mencionado artculo con el fin de que, quien no lo haya trabajado, pueda profundizar en
el concepto de etnocentrismo que ha generado numerosa literatura en marketing.
En ese trabajo, los autores identificaron una batera de slo 10 temes que podan
tambin utilizarse como indicadores de la tendencia etnocntrica y que se muestran
(conscientemente sin traducir) en el cuadro 1.
La escala fue administrada a 575 individuos que expresaron su acuerdo o desacuerdo
con cada una de las afirmaciones del cuadro 1 en una escala tipo Likert de 7 puntos en la
que 1 significaba completo desacuerdo y 5 completo acuerdo. La matriz de varianzas-
covarianzas que sintetiza los datos se ofrece en el cuadro 2.
Los autores parten de la hiptesis de que el etnocentrismo en un concepto
unidimensional, esto es, que los 10 temes deberan conformar un nico factor. Dado lo
expuesto se pide:

1. Dibuja el esquema del modelo que permitir contrastar la hiptesis sealada.
2. Escribe la sintaxis de EQS que permitira contrastar la hiptesis mencionada, esto
es, que efecte un anlisis factorial confirmatorio donde los 10 temes carguen
sobre un slo factor. Ten en cuenta lo explicado sobre la correcta especificacin
del modelo.
3. Rueda la sintaxis y, con los diversos indicadores explicados en la teora, determina
si el ajuste es o no razonable.
4. Interpreta los resultados. Determina si los parmetros estimados toman valores
adecuados tericamente.
5. Pueden los autores asumir la unidimensionalidad de la esacala de etnocentrismo?
Presta especial atencin a los resultados de los test de Wald y multiplicadores de
Lagrange para contestar a esta pregunta.
55

Cuadro 1. Afirmaciones de la escala para medir las tendencias etnocntricas
Item Afirmacin
I1 Only those products that are unavailable in the US should be imported
I2 American products, first, and foremost.
I3 Purchasing foreign-made products is un-American
I4 It is not right to purchase foreign products, because it puts American out of jobs
I5 A real American should always buy American made products
I6 We should purchase products manufactured in America instead of letting other countries get rich off us
I7 Americans should not buy foreign products, because this hurts American business and causes
unemployment
I8 It may cost me in the long-run but I prefer to support American products
I9 We should buy from foreign countries only those products that we cannot obtain within our own country
I10 American consumers who purchase products made in other countries are responsible for putting their
fellow Americans out of work

Cuadro 2. Matriz de varianzas-covarianzas de la escala.
I1 4.174
I2 2.769 4.340
I3 1.845 1.994 2.742
I4 2.791 2.827 2.257 4.300
I5 2.386 2.610 1.609 2.737 3.689
I6 2.645 2.950 2.101 2.901 2.697 4.080
I7 2.619 2.719 1.795 2.999 2.908 2.802 3.988
I8 2.134 2.535 2.057 2.739 2.334 2.785 2.582 3.590
I9 2.522 2.369 1.856 2.776 2.375 2.610 2.774 2.341 3.987
I10 1.831 2.091 1.132 1.832 1.831 1.920 2.074 1.740 1.736 3.284

Análisis Factorial Confirmatorio

Încărcat de

Informații document

Descriere originală:

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Análisis Factorial Confirmatorio

Încărcat de

Drepturi de autor:

Formate disponibile

Doctorado Interuniversitario en Marketing

Anlisis de Datos Avanzado

) est prxima a la matriz de

), entonces concluiremos que

est ms prxima a S que

. Consecuentemente, aquellos valores de

0, 388 0,197 0, 234 1, 210

S-ar putea să vă placă și