Sunteți pe pagina 1din 19

anales de psicologa, 2014, vol. 30, n 3 (octubre), 1151-1169 Copyright 2014: Servicio de Publicaciones de la Universidad de Murcia.

Murcia (Espaa)
http://dx.doi.org/10.6018/analesps.30.3.199361 ISSN edicin impresa: 0212-9728. ISSN edicin web (http://revistas.um.es/analesps): 1695-2294

El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada
Susana Lloret-Segura*, Adoracin Ferreres-Traver, Ana Hernndez-Baeza e Ins Toms-Marco

Unidad de Aplicaciones y Desarrollos Psicomtricos.


IDOCAL. Instituto de Investigacin en Psicologa de los Recursos Humanos, del Desarrollo organizacional y de la Calidad de Vida Laboral
Facultad de Psicologa. Universitat de Valncia (Espaa)

Resumen: El Anlisis Factorial Exploratorio es una de las tcnicas ms Title: Exploratory Item Factor Analysis: A practical guide revised and up-
usadas en el desarrollo, validacin y adaptacin de instrumentos de medida dated.
psicolgicos. Su uso se extendi durante los aos 60 y ha ido creciendo de Abstract: Exploratory Factor analysis is one of the techniques used in the
forma exponencial al ritmo que el avance de la informtica ha permitido. development, validation and adaptation of psychological measurement in-
Los criterios empleados en su uso, como es natural, tambin han evolucio- struments. Its use spread during the 1960s and has been growing exponen-
nado. Pero los investigadores interesados en asuntos sustantivos que utili- tially thanks to the advancement of information technology. The criteria
zan rutinariamente esta tcnica permanecen en muchos casos ignorantes de used, of course, have also evolved. But the applied researchers, who use
todo ello. En las ltimas dcadas numerosos trabajos han denunciado esta this technique as a routine, remain often ignorant of all this. In the last few
situacin. La necesidad de actualizar los criterios clsicos para incorporar decades numerous studies have denounced this situation. There is an ur-
aquellos ms adecuados es una necesidad urgente para hacer investigacin gent need to update the classic criteria. The incorporation of the most suit-
de calidad. En este trabajo se revisan los criterios clsicos y, segn el caso, able criteria will improve the quality of our research. In this work we review
se sustituyen o se complementan con otros ms actuales. El objetivo es the classic criteria and, depending on the case, we also propose current cri-
ofrecer al investigador aplicado interesado una gua actualizada acerca de teria to replace or complement the former. Our objective is to offer the in-
cmo realizar un Anlisis Factorial Exploratorio consonante con la psico- terested applied researcher updated guidance on how to perform an Ex-
metra post-Little Jiffy. Esta revisin y la gua con las recomendaciones co- ploratory Item Factor Analysis, according to the post-Little Jiffy psy-
rrespondientes se han articulado en cuatro grandes bloques: 1) el tipo de chometrics. This review and the guide with the corresponding recommen-
datos y la matriz de asociacin, 2) el mtodo de estimacin de factores, 3) el dations have been articulated in four large blocks: 1) the data type and the
nmero de factores a retener, y 4) el mtodo de rotacin y asignacin de matrix of association, 2) the method of factor estimation, 3) the number of
tems. Al final del artculo hemos incluido una versin breve de la gua. factors to be retained, and 4) the method of rotation and allocation of
Palabras clave: AFE; ACP; matriz de asociacin; estimacin de factores; items. An abridged version of the complete guide is provided at the end of
nmero de factores; rotacin de factores. the article.
Key words: AFE; PCA; matrix of association; factors estimation; number
of factors; factors rotation.

Introduccin han ido cambiando, en la actualidad coexisten los criterios


tradicionales, algunos francamente caducos, con los ms
El Anlisis Factorial exploratorio (AFE) de tems es una de modernos, y de ah viene la metfora del laberinto: el in-
las tcnicas ms frecuentemente aplicadas en estudios rela- vestigador, desconcertado en unos casos por el gran nmero
cionados con el desarrollo y validacin de tests, porque es la de posibilidades que han aparecido entre las que debe deci-
tcnica por excelencia que se utiliza para explorar el conjun- dir, o ignorante en otros casos porque desconoce esas nue-
to de variables latentes o factores comunes que explican las vas posibilidades, va abrindose paso tomando decisiones en
respuestas a los tems de un test. Si se hace una consulta cada una de las encrucijadas que se encuentra por el camino
acerca de qu se publica en relacin a este tipo de anlisis en hasta llegar al final confiando en su experiencia, en lo que
las revistas cientficas se encontrarn dos tendencias clara- han hecho otros antes que l, o en una combinacin de am-
mente separadas. Una, la ms numerosa, en que la tcnica se bas, pero sin saber a ciencia cierta si la salida que finalmente
aplica para identificar la estructura subyacente a los tems de encuentra es la principal o la de servicio.
un test. Este es un uso instrumental de la tcnica de anlisis. La paradoja que se da en este contexto es la siguiente: los
La otra, menos numerosa, en que se estudian y comparan los metodlogos buscan y encuentran mejores criterios para
diferentes criterios que habitualmente se aplican en la reali- aplicar el AFE, mientras advierten con unanimidad que los
zacin de un AFE, con otros de nueva creacin o no tan clsicos son en muchos casos inadecuados y peligrosos. Es
nuevos pero menos populares. Estos estudios investigan qu decir, abren nuevos y mejores caminos para encontrar la sa-
decisiones son ms adecuadas, segn las diferentes condi- lida del laberinto, y avisan de que otros son engaosos. En
ciones en que apliquemos esta tcnica. En este caso, la tc- cambio, los investigadores que hacen un uso instrumental
nica misma es el objeto de estudio, y es as porque las fases del AFE parecen desconocer en gran medida que los nuevos
por las que pasa el anlisis factorial requieren la aplicacin de caminos son mejores y que los antiguos son peligrosos, por
criterios de decisin que, como casi todo, han ido cambian- lo que continan recorriendo el laberinto, ajenos a las indi-
do a lo largo del tiempo, a mejor por supuesto. Pero aunque caciones que les avisan de por donde tienen que ir.
Claramente lo que est fallando, a nuestro juicio, es la
comunicacin, o la sealizacin, si pensamos en el laberinto.
* Direccin para correspondencia [Correspondence address]: De un lado, es necesario dar la mxima difusin a estos nue-
Susana Lloret Segura. Departamento de Metodologa de las Ciencias del
Comportamiento. Facultad de Psicologa. Universitat de Valncia. Avda.
vos criterios, porque hoy da ya se sabe cundo y por qu
Blasco Ibez, 21. 46022 Valencia (Espaa). funcionan mejor que los anteriores. De otro lado, es tambin
E-mail: Susana.Lloret@uv.es necesario exigir que se apliquen en las investigaciones actua-

- 1151 -
1152 Susana Lloret-Segura et. al.

les, por lo mismo, porque hoy da se sabe que funcionan me- (Journal of Applied Psychology, Personnel Psychology, Organizational
jor que los clsicos. Como sealamos anteriormente, cual- Behavior and Human Performance) en el periodo comprendido
quier camino no vale para salir del laberinto. entre 1985-1999 (se revisaron un total de 371 estudios).
El objetivo de este estudio es contribuir a difundir y a Conway y Huffcutt (2003), volvieron a confirmar la tenden-
aplicar estos nuevos estndares (y algunos no tan nuevos, cia a utilizar criterios ms modernos, aunque fue una ten-
que por ser sistemticamente ignorados, lo parecen). Lo ha- dencia minoritaria. Finalmente Henson y Roberts (2006) re-
remos de tres modos: primero, ofreciendo una revisin y visaron 60 artculos publicados en cuatro revistas (Educational
puesta al da de los estndares clsicos, y presentando los and Psychological Measurement, Journal of Educational Psychology,
nuevos estndares que los sustituyen. Segundo, revisando y Personality and Individual Differences y Psychological Assessment)
resumiendo el grado en que una variedad de software dispo- publicados hasta 1999. Su conclusin fue que la aplicacin
nible en el mercado -SPSS, FACTOR (Lorenzo-Seva y Fe- del AFE en los estudios revisados ofreca un patrn de erro-
rrando, 2006), LISREL (Jreskog y Srbom, 2007), y MPlus res comunes que se deban evitar.
(Muthn y Muthn, 2007)- permite o limita la aplicacin de Recientemente, Izquierdo, Olea y Abad (2013) presenta-
estos nuevos estndares. Y tercero, utilizando ese software ron una comunicacin que analiz el uso del AFE en los
para analizar la estructura factorial de tres escalas -D-48 aos 2011 y 2012 en las tres revistas espaolas con mayor
(Anstey, 1959. Adaptado por el Dpto. de I+D+i de TEA factor de impacto continuado en los ltimos 5 aos: Interna-
Ediciones, 1996), Autoestima y Autoconcepto, y Fuerza y tional Journal of Health and Clinical Psychology, Psicothema y Spa-
Flexibilidad (Marsh, Richards, Johnson, Roche, y Tremayne, nish Journal of Psychology. Sus resultados fueron una vez ms-
1994), utilizando datos reales para cada una, con la particula- similares: altas tasas de decisiones errneas o injustificadas.
ridad de que los datos de esas escalas se ajustan de manera A continuacin analizaremos en detalle cules son esas
inadecuada, moderada o satisfactoria, segn la escala, a los decisiones errneas, generalmente basadas en criterios o es-
supuestos del modelo del AFE clsico. Estos tres casos tndares clsicos ya desfasados, y qu otras recomendacio-
prcticos con datos reales nos permitirn comparar las con- nes guas- usar en su lugar.
secuencias de elegir entre un software u otro, y tambin las
consecuencias de elegir entre unas opciones u otras dentro Determinacin de la adecuacin del Anlisis
de un mismo software, cuando los datos son ms o menos Factorial Exploratorio
problemticos. Nuestro objetivo es claro: ilustrar cmo la
aplicacin adecuada o inadecuada del AFE puede llevar a En Psicologa, cuando hablamos de tests, hablamos en mu-
conclusiones muy diferentes. chos casos de variables latentes o rasgos que causan las res-
Este objetivo no es nuevo, en las ltimas dos dcadas al puestas a los tems de ese test. El objetivo del test es evaluar
menos 6 diferentes estudios de revisin del uso del AFE en el grado en que una persona queda caracterizada por un de-
la investigacin emprica en Psicologa han puesto de mani- terminado rasgo o variable latente, llmese extraversin, fac-
fiesto las limitaciones que caracterizaban a los estudios em- tor g, o estrs, a partir de las respuestas observadas a un
pricos que se estaban publicando. Los resumimos a conti- conjunto particular y bien escogido de tems las variables
nuacin. observadas-. (Si el test es multidimensional, entonces ten-
Ford, MacCallum y Tait (1986) revisaron los artculos dremos mltiples rasgos o variables latentes). El AFE, el
publicados en tres revistas (Journal of Applied Psychology, Per- Anlisis de Componentes Principales (ACP) y el Anlisis
sonnel Psychology, Organizational Behavior and Human Performance) Factorial Confirmatorio (AFC) son tcnicas utilizadas con
en el periodo comprendido entre 1975-1984 (revisaron un este propsito. Pero no son intercambiables. Cundo elegir
total de 152 estudios). Ford et al. (1986) concluyeron la apli- cada una de ellas? Vemoslo.
cacin del AFE en los estudios revisados resultaba deficien-
te. Casi 10 aos despus, Hinkin (1995) revis el uso del Cundo aplicamos Anlisis Factorial y cundo
AFE en el desarrollo de 277 escalas. Estas escalas aparecie- Componentes Principales?
ron en 75 artculos publicados en revistas acadmicas rele-
vantes en el periodo comprendido entre 1989 y 1994, y des- La clave est en el objetivo mismo del anlisis. Si el anli-
afortunadamente, lleg a una conclusin similar. Fabrigar, sis pretende identificar el nmero y composicin de los fac-
Wegener, MacCallum y Strahan (1999) revisaron 217 artcu- tores comunes (variables latentes) necesarios para explicar la
los publicados en dos revistas de investigacin psicolgica varianza comn del conjunto de tems analizado, entonces lo
(Journal of Personality and Social Psychology, Journal of Applied apropiado es aplicar un AFE. En este caso la representacin
Psychology) en el periodo comprendido entre 1991-1995. En algebraica del modelo para mp factores comunes tiene
este trabajo se lleg, una vez ms, a una conclusin similar a como ecuacin:
la que llegaron Ford et al. (1986), aunque se observ una X1=v1(1) F(1) + v1(2) F(2) ++v1(m) F(m)+ e1
tendencia a seguir alguna de las nuevas recomendaciones. X2=v2(1) F(1) + v2(2) F(2) ++v2(m) F(m)+ e2
Ms recientemente, Conway y Huffcutt (2003) realizaron
:
una revisin del uso del AFE en las mismas tres revistas de
:
psicologa organizacional que revisaron Ford et al. (1986)

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1153

Xp=vp(1) F(1) + vp(2) F(2) ++vp(m) F(m)+ ep El AFE parte del supuesto de que las variables observa-
donde Xj, Fi, y ej contienen la puntuacin de una persona en el tem Xj, el factor comn das son indicadores de cierto nmero de factores o variables
Fj, y el factor especfico ej, m: nmero de Factores comunes, p: nmero de tems, F: factor latentes comunes. Suponiendo que analizamos un conjunto
comn, vj(i) peso del factor comn iesimo asociado a la jesima variable observada o tem, de tems seleccionado para medir un nico factor, cada va-
i=1, 2,.., m; j= 1, 2,, p; ej: factor nico, j= 1, 2,, p. riable observada o tem que se analiza est cuidadosamente
seleccionado para que refleje alguna caracterstica del factor
En cambio, si el objetivo es identificar el nmero y com- que se pretende medir con l. Y por supuesto la idea bsica
posicin de componentes necesario para resumir las puntua- es que personas con diferentes niveles en el factor comn,
ciones observadas en un conjunto grande de variables ob- darn diferentes respuestas a ese tem, justamente porque el
servadas, entonces lo apropiado es aplicar un ACP. Este m- factor causa las diferentes respuestas a ese tem (el tems es
todo explica el mximo porcentaje de varianza observada en una manifestacin de ese factor). La variable independiente
cada tem a partir de un nmero menor de componentes que es el factor, que produce diferentes respuestas en los tems.
resuma esa informacin. En este caso, la representacin al- Los tems son las variables dependientes en este diseo. Es
gebraica del modelo para mp componentes principales tie- decir, bajo el AFE se asume que las medidas son reflecti-
ne como ecuacin: vas o manifestaciones de los constructos subyacentes
(Harman, 1976; Kim y Mueller, 1978, Bollen y Lennox,
CP1=w(1)1 X1+ w(1)2 X2++w(1)p Xp 1991; Edwards, 2011) Adems, por muy cuidadosa que sea
CP2=w(2)1 X1+ w(2)2 X2++w(2)p Xp la seleccin de los tems, es imposible que sean medidas per-
: fectas del factor comn correspondiente. Una parte de la va-
: riabilidad del tem estar directamente producida por el fac-
PCm=w(m)1 X1+ w(m)2 X2 ++w(m)p Xp tor que mide, pero otra parte no. Bajo el modelo clsico o
donde Xj,y CPj contienen la puntuacin de una persona en el tem Xj, y el componente teora clsica de tests, es posible estimar la parte de la varian-
CPi, m: nmero de componentes principales, p: nmero de tems o variables observadas, za de cada tem explicada por el factor comn subyacente a
x: tems o variables observadas, PC: componentes principales, wj(i) peso elegido para la je- ese conjunto de tems, precisamente a partir de la varianza
sima variable observada para maximizar la razn de la varianza del CP(i) respecto de la varian- comn entre ese tem y el resto de tems que miden ese mis-
za total, i=1, 2,.., m; j= 1, 2,, p. mo factor (a esta parte de la varianza del tem se le denomi-
na comunalidad). El resto de varianza del tem es varianza
Las diferencias entre la primera opcin (AFE) y la se- no comn (denominada unicidad), no contribuye a la medida
gunda (ACP), son evidentes. Las variables observadas de los factores comunes, y consecuentemente no se incluye
(tems) son las variables independientes en el ACP, pero las en el proceso de identificacin y estimacin de los factores
variables dependientes en el AFE. A nivel conceptual (y comunes. Aqu radica la segunda gran diferencia entre el
formal) la diferencia es enorme. En cambio, diferentes razo- AFE y el ACP: la inclusin de un trmino de error (e). Este
nes han llevado durante dcadas a una gran confusin entre trmino de error no existe en el ACP. El ACP no distingue
ambas, de forma que sistemticamente se ha aplicado una de entre varianza comn y varianza no comn (ver Joliffe,
esas tcnicas, el ACP, para conseguir el objetivo que corres- 2002, capitulo 7, para un tratamiento detallado y asequible
ponde a la otra, al AFE. Veamos por qu. de las semejanzas y diferencias entre ambos modelos de re-
En primer lugar, ambas tcnicas suelen aparecer juntas duccin de datos).
como tcnicas de reduccin de datos en los paquetes estads- Por ltimo, destacar que los factores comunes no se diri-
ticos ms comunes. Y eso contribuye a que parezcan inter- gen a explicar la mxima cantidad de varianza de cada tem
cambiables entre s, pero la realidad es bien diferente. El (como sucede con los componentes), solo la varianza comn
ACP es consistente con la conceptualizacin de medidas de cada tem con el resto, y esa varianza comn ya no est en los
formativas, en las que los indicadores se consideran causa de elementos de la diagonal de la matriz, sino en los elementos de
un posible constructo (Bollen y Lennox, 1991; Borsboom, fuera de la diagonal, estn expresados en trminos de covarianzas o de
Mellenbergh y van Heerden, 2003; Joliffe, 2002), aunque el correlaciones. Esos son ahora los elementos que trata de explicar el in-
modelo en s no haga referencia explcita a variables latentes. vestigador.
De hecho, ni los componentes son variables latentes, ni
los tems son ninguna medida indirecta de ellos. Los com- Cul es la recomendacin clsica?
ponentes son compuestos de las variables observadas que
cumplen la misin de reproducir el mximo de varianza de Claramente cuando analizamos los tems de un test en
cada variable observada con el mnimo nmero de compues- busca de la estructura factorial que le corresponde, estamos
tos. El objetivo est, pues, en la diagonal de la matriz, en las ubicados en el segundo de los escenarios arriba expuestos, es
varianzas de cada variable observada. Y como parte del decir, estamos bajo el modelo del anlisis factorial. Lo que
procedimiento para alcanzar este objetivo est la condicin sucede es que durante algunas dcadas la dificultad compu-
de que estos componentes presenten correlaciones nulas en- tacional de los procedimientos orientados a la estimacin de
tre ellos. factores comunes (FC) caractersticos del AFE excedan con
mucho la del procedimiento de identificacin de componen-

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1154 Susana Lloret-Segura et. al.

tes principales (CP), caracterstico del ACP hasta el punto de Por qu entonces se sigue usando?
que en ocasiones era imposible la obtencin de soluciones (o
las soluciones que aparecan eran inadecuadas, como cuando Evidentemente porque el mensaje an no ha llegado a
aparecan casos Heywood, es decir, tems con comunalida- todos los interesados, y porque la situacin se presta a esa
des de 1 o incluso mayores, o matrices no definidas positi- ambigedad: los programas de anlisis factorial incluyen,
vamente). El uso de CP como mtodo de para encontrar como hemos comentado ya, el mtodo de CP entre sus op-
una solucin inicial que identificara el nmero de dimensio- ciones de mtodos de estimacin de factores como una al-
nes necesarias para explicar el conjunto de tems no sufra ternativa ms, incluso como la opcin por omisin (y por lo
estos problemas, y esa solucin poda ser rotada en busca de tanto la de referencia). Y esta tendencia, desafortunadamen-
la estructura simple (ortogonal u oblicua) ms adecuada, de te, no ha ido a la baja.
la misma manera en que se hubiera rotado una solucin ini- Ford et al. (1986) abarcaron el periodo comprendido en-
cial obtenida por un procedimiento de FC. El mtodo de CP tre 1975-1984, y encontraron que el 42% de los estudios re-
se converta as en el mtodo de estimacin/extraccin de visados usaron CP, el 34% AFE, y el resto no inform del
factores (en realidad componentes) ms sencillo y eficaz. modelo empleado. Hinkin (1995), en el periodo comprendi-
Aparecieron estudios que sugeran que era razonable aplicar do entre 1989 y 1994, encontr que el 33% de los estudios
CP en el contexto de la estimacin de factores cuando 1) el revisados usaron CP, (slo un 20% aproximadamente us el
nmero de tems por factor era alto, y 2) los tems contenan modelo del AFE en alguna de sus variantes), y Fabrigar et al.
poco error de medida, ya que en estas condiciones particula- (1999) encontraron que este porcentaje aument hasta el
res la solucin obtenida por un procedimiento u otro eran 48%.
virtualmente equivalentes (Velicer y Jackson, 1990; Thom- Recientemente, Conway y Huffcutt (2003) realizaron una
pson, 2004). Y se extendi la idea de la equivalencia entre revisin del uso del AFE en las mismas tres revistas de psi-
ambas tcnicas. Una vez mostrada esta equivalencia para un cologa organizacional que revisaron Ford et al. (1986) e in-
conjunto de condiciones muy particulares, comenz el uso formaron de que la eleccin de este modelo sigui siendo la
intensivo de CP como mtodo de extraccin de factores ms frecuente en un 39.6% de los casos. Finalmente Henson
en el contexto del AFE cuando esas condiciones se daban, y y Roberts (2006) ofrecieron un porcentaje mayor de uso del
cuando no, tambin. No haba muchas ms alternativas, ACP en su estudio: 56.7%. En nuestro pas, Izquierdo y co-
as que el acuerdo tcito de usar una tcnica por otra se uni- laboradores (2013) presentaron la misma tendencia. Estos
versaliz. Y se convirti en la recomendacin clsica. resultados revelan claramente que es necesario insistir una
vez ms en la recomendacin de que, si lo que se pretende
Cul es la recomendacin actual? es analizar la correspondencia entre una serie de tems y el
conjunto de factores que pretenden medir esos tems, hay
Hoy da la eficiencia computacional del ACP frente al que aplicar AFE.
AFE ya no es tal. Disponemos de nuevas opciones de esti-
macin de factores (como el mtodo de factorizacin ULS Cundo aplicamos Anlisis Factorial Exploratorio
del que luego nos ocuparemos) que hacen posible la aplica- y cundo Confirmatorio?
cin del AFE en condiciones en que antes era imposible. As
que ya no tiene sentido el uso de CP como mtodo de esti- El AFE no permite al investigador definir qu tems mi-
macin de factores en el contexto del AFE. Por el contrario, den qu factores, ni tampoco las relaciones que se suponen
existen estudios empricos y de simulacin que desaconsejan entre los propios factores, -ms all de si estn o no relacio-
enrgicamente el uso de uno por otro porque pueden llevar nados entre s-. Se denomina exploratorio porque slo po-
a soluciones muy diferentes (Ferrando y Anguiano-Carrasco, demos determinar el nmero de factores que esperamos, pe-
2010; Gorsuch, 1997a; Vigil-Colet et al., 2009). ro no su composicin ni las relaciones que cada uno de los
Cuando se aplica en situaciones en las que un modelo factores mantiene con el resto. En cambio, el AFC se carac-
factorial es ms adecuado, el hecho de emplear CP como teriza por permitir al investigador definir cuntos factores
mtodo de estimacin de factores supone ignorar el error de espera, qu factores estn relacionados entre s, y qu tems
medida, lo que aumenta espuriamente las cargas factoriales, estn relacionados con cada factor.
los porcentajes de varianza explicados por los factores, y
puede producir una sobreestimacin de la dimensionalidad Cul es la recomendacin clsica?
del conjunto de tems (ver, por ejemplo, Abad, Olea, Ponso-
da y Garca, 2011; Ferrando y Anguiano-Carrasco, 2010; La recomendacin clsica (e.g., Mulaik, 1972), que toda-
Gorsuch, 1997a). Esto sucede al intentar encontrar compo- va sigue vigente (e.g., Matsunaga, 2010), diferencia entre el
nentes que expliquen el total de la varianza (la varianza co- anlisis factorial exploratorio (AFE) y el anlisis factorial
mn ms la varianza de error conjuntamente consideradas) confirmatorio (AFC) en funcin de su finalidad. Desde esta
en vez de dar cuenta nicamente de la comunalidad. De una perspectiva, ambos mtodos se utilizan para evaluar la es-
u otra forma, la interpretacin de la solucin obtenida me- tructura factorial subyacente a una matriz de correlaciones,
diante ACP podra ser errnea. pero mientras el AFE se utiliza para construir la teora, el

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1155

AFC se utiliza para confirmar la teora. De este modo, el cialmente si los factores estn correlacionados. Este proble-
AFE se utiliza cuando el investigador conoce poco sobre la ma ha sido discutido bastante a fondo en el trabajo de Fe-
variable o constructo objeto de estudio, y esta aproximacin rrando y Lorenzo-Seva (2000), y como indican los autores,
le ayuda a identificar los factores latentes que subyacen a las se trata principalmente de una acumulacin de errores de
variables manifiestas, as como los patrones de relaciones en- especificacin. La mayor parte de tems que se analizan en la
tre variables latentes y manifiestas. Por otra parte, cuando ya prctica no actan como marcadores (es decir, no son facto-
se tiene una idea clara sobre la variables objeto de estudio, el rialmente simples), y por lo tanto, presentan cargas cruzadas
uso del AFC permite probar la estructura hipotetizada, po- menores, pero no nulas, en los otros factores que supuesta-
niendo a prueba si el modelo hipotetizado se ajusta adecua- mente no miden. Cuando estas cargas cruzadas se fuerzan a
damente a los datos. cero, como sucede en el AFC, el ajuste del modelo se dete-
riora, ya que los residuales se van acumulando con cada
Cul es la recomendacin actual? error de especificacin. El deterioro del ajuste es mayor
cuanto ms largo el test (ms errores acumulados) y ms
En la actualidad existen dos tendencias. La primera, de- grande la muestra (mayor potencia).
rivada directamente de la aproximacin clsica, recomienda Para resolver este problema, la recomendacin actual
hacer un uso secuencial de ambos tipos de anlisis, siempre presenta diferentes alternativas. Una de ellas es el ESEM
que el tamao de la muestra lo permita. Se trata de dividir la (Exploratory Structural Equation Modeling), que representa un
muestra aleatoriamente en dos submuestras y explorar en la hbrido entre el AFE y el AFC. Se puede decir que el ESEM
primera muestra (con un anlisis factorial exploratorio, cla- es una alternativa semi-confirmatoria, ya que se encuentra a
ro) la estructura factorial subyacente a los tems, para luego medio camino entre ambas estrategias de anlisis en el con-
tratar de confirmar esa estructura en la otra mitad de la tinuo de restriccin que se indicaba ms arriba, y que integra
muestra, esta vez mediante un anlisis factorial confirmato- las ventajas de ambas aproximaciones.
rio (Anderson y Gerbing, 1988; Brown, 2006). El ESEM (e.g., Marsh et al., 2011; Morin, Marsh y Na-
Desde la segunda tendencia, se cuestiona la distincin gengast, 2013) es una aproximacin similar al AFC, pero
entre AFE y AFC con respecto a su finalidad (explorato- donde las saturaciones de los tems en los factores que no
ria/confirmatoria), indicando que tal diferenciacin no es les corresponden, -i.e. las saturaciones en los factores que
tan clara, y que plantea una serie de problemas (e.g., Ferran- supuestamente no miden (o cross-loadings)-, no se fijan a
do y Anguiano-Carrasco, 2010). Para empezar, es fcil com- cero. Por tanto, es menos restrictivo que el AFC, y se ajusta
prender que la mayor parte de las aplicaciones psicomtricas ms a la realidad de las medidas en Psicologa (donde habi-
del anlisis factorial se encuentran en algn punto interme- tualmente los tems no son marcadores o indicadores
dio entre la ausencia total de informacin sobre la variables perfectos del constructo que miden, sino que es habitual que
objeto de estudio, y la definicin clara de su estructura facto- los tems sean factorialmente complejos y presenten pesos
rial. Por ello, Ferrando y Anguiano-Carrasco (2010) han menores, aunque no nulos, en los otros factores). Por ello, el
propuesto establecer la diferenciacin entre las dos aproxi- ESEM consigue mejores ajustes que el AFC. Podramos de-
maciones, no en funcin de su finalidad, sino en funcin de cir que esta aproximacin se aleja de la estructura simple
las restricciones impuestas, de modo que el AFE y AFC, en propuesta por Thurstone (1947) en los inicios del AFE, que
lugar de ser considerados como dos categoras cualitativa- tanto tiempo ha dominado el panorama para acercarse ms a
mente distintas, deberan ser considerados ms bien los dos la tendencia actual de proponer modelos que se aproximen
polos de un continuo. As, el AFE (no restrictivo) impone suficientemente a la realidad, pero sin pretender reproducir-
restricciones mnimas para obtener una solucin factorial la, porque es imposible, o implausible.
inicial, que puede ser transformada aplicando diferentes cri- Otra alternativa, formulada inicialmente por Mulaik
terios de rotacin; y el AFC (restrictivo) impone restriccio- (1972) es especificar una solucin directamente interpretable
nes mucho ms fuertes que permiten poner a prueba una so- utilizando uno o dos marcadores por factor. Esta alternativa
lucin nica, cuyo ajuste puede ser evaluado utilizando dife- ha sido considerada tambin ms recientemente por McDo-
rentes ndices de bondad de ajuste (Hu y Bentler, 1999; Kli- nald (1999; 2000; 2005) con el nombre de independent-
ne, 2005; Marsh, Hau y Wen, 2004). cluster basis (I-CB). El concepto de I-CB hace referencia a
Continuando con esta segunda tendencia, diferentes au- una solucin factorial para un test multidimensional, en la
tores han puesto de manifiesto que el AFC falla en la con- que cada factor estar definido por un pequeo nmero de
firmacin de estructuras factoriales claramente apoyadas por tems factorialmente simples (marcadores). En concreto, el
los correspondientes anlisis exploratorios, porque es dema- requisito es que haya por lo menos 3 marcadores por factor
siado restrictivo (e.g. Ferrando y Anguiano-Carrasco, 2010; si los factores no estn correlacionados, y como mnimo 2
Ferrando y Lorenzo-Seva (2000); Marsh et al., 2009, 2010, marcadores por factor si los factores estn correlacionados
2011, 2014). Recurdese que en el modelo del AFC, algunas (McDonald, 1999). En una solucin semi-restringida, el res-
de las hiptesis plantean que las saturaciones de los tems en to de tems podran ser factorialmente complejos. Tal como
los factores que supuestamente no miden son nulas. sta es indican Ferrando y Lorenzo-Seva (2013), el cumplimiento de
una restriccin que no es realista en muchos casos, espe- la condicin I-CB es suficiente para identificar una solucin

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1156 Susana Lloret-Segura et. al.

sin indeterminaciones rotacionales, y es muy ventajosa en el ndice de homogeneidad corregido (correlacin tem-total
trminos de interpretacin. sin el tem analizado) y el coeficiente alfa si se elimina el tem
Finalmente, otra alternativa son las rotaciones semi- de la escala (o subescala, dependiendo de si el test es unidi-
especificadas o Procusteanas contra una matriz diana, que se mensional o est formado por varias subescalas).
pueden aplicar con el programa FACTOR. El lector intere-
sado puede consultar una aplicacin prctica de esta alterna- Recomendacin actual:
tiva en el trabajo de Ferrando, Varea, y Lorenzo (1999).
No existe pues una recomendacin universal respecto a Las recomendaciones clsicas siguen vigentes actualmen-
cundo aplicar AFE o AFC, pero lo que est claro es que sea te. Lo novedoso es que adems se han incorporado nuevas
uno u otro el modelo o la secuencia de modelos elegida, el recomendaciones que vienen a depurar an ms el proceso
investigador debe justificar su decisin adecuadamente. de seleccin de tems. La experiencia acumulada revela la
importancia de aspectos de tipo sustantivo como metodol-
Aspectos relacionados con el diseo: seleccin gico que resumimos a continuacin:
de tems, tamao y composicin de la mues-
A) El uso/abuso de tems redundantes deteriora la es-
tra, y nmero de tems por factor tructura factorial resultante. Los tems redundantes son
tems que expresan la misma idea con una redaccin mni-
Como en cualquier investigacin, la utilidad y generalizabili- mamente distinta. Tradicionalmente, se usan para evaluar la
dad de los resultados obtenidos con un AFE depender de consistencia de las personas, pero tambin para elevar la
la adecuacin del diseo de la investigacin, es decir, de la consistencia interna de las escalas (Ferrando y Anguiano-
seleccin de las variables que se van a medir, del procedi- Carrasco, 2010). El problema surge porque estos tems re-
miento de muestreo que se va a emplear, y del tamao de la dundantes comparten, como es natural, ms varianza que la
muestra, entre otras decisiones. En cambio los estudios em- que es directamente explicada por el factor comn. Tambin
pricos suelen descuidar esta fase de la investigacin (Fe- parte de la varianza nica en estos pares o tripletes de tems
rrando y Anguiano-Carrasco, 2010). Veamos detalladamente redundantes es compartida. Y cuando esto sucede, aparecen
cada uno de estos aspectos. factores comunes adicionales difciles de identificar y de ex-
plicar, especialmente tras rotar la solucin inicial.
Tamao y composicin de la muestra
B) Las distribuciones de los tems y el nmero de opcio-
Cmo se seleccionan los tems ms adecuados para construir el nes de respuesta tambin juegan un papel determinante. Si se
test? va a analizar la matriz de correlaciones de Pearson o la de
covarianzas (porque el programa que vamos a usar no per-
Uno de los primeros aspectos que ha de decidirse es el mite otra cosa), los tems han de ser variables continuas. Y si
subconjunto de items, de entre todos los posibles, que va a no lo son, como sucede cuando los tems a analizar son poli-
configurar la versin inicial del test. Si el subconjunto de tmicos (p.e. tipo Likert), la recomendacin que permite
tems omite aspectos relevantes de la variable latente que se aproximarnos adecuadamente al supuesto de continuidad en
desea medir, habr menos varianza comn de la que debiera este caso es utilizar tems con al menos cinco alternativas de
en el anlisis consiguiente, y los factores comunes resultantes respuesta y con distribuciones aproximadamente normales.
sern ms dbiles porque estarn insuficientemente defini- tems con menos categoras de respuesta o con distribucio-
dos. Si, por el contrario, se introducen tems irrelevantes, nes no normales deben analizarse como corresponde a su
aparecern factores comunes adicionales o se dificultar la naturaleza ordinal, es decir, usando la matriz de correlacio-
emergencia de los factores comunes objeto de medida. As nes policrica (para tems politmicos, o tetracrica, en caso
que la seleccin ms o menos adecuada de los tems que se de tems dicotmicos) (Bandalos y Finney, 2010). Ms ade-
van a incluir juega un papel determinante en la claridad de la lante volveremos sobre este punto.
estructura factorial identificada.
Cuntos tems conviene incluir por cada factor?
Recomendacin clsica:
Guadagnoli y Velicer (1988), MacCallum, Widaman,
La recomendacin clsica en la seleccin de los tems Preacher y Hong (2001) y MacCallum, Widaman y Zhang y
consiste en definir claramente y de forma exhaustiva el cons- Hong (1999) mostraron que el nmero de tems por factor
tructo a medir y a partir de esa definicin seleccionar los interacta con el tamao de las comunalidades de los tems y
tems de forma que cubran todo los aspectos relevantes en con el tamao de la muestra.
esa definicin. Esto es lo que desde el punto de vista clsico La prctica habitual es seleccionar tres tems por factor
se recoge bajo el epgrafe de validez de contenido. Adems, como mnimo. Sin embargo, esta prctica es contraprodu-
tambin se recomienda utilizar algunos criterios empricos cente, al comprometer la estabilidad de los resultados (Veli-
obtenidos durante la fase de anlisis de los tems, como son cer y Fava, 1998), especialmente cuando el tamao de la

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1157

muestra est por debajo de 150 personas (Costello y Osbor- 5:1. En un trabajo clsico Gorsuch (1983) sugiri una ratio
ne, 2005). de 5 sujetos por variable, y un tamao no menor de 100 per-
Como norma general, cuntos ms tems existan y midan sonas.
con precisin un factor, ms determinado estar el citado
factor y ms estable ser la solucin factorial. Los estudios Recomendacin actual:
revisados apuntan un mnimo de 3 o 4 tems por factor, so-
lo si se dispone de un mnimo de 200 casos (Fabrigar et al., En la actualidad, diferentes estudios de simulacin han
1999; Ferrando y Anguiano-Carrasco, 2010). revelado que el tamao muestral es un factor que interacta
con otros aspectos del diseo y de la naturaleza de los datos,
Idoneidad de la muestra como es la matriz que sirve de input al AFE, el nmero de
tems que definen el factor, la homogeneidad de la muestra
Qu tamao de muestra mnimo necesito? Qu aspectos de su y, muy especialmente, la comunalidad de los tems (Fabrigar
composicin hay que considerar? et al., 1999; Ferrando y Anguiano-Carrasco, 2010; Beavers et
al., 2013).
Que muestra se necesita para que una solucin sea esta- Respecto a la matriz input, se distingue entre la matriz de
ble y generalizable? Este es un problema complejo. La cues- correlacin producto-momento y la matriz de correlacin
tin del tamao y composicin muestral en el AFE ha sido policrica. La primera son medidas calculadas directamente
objeto de estudio por los investigadores durante dcadas. Es sobre datos empricos, mientras la de correlaciones policri-
habitual utilizar muestras de conveniencia (generalmente es- cas se obtiene a partir de estimadores indirectos de modo
tudiantes universitarios), pero tienen dos problemas: la no- iterativo y, en general, son mucho ms inestables. Por tanto,
representatividad y la atenuacin por restriccin de rango un AFE basado en la matriz de correlaciones policricas re-
(Ferrando y Anguiano-Carrasco, 2010). Resulta obvio que las querir ms muestra que un AFE basado en productos-
muestras ms grandes son mejores que las pequeas, pero momento para alcanzar el mismo nivel de precisin y estabi-
no siempre el investigador puede acceder a tamaos mues- lidad, si el resto de condicionantes se mantiene constante.
trales grandes, lo que ha propiciado un extenso nmero de
estudios ofreciendo un amplio listado de recomendaciones Respecto al resto de aspectos, podemos resumir las re-
no siempre acertadas acerca del tamao muestral mnimo en comendaciones como sigue:
el AFE (Guadagnoli y Velicer, 1988; Hogarty, Hines, 1) Condicin ptima: cuando las saturaciones son superiores
Kromrey, Ferron y Mumford, 2005). a .70, y el nmero de variables por factor es adecuado al
menos 6 tems por factor-, un tamao muestral de 150 o
Recomendacin clsica: 200 casos parece suficiente para obtener estimaciones
precisas de los coeficientes en el AFE (MacCallum et al.
Muchas de estas recomendaciones sobre el tamao 1999; Preacher y MacCallum, 2003). Incluso hay eviden-
muestral han sido objeto de estudio a travs de numerosos cia de que es suficiente con 100 casos (cuando hay tres
estudios empricos y de simulacin (Arrindell y van der En- factores con tres o cuatro tems cada uno, o cuando hay
de, 1985; MacCallum et al., 1999; Velicer y Fava, 1998), ms tems y factores pero las comunalidades son supe-
dnde se distinguen dos enfoques diferentes: 1) los que su- riores a .80 (Bandalos y Finney, 2010; Costello y Osbor-
gieren un tamao mnimo (N), y 2) los que defienden la ne, 2005; Guadagnoli y Velicer, 1988)).
proporcin de personas por tem (N/p). 2) Condicin moderada: cuando disponemos de comunali-
Algunos estudios clsicos del primer enfoque (Barrett y dades entre .40 y .70, y el nmero de variables por factor
Kline, 1981; Guadagnoli y Velicer, 1988) sugieren un tamao es de 3-4 tems, tambin se acepta un tamao de 200 ca-
muestral mnimo (N), que oscila entre 50 y 400 sujetos. sos, y por ltimo,
Comrey y Lee (1992, p. 217) sugirieron que: la adecuacin 3) Condicin mnima: cuando las comunalidades son bajas,
del tamao muestral poda ser evaluada con la escala siguien- en torno a 0.30, y el nmero de variables por factor es de
te: 50 -muy deficiente; 100 -deficiente; 200 -aceptable; 300 - 3 tems, se precisa una muestra mnima de 400 casos
bueno; 500 -muy bueno, 1000 o ms excelente. As que (Conway y Huffcutt, 2003; Gorsuch, 2003), incluso de
una de las recomendaciones clsicas por excelencia es que 500 o ms para conseguir estimaciones suficientemente
un tamao de 200 casos o ms (excepto en muestras clni- precisas (Hogarty et al., 2005).
cas) es suficiente para la mayor parte de los anlisis descrip-
tivos y psicomtricos de los tems, si el test a validar no es Actualmente, los criterios clsicos del tipo N/p y las re-
muy largo. Aunque se recomienda alcanzar los 500 o ms ca- cetas tradicionales tipo: 10 veces ms sujetos que tems en-
sos, siempre que sea posible (MacCallum et al. 1999). tre otras, se desaconsejan por completo, ya que no tiene nin-
Por otra parte, desde el segundo enfoque, basado en la guna base slida (Bandalos y Finney, 2010; Ferrando y An-
ratio personas/tems (N/p), la recomendacin ms habitual guiaga, 2010). De hecho, no existe una receta clara, ya que el
es la regla de los 10: una muestra 10 veces mayor que el tamao mnimo recomendado depende de todos los factores
nmero de tems (Velicer y Fava, 1998), y la proporcin de enumerados. Lgicamente, cuanto mayor sea el tamao

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1158 Susana Lloret-Segura et. al.

muestral del que dispongamos, ms confianza tendremos en nmero de opciones de respuesta es de 5 o ms, y de nuevo
que la solucin obtenida sea estable, especialmente si la co- la distribucin de los tems es aproximadamente normal. En
munalidad es baja, o cuando tengamos muchos posibles fac- este caso la asimetra tambin es un problema, porque se
tores a extraer y/o pocos tems por factor. Una cosa s pare- atenan las relaciones lineales entre tems que miden el mis-
ce clara: si alguien quiere evaluar la calidad de un test se re- mo rasgo, e incluso pueden dar lugar a relaciones no lineales
comienda un tamao muestral de al menos 200 casos como (consultar West, Finch y Curran, (1995) para una explicacin
mnimo, incluso en condiciones ptimas de comunalidades detallada de este aspecto). Otro factor a tener en cuenta es la
elevadas y factores bien determinados (Ferrando y An- discriminacin de los tems. Los tems con discriminaciones
guiano-Carrasco, 2010). intermedias no representan problema, pero cuando las dis-
criminaciones son extremas el coeficiente de correlacin de
Tipo de datos y matriz de asociacin. Adecuacin Pearson no es adecuado.
de los datos al Anlisis Factorial Estas recomendaciones clsicas, en cambio, han sido sis-
temticamente ignoradas en trabajos clave en la actualizacin
El AF clsico se ha desarrollado sobre el supuesto de de los criterios de decisin empleados en el AFE (Conway y
que los tems se relacionan linealmente con los factores que Huffcutt, 2003; Fabrigar et al., 1999; Henson y Roberts,
miden, y adems que las relaciones entre ellos son tambin 2006; Park, Dailey y Lemus, 2002; Prez y Medrano, 2010).
lineales (existen variantes de AF no lineal, pero no son el ob- Estos trabajos no contemplen el tipo de tems que se anali-
jeto de este trabajo). Si adems las variables son continuas o zan ni por lo tanto el tipo de matriz a utilizar. En estos estu-
se aproximan suficientemente a esta condicin, la matriz de dios slo se ha contemplado la posibilidad de analizar la ma-
correlaciones producto-momento de Pearson, o la matriz de triz de correlaciones producto-momento de Pearson, que
varianza-covarianza, resumir de forma adecuada las relacio- como vemos no es siempre la opcin adecuada. Esto, junto
nes entre los tems (mucho ms extendida la primera que la con el hecho de que el programa ms usado, SPSS, tampoco
segunda, sobre todo en el AFE, ver Brown (2006), pp 40- incluya en su configuracin original la posibilidad de analizar
42). En cambio, en Psicologa es muy frecuente utilizar la otro tipo de matriz que no sea la matriz de correlaciones
matriz de correlaciones de Pearson o la matriz de varianza- producto-momento (o la matriz de varianzas-covarianzas),
covarianza obtenida sobre tems ordinales sin determinar si ha contribuido a que la prctica habitual sea calcular la ma-
sus distribuciones cumplen este requisito. De hecho algunos triz de correlaciones producto-momento de Pearson sobre
programas no permiten usar otro tipo de matriz. tems ordinales, dicotmicos o politmicos, sin estudiar pre-
viamente las distribuciones de los items.
Recomendacin clsica:
Recomendacin actual:
La recomendacin clsica est dirigida a la matriz de co-
rrelaciones de Pearson como matriz de input. Este tipo de En la actualidad se sigue recomendando revisar las dis-
correlacin es adecuada para evaluar la relacin lineal entre tribuciones de los tems como paso previo, pero ahora
dos variables continuas y preferentemente de distribucin adems es posible usar otro tipo de matrices de asociacin si
normal. Los tems no son variables continuas, sino ordinales es conveniente: policrica (para tems politmicos) o te-
y discretas. Pero cuando su distribucin es aproximadamente tracrica, (en caso de tems dicotmicos), (Brown, 2006;
normal, el coeficiente de correlacin de Pearson sigue sien- Bandalos y Finney, 2010, Ferrando y Anguiano-Carrasco,
do una buena manera de estimar la relacin dos tems. Y 2010). Como en otras ocasiones, la aproximacin a la nor-
cundo es esa distribucin aproximadamente normal? En el malidad que se exige a las variables politmicos es mayor o
caso de tems dicotmicos cuando los ndices de dificultad menor dependiendo del autor que consultemos.Algunos au-
son moderados y homogneos (entre .40 y .60). O lo que es tores recomiendan las distribuciones con coeficientes de
lo mismo, los tems presentan dificultades intermedias y asimetra y curtosis en el rango (-1,1) (e.g., Ferrando y An-
consecuentemente distribuciones simtricas. Los tems guiano-Carrasco, 2010; Muthn y Kaplan, 1985, 1992).
con distribuciones asimtricas son especialmente problem- Otros en cambio consideran aceptable valores en el rango (-
ticos si adems las asimetras aparecen en ambas direcciones, 1.5, 1.5) (Forero et al., 2009), o incluso el rango [-2, 2] (Mu-
porque dan lugar a relaciones no lineales. Este problema, t- thn y Kaplan, 1985, 1992; Bandalos y Finney, 2010). En lo
pico de tests con tems muy fciles y muy difciles, est muy que s hay acuerdo, como comentamos con anterioridad, es
documentado en la literatura y da lugar a lo que se ha deno- en que el impacto negativo de la asimetra interacta con
minado como factores de dificultad, factores extra que otros factores como el tamao de la muestra o el nmero de
aparecen justamente por efecto de la asimetra de las distri- tems que definen cada factor (West, et al., 1995; Forero et
buciones de los tems (Embretson y Reise, 2000; Ferrando y al., 2009) de modo que la exigencia debe crecer a medida
Anguiano-Carrasco, 2010; McDonald y Ahlawat, 1974). que el resto de condiciones se vuelven ms desfavorables.
Si los tems son politmicos (tipo Likert), como ya anti- Se recuerda aqu que un AFE basado en la matriz de co-
cipamos, se considera que la aproximacin a la condicin rrelaciones policricas requerir ms muestra que un AFE
ideal de continuidad es razonablemente adecuada cuando el basado en la matriz de correlaciones productos-momento de

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1159

Pearson para alcanzar el mismo nivel de precisin y estabili- Cul es el mtodo de estimacin de factores
dad, por eso, si la muestra es pequea (200 sujetos) y las dis- ms adecuado?
tribuciones son adecuadas se recomienda factorizar la matriz
de correlaciones de Pearson. En caso de duda puede ser cla- Los mtodos de estimacin de factores recomendados habi-
rificador realizar el anlisis sobre las dos matrices. tualmente son Mxima Verosimilitud (MV) y Mnimos Cua-
Algunos ejemplos de software especfico que permite drados Ordinarios (MCO), si bien este ltimo, en realidad,
analizar la matriz de correlaciones ms adecuada es LISREL aglutina un conjunto de mtodos entre los que destacan ejes
(Jreskog y Srbom 2007) y MPlus (Muthn y Muthn 1998- principales y mnimos cuadrados no ponderados, basados en
2012). Tambin existe software especfico y de libre distri- un mismo principio: minimizar la suma de cuadrados de las
bucin, como FACTOR (Lorenzo-Seva y Ferrando, 2006) o diferencias entre las correlaciones observadas y las reprodu-
el paquete Psych en R (Revelle, 2014). Adems, es resalta- cidas por el modelo; es decir hacer que los residuales sean lo
ble que los usuarios de SPSS cuentan con TETRA-COM ms prximos a 0 posible (Ferrando y Anguiano-Carrasco,
(Lorenzo-Seva y Ferrando, 2012a), un programa para SPSS 2010).
que estima la matriz tetracrica. Recientemente ha aparecido Mxima verosimilitud: Este mtodo es inferencial
una rutina desarrollada por Basto y Pereira (2012), que (Lawley y Maxwell, 1971). Es un mtodo de estimacin fac-
permite tambin implementar la matriz de correlaciones po- torial que proporciona las estimaciones de los parmetros
licrica en el anlisis con SPSS. que con mayor probabilidad han producido la matriz de co-
Por ltimo, pero no menos importante, cualquiera que rrelaciones observada, si la muestra procede de una distribu-
sea el caso, se recomienda analizar tambin las distribuciones cin normal multivariada con m factores latentes. Las corre-
bivariadas de cada par de tems, como sealaron reciente- laciones se ponderan por la inversa de la unicidad de las va-
mente Prez y Medrano (2010), para identificar patrones de riables, y se emplea un algoritmo iterativo para la estimacin
relaciones no lineales entre los tems. Estos patrones viola- de los parmetros. Este mtodo, frente a otros, tiene la ven-
ran el supuesto de linealidad del AFE y de nuevo aadiran taja de que permite contrastar el ajuste del modelo a los da-
ruido a la matriz a analizar y confusin a la estructura facto- tos a travs de un ndice que sigue una distribucin ji-
rial identificada. cuadrado, y obtener los errores tpicos y pruebas de signifi-
cacin alrededor de los parmetros estimados.
Adecuacin de los datos al Anlisis Factorial Una de las desventajas de MV, sin embargo, es que re-
quiere el cumplimiento del supuesto de normalidad multiva-
Cualquiera que sea la matriz que se vaya a factorizar, es riada. Algunos autores como Finney y DiStefano, (2006) re-
necesario previamente comprobar su grado de adecuacin al comiendan contrastar este supuesto de normalidad multiva-
AF. Una de las formas ms comunes de evaluar este aspecto riada -como hace el programa FACTOR (Lorenzo-Seva y
es a travs del clculo de la medida KMO de Kaiser (1970). Ferrando, 2006) y los programas del entorno de los modelos
Esta refleja la influencia de todos los factores que hemos de ecuaciones estructurales MEE-. Yuan y Bentler (1998)
comentado: tamao de las correlaciones entre los tems, ta- son menos estrictos, y sugieren que este supuesto es poco
mao de la muestra, numero de factores y numero de tems. realista en psicologa. En cualquier caso, existe abundante li-
Esta medida de adecuacin indica cun grande es la correla- teratura basada en estudios de simulacin que muestra que el
cin entre las variables medidas. Si las correlaciones son su- mtodo de MV es robusto al incumplimiento de este supues-
ficientemente grandes, la matriz se considera adecuada para to cuando las variables tienen una distribucin univariada
su factorizacin porque ofrecer resultados estables, replica- aproximadamente normal (e.g., Muthn y Kaplan, 1985,
bles en otras muestras diferentes, independientemente del 1992; West et al., 1995; Forero, Maydeu-Olivares, y Gallar-
tamao de la muestra, o del nmero de factores, o del n- do-Pujol, 2009). Otra de las desventajas de este mtodo de
mero de tems. De otro modo, si KMO es suficientemente estimacin es que el ndice referido a la distribucin ji-
grande, los resultados no sern casuales. Kaiser consideraba cuadrado es muy sensible al tamao muestral, (Tabachnick y
una matriz con valores para KMO por debajo de .50 inade- Fidell, 2001; Brown, 2006). Adems, Ferrando y Anguiano-
cuada para el AF; mediocre si estos valores oscilaban en- Carrasco (2010) recuerdan que esta prueba asume que el
tre.60 y .69; y satisfactoria solo valores de .80 en adelante. modelo propuesto con m factores se ajusta perfectamente a
En cambio, en nuestra experiencia son muchos autores que la poblacin, y por tanto, que todo el error es muestral, y no
han recogido nicamente el primero de los valores (.50), que una parte de ese error sea error por aproximacin (el
como punto de corte (vase por ejemplo Ferguson y Cox, grado en que el modelo es una aproximacin razonable a lo
1993; Hair, Anderson, Tatham y Black, 2005; Tabachnick y que sucede en la poblacin, dados los datos observados en la
Fidell, 2001). Otros autores consideran ms adecuado in- muestra). Todo ello lleva a rechazar modelos que s suponen
crementar el listn a .70 e incluso .80 (junto por ejemplo una buena aproximacin a la estructura factorial latente, en
Costello y Osborne, 2005; Ferrando y Anguiano-Carrasco, favor de modelos con ms factores de los que tienen signifi-
2010). Los resultados del estudio emprico que presentare- cado terico, es decir, modelos sobrefactorizados. Por eso,
mos en la segunda parte de este trabajo apoyan este valor. en la prctica se suelen considerar otros indicadores de ajus-

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1160 Susana Lloret-Segura et. al.

te derivados del test ji-cuadrado que evalan el error de mar la matriz factorial en la primera iteracin. A partir de es-
aproximacin y el grado de ajuste del modelo. De ellos nos ta matriz factorial se reestiman las comunalidades, que susti-
ocuparemos en otra seccin. tuyen a las iniciales. El proceso iterativo contina hasta que
En consecuencia, las diferencias entre las comunalidades de dos iteraciones su-
A) se recomienda usar el mtodo MV, factorizando la cesivas son tan pequeas que se alcanza el criterio de con-
matriz de correlaciones producto-momento de Pearson, vergencia, o hasta que se llega a un nmero mximo de ite-
si los tems tienen un nmero suficiente de categoras de raciones. El objetivo es conseguir la mejor estimacin posi-
respuesta (5 o ms), o son continuos (cosa bastante ms ble de las comunalidades a partir del nmero de factores re-
improbable), y adems se cumple razonablemente el tenidos. La adecuacin del mtodo de ejes principales, en
supuesto de normalidad, para que pueda observarse la cualquier caso, depende de la calidad de las estimaciones ini-
relacin lineal asumida en las relaciones bivariadas entre ciales de las comunalidades. Cuando se aplica de forma itera-
los tems (Flora, LaBrish y Chalmers, 2012). Tambin se tiva, se consiguen resultados ms similares a los obtenidos
recomienda considerar otros indicadores de ajuste mediante otros mtodos como el mtodo de mnimos cua-
derivados del test ji-cuadrado que evalen el error de drados no ponderados (ULS -Unweighted Least Squares, Jo-
aproximacin y el grado de ajuste del modelo. reskg, 1977). Este mtodo, en vez de usar la matriz reduci-
B) No se recomienda analizar las matrices de correlaciones da como input, con las comunalidades estimadas en la dia-
policricas mediante MV, porque aunque las gonal, minimiza la suma de los cuadrados de las diferencias
estimaciones de los parmetros son generalmente entre las matrices de correlaciones observadas y reproduci-
insesgadas (Bollen, 1989), e incluso reproducen mejor el das. Este mtodo es el ms recomendado actualmente (ver
modelo de medida que el anlisis de correlaciones por ejemplo Flora et al., 2012), porque funciona bien cuando
producto-momento cuando algunos de los tems se trabaja con muestras pequeas incluso cuando el nmero
incumplen el supuesto de normalidad (ver Holgado-Tello de variables es elevado, especialmente si el nmero de facto-
et al., 2010) hay que tener en cuenta que las pruebas de res a retener es pequeo (Jung, 2013). Adems evita la apari-
bondad de ajuste basadas en ji-cuadrado, as como los cin de casos Heywood (saturaciones mayores que la unidad
errores tpicos (y por lo tanto las pruebas de significacin y varianzas de error negativas), ms frecuentes con otros
de los parmetros) estn sesgados (Bollen, 1989; Satorra mtodos de estimacin. Cabe sealar que el mtodo ULS es
y Bentler, 1994), por lo que debera evitarse la virtualmente intercambiable con el mtodo de Residuales
interpretacin de los mismos. Cuando se analiza la Mnimos (MinRes) (Harman y Jones, 1966, Joreskg, 1977).
matriz de correlaciones policricas se recomienda usar Dependiendo del software que se utilice, dispondremos de
MCO (e.g. Flora, et al., 2012; Forero et al., 2009; Lee, un mtodo de estimacin u otro.
Zhang y Edwards, 2012) Ferrando y Anguiano-Carrasco (2010) afirmaron que en
una situacin en que (a) las variables tienen distribuciones
Mnimos Cuadrados Ordinarios: Aqu se agrupan una serie aceptables, (b) la solucin est bien determinada, y (c) el
de mtodos descriptivos que tienen como denominador co- modelo propuesto es razonablemente correcto, las solucio-
mn que determinan la solucin factorial que hace que los nes MCO y MV sern prcticamente idnticas. En este caso,
residuales sean tan prximos a cero como sea posible. El uso MV tiene la ventaja de que permite obtener indicadores adi-
de estos mtodos ha mostrado buenos resultados en la fac- cionales muy tiles en la evaluacin del ajuste. (p. 28) En
torizacin de tems ordinales cuando se analiza la matriz de caso contrario, aparecern problemas de convergencia y es-
correlaciones policricas (Forero et al., 2009; Lee et al., timaciones inaceptables e indicadores poco fiables. En estos
2012). casos los autores recomiendan utilizar MCO.
Entre estos mtodos el mtodo de Ejes Principales ha Cabe aadir que si bien se han propuesto algunos mto-
sido la opcin clsica recomendada cuando no se cumple el dos de estimacin robustos a la violacin del supuesto de
supuesto de normalidad, lo cual es ms y ms probable se- normalidad multivariada (e.g., Mnimos Cuadrados Pondera-
gn se reduce el nmero de categoras de respuesta (Fabrigar dos (WLS en ingls), Mnimos Cuadrados Ponderados Ro-
et al. 1999). El mtodo de ejes principales se puede aplicar bustos (o WLSMV en ingls) o Mxima Verosimilitud Ro-
de forma no iterativa, emplendose como estimaciones ms busta), stos se han aplicado ms en modelos confirmatorios
habituales de las comunalidades la correlacin mltiple al que en exploratorios. Algunos programas como Mplus s
cuadrado entre cada variable observada y el resto. Estas sus- tienen implementados algunos de estos mtodos tanto para
tituyen los valores diagonales de la matriz de correlaciones, el AFC como para el AFE. Estos mtodos robustos (la utili-
dando lugar a lo que se denomina matriz de correlaciones zacin de uno u otro dependera del tamao muestral) son
reducida, que es el input para el anlisis factorial. Sin em- los ms recomendados cuando se analizan datos ordinales
bargo, en la mayora de programas, en sus versiones ms re- alejados de la normalidad en los modelos de ecuaciones es-
cientes, el mtodo de ejes principales se aplica por defecto tructurales en general, y en el AFC, en particular (e.g., Cu-
de forma iterativa. Tras estimar las comunalidades iniciales, rran, West y Finch, 1996; Flora y Curran, 2004). Sin embar-
la matriz reducida se auto-descompone en sus autovalores y go, en el caso del AFE todava es necesario realizar estudios
autovectores; estos autovectores se reescalan y pasan a for- de simulacin que permitan comparar las ventajas de estos

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1161

mtodos robustos frente a otros como ULS (ms all de la matriz de correlaciones original, y no la reducida (Ford et al.,
posibilidad de ofrecer ndices de bondad de ajuste) o incluso 1986).
MV, cuando los datos sigan una distribucin que se desve Los otros criterios clsicos que se han usado en menor
de la normalidad. Lo mismo puede decirse de las estimacio- medida en combinacin con la regla de Kaiser son: 1) la so-
nes bayesianas (Muthen y Asparouhov, 2012). lucin que ofrece la mejor interpretacin posible, y 2) el
nmero de factores basado a priori en la teora (Conway y
Cmo se selecciona el nmero de factores Huffcutt, 2003; Fabrigar et al., 1999; Ford et al., 1986).
ms adecuado?
Recomendacin actual:
Este es quiz de todos, el aspecto ms determinante de un
AFE. El nmero de factores comunes que hacen falta para Hoy en da, la regla de Kaiser es la ms desaconsejada de
explicar las relaciones entre los tems, y la composicin de todas las opciones posibles, aunque a pesar de ello sigue
esos factores, son las dos cuestiones centrales en la interpre- siendo la ms utilizada (Costello y Osborne, 2005). Por
tabilidad de la estructura factorial obtenida en el anlisis. Si ejemplo, Lorenzo-Seva, Timmerman y Kiers (2011) directa-
se retienen menos factores de los debidos, los patrones de mente excluyeron este criterio del estudio de simulacin que
saturaciones resultantes se vuelven ms difciles de interpre- llevaron a cabo por ser claramente inadecuado. Adems, Fe-
tar, y por lo tanto los factores identificados resultan confu- rrando y Anguiano-Carrasco (2010) afirmaron que uno de
sos, y si se retienen ms, entonces se estn fabricando va- los inconvenientes ms importantes de este procedimiento
riables latentes con poco sentido terico o sustantivo. La de- reside en que el nmero de factores que identifica est en re-
cisin es importante, y es quiz por ello uno de los aspectos lacin directa con el nmero de tems que se analicen; si se
en que ms opciones han aparecido. Vemoslo. analizan n variables, el nmero de factores que obtendr esta
regla oscilar entre n/5 y n/3, sea la escala unidimensional o
Recomendacin clsica: no. Igualmente, Lorenzo-Seva et al. (2011) excluyeron el
Scree test, en este caso porque la subjetividad que entraa
La recomendacin clsica en este punto es utilizar la re- resulta difcilmente programable, por lo que no se puede in-
gla de Kaiser: seleccionaremos los factores con valores pro- troducir en un estudio de simulacin como el que ellos lleva-
pios mayores que 1 que extraemos de la matriz de correla- ron a cabo. Fabrigar et al. (1999) apoyaron su buen funcio-
ciones original (y no de la matriz reducida, es decir, la matriz namiento cuando los factores comunes estn claramente de-
con las comunalidades en la diagonal). La regla de Kaiser se finidos.
ha venido usando de forma rutinaria dentro del pack cono- En la actualidad se recomienda con insistencia que la de-
cido como Little Jiffy que comprende la aplicacin del cisin acerca del nmero de factores se tome tras considerar:
ACP con la regla de Kaiser y el mtodo de rotacin Vari- 1) varios criterios objetivos, y siempre teniendo en cuenta 2)
max. Esta regla fue propuesta por Kaiser en 1957 como al- la interpretabilidad de la solucin encontrada y 3) la teora de
ternativa computacionalmente eficaz a las opciones ms partida (Lorenzo-Seva et al., 2011).
adecuadas, pero computacionalmente mucho menos eficien- Los criterios objetivos disponibles tras el anlisis varan
tes basadas en AFE y en rotaciones oblicuas. Claro que eso mucho dependiendo en gran medida del programa que se
fue en 1957, y mucho han cambiado las cosas como para use, y en menor medida del mtodo de estimacin de facto-
que sigamos empleando an los mismos procedimientos. Sin res.
embargo, los estudios que han revisado la forma en que se El Anlisis Paralelo (AP) selecciona los componentes o
viene aplicando el AFE en la investigacin desde 1975 hasta factores comunes que presentan valores propios mayores
actualidad muestran cmo este criterio es el ms utilizado que los que se obtendran por azar (Horn, 1965). La idea es:
solo o en combinacin con algn otro (Conway y Huffcutt, si la matriz analizada procediera de una poblacin en que los
2003; Fabrigar et al., 1999; Henson y Roberts, 2006; Park et tems no estuvieran relacionados, qu valores propios po-
al., 2002; Prez y Medrano, 2010) tanto cuando se utiliza dran alcanzar los factores comunes extrados de esa matriz?
ACP como cuando se utiliza AFE. Afortunadamente, los es- Y cuntos factores comunes de los que hemos obtenido
tudios ms recientes sealan que la frecuencia con que se usa sobre la matriz analizada superan esos valores propios es-
esta regla como nico criterio est disminuyendo en favor purios? La respuesta a esta pregunta ofrece el nmero co-
del aumento de casos en que se utiliza en combinacin con rrecto de factores comunes. Esta tcnica fue desarrollada pa-
otros criterios (Conway y Huttcuff, 2003; Henson y Roberts, ra ser utilizada sobre la matriz de correlaciones original (co-
2006). mo la regla de Kaiser o el Scree test) y no sobre la matriz de
El criterio que ms se combina con la regla de Kaiser es correlaciones reducida. No obstante, se ha recomendado su
el grfico de sedimentacin o Scree test (Cattell, 1966). Este uso tambin para identificar el nmero de factores comunes
criterio tambin se usa con AFE, aunque en realidad lo que (Hayton et al., 2004; Lorenzo-Seva et al. 2013; Peres-Neto,
se analiza como en el caso de la regla de Kaiser suele ser la Jackson y Sommers, 2005; Velicer et al., 2000).
En cambio, a pesar de ser recomendado en numerosos
estudios, este criterio se utiliza escasamente. Una vez ms la

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1162 Susana Lloret-Segura et. al.

explicacin hay que buscarla en la accesibilidad del procedi- mendaciones de su uso en los trabajos de Browne y Cudeck
miento, ya que SPSS, el programa ms utilizado por los in- (1993), Fabrigar et al. (1999), Ferrando y Anguiano-Carrasco
vestigadores en ciencias sociales, no lo implementa en su re- (2010) y Lorenzo-Seva et al. (2011). Este ndice estima el
pertorio. Afortunadamente, ya hay una rutina en R que per- error de aproximacin del modelo propuesto. Se trata de un
mite estimar AP y otros criterios para la identificacin del ndice relativo a los grados de libertad del modelo, por lo
nmero de factores en el contexto del programa SPSS (Bas- que puede favorecer la seleccin de modelos ms complejos.
to y Pereira, 2012), programas para SPSS y SAS que deter- Valores por debajo de .05 se consideran excelentes, en tanto
minan el nmero de componentes mediante AP y MAP de que valores mayores que .08 indicaran ajuste insuficiente.
Vellicer ( O'Connor, 2000), y un programa especficamente Por ltimo, otro criterio aplicado en el contexto del ACP
destinado a AP en Internet: ViSta-PARAN (Ledesma y Va- que se ha generalizado tambin al AFE, es el Minimum Ave-
lero-Mora, 2007). El programa de libre distribucin FAC- rage Partial Test (MAP) (Velicer, 1976). Este procedimiento
TOR (Lorenzo-Seva y Ferrando, 2006) tambin implementa se centra en identificar el nmero de componentes que
los ltimos adelantos en este y otros aspectos del anlisis ofrezca la correlacin parcial mnima entre los residuales re-
factorial y adems, es tambin de libre distribucin. sultantes. Ziwck y Velicer (1986) indicaron que este proce-
Tres criterios actualmente recomendados parten de una dimiento fue adecuado para identificar el nmero de com-
lgica diferente al AP. Todos ellos se basan en la evaluacin ponentes. Tambin se ha aplicado a la identificacin del n-
de las correlaciones residuales. La idea es que si se ha extra- mero de factores comunes. Este criterio se encuentra en la
do el nmero de factores comunes adecuado, no debe que- rutina en R antes mencionada que permite mejorar las pres-
dar idealmente varianza comn y por lo tanto las correlacio- taciones del programa SPSS en el AFE (Basto y Pereira,
nes residuales tendern a cero. Estos criterios son: 1) la ins- 2012), en el programa desarrollado por OConnor (2000), y
peccin directa de la distribucin de los residuales tipificados tambin en el programa FACTOR (Lorenzo-Seva y Ferran-
(mediana y valores extremos, que indicarn entre qu varia- do, 2006).
bles est el problema); 2) la raz media cuadrtica residual En cuanto a la interpretabilidad de la solucin, diremos
(RMCR) y 3) el ndice gamma o GFI (Tanaka y Huba, 1989). que es fundamental en la valoracin de lo que sugieran los
Los dos ltimos surgieron en el contexto de un marco ms indicadores objetivos que hayamos considerado. De poco
general: los MEE. sirve que un modelo con 2 factores ajuste mejor que otro
El RMCR es un estadstico descriptivo que condensa la con 3, si el tercer factor est pobremente definido (con me-
informacin contenida en la matriz de correlaciones residua- nos de 3 tems con saturaciones superiores a .30, por ejem-
les. Es una medida de la magnitud media de las correlaciones plo), o no puede ser interpretado por carecer de contenido.
residuales. Habitualmente, se ha utilizado la indicacin de En este sentido hay que destacar la tendencia en las ltimas
Harman (1980) que propone como valor de referencia .05 dcadas (Fabrigar et al. 1999, Lorenzo-Seva et al. 2013) hacia
para considerar un ajuste aceptable. Lorenzo-Seva y Ferran- distinguir entre factores comunes mayores y menores. Los
do (2006) recomendaron, en cambio, utilizar el criterio pro- factores comunes mayores son los que interesa retener, por-
puesto inicialmente por Kelley (1935); Kelley utiliz como que son los que explican una parte realmente sustantiva de
valor de referencia el error tpico de un coeficiente de corre- los tems que forman la escala. Los factores comunes meno-
lacin de cero en la poblacin de que proceden los datos, y res tambin explican una parte de la varianza comn, pero es
que es aproximadamente 1/N (ver Ferrando y Anguiano- una parte pequea, que no llega a ser interpretable en trmi-
Carrasco, 2010). El RMCR puede utilizarse con cualquier nos sustantivos en el contexto de lo que se desea medir con
mtodo de estimacin de factores, aunque no est imple- ese conjunto de tems. El ejemplo de Lorenzo-Seva et al.
mentado en los programas generalistas como SPSS. (2013) es clarificador: si dos tems que miden diferentes ras-
El GFI es una medida de bondad de ajuste normada que gos de personalidad tienen como denominador comn la si-
oscila entre 0 y 1 que tambin puede usarse con la mayor tuacin en que se sita a la persona, es posible que ese de-
parte de los mtodos de extraccin de factores, aunque tam- nominador comn produzca cierta covarianza entre las res-
poco es habitual en programas generalistas como SPSS. In- puestas de las personas, y aparezca un factor comn menor
dica la proporcin de covariacin entre los tems explicada que explique esa covarianza. Aunque claro est, ese factor
por el modelo propuesto, es por tanto una especie de coefi- comn no tendr significado sustantivo, sino circunstancial.
ciente de determinacin multivariado. Valores superiores a En consecuencia, la recomendacin actual ya no es explicar
0.95 son indicadores de buen ajuste del modelo (Ruiz, Pardo la mayor parte de varianza comn posible, sino la mayor par-
y San Martin, 2010). te de la varianza comn posible de explicar con el nmero
El RMSEA (Steiger y Lind, 1980) es un ndice basado en adecuado de factores comunes, que sern aquellos factores
el estadstico ji-cuadrado, por lo que solo puede obtenerse que tengan sentido. Se trata, como el lector habr ya adivi-
con aquellos procedimientos de estimacin de factores que nado, del eterno dilema entre parsimonia y plausibilidad.
lo ofrecen, lo que depende del software que utilicemos (por Un criterio que no se recomienda es la interpretacin de
ejemplo FACTOR lo incluye para ULS y MV, pero no est la varianza explicada, porque no es un indicador satisfactorio
disponible en los programas generalistas como SPSS, aunque de la adecuacin del nmero de factores comunes identifica-
si puede ser calculado por el usuario). Encontramos reco- dos, como pudiera parecer a simple vista. La varianza comn

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1163

a los tems no se puede repartir entre los diferentes factores ficients). Los primeros se encuentran en la matriz de configu-
comunes (excepto bajo un mtodo de estimacin: el Anlisis racin, y los segundos en la matriz de estructura. En el AFE,
Factorial de Rango Mnimo). Si lo hiciramos algunos de los la matriz de estructura ofrece las correlaciones entre las va-
valores propios seran negativos, porque de otro modo es riables observadas (tems) y las variables latentes (factores).
muy probable que la suma de la varianza comn explicada Cuando se utiliza rotacin ortogonal, como se asume que los
por cada factor sobrepasase la varianza comn total, preci- factores no estn correlacionados, la matriz de estructura y la
samente por eso, porque es comn, y aparece contada en matriz de configuracin son exactamente iguales, por lo que
la parte comn de la varianza en diferentes tems. Puede ser suficiente con aportar la matriz de coeficientes patrn.
consultarse una explicacin ms detallada en Lorenzo-Seva, Sin embargo, cuando se utiliza rotacin oblicua, la matriz de
U. (2013). Tambin puede consultarse Bandalos y Finney correlaciones entre factores no es una matriz identidad, de
(2010). tal suerte que la matriz de estructura y la matriz de configu-
En resumen, la recomendacin es utilizar una combina- racin no ofrecern los mismos coeficientes. En rotacin
cin de criterios objetivos y de criterios basados en la teora oblicua, se deber aportar ambas matrices, y la interpretacin
y la interpretabilidad de la solucin, y usar esta combinacin de los resultados se deber hacer en primer lugar teniendo
para comparar las diferentes soluciones alternativas. La so- en cuenta los coeficientes de estructura, y posteriormente se
lucin ptima ser la que presente la combinacin ms plau- examinarn los coeficientes patrn (Courville y Thompson,
sible y a la vez ms parsimoniosa. Hay que tener en cuenta 2001; Gorsuch, 1983; Henson y Roberts, 2006; Thompson y
que el programa que se utilice para el anlisis limitar en gran Borrello, 1985).
medida, junto con el mtodo de estimacin de los factores Los criterios de rotacin ms ampliamente conocidos, y
comunes, el tipo concreto de criterios objetivos que poda- que se encuentran disponibles en la mayor parte de los pro-
mos usar. La recomendacin es abandonar aquellos progra- gramas comerciales de anlisis estadstico, son: Varimax
mas que no permitan usar los mejores mtodos, a menos (Kaiser, 1958) en rotacin ortogonal, y Oblimin directo
que sepamos que hay una macro que lo remedie. Se des- (Clarkson y Jennrich, 1988) y Promax (Hendrickson y White,
aconseja el criterio ms utilizado en todos los estudios revi- 1964) en rotacin oblicua. Varimax ha sido propuesto como
sados: la regla de Kaiser, y recomendamos incorporar los un criterio de rotacin ortogonal cuando no hay un factor
procedimientos basados en: 1) el AP, 2) el mtodo MAP o dominante, mientras que Quartimax ha sido propuesto co-
3) el indicador de ajuste RMSEA, si es posible. No se pue- mo un criterio ortogonal alternativo cuando se espera un so-
den hacer recomendaciones de carcter universal ms all. lo factor general (Carroll, 1953). Por su parte, Equamax
El lector interesado puede encontrarse informacin ms de- combina ambos criterios (un solo factor/varios factores) y
tallada sobre estos y otros mtodos y sobre su funciona- lleva a soluciones intermedias. Tambin se han formulado
miento en un estudio de simulacin en Lorenzo-Seva et al. versiones ponderadas del criterio Varimax (e.g., Cureton y
(2013). Mulaik, 1975).
En rotacin oblicua, el criterio ms utilizado ha sido
Qu tipo de rotacin de factores y qu crite- Oblimin directo. El criterio Quartimin (Jennrich y Sampson,
rio de asignacin de tems a los factores de- 1966) es equivalente al criterio Quartimax, pero en rotacin
oblicua. Otros criterios han sido propuestos recientemente,
bemos emplear? muchos de ellos prcticamente desconocidos para los usua-
rios habituales de AFE, como, por ejemplo, Geomin (Yates,
Despus de la fase de estimacin de factores, la solucin 1987), Promin (Lorenzo-Seva, 1999) y Oblimin ponderado
es rotada para conseguir la mayor simplicidad e interpretabi- (Lorenzo-Seva, 2000). Para una presentacin detallada de di-
lidad. ferentes criterios de rotacin recomendamos los trabajos de
Browne (2001), y Sass y Schmitt (2010).
Recomendacin clsica: Aunque tradicionalmente se han formulado los diferen-
tes criterios de rotacin bajo un mtodo concreto (ortogonal
Thurstone (1947) sugiri que los factores fueran rotados u oblicuo), desarrollos de software ms recientes ponen de
en un espacio multidimensional para conseguir la solucin manifiesto que un mismo criterio puede estar disponible uti-
con la mejor estructura simple. La rotacin factorial puede lizando tanto el mtodo ortogonal como el mtodo oblicuo
ser ortogonal u oblicua. El mtodo de rotacin ortogonal (e.g. Mplus; Muthn y Muthn, 1998-2012).
asume la independencia de los factores; mientras que el m- Histricamente, los investigadores han seleccionado el
todo de rotacin oblicua permite la correlacin entre facto- criterio de rotacin a utilizar en el AFE en funcin de la po-
res. pularidad de un criterio determinado en ese momento parti-
El uso de un tipo u otro de rotacin tiene implicaciones cular (e.g., Varimax, parte integrante del pack Little Jiffy
prcticas a la hora de ofrecer los resultados de un AFE. La mencionado con anterioridad), o en funcin de la recomen-
contribucin de un tem particular a un factor determinado dacin de utilizar rotacin ortogonal cuando los factores son
se indica tanto con los coeficientes patrn (factor pattern coeffi- independientes, y rotacin oblicua cuando los factores estn
cients) como con los coeficientes estructura (factor structure coef- relacionados.

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1164 Susana Lloret-Segura et. al.

Recomendacin actual: permitir correlaciones entre factores utilizando una aproxi-


macin oblicua, las correlaciones obtenidas sern bajas); 3)
En las ltimas dos dcadas, los estudios de revisin del Finalmente, si las correlaciones entre factores fueran consis-
uso del AFE han puesto de manifiesto una evolucin donde tentemente bajas (por debajo de .30 .20), se propone repe-
se ha pasado de un uso mayoritario de la rotacin ortogonal tir el anlisis utilizando una solucin ortogonal. Y en el caso
(concretamente el criterio Varimax), a utilizar cada vez ms de que las dos soluciones fueran similares, atendiendo al cri-
la rotacin oblicua. Ford et al. (1986) concluyeron que, en terio de parsimonia, se aconseja aceptar provisionalmente la
los estudios revisados, se aplic mayoritariamente la rotacin solucin ortogonal (Ferrando y Anguiano-Carrasco, 2010).
ortogonal. Concretamente, Ford et al. (1986) encontraron Hasta aqu queda claro que la recomendacin es comen-
que alrededor del 80% de los AFEs revisados utilizaron ro- zar aplicando criterios de rotacin oblicua. Pero de todos los
tacin ortogonal, mientras que aproximadamente el 12% o que se han formulados, cul es el mejor? La realidad es que
bien utilizaron rotacin oblicua o no rotaron la solucin fac- esta pregunta parece no tener respuesta. Recientemente, se
torial (el 8% restante no ofrecan informacin al respecto). ha indicado que la casustica de estructuras factoriales hipo-
Ya que en este estudio se incluye en la misma categora los tetizadas es muy amplia, y que por lo tanto los criterios de
que usan rotacin oblicua y los que no rotan, se puede con- rotacin a aplicar en cada caso particular tambin sern dife-
cluir que el porcentaje de anlisis en los que se us rotacin rentes (e.g., Browne, 2001). En esta lnea, el trabajo de Sass y
oblicua fue inferior al 12%. Schmitt (2010) pretendieron comparar diferentes criterios de
Fabrigar et al. (1999) llegaron a una conclusin similar a rotacin en situaciones diferentes (e.g., estructura simple
la de Ford, et al. (1986), pero se observ una tendencia a se- perfecta, estructura simple aproximada, estructura compleja,
guir la recomendacin de utilizar rotacin oblicua. Los resul- estructura general) y proporcionar unas directrices para rea-
tados indicaron que el 48.3% de los AFEs evaluados utiliza- lizar un AFE. Para ello, estos autores realizaron un estudio
ron rotacin ortogonal (concretamente Varimax), y el 20.6% de simulacin con Mplus donde se evaluaron diferentes cri-
utilizaron rotacin oblicua. terios de rotacin oblicua (Quartimin, CF-Equamax, CF-
Recientemente, Conway y Huffcutt (2003), volvieron a Facparsim y Geomin) y su capacidad para reproducir dife-
confirmar la tendencia decreciente de la rotacin ortogonal. rentes matrices de patrn factorial (factor pattern matrices).
El porcentaje de AFEs analizados que utilizaron rotacin or- Sass y Schmitt (2010) concluyeron que no se puede dar una
togonal haba bajado al 41.2%. Pero no pudieron confirmar respuesta definitiva a la cuestin de qu criterio de rotacin
el incremento en el porcentaje de utilizacin de la rotacin produce la mejor solucin. Es decir, a priori, no hay crite-
oblicua. En su estudio encontraron que se haba utilizado so- rios de rotaciones correctas o incorrectas, ni criterios de ro-
lo en el 18% de los casos. Contrariamente a lo esperado este tacin que produzcan soluciones mejores o peores. Por el
resultado indicaba un ligero descenso de la rotacin oblicua. contrario, se debe ser consciente de que la eleccin de un
Conway y Huffcutt (2003) explicaban este resultado aludien- criterio de rotacin u otro, puede tener efectos importantes
do al porcentaje de trabajos que no indicaban la rotacin en los patrones factoriales estimados (estimated factor pattern
empleada. En efecto, en su estudio este porcentaje fue del loadings) y en las correlaciones entre factores (interfactor correla-
18%, mientras que en el estudio de Fabrigar et al. (1999) ese tions). Los diferentes criterios de rotacin, en determinadas
porcentaje fue solo del 8%. circunstancias, pueden llevar a matrices de patrn factorial
Esta evolucin en el uso de criterios de rotacin se debe muy similares; pero bajo otras circunstancias pueden produ-
a que tradicionalmente se pensaba que la rotacin ortogonal cir matrices de patrn factorial diferentes, e incluso con-
produca estructuras ms simples y ms fcilmente interpre- tradictorias. Es en estas situaciones cuando el investigador
tables (e.g., Nunnally, 1978). Sin embargo, diferentes estu- debe tomar la difcil decisin de elegir el criterio de rotacin
dios (Fabrigar et al., 1999; Finch, 2006; Henson y Roberts, ms adecuado, es decir, el que proporciona la solucin ms
2006; Matsunaga, 2010; Park et al., 2002; Preacher y Mac- simple y ms informativa (Asparouhov y Muthn, 2009). En
Callum, 2003) pusieron de manifiesto que esta afirmacin no ltima instancia, la seleccin del mejor criterio de rota-
era cierta, sino que la rotacin oblicua es capaz de presentar cin debe hacerla el investigador (Sass y Schmitt, 2010, p.
estructuras ms claras, simples e interpretables. 99). Aunque esta reflexin ya fue corroborada por Browne
Estos estudios aconsejan utilizar rotacin oblicua inde- (2001, p. 145): the choice of the best solution therefore cannot be
pendientemente del modelo terico del que se parta (facto- made automatically and without human judgment. Es decir, el in-
res independientes o relacionados). Los argumentos para ello vestigador puede poner a prueba distintas soluciones facto-
son varios: 1) Casi todos los fenmenos que se estudian en riales utilizando diferentes criterios de rotacin, y en base a
las ciencias sociales y de la salud estn ms o menos interre- los resultados obtenidos, seleccionar como mejor criterio
lacionados entre s, por lo que encontrar relaciones de orto- de rotacin, aquel que ofrece la solucin factorial ms simple
gonalidad perfecta es difcil. De ello se deduce, que imponer y ms informativa. Incluso se aconseja, que adems de pro-
una solucin factorial ortogonal puede ser muy probable- porcionar una justificacin adecuada del criterio de rotacin
mente alejarse de la realidad; 2) Si el constructo bajo estudio elegido, se ofrezca las diferentes matrices factor patrn re-
realmente presenta una estructura de factores independien- sultado de aplicar diferentes mtodos de rotacin, de tal
tes, esta ortogonalidad se ver reflejada en los resultados (al modo que el lector pueda sacar sus propias conclusiones en

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1165

base a las estructuras factoriales alternativas (Sass y Sch- Remitimos a los lectores interesados a las fuentes citadas
mitt, 2010, p. 97). para consultar informacin sobre estos aspectos. A conti-
En cuanto al criterio de asignacin de los tems a los fac- nuacin resumiremos todo lo anterior de forma que sea til
tores -otro aspecto que puede hacer variar enormemente la al lector.
interpretacin de la solucin obtenida- la prctica ms co-
mn es retener saturaciones que estn por encima de .30 Anlisis Factorial Exploratorio de tems: Bre-
.40 (, Bandalos y Finney, 2010; Guadagnoli y Velicer, 1988; ve Gua de uso
McDonald, 1985). De hecho, Tabachnick y Fidell (2001)
afirmaron que .32 podra ser una buena regla general en la Hemos presentado mucha informacin hasta aqu, y
saturacin mnima a considerar, que equivale aproximada- puede que en este punto el objetivo de ofrecer unas reco-
mente al 10% de la varianza explicada. Otros autores son un mendaciones claras y actuales se haya desdibujado. As que
poco ms estrictos y sitan el punto de corte en .40 como como conclusin se resumirn e integrarn en una gua bre-
mnimo (MacCallum et al., 1999; Velicer y Fava, 1998; Wi- ve las recomendaciones actuales ms importantes en torno a
lliams, Brown y Onsman, 2010) y adems recomiendan ele- cuatro aspectos centrales: 1) el tipo de datos y la matriz de
var este punto de corte a medida que la muestra sea inferior asociacin; 2) el mtodo de estimacin de factores; 3) el
a 300 casos. Tambin se recomienda que la discrepancia en- nmero de factores y finalmente, 4) el mtodo de rotacin y
tre las saturaciones en los dos primeros factores sea .50/.20 asignacin de tems.
.60/.20 (es decir, una diferencia de .30-.40). Algunos estu-
dios, especialmente los empricos, utilizan la discrepancia El tipo de datos y la matriz de asociacin
.60/.40 (Henson y Roberts, 2006; Park et al., 2002).
Los tems que no superen el criterio o conjunto de crite- Recomendacin
rios establecidos, deben ser revisados en sus dos aspectos:
sustantivo y metodolgico, para identificar en lo posible el El investigador aplicado que pretenda realizar un AFE
origen de su mal funcionamiento. Con ello se puede valorar para evaluar la escala o escalas de su inters debe utilizar ta-
si es necesario o aconsejable que se eliminen del test, que se maos de muestra apropiados, ser consecuente con la natu-
modifiquen de algn modo para incluirlos en una nueva ver- raleza ordinal, politmica (tipo Likert) o dicotmica, de los
sin del test, o si lo que sucede es que hay que aadir nuevos tems que quiera analizar usando software apropiado en cada
tems de contenido semejante para muestrear adecuadamen- caso, y comprobar la adecuacin de sus datos al AF al me-
te el contenido del factor que pretendemos medir con ese nos mediante la prueba KMO.
tem (Costello y Osborne, 2005), lo que nos lleva a re- Como norma general, la matriz de correlaciones de Pear-
examinar la validez de contenido que mencionamos con an- son queda limitada al caso en que los tems sean continuos,
terioridad (Bandalos y Finney, 2010). Independientemente o si no lo son, tengan cinco o ms alternativas de respuesta y
de ello, se realizar un nuevo anlisis factorial con la escala distribuciones aproximadamente normales (un criterio exi-
reducida tras eliminar esos tems. Idealmente el anlisis se gente emplea valores para la curtosis y la asimetra en el ran-
repetir tras eliminar uno de los tems inadecuados cada vez go (-1,1)). En la mayor parte de los casos restantes lo acon-
(Bandalos y Finney, 2010). En ocasiones variaciones peque- sejable es usar la matriz de correlaciones policrica o te-
as como eliminar un par de tems pueden modificar sustan- tracrica, segn el caso.
cialmente el resultado final del anlisis. La excepcin ocurre en el caso de que la muestra sea pe-
Como el lector ya habr notado, los aspectos tratados quea (200 sujetos o menos). En este caso, las correlaciones
hasta aqu son muchos y variados, y aun as no agotan todos policricas pueden resultar poco estables y por lo tanto ser
los que debieran tratarse en el contexto del AFE. Solo he- menos recomendables que las propias correlaciones de Pear-
mos tratado de presentar los ms relevantes que el investiga- son, por lo que en ese caso recomendamos relajar esta exi-
dor aplicado debe resolver cuando se pone manos a la obra. gencia y usar valores para asimetra y curtosis mayores (-2,2).
Hemos dejado fuera, entre otros aspectos, el AF no lineal, El caso de duda, el investigador puede comparar las solucio-
sobre el que existe extensa literatura, el asunto de las pun- nes obtenidas con ambas matrices y decidir de forma infor-
tuaciones factoriales, que puede consultarse en el captulo mada cual es la mejor solucin.
sobre Anlisis factorial Exploratorio de Abad, et al., (2011), El tamao de la muestra no es fcil de anticipar, porque
tampoco hemos ofrecido recomendaciones acerca de la utili- depender de las caractersticas psicomtricas de los tems,
zacin de paquetes o miniescalas, que pueden consultarse del tipo de matriz de asociacin, y adems estos dos aspec-
en West et al., (1995), Gorsuch (1997) y en un reciente y ex- tos estn relacionados entre s. Pero si se desea tener cierta
tenso trabajo de Little, Rhemtulla, Gibson y Schoemann, garanta de poder usar la matriz de correlaciones policri-
(2013), y finalmente, tampoco hemos dado recomendaciones ca/tetracrica se recomienda no emplear muestras por deba-
acerca de cundo y cmo usar el denominado originalmente jo de los 300 sujetos. En el caso de la matriz de correlacio-
Extension Analysis (Gorsuch, 1997 a, b), para el que exis- nes de Pearson se recomienda una muestra mnima de 200
te desde hace ya una dcada el programa EXTENSION, casos. Estas recomendaciones tienen solo validez como pun-
compatible con SPSS, SAS y MATLAB (OConnor, 2001).

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1166 Susana Lloret-Segura et. al.

to de partida. Situaciones en que las saturaciones sean bajas o de la saturacin (mnimo .40) y significado de los tems
(menor de .40) y el nmero de tems por factor tambin sea que los definen, y debe aplicar al menos un criterio objetivo
bajo (3 tems) requieren tamaos muestrales mayores para extra al margen de los que ofrece un AFE convencional -
tener alguna garanta de generalizacin de los resultados. que son scree test, GFI o RSMR-, o un AFE mediante MEE
Como es habitual utilizar muestras de conveniencia hay que -hemos mencionado como criterio RMSEA, aunque existen
tener en cuenta dos problemas: la no-representatividad y la otros criterios que se pueden utilizar-. Cuando la proporcin
atenuacin por restriccin de rango. de tems por factor es pequea, y el tamao de la muestra es
La adecuacin de los datos al AF se considera suficien- de 200 casos o ms, este criterio objetivo extra puede ser
te cuando el resultado de la medida KMO tome valores en- un Anlisis Paralelo o el mtodo MAP. Teniendo en cuenta
tre .70-.79, y satisfactoria cuando tome valores mayores a toda esta informacin, la recomendacin es:
.80. 1) obtener el resultado del ajuste del modelo con el nmero
de factores fijado al nmero esperado,
El mtodo de estimacin de factores 2) obtener el ajuste de otros modelos que puedan parecer
plausibles tras el anlisis inicial, y
Recomendacin 3) comparar y decidir.

La recomendacin para el investigador informado es de Se desaconseja explcitamente el uso del criterio de por-
nuevo que adapte el mtodo al tipo de datos que desea ana- centaje de varianza explicada, por ser confuso.
lizar: si los tems son ordinales pero tienen distribuciones
aproximadamente normales, -en este caso el criterio es El mtodo de rotacin y asignacin de tems
aceptar valores absolutos menores que 2 para la asimetra y
la curtosis-, entonces el mtodo adecuado es MV aplicado a Recomendacin
la matriz de correlaciones de Pearson, porque es el que ofre-
ce ms informacin (medidas de ajuste, pruebas de significa- Se recomienda absolutamente la rotacin oblicua. Inclu-
cin y errores tpicos alrededor de los parmetros estima- so en el caso en que no sea adecuada, porque el resultado
dos). obtenido lo pondr de manifiesto. No ocurre lo mismo con
En caso contrario, lo que se recomienda es aplicar un las rotaciones ortogonales. Lo que no est claro es el mto-
mtodo basado en MCO como ULS. El mtodo ULS permi- do de rotacin oblicua ms adecuado, pues no hay criterios
te factorizar matrices en situaciones adversas, incluso con claros para ello. Es el investigador el que deber probar va-
pocos casos y muchos tems, y sin necesidad de hacer su- rios y elegir de nuevo el que presente mejor interpretabili-
puestos distribucionales. Este mtodo tambin se recomien- dad.
da cuando la solucin de MV resulte inadecuada, porque En cuanto al criterio para interpretar la saturacin de un
presente problemas de convergencia o casos Heywood, u tem, la recomendacin tambin es clara: nunca por debajo
otras anomalas similares. En estos casos, hay que valorar de .40, especialmente si la muestra es menor de 300 casos.
cuidadosamente si esos problemas en la estimacin no estn Los tems que no superen ese valor debern ser elimina-
enmascarando unos datos que en realidad no cumplen los dos del anlisis y sometidos a un examen desde el punto de
supuestos requeridos (como el de normalidad o linealidad), o vista sustantivo y metodolgico para decidir entre tres op-
un modelo mal especificado (Fabrigar et al., 1999). ciones: eliminar el tem, revisar el tem o aadir nuevos tems
El mtodo de estimacin que se desaconseja enrgica y que muestreen la faceta relacionada con ese tem en particu-
explcitamente es el CP. CP es un mtodo para explicar la lar. En cualquier caso habr que a re-examinar la adecuacin
varianza de cada tem individual. No es un mtodo adecuado del contenido del test al constructo que se pretende medir.
al objetivo del AF, que es explicar las correlaciones entre los Independientemente de ello, se realizar un nuevo anlisis
tems a partir de la identificacin de un conjunto de factores factorial con la escala reducida tras eliminar uno de esos
comunes. Ni siquiera usado junto a una rotacin oblicua de tems cada vez.
los componentes identificados. Destacaremos una vez ms que se desaconseja el uso del
pack denominado Little Jiffy: ACP ms Kaiser ms Vari-
Numero de factores a retener max. No cabe duda que durante cierto tiempo ha sido la
forma ms efectiva de resumir las relaciones observadas en-
Recomendacin tre los tems de un test, y que bajo ciertos improbables- su-
puestos, podra dar resultados adecuados, pero como ha
Respecto al nmero de factores tambin hay una opcin quedado claro o eso esperamos- hoy da ya no es as.
que se desaconseja con la misma energa que el mtodo de
estimacin CP, y es el criterio de Kaiser. Un investigador in- Conclusin
formado debe emplear una variedad de mtodos para deci-
dir: debe retener solo factores comunes mayores identifi- Martnez y Martnez (2009, p. 373) concluyen un muy intere-
cados en funcin del nmero de tems (mnimo 3-4), tama- sante artculo sobre las nuevas conceptualizaciones de la va-

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1167

lidez -y la dificultad con que se abren camino en la comuni- su conveniencia, no nos deberamos extraar de lo que pasa
dad psicomtrica-, presentando el siguiente ejemplo: Jacob en el contexto ms complejo del AFE.
Cohen, uno de los ms influyentes investigadores en meto- Borsboom, en su artculo El ataque de los psicmetras
dologa, se ha pasado ms de cuarenta aos defendiendo el (2006), tambin concluye que los avances psicomtricos pa-
uso de los ndices del tamao del efecto en lugar del clsico recen no haber contribuido apenas al avance en la psicologa
p-valor, con argumentos que son de una lgica aplastan- en los ltimos 50 aos. Y no es por falta de avances en psi-
te. Y como el propio Cohen (1990) explica, a pesar de todo cometra, es por falta de aplicacin de esos avances en Psico-
El problema es que, en la prctica, la investigacin actual loga. Pensamos que la clave est, como afirm Cohen
apenas presta atencin al tamao del efecto (Cohen, 1990, (1990, p. 1309), en que el proceso por el que uno concibe,
p. 1310). Eso es tambin lo que concluyen Sedlmeier y Gi- planifica, ejecuta y escribe una investigacin debe depender
gernzer (1989) en su artculo Tienen los estudios sobre la del juicio informado de uno mismo como cientfico (la cursiva es
potencia estadstica efecto sobre la potencia de los estu- nuestra).
dios?, que la potencia de los estudios publicados es, como No se trata de repetir lo que han hecho otros investiga-
promedio, un insuficiente .44. Puede que el uso de la poten- dores antes, as no se puede avanzar. Se trata de informarse y
cia estadstica haya aumentado en estos ltimos aos, pero tener juicio para tomar las mejores decisiones. As es como
no es la prctica habitual. Si algo tan simple como el estudio se puede salir del laberinto por la puerta principal, como de-
del tamao del efecto en la interpretacin de los anlisis que camos al principio de este artculo. Y esa debera ser la m-
realizamos habitualmente sigue sin ser aplicado de forma ru- xima de todos los que trabajamos en el mundo de la investi-
tinaria, a pesar de la gran cantidad de estudios que muestran gacin: investigadores, editores, revisores y profesores. Esta
es nuestra pequea contribucin.
Referencias
Abad, F. J., Olea, J., Ponsoda, J., y Garca, C. (2011). Medicin en ciencias socia- Cohen, J. (1990). Things I have learned (so far). American Psychologist, 45(12),
les y de la salud. Madrid. Sntesis. 1304-1312.
Anstey, E. (1959). Test de Domins. Buenos Aires: Paids. Comrey, A. L. y Lee, H. B. (1992). A first course in factor analysis. Hillsdale, NJ:
Anderson, J. C., y Gerbing, D. W. (1988). Structural equation modeling in Erlbaum.
practice: A review and recommended two-step approach. Psychological Conway, J. M. y Huffcutt, A. (2003). A review and evaluation of exploratory
Bulletin, 103(3), 411-423. factor analysis practices in organizational research. Organizational Research
Arrindell, W. A. y van der Ende, J. (1985). An empirical test of the utility of Methods, 6(2), 147-168.
the observations-to-variables ratio in factor and components analysis. Costello, A. B. y Osborne, J. (2005). Best practices in exploratory factor
Applied Psychological Measurement, 9, 165-178. analysis: four recommendations for getting the most from your analysis.
Asparouhov, T. y Muthn, B. (2009). Exploratory structural equation model- Practical Assessment Research & Evaluation, 10(7), 1-9. Recuperado de:
ing. Structural Equation Modeling, 16, 397-438. http://pareonline.net/getvn.asp?v=10&n=7.
Bandalos, D. L. y Finney, S. J. (2010). Factor Analysis: Exploratory and Courville, T. y Thompson, B. (2001). Use of structure coefficients in pub-
Confirmatory. En G. R. Hancock y R. O. Mueller (Eds.), Reviewers guide lished multiple regression articles: Beta is not enough. Educational and
to quantitative methods. Routledge: New York. Psychological Measurement, 61, 229-248.
Barrett, P. T. y Kline, P. (1981). The observation to variable ratio in factor Cureton, E. E. y Mulaik, S. A. (1975). The weighted varimax rotation and
analysis. Personality Study in Group Behavior, 1, 23-33. the promax rotation. Psychometrika, 40, 183-195.
Basto, M. y Pereira, J.M. (2012). An SPSS R-Menu for ordinal factor analy- Curran, P. J., West, S. G. y Finch, J. F. (1996). The robustness of test statis-
sis. Journal of Statistical Software, 46, 1-29. Recuperado de: tics to nonnormality and specification error in confirmatory factor anal-
http://www.jstatsoft.org/v46/i04/paper. ysis. Psychological Methods, 1, 16-29.
Beavers, A. S., Lounsbury, J. W., Richards, J. K., Huck, S. W., Skolits, G. J., Edwards, J. R. (2011). The Fallacy of formative measurement. Organizational
& Esquivel, S. L. (2013). Practical Considerations for Using Exploratory Research Methods, 14, 370-388
Factor Analysis in Educational Research. Practical Assessment, Research & Embretson, S. E. y Reise, S. P. (2000). Item response theory for psychologists.
Evaluation, 18(6). Recuperado de: Mahwah, NJ: Lawrence Erlbaum.
http://pareonline.net/getvn.asp?v=18&n=6. Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., y Strahan, E. J. (1999).
Bollen, K. A. (1989). Structural Equations with Latent Variables. New York: Evaluating the use of exploratory factor analysis in psychological re-
Wiley. search. Psychological Methods, 4(3), 272-299.
Borsboom, D., Mellenbergh, G. J. y Van Heerden, J. (2003). The theoretical Ferrando, P. J. y Anguiano-Carrasco, C. (2010). El anlisis factorial como
status of latent variables. Psychological Review, 110, 203219. tcnica de investigacin en psicologa. Papeles del Psicolgo, 31(1), 18-33.
Borsboom, D. (2006). The attack of the psychometricians. Psychometrika, 71, Ferrando, P. J. y Lorenzo, U. (2000). Unrestricted versus restricted factor
425.440. analysis of multidimensional test items: some aspects of the problem
Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: and some suggestions. Psicologica, 21, 301-323.
Guilford Press. Ferrando, P. J. y Lorenzo-Seva, U. (2013). Unrestricted item factor analysis and
Browne, M. W. (2001). An overview of analytic rotation in exploratory fac- some relations with item response theory. Recuperado de
tor analysis. Multivariate Behavioral Research, 36, 111-150. http://psico.fcep.urv.es/utilitats/factor/.
Browne, M. W. y Cudeck, R. (1993). Alternative ways of assessing model fit. Ferrando, P. J., Varea, M. D. y Lorenzo, U. (1999). Evaluacin psicomtrica
En K. A. Carroll, J. B. (1953). An analytic solution for approximating del cuestionario de ansiedad y rendimiento (CAR) en una muestra de
simple structure in factor analysis. Psychometrika, 18, 23-28. escolares. Psicothema, 11 (1), 225-236.
Cattell, R. B. (1966). The scree test for the number of factors. Multivariate Finch, H. (2006). Comparison of the performance of varimax and promax
Behavioral Research, 1, 245-276 rotations: Factor structure recovery for dichotomous items. Journal of
Clarkson, D. B. y Jennrich, R. I. (1988) Quartic rotation criteria algorithms. Educational Measurement, 43(1), 39-52.
Psychometrika, 53, 251-259. Finney, S. J. y DiStefano, C. (2006). Nonnormal and categorical data in
structural equation models. In G.R. Hancock y R.O. Mueller (Eds.), A

anales de psicologa, 2014, vol. 30, n 3 (octubre)


1168 Susana Lloret-Segura et. al.

second course in structural equation modeling (pp. 269 - 314). Greenwich, CT: Jreskog, K. G. (1977). Factor analysis by least-squares and maximum-
Information Age. likelihood methods. En K. Enslein, A. Ralston y H.S. Wilf (Eds.), Statis-
Flora, D. V. y Curran, P. J. (2004). An empirical evaluation of alternative tical methods for digital computers, Vol. 3. New York. Wiley
methods of estimation for confirmatory factor analysis with ordinal da- Jung, S. (2013). Exploratory factor analysis with small sample sizes: A com-
ta. Psychological Methods, 9, 466491. parison of three approaches. Behavioural Processes, 97, 9095
Flora, D. B., LaBrish, C. y Chalmers, R. P. (2012). Old and new ideas for da- Kaiser, H. F. (1958). The varimax criterion for analytic rotation in factor
ta screening and assumption testing for exploratory and confirmatory analysis. Psychometrika, 23, 187-200.
factor analysis. Frontiers in Quantitative Psychology and Measurement, 3 (55), Kaiser, H. F. (1970). A second generation Little Jiffy. Psychometrika, 35, 401-
1-21. 415.
Ford, J. K., MacCallum, R. C. y Tait, M. (1986). The application of explora- Kelley, T. L. (1935). Essential traits of mental life. Harvard Studies in Education,
tory factor analysis in applied psychology: A critical review and analysis. vol. 26. Harvard University Press, Cambridge.
Personnel Psychology, 39, 291-314. Kim, J. O. y Mueller, C. W. (1978). Factor analysis. Beverly Hills, CA: Sage
Forero, C. G, Maydeu-Olivares, A. y Gallardo-Pujol, D. (2009). Factor anal- Kline, R. B. (2005). Principles and practice of structural equation modeling (2nd Edi-
ysis with ordinal indicators: A monte Carlo study comparing DWLS tion ed.). New York: The Guilford Press.
and ULS estimation. Structural Equation Modeling, 16, 625-641. Lawley, D. N. y Maxwell, A. E. (1971). Factor analysis as a statistical method.
Gorsuch, R. L. (1983). Factor analysis (2nd. ed.). Hillsdale, NJ: Erlbaum. London: Butterworths.
Gorsuch, R. L. (1997a). Exploratory factor analysis: Its role in item analysis. Ledesma, R. D., y Valero-Mora, P. (2007). Determining the Number of Fac-
Journal of Personality Assessment, 68, 532-560. tors to Retain in EFA: An easy-to-use computer program for carrying
Gorsuch, R. L. (1997b). New procedure for extension analysis in exploratory out Parallel Analysis. Practical Assessment Research & Evaluation, 12(2). Re-
factor analysis. Educational and Psychological Measurement, 57, 725-740 cuperado de : http://pareonline.net/getvn.asp?v=12&n=2
Guadagnoli, E. y W. F. Velicer (1988). Relation of sample size to the stability Lee, C.-T., Zhang, G., y Edwards, M.C. (2012). Ordinary least squares esti-
of component patterns. Psychological Bulletin, 103(2), 265-275. mation of parameters in exploratory factor analysis with ordinal data.
Hair, J. F., Anderson, R. E., Tatham, R. L. y Black, W. C. (2005). Multivariate Multivariate Behavioral Research, 47, 314339.
data analysis. New York: Prentice All International. Lorenzo-Seva, U. (1999). Promin: A Method for Oblique Factor Rotation.
Hancock, G. R. y Mueller, O. (2010). The Reviewers Guide to Quantitative Meth- Multivariate Behavioral Research, 34, 347-365.
ods in the Social Sciences. (3rd ed.). New York, NY: Routledge. Lorenzo-Seva, U. (2000). The weighted oblimin rotation. Psychometrika, 65,
Harman, H. H. (1980). Anlisis factorial moderno. Madrid: Salts. 301-318.
Harman, H. H. (1976). Modern factor analysis (3rd ed.). Chicago, IL: University Lorenzo-Seva, U. y Ferrando, P. J. (2006). FACTOR: a computer program
of Chicago Press. to fit the exploratory Factor Analysis model. Behavioral Research Methods,
Harman, H. H. y Jones, W. H. (1966). Factor analysis by minimizing residu- Instruments & Computers, 38(1), 88-91.
als (Minres). Psychometrika, 31, 351-369. Lorenzo-Seva, U. (2013). How to report the percentage of explained common variance
Hayton, J. C., Allen, D. G. y Scarpello, V. (2004). Factor retention decisions in exploratory factor analysis. Recuperado de: http://psico.fcep.urv.es
in exploratory factor analysis: A tutorial on parallel analysis. Organiza- /utilitats/factor/
tional Research Methods, 7, 191-205. Recuperado de: Lorenzo-Seva, U. y Ferrando, P. J. (2012a). TETRA-COM: a comprehensive
http://orm.sagepub.com/content/7/2/191. SPSS program for estimating the thetrachoric correlation. Behavioral Research
Hendrickson, A. E. y White, P. O. (1964). PROMAX: A quick method for Methods, 44(4), 1191-1196.
rotation to oblique simple structure. British Journal of Statistical Psychology, Lorenzo-Seva, U. y Ferrando, P. (2012b). Manual of the program FACTOR v.
17, 65-70. 8.10. Recuperado de: http://psico.fcep.urv.es/utilitats/factor/
Henson, R. K. y Roberts, J. K. (2006). Use of exploratory factor analysis in Lorenzo-Seva, U. y Ferrando, P. J. (2013). FACTOR 9.2: A comprehensive
published research. Common errors and some comment on improved program for fitting exploratory and semiconfirmatory factor analysis
practice. Educational and Psychological Measurement, 66(3), 393-416. and IRT models, Applied Psychological Measurement, 37-6, 497-498. Recu-
Hinkin, T. R. (1995). A Review of scale development practices in the study perado de: http://apm.sagepub.com
of organizations. Journal of Management, 21(5), 967-988. Lorenzo-Seva, U., Timmerman, M. E. y Kiers, H. A. L. (2011). The Hull
Hogarty, K. Y., Hines, C. V., Kromrey, J. D., Ferron, J. M. y Munford, K. R. method for selecting the number of common factors. Multivariate Behavioral
(2005). The quality of factor solutions in exploratory factor analysis: Research, 46(2), 340-364.
The influence of sample size, communality, and overdetermination. Ed- Marsh, H. W., Richards, G. E., Johnson, S., Roche, S. y Tremayne, P. (1994).
ucational and Psychological Measurement, 65, 202-226. Physical Self-Description Questionnaire: Psychometric properties and a
Holgado-Tello, F. C., Chacon-Moscoso, S., Barbero, I. y Vila-Abad, E. multitrait-multimethod analysis of relations to existing instruments.
(2010). Polycoric versus Pearson correlationsin exploratory and con- Journal of Sport and Exercise Psychology, 16, 270-305.
firmatory factor analysis of ordinal variables. Quality and Quantity, 44 (1), Marsh, H. W., Morin, A. J. S., Parker, P. D. y Kaur, G. (2014). Exploratory
153-166. structural equation modeling: An integration of the best features of ex-
Horn, J. L. (1965). A rationale and test for the number of factors in a factor ploratory and confirmatory factor analysis. Annual Review of Clinical Psy-
analysis. Psychometrika, 30, 179185. chology. doi/abs/10.1146/annurev-clinpsy-032813-153700
Hotelling, H. (1933). Analysis of a complex of statistical variables into prin- Marsh, H. W., Liem, G. A. D., Martin, A. J., Morin, A. J. S. y Nagengast, B.
cipal components. Journal of Educational Psycholgy, 24, 417441, 498520. (2011). Measurement fruitfulness of exploratory structural equation
Hu, L. T. y Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance modelling (ESEM) in addressing key substantive issues in motivation and
structure analysis: Conventional criteria versus new alternatives. Structu- engagement research. Journal of Psychoeducational Assessment, 29, 322-346.
ral Equation Modeling, 6(1), 1-55. doi:10.1080/09243453.2013.812568
Izquierdo, I., Olea, J. y Abad, F. J. (2013, Septiembre). Se aplica correctamente Marsh, H. W., Ldtke, O., Muthn, B., Asparouhov, T., Morin, A. J. S., Tra-
el anlisis factorial exploratorio en la investigacin psicolgica? Comunicacin utwein, U. y Nagengast, B. (2010). A new look at the big five factor
presentada al XIII Congreso de Metodologa de las Ciencias Sociales y structure through exploratory structural equation modeling. Psychological
de la Salud. Tenerife. Espaa. Resumen recuperado de Assessment, 22(3), 471491. doi:10.1037/a0019227
http://13congresometodologia.es/programa/programa- Marsh, H. W., Muthn, B., Asparouhov, T., Ldtke, O., Robitzsch, A.,
cientifico/programa-cientifico-general/ Morin, A. J. S. y Trautwein, U. (2009). Exploratory structural equation
Jennrich, R. I. y Sampson, P. F. (1966). Rotation for simple loadings. Psy- modeling, integrating CFA and EFA: Application to students evalua-
chometrika, 31, 313-323. tions of university teaching. Structural Equation Modeling, 16, 439476.
Jollife, I. T. (2002). Principal component analysis. Second edition, New York: doi:10.1080/10705510903008220
Springer-Verlag. Marsh, H. W., Hau, K. T. y Wen, Z. (2004). In search of Golden Rules:
Jreskog, K. G. y Srbom, D. (2007). LISREL 8.80. [Computer Software]. Comment on hypothesis-testing approaches to setting cutoff values for
Lincolnwood, IL: Scientific Software International, Inc.

anales de psicologa, 2014, vol. 30, n 3 (octubre)


El anlisis factorial exploratorio de los tems: una gua prctica, revisada y actualizada 1169

fit indexes and dangers in overgeneralizing Hu and Bentler's findings. Revelle, W. (2014). Psych: Procedures for Personality and Psychological Research.
Structural Equation Modeling, 11(3), 320-341. Northwestern University, Evanston, Illinois, USA. Recuperado de:
Martnez, J. A. y Martnez, L. (2009). El anlisis factorial confirmatorio y la http://CRAN.R-project.org/
validez de escalas en modelos causales. Anales de Psicologa, 25(2), 368- Sass, D. A. y Schmitt, T. A. (2010). A comparative investigation of rotation
374. Recuperado de: http://www.redalyc.org/ criteria within exploratory factor analysis. Multivariate Behavioral Research,
Matsunaga, M. (2010). How to factor-analyze your data right: Dos, donts, 45, 73-103.
and how-tos. International Journal of Psychological Research, 3 (1), 97-110. Satorra, A., y Bentler, EM. (1994). Corrections to test statistics and standard
Recuperado de: http://www.redalyc.org/ enors in covariance structure analysis. En A. von Eye y C.C. Clogg
MacCallum, R. C., Widaman, K. F., Preacher, K. y Hong, S. (2001). Sample (Eds.), Latent variables analysis: Applications for developmental research (pp.
size in factor analysis: The role of model error. Multivariate Behavioral Re- 399-419). Thousand Oaks, CA: Sage
search, 36, 611-637. Seldmeier, P. y Gigerenzer, G. (1989). Do studies of statistical power have
MacCallum, R. C., Widaman, K. F., Zhang, S. y Hong, S. (1999). Sample size an effect on the power of studies? Psychological Bulletin, 105, 309-316.
in factor analysis. Psychological Methods, 4, 84-99. Steiger, J. H. y Lind, J. M. (1980, May). Statistically based tests for the number of
McDonald, R. P. (1985). Factor Analysis and Related Methods. Hillsdale, NJ: common factors. Paper presented at the annual meeting of the Psychomet-
LEA. ric Society, Iowa City, IA. Recuperado de: http://www.statpower.net/
McDonald R. P. (1999). Test theory: A unified approach. Mahwah, NJ: Lawrence Tabachnick, B. G. y Fidell, L. S. (2001). Using multivariate statistics. Boston: Al-
Erlbaum Associates, Inc. lyn and Bacon.
McDonald R. P. (2000). A basis for multidimensional item response theory. Tanaka, J. S. y Huba, G. H. (1989) A general coefficient of determination for
Applied Psychological Measurement, 24, 99-114. covariance structure models under arbitrary GLS estimation. British
McDonald, R. P. (2005). Semiconfirmatory factor analysis: The example of Journal of Mathematical and Statistical Psychology, 42, 233-239.
anxiety and depression. Structural Equation Modeling, 12, 163-172. Thompson, B. (2004). Exploratory and confirmatory factor analysis: Understanding
McDonald, R. P. y Ahlawat, K. S. (1974). Difficulty factors in binary data. concepts and applications. Washington, DC: American Psychological Asso-
British Journal of Mathematical and Statistical Psychology, 27, 82-99. ciation.
Morin, A. J. S., Marsh, H. W., y Nagengast, B. (2013). Exploratory structural Thompson, B. y Borrello, G. M. (1985). The importance of structure coeffi-
equation modeling. En G. R. Hancock, y R. O. Mueller, (Eds.), Structur- cients in regression research. Educational and Psychological Measurement, 45,
al equation modeling: A second course (pp. 395-440). Charlotte, NC: Infor- 203-209.
mation Age Publishing, Inc. Thurstone, L. L. (1947). Multiple-factor analysis. Chicago: The University Chi-
Mulaik, S. A. (1972). The foundations of factor analysis. New York: McGraw Hill. cago Press.
Mundfrom, D. J., Shaw, D. G. y Ke, T. L. (2005). Minimum sample size Velicer, W. F. (1976). Determining the number of components from the
recommendations for conducting factor analyses. International Journal of matrix of partial correlations. Psychometrika, 41, 321327.
Testing, 5(2), 159-168. Velicer, W. F. y Fava, J. L. (1998). Effects of variable and subject sampling
Muthen, B., y Asparouhov, T. (2010). Bayesian SEM: A more flexible repre- on factor pattern recovery. Psychological Methods, 3(2), 231-251.
sentation of substantive theory. Psychological Methods, 17, 313-335. Velicer, W. F. y Jackson, D. N. (1990). Component analysis versus common
Muthn, B. y Kaplan D. (1985). A comparison of some methodologies for factor analysis: Some issues in selecting an appropriate procedure. Mul-
the factor analysis of non-normal Likert variables. British Journal of Math- tivariate Behavioral Research, 25(1), 1-28.
ematical and Statistical Psychology, 38, 171-189. Recuperado de: Velicer, W.F., Eaton, C. A., y Fava, J. L. (2000). Construct explication
http://www.statmodel.com/ through factor or component analysis: A review and evaluation of alter-
Muthn, B. y Kaplan D. (1985). A comparison of some methodologies for native procedures for determining the number of factors or compo-
the factor analysis of non-normal Likert variables: A note on the size of nents. En R. D. Goffin y E. Helmes (Eds.), Problems and solutions in hu-
the mode,. British Journal of Mathematical and Statistical Psychology, 45, 19- man assessment: Honoring Douglas N. Jackson at seventy. (pp. 41-71). Norwell,
30. Recuperado de: http://www.statmodel.com/ MA: Kluwer Academic. Recuperado de: http://link.springer.com/
Muthn, L. K. y Muthn, B. O. (2007). Mplus users guide (5th ed.). Los Ange- Vigil- Colet, A., Canals, J., Cos, S., Lorenzo-Seva, U., Ferrando, P. J., Her-
les, CA: Muthn& Muthn. nndez-Martnez C., Domenech, E. (2009). The factorial structure of
Muthn, L. K. y Muthn, B. O. (1998-2012). Mplus Users Guide. (7th ed.) Los the 41-item version of the screen for child anxiety related emotional
Angeles, CA: Muthn & Muthn disorders (SCARED) in a spanish population of 8 to 12 years-old. Inter-
Nunnally, J. C. (1978). Psychometric theory (2nd ed.). New York: McGraw-Hill. national Journal of Clinical and Health Psychology, 9(2), 313-327. Recuperado
O'Connor, B. P. (2000). SPSS and SAS programs for determining the num- de: http://scholar.google.com/citations
ber of components using parallel analysis and Velicer's MAP test. Behav- West, S. G., Finch, J. F. y Curran, P. J. (1995). Structural equation models
ior Research Methods, Instrumentation, and Computers, 32, 396-402. with nonnormal variables. Problems and remedies. En R. H. Hoyle
O'Connor, B. P. (2001). EXTENSION: SAS, SPSS, and MATLAB pro- (Ed.). Structural equation modeling: Concepts, issues and applications. (pp. 56-
grams for extension analysis. Applied Psychological Measurement, 25, p. 88. 75). Newbury Park, CA: Sage.
Park, H. S., Dailey, R. y Lemus, D. (2002). The Use of exploratory factor Williams, B., Brown, T., y Onsman, A. (2010). Exploratory factor analysis: A
analysis and principal components analysis in communication research. five-step guide for novices. Australasian Journal of Paramedicine, 8(3), 1-13.
Human Communication Research, 28 (4), 562577. Yates, A. (1987). Multivariate exploratory data analysis: A perspective on exploratory
Peres-Neto, P. R., Jackson, D. A. y Somers, K. M. (2005). How many prin- factor analysis. Albany: State University of New York Press.
cipal components? Stopping rules for determining the number of non- Yuan, K.H., y Bentler, P. M. (1998). Normal theory based test statistics in
trivial axes revisited. Computational Statistics and Data Analysis, 49, 974- structural equation modeling. British Journal of Mathematical and Statistical
997. Recuperado de: http://labs.eeb.utoronto.ca/ Psychology, 51, 289-309.
Prez, E. y Medrano, L. (2010). Anlisis Factorial Exploratorio: Bases Con- Zwick, R.W. y Velicer,W. F. (1986). Comparison of five rules for determin-
ceptuales y Metodolgicas. Revista Argentina de Ciencias del Comportamiento, ing the number of components to retain. Psychological Bulletin, 99, 432
2(1), 58- 66. 442.
Preacher, K. J. y MacCallum, R. C. (2003). Repairing Tom Swift's electric
factor analysis machine. Understanding Statistics, 2, 13-32. (Artculo recibido: 8-2-2014; revisin recibida: 27-5-2014; aceptado: 28-5-2014)

anales de psicologa, 2014, vol. 30, n 3 (octubre)

S-ar putea să vă placă și