Sunteți pe pagina 1din 47

Análisis Multivariante de Datos

Máster en Psicología de las Organización y del Trabajo


Ana López
Dos grandes modelos de Análisis Factorial:

 Análisis Factorial Exploratorio (AFE): Propuesto originalmente por Spearman


(1904). No requiere que el investigador tenga conocimiento del número y
naturaleza de los factores subyacentes

 Análisis Factorial Confirmatorio (AFC)

 Desarrollado más recientemente (Joreskog, 1969). Requiere que el


investigador aporte

 (a) el número de factores

 (b) qué variables están relacionada con cada factor

 (c) Si los factores están correlacionados


Análisis Factorial Exploratorio
3.1. Introducción
3.2. Modelos de Análisis Factorial.
3.2.1. El modelo de factores comunes
3.2.1.1. El modelo de factores comunes
ortogonales
3.2.2.1. El modelo de factores comunes
oblicuos
3.2.2. El modelo de análisis factorial confirmatorio
3.3. Estructura de la matriz de correlaciones en el modelo
factores comunes: Teorema fundamental
3.4.Métodos de extracción factorial
3.4.1. Componentes principales
3.4.2. Factor principal (eje principal)
3.4.3. Máxima verosimilitud
3.5. Soluciones factoriales derivadas: rotaciones
3.6. Puntuaciones factoriales
3.1. Introducción
El AF es una de las técnicas multivariantes más vinculadas a
la investigación en psicología de hecho se ha llegado a
confundir con una teoría psicológica. Surge con la
intención de “proporcionar modelos matemáticos para la
explicación de la capacidad y el comportamiento humano”.
Fue Charles Spearman, Psicólogo inglés, quien, influido
por Galton, decidió realizar su tesis doctoral sobre la
medición objetiva de la inteligencia. Propuso el primer
modelo factorial para medir la inteligencia, basado en un
factor común, el factor g, y un componente específico.
Spearman ocupó la primera Cátedra de Psicología en la
University College en Londres.
3.1. Introducción
Además del trabajo de Spearman, y situándonos en la
primera mitad del siglo XX, otros psicólogos utilizaron el
análisis factorial para identificar nuevos conceptos
científicos o definir con más precisión otros ya conocidos.
Así, Eysenck (1947) utilizó el AFE para confirmar su idea
de que la personalidad podría definirse en torno a dos
dimensiones básicas: extroversión-introversión y
neuroticismo-estabilidad emocional. Catell (1957), utilizó
esta técnica para reducir los casi 83 factores vinculados
con rasgos de personalidad que había descrito en su
“Universal Index of Source Traits”. Desde estas primeras
investigaciones hasta nuestros días, son innumerables las
investigaciones que utilizan AFE.
3.1. Introducción
El AF es una técnica de interdependencia cuyo objetivo es
resumir los datos mediante un número pequeño de nuevas
variables construidas como transformaciones de las
originales, con la mínima pérdida de información. A las
nuevas les llamaremos factores, dimensiones,
Variables latentes o no observadas, constructos. El
número de factores será aquel que nos permita describir
las correlaciones o covarianzas entre las variables
observadas con la mínima pérdida de información. El
argumento que permite sustituir un número elevado de
variables observadas (p) por un número menor de
variables latentes (m<p) es la existencia de grupos de
variables con correlaciones altas entre sí y bajas con las
variables de otros grupos. Cada grupo de variables
altamente correlacionadas representa a una variable
latente o factor.
EJEMPLO:
Reuchlin en 1964 propuso estudiar la estructura factorial
de la matriz de correlaciones observadas entre las
asignaturas que se impartían en enseñanzas medias. La
matriz entre las asignaturas de Matemáticas (M),
Ciencias naturales (CN), Francés (F),
Latín (La) y Literatura (Li) fue:

CN M F La Li
CN 1 0.804 0.366 0.427 0.232
M 1 0.138 0.426 0.408
F 1 0.813 0.747
La 1 0.812
Li 1
Estructura factorial del ejemplo de Reuchlin

Habilidad Habilidad
lógico verbal
formal

CN M La Li F
 Pautas de consumo de refrescos de los españoles.
Una empresa productora de un determinado refresco
está interesada en incrementar sus ventas para lo
cual, diseña una campaña de publicidad basándose
en los resultados de una encuesta. La encuesta
constaba de una serie de afirmaciones a las que los
sujetos contestaban desde 1 (muy en desacuerdo)
hasta 5 (muy de acuerdo). Las cuestiones
planteadas en la encuesta fueron:
X1: Me gusta beber refrescos cuando estoy con los amigos
X2: Me gusta beber un refresco cuando estoy charlando con alguien
X3: A mi los refrescos me van bien para las ocasiones divertidas
X4: Me gusta beber siempre la misma marca de refrescos
X5: A los sitios donde voy pido siempre el mismo refresco
X6: Cambio de un refresco a otro porque para mi es mucho mejor que
tomar siempre el mismo
X7: Los refrescos sólo me gusta tomarlos mezclados con alcohol
X8: Una de mis bebidas favoritas es el refresco combinado con
alcohol
X9: Principalmente mezclo los refrescos para rebajar las bebidas
alcohólicas
Un equipo de investigadores de un Departamento de Psicología de la
Educación observó la conducta en clase de una muestra de profesores
de preescolar durante un cierto tiempo y contabilizó el número de
veces que los profesores emitían cada una de las siguientes
conductas:
 1.- Habla cálidamente con los niños
 2.- Escucha atentamente cuando los niños se dirigen a él/ella
 3.- Estimula a los niños a intentar nuevas experiencias
 4.- Cuando los niños tienen mal comportamiento, explica las razones
de la regla que no han cumplido
 5.- Da alto valor a la obediencia
 6.- Parece distante o separado de los niños
 7.- Habla con irritación u hostilidad a los niños
 8.- Amenaza a los niños cuando intenta controlarlos
 9.- Emplea un tiempo considerable en actividades que no implican
interacción con los niños
 10.- Castiga a los niños sin explicación
 A una muestra de padres y madres se les ha pedido que valoren desde 1
(menos importante) a 8 (más importante) las siguientes conductas de los
adultos para educar a sus hijos:
 1.- Castigarles cuando hacen algo mal
 2.- Mirar lo que hacen
 3.- Protegerles de las malas compañías
 4.- Favorecer la confianza en ellos mismos
 5.- Dejarles actuar libremente
 6.- Presentarles otros puntos de vista
 7.- Darles un “cachete” cuando se comporten mal
 8.- Dejarle que tomen sus propias decisiones
 9.- Pararles antes de que se equivoquen
 10.- Ponerles en situaciones que les hagan pensar
 11.- Enseñarles nuevas maneras de resolver una situación
Escala de autoestima
 Tengo confianza en mi capacidad
 Me preocupa que me vean como una persona de éxito o un fracasado
 Siento inquietud o frustración por los resultados de mi trabajo
 Me resulta difícil entender lo que leo
 Me siento cohibido
 Soy tan brillante como cualquier otra persona
 Estoy disgustado conmigo mismo
 Me preocupa lo que los demás piensen de mí
 Confío en mi capacidad para entender las cosas
 En este momento me siento inferior a los demás
 Me preocupa la impresión que produzco en los otros
 Tengo menos capacidad para los estudios que los demás
 Creo que no estoy estudiando bien
 Me preocupa parecer ridículo
 Procura que los/as jugadores/as se esfuercen al máximo
 Pide la opinión de los/as judadores/as sobre la táctica a utilizar en
determinados partidos
 Ayuda a los/as judadores/as en sus problemas personales
 Felicita delante de los/as demás a un/a jugador/a por su buen juego
 Explica a cada jugador/a durante los entrenamientos las técnicas y
tácticas del deporte
 Planifica sin pedir opinión a los/as jugadores/as
 Ayuda a los/as componentes del equipo a resolver sus conflictos o
problemas personales
 Presta especial atención a la corrección de los errores de los/as
jugadores
 Consigue el visto bueno del equipo sobre asuntos importantes
antes de actuar
 Le dice al/a jugador/a cuando ha hecho realmente bien las cosas
 Transmite claramente sus funciones como entrenador/a monitor/a a
los/as jugadores/as
 No explica sus acciones
 Mira por el bienestar personal de los/as jugadores/as
 Enseña individualmente a cada jugador/a la técnica del deporte
 Deja que los/as jugadores/as participen en la toma de decisiones
 Procura que un jugador/a sea recompensado/a por una buena
actuación
 Prepara y prevé lo que se debe hacer en los entrenamientos y
partidos
 Anima a los/as jugadores/as a que hagan sugerencias sobre como
llevar a cabo los entrenamientos
3.2. Modelos de Análisis factorial

Análisis
Factorial

AF Exploratorio AF Confirmatorio

Factores Ortogonales Factores Oblicuos


3.2.1. El modelo afe; modelo de factores comunes
3.2.1.1. El modelo de factores comunes
ortogonales

Variables o factores
latentes comunes

Variables observadas

u1 u2 u3 u4 up Factores específicos
y errores de medida
3.2.1. El modelo de afe: modelo de factores comunes
3.2.1.2. El modelo de factores comunes
oblicuos

Variables o factores
latentes comunes

Variables observadas

u1 u2 u3 u4 up Factores específicos
y errores de medida
3.2.2. El modelo de análisis factorial confirmatorio

Variables o factores
latentes comunes

Variables observadas

Factores específicos
y errores de medida

u1 u2 u3 …………………… up
3.2.1.1. El modelo de factores comunes ortogonales

Variables o factores
latentes comunes

Variables observadas

u1 u2 u3 u4 up Factores específicos
y errores de medida
Expresión matemática del modelo de AFE

x1  a11 f1  a12 f 2  ..a1m f m  d1u1


x2  a21 f1  a22 f 2  ..a2 m f m  d 2u 2
...................................................
x p  a p1 f1  a p 2 f 2  ..a pm f m  d p u p

 x1   a11 a12 .. a1m  f1   d1 0 .. 0  u1 


       
 2   21
x a a .. a 2 m  f 2   0 d2 .. 0  u2 
 .    .. 
22

.. .. ..  ..  .. .. .. ..  .. 
       
 x  a a a a  f   0 0 .. d p  u p 
  
p p 1 p 2 p 3 pm  m  

x =A f+D u
La matriz A se le denomina patrón factorial y a sus elementos pesos, cargas o
saturaciones factoriales
Matriz o patrón factorial
1, 2, ..., m f3
1
2 .i
. . .
A= i . .i’
i
’ . f2
. .
.
p f1

Matriz de puntuaciones factorial


1, 2, ..., m f3
1 .
2 . .
. .j
F=.
. . f2
. .
N .j’ .
j j’ f1
Matriz o patrón factorial Estructura factorial
1, 2, ..., m
1
2
.
Rzf =
A= i
i’
.
p

Matriz de puntuaciones factorial


1, 2, ..., m
1
2
F=.
.
.
N
j j’
Supuestos acerca de las variables latentes

a. Son variables tipificadas

E(xi) = 0 E(fj) = 0 E(ui) = 0


Var(xi) = 1 Var(fj) = 1 Var(ui) = 1

b. Los factores comunes (f) no correlacionan con los factore


específicos (u)
corr(fj, ui) = 0

c. Si se asume que los factores comunes son ortogonales


Entonces (Modelo AFE Ortogonal)
corr(fj, fi) = 0
3.3. Estructura de la matriz de correlaciones en el modelo
factores comunes ortogonales: Teorema fundamental

R  E( xx' )  E( Af  Du )( Af  Du )'

R  AA' DD '
 m 2 m m

  a1 j  a1 j a2 j ..  a 1 j pj 
a
 1 r12 .. r1 p   j 1 j 1 j 1   d12 0 .. 0 
   m m m   
  a 
 r21 1 .. r2 p   a2 j a1 j 2
.. a2 j a pj   0 d 22 .. 0 

 ..    .. .. 
2j
.. .. ..  j 1 j 1 j 1
.. ..

r
  .. .. .. ..  
 p1 rp 2 .. 1   m m m
  0 0 .. d p2 
  a pj a1 j a  2
pj a2 j .. a pj 
 j 1 j 1 j 1 

m
1  ai21  ai22  ...  aim
2
 d i2  a
j 1
2
ij  d i2

Comunalidad: varianza explicada


por el conjunto de factores comunes Unicidad: varianza explicada
por factores específicos

rˆij  ai1a j1  ai 2 a j 2  ...  aim a jm


Diagramas de Venn para el reparto de la varianza de una variable en un
modelo de tres factores ortogonales

m
h 
i
2
a
j 1
2
ij

m
d i2  1  hi2  1   aij2
j 1
Ejemplo numérico con los datos de Reuchlin
CN M F La Li
CN 1 0.804 0.366 0.427 0.232
M 1 0.138 0.426 0.408
F 1 0.813 0.747
La 1 0.812
Li 1

0.8 0.2
0.9 0.1
A  0.1 0.9
0.3 0.8
0.2 0.8

vamos a calcular los siguientes valores:


a) comunalidad de cada variable.
b) unicidad de cada variable.
c) porcentaje de varianza de cada variable explicada por cada
uno de los factores comunes.
d) interpretación de los factores obtenidos.
Ejemplo numérico con los datos de Reuchlin

Representac ión de las variables en el plano de los factores


1.0

.8

.6

Asignaturas

.4 M

LI

.2 LA

F
F2

0.0 CN
0.0 .2 .4 .6 .8 1.0

F1
a) Para la matriz factorial dada las comunalidades son:

h12  0,82  0,2 2  0,68 0.32


h  0,9  0,1  0,82
2
2
2 2 0.04 f2
h32  0,12  0,9 2  0,82 0.64

h42  0,32  0,82  0,73


h52  0,2 2  0,82  0,68 f1
b) La unicidad de cada variable viene dada por:

d12  1  0,68  0,32


d 22  1  0,82  0,18
d 32  1  0,82  0,18
d 42  1  0,73  0,27
d 52  1  0,68  0,32
c) Podemos expresar la varianza de cada variable explicada por
cada factor común y la varianza explicada por el conjunto de
factores comunes en términos de porcentajes mediante las
expresiones
2
aij × 100 Porcentaje de varianza de la variable xi
explicada por el factor fj

2
hi × 100 Porcentaje de varianza de la variable xi
explicada por el conjunto de factores comunes

así, la tabla siguiente recoge los porcentajes de varianza


explicada para cada variable

Varianza Explicada en porcentajes


Factor 1 Factor 2 Comunalidad
C. Naturales 64 4 68
Matemáticas 81 1 82
Francés 1 81 82
Latín 9 64 73
Literatura 4 64 68
Para obtener una solución factorial se procede
en
dos etapas:

Fase de extracción factorial:


Fase de rotación: obtener una solución
obtener una solución
fácilmente interpretable
matemáticamente aceptable
Métodos de Extracción factorial
implementados en SPSS V. 10.0

• Análisis de componentes principales (ACP)


•Mínimos cuadrados no ponderados (MINRES)
•Mínimos cuadrados generalizados
•Máxima verosimilitud
•Ejes principales (FC)
•Alfa
•Imagen
Criterios para retener factores

• Criterio de Kaiser: se seleccionan los factores con autovalores mayores


que 1 (tiene sentido considerando un factor como un agregado de
variables)

•Gráfico sedimentación de Catell

Gr áfico de sedim ent ación


10

4
Autovalor

0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

N úm er o d e com p onent e
Criterios para retener factores

• Fijar a priori un número de factores

• Fijar una cantidad mínima de varianza a explicar (60%

- 70% en ciencias sociales)

•Utilizar un test de significación para el número de

factores
Métodos de Rotación factorial
implementados en SPSS V. 10.0

ORTOGONALES:
OBLÍCUOS:
•VARIMAX
•QUARTIMAX •OBLIMIN DIRECTO
•EQUAMAX •PROMAX

Para interpretar los factores se recomienda utilizar las


variables con pesos ≥|0,30|
Condiciones de Aplicación

• Se recomiendan 5 o mejor 10 sujetos por variable


para evitar el sobreajuste

• Linealidad: comprobar que no se dan otras formas


de relación, que la relación lineal, si existe, no se debe
a la presencia de valores atípicos y que la magnitud
de las correlaciones tengan un cierto nivel

• Normalidad si se va a utilizar un método estadístico


Condiciones de Aplicación: índices descriptivos
de la adecuación de un AFE

• Test de esfericidad de Bartlett (NM)

H0: R = I

•Este test para determinar si una matriz de correlaciones es


adecuada para realizar un análisis factorial tiene el
inconveniente que requiere distribución normal multivariante
para los datos y normalmente no se cumple. Por otro lado, con
tamaños de muestra grande se rechaza la hipótesis nula
aunque las correlaciones entre los ítems sean pequeñas.
Condiciones de Aplicación: índices descriptivos
de la adecuación de un AFE

• Coeficiente de correlación parcial (valores pequeños


implican adecuación del Afe pero no tiene asociado un test de
significación). SPSS proporciona esta matriz y su opuesta
denominada antiimagen.
Condiciones de Aplicación: índices descriptivos
de la adecuación de un AFE

• Índice KMO: compara coeficientes de correlación

observados y parciales para el conjunto de variables

0 0,5 0,6 0,7 0,8 0,9 1

Inadecuado el AFE Adecuado el AFE


Condiciones de Aplicación: índices descriptivos
de la adecuación de un AFE

•Índice MSA: compara coeficientes de correlación

observados y parciales para cada par de variables

se interpreta como KMO (SPSS proporciona estos índices

en la diagonal de la matriz antiimagen)


Alguna consideraciones para facilitar la interpretación de los factores

En AFE es deseable una solución factorial que se aproxime a una


estructura simple por lo que se hace necesario establecer algunos
criterios que faciliten su consecución

Sobre el número de factores a retener, además de consideraciones


basadas en criterios estadísticos, solo se debe retener un factor si puede
interpretarse y tiene significado en el ámbito de investigación en el que
se desarrolla la escala.
Criterios para obtener una estructura simple para la interpretación de los factores

Sobre los criterios para eliminar ítems:

• se deberían eliminar los items con comunalidades inferiores a ,40,

• aquellos cuyo peso factorial más elevado sea inferior, en valores


absolutos a ,32,

• los que tengan pesos superiores a ,32 en más de un factor, y

• aquellos en los que la diferencia entre el peso factorial más elevado y el


siguiente sea inferior a ,15

Sin embargo hay que tener cuidado con estos criterios y no aplicarlos
hasta haber evaluado el número de factores a retener.
Criterios para determinar la unidimensionalidad de un instrumento de medida

• La unidimensionalidad de un instrumento implica que solo rasgo latente o constructo


se encuentra en la base de un conjunto de ítems. Lo importante es que un
instrumento de medida represente con sus puntuaciones un solo factor dominante.
Con esto lo que se quiere lograr es que la mayor cantidad de la varianza observada
en las respuestas a los ítems sea explicada por un solo atributo latente.
Criterios para determinar la unidimensionalidad de un instrumento de medida

Si bien no existe una única línea metodológica para evaluar


unidimensionalidad (Anderson, Gerbin y Hunter, 1987; Linacre, 1994;
Wright, 1994), presentaremos brevemente algunos criterios

Así, un conjunto de ítems será unidimensional si el primer factor explica


por lo menos:

− El 40% de la varianza (Carmines y Zeller, 1979)

− El 20% de la varianza (Reckase, 1979)

− Entre el 17 y 40% de la varianza, usando matrices de correlaciones phi


(Zwick, 1985)

− Entre el 30% a 40% de la varianza, usando matrices de correlaciones


tetracóricas (Zwick, 1985)
Criterios para determinar la unidimensionalidad de un instrumento de medida

La cantidad de varianza explicada por el primer no es el único criterio


que puede tomarse en cuenta para evaluar la unidimensionalidad de un
instrumento.

Hatti (1985) propone que un instrumento de medida será unidimensional


si el cociente entre la diferencia del primer y segundo autovalor, y la del
segundo y tercer autovalor, es mayor a 3.

Por otro lado, Cuesta (1996) propone factorizar las puntuaciones


obtenidas por cada persona en cada uno de los factores (denominados
de primer orden), y si se obtiene un único factor de segundo orden, se
podrá afirmar que nos encontramos básicamente frente a una medida
unidimensional
Resumen:

Cinco decisiones importantes conlleva la ejecución de un AFE:

1. ¿Qué matriz de coeficientes de asociación se va a analizar?

2. ¿Cuántos factores deberías extraerse?

3. ¿Qué método deberíamos utilizar para extraer factores?

4- ¿Qué método de rotación debería utilizarse?

5. ¿Qué puntuaciones factoriales debemos utilizar para calcular las


puntuaciones factoriales?

S-ar putea să vă placă și